조무위키
조무위키
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
특수 문서 목록
문서 정보
행위
문서
토론
편집
역사 보기
KS X 1001
편집하기
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
{{위백복붙}} {{문자 인코딩 정보 | name = KS X 1001 <!--| _nomimecode = 1--> | mime = ks_c_5601-1987 | alias = KS C 5601 | standard = KS X 1001 | lang = [[한국어]], [[영어]], [[러시아어]]<br/>'''부분 지원:'''<br/>[[그리스어]], [[일본어]] | status = | encodings = [[EUC-KR]], [[ISO 2022]], [[통합형 한글 코드|UHC]], 조합형 한글 | classification = [[ISO-2022]] 호환 [[DBCS]], [[CJK|CJK 인코딩]] | prev = [[#1974|N바이트 한글 코드]] (KS C 5601-1974) | next = | otherrelated = [[KPS 9566]], [[JIS X 0208]], [[GB 2312]] }} [[파일:Ksx1001-map.png|frame|right|그림으로 나타낸 KS X 1001 문자 집합의 구조]] '''KS X 1001'''은 [[한국 산업 규격]]으로 지정된 한국어 [[문자 집합]]으로서, 정식 규격명은 ‘'''정보 교환용 부호계''' (한글 및 한자)’이며, 옛 이름인 '''KS C 5601'''로도 알려져 있다. [[1974년]]에 처음으로 제정되었고, [[2004년]]에 개정된 ‘KS X 1001:2004’가 최신 규격이다. 이 규격은 2바이트 부호계로서, x2121 - x7E7E까지 영역에서 8,836문자의 표현을 규정하는데, 문자는 제어 문자와 도형 문자로 분류하며, 도형 문자는 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자로 구성되어 있다. 한글 부분은 기본적으로 2바이트 완성형 코드이지만, 부속서 3에서 [[한글 조합형 인코딩|2바이트 조합형 코드]]도 보조 부호계로서 규정되어 있다. KS X 1001은 [[유니코드]]를 제외하고 [[대한민국]]에서 사용되는 거의 유일한 문자 집합이다. KS X 1001 기반의 [[문자 인코딩]]으로는 [[EUC-KR]](완성형)과 ISO-2022-KR (과거 인터넷 메일에서 쓰던 문자 인코딩)이 있다. MS 윈도에서 사용하는 [[코드 페이지 949|CP949]]은 [[EUC-KR]]의 확장으로 2바이트로 표현할 수 없는 한글 글자 마디 8,822자를 추가한 것이다. == 구성 == KS X 1001은 전형적인 94×94 문자 집합이며, 각 행들은 다음과 같이 구성되어 있다. * 0x21 ~ 0x2C: 특수 문자(문장 부호, 그림 문자 등), 한글 낱자, 괘선 조각, 외국 문자([[히라가나]], [[가타카나]], [[그리스 문자]], [[키릴 문자]] 등) * 0x30 ~ 0x48: [[한글]] 글자 마디 영역. 자주 쓰이는 2350자만 가나다 순서대로 배열했다. 하지만 이것 때문에 다음<ref>[http://kugmun.com/?document_srl=1443&mid=language1&sort_index=readed_count&order_type=desc&category=990 '믜' 자 고유 한국어 이름 곤욕]</ref>과 같은 문제가 생겼다. * 0x49: 사용자 정의 영역 A * 0x4A ~ 0x7D: [[한자]] 영역. 4888자를 한글 독음 순서대로 배열했으며, 독음이 다르고 모양이 같은 한자는 중복되어 있다. * 0x7E: 사용자 정의 영역 B 특수 문자 영역은 개정판마다 계속 추가되고 있다. KS X 1001:1998에서는 ®('등록 상표' 줄임표), €([[유로]] 기호)가, KS X 1001:2002에서는 ㉾('우편 번호' 줄임표, U+327E)가 추가되었다. === 한글 채움 문자 === 이 규격에는 완성형 한글 코드인 기본 부호계에 포함되지 않은 한글에 대해서 글자 마디마다 맨 앞에 '채움' 문자를 덧붙여 교환하는 방식이 규정되어 있다. 즉, 한글 채움 문자(24-54, [[EUC-KR]]에서는 <code>A4 D4</code>)를 사용해서 "(채움) 초성 중성 종성"과 같이 한글 영역에 들어 있지 않은 한글을 표시하는 것은 가능하다. 예를 들어 '(채움) ㅆ ㅠ (채움)'은 KS X 1001에서 나타낼 수 없는 '쓔'라는 글자를 나타낸다. 이러한 확장 방법은 2004년 개정에서도 유지되어 있다. === 부속서 === 이 규격의 부속서 3에서는 2바이트 조합형을 보조 부호계로 규정하고 있는데, 1982년 개정부터 기존 [[상용 조합형]]을 반영하여 표준화하였다. 아울러 부속서 4에서는 7비트 한글 낱자 부호계를 포함하여 2바이트 부호계가 적용되지 않는 특수 장비 등에 대한 한글 코드를 규정하고 있다. == 단점 == KS X 1001에 모든 현대 한글을 표현할 수 있는 방법이 존재하는데도 [[모질라 파이어폭스]] 등을 제외한 대부분의 프로그램들이 구현하지 않고 있다. 따라서 KS X 1001은 사실상 2350자의 한글만 지원하기 때문에 모든 현대 한글을 제대로 표현할 수 없다는 비판이 제기되었다. 또한 2350자 바깥의 한글을 처리하는 방법이 프로그램마다 여러 가지로 나뉘면서 서로 다른 프로그램 사이에서 인코딩의 호환성이 보장되지 않는 문제가 생기기도 했다. 또한, 필요한 특수 문자는 배제되고 자판으로 손수 입력 가능한 특수 문자가 너무 많이 포함되었다는 비판도 존재한다.<ref>[http://www.korean.go.kr/nkview/nklife/1989_3/18_5.html 현행 KS 완성형 한글 코드의 문제점], 국립국어연구원 국어생활 1989년 가을호</ref> 그 외에도 한글 독음이 다르고 모습이 같은 한자가 중복되어 있기 때문에 나타나는 처리상의 문제도 있는데, [[유니코드]]에 이런 특성이 고려되어 모든 중복된 한자가 유니코드 [[한중일 호환용 한자|호환성 영역]]에 수록되기도 했다. == 같이 보기 == * [[KS X 1002]] - KS X 1001의 보조 문자 집합 * [[KS X 1003]] - KS X 1001과 함께 사용되는 로마 문자 집합 {{각주}} == 참고 문헌 == * 〈정보 교환용 부호계(한글 및 한자)〉, 《한국산업규격》. 한국표준협회, 2005. == 외부 링크 == * {{언어링크|en}} [https://web.archive.org/web/20140512222331/http://kikaku.itscj.ipsj.or.jp/ISO-IR/149.pdf KS X 1001:1987의 문자표] [[분류:문자 집합]][[분류:한국 산업 규격 정보 산업 부문|1001]][[분류:한국어 컴퓨팅]]
요약:
조무위키에서의 모든 기여는 CC BY-SA 4.0 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
조무위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
이 문서에서 사용한 틀:
틀:ISO 639 이름
(
편집
)
틀:각주
(
편집
)
틀:문자 인코딩 정보
(
편집
)
틀:알림 상자
(
편집
)
틀:언어 이름
(
편집
)
틀:언어링크
(
편집
)
틀:위백복붙
(
편집
)
틀:출처 필요
(
편집
)