본문으로 이동

ISO 639-3

위키백과, 우리 모두의 백과사전.

ISO 639-3국제 표준화 기구(ISO)에서 제정한 국제 표준이다. 정식 명칭은 ISO 639-3:2007 "언어 이름 표현을 위한 코드 - 3부: 포괄적인 언어 적용을 위한 Alpha-3 코드"(Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages)이다. ISO 639 시리즈의 세 번째 부분으로 각 언어에 대해 지정된 3자리 코드를 "Alpha-3"(알파-3) 코드라고 일컫는다. 현재 총 7,916개의 항목이 수록되어 있으며,[1] ISO 639-3 코드 목록에서 확인 가능하다. 2007년 2월 1일 첫 발행되었다. 2023년에 해당 판본은 공식적으로 철회되었으며, ISO 639:2023로 통합되었다.[2]

ISO 639-3은 알려진 모든 자연어를 포괄하기 위해 ISO 639-2 Alpha-3(알파-3) 코드를 확장한 것이다. 확장된 언어 적용 범위는 주로 현재 ISO 639 세트 3의 등록 기관인 국제 SIL에서 발행한 《에스놀로그》(10~14권)에 사용된 언어 코드를 기반으로 한다.[3] 이는 현존하는 언어와 멸종된 언어, 고대와 건설된 언어, 주요 언어와 부전공 언어, 기록된 언어와 기록되지 않은 언어를 포함하여 가능한 한 완전한 언어 목록을 제공한다.[2] 그러나 인도유럽조어와 같은 재구성된 언어는 포함되지 않는다.[4]

ISO 639-3은 광범위한 응용 프로그램에서 메타데이터 코드로 사용하는 것을 목적으로 하는데, 특히 많은 언어 지원이 필요한 인터넷과 같은 컴퓨터 및 정보 시스템에서 널리 사용된다. 아카이브 및 기타 정보 저장소에서는 자원의 언어 또는 언어를 나타내는 목록 시스템으로도 사용된다. 코드는 언어 이름이 모호한 점을 보완하기 위해 언어 문헌 및 다른 곳에서도 자주 사용된다.

언어 코드

[편집]

ISO 639-3는 ISO 639-1의 모든 언어 및 ISO 639-2의 모든 개별 언어를 포함한다. ISO 639-2에는 언어 집합(collections of languages) 또한 목록에 포함되었지만, ISO 639-3에는 포함되어 있지 않다. B코드와 T코드가 ISO 639-2에 동시에 존재하는 경우, ISO 639-3은 T코드를 사용한다.

ISO 언어 코드 예시
언어 639-1 639-2 (B/T) 639-3 종류 639-3 코드
English en eng 개별 eng
French fr fre/fra 개별 fra
German de ger/deu 개별 deu
Arabic ar ara 대언어 ara
Standard Arabic 개별 arb
Egyptian Arabic 개별 arz
Levantine Arabic 개별 apc
Mesopotamian Arabic 개별 acm
Chinese zh chi/zho[5][6] 대언어 zho
Mandarin Chinese 개별 cmn
Cantonese 개별 yue
Min Nan Chinese 개별 nan
Thai th tha 개별 tha
Southern Thai 개별 sou
Northern Thai 개별 nod
개별 khb
Lao/Northeastern Thai lo lao 개별 lao/tts
Phu Thai 개별 pht

ISO 639-3 코드는 세 글자의 알파벳으로 이루어져 있으므로, 표현할 수 있는 언어의 최대 개수의 상한은 26 × 26 × 26 = 17,576개이다. ISO 639-2에서 특수 코드(4개), 예약된 범위(520개), 그리고 B 전용 코드(22개)를 정의하고 있으므로, 546개의 코드는 ISO 639-3에서 사용할 수 없다. 따라서 이를 제외하면 17,576 − 546 = 17,030개의 코드를 사용할 수 있다. 이는 ISO 639-2에서 정의된 언어 집합과 아직 ISO 639-5에서 정의되지 않은 언어 집합을 포함하지 않은 수치이다.

언어 이름

[편집]

표준 6.4.1장에 따르면 언어 이름으로는 ISO 기본 라틴 알파벳 이외에 다음의 발음 구별 기호가 붙은 문자만 사용이 가능하다.

  • á é í ó ú
  • â ê î ô û
  • à è ì ò ù
  • ä ë ï ö ü
  • ã ñ
  • å
  • õ
  • ç

또한 아스키 코드 상 5개의 문장 부호(공백, 하이픈 마이너스, 아퍼스트로피, 양 괄호)를 사용할 수 있으며, 괄호 내에는 온점과 10개의 숫자를 사용할 수 있다.

대안 이름(alternative name)은 라틴 문자인 경우 해당 언어의 올바른 철자 표기를 사용할 수 있고, 그 외에는 라틴 문자로 전자된 형태로 추가 문자를 포함할 수 있다.

대언어

[편집]

ISO 639-2에 수록된 58개의 언어가 ISO 639-3 기준으로 대언어(macrolanguages)로 간주된다.[7]

일부 대언어의 경우 ISO 639-3에는 개별 언어로서 존재하지만, ISO 639-2에는 정의되지 않은 경우가 존재한다(예: ara 아랍어). nor(노르웨이어)의 경우에는 ISO 639-2에 nno(뉘노르스크)와 nob(보크말)이 개별 언어로 존재한다. ISO 639-2에서는 한 언어(예: ara)의 하위 방언으로 취급되던 일부 언어(예: arb 표준 아랍어)가 ISO 639-3을 통해 일부 맥락에서는 개별 언어로도 취급될 수 있다는 의미이다.

특수 코드

[편집]

ISO 639-2 및 ISO 639-3에는 다음과 같은 4개의 특수 코드가 배정되어 있다.

  • mis (uncoded languages) - ISO 표준에 아직 포함되지 않은 언어
  • mul (multiple languages) - 다중 언어
  • und (undetermined) - 정해지지 않음
  • zxx (no linguistic content / not applicable) - 언어 관련 내용 없음

각주

[편집]
  1. “ISO 639-3 Code Set”. 《SIL International》. 2021년 2월 18일. 2018년 4월 1일에 원본 문서에서 보존된 문서. 2021년 4월 7일에 확인함. 
  2. “ISO 639-3:2007 withdrawn notice”. International Organization for Standardization. 2007년 2월 1일. 2024년 6월 6일에 원본 문서에서 보존된 문서. 2025년 6월 6일에 확인함. 
  3. “Maintenance agencies and registration authorities”. ISO. 2012년 10월 8일에 원본 문서에서 보존된 문서. 2014년 1월 12일에 확인함. 
  4. “Types of individual languages – Ancient languages”. 《SIL International》. 2018년 6월 12일에 원본 문서에서 보존된 문서. 2018년 6월 11일에 확인함. 
  5. “Ethnologue report for ISO 639 code: zho”. 《Ethnologue》. 2014년 9월 12일에 원본 문서에서 보존된 문서. 
  6. “ISO 639-3”. 《SIL International》. 2013년 2월 24일에 원본 문서에서 보존된 문서. 2014년 9월 12일에 확인함. 
  7. “Scope of denotation: Macrolanguages”. 《SIL International》. 2013년 2월 8일에 원본 문서에서 보존된 문서. 2012년 6월 14일에 확인함. 

외부 링크

[편집]