ISO 639-3
ISO 639-3는 국제 표준화 기구(ISO)에서 제정한 국제 표준이다. 정식 명칭은 ISO 639-3:2007 "언어 이름 표현을 위한 코드 - 3부: 포괄적인 언어 적용을 위한 Alpha-3 코드"(Codes for the representation of names of languages – Part 3: Alpha-3 code for comprehensive coverage of languages)이다. ISO 639 시리즈의 세 번째 부분으로 각 언어에 대해 지정된 3자리 코드를 "Alpha-3"(알파-3) 코드라고 일컫는다. 현재 총 7,916개의 항목이 수록되어 있으며,[1] ISO 639-3 코드 목록에서 확인 가능하다. 2007년 2월 1일 첫 발행되었다. 2023년에 해당 판본은 공식적으로 철회되었으며, ISO 639:2023로 통합되었다.[2]
ISO 639-3은 알려진 모든 자연어를 포괄하기 위해 ISO 639-2 Alpha-3(알파-3) 코드를 확장한 것이다. 확장된 언어 적용 범위는 주로 현재 ISO 639 세트 3의 등록 기관인 국제 SIL에서 발행한 《에스놀로그》(10~14권)에 사용된 언어 코드를 기반으로 한다.[3] 이는 현존하는 언어와 멸종된 언어, 고대와 건설된 언어, 주요 언어와 부전공 언어, 기록된 언어와 기록되지 않은 언어를 포함하여 가능한 한 완전한 언어 목록을 제공한다.[2] 그러나 인도유럽조어와 같은 재구성된 언어는 포함되지 않는다.[4]
ISO 639-3은 광범위한 응용 프로그램에서 메타데이터 코드로 사용하는 것을 목적으로 하는데, 특히 많은 언어 지원이 필요한 인터넷과 같은 컴퓨터 및 정보 시스템에서 널리 사용된다. 아카이브 및 기타 정보 저장소에서는 자원의 언어 또는 언어를 나타내는 목록 시스템으로도 사용된다. 코드는 언어 이름이 모호한 점을 보완하기 위해 언어 문헌 및 다른 곳에서도 자주 사용된다.
언어 코드
[편집]ISO 639-3는 ISO 639-1의 모든 언어 및 ISO 639-2의 모든 개별 언어를 포함한다. ISO 639-2에는 언어 집합(collections of languages) 또한 목록에 포함되었지만, ISO 639-3에는 포함되어 있지 않다. B코드와 T코드가 ISO 639-2에 동시에 존재하는 경우, ISO 639-3은 T코드를 사용한다.
| 언어 | 639-1 | 639-2 (B/T) | 639-3 종류 | 639-3 코드 |
|---|---|---|---|---|
| English | en |
eng |
개별 | eng
|
| French | fr
|
fre/fra
|
개별 | fra
|
| German | de |
ger/deu |
개별 | deu
|
| Arabic | ar |
ara |
대언어 | ara
|
| Standard Arabic | 개별 | arb
| ||
| Egyptian Arabic | 개별 | arz
| ||
| Levantine Arabic | 개별 | apc
| ||
| Mesopotamian Arabic | 개별 | acm
| ||
| Chinese | zh |
chi/zho[5][6] |
대언어 | zho
|
| Mandarin Chinese | 개별 | cmn
| ||
| Cantonese | 개별 | yue
| ||
| Min Nan Chinese | 개별 | nan
| ||
| Thai | th |
tha |
개별 | tha
|
| Southern Thai | 개별 | sou
| ||
| Northern Thai | 개별 | nod
| ||
| Lü | 개별 | khb
| ||
| Lao/Northeastern Thai | lo |
lao |
개별 | lao/tts
|
| Phu Thai | 개별 | pht
|
ISO 639-3 코드는 세 글자의 알파벳으로 이루어져 있으므로, 표현할 수 있는 언어의 최대 개수의 상한은 26 × 26 × 26 = 17,576개이다. ISO 639-2에서 특수 코드(4개), 예약된 범위(520개), 그리고 B 전용 코드(22개)를 정의하고 있으므로, 546개의 코드는 ISO 639-3에서 사용할 수 없다. 따라서 이를 제외하면 17,576 − 546 = 17,030개의 코드를 사용할 수 있다. 이는 ISO 639-2에서 정의된 언어 집합과 아직 ISO 639-5에서 정의되지 않은 언어 집합을 포함하지 않은 수치이다.
언어 이름
[편집]표준 6.4.1장에 따르면 언어 이름으로는 ISO 기본 라틴 알파벳 이외에 다음의 발음 구별 기호가 붙은 문자만 사용이 가능하다.
- á é í ó ú
- â ê î ô û
- à è ì ò ù
- ä ë ï ö ü
- ã ñ
- å
- õ
- ç
또한 아스키 코드 상 5개의 문장 부호(공백, 하이픈 마이너스, 아퍼스트로피, 양 괄호)를 사용할 수 있으며, 괄호 내에는 온점과 10개의 숫자를 사용할 수 있다.
대안 이름(alternative name)은 라틴 문자인 경우 해당 언어의 올바른 철자 표기를 사용할 수 있고, 그 외에는 라틴 문자로 전자된 형태로 추가 문자를 포함할 수 있다.
대언어
[편집]ISO 639-2에 수록된 58개의 언어가 ISO 639-3 기준으로 대언어(macrolanguages)로 간주된다.[7]
일부 대언어의 경우 ISO 639-3에는 개별 언어로서 존재하지만, ISO 639-2에는 정의되지 않은 경우가 존재한다(예: ara 아랍어). nor(노르웨이어)의 경우에는 ISO 639-2에 nno(뉘노르스크)와 nob(보크말)이 개별 언어로 존재한다. ISO 639-2에서는 한 언어(예: ara)의 하위 방언으로 취급되던 일부 언어(예: arb 표준 아랍어)가 ISO 639-3을 통해 일부 맥락에서는 개별 언어로도 취급될 수 있다는 의미이다.
특수 코드
[편집]ISO 639-2 및 ISO 639-3에는 다음과 같은 4개의 특수 코드가 배정되어 있다.
mis(uncoded languages) - ISO 표준에 아직 포함되지 않은 언어mul(multiple languages) - 다중 언어und(undetermined) - 정해지지 않음zxx(no linguistic content / not applicable) - 언어 관련 내용 없음
각주
[편집]- ↑ “ISO 639-3 Code Set”. 《SIL International》. 2021년 2월 18일. 2018년 4월 1일에 원본 문서에서 보존된 문서. 2021년 4월 7일에 확인함.
- ↑ 가 나 “ISO 639-3:2007 withdrawn notice”. International Organization for Standardization. 2007년 2월 1일. 2024년 6월 6일에 원본 문서에서 보존된 문서. 2025년 6월 6일에 확인함.
- ↑ “Maintenance agencies and registration authorities”. ISO. 2012년 10월 8일에 원본 문서에서 보존된 문서. 2014년 1월 12일에 확인함.
- ↑ “Types of individual languages – Ancient languages”. 《SIL International》. 2018년 6월 12일에 원본 문서에서 보존된 문서. 2018년 6월 11일에 확인함.
- ↑ “Ethnologue report for ISO 639 code: zho”. 《Ethnologue》. 2014년 9월 12일에 원본 문서에서 보존된 문서.
- ↑ “ISO 639-3”. 《SIL International》. 2013년 2월 24일에 원본 문서에서 보존된 문서. 2014년 9월 12일에 확인함.
- ↑ “Scope of denotation: Macrolanguages”. 《SIL International》. 2013년 2월 8일에 원본 문서에서 보존된 문서. 2012년 6월 14일에 확인함.