ArtikelISO 639: Kürzel für Namen von Sprachen
VerfasserHelmut Richter
erstellt / geändert /
Artikel-URLhttps://hhr-m.de/iso639/
enthältgesamten Artikel

ISO 639: Kürzel für Namen von Sprachen

Lebende und alte Sprachen (Auswahl)
ISO 639-
-1-3
araraArabisch
cscesTschechisch
dadanDänisch
dedeuDeutsch
elellGriechisch (Neu-)
enengEnglisch
esspaSpanisch
fafasFarsi (=Persisch)
frfraFranzösisch
hehebHebräisch (modern)
hihinHindi
hrhrvKroatisch
huhunUngarisch
ititaItalienisch
jajpnJapanisch
nlnldNiederländisch
plpolPolnisch
ptporPortugiesisch
rmrohRätoromanisch
rurusRussisch
skslkSlowakisch
slslvSlowenisch
svsweSchwedisch
swswaSwahili
trturTürkisch
zhzhoChinesisch
sasanSanskrit
grcAltgriechisch
lalatLatein
cuchuKirchenslawisch
nonAltnordisch
gohAlthochdeutsch
gmhMittelhochdeutsch
hboAlthebräisch
arcReichs-Aramäisch
tmrTalmud. Aramäisch
Der Sprachcode ist auch Ländercode des Landes, nach dem die Sprache benannt ist.
Der Sprachcode ist nicht Ländercode eines Landes.
Der Sprachcode ist Ländercode eines Landes, dessen Name nichts mit dem Sprachnamen zu tun hat.

Aufbau der Norm ISO 639

Codes zur Abkürzung der Namen von Sprachen sind in der Norm ISO 639 geregelt. Es gibt dabei

Diese zwei- und dreibuchstabigen Sprachcodes dürfen nicht mit den Ländercodes nach ISO 3166 verwechselt werden. Zwar stimmen sie öfters überein, wenn eine Sprache nach einem Land benannt ist, genausooft aber auch nicht (siehe Tabelle rechts). Man begegnet beispielsweise den Ländercodes am Ende von Domainnamen im Internet, dagegen den Sprachcodes am Anfang der Domainnamen der Wikipedia: so ist also etwa ar.wikipedia.org mitnichten die argentinische, sondern die arabischsprachige Wikipedia.

Die dreibuchstabigen Kürzel einzelner Sprachen sind in ISO 639-3 genormt, die von ganzen Sprachfamilien in ISO 639-5. Die beiden ISO 639-2 sind älter und haben keine eigenständige Bedeutung mehr. (ISO 639-2/T enthält nur einen kleinen Teil der Kürzel aus ISO 639-3 und ISO 639-5. ISO 639-2/B enthält dieselben Sprachen wie ISO 639-2/T, jedoch mit einigen Abweichungen, um Kompatibilität mit auf englischen Sprachbezeichnungen beruhenden Kürzeln herzustellen, wie sie im Bibliothekswesen verwendet wurden: unter anderem [chi] statt [zho] für Chinesisch, [cze] statt [ces] für Tschechisch, [dut] statt [nld] für Niederländisch, [fre] statt [fra] für Französisch, [ger] statt [deu] für Deutsch, [gre] statt [ell] für Neugriechisch und [per] statt [fas] für Persisch.)

Die abweichenden dreibuchstabigen Kürzel nach ISO 639-2/B kommen in den anderen Normteilen nicht vor. Ein Kürzel bezeichnet also eine Sprache oder Sprachfamilie immer eindeutig, und eine Sprache oder Sprachfamilie hat nur ein dreibuchstabiges Kürzel über alle Normteile außer ISO 639-2/B hinweg.

Die Norm hat zunächst die zweibuchstabigen Codes enthalten. Später sind die dreibuchstabigen hinzugefügt worden, um mehr Sprachen mit einem Sprachcode versehen zu können, besonders seitdem man das Ziel hat, mehr oder wenige alle Sprachen zu erfassen. In der Praxis, etwa beim Übersetzen von Webseiten oder Gebrauchsanweisungen in ein paar zusätzliche Sprachen, kommt aber man fast immer mit den zweibuchstabigen aus, die zudem viel bekannter sind.

Sprachfamilien, Makro- und Einzelsprachen, Dialekte

Sprachfamilien und Sprachen (Auswahl)
ISO 639-
-1-3-2-5
ineIndogermanisch
roaRomanisch
slaSlawisch
celKeltisch
gemGermanisch
gmqNordgermanisch
nonorNorwegisch
nnnnoNynorsk
nbnobBokmål
gmwWestgermanisch
dedeuDeutsch
gswSchweizerdeutsch
barBairisch
sxu(Ober-)Sächsisch
ndsNiederdeutsch

Wie schon erwähnt, enthält ISO 639-5 Sprachfamilien und ISO 639-3 einzelne Sprachen, und aus beidem können Sprachcodes auch in ISO 639-2 enthalten sein. Für die möglichen Kombinationen enthält die nebenstehende Tabelle Beispiele.

Eine Zwitterstellung nimmt dort die norwegische Sprache ein: sie enthält zwei einzelne Sprachen, nämlich die beiden Standardvarianten des Norwegischen, wird aber im Rahmen der Norm wie eine Sprache und nicht wie eine Sprachfamilie behandelt. Das wird für solche nahe verwandten Sprachen gemacht, bei denen für viele praktischen Belange der Unterschied keine Rolle spielt, obwohl er groß genug ist, dass man die Sprachen in anderen Zusammenhängen unterscheiden will und ihnen daher getrennte Sprachcodes gibt. Solche Zusammenfassungen von mehreren Sprachen zu einer heißt in der Norm Makrosprache. Man möchte die Makrosprachen unter den Sprachen haben, weil man sich oft nur dafür interessiert, ob ein Text in einer bestimmten Sprache vorliegt, und nicht unbedingt, in welcher Variante davon. Das wird auch daran deutlich, dass die zweibuchstabigen Kürzel nach ISO 639-1, die die ursprüngliche eher grobe Einteilung in deutlich verschiedene Sprachen darstellen, sehr häufig entweder Makrosprachen oder solche Einzelsprachen bezeichnen, die nicht in einer Makrosprache enthalten sind, aber praktisch nie ganze Sprachfamilien und nur ganz ausnahmsweise Einzelsprachen aus Makrosprachen (nämlich die beiden norwegischen, das Indonesische und die Nachfolgersprachen des Serbokroatischen). Am letztgenannten Beispiel sieht man, dass manchmal ethnische und politische Empfindlichkeiten eine Rolle gespielt haben, wenn etwa Volksgruppen darauf Wert legen, dass ihre Sprache nicht weniger Standard ist als die des Nachbarvolks oder dass sie von der des Nachbarvolks so verschieden ist, dass sie einen eigenen Sprachcode haben muss.

Das Konzept der Makrosprachen (siehe den Artikel „Scope of denotation for language identifiers“) wird häufig kritisiert, weil die Anwendung unscharf definiert ist und auch uneinheitlich gehandhabt wird. Diese Inkonsequenz ergibt sich zum Teil daraus, dass die Bedürfnisse einer linguistischen Taxonomie eben andere sind als die einer praktischen Liste von Sprachen, die nicht nur nach linguistischen, sondern auch nach politischen Kriterien und nach dem Empfinden der Sprecher selbst verschiedene oder gleiche Sprachen sind.

Dialekte sind nicht Gegenstand der Norm. Sie von Einzelsprachen abzugrenzen, gelingt jedoch nicht immer. Deutsche Dialekte vertreten das Deutsche nicht (ein Text in Schweizerdeutsch wird nicht als deutscher Text empfunden); deswegen wird das Deutsche auch nicht als Makrosprache geführt, und die deutschen Dialekte erscheinen entweder als eigene Sprachen oder gar nicht. Die Auswahl zwischen diesen beiden Vorgehensweisen wirkt ziemlich zufällig und ist nicht geeignet, die deutschen Dialekte insgesamt zu erfassen.

Manche Kürzel für Sprachfamilien haben ihre Bedeutung verändert, seitdem der Versuch unternommen wird, allen Sprachen einen Sprachcode zuzuweisen. So hat früher [smi] andere, also sonst nicht erfasste, Samisprachen bedeutet, heute aber die Gesamtheit der Samisprachen. Dieser Bedeutungswandel ist nicht überall in gleicher Weise vollzogen worden.

Alte Sprachen

Unter den Einzelsprachen in der Norm ISO 639-3, teilweise zusätzlich auch in ISO 639-2 oder ISO 639-1 enthalten, finden sich auch eine Reihe alter Sprachen, die je nach ihrem Alter und ihrer literarischen Bedeutung als alt (ancient), historisch (historic) oder ausgestorben (extinct) eingestuft werden, wobei diese Unterscheidung in der Praxis der Normanwendung keine Rolle spielt. Der untere Teil der Tabelle am rechten Rand enthält ein paar Beispiele.

Es gibt dabei einen Trend zur immer feineren Unterteilung, der die Bedeutung eines Kürzels nachträglich einschränken kann. So bezeichnete [arc] früher jede aramäische Sprache, heute nur noch eine von fünf Sprachen aus verschiedenen Epochen.