Indoarische Sprachen

Die indoarischen Sprachen bilden zusammen mit den iranischen und Nuristani-Sprachen den indo-iranischen Zweig der indogermanischen Sprachen. Indoarische Sprachen sind heute auf dem gesamten indischen Subkontinent verbreitet, vor allem in den Staaten Indien (Verbreitungsschwerpunkt im Norden und der Mitte des Landes), Pakistan, Bangladesh, Nepal und auf Sri Lanka.
Die indoarische Sprachen werden in drei Zeitstufen gegliedert: Altindoarische Sprachen, mittelindoarische und die heute gesprochenen neuindoarischen Sprachen. Es gibt etwa 110 neuindoarische Sprachen mit rund einer Milliarde Sprecher. Zu den wichtigsten indoarischen Sprachen gehören Hindi, das nah verwandte Urdu, Bengali, weitere indische Regionalsprachen und die klassische Sprache Sanskrit. Mit den in Südindien gesprochenen dravidischen Sprachen sind die indoarischen Sprachen nicht genetisch verwandt, doch haben sich durch jahrtausendelangen Sprachkontakt zahlreiche gemeinsame Merkmale entwickelt.
Beziehungen zu anderen Sprachen
Indogermanische Sprachfamilie
Die indoarischen Sprachen bilden einen Unterzweig der indogermanischen (indoeuropäischen) Sprachfamilie, zu der auch die Mehrzahl der in Europa gesprochenen Sprachen gehört. Andere Zweige der indogermanischen Sprachfamilie sind etwa das Griechische, die romanischen, slawischen oder germanischen Sprachen. Somit sind die indoiranischen Sprachen – wenn auch entfernte – Verwandte der germanischen Sprache Deutsch. Diese Verwandtschaft lässt sich bei den modernen Sprachen nur noch an einigen wenigen Wörtern auf den ersten Blick erkennen: So lautet das Bengali-Wort für „Name“ nām, das Hindi-Wort für „neu“ ist nayā und die „Kuh“ heißt auf Marathi gau. In anderen Fällen wie Englisch wheel und Nepali cakkā (beides bedeutet „Rad“) ist der gemeinsame Ursprung, wenngleich vorhanden, nur durch komplizierte Etymologien nachvollziehbar. Für einen Großteil des Wortschatzes und insbesondere der Grammatik der modernen indoarischen Sprachen lässt sich indes gar keine Entsprechung in den heutigen europäischen Sprachen finden. Zwischen im Altertum gesprochenen Sprachen wie dem Sanskrit und dem Lateinischen oder Altgriechischen sind die Übereinstimmungen hingegen weitaus größer, sowohl was den Wortschatz als was die Morphologie angeht. Man vergleiche hierzu Formen wie Sanskrit dantam und Latein dentem „den Zahn“ oder Sanskrit abharan und Altgriechisch epheron „sie trugen“.
Die Erkenntnis der Verwandschaft des Sanskrit mit den Sprachen Europas war maßgeblich für die Entwicklung der vergleichenden Sprachwissenschaft. Der Engländer William Jones hatte während seiner Richtertätigkeit in Kalkutta Sanskrit gelernt und erkannte 1786 als Erster die Verwandschaft des Sanskrit mit dem Griechischen, Lateinischen, Gotischen und Keltischen. Auf dieser Grundlage begründete der deutsche Sprachwissenschaftler Franz Bopp (1791–1867) die historisch-vergleichende Disziplin der Indogermanistik.
Indoiranische Sprachfamilie
Innerhalb der indogermanischen Sprachfamilie stehen die indoarischen Sprachen den iranischen Sprachen, zu denen etwa Persisch (Farsi), Kurdisch oder Paschtunisch gehören, nahe. Auch hier zeigt sich die Verwandtschaft bei den ältesten Sprachformen am deutlichsten: Im Altpersischen, der Sprache der achämenidischen Großkönige, und dem Sanskrit sind viele Wörter wie daiva und deva „Gott“, būmi und bhūmi „Erde“ oder aspa und aśva „Pferd“ nahezu formengleich, während die modernen Sprachen sich auseinanderentwickelt haben. Man fasst die indoarischen und iranischen Sprachen unter dem Zweig der indoiranischen Sprachen zusammen. Zu diesen gehört außerdem als separater Unterzweig noch die zahlenmäßig kleine Gruppe der in Afghanistan und Pakistan gesprochenen Nuristani-Sprachen. Die Stellung der ebenfalls im äußersten Nordwesten des Subkontinents verbreiteten dardischen Sprachen innerhalb des Indoiranischen ist unsicher. Während man sie früher entweder mit den Nuristani-Sprachen zusammenfasste oder als eigenständigen Zweig ansah, hält man sie heute für eine Untergruppe der indoarischen Sprachen.
Südasiatischer Sprachbund
Die indoarischen Sprachen teilen sich den indischen Subkontinent mit drei anderen Sprachfamilien: den hauptsächlich in Südindien verbreiteten dravidischen Sprachen (deren wichtigste Vertreter Tamil, Malayalam, Telugu und Kannada sind), der kleineren Gruppe der in Mittelindien verstreuten Munda-Sprachen (einem Zweig der austroasiatischen Sprachen) und den tibeto-birmanischen Sprachen (einem Zweig der sinotibetischen Sprachen) am Nord- und Ostrand des Subkontinents. Mit diesen Sprachfamilien sind die indoarischen Sprachen nicht genetisch verwandt, doch haben sie sich durch jahrtausendelangen Sprachkontakt in Wortschatz, Morphologie und Phonetik (besonders charakteristisch etwa das Vorhandensein von retroflexen Konsonanten) gegenseitig stark beeinflusst. Aufgrund der zahlreichen gemeinsamen Merkmale kann man diese Sprachen zu einem südasiatischen Sprachbund zusammenfassen. Vor allem die Wechselwirkung zwischen den indoarischen und dravidischen Sprachen ist beachtlich gewesen, wobei die dravidischen Sprachen in großem Maße Wörter aus dem Sanskrit übernommen haben, während sie selbst einen starken strukturellen Einfluss auf die Phonetik und Morphologie der indoarischen Sprachen ausgeübt haben.
Sprachgeschichte
Die indoarischen Sprachen können auf eine Sprachgeschichte von etwa vier Jahrtausenden zurückblicken. Man teilt sie in drei historische Stufen ein: altindoarisch (Vedisch, klassisches Sanskrit), mittelindoarisch (Prakrits, Pali, Apabhramsha) und neuindoarisch, die seit etwa 1000 n. Chr. bis heute gesprochenen indoarischen Sprachen.
Vorgeschichte
Als Mitglieder der indogermanischen Sprachfamilie stammen die indoarischen Sprachen von einer angenommenen indogermanischen Ursprache ab, die wohl im 4. oder 3. Jahrtausend v. Chr. in den Steppen Südrusslands gesprochen wurde. Von der indogermanischen Urbevölkerung spaltete sich eine Gruppe ab, die sich selbst als „Arier“ (ārya) bezeichnete und die eine Vorstufe der indoiranischen Sprachen sprach. Nachdem sie sich eine Zeit lang in Baktrien aufgehalten hatten, teilten sie sich um 2000 v. Chr. in einen iranischen und indoarischen Zweig auf.[1] Die Iraner ließen sich im Nord- und West-Iran nieder, die Indoarier wanderten wohl um 1500 v. Chr. auf den indischen Subkontinent ein.[2] Der älteste sprachliche Hinweis auf die Indoarier stammt indes aus dem hurritischen Mitanni-Reich im Norden Mesopotamiens und Nordosten Syriens. Dort herrschte im 16.–13. Jahrhundert v. Chr. eine Führungsschicht, die eindeutig indoarisch interpretierbare Namen trugen und Götter wie Indra verehrten. In einem Lehrbuch der Pferdehaltung, das der Mitannier Kikkuli im 15. Jahrhundert v. Chr. in hethitischer Sprache verfasste, finden sich einige aus dem Indoarischen entlehnte Fachbegriffe.[3]. Diese frühindoarische Schicht im Westen Vorderasiens verschwand nach Untergang des Mitanni-Reichs spurlos.
Altindoarische Sprachen
Die altindoarische Phase beginnt mit der Einwanderung der Indoarier nach Indien im 2. Jahrtausend v. Chr. Als Altindoarisch oder Altindisch fasst man das Vedische und das klassiche Sanskrit zusammen. Das Vedische, die Sprache der Veda-Schriften, ist die älteste indoarische Sprachform. Die Datierung der lange Zeit nur mündlich überlieferten Texte ist unsicher, die ältesten Rigveda-Hymnen dürften aber kurz nach der Einwanderung der Indoarier nach Indien Mitte des 2. Jahrtausends v. Chr. entstanden sein. Das Vedische stellt eine archaische Form des Sanskrit mit einem größeren Formenreichtum und einigen Unterschieden in Phonologie und Wortschatz dar. Die Unterschiede zum klassischen Sanskrit entsprechen etwa denen zwischen der Sprache Homers und dem klassischen Altgriechischen. Die Sprache der Brahmanas und Sutras ist eine Zwischenstufe zwischen Vedisch und klassischem Sanskrit.
Um die fehlerfreie Rezitation der heiligen Texte sicherzustellen, entwickelte sich in Indien früh die Wissenschaft der Phonetik und Grammatik. Diese fand im Werk Panini ihre Vollendung, der in seiner Grammatik um 300 v. Chr. die Sprache der gebildeten Oberschicht kodifizierte. Das einfache Volk sprach zu dieser Zeit bereits mittelindoarische Idiome. So steht die Bezeichung Sanskrit (saṃskṛta „zurechtgemacht, kultiviert“) auch im Gegensatz zu Prakrit (prākṛta „natürlich“). Paninis Grammatik wurde normativ für das klassische Sanskrit. Somit wurde das Sanskrit als Literatursprache in einem archaischen Stadium konserviert und existierte über einen langen Zeitraum parallel zu den mittelindoarischen Sprachen. Die wichtigsten Werke der Sanskrit-Literatur wie die Ashvaghoshas (2. Jahrhundert) oder Kalidasas (5. Jahrhundert) entstanden zu einer Zeit, als Sanskrit längst keine gesprochene Sprache mehr war. Anders als die Laut- und Formenlehre war die Syntax aber durch Panini kaum reglementiert und konnte daher Eigenarten entwickeln, die in den frühen Stufen des Altindoarischen unbekannt sind. Charakteristisch für das klassische Sanskrit sind die Bevorzugung von Passivkonstruktionen und die Bildung riesiger Komposita mit bis zu 20 Bestandteilen.
Mittelindoarische Sprachen
Die mittelindoarischen Sprachen entstanden schon ab etwa 600 v. Chr. aus dem Altindoarischen. Da die gesprochenen Formen des Altindoarischen keineswegs einheitlich waren, ist die oft geäußerte Aussage, bestimmte mittelindoarische Sprachen seien „aus dem Sanskrit entstanden“ irreführend. Kennzeichnend für die Entwicklung vom Alt- zum Mittelindoarischen ist eine Vereinfachung der Formenlehre und der lautlichen Gestalt der Wörter (z. B. Sanskrit trividya zu Pali tevijja). Es sind mehrere mittelindoarische Idiome überliefert, für die man oft den Oberbegriff „Prakrit“ verwendet. Die ältesten Sprachzeugnisse des Mittelindoarischen und zugleich die ältesten Schriftdenkmäler Indiens sind die in einer Reihe regionaler Dialekte abgefassten Edikte Kaiser Ashokas aus dem 3. Jahrhundert v. Chr. Sie sind in verschiedenen Teilen Indiens in Steininschriften in der Brahmi-Schrift zu finden. Die reformerischen Religionen des Buddhismus und Jainismus bevorzugten für ihre Schriften Prakrit. Auch in der Kunstdichtung kamen Prakrits zum Einsatz, teils parallel zum Sanskrit. So sprechen im klassischen Sanskrit-Drama Frauen und niedriggestellte Charaktere Prakrit.
Die mittelindoarischen Sprachen lassen sich in drei Phasen einteilen. Die früheste Phase verkörpert Pali, als Sprache des Hinayana-Kanons und zahlreicher anderer buddhistischer Literatur die wichtigste mittelindoarische Literatursprache. Die späteren Prakrits werden in einen westlichen und östlichen Zweig unterteilt. Die Hauptform des westlichen Prakrit, Sauraseni, war im Gebiet der Flüsse Ganges und Yamuna verbreitet. Es ist zudem das Standard-Prakrit des Dramas und die Sprache einiger Jaina-Texte. Zum östlichen Prakrit gehörte Magadhi, die Sprache des Landes Magadha im heutigen Bihar. Es wurde auch zur Charakterisierung niedriger Klassen in Sanskrit-Dramen verwendet. Geografisch wie sprachlich nimmt das in Kosala (heute östliches Uttar Pradesh) gesprochene Ardhamagadhi („Halb-Magadhi“) eine Zwischenstellung ein. In Ardhamagadhi ist der frühe Jaina-Kanon abgefasst. Mit ihm verwandt war Maharashtri, der Vorläufer des heutigen Marathi. Es wurde vor allem als Sprache der Poesie verwendet, in Sanskrit-Dramen kommen oft in Maharashtri verfasste Lieder vor. Phonologisch stellt es den fortschrittlichsten Dialekt der mittleren Phase dar. Außerhalb Indiens ist das Niya-Prakrit in Handschriften aus dem 3.–7. Jahrhundert als Verwaltungssprache indoarischer Gruppen und Städte in Chinesisch-Turkestan belegt. Verwandt ist das etwas ältere Gandhari, die Sprache indoarischer Khotan-Manuskripte aus dem 1. Jahrhundert.
Um die Mitte des 1. Jahrtausends bildete sich die nächste Stufe des Mittelindoarischen heraus, die man Apabhramsha (apabhraṃśa „verdorbene Sprache“) nennt. Der Begriff wird generalisierend für alle indoarischen Dialekte der späten mittelindoarischen Phase verwendet. Das Apabhramsha ist grammatikalisch noch weiter vereinfacht als die Prakrits und stellt bereits eine Übergangssprache zum Neuindoarischen dar. Die wichtigste Literatursprache dieser Periode ist das Nagara-Apabhramsha, daneben existierten mehrere regionale Apabhramshas, die bereits Vorläufer der heutigen indoarischen Sprachen darstellen.
Singhalesisch ist seit Mitte des 1. Jahrtausends v. Chr. von den übrigen indoarischen Sprachen isoliert und hat sich auf eigenen Wegen entwickelt. Ab dem 1. Jahrhundert v. Chr. ist ein singhalesisches Prakrit in Inschriften überliefert. Die singhalesische Entsprechung zur Apabhramsha-Phase ist Elu.
Neuindoarische Sprachen
Der Übergang vom Mittel- zum Neuindoarischen fand etwa 900 - 1100 n. Chr. statt. In den neuindoarischen Sprachen wird die grammatikalische Entwicklung, die sich bereits in der mittelindoarischen Phase abzeichnete, zu Ende geführt. Vom alten flektierenden Sprachbau sind nur noch Rudimente vorhanden, stattdessen setzt sich die analytische Struktur durch und einzelne Sprachen entwickeln agglutinierende Formen. Dabei sind die westlichen Sprachen generell konservativer sind als die östlichen.
Geografische Verbreitung
Das Hauptverbreitungsgebiet der heutigen indoarischen Sprachen umfasst den nördlichen Teil des indischen Subkontinents etwa vom Indus im Westen bis nach Assam im Osten sowie vom Himalaya im Norden bis etwa zum 18. Breitengrad im Süden. Die indoarischen Sprachen sind die größte Sprachfamilie Südasiens. 15 von 22 offiziellen Sprachen Indiens sind indoarisch, drei von vier Indern sprechen eine indoarische Sprache als Muttersprache.[4] Auch in Pakistan, Bangladesch, Nepal, Sri Lanka und auf den Malediven ist jeweils eine indoarische Sprache Amtssprache.
Zentralindien

Die offizielle Nationalsprache Indiens ist Hindi. Die Anzahl der Muttersprachler hängt davon ab, in welchem Umfang man benachbarte verwandte Sprachen bzw. Dialekte zum Hindi dazurechnet oder als selbstständige Sprachen betrachtet. Im engeren Sinne hat Hindi über 200 Millionen Muttersprachler, legt man die erweiterte politische Definition der indischen Regierung zugrunde (s.u.), sind es 420 Millionen. Mit Zweitsprachlern wird Hindi von 500 Millionen Indern gesprochen, diese Zahl nimmt ständig zu. Die Hindi-Standardsprache beruht auf dem Hindustani, einer überregionalen Verkehrssprache auf Grundlage des Khari Boli, dem Dialekt von Delhi und Umgebung. Es dient in den nordindischen Bundesstaaten Uttar Pradesh, Bihar, Jharkand, Chhattisgarh, Madhya Pradesh, Rajasthan, Haryana, Uttarakhand und Himachal Pradesh sowie im Unionsterritorium Delhi als Amtssprache und wird von der Bevölkerung als Schriftsprache verwendet. In diesem zentralindischen Gebiet wird eine Reihe von nah verwandten, manchmal als Hindi-Dialekte klassifizierten Regionalsprachen gesprochen. Diese unterteilen sich in zwei Gruppen, „West-Hindi“ oder west-zentralindisch (Haryani, Braj-Kanauji, Bundeli) und „Ost-Hindi“ oder ost-zentralindisch (Awadhi, Bagheli, Chhattisgarhi).
Aus politischen Gründen klassifiziert die indische Regierung eine Reihe weiterer Sprachen, die aus sprachwissenschaftlicher Sicht eigenständig sind, zu verschiedenen Untergruppen des Indoarischen gehören und teils sogar eine eigene Schriftsprache haben, als „Hindi-Dialekte“[5]. Dies sind die Sprachen der ostindischen Bihari-Gruppe (mit Bhojpuri, Maithili und Magahi), die westindischen Rajasthani-Sprachen sowie im Norden die Gruppe der am Rand des Himalaya gesprochenen nordindischen Pahari-Sprachen. Diese Definition ist nicht linguistisch, sondern ausschließlich politisch motiviert. Ziel ist es, das Hindi zu einer wirklichen Nationalsprache auszudehnen. Allerdings beeinflusst Hindi als Medien- und Prestigesprache im zunehmenden Maße andere indoarische Sprachen.
Urdu, die Sprache der indischen und pakistanischen Muslime, und Hindi sind im Bereich der Alltagssprache nahezu identisch; sie beruhen beide auf dem Hindustani und sind nicht einmal unterschiedliche Dialekte. Die Schriftsprache des Urdu unterscheidet sich aber durch einen hohen Anteil von Wörtern persisch-arabischer Herkunft und die Verwendung der arabischen Schrift. Trotz 65 Millionen Sprechern (mit Zweitsprechern 105 Mio.) ist Urdu eine Sprache ohne territoriale Basis. Einen Großteil ihrer Sprecher macht die muslimische Stadtbevölkerung Nordindiens aus, daneben ist auch in südindischen Städten wie Hyderabad ein als Dakhini bekannter Urdu-Dialekt verbreitet. In Pakistan wird Urdu nur von einem kleinen Teil der Bevölkerung als Muttersprache gesprochen (etwa 10 Mio.), doch ist es die offizielle Nationalsprache des Landes und dient als überregionale Verkehrs- und Bildungssprache, wodurch auch die Anzahl der Urdu-Sprecher stetig zunimmt.
Osten
Zu den ostindischen Sprachen wird die oben schon erwähnte Bihari-Gruppe mit den Hauptsprachen Bhojpuri (65 Mio. Sprecher), Maithili und Magahi gerechnet, die in Bihar zwischen den zentralindischen Idiomen und dem Bengali gesprochen werden. Bengali (mit 210 Millionen Sprechern die zweitgrößte indoarische Sprache) ist die Sprache der indischen Bundesstaaten Westbengalen und Tripura sowie von Bangladesh. Einige der Bengali-Varietäten (Chittagong, Sylhetti und Rajbangsi) werden auch als eigenständige Sprachen klassifiziert. Nordöstlich anschließend wird Asamiya im Bundesstaat Assam mit 15 Millionen Sprechern gesprochen.
Die Sprache des an der Ostküste Indiens gelegenen Bundesstaates Orissa ist Oriya, das von 32 Millionen Menschen gesprochen wird. In den Wald- und Berggegenden Zentralindiens werden neben den nichtindoarischen Sprachen der Adivasi-Stammesbevölkerung Bhatri und Halbi, zwei indoarische Übergangsdialekte gesprochen.
Süden und Westen
Marathi ist im nordwestlichen Dekkan im Bundesstaat Maharashtra verbreitet und hat insgesamt 80 Millionen Sprecher. Nah verwandt mit Marathi ist Konkani (8 Millionen Sprecher), das Amtssprache in Goa ist und außerdem im äußersten Süden Maharashtras sowie an der Küste von Karnataka und Kerala gesprochen wird.
In den Stammesgebieten von Nord-Maharashtra, Ost-Gujarat und Süd-Rajasthan spricht man Bhili und Khandeshi, zwei indoarische Sprachen, die früher als Gujarati-Dialekte betrachtet wurden. Das sich westlich anschließende Gujarati hat 45 Millionen Sprecher und wird im Bundesstaat Gujarat sowie von einem Teil der Bevölkerung Mumbais (Bombays) gesprochen. Nördlich schließen sich die Sprachen Rajasthans an, die sog. Rajasthani-Gruppe mit den Sprachen Marwari (15 Mio.), Malvi, Bagri, Lambardi und Nimadi, jeweils 1 bis 2 Mio. Sprecher.
Das Sprachgebiet des Sindhi (22 Mio. Sprecher) beginnt im Westen Gujarats und setzt sich jenseits der pakistanischen Grenze in der Provinz Sindh am Unterlauf des Indus fort. Mit dem Sindhi eng verwandt ist die Gruppe der westlichen sog. Panjabi-Dialekte, die auch als Lahnda-Gruppe bezeichnet wird. Von den Lahnda-Dialekten hat sich Siraiki als Schriftsprache durchgesetzt, eine weitere westpanjabische Sprache ist Hindko. Insgesamt sprechen ca. 80 Mio. Lahnda, Hindko oder Siraiki. Das eigentliche (östliche) Panjabi hat insgesamt 30 Millionen Sprecher und ist im Norden des pakistanischen Industals sowie im indischen Teil des Panjab verbreitet. Dogri-Kangri (2,2 Mio. Sprecher) wird im Gebiet von Jammu im indischen Bundesstaat Jammu und Kashmir gesprochen, es wurde früher als Panjabi-Dialekt angesehen, gehört aber einem separaten Sprachzweig an und ist mittlerweile in Indien offiziell als eigenständige Sprache anerkannt.
Norden
Nördlich des Hindi-Sprachgebiets wird Nepali von 16 Mio. gesprochen. Es ist die Nationalsprache Nepals und außerdem in Sikkim, Darjiling und Teilen Bhutans verbreitet. Weitere wichtige nordindische Sprachen sind Garhwali und Kumauni mit jeweils rund 2 Mio. Sprechern. Sie werden vor im Vorgebirge des Himalayas, westlich des Nepali-Sprachgebiets gesprochen (sog. West-Pahari-Sprachen).
Im äußersten Nordwesten des Subkontinents liegt das Verbreitungsgebiet der dardischen Sprachen. Deren wichtigste ist das im Kaschmir-Tal gesprochene Kashmiri mit 4,5 Mio. Sprechern, die einzige dardische Literatursprache. Die übrigen dardischen Sprachen (hierzu gehören u. a. Pashai, Khowar, Kalasha, Shina und Indus-Kohistani) werden insgesamt von 1,2 Millionen Menschen im Hindukusch-Gebiet Pakistans und Afghanistans gesprochen.
Übrige
Räumlich vom restlichen indoarischen Sprachgebiet getrennt ist das Singhalesische (Sinhala). Es wird von der Mehrheit der Bevölkerung Sri Lankas gesprochen (15 Mio. Sprecher). Divehi, die Sprache der Malediven, hat 220.000 Sprecher und ist eng mit dem Singhalesischen verwandt.
Einen Sonderfall stellt Romani (Romanes) dar, die in zahlreichen Dialekten über die Länder Europas und des vorderen Orients verstreute Sprache der Roma mit etwa 3,5 Mio. Sprechern. Verwandt mit dem Romani – zu dem auch die in Deutschland verbreitete Sinti-Sprache als Dialekt gehört –, sind die ebenfalls außerhalb Indiens im Nahen Osten und Europa gesprochenen Idiome Domari und Lomavren.
Als Folge neuerer Migrationsprozesse während der britischen Kolonialzeit werden indoarische Sprachen in größerer Zahl u. a. auch in der Karibik, Guyana, Südafrika, Mauritius und Fidschi verwendet. In Fidschi dient sogar eine Variante des Hindustani als Amtssprache.
Klassifikation der neuindoarischen Sprachen
Probleme
Die Klassifikation der neuindoarischen Sprachen, die seit etwa 1000 n. Chr. gesprochen werden, stößt auf viele Probleme. Idealerweise kann ein Stammbaum die genetische Abspaltung einer Gruppe von Sprachen wiedergeben, die sich durch räumliche Entfernung im Laufe der Zeit auseineinander entwickelt haben. Dieser Prozess hat im Prinzip auch bei den indoarischen Sprachen stattgefunden, ist aber durch diverse Wanderungsbewegungen zum Teil historisch nicht mehr eindeutig nachzuvollziehen. Gründe für die immer wieder erfolgenden Migrationen und die damit verbundenen Durchmischungsprozesse sind die kaum vorhanden natürlichen Barrieren im indischen Kernland und instabile politische Einheiten mit multiethnischen und multilingualen Gesellschaften. Diese Prozesse resultierten letztendlich in ein Dialektkontinuum, das sich über den ganzen indoarischen Sprachraum von West nach Ost und Nord nach Süd erstreckt.
Die Folge sind erstens große Schwierigkeiten bei der Identifikation von Einzelsprachen, bei der Abgrenzung von Dialekt und Sprache und schließlich bei der Klassifikation, das heißt der inneren Gliederung der neuindoarischen Sprachen insgesamt. Erschwerend kommt der Umstand hinzu, dass der Übergang vom späten Mittelindoarischen zum frühen Neuindoarischen etwa um 900 – 1100 n. Chr. nur sehr schwach schriftlich belegt ist; dadurch wird es unmöglich, neuindoarische Sprachen auf bestimmte mittelindoarische Sprachen zurückzuführen und somit eine natürliche Gruppenbildung der NIA-Sprache zu erzielen.
Da ein einfaches, gut begründbares Stammbaummodell also nicht leicht zu erreichen ist, gab es Ansätze, mit Hilfe des Wellenmodells die Strukturierung der NIA-Sprachen zu verstehen. Dabei werden von bestimmten Zentren ausgehende Innnovationen untersucht, die sich im Laufe der Zeit durch Teilbereiche der NIA-Sprachen bewegt haben und in Isoglossen nachzuvollziehen sind. Hier spielt auch das Phänomen der Prestigesprachen eine große Rolle, deren Merkmale und Innovationen durch Kontakt verstärkt auf benachbarte Sprachen übergegangen sind. (Indoarische Prestigesprachen mit dieser Funktion waren das Vedische, Sanskrit, Magadhi, Sauraseni, Apabhramsa und heutzutage Hindi.) Das Problem der Wellentheorie ist, dass unterschiedliche Isoglossen zu völlig unterschiedlichen Gliederungen führen und somit letztendlich keine Klassifikation möglich ist.
Historische Ansätze
Klassifikationsversuche im klassischen genetischen Sinne gab es bereits seit dem frühen 19. Jahrhundert. Aber erst Hoernle 1880 gibt eine Übersicht, die bereits auf einer größeren Zahl neuindoarischer Sprachen basiert und somit mit moderneren Fassungen vergleichbar ist. Hoernles Hauptgliederung ist eine nordwestliche und eine südöstliche, welche er auf zeitlich getrennte Einwanderungswellen zurückführt:
- Neuindoarische Sprachen (nach Hoernle 1880)
- Nord-West-Gruppe
- Nord-Gruppe: Nepali, Kumanauni, Garhwali u.a.
- West-Gruppe: Sindhi, Panjabi, Gujarati, Hindi u.a.
- Süd-Ost-Gruppe
- Ost-Gruppe: Bihari, Bengali, Oriya u.a.
- Süd-Gruppe: Marathi, Konkani
- Nord-West-Gruppe
Die Grundergebnis dieser auch areal bedingten Klassifikation haben viele spätere Forscher übernommen, allerdings wurde die These der verschiedenen Einwanderungsströme schon bald verworfen. Einen nächsten wichtigen Schritt machte Grierson in seinem Linguistic Survey of India (1903-28), der noch heute eine wichtige Arbeitsgrundlage darstellt. Er ging von einem Konzept „äußerer“ und „innerer“ NIA-Sprachen aus. Zu den inneren zählte er die Pahari-Gruppe, Panjabi, Rajasthani, Gujarati und Hindi, zu den äußeren die Ostgruppe (Bengali, Assami, Oriya), die Südgruppe (Marathi, Konkani, Singhalesisch) und eine Nordwestgruppe (Lahnda, Sindhi). Dazwischen positionierte er eine „mittlere“ Gruppe von Übergangssprachen (z. B. Awadhi, Chhattisgarhi). Das Innen-Außen-Konzept konnte sich ebensowenig wie die Migrationsthese halten.
Eine neue Klassifikation legte dann Chatterji 1926 vor, die bereits im Wesentlichen mit heutigen Ansätzen korrespondiert. Obwohl die Gruppen wieder areale Namen tragen, geht Chatterji von linguistischen Merkmalen und bestimmten phonetischen Isoglossen aus und kommt damit zu folgender nicht-hierarchischen Klassifikation:
- Neuindoarische Sprachen (nach Chatterji 1926)
- Nord: Pahari, Nepali
- Nordwest: Lahnda, Panjabi, Sindhi
- Südwest: Rajasthani, Gujarati
- Zentral: Hindi und verwandte Sprachen
- Ost: Bihari, Bengali, Assami, Oriya
- Süd: Marathi, Singhalesisch
Grierson revidiert 1931 seinen ursprünglichen Ansatz und kommt zu einer sehr ähnlichen Binnengliederung wie Chatterji. Auch die Klassifikationen von Turner (1960), Katre (1965) und Cardona (1974) sind jeweils begründete Varianten des Chatterji-Ansatzes.
Sonderfälle Dardisch, Romani, Singhalesisch
Während man also zum Kern der NIA-Sprachen nach und nach einen annähernden Konsens gefunden hatte, ohne allerdings in jedem Detail zu einer allgemein akzeptierten Einteilung zu gelangen, gab es noch längere Dispute um Randgruppen, nämlich das Dardische, die Zigeunersprachen (Romani, Domari und Lomavren) und das Singhalesische und Maledivische (Divehi). Letztere hat man entweder den südindoarischen Sprachen (Marathi, Konkani) zugerechnet oder aber als eigene Gruppe behandelt.
Beim Dardischen ist bis heute nicht endgültig geklärt, welche Sprachen dazugehören sollen. Rechnete man ursprünglich die Nuristani-Sprachen dazu, so tendiert heute die Mehrheit der Forscher dahin, Nuristani als dritten Zweig des Indoiranischen gleichrangig neben Iranisch und Indoarisch aufzufassen und nicht mehr den dardischen Sprachen zuzuordnen. Strittig ist dann immer noch die Position der (restlichen) dardischen Sprachen (die wichtigste ist Kashmiri) innerhalb des Neuindoarischen. Während manche Forscher es als einen Unterzweig des Nordwestindischen betrachten (etwa zusammen mit Lahnda und Sindhi), setzt sich die Positionierung als selbstständiger Zweig des Indoarischen durch.
Besonders schwierig gestaltet sich die Zuordnung des Romani (und der anderen Zigeuneridiome), deren Zughörigkeit zum Indoarischen Mitte des 19. Jhdts. erkannt wurde. Die moderne Darstellung des Romani und seiner Dialekte von Matras (2002) positioniert es im Zentralindischen nahe dem Hindi, frühere Auffassungen tendierten wegen mancher Ähnlichkeiten in der Phonetik eher zum Nordwestindischen. In dieser Sache ist die letzte Entscheidung noch nicht getroffen, dieser Artikel stellt das Romani zusammen mit dem Domari und Lomavren als separaten Zweig des NIA dar.
Somit deckt sich die hier gegebene Klassifikation weitgehend mit der von Gippert im Metzler Lexikon Sprache (2. Auflage 2000), die von ihm als "zur Zeit beste Arbeitshypothese" bezeichnet wird. Eine stabile, für alle Zeiten gültige Klassifikation der NIA-Sprachen wird es wahrscheinlich auch in Zukunft nicht geben, aber große Abweichungen vom hier vorgestellten Modell sind allerdings wohl auch nicht zu erwarten.
Hauptzweige des Neuindoarischen
Das folgende Strukturdiagramm gibt die Hauptzweige des Neuindoarischen mit den wichtigsten Sprachen wieder. Die vollständige Klassifikation aller NIA-Sprachen wird im nächsten Abschnitt dargestellt.
- Neuindoarisch
- Dardisch: Kashmiri, Pashai, Khowar, Indus-Kohistani, Shina
- Nordindisch: Garhwali, Kumauni, Nepali
- Nordwestindisch: Dogri-Kangri, Hindko, Lahnda (West-Panjabi), Panjabi, Sindhi
- Westindisch: Marwari, Malvi, Nimadi, Gujari, Bagri, Lambardi; Gujarati, Vasavi; Bhili; Khandeshi
- Zentralindisch: Hindi, Urdu, Braj-Kanauji, Haryanvi, Bundeli; Awadhi, Chhattisgarhi
- Ostindisch: Bhojpuri, Maithili, Magahi, Sadri; Oriya; Asamiya, Bengali, Chittagong, Sylhetti, Rajbangsi
- Südindisch: Marathi, Konkani
- Sinhala-Divehi: Singhalesisch, Divehi (Maledivisch)
- Romani-Domari: Romani, Domari
Klassifikation der neuindoarischen Sprachen
Für jeden Hauptzweig des Neuindoarischen werden in der folgenden Übersicht die strukturelle Gliederung und die zugehörigen Sprachen mit ihren aktuellen Sprecherzahlen angegeben. Zur Sprachidentifikation (und Abgrenzung gegenüber Dialekten) wurde vor allem David Dalby The Linguasphere Register (2000) herangezogen. Es sei darauf hingewiesen, dass die dargestellten Einheiten tatsächlich "Sprachen" und nicht nur "Dialekte" sind; jede angeführte Sprache hat in der Regel ihrerseits etliche Dialekte. Zwischen benachbarten Sprachen gibt es normalerweise Übergangsdialekte, deren Zuordnung natürlich problematisch ist. Für eine vollständige und detaillierte Aufstellung mit Dialekten und Unterdialekten siehe den unten angegeben Weblink, auf dem diese Klassifikation basiert. Die Sprecherzahlen stammen im Wesentlichen aus Ethnologue (15. Auflage 2005), bei größeren Sprachen wurden statistische Jahrbücher und zusätzliche Quellen zur Absicherung herangezogen.
Hauptzweige in Kapitälchen, genetische Untergruppen in Fettdruck, Sprachnamen im Normaldruck.
DARDISCH (23 Sprachen mit 5,7 Mio Sprechern)
- Kunar
- Pashai (110 Tsd), Gawarbati (10 Tsd), Dameli (5 Tsd), Shumasti (1 Tsd)
- Chitral
- Khowar (Chitrali) (240 Tsd), Kalasha (5 Tsd)
- Kohistani
- Indus Kohistani (220 Tsd), Kalami Kohistani (Bashkarik, Garwi) (40 Tsd), Torwali (60 Tsd), Kalkoti (4 Tsd), Bateri (30 Tsd), Chilisso (3 Tsd), Gowro (200), Wotapuri-Katarqalai (2 Tsd), Tirahi (100)
- Shina
- Shina (500 Tsd), Brokshat (Brokskat, Brokpa) (3 Tsd), Ushojo (2 Tsd), Dumaki (500) [wird auch als Domari-Dialekt betrachtet], Phalura (Dangarik) (10 Tsd), Sawi (Sau) (3 Tsd)
- Kashmiri
- Kashmiri (Keshur) (4,5 Mio)
Diese Klassifikation der dardischen Sprachen und die verwendeten Sprachnamen basieren auf den Darstellungen der Einzelsprachen in Sociolinguistic Survey of Northern Pakistan und Studies in Languages of Northern Pakistan, genauere Literaturangaben im Artikel Dardische Sprachen.
NORDINDISCH oder PAHARI (3 Sprachen mit 21 Mio Sprechern)
- Westpahari
- Garhwali (2,2 Mio), Kumauni (2,4 Mio)
- Ostpahari
- Nepali (16 Mio)
NORDWESTINDISCH (20 Sprachen mit 135 Mio Sprechern)
- Dogri-Kangri
- Dogri-Kangri (2,2 Mio), Gaddi (Bhamauri) (120 Tsd), Churahi (110 Tsd), Bhattiyali (100 Tsd), Bilaspuri (300 Tsd), Kinnauri-Harijani (6 Tsd), Chambeali (130 Tsd), Mandeali (800 Tsd), Mahasu-Pahari (650 Tsd), Jaunsari (100 Tsd), Kului (110 Tsd), Bhadrawahi-Pangwali (90 Tsd), Pahari-Potwari (200 Tsd)
- Lahnda
- Hindko (3 Mio), Lahndna (West-Panjabi) (45 Mio), Siraiki (Süd-Panjabi, Multani) (30 Mio)
- Panjabi
- Panjabi (Ost-Panjabi) (30 Mio)
- Sindhi
- Sindhi (22 Mio), Kachchi (850 Tsd), Jadgali (100 Tsd)
WESTINDISCH (13 Sprachen mit 78 Mio Sprechern)
- Rajasthani
- Marwari (15 Mio), Harauti (600 Tsd), Goaria (25 Tsd); Malvi (1,2 Mio), Nimadi (1,4 Mio), Gujari (Gujuri) (1-2 Mio), Bagri (1,8 Mio), Lambadi (Lamani) (2,8 Mio), Lohari (wenige Tsd)
- Gujarati
- Gujarati (45 Mio), Vasavi (1 Mio), Saurashtri (300 Tsd)
- Bhili-Khandeshi
- Bhili (6 Mio), Kandeshi (2,5 Mio)
ZENTRALINDISCH (14 Sprachen mit 320 Mio Sprechern, inkl. S2 655 Mio)
- West
- Hindi (200 Mio, mit S2 490 Mio), Urdu (60 Mio, mit S2 105 Mio), Braj-kanauji (6 Mio), Haryanvi (Banguru) (13 Mio), Bundeli (8 Mio), Gowli (35 Tsd), Chamari (5 Tsd), Sansi (10 Tsd), Ghera (10 Tsd), Bhaya (700)
- Ost
- Awadhi (21 Mio), Bagheli (400 Tsd); Chhattisgarhi (12 Mio), Dhanwar (15 Tsd)
OSTINDISCH (26 Sprachen mit 347 Mio Sprechern)
- Bihari
- Bhojpuri (26 Mio), Maithili (25 Mio), Magahi (12 Mio), Sadri (2 Mio), Oraon Sadri (200 Tsd), Angika (750 Tsd), Bote-Majhi (10 Tsd)
- Oriya
- Oriya (32 Mio), Adiwasi Oriya (300 Tsd), Halbi (800 Tsd)
- Tharu
- Rana Thakur (270 Tsd), Saptari (250 Tsd), Chitwania (80 Tsd), Deokri (80 Tsd), Mahotari (30 Tsd), Buksa (45 Tsd)
- Assami-Bengali
- Assami (15 Mio); Bengali (210 Mio), Chittagong (14 Mio), Sylhetti (5 Mio), Rajbangsi (2,4 Mio), Chakma (600 Tsd), Bishnupriya-Manipuri (75 Tsd), Hajong (20 Tsd)
SÜDINDISCH (4 Sprachen mit 89 Mio Sprechern)
- Marathi
- Marathi (80 Mio)
- Konkani
- Konkani (8 Mio), Bhil-Konkani (600 Tsd), Varli (500 Tsd)
SINHALA-DIVEHI (2 Sprachen mit 13,2 Mio Sprechern)
- Sinhala (Singhalesisch) (13 Mio), Divehi (Maledivisch) (220 Tsd)
ROMANI-DOMARI (3 Sprachen mit 4 Mio Sprechern)
- Romani (3,5 Mio), Domari (500 Tsd), Lomavren (100 Tsd ?)
NICHT-KLASSIFIZIERT (8 Sprachen mit 220 Tsd Sprechern)
Zusätzlich zu den klassifizierten neuindoarischen Sprachen gibt es einige schriftlose Sprachen, die bisher keinem der Hauptzweige zuzuordnen waren; dennoch sind die hier genannten Sprachen zweifelsfrei indoarisch. Möglicherweise sind einige dieser Sprachen Dialekte von klassifizierten Sprachen. Von keiner dieser Sprachen gibt es bisher linguistische Untersuchungen oder gar Grammatiken. Es handelt sich um:
- Tippera (100 Tsd Sprecher), Kanjari (50 Tsd), Od (50 Tsd), Usui (5 Tsd), Vaagri Booli (10 Tsd), Darai (7 Tsd),
Kumhali (1 Tsd), Chinali (1 Tsd).
Sprachliche Merkmale
Phonologie
Das Phoneminventar der indoarischen Sprachen ist in den verschiedenen Sprachstufen recht stabil geblieben. Charakteristische Laute wie die retroflexen und aspirierten Konsonanten kommen sowohl in alt-, mittel- als auch fast allen neuindoarischen Sprachen vor. Hingegen unterscheidet sich die Sprachstufen in der Verteilung der Laute im Wort erheblich, wodurch sich die Lautgestalt der Wörter teils erheblich verändert hat.
Konsonanten
Charakteristisch für das Konsonantensystem der indoarischen Sprachen ist eine große Zahl an Plosiven (Verschlusslauten), die nach fünf Artikulationsorten (velar, palatal, retroflex, dental und labial) unterschieden werden. Der Kontrast zwischen retroflexem ṭ und dentalem t (vgl. Hindi totā „Papagei“ und ṭoṭā „Mangel“) ist typisch für die Sprachen Südasiens. Obwohl man c und j traditionell als Plosive klassifiziert, werden sie in der Praxis eher als Affrikaten, also [ʧ] und [ʤ], gesprochen.[6] Der Unterschied zwischen stimmhaften und stimmlosen (z. B. p vs. b) ist ebenso bedeutungsunterscheidend wie die Aspiration, die sowohl bei stimmlosen als auch stimmhaften Plosiven vorkommt (z. B. p, b vs. ph, bh). Somit ergibt sich folgendes System der Plosive (Angegeben ist die IAST-Transkription und der Lautwert in IPA-Lautschrift):
stimmlos | stimmlos aspiriert | stimmhaft | stimmhaft aspiriert | |
---|---|---|---|---|
Velar | k [k] | kh [kʰ] | g [g] | gh [gʱ] |
Palatal | c [c] | ch [cʰ] | j [ɟ] | jh [ɟʱ] |
Retroflex | ṭ [ʈ] | ṭh [ʈʰ] | ḍ [ɖ] | ḍh [ɖʱ] |
Dental | t [t̪] | th [t̪ʰ] | d [d̪] | dh [d̪ʱ] |
Labial | p [p] | ph [pʰ] | b [b] | bh [bʱ] |
Einige periphere indoarische Sprachen haben dieses System vereinfacht. Im Singhalesischen ist (wohl unter tamilischem Einfluss) die Aspiration verloren gegangen, während Asamiya keine retroflexen Laute kennt. Andere Sprachen haben zusätzliche Laute entwickelt, Sindhi etwa die Implosive [ɠ], [ʄ], [ɗ], und [ɓ].
Die traditionelle indische Grammatik beschreibt fünf Nasale, deren Artikulationsort den fünf Reihen von Plosiven entspricht: ṅ [ŋ], ñ [ɲ], ṇ [ɳ], n [n̪] und m [m]. Ursprünglich waren aber nur m, das dentale n und das retroflexe ṇ eigenständige Phoneme, auch die Unterscheidung zwischen den letzten beiden wird nicht in allen modernen Sprachen gewahrt. Die Laute ṅ und ñ sind meist nur positionsbedingte Allophone, die nur vor den entsprechenden Plosiven vorkommen, in manchen Sprachen haben sie aber sekundären Phonemstatus erlangt (z. B. Singhalesisch miña aus Prakrit miñja). Im klassischen Sanskrit kamen der Vibrant r [r] und der Lateral l [l] vor. Andere indoarische Sprachen haben ihr Phoneminventar in diesem Bereich erweitert: Ein retroflexer Lateral ḷ [ɭ] kommt bereits im Vedischen und später u. A. in Oriya, Marathi, Gujarati und Panjabi vor. Hindi, Bengali, Panjabi und Sindhi kennen den retroflexen Flap [ɽ]. Während im Altindoarischen noch vier Frikative vorkamen – die drei Zischlaute ś [ɕ], ṣ [ʂ] und s [s] sowie h [ɦ] – sind in den modernen Sprachen die drei ursprünglichen Sibilanten zu einem Laut, im Westen meist [s], im Osten [ʃ], zusammengefallen. Viele Sprachen haben aber durch Lehnwörter eine neue Unterscheidung zwischen [s] und [ʃ] eingeführt. An Halbvokalen kommen y [j] und v [ʋ] vor.
Zusätzlich zu diesen ursprünglichen indoarischen Konsonanten haben viele neuindoarische Sprachen durch Lehnwörter aus dem Persischen und Englischen neue Phoneme übernommen, namentlich [f], [z], [x], [ɣ] und [q]. In allen Sprachen außer Urdu ist die Stellung dieser Phoneme aber nicht sehr gefestigt, bei nachlässiger Aussprache werden sie oft durch ähnlich klingende Laute ersetzt, also etwa philm statt film.
Vokale
Die Anzahl der Vokalphoneme bewegt sich in den meisten neuindoarischen Sprachen zwischen sechs und zehn. Romani hat nur fünf Vokale, das Singhalesische dagegen ein System von 13 Vokalen, das in erster Linie auf der Unterscheidung nach Vokallänge beruht. Für die dardischen Sprachen und bestimmte Marathi-Dialekte werden Systeme mit bis zu 18 Vokalen beschrieben, die aber nur unzureichend erforscht sind.[7]
Die Vokalsysteme der wichtigsten indoarischen Sprachen sind wie folgt:
Sprache | Vokalphoneme |
---|---|
Marathi, Nepali: | /i, e, a, ə, o, u/ |
Oriya: | /i, e, a, ɔ, o, u/ |
Bengali: | /i, e, æ, a, ɔ, o, u/ |
Asamiya: | /i, e, ɛ, a, ɒ, ɔ, o, u/ |
Gujarati: | /i, e, ɛ, a, ə, ɔ, o, u/ |
Hindi, Panjabi: | /i, ɪ, e, æ, a, ə, ɔ, o, u/ |
Anmerkung: Das [ə] steht für den kurzen a-Laut, der bisweilen auch als [ʌ] wiedergegeben wird.
Das symmetrische zehn-Vokal-System des Hindi und Panjabi steht dem Sanskrit am nächsten. Im Sanskrit bestand aber der Unterschied zwischen Paaren wie i / ī primär in der Vokallänge: [i] / [iː]. In den neuindoarischen Sprachen ist dieser quantitative Unterschied durch einen qualitativen ersetzt worden: [ɪ] / [i]. Es ist aber möglich, dass der qualitative Unterschied bereits von Anfang mit der Unterscheidung nach der Vokallänge einherging.[8] Zumindest für das kurze a [ə] und das lange ā [aː] wird bereits in den ältesten Grammatiken ein qualitativer Unterschied beschrieben. Zudem kannte das Sanskrit die „konsonantischen Vokale“ ṛ, ṝ und ḷ. Die letzten beiden sind sehr selten, das ṛ kommt hingegen auch in den modernen Sprachen in Sanskrit-Lehnwörtern vor und wird als [rɪ] gesprochen (z. B. ṛṣi [rɪʃɪ] „Rishi“).
Die Phoneme [æ] und [ɔ] im Hindi und Panjabi gehen ursprünglich auf die Diphthonge [ai] und [au] zurück und werden in manchen Dialekten auch noch als solche gesprochen. Während die Diphthonge im Sanskrit phonematisch sind, werden die zahlreichen Vokalverbindungen der neuindoarischen Sprachen nicht als eigenständige Phoneme aufgefasst.
Den reinen Vokalen stehen in den meisten neuindoarischen Sprachen Nasalvokale gegenüber (z. B. Hindi cā̃d „Mond“). Das Sanskrit kennt ebenfalls eine als anusvara bezeichnete Nasalisierung, die aber im Gegensatz zur Nasalisierung in den modernen Sprachen nicht phonematisch ist.
Akzent
Die älteste indoiranische Sprachform, das Vedische, verfügte über einen tonalen Akzent, der dem des Altgriechischen entsprach (vgl. Vedisch pā́t, padáḥ mit Altgriechisch poús, podós „Fuß“). Der Akzent konnte auf jede Silbe des Wortes fallen und wurde mit einem Hochton (udātta) gesprochen. Im klassischen Sanskrit wandelte sich der tonale Akzent zu einem auf der Schallfülle beruhenden dynamischen Akzent, wie er auch im Deutschen vorkommt. Die Position des Akzents stimmte nicht mit dem alten tonalen Akzent überein, sondern fiel ähnlich wie im Lateinischen nach vorhersagbaren Regeln auf die zweit-, dritt- oder viertletzte Silbe. Die Betonung folgt in den neuindoarischen Sprachen unterschiedlichen Regeln, ist aber nie bedeutungsunterscheidend (eine Ausnahme stellt Asamiya dar, vgl. ˈpise „er trinkt“ und piˈse „dann“).
Panjabi stellt als Tonsprache einen Sonderfall dar. Die drei bedeutungsunterscheidende Töne (z. B. koṛā „Peitsche“, kóṛā „Aussätziger“, kòṛā „Pferd“) sind sekundär unter dem Einfluss eines früheren aspirierten Konsonanten entstanden (vgl. Panjabi kòṛā mit Hindi ghoṛā).
Verteilung der Laute
Im Sanskrit können Wörter nur auf bestimmte Konsonanten enden, Verbindungen von mehreren Konsonanten sind in der Regel nicht zulässig. Am Anfang und in der Mitte eines Wortes treten dagegen komplizierte Konsonantenhäufungen auf (z. B. jyotsna „Mondschein“). In der mittelindoarischen Periode vereinfachte sich die Struktur der Wörter erheblich: Am Wortanfang waren nur noch einfache Konsonanten mögich, so wandelte sich z. B. Sanskrit prathama „erster“ zu Pali paṭhama. Im Wortinneren waren nur bestimmte einfach auszusprechende Konsonantenverbindungen (verdoppelte Konsonanten oder Verbindungen mit einem Nasal als erster Bestandteil) zulässig, die altindoarischen Konsonantenverbindungen wurden durch Assimilation vereinfacht (z. B. Sanskrit putra „Sohn“ zu Pali puttā). Am Wortende konnten gar keine Konsonanten außer dem nasalisierten ṃ vorkommen.
In den neuindoarischen Sprachen kommen durch Lehnwörter und den Ausfall von kurzen Vokalen wieder zahlreiche Konsonantenverbindungen vor. Im Wortinneren wird ein kurzes a in vielen Sprachen noch geschrieben, aber nicht mehr gesprochen, z. B. wird das Hindi-Wort karanā „machen“ als karnā gesprochen. In vielen neuindoarische Sprachen ist das kurze a am Wortende ausgefallen, so dass eine große Zahl an Wörtern auf einen Konsonanten endet (z. B. Marathi sāt „sieben“, aus Praktit satta).
Im Sanskrit können zwei Vokale nicht aufeinanderfolgen. Durch den Ausfall intervokalischer Konsonanten entstanden in den Prakrit-Sprachen aber zahlreiche Vokalabfolgen, die in den modernen Sprachen zum Teil zusammengezogen wurden (z. B. Sanskrit citrakāra „Maler“ > Prakrit cittaāra > Gujarati cittāro), zum Teil aber auch beibehalten wurden (z. B. rāja „König“ > rāā > rāo).
Morphologie
Die Morphologie der indoarischen Sprachen hat im Laufe ihrer Entwicklung grundlegende Änderungen durchlebt. Das altindoarische Sanskrit war eine hochgradig synthetisch-flektierende Sprache mit einer komplizierten Morphologie, dem Lateinischen und Altgriechischen nicht unähnlich. Die Entwicklung hin zu den mittelindoarischen Sprachen ging mit einer deutlichen Vereinfachung der Formenbildung einher. Die neuindoarischen Sprachen sind zu einem weitgehend analytischen Sprachbau mit agglutinierenden Elementen übergegangen. Typologisch sind die indoarischen Sprachen stark von ihren dravidischen Nachbarsprachen beeinflusst worden. Auch im Bereich der Syntax schlägt sich die Änderung der Morphologie bereits im klassischen Sanskrit deutlich nieder.
Nomen
Die Morphologie der Nomina war im Sanskrit komplex. Sie wurden in acht Kasus (Nominativ, Akkusativ, Instrumental, Dativ, Ablativ, Genitiv, Lokativ, Vokativ) und drei Numeri (Singular, Dual, Plural) dekliniert. Je nach Deklinationstyp unterschieden sich die Kasusendungen. Im Mittelindoarischen wurde dieses komplizierte System vereinfacht: Der Dual ging verloren, das Kasussystem wurde vereinfacht und die variablen Konsonantenstämme wurden in regelmäßige Vokalstämme umgewandelt (z. B. Sanskrit gacchant-/gacchat- „gehend“ zu Pali gacchanta-). Im großen und ganzen bleibt aber im Mittelindoarischen das alte Kasussystem, wenn auch vereinfacht, bestehen. Als Beispiel ist die Deklination des Wortes putra-/putta- („Sohn“) im Singular in Sanskrit, Pali und Apabhramsha angegeben.
Kasus | Sanskrit | Pali | Apabhramsha |
---|---|---|---|
Nominativ | putraḥ | putto | puttu |
Akkusativ | putram | puttaṃ | puttu |
Instrumental | putrena | puttena | putteṇa(ṃ), puttẽ, puttiṃ |
Dativ | putrāya | (puttāya) | – |
Ablativ | putrāt | puttā, puttasmā, puttamhā | puttahi, puttaho |
Genitiv | putrasya | puttassa | puttaha, puttaho, puttassu, puttāsu |
Lokativ | putre | putte, puttasmiṃ, puttamhi | putti, puttahiṃ |
Die neuindoarischen Sprachen verbinden flektierende und agglutinierende Elemente in ihrer Nominalmorphologie. Dabei sind die westindischen Sprachen generell eher flektierend, die ostindischen eher agglutinierend. Während etwa im Hindi die Endung jeweils gleichzeitig Kasus und Numerus ausdrückt, kombiniert Bengali separate Endungen für Kasus und Numerus. Als Beispiel ist die Deklination des Wortes für „Junge“ angegeben.
|
|
Von dem Deklinationssystem des Alt- und Mittelindoarischen sind in den neuindoarischen Sprachen nur noch Rudimente vorhanden. Die meisten neuindoarischen Sprachen kennen eine Opposition von Nominativ (bzw. Rektus) und Obliquus (z. B. Hindi laṛkā – laṛke „Junge“, Gujarati ghoḍo – ghoḍā „Pferd“). Der Obliquus wird durch ein sekundäres System von Partikeln oder agglutinierender Affixe entwickelt. Dies können Postpositionen (z. B. Hindi laṛke ko „dem Jungen“) oder Suffixe (z. B. Gujarati ghoḍāe „durch das Pferd“) sein, wobei die Grenze zwischen diesen beiden Kategorien nicht immer eindeutig ist. Oftmals sind die Suffixe aus vormals eigenständigen Wörtern entstanden, wie am Beispiel der Genitivendung -er im Bengali deutlich wird, die über die Partikel kera auf das altindoarische Substantiv kārya mit der Bedeutung „Angelegenheit“ zurückgeht.
Die alt- und mittelindoarischen Sprachen kennen die drei indogermanischen Genera Maskulinum, Femininum und Neutrum. Unter den neuindoarischen Sprachen ist dieses System in den westlichen Sprachen (Gujarati, Marathi, Konkani) beibehalten worden. Im Singhalesischen kommen ebenfalls drei Genera vor, doch handelt es sich hierbei um ein anders gelagertes System, das wie in den dravidischen Sprachen auf Belebtheit und natürlichem Geschlecht beruht. In den meisten neuindoarischen Sprachen sind Maskulinum und Neutrum zusammengefallen. Nach Osten hin ist die Genuskategorie weniger stark ausgeprägt. Die östlichsten Sprachen Bengali, Asamiya und Oriya haben sie gänzlich verloren, ebenso Khowar und Kalasha am entgegengesetzen Ende des indoarischen Sprachraums.
Lexik
Die einheimische Grammatik teilt den Wortschatz der modernen indoarischen Sprachen in vier Kategorien, die mit Sanskrit-Namen bezeichnet werden:
- tadbhava („daraus [d. h. aus einem Sanskritwort] entstanden“): Erbwörter aus dem Altindoarischen
- tatsama („dasselbe wie das [d. h. ein Sanskritwort]“): direkte Entlehnungen aus dem Sanskrit
- deśya („lokal“): Wörter ohne Entsprechung im Sanskrit
- videśi („fremd“): Lehnwörter aus außerindischen Sprachen
Erbwörter
Den Kern der neuindoarischen Lexik bilden die Tadbhava-Wörter, die auf natürlichem Wege aus dem Altindoarischen über die Zwischenstufe der mittelindoarischen Prakrits entlehnt worden und dabei durch eine Reihe von Lautwandeln in ihrer Gestalt verändert worden sind. So geht das Hindi-Wort khet („Feld“) über Prakrit khetta auf Sanskrit kṣetra zurück. Manche Wörter wie deva („Gott“) oder nāma („Name“) hatten schon im Altindischen eine so einfache Gestalt, dass sie keiner weiteren Veränderung unterlagen. Tadbhava-Wörter können einen ursprünglich nichtindogermanischen Ursprung haben, denn bereits im Sanskrit sind Entlehnungen aus den dravidischen und Munda-Sprachen vorhanden.
Einige indoarische Wortgleichungen [9]
Sprache | Hand | Zahn | Ohr | machen | trinken | hören |
---|---|---|---|---|---|---|
Sanskrit | hasta | danta | karṇa | kar- | pib- | śṛn- |
Hindi | hāth | dā̃t | kan | kar- | pī- | sun- |
Bengali | hāt | dā̃t | kān | kɔr- | pi- | ʃon- |
Panjabi | hatth | dand | kann | kar- | pī- | suṇ- |
Marathi | hāt | dāt | kān | kar- | pi- | aik- |
Gujarati | hāth | dā̃t | kān | kar- | pī- | sā̃bhaḷ- |
Oriya | hātɔ | dāntɔ | kānɔ | kɔr- | pi- | suṇ- |
Sindhi | hathu | ɗandu | kanu | kar- | pi- | suṇ- |
Asamiya | hāt | dā̃t | kān | kɔr- | pi- | xun- |
Nepali | hāt | dā̃t | kān | gar- | piu- | sun- |
Kashmiri | athɨ | dād | kan | kar- | co- | buz |
Singhalesisch | ata | data | kaṇa | kara- | bo-, bī- | ähe- |
Romani | vast | dand | kan | ker- | pi- | sun- |
Sanskritismen
Wörter, die in unveränderter Gestalt (oder besser: Schreibweise) direkt aus dem Sanskrit entlehnt worden sind, bezeichnet man als Tatsamas. Die Aussprache kann dabei durchaus abweichen: die Unterscheidung zwischen bestimmten Lauten wie ś und ṣ wird meist nicht mehr gewahrt, in Hindi und Marathi fällt das kurze a am Wortende oft aus, im Bengali werden Konsonantenverbindungen assimiliert. So wird das Tatsama ātmahatyā („Selbstmord“) auf Hindi [Singhalesischen werden auch aus dem Pali, das als Sprache des buddhistischen Kanons eine ähnlich wichtige Rolle wie das Sanskrit einnimmt, übernommene Wörter zu den Tatsamas gerechnet. Teils sind Doubletten von Tadbhava und Tatsama-Wörtern vorhanden, wobei das Tatsama dann meist eine spezialisiertere Bedeutung hat. So existiert im Hindi neben dem erwähnten Tadbhava khet für ein Feld im konkreten Sinne (d. h. eines, das man pflügen kann) das Tatsama-Wort kṣetra, das ein Feld im übertragenden Sinne (also ein Beschäftigungsfeld o. Ä.) bezeichnet.
], auf Bengali dagegen [ ] ausgesprochen. ImIn den modernen indoarischen Literatursprachen (außer denen wie Urdu, die dem kulturellen Einfluss des Islam unterliegen) hat die Verwendung von Sanskrit-Wörter sehr große Ausmaße angenommen. Vor allem im Wortschatz des höheren Registers finden sich viele Sanskritismen, ähnlich wie in den europäischen Sprachen lateinische und griechische Fremdwörter verwendet werden. Nationalistische Kreise fördern die Verwendung von Sanskritwörtern als ein Symbol des politischen Hinduismus[10] und versuchen in der Schriftsprache auch für neuere Begriffe wie „Elektrizität“ werden Sanskrit-Neologismen zu etablieren. In der Alltagssprache können sich künstliche Sanskrit-Neologismen aber nur schwerlich gegen englische Lehnwörter durchsetzen.
Lehnwörter
Zu den Deśya-Wörtern rechnet man Wörter ohne Parallelen im Sanskrit. Hierzu gehören aus altindischen Dialekten ererbte Wörter, die im Sanskrit fehlen, sowie Entlehnungen aus den dravidischen und Munda-Sprachen. Dazu kommen in den neuindoarischen Sprachen in großer Zahl aus außerindischen Sprachen, vor allem dem Persischen, Arabischen, Portugiesischen und Englischen, übernommene Lehnwörter, die die indische Grammatik zur videśi-Kategorie rechnet.
Während der etwa achthundertjährigen islamischen Herrschaft in Nordindien war das Persische die Hofsprache der Oberschicht. So gelangten viele persische und über persische Vermittlung auch arabische Wörter in die indoarischen Sprachen. Für Urdu, die Sprache der indischen Muslime, übernimmt das Persisch-Arabische eine ähnliche Rolle als Quelle für Wörter höherer Stilebenen wie Sanskrit für die mehrheitlich von Hindus gesprochenen Sprachen. Dementsprechend groß ist deren Anteil im Urdu, besonders niedrig ist er naturgemäß in Sprachen wie Nepali, Asamiya oder Singhalesisch, die keinem nachhaltigen islamischen Einfluss ausgesetzt waren.[11]
Einen verhältnismäßig kleinen Anteil unter den Fremdwörtern machen Entlehnungen aus dem Portugiesischen, mit der die indischen Sprachen ab dem 16. Jahrhundert durch europäische Seefahrer in Kontakt kamen. Aus der portugiesischen Sprache wurden Wörter wie chave für „Schlüssel“ (Hindi cābhī, Marathi cāvī), janela für „Fenster“ (Hingi janglā, Bengali jānālā, Singhalesisch janēlaya) oder mestre für „Handwerker“ (Hindi mistrī, Marathi mestrī) übernommen. Äußerst zahlreich sind seit der britischen Kolonialzeit die englischen Lehnwörter. Vor allem moderne Begriffe wie „Hotel“ (hoṭal), „Ticket“ (ṭikaṭ) oder „Fahrrad“ (sāikil, von cycle) wurden aus dem Englischen entnommen.
Schriften
Die indoarischen Sprachen werden in einer Vielzahl von Schriften geschrieben: verschiedenen indischen Schriften, der persisch-arabischen Schrift und in Einzelfällen der lateinischen Schrift. Dhivehi, die Sprache der Malediven, hat eine gänzlich eigene Schrift, Thaana genannt. Sie wurde im 15. Jahrhundert nach dem Vorbild von arabischen Ziffernzeichen und anderen Elementen geschaffen.
Indische Schriften

Die meisten für die indoarischen Sprachen verwendeten Schriften gehören ebenso wie die Schriften Südindiens, Südostasiens und Tibets zur Familie der indischen Schriften, die allesamt von der Brahmi-Schrift abstammen. Die Brahmi-Schrift tritt erstmalig im 3. Jahrhundert v. Chr. in den Inschriften Kaiser Ashokas zu Tage. Ihre Ursprünge sind ungeklärt, als wahrscheinlich gilt, dass sie nach einem semitischen Vorbild geschaffen wurde, während die in Indien populäre These von einer Abstammung von der Indus-Schrift von westlichen Forschern abgelehnt wird.[12] Im Laufe der Zeit spaltete sich die Brahmi-Schrift in zahlreiche regionale Varianten auf, die grafisch teils sehr stark voneinander abweichen. Strukturell sind sie sich aber sehr ähnlich und teilen alle dasselbe Funktionsprinzip. Es handelt sich bei ihnen um eine Zwischenform aus Alphabet und Silbenschrift, sogenannte Abugidas, bei denen jedes Konsonantenzeichen einen inhärenten Vokal a besitzt, der durch diakritische Zeichen modifiziert werden kann. Konsonantenverbindungen werden durch Ligaturen ausgedrückt. Die Reihenfolge der Zeichen ist in den indischen Schriften anders als etwa im lateinischen Alphabet nicht beliebig, sondern spiegelt die Phonologie der indoarischen Sprachen wieder. Die Buchstaben werden folgendermaßen angeordnet:
- Vokale (a, ā, i, ī, u, ū, ṛ, ṝ, ḷ, e, ai, o, au)
- Plosive und Nasale nach Artikulationsort von hinten nach vorne geordnet
- Velare (ka, kha, ga, gha, ṅa)
- Palatale (ca, cha, ja, jha, ña)
- Retroflexe (ṭa, ṭha, ḍa, ḍha, ṇa)
- Dentale (ta, tha, da, dha, na)
- Labiale (pa, pha, ba, bha, ma)
- Halbvokale (ya, ra, la, va)
- Sibilanten und Hauchlaut (śa, ṣa, sa, ha)
Das Zeicheninventar ist in den verschiedenen Schriften im wesentlichen dasselbe. Manche Schriften kennen ein spezielles Zeichen für das retroflexe ḷ, weitere Sonderzeichen könnten durch einen untergesetzten Punkt geschaffen werden.
Folgende indische Schriften werden für indoarische Sprachen verwendet (als Beispiel ist die erste Konsonantenreihe ka, kha, ga, gha, ṅa angegeben):
Schrift | Sprache(n) | Beispiel |
---|---|---|
Devanagari | Hindi, Bihari, Rajasthani, Marathi, Nepali | ![]() |
Bengalische Schrift | Bengali, Asamiya, Bishnupriya Manipuri | ![]() |
Gurmukhi | Panjabi | ![]() |
Gujarati-Schrift | Gujarati | ![]() |
Oriya-Schrift | Oriya | ![]() |
Singhalesische Schrift | Singhalesisch | ![]() |
Sanskrit wurde traditionell in der Schrift der jeweiligen Regionalsprache geschrieben, heute hat sich Devanagari als übliche Schrift für Sanskrit-Texte durchgesetzt. Für manche Sprachen werden parallel mehrere Schriften verwendet: Kashmiri wird in Pakistan in persisch-arabischer Schrift, in Indien in Devanagari geschrieben. Für Panjabi sind sogar drei Schriften im Einsatz: die persisch-arabische in Pakistan, Gurmukhi unter den Sikhs und Devanagari unter den panjabisprachigen Hindus.
Persisch-Arabische Schrift

Urdu, die Sprache der indischen Muslime, wird ebenso wie die übrigen in Pakistan verwendeten indoarischen Sprachen (Sindhi, Panjabi, Kashmiri) in der persisch-arabischen Schrift, einer um einige Sonderzeichen erweiterten Version des arabischen Alphabets, geschrieben. Die arabische Schrift eignet sich nicht allzu gut für die Wiedergabe indoarischer Sprachen. Zum einen werden kurze Vokale nicht ausgedrückt und auch bei den langen Vokalen kann etwa nicht zwischen ū, ō und au unterschieden werden. In arabischen Lehnwörtern kommen redundante Buchstaben vor, die gleich ausgesprochen werden (z. B. Sin, Sad und Tha alle als s). Für andere Laute, die in den indoarischen Sprachen vorkommen, existieren in der arabischen Schrift aber keine Zeichen, so dass diese mithilfe von diakritischen Zeichen neu geschaffen werden mussten (z. B. ٹ ṭ, ڈ ḍ und ڑ ṛ für die retroflexen Laute im Urdu). Bei der Bildung dieser Sonderzeichen weisen die Alphabete von Urdu und Sindhi Unterschiede auf (so sind die Retroflexe in Sindhi ٽ ṭ, ڊ ḍ und ڙ ṛ), während sich Panjabi und Kashmiri an der Urdu-Orthografie orientieren. Auch verwendet Sindhi für die aspirierten Konsonanten eigene Sonderzeichen, während sie im Urdu durch die Kombination des nichtaspirierten Konsonanten und h ausgedrückt werden (z. B. Sindhi ٿ und Urdu ته für th). Weiterhin unterscheidet sich Urdu durch die Verwendung des geschwungenen Nastaliq-Duktus von Sindhi, das man vorzugsweise im simpleren Naskhi schreibt.
Lateinische Schrift
Die einzigen indoarischen Sprachen, die regulär in lateinischer Schrift geschrieben werden, sind Konkani und Romani. Für Konkani, die Sprache Goas, wurde im 16. Jahrhundert eine Orthografie auf Grundlage des Portugiesischen geschaffen. Daneben wird Konkani auch in Devanagari-Schrift geschrieben. Für Kalasha-mun, die bislang illiterate Sprache der Kalasha von Chitral, wird seit neuestem im Schulunterricht das lateinische Alphabet verwendet.
Im wissenschaftlichen Kontext ist die lateinische Transliteration gebräuchlich. Der übliche Standard ist das International Alphabet of Sanskrit Transliteration (IAST), das unter- und übergesetzte Punkte und andere diakritische Zeichen für die speziellen Laute der indoarischen Sprachen verwendet.
Quellen und weiterführende Informationen
Einzelnachweise
- ↑ Colin P. Masica: The Indo-Aryan Languages, Cambridge 1991, S. 36.
- ↑ Masica: The Indo-Aryan Languages, S. 37.
- ↑ Jules Bloch: Indo-Aryan. From the Vedas to modern times. , Paris 1965, S. 11
- ↑ Census of India: Family-wise grouping of the 114 scheduled and non-scheduled languages – 1991
- ↑ Berger: Die Vielfalt der indischen Sprachen, S. 105.
- ↑ Masica: The Indo-Aryan languages, S. 94.
- ↑ Masica: The Indo-Aryan languages, S. 113.
- ↑ Masica: The Indo-Aryan languages, S. 111.
- ↑ Die Beispiele stammen aus Masica: The Indo-Aryan languages, S. 85.
- ↑ Berger: Die Vielfalt der indischen Sprachen, S. 102.
- ↑ Masica: The Indo-Aryan Languages, S. 71.
- ↑ Masica: The Indo-Aryan Languages, S. 133 f.
Literatur
Allgemein
- Berger, Hermann: Die Vielfalt der indischen Sprachen. In: Dietmar Rothermund (Hrsg.): Indien. Kultur, Geschichte, Politik, Wirtschaft, Umwelt. Ein Handbuch. C. H. Beck, München 1995. S. 101-110.
- Bloch, Jules: Indo-Aryan. From the Vedas to modern times. Übers. Alfred Master. Libraire d’Amérique et d’Orient Arien Maisonneuve, Paris 1965.
- Cardona, George: Indo-Aryan Languages. In: Bernard Comrie (Hrsg.): The Major Languages of South Asia, the Middle East and Africa. Routledge, London 1990.
- Cardona, George and Dhanesh Jain (Hrsg.): The Indo-Aryan Languages. Routledge, London 2003.
- Masica, Colin P.: The Indo-Aryan Languages. Cambridge University Press, Cambridge 1991.
- Zograph, Georgij A.: Die Sprachen Südasiens. Übers. Erika Klemm. VEB Verlag Enzyklopädie, Leipzig 1982.
Zur Klassifikation
Allgemein
- Ruhlen, Merritt: A Guide to the World's Languages. Edward Arnold, London - Melbourne - Auckland 1991.
- Dalby, David: The Linguasphere Register. Linguasphere Press, Hebron (Wales, UK) 2000.
Indoarisch: in historischer Folge
- Hoernle, R.: A Comparative Grammar of the Gaudian Language. London 1880.
- Grierson, George A.: Linguistic Survey of India (LSI). Vol. I-XI. Kalkutta 1903-28. Reprint Delhi 1968.
- Grierson, George A.: On the Modern Indo-Aryan Vernaculars. Delhi 1931-33.
- Chatterji, Suniti Kumar: The Origin and Development of Bengali Language. Kalkutta 1926.
- Turner, R.L.: Some Problems of Sound Change of Indo-Aryan. Poona 1960.
- Katre, S. M.: Some Problems of Historical Linguistics in Indo-Aryan. Poona 1965.
- Nigam, R.C.: Language Handbook on Mother Tongue in Census. New Delhi 1972.
- Cardona, George: The Indo-Aryan Languages. In: Encyclopedia Britannica, 15. Auflage 1974.
- Matras, Yaron: Romani. A Linguistic Introduction. Cambridge University Press 2002.
Weblinks
- Ernst Kausen, Die Klassifikation der indogermanischen Sprachen (Word-Dokument, 133 KB) Basis für die Klassifizierung der neuindoarischen Sprachen dieses Artikels.
- Sir Ralph Lilley Turner: A comparative dictionary of Indo-Aryan languages. London: Oxford University Press, 1962-1966. Digitalisat der University of Chicago.