Indoarische Sprachen

Die indoarischen Sprachen bilden zusammen mit den iranischen und Nuristani-Sprachen den indo-iranischen Zweig der indogermanischen Sprachen. Indoarische Sprachen sind heute auf dem gesamten indischen Subkontinent verbreitet, vor allem in den Staaten Indien (Verbreitungsschwerpunkt im Norden und der Mitte des Landes), Pakistan, Bangladesh, Nepal und auf Sri Lanka.

Die indoarische Sprachen werden in drei Zeitstufen gegliedert: Altindoarische Sprachen (vor allem Sanskrit), mittelindoarische und die heute gesprochenen neuindoarischen Sprachen. Es gibt etwa 110 neuindoarische Sprachen mit rund einer Milliarde Sprecher. Zu den wichtigsten indoarischen Sprachen gehören Hindi, das nah verwandte Urdu, Bengali, weitere indische Regionalsprachen und die klassische Sprache Sanskrit. Mit den in Südindien gesprochenen dravidischen Sprachen sind die indoarischen Sprachen nicht genetisch verwandt, doch haben sich durch jahrtausendelangen Sprachkontakt zahlreiche gemeinsame Merkmale entwickelt.

Beziehungen zu anderen Sprachen

Indogermanische Sprachfamilie

Die indoarischen Sprachen bilden einen Unterzweig der indogermanischen (indoeuropäischen) Sprachfamilie, zu der auch die Mehrzahl der in Europa gesprochenen Sprachen gehört. Andere Zweige der indogermanischen Sprachfamilie sind etwa das Griechische, die romanischen, slawischen oder germanischen Sprachen. Somit sind die indoiranischen Sprachen – wenn auch entfernte – Verwandte des Deutschen. Diese Verwandtschaft lässt sich bei den modernen Sprachen nur noch an einigen wenigen Wörtern auf den ersten Blick erkennen: So lautet das Bengali-Wort für „Name“ nām, das Hindi-Wort für „neu“ ist nayā und die „Kuh“ heißt auf Marathi gau. In anderen Fällen wie Englisch wheel und Nepali cakkā (beides bedeutet „Rad“) ist der gemeinsame Ursprung, wenngleich vorhanden, nur durch komplizierte Etymologien nachvollziehbar. Für einen Großteil des Wortschatzes und insbesondere der Grammatik der modernen indoarischen Sprachen lässt sich indes gar keine Entsprechung in den heutigen europäischen Sprachen finden. Zwischen im Altertum gesprochenen Sprachen wie dem Sanskrit und dem Lateinischen oder Altgriechischen sind die Übereinstimmungen hingegen weitaus größer, sowohl was den Wortschatz als was die Grammatik angeht. Man vergleiche hierzu Formen wie Sanskrit dantam und Latein dentem „den Zahn“ oder Sanskrit abharan und Altgriechisch epheron „sie trugen“.

Indoiranische Sprachfamilie

Innerhalb der indogermanischen Sprachfamilie stehen die indoarischen Sprachen den iranischen Sprachen, zu denen etwa Persisch (Farsi), Kurdisch oder Paschtunisch gehören, nahe. Auch hier zeigt sich die Verwandtschaft bei den ältesten Sprachformen am deutlichsten: Im Altpersischen, der Sprache der achämenidischen Großkönige, und dem Sanskrit sind viele Wörter wie daiva und deva „Gott“, būmi und bhūmi „Erde“ oder aspa und aśva „Pferd“ nahezu formengleich, während die modernen Sprachen sich auseinanderentwickelt haben. Man fasst die indoarischen und iranischen Sprachen unter dem Zweig der indoiranischen Sprachen zusammen. Zu diesen gehört außerdem als separater Unterzweig noch die zahlenmäßig kleine Gruppe der in Afghanistan und Pakistan gesprochenen Nuristani-Sprachen. Die Stellung der ebenfalls im äußersten Nordwesten des Subkontinents verbreiteten dardischen Sprachen innerhalb des Indoiranischen ist unsicher. Während man sie früher entweder mit den Nuristani-Sprachen zusammenfasste oder als eigenständigen Zweig ansah, hält man sie heute für eine Untergruppe der indoarischen Sprachen.

Südasiatischer Sprachbund

Die indoarischen Sprachen teilen sich den indischen Subkontinent mit drei anderen Sprachfamilien: den hauptsächlich in Südindien verbreiteten dravidischen Sprachen (deren wichtigste Vertreter Tamil, Malayalam, Telugu und Kannada sind), der kleineren Gruppe der in Mittelindien verstreuten Munda-Sprachen (einem Zweig der austroasiatischen Sprachen) und den tibeto-birmanischen Sprachen am Nord- und Ostrand des Subkontinents. Mit diesen Sprachfamilien sind die indoarischen Sprachen nicht verwandt, doch haben sie sich durch jahrtausendelangen Sprachkontakt in Wortschatz, Grammatik wie Phonetik (besonders charakteristisch etwa das Vorhandensein von retroflexen Konsonanten) gegenseitig stark angenähert. Aufgrund der zahlreichen gemeinsamen Merkmale fasst man diese Sprachen zum südasiatischen Sprachbund zusammen. Vor allem die Wechselwirkung zwischen den indoarischen und dravidischen Sprachen ist stark gewesen, wobei die dravidischen Sprachen in großem Maße Wortschatz vor allem aus dem Sanskrit übernommen haben, während sie selbst einen starken strukturellen Einfluss auf die indoarischen Sprachen ausgeübt haben.

Geografische Verbreitung

Das Hauptverbreitungsgebiet der heutigen indoarischen Sprachen umfasst den nördlichen Teil des indischen Subkontinents etwa vom Indus im Westen bis nach Assam im Osten sowie vom Himalaya im Norden bis etwa zum 18. Breitengrad im Süden. Die indoarischen Sprachen sind die größte Sprachfamilie Südasiens. 15 von 22 offiziellen Sprachen Indiens sind indoarisch, drei von vier Indern sprechen eine indoarische Sprache als Muttersprache.^[1] Auch in Pakistan, Bangladesch, Nepal, Sri Lanka und auf den Malediven ist jeweils eine indoarische Sprache Amtssprache.

Zentralindien

Verbreitungsgebiete der wichtigsten indoarischen Sprachen

Die offizielle Nationalsprache Indiens ist Hindi. Die Anzahl der Muttersprachler hängt von der problematischen Abgrenzung zwischen Sprache und Dialekt ab: Im engeren Sinne hat Hindi über 200 Millionen Muttersprachler, legt man die linguistisch falsche Definition der indischen Regierung zugrunde, sind es 420 Millionen. Mit Zweitsprachlern wird Hindi von 500 Millionen Indern gesprochen. Die Hindi-Standardsprache beruht auf dem Hindustani, einer überregionalen Verkehrssprache auf Grundlage des Khari Boli, dem Dialekt von Delhi und Umgebung. Es dient in den nordindischen Bundesstaaten Uttar Pradesh, Bihar, Jharkand, Chhattisgarh, Madhya Pradesh, Rajasthan, Haryana, Uttarakhand und Himachal Pradesh sowie im Unionsterritorium Delhi als Amtssprache und wird von der Bevölkerung als Schriftsprache verwendet. In diesem zentralindischen Gebiet wird eine Reihe von nah verwandten, manchmal als Hindi-Dialekte klassifizierten Regionalsprachen gesprochen. Diese unterteilen sich in zwei Gruppen, „West-Hindi“ oder west-zentralindisch (Haryani, Braj-Kanauji, Bundeli) und „Ost-Hindi“ oder ost-zentralindisch (Awadhi, Bagheli, Chhattisgarhi).

Aus politischen Gründen klassifiziert die indische Regierung eine Reihe weiterer Sprachen, die aus sprachwissenschaftlicher Sicht eigenständig sind, zu verschiedenen Untergruppen des Indoarischen gehören und teils sogar eine eigene Schriftsprache haben, als „Hindi-Dialekte“^[2]. Dies sind die Sprachen der ostindischen Bihari-Gruppe (mit Bhojpuri, Maithili und Magahi, ingesamt 65 Mio. Sprecher), die westindischen Rajasthani-Sprachen sowie im Norden die Gruppe der am Rand des Himalaya gesprochenen nordindischen Pahari-Sprachen. Diese Definition ist linguistisch nicht sinnvoll, sondern ausschließlich politisch motiviert. Allerdings beeinflusst das Hindi als Medien- und Prestigesprache im zunehmenden Maße andere indoarische Sprachen.

Urdu, die Sprache der indischen und pakistanischen Muslime, und Hindi sind im Bereich der Alltagssprache nahezu identisch; sie beruhen beide auf dem Hindustani und sind nicht einmal unterschiedliche Dialekte. Die Schriftsprache des Urdu unterscheidet sich aber durch einen hohen Anteil von Wörtern persisch-arabischer Herkunft und die Verwendung der arabischen Schrift. Trotz 65 Millionen Sprechern (mit Zweitsprechern 105 Mio.) ist Urdu eine Sprache ohne territoriale Basis. Einen Großteil ihrer Sprecher macht die muslimische Stadtbevölkerung Nordindiens aus, daneben ist auch in südindischen Städten wie Hyderabad ein als Dakhini bekannter Urdu-Dialekt verbreitet. In Pakistan wird Urdu nur von einem kleinen Teil der Bevölkerung als Muttersprache gesprochen (etwa 10 Mio.), doch ist es die offizielle Nationalsprache des Landes und dient als überregionale Verkehrs- und Bildungssprache, wodurch auch die Anzahl der Urdu-Muttersprachler stetig zunimmt.

Osten

Zu den ostindischen Sprachen wird die oben schon erwähnte Bihari-Gruppe mit den Hauptsprachen Bhojpuri (65 Mio. Sprecher), Maithili und Magahi gerechnet, die in Bihar zwischen den zentralindischen Idiomen und dem Bengali gesprochen werden. Bengali (mit 210 Millionen Sprechern die zweitgrößte indoarische Sprache) ist die Sprache der indischen Bundesstaaten Westbengalen und Tripura sowie von Bangladesh. Einige der Bengali-Dialekte (Chittagong, Sylhetti und Rajbangsi) könnten auch als eigenständige Sprachen klassifiziert werden. Nordöstlich anschließend wird Asamiya im Bundesstaat Assam mit 15 Millionen Sprechern gesprochen. Bishnupriya Manipuri hat 120.000 Sprecher im Süden Assams, Tripura, Manipur sowie Bangladesh.

Die Sprache des an der Ostküste Indiens gelegenen Bundesstaates Orissa ist Oriya, das von 32 Millionen Menschen gesprochen wird. In den Wald- und Berggegenden Zentralindiens werden neben den nichtindoarischen Sprachen der Adivasi-Stammesbevölkerung Bhatri und Halbi, zwei indoarische Übergangsdialekte gesprochen.

Westen

Marathi ist im nordwestlichen Dekkan im Bundesstaat Maharashtra verbreitet und hat insgesamt 80 Millionen Sprecher. Nah verwandt mit Marathi ist Konkani (8 Millionen Sprecher), das Amtssprache in Goa ist und außerdem im äußersten Süden Maharashtras sowie an der Küste von Karnataka und Kerala gesprochen wird.

In den Stammesgebieten von Nord-Maharashtra, Ost-Gujarat und Süd-Rajasthan spricht man Bhili und Khandeshi, zwei indoarische Sprachen, die früher als Gujarati-Dialekte betrachtet wurden. Das sich westlich anschließende Gujarati hat 45 Millionen Sprecher und wird im Bundesstaat Gujarat sowie von einem Teil der Bevölkerung Mumbais (Bombays) gesprochen. Nördlich schließen sich die Sprachen Rajasthans an, die sog. Rajasthani-Gruppe mit den Sprachen Marwari (15 Mio.), Malvi, Bagri, Lambardi und Nimadi, jeweils 1 bis 2 Mio. Sprecher.

Das Sprachgebiet des Sindhi (22 Mio. Sprecher) beginnt im Westen Gujarats und setzt sich jenseits der pakistanischen Grenze in der Provinz Sindh am Unterlauf des Indus fort. Mit dem Sindhi eng verwandt ist die Gruppe der westlichen sog. Panjabi-Dialekte, die auch als Lahnda-Gruppe bezeichnet wird. Von den Lahnda-Dialekten hat sich Siraiki als Schriftsprache durchgesetzt, eine weitere westpanjabische Sprache ist Hindko. Insgesamt sprechen ca. 80 Mio. Lahnda, Hindko oder Siraiki. Das eigentliche (östliche) Panjabi hat insgesamt 30 Millionen Sprecher und ist im Norden des pakistanischen Industals sowie im indischen Teil des Panjab verbreitet. Dogri-Kangri (2,2 Mio. Sprecher) wird im Gebiet von Jammu im indischen Bundesstaat Jammu und Kashmir gesprochen, es wurde früher als Panjabi-Dialekt angesehen, gehört aber einem separaten Sprachzweig an und ist mittlerweile in Indien offiziell als eigenständige Sprache anerkannt.

Norden

Nördlich des Hindi-Sprachgebiets wird Nepali von 16 Mio. gesprochen. Es ist die Nationalsprache Nepals und außerdem in Sikkim, Darjiling und Teilen Bhutans verbreitet. Weitere wichtige nordindische Sprachen sind Garhwali und Kumauni mit jeweils rund 2 Mio. Sprechern. Sie werden vor im Vorgebirge des Himalayas, westlich des Nepali-Sprachgebiets gesprochen (sog. West-Pahari-Sprachen).

Im äußersten Nordwesten des Subkontinents liegt das Verbreitungsgebiet der dardischen Sprachen. Deren wichtigste ist das im Kaschmir-Tal gesprochene Kashmiri mit 4,5 Mio. Sprechern, die einzige dardische Literatursprache. Die übrigen dardischen Sprachen (hierzu gehören u. a. Pashai, Khowar, Kalasha, Shina und Indus-Kohistani) werden insgesamt von 1,2 Millionen Menschen im Hindukusch-Gebiet Pakistans und Afghanistans gesprochen.

Übrige

Räumlich vom restlichen indoarischen Sprachgebiet getrennt ist das Singhalesische (Sinhala). Es wird von der Mehrheit der Bevölkerung Sri Lankas gesprochen (15 Mio. Sprecher). Divehi, die Sprache der Malediven, hat 220.000 Sprecher und ist eng mit dem Singhalesischen verwandt.

Einen Sonderfall stellt Romani (Romanes) dar, die in zahlreichen Dialekten über die Länder Europas und des vorderen Orients verstreute Sprache der Roma mit etwa 3,5 Mio. Sprechern. Verwandt mit dem Romani – zu dem auch das in Deutschland verbreitete Sintitikes als Dialekt gehört –, sind die ebenfalls außerhalb Indiens im Nahen Osten und Europa gesprochenen Idiome Domari und Lomavren.

Als Folge neuerer Migrationsprozesse während der britischen Kolonialzeit werden indoarische Sprachen in größerer Zahl u. a. auch in der Karibik, Guyana, Südafrika, Mauritius und Fidschi verwendet. In Fidschi dient sogar eine Variante des Hindustani als Amtssprache.

Historische Übersicht

Die indoarischen Sprachen können auf eine Sprachgeschichte von etwa vier Jahrtausenden zurückblicken. Man teilt sie in drei historische Stufen ein: altindoarisch (Vedisch, klassisches Sanskrit), mittelindoarisch (Prakrits, Pali, Apabhramsha) und neuindoarisch, die seit etwa 1000 n. Chr. bis heute gesprochenen Sprachen. Die gebräuchlichen Abkürzungen sind AIA, MIA und NIA für alt-, mittel- und neuindoarisch.

Vorgeschichte

Als Mitglieder der indogermanischen Sprachfamilie stammen die indoarischen Sprachen von einer angenommenen indogermanischen Ursprache ab, die wohl im 4. oder 3. Jahrtausend v. Chr. in den Steppen Südrusslands gesprochen wurde. Von der indogermanischen Urbevölkerung spaltete sich eine Gruppe ab, die sich selbst als „Arier“ (ārya) bezeichnete und die eine Vorstufe der indoiranischen Sprachen sprach. Nachdem sie sich eine Zeit lang in Baktrien aufgehalten hatten, teilten sie sich um 2000 v. Chr. in einen iranischen und indoarischen Zweig auf.^[3] Die Iraner ließen sich im Nord- und West-Iran nieder, die Indoarier wanderten wohl um 1500 v. Chr. auf den indischen Subkontinent ein.^[4] Der älteste sprachliche Hinweis auf die Indoarier stammt indes aus dem hurritischen Mitanni-Reich im Norden Mesopotamiens und Nordosten Syriens. Dort herrschten im 16.–13. Jahrhundert v. Chr. eine Führungsschicht, die eindeutig indoarisch interpretierbare Namen trugen und Götter wie Indra verehrten. In einem Lehrbuch der Pferdehaltung, das der Mitannier Kikkuli im 15. Jahrhundert v. Chr. in hethitischer Sprache verfasste, finden sich einige aus dem Indoarischen entlehnte Fachbegriffe.^[5]. Diese frühindoarische Schicht im Westen Vorderasiens verschwand nach Untergang des Mitanni-Reichs spurlos.

Altindoarische Sprachen

Die altindoarische Phase beginnt mit der Einwanderung der Indoarier nach Indien im 2. Jahrtausend v. Chr. Als Altindoarisch oder Altindisch fasst man das Vedische und das klassiche Sanskrit zusammen. Das Vedische, die Sprache der Veda-Schriften, ist die älteste indoarische Sprachform. Die Datierung der lange Zeit nur mündlich überlieferten Texte ist unsicher, die ältesten Rigveda-Hymnen dürften aber kurz nach der Einwanderung der Indoarier nach Indien Mitte des 2. Jahrtausends v. Chr. entstanden sein. Das Vedische stellt eine archaische Form des Sanskrit dar, die Unterschiede zum klassischen Sanskrit entsprechen etwa denen zwischen der Sprache Homers und dem klassischen Altgriechischen. Die Sprache der Brahmanas und Sutras ist eine Zwischenstufe zwischen Vedisch und klassischem Sanskrit. In klassischem Sanskrit sind u.a. die großen altindischen Epen Mahabharata und Ramayana geschrieben.

Um die fehlerfreie Rezitation der heiligen Texte sicherzustellen, entwickelte sich in Indien früh die Wissenschaft der Phonetik und Grammatik. Diese fand in der Grammatik des Panini (wohl 4. Jahrhundert v. Chr.) ihre Vollendung. Sein Werk wurde normativ für das klassische Sanskrit. Somit wurde das Sanskrit als Literatursprache in einem archaischen Stadium konserviert, während die gesprochene Sprache sich zu verschiedenen mittelindoarischen Idiomen weiterentwickelte. Das sanskrit hat keinen bekannten unmittelbaren mittelindoarischen Nachfolger gefunden, so dass man nicht sagen kann, dass bestimmte MIA-Sprachen "aus dem Sanskrit entstanden" seien.

Mittelindoarische Sprachen

Nach Masica (1991) sind folgende mittelindoarische Sprachen und Dialektgruppen überliefert:

Frühe mitelindoarische Phase
- Ashoka-Prakrits. Regionale Dialekte des 3. Jhdts. v. Chr., Verbreitung in ganz Indien, außer im extremen Süden. Belegt auf den Inschriften des Kaisers Ashoka, in Brahmi-Schrift.
- Pali. Sprache des Hinayana-Buddhismus und anderer literarischer Texte. Basiert auf mittelindischen Dialekten und ist vom Sanskrit beeinflusst. Die Sprache der Gathas (Kern des buddhistischen Kanons) ist archaischer als die der Kommentarwerke.
- Frühes Ardhamagadhi. Sprache der frühesten Jain-Sutras.
Mittlere mittelindoarische Phase
- Niya-Prakrit. Verwaltungssprache indoarischer Gruppen und Städte in Chinesisch-Turkestan, belegt seit dem 3. Jhdt. n. Chr. Verwandt ist das etwas ältere Gandhari, die Sprache indoarischer Khotan-Manuskripte aus dem 1. Jhdt.
- Ardhamagadhi. Sprache des klassischen Jain-Kanons (6. Jhdt.) und früher buddhistischer Dramen. Basiert möglicherweise auf der Sprache von Kosala (Oudh), heute im östlichen Uttar Pradesh.
- Magadhi. Sprache Bihars und möglicherweise des Maurya-Reiches (4.-2. Jhdt. v. Chr.). Wurde auch zur Charakterisierung niedriger Klassen in Sanskrit-Dramen verwendet.
- Sauraseni. Das Standard-Prakrit des Dramas. Regional kann es als Nachfolger des Pali gelten. Wird auch in Jain-Texten benutzt.
- Maharashtri. Südwestlicher Dialekt, Sprache der Poesie. Phonologisch der fortschrittlichste Dialekt der mittleren Phase.
- Sinhala-Prakrit. Sprache der singhalesischen Inschriften seit dem 1. Jhdt. v. Chr.
Späte mittelindoarische Phase
- Apabhramsa. Basiert auf mittelindischen Dialekten, Nachfolger des Sauraseni. Übergangssprache zu NIA-Sprachen. Der Name wird auch generalisierend für alle indoarischen Dialekte der späten MIA-Phase verwendet.
- Elu. Singhalesisches Apabhramsa.

Klassifikation der neuindoarischen Sprachen

Probleme

Die Klassifikation der neuindoarischen Sprachen, die seit etwa 1000 n. Chr. gesprochen werden, stößt auf viele Probleme. Idealerweise kann ein Stammbaum die genetische Abspaltung einer Gruppe von Sprachen wiedergeben, die sich durch räumliche Entfernung im Laufe der Zeit auseineinander entwickelt haben. Dieser Prozess hat im Prinzip auch bei den indoarischen Sprachen stattgefunden, ist aber durch diverse Wanderungsbewegungen zum Teil historisch nicht mehr eindeutig nachzuvollziehen. Gründe für die immer wieder erfolgenden Migrationen und die damit verbundenen Durchmischungsprozesse sind die kaum vorhanden natürlichen Barrieren im indischen Kernland und instabile politische Einheiten mit multiethnischen und multilingualen Gesellschaften. Diese Prozesse resultierten letztendlich in ein Dialektkontinuum, das sich über den ganzen indoarischen Sprachraum von West nach Ost und Nord nach Süd erstreckt.

Die Folge sind erstens große Schwierigkeiten bei der Identifikation von Einzelsprachen, bei der Abgrenzung von Dialekt und Sprache und schließlich bei der Klassifikation, das heißt der inneren Gliederung der neuindoarischen Sprachen insgesamt. Erschwerend kommt der Umstand hinzu, dass der Übergang vom späten Mittelindoarischen zum frühen Neuindoarischen etwa um 900 – 1100 n. Chr. nur sehr schwach schriftlich belegt ist; dadurch wird es unmöglich, neuindoarische Sprachen auf bestimmte mittelindoarische Sprachen zurückzuführen und somit eine natürliche Gruppenbildung der NIA-Sprache zu erzielen.

Da ein einfaches, gut begründbares Stammbaummodell also nicht leicht zu erreichen ist, gab es Ansätze, mit Hilfe des Wellenmodells die Strukturierung der NIA-Sprachen zu verstehen. Dabei werden von bestimmten Zentren ausgehende Innnovationen untersucht, die sich im Laufe der Zeit durch Teilbereiche der NIA-Sprachen bewegt haben und in Isoglossen nachzuvollziehen sind. Hier spielt auch das Phänomen der Prestigesprachen eine große Rolle, deren Merkmale und Innovationen durch Kontakt verstärkt auf benachbarte Sprachen übergegangen sind. (Indoarische Prestigesprachen mit dieser Funktion waren das Vedische, Sanskrit, Magadhi, Sauraseni, Apabhramsa und heutzutage Hindi.) Das Problem der Wellentheorie ist, dass unterschiedliche Isoglossen zu völlig unterschiedlichen Gliederungen führen und somit letztendlich keine Klassifikation möglich ist.

Historische Ansätze

Klassifikationsversuche im klassischen genetischen Sinne gab es bereits seit dem frühen 19. Jahrhundert. Aber erst Hoernle 1880 gibt eine Übersicht, die bereits auf einer größeren Zahl neuindoarischer Sprachen basiert und somit mit moderneren Fassungen vergleichbar ist. Hoernles Hauptgliederung ist eine nordwestliche und eine südöstliche, welche er auf zeitlich getrennte Einwanderungswellen zurückführt:

Neuindoarische Sprachen (nach Hoernle 1880)
- Nord-West-Gruppe
  - Nord-Gruppe: Nepali, Kumanauni, Garhwali u.a.
  - West-Gruppe: Sindhi, Panjabi, Gujarati, Hindi u.a.
- Süd-Ost-Gruppe
  - Ost-Gruppe: Bihari, Bengali, Oriya u.a.
  - Süd-Gruppe: Marathi, Konkani

Die Grundergebnis dieser auch areal bedingten Klassifikation haben viele spätere Forscher übernommen, allerdings wurde die These der verschiedenen Einwanderungsströme schon bald verworfen. Einen nächsten wichtigen Schritt machte Grierson in seinem Linguistic Survey of India (1903-28), der noch heute eine wichtige Arbeitsgrundlage darstellt. Er ging von einem Konzept „äußerer“ und „innerer“ NIA-Sprachen aus. Zu den inneren zählte er die Pahari-Gruppe, Panjabi, Rajasthani, Gujarati und Hindi, zu den äußeren die Ostgruppe (Bengali, Assami, Oriya), die Südgruppe (Marathi, Konkani, Singhalesisch) und eine Nordwestgruppe (Lahnda, Sindhi). Dazwischen positionierte er eine „mittlere“ Gruppe von Übergangssprachen (z. B. Awadhi, Chhattisgarhi). Das Innen-Außen-Konzept konnte sich ebensowenig wie die Migrationsthese halten.

Eine neue Klassifikation legte dann Chatterji 1926 vor, die bereits im Wesentlichen mit heutigen Ansätzen korrespondiert. Obwohl die Gruppen wieder areale Namen tragen, geht Chatterji von linguistischen Merkmalen und bestimmten phonetischen Isoglossen aus und kommt damit zu folgender nicht-hierarchischen Klassifikation:

Neuindoarische Sprachen (nach Chatterji 1926)
- Nord: Pahari, Nepali
- Nordwest: Lahnda, Panjabi, Sindhi
- Südwest: Rajasthani, Gujarati
- Zentral: Hindi und verwandte Sprachen
- Ost: Bihari, Bengali, Assami, Oriya
- Süd: Marathi, Singhalesisch

Grierson revidiert 1931 seinen ursprünglichen Ansatz und kommt zu einer sehr ähnlichen Binnengliederung wie Chatterji. Auch die Klassifikationen von Turner (1960), Katre (1965) und Cardona (1974) sind jeweils begründete Varianten des Chatterji-Ansatzes.

Sonderfälle Dardisch, Romani, Singhalesisch

Während man also zum Kern der NIA-Sprachen nach und nach einen annähernden Konsens gefunden hatte, ohne allerdings in jedem Detail zu einer allgemein akzeptierten Einteilung zu gelangen, gab es noch längere Dispute um Randgruppen, nämlich das Dardische, die Zigeunersprachen (Romani, Domari und Lomavren) und das Singhalesische und Maledivische (Divehi). Letztere hat man entweder den südindoarischen Sprachen (Marathi, Konkani) zugerechnet oder aber als eigene Gruppe behandelt.

Beim Dardischen ist bis heute nicht endgültig geklärt, welche Sprachen dazugehören sollen. Rechnete man ursprünglich die Nuristani-Sprachen dazu, so tendiert heute die Mehrheit der Forscher dahin, Nuristani als dritten Zweig des Indoiranischen gleichrangig neben Iranisch und Indoarisch aufzufassen und nicht mehr den dardischen Sprachen zuzuordnen. Strittig ist dann immer noch die Position der (restlichen) dardischen Sprachen (die wichtigste ist Kashmiri) innerhalb des Neuindoarischen. Während manche Forscher es als einen Unterzweig des Nordwestindischen betrachten (etwa zusammen mit Lahnda und Sindhi), setzt sich die Positionierung als selbstständiger Zweig des Indoarischen durch.

Besonders schwierig gestaltet sich die Zuordnung des Romani (und der anderen Zigeuneridiome), deren Zughörigkeit zum Indoarischen Mitte des 19. Jhdts. erkannt wurde. Die moderne Darstellung des Romani und seiner Dialekte von Matras (2002) positioniert es im Zentralindischen nahe dem Hindi, frühere Auffassungen tendierten wegen mancher Ähnlichkeiten in der Phonetik eher zum Nordwestindischen. In dieser Sache ist die letzte Entscheidung noch nicht getroffen, dieser Artikel stellt das Romani zusammen mit dem Domari und Lomavren als separaten Zweig des NIA dar.

Somit deckt sich die hier gegebene Klassifikation weitgehend mit der von Gippert im Metzler Lexikon Sprache (2. Auflage 2000), die von ihm als "zur Zeit beste Arbeitshypothese" bezeichnet wird. Eine stabile, für alle Zeiten gültige Klassifikation der NIA-Sprachen wird es wahrscheinlich auch in Zukunft nicht geben, aber große Abweichungen vom hier vorgestellten Modell sind allerdings wohl auch nicht zu erwarten.

Hauptzweige des Neuindoarischen

Das folgende Strukturdiagramm gibt die Hauptzweige des Neuindoarischen mit den wichtigsten Sprachen wieder. Die vollständige Klassifikation aller NIA-Sprachen wird im nächsten Abschnitt dargestellt.

Neuindoarisch
- Dardisch: Kashmiri, Pashai, Khowar, Indus-Kohistani, Shina
- Nordindisch: Garhwali, Kumauni, Nepali
- Nordwestindisch: Dogri-Kangri, Hindko, Lahnda (West-Panjabi), Panjabi, Sindhi
- Westindisch: Marwari, Malvi, Nimadi, Gujari, Bagri, Lambardi; Gujarati, Vasavi; Bhili; Khandeshi
- Zentralindisch: Hindi, Urdu, Braj-Kanauji, Haryanvi, Bundeli; Awadhi, Chhattisgarhi
- Ostindisch: Bhojpuri, Maithili, Magahi, Sadri; Oriya; Asamiya, Bengali, Chittagong, Sylhetti, Rajbangsi
- Südindisch: Marathi, Konkani
- Sinhala-Divehi: Singhalesisch, Divehi (Maledivisch)
- Romani-Domari: Romani, Domari

Klassifikation sämtlicher neuindoarischer Sprachen

Für jeden Hauptzweig des Neuindoarischen werden in der folgenden Übersicht die strukturelle Gliederung und die zugehörigen Sprachen mit ihren aktuellen Sprecherzahlen angegeben. Zur Sprachidentifikation (und Abgrenzung gegenüber Dialekten) wurde vor allem David Dalbys The Linguasphere Register (2000) herangezogen. Für eine detaillierte Aufstellung mit Dialekten und Unterdialekten siehe den unten angegeben Weblink, auf dem diese Klassifikation basiert. Die Sprecherzahlen stammen im Wesentlichen aus Ethnologue (15. Auflage 2005), bei größeren Sprachen wurden statistische Jahrbücher und zusätzliche Quellen zur Absicherung herangezogen.

Sprachzweige in Kapitälchen, genetische Untergruppen in Fettdruck, Sprachnamen im Normaldruck.

DARDISCH (23 Sprachen mit 5,7 Mio Sprechern)

Kunar
- Pashai (110 Tsd), Gawarbati (10 Tsd), Dameli (5 Tsd), Shumasti (1 Tsd)
Chitral
- Khowar (Chitrali) (240 Tsd), Kalasha (5 Tsd)
Kohistani
- Indus Kohistani (220 Tsd), Kalami Kohistani (Bashkarik, Garwi) (40 Tsd), Torwali (60 Tsd), Kalkoti (4 Tsd), Bateri (30 Tsd), Chilisso (3 Tsd), Gowro (200), Wotapuri-Katarqalai (2 Tsd), Tirahi (100)
Shina
- Shina (500 Tsd), Brokshat (Brokskat, Brokpa) (3 Tsd), Ushojo (2 Tsd), Dumaki (500) [wird auch als Domari-Dialekt betrachtet], Phalura (Dangarik) (10 Tsd), Sawi (Sau) (3 Tsd)
Kashmiri
- Kashmiri (Keshur) (4,5 Mio)

Diese Klassifikation der dardischen Sprachen und die verwendeten Sprachnamen basieren auf den Darstellungen der Einzelsprachen in Sociolinguistic Survey of Northern Pakistan und Studies in Languages of Northern Pakistan, genauere Literaturangaben im Artikel Dardische Sprachen.

NORDINDISCH oder PAHARI (3 Sprachen mit 21 Mio Sprechern)

Westpahari
- Garhwali (2,2 Mio), Kumauni (2,4 Mio)
Ostpahari
- Nepali (16 Mio)

NORDWESTINDISCH (20 Sprachen mit 135 Mio Sprechern)

Dogri-Kangri
- Dogri-Kangri (2,2 Mio), Gaddi (Bhamauri) (120 Tsd), Churahi (110 Tsd), Bhattiyali (100 Tsd), Bilaspuri (300 Tsd), Kinnauri-Harijani (6 Tsd), Chambeali (130 Tsd), Mandeali (800 Tsd), Mahasu-Pahari (650 Tsd), Jaunsari (100 Tsd), Kului (110 Tsd), Bhadrawahi-Pangwali (90 Tsd), Pahari-Potwari (200 Tsd)
Lahnda
- Hindko (3 Mio), Lahndna (West-Panjabi) (45 Mio), Siraiki (Süd-Panjabi, Multani) (30 Mio)
Panjabi
- Panjabi (Ost-Panjabi) (30 Mio)
Sindhi
- Sindhi (22 Mio), Kachchi (850 Tsd), Jadgali (100 Tsd)

WESTINDISCH (13 Sprachen mit 78 Mio Sprechern)

Rajasthani
- Marwari (15 Mio), Harauti (600 Tsd), Goaria (25 Tsd); Malvi (1,2 Mio), Nimadi (1,4 Mio), Gujari (Gujuri) (1-2 Mio), Bagri (1,8 Mio), Lambadi (Lamani) (2,8 Mio), Lohari (wenige Tsd)
Gujarati
- Gujarati (45 Mio), Vasavi (1 Mio), Saurashtri (300 Tsd)
Bhili-Khandeshi
- Bhili (6 Mio), Kandeshi (2,5 Mio)

ZENTRALINDISCH (14 Sprachen mit 320 Mio Sprechern, inkl. S2 655 Mio)

West
- Hindi (200 Mio, mit S2 490 Mio), Urdu (60 Mio, mit S2 105 Mio), Braj-kanauji (6 Mio), Haryanvi (Banguru) (13 Mio), Bundeli (8 Mio), Gowli (35 Tsd), Chamari (5 Tsd), Sansi (10 Tsd), Ghera (10 Tsd), Bhaya (700)
Ost
- Awadhi (21 Mio), Bagheli (400 Tsd); Chhattisgarhi (12 Mio), Dhanwar (15 Tsd)

OSTINDISCH (26 Sprachen mit 347 Mio Sprechern)

Bihari
- Bhojpuri (26 Mio), Maithili (25 Mio), Magahi (12 Mio), Sadri (2 Mio), Oraon Sadri (200 Tsd), Angika (750 Tsd), Bote-Majhi (10 Tsd)
Oriya
- Oriya (32 Mio), Adiwasi Oriya (300 Tsd), Halbi (800 Tsd)
Tharu
- Rana Thakur (270 Tsd), Saptari (250 Tsd), Chitwania (80 Tsd), Deokri (80 Tsd), Mahotari (30 Tsd), Buksa (45 Tsd)
Assami-Bengali
- Assami (15 Mio); Bengali (210 Mio), Chittagong (14 Mio), Sylhetti (5 Mio), Rajbangsi (2,4 Mio), Chakma (600 Tsd), Bishnupriya-Manipuri (75 Tsd), Hajong (20 Tsd)

SÜDINDISCH (4 Sprachen mit 89 Mio Sprechern)

Marathi
- Marathi (80 Mio)
Konkani
- Konkani (8 Mio), Bhil-Konkani (600 Tsd), Varli (500 Tsd)

SINHALA-DIVEHI (2 Sprachen mit 13,2 Mio Sprechern)

Sinhala (Singhalesisch) (13 Mio), Divehi (Maledivisch) (220 Tsd)

ROMANI-DOMARI (3 Sprachen mit 4 Mio Sprechern)

Romani (3,5 Mio), Domari (500 Tsd), Lomavren (100 Tsd ?)

NICHT-KLASSIFIZIERT (8 Sprachen mit 220 Tsd Sprechern)
Zusätzlich zu den klassifizierten neuindoarischen Sprachen gibt es einige schriftlose Sprachen, die bisher keinem der Hauptzweige zuzuordnen waren; dennoch sind die hier genannten Sprachen zweifelsfrei indoarisch. Möglicherweise sind einige dieser Sprachen Dialekte von klassifizierten Sprachen. Von keiner dieser Sprachen gibt es bisher linguistische Untersuchungen oder gar Grammatiken. Es handelt sich um:

Tippera (100 Tsd Sprecher), Kanjari (50 Tsd), Od (50 Tsd), Usui (5 Tsd), Vaagri Booli (10 Tsd), Darai (7 Tsd),
Kumhali (1 Tsd), Chinali (1 Tsd).

Sprachliche Merkmale

Phonologie

Das Phoneminventar der indoarischen Sprachen ist in den verschiedenen Sprachstufen recht stabil geblieben. Charakteristische Laute wie die retroflexen und aspirierten Konsonanten kommen sowohl in alt-, mittel- als auch fast allen neuindoarischen Sprachen vor. Hingegen unterscheidet sich die Sprachstufen in der Verteilung der Laute im Wort erheblich, wodurch sich die Lautgestalt der Wörter teils erheblich verändert hat.

Konsonanten

Artikulationsorte der Plosive: 1. velar, 2. palatal, 3. retroflex, 4. dental, 5. labial.

Charakteristisch für das Konsonantensystem der indoarischen Sprachen ist eine große Zahl an Plosiven (Verschlusslauten), die nach fünf Artikulationsorten (velar, palatal, retroflex, dental und labial) unterschieden werden. Der Kontrast zwischen retroflexem ṭ und dentalem t (vgl. Hindi totā „Papagei“ und ṭoṭā „Mangel“) ist typisch für die Sprachen Südasiens. Obwohl man c und j traditionell als Plosive klassifiziert, werden sie in der Praxis eher als Affrikaten, also [ʧ] und [ʤ], gesprochen.^[6] Der Unterschied zwischen stimmhaften und stimmlosen (z. B. p vs. b) ist ebenso bedeutungsunterscheidend wie die Aspiration, die sowohl bei stimmlosen als auch stimmhaften Plosiven vorkommt (z. B. p, b vs. ph, bh). Somit ergibt sich folgendes System der Plosive (Angegeben ist die IAST-Transkription und der Lautwert in IPA-Lautschrift):

	stl.	stl. asp.	sth.	sth. asp.
Velar	k [k]	kh [kʰ]	g [g]	gh [gʱ]
Palatal	c [c]	ch [cʰ]	j [ɟ]	jh [ɟʱ]
Retroflex	ṭ [ʈ]	ṭh [ʈʰ]	ḍ [ɖ]	ḍh [ɖʱ]
Dental	t [t̪]	th [t̪ʰ]	d [d̪]	dh [d̪ʱ]
Labial	p [p]	ph [pʰ]	b [b]	bh [bʱ]

Einige periphere indoarische Sprachen haben dieses System vereinfacht. Im Singhalesischen ist (wohl unter tamilischem Einfluss) die Aspiration verloren gegangen, während Asamiya keine retroflexen Laute kennt. Andere Sprachen haben zusätzliche Laute entwickelt, Sindhi etwa die Implosive [ɠ], [ʄ], [ɗ], und [ɓ].

Die traditionelle indische Grammatik beschreibt fünf Nasale, deren Artikulationsort den fünf Reihen von Plosiven entspricht: ṅ [ŋ], ñ [ɲ], ṇ [ɳ], n [n̪] und m [m]. Ursprünglich waren aber nur m, das dentale n und das retroflexe ṇ eigenständige Phoneme, auch die Unterscheidung zwischen den letzten beiden wird nicht in allen modernen Sprachen gewahrt. Die Laute ṅ und ñ sind meist nur positionsbedingte Allophone, die nur vor den entsprechenden Plosiven vorkommen, in manchen Sprachen haben sie aber sekundären Phonemstatus erlangt (z. B. Singhalesisch miña aus Prakrit miñja). Im klassischen Sanskrit kamen der Vibrant r [r] und der Lateral l [l] vor. Andere indoarische Sprachen haben ihr Phoneminventar in diesem Bereich erweitert: Ein retroflexer Lateral ḷ [ɭ] kommt bereits im Vedischen und später u. A. in Oriya, Marathi, Gujarati und Panjabi vor. Hindi, Bengali, Panjabi und Sindhi kennen den retroflexen Flap [ɽ]. Während im Altindoarischen noch vier Frikative vorkamen – die drei Zischlaute ś [ɕ], ṣ [ʂ] und s [s] sowie h [ɦ] – sind in den modernen Sprachen die drei ursprünglichen Sibilanten zu einem Laut, im Westen meist [s], im Osten [ʃ], zusammengefallen. Viele Sprachen haben aber durch Lehnwörter eine neue Unterscheidung zwischen [s] und [ʃ] eingeführt. An Halbvokalen kommen y [j] und v [ʋ] vor.

Zusätzlich zu diesen ursprünglichen indoarischen Konsonanten haben viele neuindoarische Sprachen durch Lehnwörter aus dem Persischen und Englischen neue Phoneme übernommen, namentlich [f], [z], [x], [ɣ] und [q]. In allen Sprachen außer Urdu ist die Stellung dieser Phoneme aber nicht sehr gefestigt, bei nachlässiger Aussprache werden sie oft durch ähnlich klingende Laute ersetzt, also etwa philm statt film.

Vokale

Die Anzahl der Vokalphoneme bewegt sich in den meisten neuindoarischen Sprachen zwischen sechs und zehn. Romani hat nur fünf Vokale, das Singhalesische dagegen ein System von 13 Vokalen, das in erster Linie auf der Unterscheidung nach Vokallänge beruht. Für die dardischen Sprachen und bestimmte Marathi-Dialekte werden Systeme mit bis zu 18 Vokalen beschrieben, die aber nur unzureichend erforscht sind.^[7]

Die Vokalsysteme der wichtigsten indoarischen Sprachen sind wie folgt:

Sprache	Vokalphoneme
Marathi, Nepali:	/i, e, a, ə, o, u/
Oriya:	/i, e, a, ɔ, o, u/
Bengali:	/i, e, æ, a, ɔ, o, u/
Asamiya:	/i, e, ɛ, a, ɒ, ɔ, o, u/
Gujarati:	/i, e, ɛ, a, ə, ɔ, o, u/
Hindi, Panjabi:	/i, ɪ, e, æ, a, ə, ɔ, o, u/

Anmerkung: Das [ə] steht für den kurzen a-Laut, der bisweilen auch als [ʌ] wiedergegeben wird.

Das symmetrische zehn-Vokal-System des Hindi und Panjabi steht dem Sanskrit am nächsten. Im Sanskrit bestand aber der Unterschied zwischen Paaren wie i / ī primär in der Vokallänge: [i] / [iː]. In den neuindoarischen Sprachen ist dieser quantitative Unterschied durch einen qualitativen ersetzt worden: [ɪ] / [i]. Es ist aber möglich, dass der qualitative Unterschied bereits von Anfang mit der Unterscheidung nach der Vokallänge einherging.^[8] Zumindest für das kurze a [ə] und das lange ā [aː] wird bereits in den ältesten Grammatiken ein qualitativer Unterschied beschrieben. Zudem kannte das Sanskrit die „konsonantischen Vokale“ ṛ, ṝ und ḷ. Die letzten beiden sind sehr selten, das ṛ kommt hingegen auch in den modernen Sprachen in Sanskrit-Lehnwörtern vor und wird als [rɪ] gesprochen (z. B. ṛṣi [rɪʃɪ] „Rishi“).

Die Phoneme [æ] und [ɔ] im Hindi und Panjabi gehen ursprünglich auf die Diphthonge [ai] und [au] zurück und werden in manchen Dialekten auch noch als solche gesprochen. Während die Diphthonge im Sanskrit phonematisch sind, werden die zahlreichen Vokalverbindungen der neuindoarischen Sprachen nicht als eigenständige Phoneme aufgefasst.

Den reinen Vokalen stehen in den meisten neuindoarischen Sprachen Nasalvokale gegenüber (z. B. Hindi cā̃d „Mond“). Das Sanskrit kennt ebenfalls eine als anusvara bezeichnete Nasalisierung, die aber im Gegensatz zur Nasalisierung in den modernen Sprachen nicht phonematisch ist.

Akzent

Die älteste indoiranische Sprachform, das Vedische, verfügte über einen tonalen Akzent, der dem des Altgriechischen entsprach (vgl. Vedisch pā́t, padáḥ mit Altgriechisch poús, podós „Fuß“). Der Akzent konnte auf jede Silbe des Wortes fallen und wurde mit einem Hochton (udātta) gesprochen. Im klassischen Sanskrit wandelte sich der tonale Akzent zu einem auf der Schallfülle beruhenden dynamischen Akzent, wie er auch im Deutschen vorkommt. Die Position des Akzents stimmte nicht mit dem alten tonalen Akzent überein, sondern fiel ähnlich wie im Lateinischen nach vorhersagbaren Regeln auf die zweit-, dritt- oder viertletzte Silbe. Die Betonung folgt in den neuindoarischen Sprachen unterschiedlichen Regeln, ist aber nie bedeutungsunterscheidend (eine Ausnahme stellt Asamiya dar, vgl. ˈpise „er trinkt“ und piˈse „dann“).

Panjabi stellt als Tonsprache einen Sonderfall dar. Die drei bedeutungsunterscheidende Töne (z. B. koṛā „Peitsche“, kóṛā „Aussätziger“, kòṛā „Pferd“) sind sekundär unter dem Einfluss eines früheren aspirierten Konsonanten entstanden (vgl. Panjabi kòṛā mit Hindi ghoṛā).

Verteilung der Laute

Im Sanskrit können Wörter in der Regel nur auf bestimmte einfache Konsonanten enden. Am Anfang und in der Mitte eines Wortes treten dagegen komplizierte Konsonantenhäufungen auf (z. B. jyotsna „Mondschein“). In der mittelindoarischen Periode vereinfachte sich die Struktur der Wörter erheblich: Am Wortanfang waren nur noch einfache Konsonanten mögich, so wandelte sich z. B. Sanskrit prathama „erster“ zu Pali paṭhama. Im Wortinneren waren nur bestimmte einfach auszusprechende Konsonantenverbindungen (verdoppelte Konsonanten oder Verbindungen mit einem Nasal als erster Bestandteil) zulässig, die altindoarischen Konsonantenverbindungen wurden durch Assimilation vereinfacht (z. B. Sanskrit putra „Sohn“ zu Pali puttā). Am Wortende konnten gar keine Konsonanten außer dem nasalisierten ṃ vorkommen.

In den neuindoarischen Sprachen kommen durch Lehnwörter und den Ausfall von kurzen Vokalen wieder zahlreiche Konsonantenverbindungen vor. Im Wortinneren wird ein kurzes a in vielen Sprachen noch geschrieben, aber nicht mehr gesprochen, z. B. wird das Hindi-Wort karanā „machen“ als karnā gesprochen. In vielen neuindoarische Sprachen ist das kurze a am Wortende ausgefallen, so dass eine große Zahl an Wörtern auf einen Konsonanten endet (z. B. Marathi sāt „sieben“, aus Praktit satta).

Im Sanskrit können zwei Vokale nicht aufeinanderfolgen. Durch den Ausfall intervokalischer Konsonanten entstanden in den Prakrit-Sprachen aber zahlreiche Vokalabfolgen, die in den modernen Sprachen zum Teil zusammengezogen wurden (z. B. Sanskrit citrakāra „Maler“ > Prakrit cittaāra > Gujarati cittāro), zum Teil aber auch beibehalten wurden (z. B. rāja „König“ > rāā > rāo).

Morphologie

Die Morphologie der indoarischen Sprachen hat im Laufe ihrer Entwicklung grundlegende Änderungen durchlebt. Das altindoarische Sanskrit war eine hochgradig synthetisch-flektierende Sprache mit einer komplizierten Morphologie, dem Lateinischen und Altgriechischen nicht unähnlich. Die Entwicklung hin zu den mittelindoarischen Sprachen ging mit einer deutlichen Vereinfachung der Morphologie einher. Die neuindoarischen Sprachen sind zu einem weitgehend analytischen Sprachbau mit agglutinierenden Elementen übergegangen. Typologisch sind die indoarischen Sprachen stark von ihren dravidischen Nachbarsprachen beeinflusst worden. Auch im Bereich der Syntax schlägt sich die Änderung der Morphologie bereits im klassischen Sanskrit deutlich nieder.

Das Nomen

Das Altindoarische hatte neben dem Singular und Plural noch einen weiteren Numerus, den Dual (Zweizahl). Dessen Benutzung war im Sanskrit obligatorisch, in der mittelindoarischen Phase ging der Dual aber verloren. Die Kategorie des Numerus ist nicht in allen neuindoarischen Sprachen stark ausgeprägt. Bengali etwa kennt eine Pluralendung, deren Verwendung ist aber nicht obligatorisch, auch besteht keine Numeruskongruenz.

Die alt- und mittelindoarischen Sprachen kennen die drei indogermanischen Genera Maskulinum, Femininum und Neutrum. Unter den neuindoarischen Sprachen ist dieses System in den westlichen Sprachen (Gujarati, Marathi, Konkani) beibehalten worden. Im Singhalesischen kommen ebenfalls drei Genera vor, doch handelt es sich hierbei um ein anders gelagertes System, das wie in den dravidischen Sprachen auf Belebtheit und natürlichem Geschlecht beruht. In den meisten neuindoarischen Sprachen sind Maskulinum und Neutrum zusammengefallen. Nach Osten hin ist die Genuskategorie weniger stark ausgeprägt. Die östlichsten Sprachen Bengali, Asamiya und Oriya haben sie gänzlich verloren, ebenso Khowar und Kalasha-mun am entgegengesetzen Ende des indoarischen Sprachraums.

Lexik

Die einheimische Grammatik teilt den Wortschatz der modernen indoarischen Sprachen in vier Kategorien, die mit Sanskrit-Namen bezeichnet werden:

tadbhava („daraus [d. h. aus einem Sanskritwort] entstanden“): Erbwörter aus dem Altindoarischen
tatsama („dasselbe wie das [d. h. ein Sanskritwort]“): direkte Entlehnungen aus dem Sanskrit
deśya („lokal“): Wörter ohne Entsprechung im Sanskrit
videśi („fremd“): Lehnwörter aus außerindischen Sprachen

Erbwörter

Den Kern der neuindoarischen Lexik bilden die Tadbhava-Wörter, die auf natürlichem Wege aus dem Altindoarischen über die Zwischenstufe der mittelindoarischen Prakrits entlehnt worden und dabei durch eine Reihe von Lautwandeln in ihrer Gestalt verändert worden sind. So geht das Hindi-Wort khet („Feld“) über Prakrit khetta auf Sanskrit kṣetra zurück. Manche Wörter wie deva („Gott“) oder nāma („Name“) hatten schon im Altindischen eine so einfache Gestalt, dass sie keiner weiteren Veränderung unterlagen. Tadbhava-Wörter können einen ursprünglich nichtindogermanischen Ursprung haben, denn bereits im Sanskrit sind Entlehnungen aus den dravidischen und Munda-Sprachen vorhanden.

Einige indoarische Wortgleichungen^[9]
Sprache	Hand	Zahn	Ohr	machen	trinken	hören
Sanskrit	hasta	danta	karṇa	kar-	pib-	śṛn-
Hindi	hāth	dā̃t	kan	kar-	pī-	sun-
Bengali	hāt	dā̃t	kān	kɔr-	pi-	ʃon-
Panjabi	hatth	dand	kann	kar-	pī-	suṇ-
Marathi	hāt	dāt	kān	kar-	pi-	aik-
Gujarati	hāth	dā̃t	kān	kar-	pī-	sā̃bhaḷ-
Oriya	hātɔ	dāntɔ	kānɔ	kɔr-	pi-	suṇ-
Sindhi	hathu	ɗandu	kanu	kar-	pi-	suṇ-
Asamiya	hāt	dā̃t	kān	kɔr-	pi-	xun-
Nepali	hāt	dā̃t	kān	gar-	piu-	sun-
Kashmiri	athɨ	dād	kan	kar-	co-	buz
Singhalesisch	ata	data	kaṇa	kara-	bo-, bī-	ähe-
Romani	vast	dand	kan	ker-	pi-	sun-

Sanskritismen

Wörter, die in unveränderter Gestalt (oder besser: Schreibweise) direkt aus dem Sanskrit entlehnt worden sind, bezeichnet man als Tatsamas. Die Aussprache kann dabei durchaus abweichen: die Unterscheidung zwischen bestimmten Lauten wie ś und ṣ wird meist nicht mehr gewahrt, in Hindi und Marathi fällt das kurze a am Wortende oft aus, im Bengali werden Konsonantenverbindungen assimiliert. So wird das Tatsama ātmahatyā („Selbstmord“) auf Hindi [aːtmʌhʌtjaː], auf Bengali dagegen [ãttohɔtta] ausgesprochen. Im Singhalesischen werden auch aus dem Pali, das als Sprache des buddhistischen Kanons eine ähnlich wichtige Rolle wie das Sanskrit einnimmt, übernommene Wörter zu den Tatsamas gerechnet. Teils sind Doubletten von Tadbhava und Tatsama-Wörtern vorhanden, wobei das Tatsama dann meist eine spezialisiertere Bedeutung hat. So existiert im Hindi neben dem erwähnten Tadbhava khet für ein Feld im konkreten Sinne (d. h. eines, das man pflügen kann) das Tatsama-Wort kṣetra, das ein Feld im übertragenden Sinne (also ein Beschäftigungsfeld o. Ä.) bezeichnet.

In den modernen indoarischen Literatursprachen (außer denen wie Urdu, die dem kulturellen Einfluss des Islam unterliegen) hat die Verwendung von Sanskrit-Wörter sehr große Ausmaße angenommen. Vor allem im Wortschatz des höheren Registers finden sich viele Sanskritismen, ähnlich wie in den europäischen Sprachen lateinische und griechische Fremdwörter verwendet werden. Nationalistische Kreise fördern die Verwendung von Sanskritwörtern als ein Symbol des politischen Hinduismus^[10] und versuchen in der Schriftsprache auch für neuere Begriffe wie „Elektrizität“ werden Sanskrit-Neologismen zu etablieren. In der Alltagssprache können sich künstliche Sanskrit-Neologismen aber nur schwerlich gegen englische Lehnwörter durchsetzen.

Lehnwörter

Zu den Deśya-Wörtern rechnet man Wörter ohne Parallelen im Sanskrit. Hierzu gehören aus altindischen Dialekten ererbte Wörter, die im Sanskrit fehlen, sowie Entlehnungen aus den dravidischen und Munda-Sprachen. Dazu kommen in den neuindoarischen Sprachen in großer Zahl aus außerindischen Sprachen, vor allem dem Persischen, Arabischen, Portugiesischen und Englischen, übernommene Lehnwörter, die die indische Grammatik zur videśi-Kategorie rechnet.

Während der etwa achthundertjährigen islamischen Herrschaft in Nordindien war das Persische die Hofsprache der Oberschicht. So gelangten viele persische und über persische Vermittlung auch arabische Wörter in die indoarischen Sprachen. Für Urdu, die Sprache der indischen Muslime, übernimmt das Persisch-Arabische eine ähnliche Rolle als Quelle für Wörter höherer Stilebenen wie Sanskrit für die mehrheitlich von Hindus gesprochenen Sprachen. Dementsprechend groß ist deren Anteil im Urdu, besonders niedrig ist er naturgemäß in Sprachen wie Nepali, Asamiya oder Singhalesisch, die keinem nachhaltigen islamischen Einfluss ausgesetzt waren.^[11]

Einen verhältnismäßig kleinen Anteil unter den Fremdwörtern machen Entlehnungen aus dem Portugiesischen, mit der die indischen Sprachen ab dem 16. Jahrhundert durch europäische Seefahrer in Kontakt kamen. Aus der portugiesischen Sprache wurden Wörter wie chave für „Schlüssel“ (Hindi cābhī, Marathi cāvī), janela für „Fenster“ (Hingi janglā, Bengali jānālā, Singhalesisch janēlaya) oder mestre für „Handwerker“ (Hindi mistrī, Marathi mestrī) übernommen. Äußerst zahlreich sind seit der britischen Kolonialzeit die englischen Lehnwörter. Vor allem moderne Begriffe wie „Hotel“ (hoṭal), „Ticket“ (ṭikaṭ) oder „Fahrrad“ (sāikil, von cycle) wurden aus dem Englischen entnommen.

Schriften

Die indoarischen Sprachen werden in einer Vielzahl von Schriften geschrieben: verschiedenen indischen Schriften, der persisch-arabischen Schrift und in Einzelfällen der lateinischen Schrift. Dhivehi, die Sprache der Malediven, hat eine gänzlich eigene Schrift, Thaana genannt. Sie wurde im 15. Jahrhundert nach dem Vorbild von arabischen Ziffernzeichen und anderen Elementen geschaffen.

Indische Schriften

Hinduistisches Mantra auf Sanskrit in Devanagari-Schrift

Die meisten für die indoarischen Sprachen verwendeten Schriften gehören ebenso wie die Schriften Südindiens, Südostasiens und Tibets zur Familie der indischen Schriften, die allesamt von der Brahmi-Schrift abstammen. Die Brahmi-Schrift tritt erstmalig im 3. Jahrhundert v. Chr. in den Inschriften Kaiser Ashokas zu Tage. Ihre Ursprünge sind ungeklärt, als wahrscheinlich gilt, dass sie nach einem semitischen Vorbild geschaffen wurde, während die in Indien populäre These von einer Abstammung von der Indus-Schrift von westlichen Forschern abgelehnt wird.^[12] Im Laufe der Zeit spaltete sich die Brahmi-Schrift in zahlreiche regionale Varianten auf, die grafisch teils sehr stark voneinander abweichen. Strukturell sind sie sich aber sehr ähnlich und teilen alle dasselbe Funktionsprinzip. Es handelt sich bei ihnen um eine Zwischenform aus Alphabet und Silbenschrift, sogenannte Abugidas, bei denen jedes Konsonantenzeichen einen inhärenten Vokal a besitzt, der durch diakritische Zeichen modifiziert werden kann. Konsonantenverbindungen werden durch Ligaturen ausgedrückt. Die Reihenfolge der Zeichen ist in den indischen Schriften anders als etwa im lateinischen Alphabet nicht beliebig, sondern spiegelt die Phonologie der indoarischen Sprachen wieder. Die Buchstaben werden folgendermaßen angeordnet:

Vokale (a, ā, i, ī, u, ū, ṛ, ṝ, ḷ, e, ai, o, au)
Plosive und Nasale nach Artikulationsort von hinten nach vorne geordnet
- Velare (ka, kha, ga, gha, ṅa)
- Palatale (ca, cha, ja, jha, ña)
- Retroflexe (ṭa, ṭha, ḍa, ḍha, ṇa)
- Dentale (ta, tha, da, dha, na)
- Labiale (pa, pha, ba, bha, ma)
Halbvokale (ya, ra, la, va)
Sibilanten und Hauchlaut (śa, ṣa, sa, ha)

Das Zeicheninventar ist in den verschiedenen Schriften im wesentlichen dasselbe. Manche Schriften kennen ein spezielles Zeichen für das retroflexe ḷ, weitere Sonderzeichen könnten durch einen untergesetzten Punkt geschaffen werden.

Folgende indische Schriften werden für indoarische Sprachen verwendet (als Beispiel ist die erste Konsonantenreihe ka, kha, ga, gha, ṅa angegeben):

Schrift	Sprache(n)	Beispiel
Devanagari	Hindi, Bihari, Rajasthani, Marathi, Nepali
Bengalische Schrift	Bengali, Asamiya, Bishnupriya Manipuri
Gurmukhi	Panjabi
Gujarati-Schrift	Gujarati
Oriya-Schrift	Oriya
Singhalesische Schrift	Singhalesisch

Sanskrit wurde traditionell in der Schrift der jeweiligen Regionalsprache geschrieben, heute hat sich Devanagari als übliche Schrift für Sanskrit-Texte durchgesetzt. Für manche Sprachen werden parallel mehrere Schriften verwendet: Kashmiri wird in Pakistan in persisch-arabischer Schrift, in Indien in Devanagari geschrieben. Für Panjabi sind sogar drei Schriften im Einsatz: die persisch-arabische in Pakistan, Gurmukhi unter den Sikhs und Devanagari unter den panjabisprachigen Hindus.

Persisch-Arabische Schrift

Urdu-Gedicht von Mirza Ghalib im Nastaliq-Duktus

Urdu, die Sprache der indischen Muslime, wird ebenso wie die übrigen in Pakistan verwendeten indoarischen Sprachen (Sindhi, Panjabi, Kashmiri) in der persisch-arabischen Schrift, einer um einige Sonderzeichen erweiterten Version des arabischen Alphabets, geschrieben. Die arabische Schrift eignet sich nicht allzu gut für die Wiedergabe indoarischer Sprachen. Zum einen werden kurze Vokale nicht ausgedrückt und auch bei den langen Vokalen kann etwa nicht zwischen ū, ō und au unterschieden werden. In arabischen Lehnwörtern kommen redundante Buchstaben vor, die gleich ausgesprochen werden (z. B. Sin, Sad und Tha alle als s). Für andere Laute, die in den indoarischen Sprachen vorkommen, existieren in der arabischen Schrift aber keine Zeichen, so dass diese mithilfe von diakritischen Zeichen neu geschaffen werden mussten (z. B. ٹ ṭ, ڈ ḍ und ڑ ṛ für die retroflexen Laute im Urdu). Bei der Bildung dieser Sonderzeichen weisen die Alphabete von Urdu und Sindhi Unterschiede auf (so sind die Retroflexe in Sindhi ٽ ṭ, ڊ ḍ und ڙ ṛ), während sich Panjabi und Kashmiri an der Urdu-Orthografie orientieren. Auch verwendet Sindhi für die aspirierten Konsonanten eigene Sonderzeichen, während sie im Urdu durch die Kombination des nichtaspirierten Konsonanten und h ausgedrückt werden (z. B. Sindhi ٿ und Urdu ته für th). Weiterhin unterscheidet sich Urdu durch die Verwendung des geschwungenen Nastaliq-Duktus von Sindhi, das man vorzugsweise im simpleren Naskhi schreibt.

Lateinische Schrift

Die einzigen indoarischen Sprachen, die regulär in lateinischer Schrift geschrieben werden, sind Konkani und Romani. Für Konkani, die Sprache Goas, wurde im 16. Jahrhundert eine Orthografie auf Grundlage des Portugiesischen geschaffen. Daneben wird Konkani auch in Devanagari-Schrift geschrieben. Für Kalasha-mun, die bislang illiterate Sprache der Kalasha von Chitral, wird seit neuestem im Schulunterricht das lateinische Alphabet verwendet.

Im wissenschaftlichen Kontext ist die lateinische Transliteration gebräuchlich. Der übliche Standard ist das International Alphabet of Sanskrit Transliteration (IAST), das unter- und übergesetzte Punkte und andere diakritische Zeichen für die speziellen Laute der indoarischen Sprachen verwendet.

Quellen und weiterführende Informationen

Einzelnachweise

↑ Census of India: Family-wise grouping of the 114 scheduled and non-scheduled languages – 1991
↑ Berger: Die Vielfalt der indischen Sprachen, S. 105.
↑ Colin P. Masica: The Indo-Aryan Languages, Cambridge 1991, S. 36.
↑ Masica: The Indo-Aryan Languages, S. 37.
↑ Jules Bloch: Indo-Aryan. From the Vedas to modern times. , Paris 1965, S. 11
↑ Masica: The Indo-Aryan languages, S. 94.
↑ Masica: The Indo-Aryan languages, S. 113.
↑ Masica: The Indo-Aryan languages, S. 111.
↑ Die Beispiele stammen aus Masica: The Indo-Aryan languages, S. 85.
↑ Berger: Die Vielfalt der indischen Sprachen, S. 102.
↑ Masica: The Indo-Aryan Languages, S. 71.
↑ Masica: The Indo-Aryan Languages, S. 133 f.

Literatur

Berger, Hermann: Die Vielfalt der indischen Sprachen. In: Dietmar Rothermund (Hrsg.): Indien. Kultur, Geschichte, Politik, Wirtschaft, Umwelt. Ein Handbuch. C. H. Beck, München 1995. S. 101-110.
Bloch, Jules: Indo-Aryan. From the Vedas to modern times. Übers. Alfred Master. Libraire d’Amérique et d’Orient Arien Maisonneuve, Paris 1965.
Cardona, George: Indo-Aryan Languages. In: Bernard Comrie (Hrsg.): The Major Languages of South Asia, the Middle East and Africa. Routledge, London 1990.
Cardona, George and Dhanesh Jain (Hrsg.): The Indo-Aryan Languages. Routledge, London 2003.
Masica, Colin P.: The Indo-Aryan Languages. Cambridge University Press, Cambridge 1991.
Zograph, Georgij A.: Die Sprachen Südasiens. Übers. Erika Klemm. VEB Verlag Enzyklopädie, Leipzig 1982.

Weblinks

Ernst Kausen, Die Klassifikation der indogermanischen Sprachen (DOC 133 KB) Basis für die Klassifizierung der neuindoarischen Sprachen dieses Artikels.

[1] Census of India: Family-wise grouping of the 114 scheduled and non-scheduled languages – 1991

[2] Berger: Die Vielfalt der indischen Sprachen, S. 105.

[3] Colin P. Masica: The Indo-Aryan Languages, Cambridge 1991, S. 36.

[4] Masica: The Indo-Aryan Languages, S. 37.

[5] Jules Bloch: Indo-Aryan. From the Vedas to modern times. , Paris 1965, S. 11

[6] Masica: The Indo-Aryan languages, S. 94.

[7] Masica: The Indo-Aryan languages, S. 113.

[8] Masica: The Indo-Aryan languages, S. 111.

[9] Die Beispiele stammen aus Masica: The Indo-Aryan languages, S. 85.

[10] Berger: Die Vielfalt der indischen Sprachen, S. 102.

[11] Masica: The Indo-Aryan Languages, S. 71.

[12] Masica: The Indo-Aryan Languages, S. 133 f.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]