Die Internetlinguistik (IL) ist eine moderne, dynamische Teildisziplin der Sprachwissenschaft, die sich mit der wissenschaftlichen Untersuchung der Sprachverwendung in Abhängigkeit von der spezifischen Online-Umgebung beschäftigt. Auf der Grundlage von linguistischem Basiswissen werden aktuelle sprachliche Phänomene analysiert, die durch das Internet entstehen. Wie sich neue sprachliche Phänomene bilden, wird anhand von (zahlreichen) empirischem Material aufgezeigt.
Einleitung
Definition
Per Definition beschäftigt sich die Internetlinguistik „mit der Sprachverwendung im Internet und damit mit einem spezifischen kommunikativen Kontext, dessen Charakteristika in alle Analysen einfließen. Bei der Internetlinguistik handelt es sich um eine Schnittstellendisziplin, die – wie für die Angewandte Linguistik typisch – neben linguistischen Zugängen, kommunikations- und medienwissenschaftliche Methoden kombiniert und durchaus auch sozio- und psychologische Fragestellungen motiviert.“ (Marx/ Weidacher 2014: 10) Andere weitere Definitionen? – bisher einzige Definition, die in wissenschaftlicher (deutscher) Literatur vorhanden ist. ---> Ursprünge gehen auf Crystal zurück → Verlinken? ---> Anwendungsbereiche? ---> Dynamisch, ständigen Veränderungen ausgesetzt?
Entstehung
---> Sprachwissenschaftliche Studien? ---> Erste Methoden? Die IL hat sich daraus entwickelt, dass isolierte Beobachtungen sprachlicher Phänomene im Internet überwunden wurden und stattdessen die Sprachverwendung im Internet in den Fokus gerückt wurde. Diese werden dann nicht nur aus sprachwissenschaftlicher, sondern auch aus erweiterter linguistischer Sicht untersucht. David Crystal gilt als einer der Vorläufer Erste Publikationen zu diesem Thema sind schon Ende der 90´er Jahre entstanden. Doch bis heute erscheinen/ entstehen zahlreiche aktuelle Auseinandersetzungen über Sprache und Kommunikation im Internet.
Überblick
In der forschungsorientierten Internetlinguistik wird unter anderem folgenden Fragen nachgegangen: Wie beeinflussen sich Sprache und Internet gegenseitig? Wie gestaltet sich die Kommunikation in den Internetdiensten selbst? Wie wird der aus der Linguistik untersuchte Sprachraum/ Untersuchungsgegenstand eventuell erweitert? Internetlinguistik als eigene Disziplin ist insofern sinnvoll, da das Internet als Übertragungsmedium von Sprache gesehen wird. Es gibt also nicht nur Web-Inhalte an sich, sondern auch Inhalte die nur mithilfe der Internettechnologie übertragen werden können (BEISPIEL ???). Des Weiteren gibt es einen erweiterten Internetbegriff (Web, Netz, WWW, Internet als Kommunikationsraum, Internet als Speichermedium, Internet als Übertragungsmedium,...)
Nicht zu verwechseln ist die Internetlinguistik von dem Fakt an sich und die Art und Weise wie sich Linguistik im Internet präsentiert (vgl. Cölfen/Cölfen/Schmitz 1997 Linguistik im Internet ...). Ebenfalls ist sie von der Computerlinguistik abzugrenzen, da sie mehr inhaltliche Arbeit leistet und nicht Sprache „algorithmisch“ untersucht, die es auch ohne das Internet gibt.
Dennoch findet die IL in folgenden Feldern forschungsorientierte Anwendung:
- Datenanalyse in Korpuslinguistik
- Sprachwissenschaft
- Semantik und Pragmatik
- Textlinguistik
- Soziologie und Psychologie
- Digital Humanities
---> noch umtauschen
Des Weiteren bedient sich die IL medienwissenschaftlicher und kommunikationswissenschaftlicher Methoden. Es handelt sich also um ein interdisziplinäres Feld der Sprachwissenschaft.
Methoden
Datenerhebungsmethoden und tools
· Korpus Generierung
· Online Fragebögen
· Log File Analyse
· Offline Datenerhebung
Korpus Generierung, Korpora sind umfangreiche Datensammlungen gesprochener und geschriebener Texte, die · Explorativ/hypothesengeleitet ermöglichen sprachliche Phänomene zu untersuchen
· daher mit Blick auf Forschungsfrage (oder das spezifische Erkenntnisinteresse) zusammengestellt, um mögl. charakteristische Eigenschaften des betreffenden Sprachausschnitts abzubilden
· in Größenordnung von ca mehreren Mill. Textwörtern
· meist elektronisch verfügbar+ maschinenlesbar sind.
· Regelhaft mittels Computer und statistischer Programme/Verfahren untersuch- und analysierbar sind.
Siehe Links: bestehende Korpora (DWDS, IDS-Mannheim)
Online Fragebögen,
Fragebögen sind ein Erhebungsinstrument der empirischen Sozialforschung. Hier nutzbar, um zB die Verbreitung spezifischer Lexeme oder Urteile über Grammatikalität zu untersuchen.
· Nachteilhaft: nicht kontrollierbar, wer den Fragebogen wie(wann+warum) ausfüllt und ob überhaupt von einer Person beantwortet (und nicht einer Gruppe)
· Vorteilhaft: sind schnell auszufüllen und zu verschicken (erreichen größere Probanden-gruppen auch weit entfernt, ohne Porto/ weiteres Geld zu kosten)
· Rücklaufquote, anders als wenn angekündigt/ mit Befragungsleiter.
· Dafür: höhere Motivation, da Befragte selbst den Zeitpunkt wählen zum antworten.
· Alle Probleme des Fragebogen zu bedenken: repräsentative Stichprobe, Verzerrung durch (immer gleiche Leute die bei Umfragen mitmachen)
Hilfen zur Erstellung für nichtkommerzielle Zwecke:
Siehe Link: www.socisurvey.de
Log-File Analyse,
Protokolliert die Online Aktivität von Nutzern. Erhebt sowohl statistische als auch inhaltliche Daten (zB online Kommunikation)
· Besonders geeignet für: online Gespräche in Social Media und Chaträume
· Die Nutzer sind in Kenntnis der Aufzeichnung der Daten
· Zu beachten: Beobachter Paradoxon (vgl Labov 1972 Zitat): „The aim of linguisic research in the community must be to find out how people talk when they are not systematically observed, yet we can only obtain this data by systematic observation:“
Offline Datenerhebung,
Zur Untersuchung von Online Phänomenen die mit vorherigen Methoden nicht erschließbar sind, oder wo kein Zugang (oder nur beschränkter) zu den Daten besteht.
· Ziel: Aufbau eines persönlichen offline Kontaktes zu den Probanden, um diese zu motivieren, Protokolle über ihre online Aktivität für Forschungszwecke zu erstellen.
Tools, Projekte und Innovationen
Text Encoding Initiative (TEI) ist eine 1987 gegründete Organisation und ein gleichnamiges Dokumentenformat zur Kodierung und zum Austausch von Texten. In der aktuellen Version P5 basiert das Format auf XML und ist in einer Metasprache definiert, aus der formale Schemata wie DTD, XML Schema und RELAX NG Schema abgeleitet werden können.
TEI hat sich zu einem De-facto-Standard innerhalb der Geisteswissenschaften entwickelt, wo es zum Beispiel zur Kodierung von gedruckten Werken (Editionswissenschaft) oder zur Auszeichnung von sprachlichen Informationen (Linguistik) in Texten verwendet wird.
BootCaT (Simple Utilities to Bootstrap Corpora And Terms from the Web) und das Webspezifische Anwendungstool: WebBootCaT stellt online mittels bootstrapping Text Korpora für Stichwörter oder Suchanfragen zusammen. Es nutzt dabei eine Folge von Befehlszeilenskripts zur Erstellung eines Domänenspezifischen Korpus. Freie Software von Linguisten der Universitäten Bologna, Trento und Zaghreb, Marco Baroni & Silvia Bernardini.
Cloud computing, in web 2.0 Umgebung, Möglichkeit das Ressourcen von einer großen Anzahl von verschiedenen PCs gespeist werden, und auch von verschiedensten Geräten abrufbar sind.
Big Data: Die Zukunft des Netzes? Big Data erlaubt die automatisierte Analyse von Texten in großem Umfang und könnte so die Realisierung des semantischen Web 3.0 ermöglichen. Es beruht auf der komplexen Beschreibung der Beziehungen zwischen Informationen.
weiter führende links
Bereits bestehende Korpora
USENET corpus: http://www.psych.ualberta.ca/~westburylab/downloads/usenetcorpus.download.html
Birmingham blog corpus
http://wse1.webcorp.org.uk/blogs/
IDS Mannheim für gesprochenes Deutsch
http://agd.ids-mannheim.de/korpus_index.shtml
für geschriebene Sprache
http://www.ids-mannheim.de/cosmas2/
Dortmunder Chatkorpus
http://www.chatkorpus.tu-dortmund.de/
user manual: http://www.linse.uni-due.de/tl_files/PDFs/Publikationen-Rezensionen/Chatkorpus_Beisswenger_2013.pd
Wortschatzportal der Universität Leipzig
http://wortschatz.uni-leipzig.de
Digitales Wörterbuch der Deutschen Sprache
www.dwds.de
LIMAS
http://korpora.zim.uni-duisburg-essen.de/Limas
TIGER für maschinelle Sprachverarbeitung
http://www.ims.uni-stuttgart.de/forschung/ressourcen/korpora/tiger.html
internationale Korpora:
deWac, web texte in deutscher, englischer, italienischer und französischer Sprache
http://wacky.sslmit.unibo.it/doku.php?id=corpora
Overview of corpus based resources by M. Davies (several languages)
Corpus of Contemporary American English
http://www.corpus.byu.edu/coca/
British National Corpus
Webcorp, the Web as Corpus
http://www.webcorp.org.uk/live/
Leeds Collection of Internet Corpora
http://corpus.leeds.ac.uk/internet.html
Projekte, Tools:
Projekt Sprache Universität Hannover
https://www.mediensprache.net/de/
http://socialmedialinguist.blogspot.com.au/
http://www.tei-c.org/index.xml
http://bootcat.sslmit.unibo.it/
Literatur
Beißwenger, M./Storrer, A., 2008. Corpora of Computer-Mediated CommunicaTon. In: A. Lüdeling/M. Kytö̈ (Eds.),Corpus LinguisTcs. An InternaTonal Handbook (pp. 292-308). Berlin /New York: Mouton de Gruyter. Berlin: De Gruyter.
Bubenhofer, N., 2009. Sprachgebrauchsmuster. KorpuslinguisTk als Methode der Diskurs und Kulturanalyse.
Gatto, M., 2014. Web as Corpus. Theory and PracTce. London: Bloomsbury.
Marx, C./Weidacher G., 2014. Internetlinguistik. Ein Lehr- und Arbeitsbuch. Narr Verlag, Tübingen ISBN 978-3-8233-6809-0
Zappavigna, M., 2012. Discourse of Twiser and social Media. How we use language to create affiliaTon on the web. London: Bloomsbury.
Problematisierung des Forschungsfeldes
Sprache und Kommunikation im Internet als Forschungsgegenstand der IL
Gibt es eine Internetsprache?
* Keine Fachsprache mit eigener Systematik
* Kein homogener Kommunikationsraum
* Keine internetspezifische Sondersprache
* Kein einheitlicher Sprachgebrauch
"Die Übertragung von typischen internetspezifischen Phänomenen auf die Offline-Kommunikation"
Kommunikationssituation
Phänomene im Sprachgebrauch und in der Internetkommunikation
*Abkürzungen und Verkürzungen
*Anglizismen
*Neologismen
*Dialektausdrücke
*Interjektionen
*Verschmelzung von Wortformen
*Emoticons
*Iterationen
*Inflektive
*Akronyme
*Hashtags
*Ellipsen
*Leetspeak
Textuelle Online-Kommunikation
In Betrachtung der Kommunikationsformen im Internet sowie der daraus hervorgehenden neuen Textsorten stellt sich aus der Perspektive der Textlinguistik die Frage, inwiefern für die Analyse von Online-Texten eine Internet-Textlinguistik benötigt wird.[1] Einerseits spiegeln Textstrukturen im Internet Elemente und Muster wider, die bereits aus traditionellen Texten bekannt sind, so dass eine für das Internet spezifische Textlinguistik nicht erforderlich erscheint.[2]. Andererseits können prototypische Merkmale von herkömmlichen Texten[3] relativ deutich von typischen Merkmalen in Internet-Texten abgegrenzt werden:[4]
Merkmale prototypischer herkömmlicher Texte | Besondere Merkmale von (vielen) Texten im Internet |
---|---|
Stabilität | Fluidity |
Abgeschlossenheit | Hypertextualität |
Sprachlichkeit/Schriftlichkeit | Multimodalität |
Monologizität | Dialogizität |
In der Gegenüberstellung der Merkmale von prototypsicher Texte im Vergleich zu Texten im Internet, erscheint ein Ansatz in dem Internet-Texte auf der Basis von theoretischen und methodischen Grundlagen untersucht werden, die zur Analyse von beispielsweise traditionellen Print-Texten entwickelt wurden, begrenzt anwendbar [5]. Diesbezüglich sollte sich die Anpassung von Theorien und Methoden der Textlinguistik auf Texte in spezifischer Online-Umgebung als sinnvoll erweisen [6].
Praxisrelevante Aspekte der IL
Als Schnittstellendisziplin / als Disziplin der angewandten Linguistik, sind praxisrelevante Aspekte der Internetlinguistik innerhalb der Forschung ausschlaggebend. In vielen Bereichen sind es nicht nur aus sprachlichem Interesse motivierte Fragestellungen sowie Ergebnisse, die den Forschungsbereich der Internetlinguistik ausmachen. So liegt beispielsweise auf der Hand, dass eine medienwissenschaftliche Betrachtung des World Wide Web Fragestellungen aufwirft, die durch Betrachtung des Mittels Sprache gelöst werden. Sozial- und Verhaltenswissenschaften können zudem Schlüsse aus der Analyse sprachlicher Kommunikation im Internet ziehen. Beispiel dafür sind Untersuchungen zum Thema Cybermobbing (VERWEIS AUF BEISPIEL). (Mobbingunterbindung?) Ebenso lassen sich Rückschlüsse auf andere gesellschaftliche Bereiche aus der Sprachanalyse der Onlinekommunikation ziehen. Ein denkbarer Anwendungsbereich wären beispielsweise Ergebnisse bezüglich der Verbindlichkeit von sprachlichen Äußerungen, beispielsweise die rechtliche Verbindlichkeit von Selbstverpflichtungen/sprachliche Äußerungen als Verträge etc. (Gibt es dazu einen Fachbegriff/Alternative Benennung?) Als interdisziplinärer Ansatz lässt sich dabei keine klare Trennung der jeweiligen Wissenschaften vornehmen. Beispielsweise können in der Forschung zum Thema Cybermobbing sozialwissenschaftliche, psychologische oder medientheoretische Methoden neben linguistischen Methoden angewandt werden. Es lässt sich somit auch nicht klar definieren, dass die Internetlinguistik einen bestimmten Forschungsoutput bringt, der praktisch in anderen Bereichen angewandt werden kann, wenn fachbereichsübergreifende Ansätze den gesamten Forschungsvorgang prägen.(Positivere Formulierung, eher auf den Output bezogen, der existiert, nicht auf die Probleme)
Über Sprache online neue Konzeptualisierungen von Kommunikation ableiten
Internetlinguistik und Datenverarbeitung
Mit der Entwicklung des Web 3.0 und dem Fortschritt der technischen Verarbeitung und Produktion, ergeben sich Schnittstellen zwischen sprachwissenschaftlichen und technischen Disziplinen in Form von geteilten Methoden, sowie durch Aufgreifen der Erkenntnisse etc. Einerseits betrifft dies den informationstechnischen Umgang mit Sprache, den Bereich der Computerlinguistik. Zudem kann Sprache als Informationsträger betrachtet werden, Sprache enthält dabei Informationen in Form unstrukturierter Daten (BELEG). Der technische Vorgang, Daten aus natürlicher Sprache zu extrahieren nennt sich „Information Extraction“. Der technische Umgang mit Sprache lässt sich unterscheiden in automatisierte Sprachverarbeitung und automatisierte Sprachproduktion.
Automatische Sprachverarbeitung: - Bereich Mensch-Maschine-Interaktion: Aufforderungen wie Suchanfragen etc. (z.B. Siri) sind im Internet übertragene Sprache, ebenso Voraussetzung für semantische Suche - Automatische Informationsextraktion erfolgt aus im Internet vorhandener Sprache, vor allem vorhandenen Dokumenten o Beispiel: Informationsextraktion zur Datenbankererstellung (z.B. Freebase): Webtexte mit computerlinguistischen Methoden analysiert o Beispiel: Automatisiertes Ranking von textuellen Webinhalten ist Arbeit mit im Internet vorhandener Sprache: Unter anderem Knowledge Base Trust: Google bewertet Texte seit 2015 nach Wahrheit : Textverständnis von Webtexten notwendig Dazu: Sprache wird entsprechend der automatischen Verarbeitung gestaltet: SEO • (automatische )Übersetzungsgerechtes Schreiben • Einerseits: IL: Daten nutzbar, andererseits: Sprachveränderung als Forschungsgegenstand (Interessant: Anbieter arbeiten daran, menschliche Sprache besser zu verstehen, Sprachproduzenten daran, Sprache maschinengerecht zu machen ) Automatische Sprachproduktion: - Automatische Sprachproduktion o Automatische Übersetzungen, Pressemeldungen etc.: http://www.slate.com/blogs/future_tense/2014/03/17/quakebot_los_angeles_times_robot_journalist_writes_article_on_la_earthquake.html o Auch in der individuellen Internetkommunikation: Autocomplete – Beispiel wo Ergebnisse der Internetlinguistik eindeutig Einfluss nehmen könnten o Einerseits: Internetlinguistik => Formale Regelhaftigkeiten die festgestellt werden, können – Angewandte Internetlinguistik? o Andererseits: Automatische Sprachprodukte als Gegenstand der Internetlinguistik
o Fragestellung: Eigenschaften dieser Texte, EINFLUSS AUF natürlich Sprache?
o Existenz solcher Produkte evident, automatische Übersetzungen, Nachrichtenseiten, http://en.wikipedia.org/wiki/Waray_Wikipedia
- Unterschiede in der Methodik der Linguistik und der genannten Prozesse: - Während Linguistik konkret um die Sprache, innere Zusammenhänge, auch um soziale Aspekte geht, weshalb auch Einzeläußerungen analysiert werden, der Einfluss auf die Gemeinschaft der Kommunikator/Rezipienten beachtet wird etc.: - Im Bereich Information Extraction/Sprachproduktion: kodierte Information relevant o Quantitativer Einsatz (möglich durch Korpusgröße) o Formal, Strukturalistisch (wenn Sprachinterne Prozesse überhaupt relevant) o Möglicherweise Zukunft: Auch andere Aspekte wie Pragmatik, Informationsstrukturen relevant?
...
Perspektiven/Ausblick
...
Literatur
Beißwenger, M./Storrer, A., 2008. Corpora of Computer-Mediated CommunicaTon. In: A. Lüdeling/M. Kytö̈ (Eds.),Corpus LinguisTcs. An InternaTonal Handbook (pp. 292-308). Berlin /New York: Mouton de Gruyter. Berlin: De Gruyter.
Bubenhofer, N., 2009. Sprachgebrauchsmuster. KorpuslinguisTk als Methode der Diskurs und Kulturanalyse.
Gatto, M., 2014. Web as Corpus. Theory and PracTce. London: Bloomsbury.
Marx, C./Weidacher G., 2014. Internetlinguistik. Ein Lehr- und Arbeitsbuch. Narr Verlag, Tübingen ISBN 978-3-8233-6809-0
Zappavigna, M., 2012. Discourse of Twiser and social Media. How we use language to create affiliaTon on the web. London: Bloomsbury
- ↑ Marx, Konstanze, Weidacher, Georg 2014 Internettextlinguistik
- ↑ Ziegler, Arne (2004): Textstrukturen internetbasierter Kommunikation. Brauchen wir eine Medientextlinguistik? In: Beißwenger, Michael/ Hoffmann, Ludgar/ Storrer, Angelika (Hrsg.). Internetbasierte Kommunikation. Osnabrücker Beiträge zur Sprachtheorie. Duisburg: OBST.
- ↑ Sandig...
- ↑ Marx
- ↑ Rodney, H. Jones (2009): Technology and sites of display. In Carey Jewitt (ed) The Routledge Handbook of Multimodal Analysis...
- ↑ marx