Wikipedia:WikiProjekt KI und Wikipedia
Essentials |
Diskussion |
Handbuch |
Hintergrund |
Texte |
Übersetzung |
Bild/Video/Musik |
QS allgemein |
Interesse |
Richtlinien, Regeln und ihre Weiterentwicklung[Quelltext bearbeiten]Status Quo: Gegenwärtig ist KI nur in einer Richtlinie erwähnt - Wikipedia:Belege (Grundsätzliches, Punkt 8):
Das Projekt erarbeitet unter KI und Wikipedia/Handbuch ein Dokument, welches Hintergründe darstellt und Empfehlungen gibt. Daraus können sich allgemeine Richtlinien entwickeln. |
KI verstehen[Quelltext bearbeiten]Was sollte oder müsste man irgendwann wissen, um das Thema "KI heute" zu verstehen. Nicht alles ist gleich wichtig, nicht alles muss man auf einmal lesen. Mehr dann in „Hintergrund“ und natürlich der zahlreichen anderen Literatur zum Thema. Das Intro soll allgemeinverständlich bleiben, wo bewusst vor allem online zugängliche Informationen enthalten sind (man muss nichts kaufen). Einführungen[Quelltext bearbeiten]![]() ![]() ![]() ![]() ![]() Begriffe und Glossare[Quelltext bearbeiten]Fachbegriffe und ihre Beziehungen korrekt verstehen oder nachschlagen - manche steigen in ein Thema gern über einen Suchbegriff ein:
Einführende Info thematisch[Quelltext bearbeiten]
Generative KI, ihr Woher und Wohin[Quelltext bearbeiten]![]()
Wie es weitergehen kann[Quelltext bearbeiten]Hinter dem "Hype" geht die Entwicklung weiter.
Bücher und Lehrbücher für den ausführlichen Einstieg[Quelltext bearbeiten]Noch ist das Literaturverzeichnis hier, die Literatur explodiert aber aktuell und muss irgendwann anders platziert werden, damit die Auswahl nicht nur bestimmte Bücher präferiert.
|
Probleme[Quelltext bearbeiten]Was macht generative KI problematisch?[Quelltext bearbeiten]![]() → Die heuristische Herangehensweise, kann zu Falschaussagen führen. Man unterscheidet 2 Fehler-Typen, „Halluzination“ und Bias als Verzerrungen (analog zu Kognitive Verzerrung).
→ Für die korrekte Wissensdarstellung (Wikipedia) als begründbare, wahre Überzeugung ist bei generativen KI-Modellen problematisch, dass weder der Wahrheitsgehalt ihrer Aussagen noch ihre Begründetheit ohne externe Prüfung nachvollziehbar ist (siehe Evaluation).
→ Beim Trainingprozess eines generativen KI-Modells wird lediglich eine statistische Analyse der Häufigkeit und Nähe von Wortfragmenten zueinander analysiert. Selbst die Verwendung des Wikipedia-Wissens für das Training von KI bedeutet nicht, dass das Modell automatisch das gesicherte Wissen der Wikipedia deterministisch abrufen und wiedergeben kann. Die Modelle sind daraufhin optimiert, für Menschen überzeugende Ausgaben zu generieren, ein reines Sprachmodell kann von sich aus aber keine logischen Schlüsse ziehen (siehe z.B. Mirzadeh, Iman, et al. 2024.) Hinzu kommt das Problem der Selbstreferenzialität. Wenn der Inhalt z.B. von Wikipedia für das Sprachmodelltraining verwendet wird, pflanzen sich die Fehler als "gesichertes kuratiertes" Wissen fort, wofür Wikipedia immer noch steht. Wie im Cartoon dargestellt (AI Hackathon Oktober 2024) wird das als "Whirlpool" (auch mit Strudel übersetzbar) bezeichnet und die "Verdünnung" kuratierten Wissens würde fortschreiten. Wikipedia ist zwar keine Quelle für Wikipedia, es würde z.B. über Primärquellen einfliessen können, die bei der Erstellung generative KI nutzen und die dann wiederum in Wikipedia zitiert werden können. Strudel scheint daher recht zutreffend. Bias (Verzerrung) und Fairness[Quelltext bearbeiten]entspricht in Analogie den menschlichen Urteilsfehlern, die über die Trainingsdaten und die Entwicklung der KI selber Eingang finden.
Evaluation der Modelle hinsichtlich der Güte/Fehlerfreiheit[Quelltext bearbeiten]Wichtig sind objektive Studien zur Evaluation der generativen KI und der Erkennungsgüte von KI-generierten Inhalten. Wegen der Dynamik sollte man immer die neuesten Daten nehmen.
Vergleiche verschiedener Modelle[Quelltext bearbeiten]
Kritischer Umgang mit KI ist ausreichend?[Quelltext bearbeiten]Die "gesamtgesellschaftliche" Perspektive ist hier zu berücksichtigen, insofern es auch den Umgang mit Wissensinhalten betrifft. Können wir auf den kritischen Autor und Leser verlassen? → Hier bestehen Bedenken, dass ein kritischer Einsatz tatsächlich vorhanden ist und vor allem in jüngeren Generationen scheint man das deutlich gelassener zu sehen.
|
Wikiversum[Quelltext bearbeiten]Wir sind nicht die Enzigen im Wikiversum, die sich mit dem Thema beschäftigen. Zahlreiche Initiativen arbeiten schon länger an diesem Thema, haben die Tragweite erkannt und erarbeiten Konzepte, wie man den Herausforderungen begegnen kann. Die Wikimedia-Foundation hat eine Strategie 2025 bis 2028 vorgelegt, die jährlich angepasst werden soll und darauf hinausläuft, dass die Wisssenskuratierung durch menschliche Autoren als Stärke der Wikipedia erhalten bleibt, KI als Werkzeug zur Effizienzsteigerung der Arbeit aber besser erschlossen wird. Einschätzungen der Lage[Quelltext bearbeiten]
Initiativen zu KI[Quelltext bearbeiten]Erfahrungsaustausch scheint wichtig auch weil wir hier vielleicht diesen Einfluss noch nicht so deutlich spüren wie andere, etwa die englischsprachige Wikipedia.
AI Cleanup (englischsprachige WP)[Quelltext bearbeiten]Systematische Suche und Behandlung KI-erstellter Texte sowie Hinweise an die erstellenden Autoren, rund 100 Mitarbeiter, Erarbeitung von Kriterien zur Identifikaton und einheitliche Hinweise, Benutzeransprachen und Wartungskategorien:
Wie verbreitet ist KI bereits in Wikipedia?[Quelltext bearbeiten]![]()
Auf dem Weg zum richtigen Umgang mit KI in Wikipedia[Quelltext bearbeiten]In einer Chronik des Projektes hat diese Umfrage einen herausragenden Platz, die Initative von Karsten11 hat verbunden mit der Fortführung der Diskussion in seinem BNR und durch den Impuls des Zukunftskongresses zur Gründung des Projektes geführt. Es hat auch früher und anderswo Stimmen und Veranstaltungen zu diesem Thema gegeben, die nicht vergessen werden sollten. Sie können nun im Projekt sichtbarer dokumentiert und eingeordnet werden. ![]() Umfrage (nicht verbindlich)[Quelltext bearbeiten]
Regelsuche in Schwesterprojekten[Quelltext bearbeiten]
Rechtsfragen Wikiversum[Quelltext bearbeiten]siehe auch: Rechtsfragen und Rechtsstreit auf Hintergründe
|
Tools und Tipps[Quelltext bearbeiten]Die Auswahl erfolgt aufgrund des recherchierten Wissensstandes mit dem Ziel, wichtige Tools aufzulisten, mit denen man Erfahrungen sammeln kann - ohne Bevorzugung Einzelner. Noch ein paar Fachterme:
ACHTUNG: Fehler (Halluzinationen) können auch bei Recherchen bzw. dem Einsatz als Hilfsmittel auftreten. Einige Tools sind kostenpflichtig in den neuesten und nicht nutzungsbegrenzten Versionen. In dieser Tabelle sieht man, dass bei geeigneter Auswahl auf die neusten Modelle kostenfrei zurückgegriffen werden kann, wenn die dort genutzten Quellen stimmen. Spezifische Tools für Bilder/Video und Musik stehen nicht hier, ggf. auf den Themenseiten. KI-basierte Chatbots (generative KI)[Quelltext bearbeiten]Einzelne Chatbots nutzen gleiche oder unterschiedliche Large Language Models (LLM), siehe Tabelle auf "Hintergründe" ganz unten. Die Zahl der Chatbots nimmt aktuell zu, die Übersicht wird schwerer. Textbasierte sind Schwerpunkt der Auswahl. Einige davon können nicht nur Texte erzeugen, sondern auch Medien (Bilder). Einige greifen neben den "gelernten" Inhalten auch aktuell auf das Internet zurück und bereiten Echtzeitdaten mit in ihren Antworten mit auf.[1] Von den meisten gibt es auch Apps. Wenn man genau liest, kommt man auch zu einer kostenfreien Version - entweder mit begrenzten Aufrufen in einem Zeitraum oder nicht mit dem vollen Funktionsumfang. Anmeldung ist oft notwendig oder sinnvoll, um die Ergebisse zu speichern), es wird eine E-Mail-Adresse verlangt, die bestätigt werden muss.
Siehe auch: Hintergrundinformation zu generativen Chatbots Tools mit Schwerpunkt Bildgenerierung[Quelltext bearbeiten]
Plattformen für "text to image", spezialisiert oder in andere Plattformen integriert, die auch die wichtigsten Modelle entwickelt haben.
Voicebots (Sprachbots)[Quelltext bearbeiten]als Sprachassistenten, die in gesprochener Sprache interagieren und KI verwenden. Allgemein sind z.B. verwendbar:
Darüber hinaus setzen viele Unternehmen, besonders in den Bereichen Kundenservice, Finanzdienstleistungen und E-Commerce, zunehmend auf Voicebots in ihren Telefonhotlines. Diese sind zwar nicht allgemein aufrufbar, aber für Kunden dieser Unternehmen zugänglich.
Tools zum Umschreiben, Vereinfachen, Zusammenfassen und Korrigieren von Text[Quelltext bearbeiten]Hier kann man prüfen, ob diese Verbesserungen durch KI zu falschpositiven Ergebnissen in den Erkennungstools führen, weil bestimmte Formulierungen als typisch für KI angesehen werden. Ein kuratierter Ausgangs-Text kann auch sinnentstellend verändert werden, er muss daher genau geprüft werden.
Siehe auch: Hintergrundinformation zu KI als Hilfsmittel Tools für die Übersetzung[Quelltext bearbeiten]Eine genaue Überprüfung ist notwendig, wird als en:Postediting bezeichnet. Siehe auch: Hintergrundinformation Übersetzungstools Einsatz von Modellen auf einem lokalen Rechner[Quelltext bearbeiten]Eine Reihe von Modellen steht auf Plattformen wie Hugging Face zu bestimmten Bedingungen (analog zu Freeware) zum Download zur Verfügung. Sie können mit passenden Werkzeugen damit lokal auf dem eigenen Rechner ausgeführt und getestet werden.
Tools für das Erkennen KI-generierter Inhalte[Quelltext bearbeiten]Einige Tools kann man hinsichtlich der Sensibilität einstellen.
... ---
Tools und Tipps zum Umgehen der Erkennung als KI-generiert[Quelltext bearbeiten]Das Problem der KI-Nutzung haben viele Bereiche, einfache Plagiate waren gestern. Alle Prüfungs- und Qualifizierungsarbeiten können betroffen sein, wenn diese nicht mehr ausreichend den eigenen Kenntnisstand repräsentieren, sondern von KI (mit)geschrieben wurden. Es gibt zahlreiche Tools und Tipps, diese Erkennung zu verhindern. Sie sind für Wikipedia insofern auch relevant, dass sie die Erkennbarkeit als KI-generiert beeinträchtigen.
... |
Anmerkungen
[Quelltext bearbeiten]- ↑ Bobachtung: Der neue Artikel Günter Trost von mir brauchte eine Woche, ehe er in den Google-Suchergebissen erschien. Nachfragen in diversen Chatbots, ob es in der Wikipedia zu ihm einen Artikel gibt, wurden verneint und auch die Info von dort wurden nicht verwendet (aber andere aus dem Internet, die schon länger drin sind und auch durch "Training" reingekommen sein könnten). Am gleichen Tag an dem es in Google Search erschien, kannte auch Perplexity den und fasst den perfekt zusammen. Gibt es da "Wechselbeziehungen"? Wo
Medien wie Bilder, Grafiken, Videos und Soundbeispiele und andere stammen aus Wikimedia:Commons, wenn nichts anderes angegeben ist. Die Autoren und Lizenzbedingungen sind ersichtlich, wenn man das Medium anclickt (vergrössert) und dann "Weitere Einzelheiten" aufruft. Die Lizenzbedingungen sind insbesondere dann zu beachten, wenn eine Verwendung ausserhalb der Wikipedia erfolgen soll.
Zitate sind kursiv dargestellt, "→" kennzeichnet redaktionelle Zusammenfassungen