Zum Inhalt springen

„GPTZero“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Mechanismus übersetzt
Mechanismus übersetzt
Zeile 8: Zeile 8:


== Mechanismus ==
== Mechanismus ==
GPTZero arbeitet mit zwei Eigenschaften eines Textes, um zu erfassen, ob dieser von einer künstlichen Intelligenz verfasst wurde. Die erste Eigenschaft ist die „Perplexität“, es ist ein Maß, wie zufällig oder wie vertraut ein Text für ein Sprachmodell ist. D.h. ob die Art und Weise, wie der Satz aufgebaut ist, für ein Sprachmodell typisch oder eher ungewöhnlich ist.<ref name=":5">{{Internetquelle |autor=Erik Ofgang published |url=https://www.techlearning.com/news/what-is-gptzero-the-chatgpt-detection-tool-explained |titel=What is GPTZero? The ChatGPT Detection Tool Explained By Its Creator |datum=2023-01-27 |sprache=en |abruf=2024-12-07}}</ref> Die KI stützt sich auf Sprachmodelle, und je mehr solcher Modelle im Text vorhanden sind, desto größer ist die Wahrscheinlichkeit, dass der Text nicht von einem Menschen verfasst wurde.
GPTZero arbeitet mit zwei Eigenschaften eines Textes, um zu erfassen, ob dieser von einer künstlichen Intelligenz verfasst wurde. Die erste Eigenschaft ist die „Perplexität“ (deutsch: Unsicherheit), es ist ein Maß, wie zufällig oder wie vertraut ein Text für ein Sprachmodell ist. D.h. ob die Art und Weise, wie der Satz aufgebaut ist, für ein Sprachmodell typisch oder eher ungewöhnlich ist.<ref name=":5">{{Internetquelle |autor=Erik Ofgang published |url=https://www.techlearning.com/news/what-is-gptzero-the-chatgpt-detection-tool-explained |titel=What is GPTZero? The ChatGPT Detection Tool Explained By Its Creator |datum=2023-01-27 |sprache=en |abruf=2024-12-07}}</ref> Die KI stützt sich auf Sprachmodelle, und je mehr solcher Modelle im Text vorhanden sind, desto größer ist die Wahrscheinlichkeit, dass der Text nicht von einem Menschen verfasst wurde.


Die zweite Eigenschaft eines Textes nennt das Unternehmen „Burstiness“ (deutsch: Zerreißfaktor) und bezieht sich auf die Komplexität von Sätzen. Menschen neigen dazu, die Satzlänge zu variieren, mal lange Sätze, dann wieder sehr kurze Sätze zu schreiben. Ein maschineller Aufsatz hat eine konstante Basis.<ref name=":5" />
Die zweite Eigenschaft eines Textes nennt das Unternehmen „Burstiness“ (deutsch: Zerreißfaktor) und bezieht sich auf die Komplexität von Sätzen. Menschen neigen dazu, die Satzlänge zu variieren, mal lange Sätze, dann wieder sehr kurze Sätze zu schreiben. Ein maschineller Aufsatz hat eine konstante Basis.<ref name=":5" />

Neben der Überprüfung von Texten, die direkt von KI Werkzeugen kopiert wurden, ist das Tool auch in der Lage, die Teile eines Textes zu erkennen und hervorzuheben, die von einem Sprachmodell wie ChatGPT geschrieben oder umformuliert wurden. Nach GPTZero können mehrere Dateien zusammen hochgeladen werden, um eine effektive und schnelle Überprüfung von unterschiedlichen Texten sicherzustellen. Damit können Lehrer z.B. schnell die Arbeiten einer ganzen Klasse überprüfen.<ref>{{Internetquelle |autor=Kamya Pandey |url=https://www.jumpstartmag.com/ai-detector-for-educators-what-is-gptzero/ |titel=AI Detector for Educators: What is GPTZero? |werk=JumpStart Magazine: Your Digital & Print Community Hub |datum=2023-03-02 |sprache=en-US |abruf=2024-12-07}}</ref>


==Mechanism==
==Mechanism==

Version vom 7. Dezember 2024, 15:31 Uhr

Dieser Importartikel ist fälschlicherweise im Artikelnamensraum. Bitte verschiebe die Seite oder entferne diesen Baustein.
Dieser Artikel (GPTZero) ist im Entstehen begriffen und noch nicht Bestandteil der freien Enzyklopädie Wikipedia.
Wenn du dies liest:
  • Der Text kann teilweise in einer Fremdsprache verfasst, unvollständig sein oder noch ungeprüfte Aussagen enthalten.
  • Wenn du Fragen zum Thema hast, nimm am besten Kontakt mit den Autoren auf.
Wenn du diesen Artikel überarbeitest:
  • Bitte denke daran, die Angaben im Artikel durch geeignete Quellen zu belegen und zu prüfen, ob er auch anderweitig den Richtlinien der Wikipedia entspricht (siehe Wikipedia:Artikel).
  • Nach erfolgter Übersetzung kannst du diese Vorlage entfernen und den Artikel in den Artikelnamensraum verschieben. Die entstehende Weiterleitung kannst du schnelllöschen lassen.
  • Importe inaktiver Accounts, die länger als drei Monate völlig unbearbeitet sind, werden gelöscht.

GPTZero ist eine Software, die Texte identifizieren kann, die von Sprachmodellen der künstlichen Intelligenz erzeugt wurden. Der primäre Fokus der Hersteller von GPTZero ist, Texte, die mit KI erstellt wurden, identifizieren zu können.[1] Während GPTZero für seine Bemühungen akademische Unehrlichkeit zu verhindern, gelobt wurde, wird auf der anderen Seite auch die Falsch-Positiv-Rate des Tools kritisiert[2]. GPTZero ist das erfolgreichste Tool, das das meiste Kapital einsammeln konnte.[3]

Geschichte

GPTZero wurde von Edward Tian, einem Studenten der Princeton Universität entwickelt, um akademischen Plagiaten, die mit KI erstellt wurden, auf die Spur zu kommen. Die Software wurde im Januar 2023 online gestellt und bereits in der ersten Woche 30.000 Mal genutzt.[4] Aufgrund des großen Erfolgs gründete Tian zusammen mit Alex Cui ein Start-up, das bereits 3,5 Mio. Startkapital im Mai 2023 eingeworben hatte.[5] In den ersten sieben Monaten hatte das Unternehmen bereits 12 Mitarbeiter.[4] Im Juli 2024 hatte GPTZero bereits 4 Mil. Nutzer und sammelte 10 Mil. $ von Investoren ein.[3]

GPTZero bietet bereits ein KI-Klassifizierungsmodell an, das Unternehmen kündigte aber im September 2024 an, ein weit umfassenderes Tool zur Überwachung des Schreibprozesses zu entwickeln. Die Nutzer der neuen Autorenplattform von GPTZero können Daten über ihren Schreibprozess zusammenstellen und weitergeben, also z.B. den Verlauf des Einfügens von Text, die Anzahl der Autoren oder die Dauer der Bearbeitung. Damit kann das Tool den Entstehungsprozess überwachen und aufzeichnen, das später von Dritten überprüft werden kann.[6]

Mechanismus

GPTZero arbeitet mit zwei Eigenschaften eines Textes, um zu erfassen, ob dieser von einer künstlichen Intelligenz verfasst wurde. Die erste Eigenschaft ist die „Perplexität“ (deutsch: Unsicherheit), es ist ein Maß, wie zufällig oder wie vertraut ein Text für ein Sprachmodell ist. D.h. ob die Art und Weise, wie der Satz aufgebaut ist, für ein Sprachmodell typisch oder eher ungewöhnlich ist.[7] Die KI stützt sich auf Sprachmodelle, und je mehr solcher Modelle im Text vorhanden sind, desto größer ist die Wahrscheinlichkeit, dass der Text nicht von einem Menschen verfasst wurde.

Die zweite Eigenschaft eines Textes nennt das Unternehmen „Burstiness“ (deutsch: Zerreißfaktor) und bezieht sich auf die Komplexität von Sätzen. Menschen neigen dazu, die Satzlänge zu variieren, mal lange Sätze, dann wieder sehr kurze Sätze zu schreiben. Ein maschineller Aufsatz hat eine konstante Basis.[7]

Neben der Überprüfung von Texten, die direkt von KI Werkzeugen kopiert wurden, ist das Tool auch in der Lage, die Teile eines Textes zu erkennen und hervorzuheben, die von einem Sprachmodell wie ChatGPT geschrieben oder umformuliert wurden. Nach GPTZero können mehrere Dateien zusammen hochgeladen werden, um eine effektive und schnelle Überprüfung von unterschiedlichen Texten sicherzustellen. Damit können Lehrer z.B. schnell die Arbeiten einer ganzen Klasse überprüfen.[8]

Mechanism

GPTZero uses qualities it terms perplexity and burstiness to attempt determining if a passage was written by a AI.[9] According to the company, perplexity is how random the text in the sentence is, and whether the way the sentence is constructed is unusual or "surprising" for the application. It relies on language models, and the more such models, the higher the chance that a person did not write the text.[10] In contrast, burstiness compares sentences with each other, determining their similarity. Human text is more discontinuous, meaning humans tend to write with more sentence variation than AI.[11]

Use cases

The academic community has attempted using GPTZero to tackle concerns about AI-generated content for plagiarism.[12][10][9] Educational institutions, including Princeton University, have discussed the use of GPTZero to combat AI-generated content in academic settings, with mixed opinions.[11][13] In October 2023, GPTZero had partnered with the American Federation of Teachers.[14]

By 2024, Tian reported that GPTZero also "received a lot of adoption with hiring managers, with recruiting [and] cover letter analysis."[15]

Efficacy

In a March 2023 paper named "Can AI-Generated Text be Reliably Detected?",[16] computer scientists Vinu Sankar Sadasivan, Aounon Kumar, Sriram Balasubramanian, Wenxiao Wang, and Soheil Feizi from the University of Maryland demonstrate empirically and theoretically that several AI-text detectors are not reliable in practical scenarios.[17][18]

Tech website Futurism tested the tool, and said that while the "results are impressive", based on its error rate, teachers relying on the tool would end up "falsely accusing nearly 20 percent of [innocent students] of academic misconduct".[19]

The Washington Post noted in August 2023 that GPTZero suffers from false positives, emphasizing that "even a small 'false positive' error rate means that some students could be wrongly accused [of academic misconduct]".[2]

News website Ars Technica commented that humans can still write sentences in a highly regular way, leading to false positives. The writer, Benj Edwards, went on to state that the perplexity score only concerns itself with what is "surprising" for the AI, leading to instances where highly common texts, such as the US Constitution, are labeled as likely AI-generated.[20]

Siehe auch

Einzelnachweise

  1. American Federation of Teachers partners with AI identification platform, GPTZero. In: CBS News. 17. Oktober 2023, abgerufen am 21. Oktober 2023 (amerikanisches Englisch).
  2. a b Geoffrey Fowler: What to do when you're accused of AI cheating In: The Washington Post, August 14, 2023. Abgerufen im October 20, 2023 
  3. a b AI Detectors Falsely Accuse Students of Cheating—With Big Consequences. In: Bloomberg.com. 18. Oktober 2024 (bloomberg.com [abgerufen am 7. Dezember 2024]).
  4. a b Madeline Renbarger: How a 23-year-old college student built one of the leading AI detection tools. Abgerufen am 6. Dezember 2024 (amerikanisches Englisch).
  5. Chris Stokel-Walker: This AI detection tool raised 3,5 mio $ to check the internet for computer-generated work. In: Fast Company. 5. August 2023, abgerufen am 7. Dezember 2024 (englisch).
  6. Brian Contreras: How can you detected AI-generated Text? This Startup has some compelling Ideas. 18. September 2024, abgerufen am 7. Dezember 2024 (englisch).
  7. a b Erik Ofgang published: What is GPTZero? The ChatGPT Detection Tool Explained By Its Creator. 27. Januar 2023, abgerufen am 7. Dezember 2024 (englisch).
  8. Kamya Pandey: AI Detector for Educators: What is GPTZero? In: JumpStart Magazine: Your Digital & Print Community Hub. 2. März 2023, abgerufen am 7. Dezember 2024 (amerikanisches Englisch).
  9. a b What is GPTZERO? The ChatGPT Detection Tool Explained. In: Tech Learning. 27. Januar 2023;.
  10. a b AI Detector for Educators: What is GPTZERO? In: Jumpstart Magazine. 2. März 2023;.
  11. a b Edward Tian's GPTZERO Software Aims to Detect AI-Generated Plagiarism. In: The Daily Princetonian.
  12. Tribune.com.pk: GPTZero: A ChatGPT Detection Tool. In: The Express Tribune. 22. Februar 2023;.
  13. GPTZero to help teachers deal with ChatGPT-generated student essays. 12. Januar 2023, abgerufen am 21. September 2023.
  14. US Teachers Union Bans ChatGPT and Deploys GPTZero To Detect Cheating. In: MobileAppAaily. Abgerufen am 21. Oktober 2023 (englisch).
  15. https://www.inc.com/brian-contreras/how-can-you-detect-ai-generated-text-this-startup-has-some-compelling-ideas.html
  16. Vorlage:Cite arXiv
  17. Vorlage:Cite magazine
  18. No reliable way to detect AI-generated text, boffins sigh. 21. März 2023, abgerufen am 25. September 2023.
  19. There's a Problem With That App That Detects GPT-Written Text: It's Not Very Accurate. In: Futurism. 9. Januar 2023, abgerufen am 21. Oktober 2023.
  20. Benj Edwards: Why AI detectors think the US Constitution was written by AI. In: Ars Technica. 14. Juli 2023, abgerufen am 14. Dezember 2023 (amerikanisches Englisch).

[[Category:Internet properties established in 2023]] [[Category:Large language models]] [[Category:Applications of artificial intelligence]]