Zum Inhalt springen

Datei:Zipf-code-1 English plain, book-coded, Vigenere coded.svg

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
Zur Beschreibungsseite auf Commons
aus Wikipedia, der freien Enzyklopädie

Originaldatei (SVG-Datei, Basisgröße: 512 × 504 Pixel, Dateigröße: 2,54 MB)

Diese Datei und die Informationen unter dem roten Trennstrich werden aus dem zentralen Medienarchiv Wikimedia Commons eingebunden.

Zur Beschreibungsseite auf Commons


Beschreibung

Beschreibung
English: Zipf law plot (frequency as function of frequency rank) for three versions of the same English text in different encodings.

The original text is H. G. Wells's novel The War of the Worlds (1898), excluding numbers, mapped to lowercase.

The three versions and the respective word frequency files are:

  • Plain (unencoded) text. Sample: no one would have believed in the last years of the nineteenth century [...] there were already a couple of score of passengers aboard some of. File engl/wow/tot.1/gud.wfr (original 60293 words, truncated/filtered to 35027 words, N = 4869 distinct).

English, Text of H. G. Wells's novel The War of the Worlds (1898), mapped to lowercase, excluding numbers.

  • The same text encoded with a 'book code'; specifically, with each distinct word replaced by a different Roman numeral, assigned in order of decreasing frequency. For example, 'that' ⟶ 'xiii', 'his' ⟶ 'lxiv'. The letter 'p' is used as a Roman 'digit' with value 5000. Sample: ccv lii clxix cxxix mdcxxvi xxiv xx dccxii mcmxlix i xx mmmdccclxxxiii [...] mdccclxiii mmmciv cccxxii i. File enrc/wow/tot.1/gud.wfr (original 60293 words, truncated/filtered to 35027 words, N = 4869 distinct).
  • The same text encrypted with a Vigenère cypher with a 27-character alphabet (letters plus apostrophe), preserving spaces, with key 'ferrocyanide'. For example, 'no one would have believed ...' ⟶ 'ss eds yluyl ke'i svzkbvrl ...'. Sample: ss eds yluyl ke'i svzkbvrl lr ylv bouq yriuw tj jys pfnrahisxy tspqudf [...] tumui aihv onoenla e hskfzg lf ekrvj sw foupe'ohvx eseota sauh sk. File envg/wow/tot.1/gud.wfr (original 60293 words, truncated/filtered to 35027 words, N = 12911 distinct).
The word frequency files '*/*/*/gud.wfr' are available at the UNICAMP website. The original annotated full texts, before truncation/filtering, are in the companion files */*/org/main.src. The truncated/filtered texts -- one word per line, without punctuation -- are in */*/*/gud.tlw.
Datum
Quelle Eigenes Werk
Urheber Jorge Stolfi

Lizenz

Ich, der Urheber dieses Werkes, veröffentliche es unter der folgenden Lizenz:
w:de:Creative Commons
Namensnennung Weitergabe unter gleichen Bedingungen
Dieses Werk darf von dir
  • verbreitet werden – vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden
  • neu zusammengestellt werden – abgewandelt und bearbeitet werden
Zu den folgenden Bedingungen:
  • Namensnennung – Du musst angemessene Urheber- und Rechteangaben machen, einen Link zur Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Diese Angaben dürfen in jeder angemessenen Art und Weise gemacht werden, allerdings nicht so, dass der Eindruck entsteht, der Lizenzgeber unterstütze gerade dich oder deine Nutzung besonders.
  • Weitergabe unter gleichen Bedingungen – Wenn du das Material wiedermischst, transformierst oder darauf aufbaust, musst du deine Beiträge unter der gleichen oder einer kompatiblen Lizenz wie das Original verbreiten.

Kurzbeschreibungen

Ergänze eine einzeilige Erklärung, was diese Datei darstellt.
Zipf plot for three version of English: plain , book-coded, and Vigenere coded

In dieser Datei abgebildete Objekte

Motiv

image/svg+xml

Dateiversionen

Klicke auf einen Zeitpunkt, um diese Version zu laden.

Version vomVorschaubildMaßeBenutzerKommentar
aktuell02:58, 16. Mai 2023Vorschaubild der Version vom 02:58, 16. Mai 2023512 × 504 (2,54 MB)Jorge StolfiUploaded own work with UploadWizard

Keine Seiten verwenden diese Datei.

Globale Dateiverwendung

Die nachfolgenden anderen Wikis verwenden diese Datei:

Metadaten