Zum Inhalt springen

„Breidbart-Index“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Weede (Diskussion | Beiträge)
Überflüssigen Passus zur Verwechslung von UBE mit Spam komplett gelöscht.
Keine Bearbeitungszusammenfassung
 
(94 dazwischenliegende Versionen von 30 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
Der nach seinem Erfinder, [[Seth Breidbart]], benannte '''Breidbart-Index''' ist der bedeutendste ''Cancel-Index'' im [[Usenet]].
Der '''Breidbart'''-Index (kurz: der '''BI''') ist ein Begriff aus dem [[Usenet]]. Es handelt sich um eine Zahl, die definiert, wie intensiv substanziell gleiche Inhalte oder Werbung für denselben Service mit vielen Exemplaren bzw. in vielen Newsgroups verbreitet wurden. Wenn ein erlaubter Wert überschritten wird, bezeichnet man die betreffenden Usenet-Artikel als [[Spam]].


Mit einem ''Cancel-Index'' wird die Verbreitungsintensität wesensgleicher Artikel bestimmt. Überschreitet der [[Kennzahl|Index]] einen Grenzwert, so bezeichnet man die betreffenden Artikel als [[Spam]]. Sie dürfen dann durch [[Fremdcancel]] entfernt werden.
Die Berechnung des Breidbart-Index ist scheinbar so kompliziert, weil es mehrere Möglichkeiten gibt, dasselbe in mehrere Newsgroups zu posten:
# entweder mit einem Exemplar und einer mit Kommata verketteten Liste von Newsgroups anstelle des Newsgroup-Namens,
# oder mit mehreren Exemplaren in nur je einer Newsgroup,
# oder mit einer Mischform von beidem.


== Cancel-Index ==
Der Breidbart-Index versucht zu berücksichtigen, dass die erste Variante nicht so schlimmen Ressourcendiebstahl darstellt wie die zweite. Zum Breitbart-Index trägt jedes Exemplar die [[Quadratwurzel]] aus der Anzahl der Newsgroups bei, in die dieses eine Exemplar gepostet wurde. Die Summe dieser Beiträge nennt man Breidbart-Index.
* [[Crossposting]] ist das Versenden eines Artikels in mehrere Gruppen.
* [[Multiposting]] ist das mehrfache Versenden desselben Inhalts.


Die grundlegende Idee des ''Breidbart-Index'' besteht darin, diese Methoden unterschiedlich zu bewerten.<ref>[http://groups.google.com/group/news.admin.misc/msg/6e7f15c048a71019 &lt;news:36i6hk$3li&gt;]</ref> Zum einen müssen bei ''Crossposts'' weniger Daten übertragen und gespeichert werden. Zum anderen sind exzessive ''Crossposts'' (ECP) ein plausibler Anfängerfehler, während exzessive ''Multiposts'' (EMP) auf vorsätzlichen Einsatz spezieller Software schließen lässt.
Dabei ist es von Bedeutung, innerhalb welches Zeitraums die Artikel gepostet wurden. Wenn es nicht anders geregelt ist, wird alles mitgezählt, was innerhalb von 45 Tagen gepostet wurde. Davon abweichend gibt es im deutschsprachigen Usenet den Begriff '''BI7''' mit einem Zeitraum von 7 Tagen.


Entscheidend ist die Erfassung verschiedener Artikel als wesensgleich (im englischen Original: ''substantively identical'').
Nach allgemeiner Übereinkunft darf netzweit, in keiner Newsgroup, der Breidbart-Index einen Wert von
Dies umfasst unter anderem:
* [[Byte]] für Byte identische Nachrichten;
* an sich identische Nachrichten, die sich nur in geringen Anpassungen an die Gruppe unterscheiden;
* Nachrichten, die dasselbe Produkt, Dienstleistung oder Website bewerben;
* Nachrichten, die aus der gleichen Signatur (und sonst nichts) bestehen;
* Nachrichten, die sich nur durch den zitierten Text unterscheiden.


== Breidbart-Index (BI) ==
: 20 innerhalb von 45 Tagen
Der BI einer Menge von Artikeln ist die Summe der [[Quadratwurzel]]n von ''n'', wobei ''n'' die Anzahl der [[Newsgroup]]s ist, in die jeder einzelne Artikel gepostet wurde. Bewertet wird dabei eine Serie von ''m'' wesensgleichen Artikeln innerhalb eines Zeitraums von 45 Tagen. Das heißt, Postings älter als 45 Tage zählen nicht zur Serie.<ref name="thresholds" />


; Formel
überschreiten. Anderenfalls handelt es sich um Spam, und es ist erwünscht, dass Dritte ihn [[canceln]]. Das Fremd[[canceln]] muss sich an sehr strenge formale Regeln halten, erfordert Erfahrung, und Fehler können dabei viel "böses Blut" provozieren.
<math>\mbox{BI} = \sum_{k=1}^m \sqrt{n_k}</math>


; Beispiel
In manchen Teil-Hierarchien, z.B. in den Newsgroups de.*, gelten noch schärfere Beschränkungen auf der Basis eines Mehrheitsentscheids (Abstimmung per E-Mail).
Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.


<math>\sqrt{9} + \sqrt{16} = 3 + 4 = 7</math>
Der Breidbart-Index ist nach seinem Erfinder '''Steth Breidbart''' benannt.


== Version 2 des Breidbart-Index (BI2) ==
Historisch gesehen war der allererste Spam, der netzweit unangenehm auffiel und der dazu zwang, ihn zu [[canceln]], Mitte der 90er eine in extrem viele Newsgroups gespamte Werbekampagne des Rechtsanwaltsbüros '''Canter & Siegel''' (USA), worin damit geworben wurde, bei der Teilnahme an der Verlosung von [[Greencard (USA)|Greencard]]s behilflich zu sein.
Der BI2 ist definiert als Summe der Quadratwurzeln von ''n'', plus der Summe von ''n'', geteilt durch zwei.<ref name="thresholds" />
Der BI2 ist aggressiver als der BI. Ein Crosspost in 35 Gruppen reicht, damit eine einzelne Nachricht den Grenzwert von 20 übertritt.


; Formel
In den deutschsprachigen Newsgroups war - historisch gesehen - das bemerkenswerteste Spam-Problem bis Anfang 2004 ein streitbarer, gerichts- und strafanzeigefreudiger Herr aus München mit der felsenfesten Überzeugung, die damalige Newsgroup ''de.etc.finanz.boerse.misc'' sei sein persönliches Eigentum und dem Zweck vorbehalten, für seine angeblich gut funktionierenden Verfahren zur Vorausberechnung von Roulette-Ergebnissen zu werben, was er dann auch mehrmals täglich mit viel Eigenlob und fingierten Fan-Emails tat.
<math>\mbox{BI2} = \sum_{k=1}^m \frac{n_k + \sqrt{n_k}}{2}</math>


; Beispiel
==Weblinks==
Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.


<math>\frac{\sqrt{9} + \sqrt{16} + 9 + 16}{2} =
*[http://www.uiuc.edu/ph/www/tskirvin/faqs/cancel.faq Current Spam thresholds and guidelines] von Tim Skirvin.
\frac{3 + 4 + 9 + 16}{2} = \frac{32}{2} = 16</math>


== Skirvin-Breidbart-Index (SBI, BI3) ==
*[http://home.snafu.de/hweede/debi.txt Mehrheitsentscheid (Abstimmungsergebnis) über das Canceln von Spam in de.*]
Die Bezeichnungen ''Skirvin-Breidbart-Index'' und SBI finden sich im
''Spam Thresholds FAQ''.<ref name="thresholds" /> In der Hierarchie nl.*
wird dieser Index aber BI3 genannt.<ref name="nl.faq" />

Der SBI wird wie der BI2 berechnet, summiert aber die Anzahl der Gruppen
in <span style="font-family:monospace;">Followup-to:</span> (wenn vorhanden) statt der Anzahl der Gruppen
in <span style="font-family:monospace;">Newsgroups:</span>. Dadurch wird das Setzen eines Followup-to: belohnt.

; Beispiel
Zwei Postings enthalten denselben Text.
Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16 mit vier Gruppen im Followup-to:

<math>\frac{\sqrt{9} + \sqrt{16} + 9 + 4}{2} =
\frac{3 + 4 + 9 + 4}{2} = \frac{20}{2} = 10</math>

== BI7 und BI30 ==
In der [[Usenet-Hierarchie de.*]] gilt der ''Breidbart-Index'' mit einem
Zeitfenster von 7 Tagen statt 45. Dafür hat sich die Abkürzung ''BI7''
eingebürgert.<ref name="de.result" />

In der Hierarchie <code>hamster.de.*</code> gilt der ''Breidbart-Index'' mit einem
Zeitfenster von 30 Tagen statt 45. Dafür hat sich die Abkürzung ''BI30''
eingebürgert.<ref name="hamster.de.faq" />

== Cancel-Index in at.* ==
Ist im FAQ<ref name="at.sciat">[http://www.pfeifer.com/gerald/spam/FAQ.html Spam Cancel in at.* (FAQ)]</ref>
der Gruppe at.usenet.cancel-reports definiert.
Im Wahlaufruf (''CfV'')<ref name="at.cfv">[http://groups.google.at/group/at.usenet.announce/msg/5c062d8beec52a92 &lt;news:CfV$1$at.usenet.cancel-reports$3&gt;]</ref>
und im FAQ wird nur die Bezeichnung Cancel-Index verwendet.
Inoffizielle Abkürzungen sind ''CI'' und ''ACI''.

Der ACI eines einzelnen Postings berechnet sich als 3 plus Anzahl der Gruppen, an die dieses Posting geschickt wurde. Der Index
mehrerer Postings ist die Summe der Indizes der einzelnen Postings.

== Grenzwerte ==
* Laut <nowiki>RFC&nbsp;1036</nowiki><ref>{{RFC-Internet |RFC=1036 |Titel=Standard for Interchange of USENET Messages |Datum=1987-12}}</ref> darf ein Artikel nur vom Autor oder dem Administrator des Servers, auf dem der Artikel ins Usenet eingespeist wurde, gecancelt werden.
* Laut dem Spam Thresholds FAQ<ref name="thresholds">[http://wiki.killfile.org/projects/usenet/faqs/spam/ Spam Thresholds FAQ]</ref> gilt im gesamten Usenet ein Breidbart-Index von 20, d.&nbsp;h. Artikelserien, die über diesem Wert liegen, dürfen von jedermann per [[Fremdcancel]] entfernt werden.
* In einigen Hierarchien wurden alternative (strengere) Grenzwerte durch eine Abstimmung festgelegt.
* In der Hierarchie free.* sind alle Arten von Cancel verboten.<ref>[http://wiki.killfile.org/projects/usenet/faqs/free/ free.* FAQ.] killfile.org</ref>

Tatsächlich ist eine Cancel-Message nur eine durch Software automatisch
auswertbare Bitte, einen bestimmten Artikel zu löschen. Betreiber von
[[Newsserver]]n dürfen frei entscheiden, wie sie die widersprüchlichen
Richtlinien umsetzen.<ref>[http://wiki.killfile.org/projects/usenet/faqs/cancel/ Cancel Messages: Frequently Asked Questions.] killfile.org</ref>

{| class="wikitable"
|-
! Hierarchie
! Cancel-Index
! Zeitfenster
! Grenzwert
! Berichte
! Festlegung
|-
| *
| BI
| 45
| 20
| news.admin.net-abuse.bulletins
|<ref name="thresholds" />
|-
| at.*
| ACI
| 45
| 11
| at.usenet.cancel-reports
|<ref name="at.cfv" /><ref name="at.result">[http://groups.google.at/group/at.usenet.announce/msg/5c062d8beec52a92 &lt;news:Result-festlegung-bi-06-05-1999&gt;]</ref>
|-
| at.anzeigen.*
| ACI
| 14
| 4
| at.usenet.cancel-reports
|<ref>[http://groups.google.at/group/at.anzeigen.sonstiges/msg/85adfd5d1ff9287b &lt;news:938889391/18913&gt;]</ref><ref>[http://groups.google.at/group/at.usenet.announce/msg/d58b457106d043ba &lt;news:RESULT-Entfernung_von_at.anzeigen.computer.haendler-03.10.1999&gt;]</ref>
|-
| bln.*
| BI
| 45
| 3
|
|<ref name="de.markt.arbeit.faq">[http://home.snafu.de/hweede/dma.htm Die Jobbörse in den Newsgroups: de.markt.arbeit.*]</ref>
|-
| de.*
| BI
| 7
| 5
| de.admin.net-abuse.announce
|<ref name="de.result">[http://groups.google.at/group/de.admin.news.announce/msg/4fc0ae92daa76052 &lt;news:Result-festlegung-bi-06-05-1999&gt;], http://home.snafu.de/hweede/debi.txt</ref><ref>{{Webarchiv |url=http://filmateleven.de/cms/?Usenet:Fremdcancel-FAQ |text=Fremdcancel-FAQ |wayback=20070625154346}}</ref>
|-
| de.alt.dateien.*
| BI
| 45
| 1
| de.admin.net-abuse.announce
|<ref name="de.result" /><ref name="de.markt.arbeit.faq" />
|-
| de.markt.*
| BI
| 45
| 2
| de.admin.net-abuse.announce
|<ref name="dma-result">{{Webarchiv |url=http://www.s.netic.de/fw/dma-result.txt |text=Archivlink |wayback=20110130054729}}, &lt;Result-de.markt.ALL-28.05.1998&gt;</ref><ref name="de.result" /><ref name="de.markt.arbeit.faq" />
|-
| es.*
| BI
| 45
| 20
|
|<ref name="es.faq">{{Webarchiv |url=http://personal.telefonica.terra.es/web/modestogarrido/usenet/docs/spam.html |text=FAQ: SPAM.ES |wayback=20100503215854}}</ref>
|-
| fr.*
| BI
| 30
| 10
| fr.usenet.abus.rapports
|<ref name="fr.faq">[http://www.usenet-fr.net/fur/usenet/abus/cancel-faq-fr-1.html Les annulations d’articles (Cancel)]</ref>
|-
| hamster.de.*
| BI
| 30
| 3
| hamster.cancelreport
|<ref name="hamster.de.faq">{{Webarchiv |url=http://www.arcorhome.de/newshamster/micha/usenet/rules-de.txt |text=Regelsatz für hamster.de.* |archive-is=20130210074044}}</ref>
|-
| it.*
| BI
| 45
| 20
| it.news.net-abuse
|<ref name="it.faq">[http://wiki.news.nic.it/AiutoCanc Tutto quello che occorre sapere sulla cancellazione]</ref><ref>[http://www.collinelli.net/antispam/ Pagina Antispam in italiano]</ref>
|-
| muc.*
| BI
| 45
| 2
|
|<ref name="de.markt.arbeit.faq" />
|-
| nl.*
| SBI
|
| 10
| nl.internet.misbruik.rapport
|<ref name="nl.faq">{{Webarchiv |url=http://nl.news-admin.org/info/nlcancel.html |text=Over cancelrapporten in nl.internet.misbruik |wayback=20070804154517}}</ref>
|-
|nrw.*
|BI
|7
|2
|
|<ref name="nrw.regeln">[http://nrw.usenetverwaltung.de/infos/regeln.html Regeln der nrw.*-Hierarchie.] nrw.usenetverwaltung.de</ref>
|-
| schule.*
| BI
| 14
| 3
| schule.cancelreport
|<ref name="schule">{{Webarchiv |url=http://schule.afaik.de/netiquette/netiquette.txt |text=schule.afaik.de |wayback=20210227034402 |archiv-bot=2023-06-18 15:14:24 InternetArchiveBot}}</ref>
|}

== Einzelnachweise ==
<references responsive />


[[Kategorie:Usenet]]
[[Kategorie:Usenet]]

Aktuelle Version vom 27. Februar 2025, 13:08 Uhr

Der nach seinem Erfinder, Seth Breidbart, benannte Breidbart-Index ist der bedeutendste Cancel-Index im Usenet.

Mit einem Cancel-Index wird die Verbreitungsintensität wesensgleicher Artikel bestimmt. Überschreitet der Index einen Grenzwert, so bezeichnet man die betreffenden Artikel als Spam. Sie dürfen dann durch Fremdcancel entfernt werden.

  • Crossposting ist das Versenden eines Artikels in mehrere Gruppen.
  • Multiposting ist das mehrfache Versenden desselben Inhalts.

Die grundlegende Idee des Breidbart-Index besteht darin, diese Methoden unterschiedlich zu bewerten.[1] Zum einen müssen bei Crossposts weniger Daten übertragen und gespeichert werden. Zum anderen sind exzessive Crossposts (ECP) ein plausibler Anfängerfehler, während exzessive Multiposts (EMP) auf vorsätzlichen Einsatz spezieller Software schließen lässt.

Entscheidend ist die Erfassung verschiedener Artikel als wesensgleich (im englischen Original: substantively identical). Dies umfasst unter anderem:

  • Byte für Byte identische Nachrichten;
  • an sich identische Nachrichten, die sich nur in geringen Anpassungen an die Gruppe unterscheiden;
  • Nachrichten, die dasselbe Produkt, Dienstleistung oder Website bewerben;
  • Nachrichten, die aus der gleichen Signatur (und sonst nichts) bestehen;
  • Nachrichten, die sich nur durch den zitierten Text unterscheiden.

Breidbart-Index (BI)

[Bearbeiten | Quelltext bearbeiten]

Der BI einer Menge von Artikeln ist die Summe der Quadratwurzeln von n, wobei n die Anzahl der Newsgroups ist, in die jeder einzelne Artikel gepostet wurde. Bewertet wird dabei eine Serie von m wesensgleichen Artikeln innerhalb eines Zeitraums von 45 Tagen. Das heißt, Postings älter als 45 Tage zählen nicht zur Serie.[2]

Formel

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Version 2 des Breidbart-Index (BI2)

[Bearbeiten | Quelltext bearbeiten]

Der BI2 ist definiert als Summe der Quadratwurzeln von n, plus der Summe von n, geteilt durch zwei.[2] Der BI2 ist aggressiver als der BI. Ein Crosspost in 35 Gruppen reicht, damit eine einzelne Nachricht den Grenzwert von 20 übertritt.

Formel

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Skirvin-Breidbart-Index (SBI, BI3)

[Bearbeiten | Quelltext bearbeiten]

Die Bezeichnungen Skirvin-Breidbart-Index und SBI finden sich im Spam Thresholds FAQ.[2] In der Hierarchie nl.* wird dieser Index aber BI3 genannt.[3]

Der SBI wird wie der BI2 berechnet, summiert aber die Anzahl der Gruppen in Followup-to: (wenn vorhanden) statt der Anzahl der Gruppen in Newsgroups:. Dadurch wird das Setzen eines Followup-to: belohnt.

Beispiel

Zwei Postings enthalten denselben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16 mit vier Gruppen im Followup-to:

In der Usenet-Hierarchie de.* gilt der Breidbart-Index mit einem Zeitfenster von 7 Tagen statt 45. Dafür hat sich die Abkürzung BI7 eingebürgert.[4]

In der Hierarchie hamster.de.* gilt der Breidbart-Index mit einem Zeitfenster von 30 Tagen statt 45. Dafür hat sich die Abkürzung BI30 eingebürgert.[5]

Cancel-Index in at.*

[Bearbeiten | Quelltext bearbeiten]

Ist im FAQ[6] der Gruppe at.usenet.cancel-reports definiert. Im Wahlaufruf (CfV)[7] und im FAQ wird nur die Bezeichnung Cancel-Index verwendet. Inoffizielle Abkürzungen sind CI und ACI.

Der ACI eines einzelnen Postings berechnet sich als 3 plus Anzahl der Gruppen, an die dieses Posting geschickt wurde. Der Index mehrerer Postings ist die Summe der Indizes der einzelnen Postings.

  • Laut RFC 1036[8] darf ein Artikel nur vom Autor oder dem Administrator des Servers, auf dem der Artikel ins Usenet eingespeist wurde, gecancelt werden.
  • Laut dem Spam Thresholds FAQ[2] gilt im gesamten Usenet ein Breidbart-Index von 20, d. h. Artikelserien, die über diesem Wert liegen, dürfen von jedermann per Fremdcancel entfernt werden.
  • In einigen Hierarchien wurden alternative (strengere) Grenzwerte durch eine Abstimmung festgelegt.
  • In der Hierarchie free.* sind alle Arten von Cancel verboten.[9]

Tatsächlich ist eine Cancel-Message nur eine durch Software automatisch auswertbare Bitte, einen bestimmten Artikel zu löschen. Betreiber von Newsservern dürfen frei entscheiden, wie sie die widersprüchlichen Richtlinien umsetzen.[10]

Hierarchie Cancel-Index Zeitfenster Grenzwert Berichte Festlegung
* BI 45 20 news.admin.net-abuse.bulletins [2]
at.* ACI 45 11 at.usenet.cancel-reports [7][11]
at.anzeigen.* ACI 14 4 at.usenet.cancel-reports [12][13]
bln.* BI 45 3 [14]
de.* BI 7 5 de.admin.net-abuse.announce [4][15]
de.alt.dateien.* BI 45 1 de.admin.net-abuse.announce [4][14]
de.markt.* BI 45 2 de.admin.net-abuse.announce [16][4][14]
es.* BI 45 20 [17]
fr.* BI 30 10 fr.usenet.abus.rapports [18]
hamster.de.* BI 30 3 hamster.cancelreport [5]
it.* BI 45 20 it.news.net-abuse [19][20]
muc.* BI 45 2 [14]
nl.* SBI 10 nl.internet.misbruik.rapport [3]
nrw.* BI 7 2 [21]
schule.* BI 14 3 schule.cancelreport [22]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. <news:36i6hk$3li>
  2. a b c d e Spam Thresholds FAQ
  3. a b Over cancelrapporten in nl.internet.misbruik (Memento vom 4. August 2007 im Internet Archive)
  4. a b c d <news:Result-festlegung-bi-06-05-1999>, http://home.snafu.de/hweede/debi.txt
  5. a b Regelsatz für hamster.de.* (Memento vom 10. Februar 2013 im Webarchiv archive.today)
  6. Spam Cancel in at.* (FAQ)
  7. a b <news:CfV$1$at.usenet.cancel-reports$3>
  8. RFC: 1036 – Standard for Interchange of USENET Messages. Dezember 1987 (englisch).
  9. free.* FAQ. killfile.org
  10. Cancel Messages: Frequently Asked Questions. killfile.org
  11. <news:Result-festlegung-bi-06-05-1999>
  12. <news:938889391/18913>
  13. <news:RESULT-Entfernung_von_at.anzeigen.computer.haendler-03.10.1999>
  14. a b c d Die Jobbörse in den Newsgroups: de.markt.arbeit.*
  15. Fremdcancel-FAQ (Memento vom 25. Juni 2007 im Internet Archive)
  16. Archivlink (Memento vom 30. Januar 2011 im Internet Archive), <Result-de.markt.ALL-28.05.1998>
  17. FAQ: SPAM.ES (Memento vom 3. Mai 2010 im Internet Archive)
  18. Les annulations d’articles (Cancel)
  19. Tutto quello che occorre sapere sulla cancellazione
  20. Pagina Antispam in italiano
  21. Regeln der nrw.*-Hierarchie. nrw.usenetverwaltung.de
  22. schule.afaik.de (Memento des Originals vom 27. Februar 2021 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/schule.afaik.de