Aller au contenu

Projet:Sources/Chez Manon

Ajouter un sujet
Pensez à sourcer vos modifications à l'aide de sources vérifiables !
Une page de Wikipédia, l'encyclopédie libre.
Dernier commentaire : il y a 10 jours par Sammyday dans le sujet Jean Tosti
Le projet « Sources » n'est pas notifié pour le moment.

Goutte d'eau
Goutte d'eau
La source, Ingres
La source, Ingres


Chez Manon


« Un ruisseau à nombreuses sources ne tarit jamais. »
Proverbe camerounais.


Chez Manon est l'espace de convivialité du Projet:Sources. Il accueille quelques brèves discussions, par exemple pour discuter du sourçage d'un article, demander une information, ou causer du projet…

Ci-contre, notre muse à tous, Manon, vue par le peintre Ingres. Émoticône

Export de sources via Zotero

[modifier | modifier le code]

Hello,

Pour celles et ceux qui utilisent Zotero, vous savez probablement qu'il est possible d'exporter les sources de votre bibliothèque, sous la forme d'entrée biblio ou de référence (clic droit sur une source > Créer une bibliographie à partir du document > Wikipedia Templates ; sélectionner « copier dans le presse-papier). Mais vous savez probablement aussi que l'export se fait en anglais, avec les modèles de wp-en, ce qui le rend difficilement utilisable ici.

Clairement, je ne connais rien au format utilisé, mais j'ai entrepris de créer un modèle (« style ») de citation adapté à fr-wp, à partir de l'existant dédié à en-wp, en bidouillant. Il permet l'export des sources avec {{ouvrage}}, {{article}} et {{lien web}}. Après quelques tests et maintes retouches, il marche plutôt bien, en dépit de quelques limitations (pas trouvé comment séparer les auteurs avec des paramètres dédiés auteur1, auteur2, etc.), et une intervention manuelle reste nécessaire (pour ajouter d'éventuels liens internes, des paramètres supplémentaires, etc.). Il est sans doute améliorable.

Avant de l'importer dans le Zotero Style Repositery, est-ce que des contributeurs veulent bien le tester ? M'envoyer un courriel, pour que je vous transmette le fichier.

Je mets aussi le code sur Projet:Sources/Style Zotero, si vous voulez participer directement (éditeur visuel de CSL / documentation).

Bien à vous, — Jules* discuter 23 décembre 2024 à 21:54 (CET)Répondre

Salut @Jules*,
J'en ai rêvé à Pâques (discussion), je l'aurais pour Noël : merci.
Je peux tester un peu voire regarder mais je ne connais pas le format non plus (certes il y a une documentation mais bon). LD (d) 24 décembre 2024 à 11:30 (CET)Répondre
✔️ Envoyé ! J'ai oublié de le préciser, mais pour ajouter le style dans Zotero : Édition > Paramètres > Citer > bouton "+" > sélectionner le fichier. — Jules* discuter 24 décembre 2024 à 13:40 (CET)Répondre
Salut @Jules*, je veux bien tester aussi. Cordialement GF38storic (discuter) 24 décembre 2024 à 15:40 (CET)Répondre
@LD et @GF38storic : j'ai apporté des modifications au code afin que soient pris en charge les articles de presse. Je pensais que c'était déjà le cas, mais en fait non, et cela donnait une erreur [CSL STYLE ERROR: reference with no printed form.]. Le problème est désormais résolu.
N'hésitez pas à mettre à jour votre version du fichier CSL en y copiant-collant la nouvelle version du code Émoticône. — Jules* discuter 27 décembre 2024 à 20:56 (CET)Répondre
Salut Jules, J'ai sélectionné une référence dans Zotero 7.0.11 (64-bit), click droit, "créer une bibliographie à partir du document", dans la fenêtre, style "wikipédia-fr Templates", mode de création "citation",
  • avant mise à jour
    • "copier dans le presse-papier". Puis coller sur le word, résultat => [CSL STYLE ERROR: reference with no printed form.]
    • "enregistrer au format rtf". j'ouvre le rtf, résultat => <\rtf ::::: <ref>\{\{lien web |langue=fre |url=https://www.musee-du-genie-angers.fr/fpdb/10701534-doc-fiche-55.pdf |auteurs=Mus\uc0\u233{}e du G\uc0\u233{}nie (Angers) |titre=Le bicorne du g\uc0\u233{}n\uc0\u233{}ral Bertrand 1773-1844 |site=Mus\uc0\u233{}e du G\uc0\u233{}nie Angers | consult\uc0\u233{} le=5 ao\uc0\u251{}t 2019\}\}</ref> :::::}
  • Puis j'ai copié-collé le nouveau code (mais qui reste numéroté à la version 1.0 (?))
    • (pour un article) "copier dans le presse-papier". Puis coller sur le word, résultat =>
      • <ref>{{article |langue=fre |auteurs=Xavier Tracol |titre=Arcade & Périscope - Les jeux de simulation sous-marine (2e partie) | numéro=56 |date= août 2021 |issn=2258-5303 |passage=7‑11}}</ref>
    • (pour un ouvrage) idem, résultat =>
      • <ref>{{ouvrage |langue=fre |auteurs=Bernard Bergerot |année= 1986 |titre=Le Maréchal Suchet : duc d’Albuféra |éditeur=Tallandier |périodique=Bibliothèque napoléonienne |isbn=978-2-235-01686-5}}</ref>
J'utilise classiquement un code langue 3 lettres dans Zotero qui se retrouve dans la ref style wikipédia. En modifiant le code langue en passant à 2 lettres comme sur WP, et en recommençant la ref WP se retrouve avec le bon code 2 lettres., ex : <ref>{{ouvrage |langue=fr |auteurs=Bernard Bergerot |année= 1986 |titre=Le Maréchal Suchet : duc d’Albuféra |éditeur=Tallandier |périodique=Bibliothèque napoléonienne |isbn=978-2-235-01686-5}}</ref>
Je dirai que c'est super. Parmi les améliorations manquantes (d'après mes essais): avoir les pages totales, le lieu de l'éditeur, et le numéro de volume.
Pour l'instant, un bug sur le modèle ouvrage où dans Zotero ce qui est "collection" ressort comme "périodique" en style WP.
En tout cas, merci du boulot. Cordialement GF38storic (discuter) 27 décembre 2024 à 22:54 (CET)Répondre
@Jules* GF38storic (discuter) 27 décembre 2024 à 22:55 (CET)Répondre
Merci pour le retour, @GF38storic ! Je regarde tranquillement demain, mais pour « collection », c'est effectivement un bug, et le lieu d'édition est normalement programmé pour être inséré dans la ref, donc là aussi c'est un bug. Pour les pages totales et le numéro de volume, je vais essayer d'ajouter ça Émoticône sourire. Pour la langue, c'est effectivement ainsi que j'ai programmé le script : il reprend directement ce qui est renseigné dans Zotero. Mais si c'est pertinent on peut faire autrement. Pour que je comprenne : à quoi correspond ton « fre » ? Une variante du français, comme fr-ca pour le français canadien ? Bien à toi, — Jules* discuter 27 décembre 2024 à 23:14 (CET)Répondre
Sur Zotero, je mettais "fre" pour "french". Je ne pense pas que ce soit pertinent, c'est très bien que cela reprenne ce que l'on rentre dans Zotero. A chacun des utilisateurs d'adapter sinon ça deviendrait impossible à gérer toutes les déclinaisons de chacun d'entre nous. Cordialement GF38storic (discuter) 27 décembre 2024 à 23:22 (CET)Répondre
Bon, finalement je m'en suis occupé tout de suite :
  • ❌ pour la langue, effectivement, mieux vaut en rester au fonctionnement actuel (le code langue officiel pour le français est fr Émoticône) ;
  • ✔️ corrigé pour « collection » ;
  • ✔️ corrigé pour « lieu » [d'édition] ;
  • ✔️ paramètre « pages totales » ajouté ;
  • ❌ s'agissant du numéro de volume, d'après mes tests ça fonctionne déjà correctement. Dans Zotero, @GF38storic, c'est le paramètre « volume ».
J'ai mis à jour le code. (Le numéro de version fait référence à la version du format CSL.) — Jules* discuter 27 décembre 2024 à 23:43 (CET)Répondre
@Jules* cela fonctionne bien pour les revues scientifiques. Après, comme pour la version anglophone, on retrouve le même problème d'identification des données pour le paramètre "pages" (wikitraduit par "passage" en français, "page" en anglais). ex. cet article, mais tu ne peux pas y faire grand chose àmha.
Sinon :
  • Ajout : Édition > Paramètres Préférences > Citer > bouton "+" > sélectionner le fichier.
  • Raccourci de citation : Édition > Préférences > Exportation > Format pour les documents : choisir "Wikipedia-fr templates".
Merci Émoticône cœur wikilove LD (d) 29 décembre 2024 à 00:19 (CET)Répondre
En effet, @LD, c'est la tambouille du logiciel lui-même, ça. De la même manière, pour les articles de presse en ligne, il est fréquent que Zotero peine à récupérer le nom des auteurs.
Merci ! Mais chez moi (Zotero 7.0.11 (64-bit)) c'est bien « Paramètres », pas « Préférences » Émoticône.
À la réflexion, je vais essayer de paramétrer l'usage de {{chapitre}}, au lieu de {{ouvrage}}, pour les items Zotero de type « chapitre ». Ce sera plus propre.
Une fois cela fait, je remettrai un message sur le Bistro, et si pas d'autre remarque, je regarderai plus en détail comment ajouter le style CSL sur le Zotero Style Repositery. — Jules* discuter 29 décembre 2024 à 13:02 (CET)Répondre
https://github.com/citation-style-language/styles LD (d) 29 décembre 2024 à 15:02 (CET)Répondre
J'ai intégré au code la prise en charge du modèle {{chapitre}}. Mes tests sont concluants.
J'ai créé une pull request sur Github (la première de toute ma vie wouhouuu Émoticône). Plus qu'à attendre le retour des devs et, j'espère, la validation du style. — Jules* discuter 3 janvier 2025 à 21:08 (CET)Répondre
Un retour après test : c'est parfait avec le même problème de code langue "fre" évoqué par @GF38storic. Il s'agit de la forme ISO 639-2 des codes langues, quand nos modèles ouvrages & cie utilisent seulement la forme ISO 639-1 (explication par @Raminagrobis sur Discord).
ça vaut peut-être quand même la peine de s'y pencher puisque c'est visiblement le format des codes langues dans des grands catalogues de bib., notamment les notices au format Unimarc de la BNF que récupère le plug-in Zotero (je n'ai pas vérifié d'autres catalogues, il y a des chances que ce soit la même chose).
Mais il semble que ce soit sur la gestion des codes Iso 639-2 des modèles qu'il faille jouer plutôt que sur le style Zotero, non ?
Et sinon merci @Jules* c'est vraiment chouette d'avoir ce style !
EDIT : question posée à ce sujet sur le projet modèle.
Unptitpeudtout (discuter) 1 février 2025 à 09:41 (CET)Répondre

A donné lieu à Aide:Zotero et à Wikipédia:RAW/2025-03-01#L'atelier. — Jules* 💬 9 mars 2025 à 15:12 (CET)Répondre

Super @Jules*. Merci. GF38storic (discuter) 10 mars 2025 à 07:58 (CET)Répondre

Sites rédigés avec l'assistance d'un chatbot

[modifier | modifier le code]

Bonjour,

En cherchant des sources permettant de vérifier, étayer et compléter l'article atompunk, je suis tombé sur deux articles qui présentent toutes les caractéristiques d'un texte rédigé par ChatGPT ou autre chatbot :

En jetant un coup d'oeil rapide à ces sites, ils me semblent avoir été entièrement rédigés de la sorte.

Ma question porte sur plusieurs problèmes que cela soulève :

  1. peut-on considérer ces sources comme suffisamment fiables pour étayer un article? Je pense que non, ne serait-ce que parce que ce sont des sites qui me semblent trop confidentiels, pas soumis à la critique d'un vaste lectorat ni d'un comité éditorial de quelque type que ce soit, mais c'est un avis empirique.
  2. peut-on affirmer qu'il s'agit de textes rédigés par une IA avec certitude? Je pense que ce n'est pas techniquement possible, sauf si le site le précise lui-même évidemment.
  3. doit-on lister ces sites dans une catégorie dédiée de l'observatoire des sources? Là encore, en l'absence de preuve indiscutable de la nature du rédacteur de ces textes et du modèle éditorial de ces sites, ça ne me semble pas évident.

Merci de votre attention et de vos éventuelles réponses. El Comandante (discuter) 3 janvier 2025 à 08:01 (CET)Répondre

Bonjour @El Comandante.
  1. Non : site genAI = pas fiable, puisque d'une part les IA sont connues pour inventer des infos ou mal comprendre certains éléments, et d'autre part, plus basiquement, la qualité d'une source (Wikipédia:Citez vos sources#Quelques critères de qualité) se jauge notamment à l'aune de la reconnaissance de compétence/expertise de ses auteurs. Or l'IA n'étant pas humaine, il ne peut s'agir de sources de qualité. Une IA, fondamentalement, est idiote, elle ne sait pas vérifier la véracité d'une information, elle sait uniquement remâcher ce qu'elle trouve en ligne.
  2. Franchement, dans les deux cas que tu cites, ça ne fait pas l'ombre d'un doute, àmha. Parfois c'est moins évident.
  3. Pour les sites dont l'usage de genAI est courant, pour moi c'est sur Spécial:BlockedExternalDomains qu'il faut les lister Émoticône.
Jules* discuter 3 janvier 2025 à 20:28 (CET)Répondre
Ouaip, on a du lourd avec ces deux sites:
- sur l'un, avec un certain Steampunk Gary qui crache des articles par rafales
- sur l'autre, la superbe mention "ExpertBeacon provides expert advice and connects you with local professionals who can help!" qui lui confère une fiabilité en béton, pour sûr! Limfjord69 (discuter) 3 janvier 2025 à 20:42 (CET)Répondre
Conflit d’éditionBonsoir El Comandante,
  1. A partir du moment où l'on sait que la génération de textes par IA n'est pas fiable, il parait évident que de tels textes, non fiables, ne peuvent pas servir de sources (sans compter l'éventuelle question des droits d'auteur):
  2. On ne le peut pas toujours, mais ton premier exemple (je n'ai pas creusé le second) est un cas typique où l'on peut être affirmatif à 100 % vu le cumul des marqueurs: images générées par IA, plan type, discours stéréotypé. Ce n'est probablement pas ChatGPT qui est utilisé ici, mais un générateur de texte antérieur de type Open AI ou autre, puisque la structure des textes présents sur le site a basculé en septembre 2022 : on passe de quelques lignes à de longs textes structurés
  3. C'est à bloquer d'office (et pas seulement pour des questions d'IA pour le premier blog), sauf si on préfère épuiser les patrouilleurs ou que WP devienne n'importe quoi. --Pa2chant.bis (discuter) 3 janvier 2025 à 21:14 (CET)Répondre
Bonjour à tous,
j'ai indiqué cette discussion dans l'essai sur le Contrôle des textes générés par IA comme exemple de sources non-fiables, et je m'étais dit qu'il faudrait un espace dédié dans le projet Sources pour ce suivi.
Que pensez-vous de rajouter une section « IA » après l'alphabétique dans l'Observatoire des sources pour recenser les discussions sur des sources précises (sites web, livres, presse...) ? Fabius Lector (discuter) 15 janvier 2025 à 13:04 (CET)Répondre
Hello. Je ne suis pas sûr que créer encore un nouvel espace de discussion soit pertinent : il risque d'arriver souvent qu'une discussion soit créée sur la pdd de l'ODS, et qu'en cours de route l'usage de l'IA soit suspecté, ce qui obligerait alors à déplacer la discussion vers l'espace dédié. Pas pratique. Àmha, il est plus simple de mener ces discussions sur la pdd de l'ODS. Bien à toi, — Jules* discuter 15 janvier 2025 à 13:46 (CET)Répondre
Oui, j'ai du mal m'exprimer, l'idée est juste de rajouter une section « IA » après la liste alphabétique de l'ODS (observatoire des sources, pas des IA) pour renvoyer vers les discussions ici. Pas un espace de plus, juste une catégorie spécifique pour l'ODS à laquelle on pourrait faire référence pour ce qui a été traité sur le sujet. Fabius Lector (discuter) 16 janvier 2025 à 13:53 (CET)Répondre

Enquête : genAI et plagiat dans les sources de Wikipédia

[modifier | modifier le code]


Bonjour à toutes et à tous,

Fin , Jules* a été contacté par Jean-Marc Manach (Manhack), journaliste pour le média Next, qui au cours d’une enquête a découvert plusieurs centaines de sites web utilisant des IA génératives (abrégées genAI). Le fait qu’au moins l’un d’entre eux, le site d’information L’Observatoire de l’Europe, ait certains de ses articles rédigés par un auteur fictif, utilisés sur Wikipédia, l’a incité à nous contacter. Il a proposé à Jules de lui fournir la liste des sites web identifiés afin de déterminer lesquels sont utilisés sur Wikipédia, la liste étant soumise à embargo jusqu’à publication de l’enquête de presse ; en échange, il apprécierait que la communauté wikipédienne lui fasse remonter les sites web genAI qu’elle détecte.

Au vu de l’ampleur du projet, il est apparu nécessaire d’être deux wikipédiens pour analyser les sites web signalés par Jean-Marc Manach.Pa2chant.bis a accepté de rejoindre le projet et nous avons travaillé tous les deux de mi-novembre à mi-décembre, y consacrant plusieurs dizaines d’heures.

Next et le service Checknews de Libération (partenaires sur ce dossier) ont désormais bouclé leur enquête, que vous pouvez retrouver dans les liens ci-dessous :

Il est temps de publier notre propre enquête. Bonne lecture !

Méthodologie

[modifier | modifier le code]

Sur 327 sites fournis par Next, 14 avaient déjà été identifiés lors des enquêtes menées à l’été 2022 sur Avisa Partners et Nativiz, un peu moins de 160 sont présents sur Wikipédia. Nous en avons examiné 148, qui sont présents dans l’espace principal.

Nous avons examiné chacun des sites avec les objectifs suivants :

  • évaluer s’ils ont recours à des genAI ;
  • évaluer s’ils ont recours à de la traduction automatique ou à de la reformulation par IA (plagiat) ;
  • évaluer s’ils font du native advertising ou diffusent des contenus sponsorisés (dissimulés ou non) ;
  • évaluer de manière générale leur qualité.

Par ailleurs, nous avons vérifié, pour chaque site web, par qui étaient effectuées les insertions sur Wikipédia. Dans la majeure partie de cas, une vérification d’un échantillon aléatoire a permis de constater que les ajouts étaient faits de bonne foi. Lorsque cela était nécessaire (suspicion de spam ou d’insertions par des comptes rémunérés), nous avons opéré une vérification systématique des ajouts.

Pour chaque site examiné, nous avons indiqué ce que nous préconisons que la communauté fasse : mise en liste noire, suppression des liens, remplacement des liens par une version archivée (lorsque les liens ne sont plus accessibles, que le site a été « vampirisé », et que c’était auparavant une source acceptable).

Les résultats détaillés, site par site, sont consultables sur la sous-page suivante : Enquête genAI : analyse détaillée.

Les cas les plus fréquents sont les sites entièrement produits à partir de gen-AI et ceux plagiant d’autres sites web (avec traduction automatique ou réécriture par IA). Il est possible que certains plagiats soient manuels, ce qui fondamentalement ne change pas grand chose sur l’absence de qualité du site.

Autre cas de figure courant : le site (de qualité ou non) a eu une première vie, durant laquelle des liens ont été insérés sur Wikipédia, puis le nom de domaine a été racheté par un tiers — généralement une entreprise de SEO ou de monétisation par la publicité de fermes à contenus, le but étant de profiter de l’audience web du site — qui s’est mis à publier des contenus gen-AI.

Certains liens, qui contiennent des articles sponsorisés ou relèvent du native advertising, ont servi à des usages promotionnels sur l’encyclopédie. Quelques autres ont fait l’objet de spam.

De manière chiffrée, sur 148 sites analysés : 105 ont recours à de l’IA pour la rédaction des textes ; 65 recourent au plagiat (avec ou sans traduction, avec ou sans reformulation par IA) ; 81 ne sont pas transparents (pas de mentions légales, mentions mensongères, auteurs fictifs, etc.) ; 51 sont des sites vampirisés ; 7 ont fait l’objet de spam sur Wikipédia ; 18 ont servi à des modifications promotionnelles sur Wikipédia ; 2 sont clairement des faux-positifs. (NB : d’autres sites, dont l’usage de l’IA n’est pas bien établi, ont été retirés de la liste de Next, mais nous ne les considérons pas comme des faux positifs car ils posent d’autres problèmes : plagiat, etc.)

S’agissant des ajouts faits de bonne foi, ils sont souvent l'œuvre de contributeurs expérimentés, voire très expérimentés, y compris lorsqu’il s’agit de sites de très mauvaise qualité (pas d’auteurs, pas de mentions légales, traduction automatique manifeste, etc.).

Nous vous laissons désormais vous emparer de ce matériau et en discuter Émoticône sourire : Enquête genAI : analyse détaillée.

Merci à Jean-Marc Manach de nous avoir partagé la liste des noms de domaine qu’il a identifiés et sans lequel cette enquête n’existerait pas. Merci à 0x010C pour le support technique en début d’enquête, à savoir la récupération automatisée de l’insertion de certains liens à partir des dumps.

Du travail pour tous

[modifier | modifier le code]

Par ailleurs, depuis la conclusion de notre enquête wikipédienne, Jean-Marc Manach a identifié plus de 700 autres sites web avec des contenus genAI ou contenant des plagiats. Avec un script créé pour l’occasion, nous avons ramené ce nombre à une liste de 284 sites web présents sur Wikipédia, liste mise à disposition sur Enquête genAI : noms de domaine à analyser (pas le même lien que ci-dessus). Ces 284 sites s’ajoutent donc aux 148 déjà passés en revue : nous comptons sur l’analyse collaborative pour poursuivre le travail que nous avons entrepris.

Jules* discuter et Pa2chant.bis (discuter) le 6 février 2025 à 11:25 (CET)Répondre

Discussions

[modifier | modifier le code]

Un grand bravo pour tout ce travail effectué pour débusquer tous ces sites ! Skimel (discuter) 6 février 2025 à 13:43 (CET)Répondre

J'ai l'impression qu'il y a aussi pas mal de recyclage de noms de domaines.
Par exemple: https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Recherche_de_lien/geekopolis.fr pointe sur une page de 2015, et visiblement, c'était une page d'un événement il y a 10 ans (cf le contexte d'un des liens)
De même, https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Recherche_de_lien/journees-prevention-santepublique.fr montre qu'il y a aussi un recyclage de page d'événement. Je n'ai pas lu les articles (donc c'est peut être mentionné), mais ça me semble être assez souvent le cas (autre exemple: https://fr.wikipedia.org/wiki/Sp%C3%A9cial:Recherche_de_lien/printempsfrancais.fr ). Misc (discuter) 6 février 2025 à 14:06 (CET)Répondre
C'est ce que l'on a appelé « vampirisme », @Misc, pour la partie déjà analysée (cf. les étiquettes). — Jules* discuter 6 février 2025 à 14:07 (CET)Répondre
Ah j'ai lu en diagonal et j'ai pas vu que c'était un lien différent de celui d'en bas. Misc (discuter) 6 février 2025 à 14:16 (CET)Répondre
J'ai lue diagonale la liste des sites, et je suis tombé sur la site officiel d'une de mes anciennes boites. Donc comme le dit Misc oui il y a du recyclage, de noms de domaine aussi. GPZ Anonymous (discuter) 6 février 2025 à 15:12 (CET)Répondre

Merci pour votre impressionnant travail qui permet la vigilance, le maintien et la qualité de notre encyclopédie. Smiley avec un pouce vers le haut --RawWriter (discuter) 6 février 2025 à 15:39 (CET)Répondre

Merci à Jules* et Pa2chant.bis pour votre dévouement . Des centaines de liens qui n'ont rien à faire dans une encyclopédie ! Bravo pour votre vigilance ! --JMGuyon (discuter) 6 février 2025 à 19:05 (CET)Répondre
Bravo pour cet énorme et fastidieux travail qui a le mérite de mettre en lumière un phénomène de plus en plus problématique. Mais... (je vais me prendre une volée de bois vert) était-ce vraiment utile d'un point de vue encyclopédique ? Rien qu'en parcourant la liste des noms de domaine on se doute que la qualité et la fiabilité de 90% d'entre eux ne risquent pas d'être au rendez-vous. Et en accédant aux pages d'accueil de la plupart je vois principalement des sites de relais d'actualités dans un domaine bien ciblé ou des sites promotionnels. Par nature ceux-ci ne véhiculent pas d'informations dignes d'intérêt pour une encyclopédie, et les règles de WP recommandent d'utiliser des sources secondaires de qualité. Bref, genAI ou pas, on n'y est pas. Desman31 (discuter) 6 février 2025 à 19:37 (CET)Répondre
Pas de volée de bois vert Tire la langue. En effet, @Desman31, la plupart de ces sites, genAI ou non, ne sont pas de qualité. Mais on a voulu le démontrer : le temps d'analyse n'a pas servi qu'à regarder l'aspect genAI, mais aussi la présence de plagiat, de publicités dissimulées, et l'absence de rédacteurs humains, l'absence de mentions légales. Cela permet de caractériser de manière plus fine les problèmes rencontrés pour chaque site web et permet ce qu'on est en train de faire là, d'en discuter, et de sensibiliser. Et l'aspect genAI, et plus encore les plagiats avec IA, méritent quand même d'être davantage connus de la communauté, car c'est un phénomène nouveau et qu'il est plus facile de tomber dans le panneau : quand c'est bien fait, le résultat fait sérieux, et pour cause il y a reprise et paraphrase de sources de presse.
« Rien qu'en parcourant la liste des noms de domaine on se doute que la qualité et la fiabilité de 90% d'entre eux ne risquent pas d'être au rendez-vous. » Et pourtant ils sont largement utilisés sur Wikipédia, pour certains… — Jules* discuter 6 février 2025 à 20:53 (CET)Répondre

Voilà de quoi nous occuper pour les longues soirées d'hiver. Merci pour l'intense travail effectué. Notification Jules* : il me semble essentiel de faire remonter le point vers le Bulletin des administrateurs également pour une discussion sur le sujet --> nous pourrions acter le passage d'un très grand nombre d'URL vers la liste noire, chose qui n'est pas usuelle, et mérite une mention au collège des admins, à mon avis. On ne va pas s'en sortir si on passe au fil de l'épée les liens 1 à 1, il va falloir, de mon point de vue, un nettoyage plus poussé voire radical. Lebrouillard demander audience 6 février 2025 à 18:14 (CET)Répondre

J'ai mis un ptit mot sur le BA en même temps que je publiais l'enquête, @Lebrouillard Émoticône : Wikipédia:Bulletin des administrateurs/2025/Semaine 6#Enquête genAI et plagiat dans les sources de Wikipédia : sites à blacklister ?.
Je suis d'accord avec toi qu'un ajout groupé des sites (pour lesquels nous l'avons préconisé, si la communauté/les admins sont d'accord) sur la liste noire serait optimal. — Jules* discuter 6 février 2025 à 18:18 (CET)Répondre
Hello, comme je proposais à Jules sur une autre page: je me demande s'il ne faudrait pas, lors de la suppression de ces références, indiquer un refnec ou quelque chose si le contenu (désormais non sourcé) reste en place. Vous en pensez quoi? Triton (discuter) 7 février 2025 à 00:54 (CET)Répondre
c'est ce que je tente de faire lorsqu'on a un souci de ce genre, ça permet au lectorat de trouver d'autres sources et améliorer les articles, ça me semble donc une excellente idée @Triton - Lupin (discuter) 7 février 2025 à 10:26 (CET)Répondre
Pour ce que ça vaut, c'est souvent, soit sourçable assez facilement autrement (puisque par nature la génération par IA ne fait rien d'original), soit juste faux et à retirer carrément (cas d'hallucinations, ou quand l'auteur du prompt a demandé à développer une brève - l'IA brode allègrement). L'ajout de refnec est possible, mais pas un premier choix, si possible. Blinking Spirit (discuter) 7 février 2025 à 11:16 (CET)Répondre
Hello, ça rejoint ce que vous dites, mais pour l'instant j'ai eu quatre grands cas de figure, avec diverses variations :
  • Remplacement par une source de meilleure qualité (notamment car la source retirée était un plagiat d'une source de qualité pouvant être identifiée) ;
  • Ajout de refnec car info potentiellement encyclopédique mais pas pris le temps de chercher une autre source ;
  • Suppression de l'info, car anecdotique, probablement pas encyclopédique, promotionnelle (parfois, était sourcée par une fausse source secondaire en fait paraphrase/plagiat, par IA ou non, d'un communiqué de presse).
  • Rien, soit parce qu'il y a déjà une autre référence, soit parce que l'info ne nécessite pas d'être sourcée.
Jules* discuter 7 février 2025 à 13:03 (CET)Répondre
Bonjour, pour deux articles pour lesquels j'avais cité par méconnaissance varactu.fr la notification de Jules et la mention [refnec] m'ont permis d'être informé et de retrouver facilement des sources originelles (varmatin.com ou nicematin.com). Merci à tout ceux qui ont lancé ce projet indispensable de désinfox de WP. -- Gnrc (discuter) 8 février 2025 à 11:53 (CET)Répondre
Bravo pour ce travail formidable Émoticône sourire. Un premier tour de piste me conduit à penser à une autre façon que la suppression/remplacement par ref nec. Pas par mansuétude mais parce que ça source parfois des faits qui peuvent avoir un apport encyclopédique in fine, et surtout par pédagogie vis à vis des tentatives de manipulations ou de pub indirecte en loucedé sur Wp. Si un contributeur insère avec bonne foi, un tag "source insuffisante" avec commentaire de diff renvoyant vers le lien du diag me paraît un bon premier rappel vers le droit chemin, (surtout s'il a l'article en suivi). De plus, on gagne du temps si on veut avancer avec un minimum de rapidité (car il y a un gros gros taf..), et il sera toujours possible d'être plus radical ultérieurement. Limfjord69 (discuter) 8 février 2025 à 16:11 (CET)Répondre
Hello @Limfjord69. Dans le même style, il y a une autre possibilité que j'ai évoquée plus bas : celle de notifier les auteurs d'insertions, en leur fournissant nom de l'article et diff, directement depuis la section d'analyse du site, afin de leur laisser l'opportunité d'effectuer les corrections nécessaires. — 𝒥𝓊𝓁ℯ𝓈 *  💬 8 février 2025 à 16:20 (CET)Répondre

Participation de WP à l'extension de Next.ink

[modifier | modifier le code]

Si j'ai bien compris, l'extension Firefox/Chrome recense les sites détectés et WP pourrait-il y participer de manière plus générale/officielle ? Par exemple, pourrait-on :

  • intégrer de nouvelles détections qu'on ferait de notre côté ;
  • rajouter une fonction faisant un surlignage d'url correspondant à un site de la liste. Ça ferait une alerte préalable quand on a des relais de ces sites, y compris par du sourçage sur WP (et ça nous faciliterait le suivi...) ;
  • renvoyer à une documentation dans le style de l'analyse détaillée. Là, le "Plus d'infos" de leur alerte renvoie vers leur article d'enquête et on pourrait avoir plus précis/direct, peut-être simplement donner le lien vers la page WP.

--Fabius Lector (discuter) 6 février 2025 à 13:35 (CET)Répondre

Hello @Fabius Lector. Oui pour le premier point, c'est même une proposition de @Manhack. Pour le reste, je le laisse répondre. (Mais pour les sites qu'on mettra en liste noire, plus besoin d'être alerté pour leur insertion sur WP, puisqu'elle sera impossible.) — Jules* discuter 6 février 2025 à 13:38 (CET)Répondre
Bonjour, et désolé de répondre avec retard, mais mes journées sont plutôt chargées avec cette enquête...
Je profite de l'occasion pour remercier une fois de plus (mais publiquement, cette fois) @Jules* & @Pa2chan.bis pour le travail considérable qu'ils ont effectués à partir de la liste de sites GenAI que j'ai identifiés.
Pour répondre @Fabius Lector, il suffit de cliquer sur le bouton de l'extension pour pouvoir nous adresser, via un formulaire, la mention d'un site GenAI susceptible d'être rajouté.
Nous avons décidé de ne pas rendre publique la liste intégrale des sites GenAI que nous avons identifiés, pour ne pas faire de "name & shame" (en mettant sur le même plan les petits éditeurs opportunistes avec ceux qui industrialisent le process), mais aussi pour ne pas aider ceux qui voudraient améliorer leurs générateurs AI.
Seules les URL mentionnées dans WP comme "sources" le sont, afin de permettre aux contributeurs de l'encyclopédie de vérifier si la mention est légitime, ou pas.
J'ai transmis votre proposition de surlignage des liens au développeur de l'extension, qui n'en est qu'à sa V1 (encore à approuver par Chrome, btw). -- Manhack (discuter) 7 février 2025 à 17:21 (CET)Répondre

leparisien.fr

[modifier | modifier le code]

genAI Nombreux guides d'achat rédigés par IA depuis début 2025 avec des patterns similaires. Malheureusement, vous n'autorisez pas les liens leparisien sur votre wiki, ce qui n'est pas juste ni éthique. — Le message qui précède, non signé, a été déposé par Ecowatcher75 (discuter) ()

C'est possible (les sites de presse ont souvent des sous-domaine publicitaires avec des pratiques vraiment nazes), mais là vous n'êtes pas très précis.
En revanche, merci de vous être manifesté, ça m'a permis de repérer et reverter votre spam pour lespailles.com sur notre wiki, doublé d'un spam pour la version anglophone du même site commercial, drinking-straw.com, sur Wikipédia en anglais (où il avait déjà été annulé). Et de bloquer votre compte.
Jules* discuter 6 février 2025 à 22:28 (CET)Répondre
Ok, je viens de comprendre « vous n'autorisez pas les liens leparisien sur votre wiki » — et ça explique que vous n'ayez pas été précis. Certains sous-domaines du Parisien sont déjà bloqués (on peut voir lesquels dans MediaWiki:Spam-blacklist), précisément car il s'agit de publi-rédactionnel ; c'est donc tout à fait juste et éthique. Les articles du Parisien, eux, peuvent être partagés sur Wikipédia sans souci.
Jules* discuter 6 février 2025 à 22:40 (CET)Répondre

Analyse des 284 sites supplémentaires

[modifier | modifier le code]

Hello,

Quand on aura fini le ménage (merci, vous êtes plusieurs à bosser dessus !) sur les 148 sites déjà analysés, il y en aura 284 autres à analyser. Je publierai demain quelques conseils pour le faire, en m'appuyant sur la manière dont Pa2chant.bis et moi avons bossé (là, détente puis dodo). — Jules* discuter 6 février 2025 à 23:47 (CET)Répondre

✔️ Fait.
Par ailleurs, pour info, svp ne commencez pas tout de suite le nettoyage des liens, pour la raison indiquée. (Ping @GPZ Anonymous : pas grave pour les trois-quatre que tu as déjà nettoyés.) Et d'ailleurs, aussi, ce serait ptet pas plus mal d'avoir au moins deux regards pour chaque site (comme on l'a fait avec Pa2chant.bis), avant d'agir ? À discuter.
Jules* discuter 7 février 2025 à 15:20 (CET)Répondre
Bonjour @Jules*, @Pa2chant.bis En terme de détection de texte généré par IA, vous vous appuyez sur quel type d'outil ? GPZ Anonymous (discuter) 7 février 2025 à 17:14 (CET)Répondre
Perso je n'ai pas utilisé d'outil automatisé (j'ai toujours lu qu'ils n'étaient pas très fiables, et @manhack dit la même chose [https://next.ink/165310/comment-reconnaitre-les-sites-dinfos-generes-par-des-ia/ dans son papier), uniquement de la détection manuelle ; j'ai mis quelques conseils ici. — Jules* discuter 7 février 2025 à 17:24 (CET)Répondre
Comme indiqué dans l'article consacré à la méthodologie de mon enquête, ainsi que dans le mode d'emploi que j'avais publié en 2023, je n'utilise pas d'outil de détection des contenus GenAI, au vu du trop grand nombre de faux positifs et faux négatifs que ces IA génèrent elles-mêmes.
L'article consacré à l'extension que nous avons développé résume par ailleurs la grille de lecture (liste non cumulative, ni exhaustive) nous ayant permis de détecter les sites d'info contenant des articles nous semblant avoir été (en tout ou partie) générés par IA. -- Manhack (discuter) 7 février 2025 à 17:30 (CET)Répondre
C'est bon, j'ai récupéré cette nuit la liste des insertions sur Wikipédia, grâce à cet outil qui m'a été signalé par son auteur et que j'ai adapté à la marge.
J'ai donc obtenu une magnifique liste de 4638 insertions. Le but étant d'identifier des éventuels ajouts publicitaires ou spam, j'ai retiré de la liste les ajouts de liens sur les pdd (d'articles, d'utilisateurs, etc.), sur l'espace Wikipédia (surtout le Bistro et l'Oracle ; ainsi que les DRP car pas exploitable, ajout par le bot dans les pages d'archives), sur la page d'analyse elle-même ^^, et enfin sur les pages projet. J'ai laissé les ajouts dans l'espace Utilisateur, car souvent ce sont des ajouts dans des pages de brouillon, ce qui peut être intéressant dans une perspective antipub.
Ce filtrage ramène la liste à 3 788 résultats. Je pense partager le fichier (qui n'aura vraiment d'intérêt que quand on aura analysé les sites !) avec quelques contributeurs du Projet:Antipub.
Mais, perspective antipub mise à part, on pourra aussi envisager un partage public, pour les sites où ce sera pertinent, cette fois-ci pour notifier les contributeurs auteurs des ajouts et leur permettre de corriger directement. À réfléchir.
𝒥𝓊𝓁ℯ𝓈 *  💬 8 février 2025 à 14:55 (CET)Répondre

Proposition d'Esprit Fugace

[modifier | modifier le code]

Cf. Discussion Projet:Sources/Enquête genAI : analyse détaillée, par Esprit Fugace. — 𝒥𝓊𝓁ℯ𝓈 *  💬 8 février 2025 à 14:58 (CET)Répondre

Pour débroussailler un peu :
  • J'imaginais une interface un peu similaire aux RA, avec des fonds colorés permettant de voir le niveau de traitement (à traiter, diagnostic fait, liens virés, blacklistage)
  • Une demande = un site, avec un début d'argumentaire sur pourquoi le site est suspect (de plagiat / génération IA, pas juste d'être un site de merde)
  • Archivage automatique (pour garder une trace), là aussi comme les RA (demander à El pitareio si NaggoBot peut s'en charger ?)
  • Traitement par 3 fois : 1 demandeur, 1 traitant, 1 admin (y compris admin d'interface) pour le blacklistage du site, ce qui permettrait de limiter les effets de bords (blacklistages de sites finalement légitimes).
  • Sur une page genre Projet:Sources/Suspicions de GenAI (ou autre titre, j'ai pas trop d'idées).
Il me semble que ça permettrait de traiter les sites les uns après les autres, en mode "routine", en assurant un suivi des traitements et un archivage correct.
Vous en pensez quoi ? Esprit Fugace (discuter) 8 février 2025 à 15:13 (CET)Répondre
Je trouve que c'est une bonne idée (pour prendre le relai quand on aura fini de traiter les deux listes actuelles). — 𝒥𝓊𝓁ℯ𝓈 *  💬 8 février 2025 à 15:22 (CET)Répondre
Beaucoup de bien. --Pa2chant.bis (discuter) 8 février 2025 à 16:22 (CET)Répondre
Bonne idée. Girart de Roussillon (Discrepance ?) 8 février 2025 à 22:25 (CET)Répondre
Oui bonne idée ! Ce qui serait aussi intéressant c'est d'avoir des indications sur la manière de détecter ce genre de site. En ce qui me concerne je ne me sens pas du tout compètent pour savoir si un site est susceptible d'être un plagiat ou généré par AI, et je ne pense pas qu'y allait au "feeling" soit un bon moyen. Mais ça je pense que @Jules* et @Pa2chant.bis ont à présent acquis une grande expérience pourront nous la transmettre. RawWriter (discuter) 8 février 2025 à 23:12 (CET)Répondre
Hello @RawWriter. J'ai listé quelques conseils d'analyse ici, dans le premier encadré (d'ailleurs, si tu veux compléter, @Pa2chant.bis, NHP !). Ce sont des conseils pour quand il y a déjà un doute, mais sinon, de manière plus basique, lors de la recherche de sources pour un article, des réflexes à avoir, àmha :
  • regarder si les articles sont signés par des auteurs (et si oui, vérifier leur existence sur le web) ;
  • regarder si le site a une équipe de rédaction digne de ce nom ;
  • regarder s'il y a des mentions légales et une page « Qui sommes-nous ? ».
Si un site est géré par des gens inconnus ou sans compétence dans le domaine, il ne peut pas être utilisé sur Wikipédia comme une source secondaire de qualité. Voir aussi Aide:Identifier des sources fiables. — 𝒥𝓊𝓁ℯ𝓈 *  💬 8 février 2025 à 23:56 (CET)Répondre
Bonjour @Jules*, merci pour ces indications et conseils. Et pour le basique c'est un peu ce que je faisais déjà. Mon questionnement était surtout comment reconnaitre une AI et vos conseils sont bien utiles. RawWriter (discuter) 9 février 2025 à 17:39 (CET)Répondre
Un grand merci pour ce travail, qui met en lumière un thème dont j'ignorais quasiment tout. Beau travail et belle pédagogie. Tilcago (discuter) 1 avril 2025 à 10:32 (CEST)Répondre

Faux sites d'infos pour générer de la source

[modifier | modifier le code]

Attention, j'ai l'impression que certains de ces sites peuvent très bien refourguer de la com préparée par une entreprise cliente, ce qui génère de la fausse source. J'ai l'impression de voir cela avec un site internet turc (Projet:Sources/Enquête genAI : analyse détaillée#rayhaber.com). Pour l'article Skyworth Auto, n'ayant pas réussi à trouver les infos mentionnées, j'ai préféré supprimer le passage. Girart de Roussillon (Discrepance ?) 8 février 2025 à 23:29 (CET)Répondre

Point d'étape 1

[modifier | modifier le code]

Hello,

Petit point d'étape, une semaine après la publication de l'enquête. Pour commencer, merci à toutes et à tous pour votre participation au nettoyage et à l'analyse Émoticône !

Votre aide est la bienvenue et je vais laisser un petit mot sur la pdd de l'ODS et sur le Bistro. — Jules* 💬 12 février 2025 à 22:10 (CET)Répondre

P.-S. : mon activité wikipédienne (entre autres) est fortement ralentie par un retour de tendinite bras droit, donc je vais être moins actif sur ce dossier, en tout cas en clics et en écriture, désolé. Mais je lirai vos analyses. — Jules* 💬 14 février 2025 à 16:41 (CET)Répondre

400 de plus

[modifier | modifier le code]

Hello,

Environ la moitié des 284 sites à analyser a fait l'objet d'une analyse par un bénévole (pour beaucoup par Aelxen, très motivé) : il faut ensuite qu'une deuxième personne valide l'analyse initiale pour commencer à traiter (supprimer ou remplacer les liens, quand c'est ce qui est préconisé).

D'autre part, Next a identifié plusieurs milliers de sites web genAI supplémentaires. Parmi eux, 400 noms de domaine sont présents sur Wikipédia et devront à leur tout être analysés. Je les ai ajoutés dans une liste distincte : Projet:Sources/Enquête genAI : noms de domaine à analyser/2.

Toutes les bonnes volontés sont les bienvenues. (J'espère pouvoir mettre la main à la pâte prochainement.)

Jules* 💬 31 mars 2025 à 14:20 (CEST)Répondre

Texte catégorisé comme "Opinion" et "signé" par le comité de rédaction d'un journal

[modifier | modifier le code]

Un tel texte est-il une source recevable ? A ma connaissance non, pour les raisons suivantes :

  • La rubrique "Opinion" contrevient à WP:Sources primaires : "des textes exprimant l'opinion personnelle de leurs rédacteurs".
  • Un texte non signé est de peu de valeur ; il y a toujours quelqu'un derrière, certes mais on ne sait pas à quel point il est qualifié pour traiter tel sujet.
  • Le problème des tribunes est qu'elles sont souvent de faible WP:Proportion.

Je suis en dialogue avec quelqu'un qui m'oppose qu'un des arguments contre les tribunes et textes assimilés est qu'ils ne passent pas par un comité de rédaction, alors que là, c'est le comité de rédaction qui signe. Soit, mais il n'en reste pas moins que le texte est catégorisé d'une manière qui signale un angle assumé comme particulier et subjectif. JMGuyon (discuter) 14 février 2025 à 12:39 (CET)Répondre

Selon moi, cela n'a pas beaucoup de sens de rechercher s'il existe une validité ou une invalidité en toute circonstance : cela dépend en grande partie de l'affirmation de l'article que cette source vient étayer. Cordialement, ― Racconish💬 14 février 2025 à 15:58 (CET)Répondre
L'idée est de chercher des critères objectifs, pour éviter les raisonnements à géométrie variable, qui seront validés ou non en fonction d'un rapport de force à l'instant t sur une pdd.--JMGuyon (discuter) 14 février 2025 à 16:13 (CET)Répondre
À partir du moment où leurs auteurs et autrices du billet ne le considèrent pas comme un article de journalisme mais comme un billet d'opinion, cette décision s'entend au vu de leurs règles de transparence et d'éthique, je ne vois donc pas de raison de les considérer comme des informations objectives ou des articles journalistiques. - Lupin (discuter) 15 février 2025 à 14:59 (CET)Répondre
@JMGuyon : Wikipédia:Sources fiables#Articles d'opinion. Desman31 (discuter) 19 février 2025 à 00:18 (CET)Répondre

Sources mises en cause pour leurs biais concernant le racisme, et utilisées pour étayer ou réfuter la thèse d'un génocide

[modifier | modifier le code]

Peut-on puiser dans des revues ou sites controversés sur un thème en connexion étroite avec le sujet de la page Wikipédia (en l'occurrence, un possible génocide impliquant des Arabes en majorité musulmans )?

JMGuyon (discuter) 14 février 2025 à 15:46 (CET)Répondre

debunkersdehoax.org, source de qualité pour wikipédia ?

[modifier | modifier le code]

Bonjour, quelqu'un a-t-il des sources secondaires intéressantes concernant le site debunkersdehoax.org ? Celui-ci se présente ainsi : « Nos méthodes sont PARTICIPATIVES. Ce qui veut dire que tout citoyen se sentant concerné par cette propagande peut nous aider, soit en nous signalant de possibles hoaxes, en rédigeant des articles, en nous apportant leurs connaissances personnelles ou professionnelles » et « nous sommes de simples citoyens révoltés par la propagande mensongère et haineuse de l’extrême droite dans les médias. » ce qui laisse entendre que ce sont de simples quidam qui y participent. Notification Panam2014 : a trouvé une mention ici dans les Décodeurs du Monde. La source est utilisée dans l'article Alice Cordier [1] et, sauf erreur, a été ajoutée par Notification DarkVador79-UA :. Je vois une discussion également dans la pd de Tatiana Ventôse : Notification Au passage :, Notification JzK : --Thontep (discuter) 16 février 2025 à 16:59 (CET)Répondre

Ils parlent de nous aider ils ne disent pas qu'ils laissent la main libre aux participants. Un peu comme les Décodeurs. Panam (discuter) 16 février 2025 à 17:04 (CET)Répondre
Je ne saisis pas du tout la comparaison avec « les Décodeurs », rubrique d'un quotidien des plus connus en France. Parle-t-on de journalistes, de comité de lecture, de responsabilité éditoriale ?! --Thontep (discuter) 16 février 2025 à 17:11 (CET)Répondre
Je parle du fonctionnement participatif. Les Décodeurs ne qualifient pas DDH de blog et le décrivent comme page qui démolit intox et rumeurs, spécialisé dans le démontage de rumeurs Panam (discuter) 16 février 2025 à 17:15 (CET)Répondre
Je ne sais pas qui a qualifié ce site de blog. C'est un simple site participatif, un peu comme dans un tout autre domaine, babelio (sans faire injure à la qualité du projet babelio), où également tout un chacun peut écrire sa petite critique (bien que, ici, il semble que les articles ne soient écrits que par un ou deux participants), mais ici avec un ancrage politique bien marqué et un style le plus souvent de type pamphlétaire ou, disons, polémiste : [2]. --Thontep (discuter) 17 février 2025 à 07:58 (CET)Répondre
Si ce site marche sur le mode participatif, il n'y a pas de raison de le qualifier de source secondaire de qualité. Je le classerais dans la même typologie de site que agoravox : le site ne présente pas de risque majeur de désinformation, mais il ne constitue pas pour autant une WP:Source secondaire qualitative à portée encyclopédique. Lebrouillard demander audience 17 février 2025 à 09:09 (CET)Répondre

Utiliser comme source une thèse non publiée ?

[modifier | modifier le code]

Je souhaiterais savoir en toute généralité si c'est permis. A mon sens, en règle générale, ça ne l'est pas, il y a une exception, si la thèse fait l'objet de comptes rendus et d'analyses, si elle est relayée, de sorte qu'elle n'est plus une source de faible WP:Proportion.

  • WP:Travaux inédits : ils sont prohibés. Sauf erreur une thèse n'a pas d'ISBN.
  • WP:Citez vos sources n'évoque même pas la question.
  • WP:Sources fiables#Évaluation des sources universitaires (un essai) : "Si le contenu a été publié dans des sources de renom avec comité de lecture ou par des presses universitaires bien considérées, alors il aura très souvent été validé au préalable par un ou plusieurs autres universitaires". Effectivement, les maisons d'éditions confient les collections spécialisées à des universitaires, qui font le tri dans les manuscrits proposés. Et : "les thèses complètes rédigées dans le cadre des exigences d'un doctorat (...) peuvent être utilisés, mais il faut faire attention, car elles sont souvent, en partie, des sources primaires. Certains d'entre eux auront fait l'objet d'un processus d'évaluation par les pairs, plus ou moins rigoureux, mais d'autres ne le feront pas". AInsi cette page ne considère pas le jury de soutenance comme une garantie suffisante, ni comme une évaluation par des pairs au sens habituel du terme.
  • Discussion de 52 messages sur le Bistro. Je n'ai lu que les 2 derniers messages, en résumé : 1)"la qualité d'une source s'évalue à partir de la spécialité son auteur" ; 2)" "la qualité d'une source s'évalue à partir de de publication (qualité de la revue ou éditeur)" ; 3) "la thèse a fait l'objet de comptes-rendus, d'analyses ou de citations par d’autres sources secondaires" ; 4)si une thèse est de qualité, elle débouche sur un ouvrage (et pas à compte d'auteur) ; 5)des jurys qui valident tout et n'importe quoi, ça ne manque pas (alors, certes on trouve des conneries dans des revues à comité de lecture, m'enfin, le processus me semble plus rigoureux) ; 6)Une thèse non publiée est de faible WP:Proportion, sauf exception, il faut donc vérifier. JMGuyon (discuter) 17 février 2025 à 23:59 (CET)Répondre
Le contexte. La thèse.
Il aurait probablement été intéressant d'apporter ces deux informations et d'aviser de la démarche en PDD de l'article. Qu'est-ce que c'est que cette méthode ?
Bref.
J'invite chacun à consulter la longue discussion afin de prendre connaissance des arguments et fournir leur avis. C'est souhaitable. Il me semble important de souligner que l'interprétation de la discussion du Bistro diffère très fortement d'un avis à l'autre. Que la lecture et interprétation de ce qu'est un WP:TI interpelle et ne semble pas partagé par au moins quatre des intervenants de la discussion. Que la question de la pertinence / qualité et fiabilité de la source est l'objet de la discussion et de la question afin d'atteindre un consensus. Que sur les 12 personnes de la discussions s'étant exprimée, il y a une abstention et un refus, les dix autres étant favorables avec les précautions.
La PDD a été agitée durant une journée entière et animée par tous ces contributeurs souhaitant retravailler et améliorer l'article. Au terme de cette journée, certains contributeurs parlent de tentatives de verrouillage d'article et je tente, tant bien que mal, de préserver le dialogue sur l'aspect éditorial.
Étant initialement externe au sujet et aux conflits de cette page, je pensais sincèrement que le dialogue serait possible. Je profite donc de cette demande pour que l'un ou l'autre contributeur permette de clarifier ce point. Nanoyo (discuter) 18 février 2025 à 02:01 (CET)Répondre
Deux éléments de réponse sur une des affirmations :
  • une thèse fait l'objet de publication selon les disciplines.
  • d'un autre côté, elle peut être selon les disciplines (pas nécessairement les mêmes) basée sur des publi scientifiques elles-même revues par les pairs.
- Lupin (discuter) 18 février 2025 à 07:39 (CET)Répondre
Un élément de réponse au premier point : La thèse est présentée dans la magazine Le Temps des Médias (résumé, pas complet !)
Un élément de réponse au second point : la bibliographie sur laquelle repose la thèse Nanoyo (discuter) 18 février 2025 à 07:44 (CET)Répondre
La bibliographie de la thèse est bien plus étendue que cela. Pyb en a extrait les éléments dont le titre portait le nom Le Point. Pour présenter le document, la thèse est fondée sur des interviews des fondateurs, sur une analyse de documents d'archives (au sens de documents produits par le journal ou par les personnes travaillant au journal), sur des documents comptables, sur l'analyse de la production journalistique (le contenu des journaux). Bref, un travail d'historien qui complète utilement les articles déjà utilisés. J'ai déjà ajouté pas mal d'éléments dans l'article. Girart de Roussillon (Discrepance ?) 18 février 2025 à 08:11 (CET)Répondre
Pffff, sujet déjà discuté plusieurs fois (j'avoue la flemme de chercher à cette heure-ci mais les fils sont quelque part dans les archives). Pour rebondir juste sur un points : C'est quoi une "thèse non publiée" ??? Toutes les thèses de doctorat sont imprimées a minima à plusieurs exemplaires, dont au moins un est déposé à la bibliothèque de l'université et, de nos jours, également numérisé et accessible. Une thèse de doctorat est relue et approuvée par le corps académique. Enfin, en sciences exactes, une thèse de doctorat 'n'est traditionnellement validée que si le candidat a publié au moins 2 articles dans des revues à comité de lecture. Cela veut dire que des parties de la thèse ont été publiées (a priori les plus intéressantes). Pour le reste, je me permets de signaler aimablement @JMGuyon que ce n'est pas la première fois qu'elle pose tout un tas de questions, toujours les mêmes, sur le fonctionnement des sources académiques... La PDD et l'article dont provient cette question ont des problèmes bien plus importants, il me semble. Desman31 (discuter) 19 février 2025 à 00:07 (CET)Répondre
Je suppose que par « publiée », il était fait référence à la tradition dans certaines disciplines qu'une bonne thèse est une thèse publiée chez un éditeur en version longue.
Je ne m'avancerais pas sur les « traditions », qui varient d'une discipline à l'autre, mais on peut effectivement noter que la thèse traduit les travaux effectués et revus par les pairs au cours de conférences, publications avec relecture par des pairs, validation par l'école doctorale puis le jury sur manuscrit puis sur présentation orale. Dire qu'il n'y a pas de processus éditorial ou sélection n'est pas possible. - Lupin (discuter) 19 février 2025 à 10:22 (CET)Répondre
S'il y a consensus, faisons évoluer les textes. Parce que je me suis toujours interdit de puiser dans les thèses non publiées (en sciences humaines), pensant que l'on pourrait m'accuser de puiser dans des travaux inédits.
Donc il faut écrire : une thèse non publiée (id est non publiée chez un éditeur,sans ISBN, non commercialisée) est autorisée sans condition. J'ajouterais : même si aucune vérification n'a été effectuée concernant la WP:Proportion, et concernant le fait que cette thèse a été relayée hors de Wikipédia. J'ajouterais aussi : même si l'auteur est un parfait inconnu, comme semble l'être Nicolas Tryzna (je n'ai trouvé aucun article de lui dans une revue quelle qu'elle soit ; je trouve bien de lui un livre de 2011, soit 6 ans avant sa soutenance de thèse, mais publié par les Editions universitaires européennes, qui font l'objet de cette mise en garde sur le site d'une université : "Plusieurs étudiants à la maîtrise ou au doctorat sont fréquemment sollicités par les Éditions Universitaires Européennes, via un courriel flatteur et personnalisé, pour publier en ligne leur mémoire ou leur thèse gratuitement. Soyez prudent si vous recevez un courriel de ces maisons d'édition. Sans être frauduleuses, leurs pratiques sont pour le moins contestables et peuvent vous occasionner des problèmes indésirables."). A noter que le lien présenté par Nanonoyo vers Le Temps des médias n'est nullement un compte rendu, masi un court résumé par Nicolas Tryzna.
Je notifie des admins et patrouilleurses qui ont l'habitude de trier les sources, @Bertrand Labévue, @Lebrouillard, @Pa2chant.bis, @Hyméros, @Arroser, @GPZ Anonymous et @Jean-Christophe BENOIST, pourriez-vous dire s'il vous plaît si vous êtes d'accord avec cette modification de WP:Citez vos sources ? Cordialement---JMGuyon (discuter) 19 février 2025 à 14:25 (CET)Répondre
Pourquoi "sans condition" ? Il y en a toujours comme la pertinence de la source ou son contexte (pédigré de l'auteur, du directeur de thèse, de l'université, etc). De plus sur les sujets où le débat académique est ouvert, spécialement en sciences humaines, le texte de l'auteur ne reflète que son point de vue qui doit être attribué pour respecter WP:PROP. Desman31 (discuter) 19 février 2025 à 14:26 (CET)Répondre
L'attribution du point de vue vaut en général, dès qu'un point de vue n'est pas consensuel, cet élément est sans rapport avec la nature de la source - publiée ou non publiée.
WP:Proportion doit s'appliquer toujours, mais ici, par vote, il a été décidé de s'en passer ; du moins c'est ainsi que je perçois la non-réponse à mes demandes répétées concernant le fait de savoir si cette thèse est relayée quelque part hors de Wikipédia.--JMGuyon (discuter) 19 février 2025 à 14:43 (CET)Répondre
Je vais modifier WP:Sources fiables ; cf. Discussion Wikipédia:Sources fiables#Une thèse non publiée peut être utilisée, sans restriction JMGuyon (discuter) 20 février 2025 à 18:22 (CET)Répondre
Bonjour @JMGuyon,
les échanges ont indiqué que les thèses de doctorat doivent être utilisées dans le respect de WP:PROP, avec attribution, en tenant compte de la pertinence de la source ou son contexte (pédigré de l'auteur, du directeur de thèse, de l'université, etc). Typiquement, une thèse centrée sur un sujet sera plus pertinente qu'une thèse qui aborde un sujet comme effet de bord du sujet principal. La biblio est ici centrale (plus elle est étoffée, plus le sujet a été couvert). - Lupin (discuter) 21 février 2025 à 09:57 (CET)Répondre
Bis repetita : l'attribution de point de vue, WP:Proportion, le caractère centré ou non de la source ne sont pas des recommandations liées spécifiquement à tel ou tel type de source, et devraient s'appliquer de toute manière, pour toutes les sources, donc inutile de préciser ces 3 points concernant les thèses non publiées.
Cela dit, si j'ai bien compris @Fabius Lector, on peut se passer de WP:Proportion concernant les thèses non publiées, puisqu'en réponse au fait que personne n'a relayé la thèse d N. Tryzna hors de Wikipédia, ce user me répond que le jury de thèse garantit à lui seul l'intérêt de la thèse cf. "Quant à dire qu'on juge inutile de savoir si ça a été jugé fiable et intéressant avant, je crois que c'est faux d'après ce qu'en dit GF38storic : les thèses soutenues ont été contrôlée avant, avec une direction de thèse qui vaut bien les chefs de rédaction des médias qu'on accepte de manière standard". Donc automatiquement toute thèse soutenue mais non publiée répondrait à WP:Proportion, de même que, si l'on suit ce raisonnement, tout article publié dans une revue à comité de lecture. Pour moi c'est totalement nouveau, quand on sait le nombre de thèses comprises dans des dossiers retoqués ensuite par le Conseil national des Universités, mais soit, pourquoi pas.
Le pedigree de l'auteur : manifestement ce critère n'est pas du tout consensuel, puisque N. Tryzna a zéro pedigree, et que néanmoins tout le monde est d'accord pour l'utiliser.
Le pedigree du directeur de thèse : je l'ai intégré dans ma proposition de modification de [[{WP:Sources fiables]] (bien qu'à titre personnel, je sois en désaccord : l'auteur de la thèse n'est pas le directeur de thèse, et de nombreux directeurs, débordés, en particulier dans les grandes universités, sont extrêmement négligents dans leur travail de direction ; mais mon avis personnel s'efface devant celui de la majorité).--JMGuyon (discuter) 21 février 2025 à 10:48 (CET)Répondre
Quel rapport entre l'usage d'UNE thèse et WP:Proportion ? L'importance s'évalue par rapport au paysage des sources et des points de vue, ça ne dépend pas d'une source en soi. Et n'est-ce pas simplement le bon sens que de savoir qu'un travail journalistique de base, tous ces articles d'actualité rédigés en une journée qu'on met en source, n'est pas en soi supérieur à un travail de thèse ? Va-t-on aussi demander le taux de diffusion d'un article de presse, savoir si il a été bien revu par des pairs, critiqué par d'autres journaux etc. avant de l'utiliser ? Et je ne parle pas d'usages de publications scientifiques citées par personne, publiées dans des revues confidentielles, que toi-même tu utilises à l'occasion.
Et à nouveau : c'est du cas par cas (cf. Généralisation abusive), et il n'y a pas que la source à évaluer, il y a aussi l'usage que l'on en fait à voir. P.e. Tryzna donne des faits bruts, une chronologie, des graphiques de ventes et de nombres d'abonnés qui ne devraient poser problème à personne. Ou au niveau politique, il fait une comparaison du traitement des élections présidentielles lui faisant dire que ça a changé avec Giesbert, ceci appuyé sur une analyse précise de numéros du magazine des élections de 1974 à celles de 2012, chose qu'on sera bien en peine de trouver ailleurs. Fabius Lector (discuter) 21 février 2025 à 11:39 (CET)Répondre
Dans tous les cas une thèse c'est surtout intéressant pour la partie synthétique. Pour la partie "travail original" du cœur de la thèse, ça a à peu près la valeur des articles publiés par la personne par ailleurs qui sont supposés lui servir de base, donc on se réfère à la politique sur la valeur comme source de ces articles, et ça devrait être possible de les utiliser directement. — TomT0m [bla] 21 février 2025 à 12:06 (CET)Répondre
@GF38storic pour permettre de confirmer le propos que vous lui attribuez - Lupin (discuter) 22 février 2025 à 23:42 (CET)Répondre
@Fabius Lector si vous dites "qu'on serait bien en peine de trouver ailleurs" que chez Tryzna "une analyse précise de numéros du magazine des élections de 1974 à celles de 2012", donc on ne respecte pas WP:Proportion. Tout ce qui s'écrit n'a pas à se retrouver dans une encyclopédie, il faut que ce soit notoire.
Quant à votre comparaison de Nicolas Tryzna et d'un historien (Ts. Sahara) que j'ai utilisé sur une autre page : il n'y a de mon point de vue pas de commune mesure entre Tryzna, inconnu au bataillon, sans autre titre qu'une thèse qui n'a pas eu de suite (ni poste ni publications), et Ts. Sahara, qui a mené une vraie carrière universitaire. 1)Le fait d'avoir un poste de chercheur implique un niveau supérieur de validation (la plupart des gens qui ont soutenu une thèse n'obtiennent pas de poste. 2)Ts. Sahara a publié des livres (et des articles dans des revues académiques), ce qui implique là aussi un niveau supérieur de validation, comme il est écrit encore à l'heure actuelle dans WP:Sources fiables, mais ce critère étant indifférent à la plupart d'entre vous, je vais l'enlever, pour ne pas défavoriser les auteurs de thèse "du bas de l'échelle". Il a été fait appel à Ts. Sahara pour écrire dans l'International Encyclopedia First World War (Janz, Oliver. « 1914-1918-Online: The International Encyclopedia of the First World War ». Cent Ans après : La mémoire de la Première Guerre Mondiale, édité par Elli Lemonidou, traduit par Christos Apostolopoulos, École française d’Athènes, 2019, https://doi.org/10.4000/books.efa.4583 ; 1914–1918 Online (en)), entre autres. Tryzna : rien.
Là où je suis d'accord avez vous, c'est sur la supériorité des sources académiques par rapport aux articles de la presse.--JMGuyon (discuter) 21 février 2025 à 18:09 (CET)Répondre
Mais pourquoi comparer un extrême avec l'autre, et pas avec les meilleures sources (les ouvrages de synthèse sur un sujet) ? Quand on compare avec le pire, tout est mieux. Les problèmes des thèses ou études scientifiques sont les mêmes : 1) Très difficile à lire, à interpréter, à synthétiser et à vérifier. Il faut être (très) spécialiste pour vraiment comprendre, et les problèmes d'interprétation ou de synthèse potentiels sont importants 2) On trouve des thèses et des études qui disent tout et leur contraire, notamment (mais pas que) dans le domaine médical (on l'a vu lors du COVID) ou des sciences humaines. On ne peut pas toutes les mettre sur le même plan, et les "cherry picker" à loisir selon ce que on veut dire ou démontrer. Des sources de synthèse, ou des méta-analyses sont souvent nécessaires pour s'orienter et connaitre les plus pertinentes, et les synthétiser correctement à notre place. Après, sur des sujets non polémiques, cela peut être envisageable, ponctuellement. Jean-Christophe BENOIST (discuter) 21 février 2025 à 21:00 (CET)Répondre
@JMGuyon, je ne vais pas développer plus, c'est juste du bon sens qu'une thèse de 400 pages avec un contrôle universitaire vaut généralement autant qu'un article de journaliste et qu'une simple publication dans un journal scientifique est inférieure aux méta-études et travaux de synthèse qui présentent un panorama des thèses en concurrence. De manière générale, il suffit souvent de voir si il y a présentation de thèses concurrentes pour savoir si on est dans du travail réellement secondaire. Pour le reste, les thèses en question s'accordent normalement sur un fond commun, factuel, la matière du sujet, pour ne diverger que sur sa lecture, son interprétation. En l'occurrence, que ce soit Tryzna pour Le Point ou Sahara pour Gaza, ils s'appuieront sur des faits basiques qu'on peut sourcer avec eux, et il y a juste à attribuer ce qui représente leur apport personnel, leur thèse. Fabius Lector (discuter) 21 février 2025 à 23:20 (CET)Répondre
@Fabius Lector nous ne parlons ici que des thèses non publiées, non du reste.
Quand vous écrivez  : "on serait bien en peine de trouver ailleurs" que chez Tryzna "une analyse précise de numéros du magazine des élections de 1974 à celles de 2012", vous avez conscience de relayer une analyse isolée ; voir le Bistro d'hier, "une analyse isolée a beaucoup moins de poids que des analyses multiples (WP:PROP)", dans une discussion avec Jean-Christophe BENOIST.
A la différence de @Jean-Christophe BENOIST toutefois, je prendrais garde à ce que l'on appelle "sujets non polémiques". AInsi j'ai vu des bios de membres de l'Action française gonflées artificiellement à coups de sources primaires et de thèses non publiées,avec comme réponse : "mais ce que j'écris est factuel". Le résultat était que l'article Wikipédia donnait une image d'importance à des personnalités habituellement traitées de manière expéditive. Dans le cas du Point, il convient de prendre garde à ne pas développer de manière exagérée des aspects sur lesquels les sources secondaires notoires a priori passent légèrement, ce qui fausse l'idée des proportions réelles dans ces sources.
Enfin que, de manière générale, une thèse même non publiée vaille plus qu'un article de journal, je le crois, mais malheureusement dans Wikipédia, il y a une contrainte, ou un garde-fou, la notoriété / notabilité, critère central. Si l'on suivait votre raisonnement, on accepterait des textes non publiés de grands noms de l'université, au motif que ça vaut infiniment mieux que le papier bâclé d'un journaliste de 22 ans, ce qui serait exact, mais dans Wikipédia ça ne fonctionne pas ainsi.--JMGuyon (discuter) 22 février 2025 à 07:10 (CET)Répondre
C'est un peu oublier aussi le principe de gradation de l'exigence des sources en fonction du caractère polémique ou inédit. Sur une information pas très polémique, et sans beaucoup d'enjeu, il n'y a pas de raison d'être trop exigeant. Wikipédia fonctionne aussi sur un principe de souplesse. — TomT0m [bla] 22 février 2025 à 12:02 (CET)Répondre
@JMGuyon, quand je parle d'analyse avec Tryzna, il s'agit d'une chose assez simple à utiliser, le décompte factuel de pages consacrées par Le Point aux analyses post-élections, le fait que ça augmente avec Giesbert, et éventuellement l'interprétation du fait attribuable à l'auteur, sa lecture. On peut se passer de l'interprétation si on veut mais ça ne coûte pas grand chose de l'indiquer vu qu'elle n'est pas polémique et si quelqu'un fait un jour une autre lecture, on pourra l'indiquer aussi, le fait restant ce qu'il est. Comme dit TomT0m, on ne va pas batailler sur des infos qui ne posent guère de problème, avec des auteurs qui n'ont pas d'autre enjeu qu'un travail universitaire sérieux. Autant éviter que le mieux soit l'ennemi de bien et finir dans une hypercritique paralysante quand le bon sens suffit pour voir qu'on a une source qui n'est peut-être pas parfaite mais n'engage rien de grave avec un sourçage qui pourra peut-être être amélioré plus tard.
P.S. les faits relevés par Tryzna : c'était entre 1 et 4 pages avant Giesbert (élections 1972, 1981, 1988, 1995), ça passe à 6, 8 et 16 pour 2002, 2007, 2012. L'interprétation : « Sous Franz-Olivier Giesbert, l’élection présidentielle est un combat personnel et il faut donc donner la situation des deux combattants après le combat. » Fabius Lector (discuter) 22 février 2025 à 12:42 (CET)Répondre
@Fabius Lector ce qui pose problème est la sélection des informations et le choix du cadrage, quand il serait possible d'effectuer une sélection tout à fait différente. Il me paraît clair au vu de l'exemple que vous donnez, et au vu de l'évolution de l'article, qu'on est en train de rembourrer la page avec des informations dont on ne trouve pas l'équivalent dans d'autres pages consacrées à des médias, infos ultra-spécialisées, au détriment du style synthétique qui doit être de mise dans une encyclopédie. Par exemple des innovations à partir du n° 10, avec nouvelle rubrique sur les indiscrétions politiques, embauche d'un dessinateur, etc. Tout cela est anecdotique pour des non-spécialistes. Vous dites "rien de grave" ; il se trouve, par une étrange coïncidence, que ce rembourrage dont on ne voit pas beaucoup d'exemples, se produit en un moment particulier, où certains affirment que WP:Prop n'aurait pas été respecté, et là on va puiser dans la thèse non publiée d'un illustre inconnu que nous sommes seul.e.s à relayer, pour ... un meilleur respect de WP:Prop ?
Quand je cite une discussion entre Jules* et Jean-Christophe Benoist, qui se termine sur , "une analyse isolée a beaucoup moins de poids que des analyses multiples (WP:PROP)", je rappelle tout simplement les bons usages éditoriaux. — Le message qui précède, non signé, a été déposé par JMGuyon (discuter), le 23 février 2025 à 15:56.
Je plussoie. Le problème des analyses isolées est le cherry picking et le POV-pushing (mise en avant arbitraire) potentiel. Cela dit, même si c'est subjectif, le caractère polémique ou non du sujet ou de la thèse entre en compte, et aussi un autre critère : les sources disponibles sur un sujet. Il m'est arrivé d'utiliser des thèses (pas souvent) dans le domaine musical, car les sources disponibles analysant l'oeuvre musicale étaient rares. Une oeuvre musicale n'est en général pas un sujet polémique, et si il n'y a pas 36000 points de vues sur un sujet, on ne peut pas dire que on en met un arbitrairement en avant ! --Jean-Christophe BENOIST (discuter) 23 février 2025 à 17:22 (CET)Répondre
@JMGuyon, si vous souhaitez parler du contenu de l'article du Point, c'est en page de discussion de l'article qu'il faut le faire. Je ne répondrai donc pas à vos observations ici.
Je suis pratiquement le seul à essayer d'apporter du contenu à l'article. Sur un article "normal", j'aurais vingt fois le temps, sur plusieurs semaines ou mois, de me relire pour reprendre, synthétiser ou enlever des passages. Sur un article aussi "observé", n'importe quelle contribution est sous le feu des projecteurs. Je ne dis pas que ce je fais est parfait, mais la critique est toujours plus facile.
Une de vos phrases me fais tiquer :
« Vous dites "rien de grave" ; il se trouve, par une étrange coïncidence, que ce rembourrage dont on ne voit pas beaucoup d'exemples, se produit en un moment particulier, où certains affirment que WP:Prop n'aurait pas été respecté, et là on va puiser dans la thèse non publiée d'un illustre inconnu que nous sommes seul.e.s à relayer, pour ... un meilleur respect de WP:Prop ? ». Que sous-entendez-vous par "étrange coïncidence" ?
En outre, ce n'est pas "certains", mais à peu près tout le monde qui dit que "WP:Prop" n'est pas respecté. Girart de Roussillon (Discrepance ?) 23 février 2025 à 20:33 (CET)Répondre
@Girart de Roussillon j'ai ouvert une section ici en indiquant que la question avait une portée générale, pour ne pas personnaliser le débat. Mais Nanonoyo s'en est scandalisé ("Qu'est-ce que c'est que cette méthode" ?") et a considéré qu'il fallait indiquer la thèse et la page Wp qui étaient le point de départ de mon questionnement, en me désignant implicitement comme quelqu'un qui verrouille l'article, et voilà comment mon projet d'en rester à une discussion générale a "capoté". Il ne faut donc pas s'étonner qu'on parle ... de la thèse et de la page Wp.
L'intérêt de cette section est qu'elle a conduit malgré tout à l'émergence d'un consensus et à la modification de WP:Sources fiables. Accessoirement, je vais enfin pouvoir utiliser des thèses moi aussi, sans craindre qu'on me tombe dessus.
Je trouve très bien que vous enrichissiez l'article, mais j'ai aussi des critiques concernant l'utilisation d'un parfait inconnu, que Wikipédia est la seule à relayer :/, pour des détails que Tryzna est le seul à produire, parfois sans intérêt encyclopédique, et dans des proportions aussi démesurées : 45 citations ! cf. la discussion citée entre Jules* et Jean-Christophe BENOIST : "Une analyse isolée a beaucoup moins de poids que des analyses multiples (WP:PROP)".
"Tout le monde dit que WP:Proportion n'est pas respecté", écrivez-vous : mais on ne rétablit pas la proportion avec des analyses isolées extraites d'une source dont la notoriété est nulle, rédigée par un auteur dont la notoriété est voisine de zéro.
L"étrange coïncidence" : c'est dans l'idée de rétablir une meilleure proportion que cette thèse a été utilisée, sauf qu'à mon avis, elle rompt la proportion. Quand elle converge avec la source Michel Jamet, OK, il n'y a rien à dire. Mais quand il s'agit d'un monceau de détails qui, même dans une thèse, paraissent sans grand intérêt (sinon de faire état de recherches scrupuleuses et érudites dans les archives, en vue de décrocher le diplôme), alors dans une encyclopédie censée opérer une synthèse, de mon point c'est encore moins pertinent .--JMGuyon (discuter) 23 février 2025 à 21:10 (CET)Répondre
Un auteur ne fait pas des recherches de détail pour décrocher un diplôme, il fait des recherches poussées "de détail", pour établir des faits dans toute leur complexité, en mettant en exergue les apports des différentes sources, ainsi que là où elles se rejoignent et là où elles divergent. C'est ensuite qu'il peut interpréter. C'est cela le travail de recherche. Et l'auteur doit fournir ces détails pour prouver son récit dont ses interprétations.
S'il faut synthétiser davantage certains passages de l'article du Point, cela relève de la rédaction et n'a plus rien à voir avec le projet "sources" mais avec la PDD de l'article.
J'ai relu WP:Prop et je ne partage pas l'interprétation que vous en faites.
« L’importance disproportionnée ou le poids indu (de l'anglais undue weight) est le fait de consacrer une place excessive à un point de vue (POV) particulier dans un article encyclopédique. Celui-ci n'est alors pas représentatif du savoir actuel. » Mais, il est explicité que ce point de vue particulier s'opposerait à d'autre(s) point(s) de vue. Quand il n'y a pas de point de vue opposé sur un sujet non polémique, comme de simples faits historiques, WP:Prop ne s'applique pas.
C'est ainsi que j'interprète les nombreux articles labellisés récemment où une source est préférentiellement utilisée : Cheval à La Réunion, Colonne votive de Lisieux, Piles gallo-romaines de Betbèze, etc.
Votre interprétation me semble opposée à la pratique communautaire. Girart de Roussillon (Discrepance ?) 23 février 2025 à 23:13 (CET)Répondre
J'ai fait référence au Bistro du 21 février 2025, non à une opinion personnelle : cf. "même si on n'accepte pas l'idée que les idées originales sont "en bas" de la pyramide des sources (juste au-dessus des faits, par opposition aux "vraies" sources secondaires, qui ne produisent pas de nouveau savoir, seulement synthèse du savoir existant), il y a toujours WP:Proportion. En général, les idées/analyses originales/inédites sont de faible Proportion, et sont pas multi-sourçables surtout si elles n'ont pas été remarquées."; ", "une analyse isolée a beaucoup moins de poids que des analyses multiples (WP:PROP)" ; "La Proportion, c'est aussi - et même surtout - le nombre de sources qui arrivent dans l'idée aux même conclusions et à la même analyse indépendamment. Il y a là un le signe d'un début de pertinence objective. Mais si une seule source arrive à des conclusions, il faut (au moins) se poser des questions".
La distinction entre "faits" et "point de vue" est éminemment fragile, parce que les faits sont toujours construits par le regard de quelqu'un, qui produit un découpage singulier dans le réel.
Le cadrage ou POV choisi par Nicolas Tryzna est-il "représentatif du savoir actuel" ? A priori non, puisque Nicolas Tryzna lui-même affirme que son cadrage est rarement pratiqué : "au sein de l'histoire de la presse écrite, déclare Tryzna "la presse magazine reste la grande oubliée, en particulier les magazines d’actualité générale (...) Cette recherche entend compenser ce manque". D'ailleurs c'est ce qui fait la valeur d'un travail de recherche : modifier la perspective. Fabius Lector qui cite Tryzna, a reconnu que l'approche de Tryzna est unique : cf. plus haut : "Tryzna fait une comparaison du traitement des élections présidentielles lui faisant dire que ça a changé avec Giesbert, ceci appuyé sur une analyse précise de numéros du magazine des élections de 1974 à celles de 2012, chose qu'on sera bien en peine de trouver ailleurs". --JMGuyon (discuter) 23 février 2025 à 23:57 (CET)Répondre
Votre raisonnement est bancal. « Le cadrage ou POV choisi par Nicolas Tryzna est-il "représentatif du savoir actuel" ? A priori non, puisque Nicolas Tryzna lui-même reconnaît que son cadrage est rarement pratiqué : au sein de l'histoire de la presse écrite "La presse magazine reste la grande oubliée, en particulier les magazines d’actualité générale. ». Dans ce cas, rejetons les travaux de Odoul et Jamet utilisés dans l'article du Point puisque ce cadrage est rarement pratiqué, et puisque chacun aura développé dans son article des aspects que l'autre n'aura pas traité.
Vous donnez l'impression, à votre corps défendant je veux bien le croire, de tout faire pour limiter l'utilisation du travail de Tryzna et je n'en comprend pas l'intérêt. Il me semble que vous êtes seul avec cet objectif. Il est nécessaire que vous le compreniez. De mon côté, je cesse les échanges car il apparaît manifeste que nous n'arriverons pas à nous convaincre mutuellement. Girart de Roussillon (Discrepance ?) 24 février 2025 à 00:36 (CET)Répondre
S'il y a contestation d'un PdV (pour des raisons motivées), c'est qu'il y a de la polémique quelque-part. Rien n'empêche d'utiliser une source préférentiellement, si elle est représentative du savoir actuel. Si elle est représentative, il ne devrait pas y avoir de polémique. Mais là semble-t-il ils'agit de PdV originaux, pas en désaccord avec le savoir actuel. Ces PdV on sans doute droit de cité, mais pas occuper une grande partie dans l'article. Ce serait donner une visibilité à des PdV originaux, au détriment de la Proportion du savoir établi, car si on lit l'article on peut croire que ces PdV originaux font parti du savoir établi, voire plus rester en mémoire que le savoir établi. Donc tout est une question de place/quantité dans l'article (sans doute pas nulle). Je n'ai pas suivi ce cas précis pour donner mon avis sur ce cas. Jean-Christophe BENOIST (discuter) 24 février 2025 à 13:03 (CET)Répondre
Réponse à Girart de Roussillon : que le cadrage de N. Tryzna soit rarement est une certitude puisqu'il le déclare lui-même ; j'ignore si les travaux de Odol et Jamet ont un cadrage rarement pratiqué mais d'une part les textes de Véronique Odul et Michel Jamet sont publiés de manière classique dans des lieux reconnus, et ces auteurs ont d'autres publications du même type, ce ne sont pas de parfaits inconnus ; d'autre part, leurs études utilisées ici sont citées ailleurs (comme le montre une recherche rapide en ligne) ; enfin ils sont utilisés dans Wikipédia de manière plus raisonnable, 16 fois pour l'une, 18 fois pour l'autre, alors qu'on en est à 52 références pour un auteur, N. Tryzna,que, jusqu'à preuve du contraire, personne ne cite à part nous. Si en réponse à un propos argumenté, vous n'avez que des manquements à WP:FOI à offrir, je ne trouverai pas triste que vous ne veuillez pas continuer l'échange.--JMGuyon (discuter) 24 février 2025 à 21:14 (CET)Répondre

a des publications dans des lieux reconnus,

Bonjour à tous,
J'arrive après les discussions. Néanmoins, la formulation "Les mémoires ou thèses complètes rédigés dans le cadre des exigences d'un doctorat et qui sont accessibles au public (la plupart par prêt entre bibliothèques ou via Proquest) peuvent être utilisés. Si possible, utilisez des thèses supervisées par des spécialistes reconnus dans le domaine..." me paraît un peu dangereuse. Aujourd'hui encore, des thèses de doctorat d'université tunisiennes défendent ouvertement le créationnisme et le concordisme. Je propose une reformulation en "Les mémoires ou thèses complètes rédigés dans le cadre des exigences d'un doctorat et qui sont accessibles au public (la plupart par prêt entre bibliothèques ou via Proquest) peuvent être utilisés [s'ils sont supervisés] par des spécialistes reconnus dans le domaine...". Qu'en pensez-vous ?
Bien à vous,
Hesan (discuter) 24 février 2025 à 21:32 (CET)Répondre
Bonjour @JMGuyon merci de ne pas modifier unilatéralement la métapage WP:FIABLE, étant donné qu'à peu près tout le monde ici est contre votre proposition. On ne modifie pas une règle générale parce que sur un cas particulier vous n'arrivez pas à vous mettre d'accord. Par ailleurs, j'en profite pour signaler que la phrase "Si possible, utilisez des thèses supervisées par des spécialistes reconnus dans le domaine." ne veut rien dire étant donné qu'un directeur de thèse est forcément un chercheur chevronné et spécialiste dans son domaine. Bref, l'ancienne formulation me semble claire avec suffisamment de mises en garde pour éviter les thèses genre Bogdanoff. Wikipédiennement, Desman31 (discuter) 26 février 2025 à 00:43 (CET)Répondre
@Hesan Je ne pense pas qu'on puisse lister ici la situation pour chaque pays, cependant merci de l'avoir signalé ici. Ce sera enregistré et archivé avec cette PDD, pour les contributeurs qui se posent la question à l'avenir. Desman31 (discuter) 3 mars 2025 à 11:14 (CET)Répondre
Bonjour,
Je ne pense pas qu'il faille lister la situation de chaque pays mais il est, pour moi, nécessaire de formuler correctement nos propres règles... J'ai cité un exemple mais je doute que les thèses religieuses soient les seules à poser soucis. Qu'en est-elle des doctorats dans les dictatures ? les pays où l'université ne respecte pas un système aussi strict que le nôtre ?
Une rédaction comme "Les mémoires ou thèses complètes rédigés dans le cadre des exigences d'un doctorat et qui sont accessibles au public (la plupart par prêt entre bibliothèques ou via Proquest) peuvent être utilisés [s'ils sont supervisés] par des spécialistes reconnus dans le domaine..." serait un cas général suffisant. Qu'est-ce que cela apporte de ne pas corriger ainsi ? si ce n'est autoriser les thèses qui ne sont absolument pas reconnues dans leur domaine...
Bonne soirée, Hesan (discuter) 3 mars 2025 à 20:26 (CET)Répondre
Note : attention à ne pas francocentrer le débat, « le notre » ne se réfère pas au même système pour tout le lectorat :) - Lupin (discuter) 3 mars 2025 à 20:51 (CET)Répondre

"Dictionnaire des wallonsé" par la Région wallonne

[modifier | modifier le code]

Bonjour,

En s'interrogeant dernièrement sur les pages belges, et leurs absentes, on évoquait une personnalité. Dans ma recherche, je suis du coup tombé sur https://connaitrelawallonie.wallonie.be/fr/wallons-marquants/dictionnaire-des-wallons

Je me demandais si ce type de sources ne pourrait pas être considérée comme tertiaire ? Un avis sur la qualité de cette source ? Nanoyo (discuter) 21 février 2025 à 09:56 (CET)Répondre

Occurrences de Wikinews dans les articles...

[modifier | modifier le code]

Bonjour Émoticône tout le monde, il y a actuellement 115 articles qui utilisent Wikinews sur Wikipédia. Pour rappel, d'après la recommandation WP:WPS, Wikinews n'est évident pas une source fiable pour nos articles. Si vous pouvez aider à retirer les liens, ça serait sympa Émoticône ! Tout n'est pas à jeter, certains liens sont pertinents, mais dans la plus part des cas, il existe des sources secondaires, sinon il faut remplacer par {{refsou}} ou {{refnec}}.

Bonne journée, 🐢 Monsieur Tortue (💬) 2 mars 2025 à 17:39 (CET)Répondre

Bonjour Notification Mr Tortue : « Tout n'est pas à jeter, certains liens sont pertinents » => vous voulez dire qu'il faut conserver certains liens vers Wikinews ? Si oui, comment on fait pour faire la différence entre le bon lien vers Wikinews et le mauvais lien ? Merci d'avance Bienbom (discuter) 24 mars 2025 à 11:41 (CET)Répondre
Bonsoir Bienbom Émoticône, quand je parle du « bon lien » (et pas du bon chasseur Émoticône), je pense notamment à ceux sur les pages comme Janvier 2010 en sport (« Visitez Wikinews pour lire... » en haut à droite) ou bien tout simplement sur Wikinews. Mais sinon oui, pratiquement tout lien wikinews qui se trouve dans une balise ref devrait être remplacé ou supprimé. Bonne soirée, 🐢 Monsieur Tortue (💬) 25 mars 2025 à 22:55 (CET)Répondre
Merci pour la réponse, j'ai compris cette fois. Bienbom (discuter) 26 mars 2025 à 11:09 (CET)Répondre

Jean Tosti

[modifier | modifier le code]

Bonjour à tous.

J'ai été assez étonné de trouver deux extraits d'une même page de ce site sur deux articles différents[3][4], mais bon, sur des articles un peu anciens, cela peut arriver. Après un tour sur le site en question, puis sur sur sa page secondaire, là je me suis dis que peut-être, il y avait un peu de nettoyage à faire. En fait, ce site (en http et pas https) compte 163 liens sur Wikipédia. Vu sa qualité apparente, c'est assez étonnant, mais peut-être faudrait-il le signaler à un projet qui y tient ? SammyDay (discuter) 5 avril 2025 à 23:05 (CEST)Répondre