Vai al contenuto

Utente:Marco27Bot/refLinks.py

Da Wikipedia, l'enciclopedia libera.
La versione stampabile non è più supportata e potrebbe contenere errori di resa. Aggiorna i preferiti del tuo browser e usa semmai la funzione ordinaria di stampa del tuo browser.

Da chi è usato questo script

Qui su it.wiki, lo script è utilizzato da Marco27Bot, quindi per ogni genere di informazioni puoi contattare il suo manovratore. Il codice sorgente dello script è reperibile nel repository di pywikibot.

Cosa fa questo script?

Lo script dà un titolo ai collegamenti esterni senza titolo nelle note.

Alcuni esempi del suo funzionamento: [2], [3], [4] e [5].

Funzionamento

Note come queste:

  • <ref>[http://www.google.it]</ref>[1]
  • <ref>http://www.google.it</ref>[2]

sono convertite in:

  • <ref>[http://www.google.it Google<!-- Titolo generato automaticamente -->]</ref>[3]

e il risultato è:

  • Il titolo utilizzato come titolo del link è il titolo HTML della pagina linkata (preso dal tag <title>).
  • Gli a capo vengono convertiti in singoli spazi per evitare lunghi titoli. Gli spazi in eccesso vengono eliminati.
  • Quando i contenuti non sono di tipo text/html (quindi immagini, audio, .doc, ...), lo script non riesce a dare un titolo al documento, così lo sostituisce semplicemente con l'indirizzo del link.
  • I titoli lunghi sono troncati automaticamente a 250 caratteri. Quando questo avviene, nella parte finale del titolo compare "...".

Come posso fermare il bot mentre esegue questo script?

Se c'è la necessità di fermare il bot durante l'esecuzione di questo script, basta modificare semplicemente questa pagina. Il bot, che controlla quella pagina ogni circa 10 modifiche, si fermerà entro breve.

Caratteristiche

  • Legge i titoli dai file PDF
  • Se trova un link non attivo, lo marca con il template {{Collegamento interrotto}}; lo si potrà cercare nell'Internet Archive, vedi mw:Archived Pages.
  • Se nella pagina non è presente <references/> o {{References}}, aggiunge <references/>.
  • Quando sono presenti note con lo stesso contenuto, viene mantenuta solo la prima e alle altre viene aggiunto un refname.

Tuttavia, alcuni link non possono essere modificati dallo script. Questo può avvenire quando:

  • La pagina linkata non ha titolo nel suo codice HTML
  • Il sito si trova in blacklist
    • Blacklist dei titoli : Lo script esclude automaticamente alcune parole, come "Accedi", "Registrati", "Login", "Pagina non trovata", ecc....