Uniform Resource Locator
Als Uniform Resource Locator (URL, dt. „einheitlicher Quellenanzeiger“) bezeichnet man eine Unterart von Uniform Resource Identifiern (URIs). URLs identifizieren und lokalisieren eine Ressource über das verwendete Netzwerkprotokoll (beispielsweise HTTP oder FTP) und den Ort (engl. location) der Ressource in Computernetzwerken.
Da URLs die erste und häufigste Art von URIs darstellen, werden die Begriffe häufig synonym verwendet.
In der Umgangssprache wird URL häufig als Synonym für Internetadresse verwendet.
Die URL zu diesem Artikel ist beispielsweise http://de.wikipedia.org/wiki/Uniform_Resource_Locator
.
Aufbau
Mögliche Elemente einer URL sind:
http://hans:geheim@www.example.org:80/demo/example.cgi?land=de&stadt=aa | | | | | | | | | | host | url-path searchpath | | password port | user protocol
Zwingend erforderliche Mindestbestandteile einer URL sind dabei lediglich das Protokoll, der Host und der Pfad. Wobei letzterer auch leer sein kann. [1]
protocol
Das verwendete Netzwerkprotokoll, über das die Ressource lokalisiert werden kann. Zum Beispiel das HTTP, HTTPS oder FTP.
user / password
Falls benötigt, kann ein Login aus Benutzername (user) und Passwort (password) übermittelt werden. Diese werden, voneinander durch Doppelpunkt getrennt, der Domain mit einem trennenden At-Zeichen (@) vorangestellt.
Auch wenn für dieses Beispiel das Protokoll HTTP gewählt wurde, ist die Angabe von Benutzername und Passwort als Teil der URL gerade nicht Teil der HTTP-Spezifikation![2] Aktuelle Browser akzeptieren diese URL-Syntax zwar, fragen aber beim Benutzer nach, ob er sich wirklich mit den angegebenen Daten anmelden möchte. Der Internet Explorer 6 (ab Windows XP SP2) fällt hier aus dem Rahmen, indem er diese URL-Syntax rundweg als fehlerhaft ablehnt. Mit einem Registry-Eintrag kann man ihn zum gleichen Verhalten zwingen, wie es seine Vorgänger bis Version 5.5 zeigen: Diese übernehmen die Anmeldedaten ungefragt und übergeben sie direkt an den Server.
Bei einigen anderen Protokollen, etwa FTP, ist die Angabe der Benutzerdaten in der gezeigten Form dagegen völlig korrekt und durch die Standards abgedeckt.
host
Der Host, d. h. die Internet-Adresse des Host, wird nach dem Domain-Schema zusammengesetzt. An seiner Stelle kann auch eine IP-Adresse stehen. Der Host www.example.org, aus dem obigen Beispiel, besteht aus der Top-Level-Domain „org“, der Second-Level-Domain („example“) und der Third-Level-Domain („www“).
port
Die Angabe des Ports erlaubt die Ansteuerung eines TCP/IP-Ports. Wird kein Port angegeben, so wird der Standard-Port des jeweiligen Protokolls verwendet – z. B. bei HTTP 80, bei HTTPS 443 und bei FTP 21.
url-path
Der Pfad beschreibt eine bestimmte Ressource (diese kann sich z. B. mit der Verzeichnisstuktur des Zielsystems decken, also z.B. eine Datei oder ein Verzeichnis) auf dem Server. Der Pfad kann auch leer sein. Ein leerer Pfad kann optional durch einen Trailing-Slash ersetzt werden und ist zu diesem gleichbedeutend.[1]
Die Interpretation (Datei oder Verzeichnis; Textdatei liefern oder Skript ausführen) bleibt dem Server überlassen. Oft fordert ein Browser den Pfad „/“ an, und bekommt stattdessen die Datei „/index.html“ zurück, ohne dass dies für die den anfragenden Client ersichtlich wäre.
searchpath
Die URL kann z. B. im HTTP nach der eigentlichen Adresse – getrennt durch ein Fragezeichen – einen Query String enthalten. Damit können zusätzliche Informationen übertragen werden, die serverseitig Variablen zugeordnet und weiterverarbeitet werden.
Sprachliches
Artikel
Die Abkürzung URL wird im deutschen Sprachgebrauch meist mit einem weiblichen Artikel verwendet, gelegentlich auch mit einem männlichen Artikel.[3] Die Wahl des Genus hängt davon ab, ob es in Anlehnung an die deutsche Übersetzung „die Adresse“ (feminin) gebildet wird oder mittels der Regel, dass Wörter auf „-or“ (hier „Locator“) im deutschen stets maskulin sind.[4]
URLs in Texten
RFC 3986, Anhang C, empfiehlt, URIs (und damit auch URLs) in Texten
- eigenständig auf einer Zeile,
- mit doppelten Anführungsstrichen
"http://de.wikipedia.org/wiki/Uniform_Resource_Locator"
oder - mit spitzen Klammern
<http://de.wikipedia.org/wiki/Uniform_Resource_Locator>
gegen den Kontext und vor allem gegen die Interpunktion des Satzes abzugrenzen.
Siehe auch
- Digital Object Identifier
- Linkresolver, OpenURL, Ex Libris SFX
- Semacode
- Typosquatting
- URL-Kodierung (Prozentzeichen-Kodierung)
Einzelnachweise
- ↑ a b RFC3986: Uniform Resource Identifier (URI): Generic Syntax. Abgerufen am 12. Januar 2009.
- ↑ RFC2616: Hypertext Transfer Protocol -- HTTP/1.1, 3.2.2 http URL. Abgerufen am 2. November 2007.
- ↑ DUDEN – Deutsches Universalwörterbuch, siehe auch Online-Suche von www.duden.de
- ↑ Antwort des Bertelsmann-Verlags auf Frage nach Genus von "URL"
Weblinks
- RFC 3986 – Uniform Resource Identifier (URI): Generic Syntax
- RFC 1738 – Uniform Resource Locators (URL)
- RFC 1808 – Relative Uniform Resource Locators (veraltet, aktuell: RFC 3986)
- Online-Tool zur URL-Kodierung/Dekodierung gemäß RFC 3986 (JavaScript, GPL)