Permalink

Was ist ein guter Standard?

Langlebigkeit

Webdokumente werden im Grunde für die Ewigkeit geschrieben. Wenn etwas wertvoll genug ist, niedergeschrieben zu werden, dann ist es auch wertvoll genug, bewahrt zu werden. Man weiß nie, wann etwas nicht mehr von Nutzen ist oder was alles davon abhängig ist. Als Konsequenz daraus sollte man URLs niemals »sterben« lassen. Das ist mittlerweile allgemein bekannt.

Sie sollten darüber hinaus Inhalte so verfassen, dass sie technologische Änderungen mit hoher Wahrscheinlichkeit überleben, denn es kann irgendwann sehr teuer werden, veraltete Dokumente in ein anderes Format zu konvertieren. Wie erreicht man das? Sofern man nicht die Zukunft voraussagen kann, ist die beste Faustregel, die Standards einzuhalten, unter anderem die W3C-Spezifikationen und -Richtlinien.

Allerdings ist es trotz Tims Bitten (siehe [TBL98]) sehr unwahrscheinlich, dass viele aktuelle URLs noch in 50 Jahren existieren werden, aber die Dokumente, die heute auf diese Ressourcen verweisen, werden wahrscheinlich noch existieren, und wenn sie in HTML geschrieben worden sind, werden sie auch weiterhin lesbar sein.

Das bringt eine Verantwortung für die Entwickler von Spezifikationen mit sich. Sie müssen sich immer fragen, ob die Spezifikation fördert, oder zumindest erlaubt, dass Webressourcen so erstellt werden, dass sie noch in 50 Jahren zu entziffern sind. Weil Entwickler die Zukunft genauso wenig voraussehen können wie jeder andere auch, folgen sie folgenden Faustregeln:

  • Füge keine Funktionen ein, von denen du jetzt schon weißt, dass sie in der nächsten Version missbillig (deprecated) sein werden.
  • Verwende einfache Formate, die decodiert werden können, wenn die Spezifikation verloren geht. Verwende vielleicht ein Textformat.
  • Sei geräteunabhängig, wann immer es möglich ist, oder setze geräteabhängige Teile in separate Module.
  • Et ceterea, siehe das Inhaltsverzeichnis dieses Essays.

Und was ist nun mit toten URLs? Der traditionelle Weg, Information davor zu schützen, in Vergessenheit zu geraten, ist, redundante Metadaten innerhalb einer Ressource anzubieten: Eine Bibliothek kann ein verloren gegangenes Buch durch die Information auf der Titelseite wiederfinden. Im Web können wir das zurzeit ein wenig besser machen, weil wir Metadaten (zum Teil) maschinenlesbar gestalten können. Daher ist es eine gute Idee, in jedes Datenformat Standardfelder für Informationen einzufügen, die helfen, die Ressource zu identifizieren: meta und link in HTML, eingebettetes RDF in SVG, @author/@version in Java und so weiter.

Siehe auch

[Kahle97]
Kahle, Brewster. Preserving the Internet in: Scientific American. Mar 1997. URL: http://www.sciam.com/0397issue/0397kahle.html
[Nielsen98]
Nielsen, Jakob. Fighting linkrot. 14 Jun 1998. Alertbox column. URL: http://www.useit.com/alertbox/980614.html
[TBL98]
Berners-Lee, Tim. Cool URIs don't change. 1998. W3C. URL: http://www.w3.org/Provider/Style/URI