Silver Server

Silver Server


Domaincheck! Internet-Adressen einrichten und verwalten.

SILVER 12

Juli 2007

Inhalt der Ausgabe


SILVER erscheint vierteljährlich auch in gedruckter Form. Bestellen Sie ein kostenloses Abo per E-Mail an:silver@sil.at

Die Ewigkeit ist lang

Bibliotheken sind Zentralorgane der Vergangenheit. In ihnen lagern Teile unseres kulturellen Erbes nun auch in digitaler Form. Doch selbst digitales ist nicht automatisch für die Ewigkeit. Ein Interview mit John A. Kunze von der California Digital Library.


Text/Interview: Andreas Kump

 

Der Traum vom Archiv, das ewig hält, dem kein Brand oder andere Einflüsse zusetzen, ist so alt wie das Archivieren selbst. Kein Wunder also, dass speziell Bibliotheken die Digitalisierung ihrer Bestände als Ende der vergänglichen Papierseiten anzusehen beginnen. Zudem kommen neuerdings auch archivierenswerte digitale Dokumente hinzu, für die es ebenfalls einen Umgang mit der Speicherung braucht. Weltweit beschäftigen sich daher etliche Institutionen mit den Besonderheiten der keinesfalls unproblematischen digitalen Langzeitarchivierung. 

Eine davon ist die California Digital Library in Oakland, deren technischer Mitarbeiter John A. Kunze im Juni 2006 im Rahmen einer Konferenz zum „European Digital Cultural Heritage“ in Salzburg referierte. Kunzes Hintergrund sind die Bereiche Mathematik und Computerwissenschaften. Derzeit befasst er sich mit langzeitverfügbaren digitalen Referenzen (Archival Resource Key) und der Spezifizierung schlanker  Metadatenschemata. Seiner Vita nach, entwarf, schrieb und leitete Kunze zuvor das erste Campus-weite Informationssystem an der UC Berkeley, das ein früher Konkurrent und Client des World Wide Web war. Davor war er als BSD Unix Hacker aktiv, dessen Arbeit in den heutigen Linux- und Apple-Betriebssystemen weiterlebt. SILVER hat John A. Kunze per E-Mail zur digitalen Langzeitarchivierung und -erhaltung befragt.

Bildtext: Röhren-Analogrechner, AEG Telefunken, 1953 medien.welten, Technisches Museum Wien

Seit wann beschäftigen Sie sich mit der Langzeiterhaltung digitaler Daten?

Ernsthaft arbeite ich seit ungefähr 1992 mit Bibliothek-Anwendungen, und auf eine Art hat wohl jeder, der in Bibliotheken, Museen oder Archiven arbeitet, mit Erhaltung zu tun. Einfach deshalb, weil diese Organisationen kulturelle und wissenschaftliche Zeugnisse über so lange Zeiträume aufbewahren, dass es wichtig ist, die Fähigkeit beizubehalten, den Menschen die sichere Erfahrung originaler Aufzeichnungen bieten zu können. Für die Erhaltung digitaler Information kann das allerdings verwirrend sein, da die Erhaltungszeiträume in Monaten anstatt Jahren gemessen werden können.

Lange bevor der Begriff „Digitale Archivierung“ aufkam, kämpften Systemadministratoren – und sie kämpfen noch immer – mit wichtiger Kurzzeit-Archivierung der digitalen Information, die die Recheninfrastruktur unterstützt. Obwohl sie es „Computer-Erhaltung“ nennen, sind ihre Aktivitäten (Database- Conversions, Software-Uprades etc.) nahe an dem, was Kulturerbe- Organisationen als „Digitale Archivierung“ bezeichnen.

Die letztere Form der „digitalen Archivierung“ betreibe ich seit ungefähr zehn Jahren, im Zusammenhang mit meiner Arbeit mit Persistent Identifiers1, beschäftige mich aber mit ihren frühen Formen seit Anfang meiner Laufbahn. Offiziell bin ich dem Archivierungsbereich aber erst seit 2002 angeschlossen, als ich dem neu gegründeten Programm für digitale Archivierung der California Digital Library (CDL) beitrat.

Welche Daten bzw. Arten von Wissen betreffen Ihre Arbeit?

Wir haben seit Beginn mit allen Arten von Information zu tun: Dokumente, Bilder, Pläne, wissenschaftliche Arbeiten, elektronisch publizierte Bücher, Volkszählungsdaten. Seit kurzem beschäftigen wir uns auch noch mit Tonaufnahmen, Erfassung von Websites, Scannen von Büchern und Datensätzen.

Während Bibliotheken traditionell gedrucktes Material sammelten, haben viele nun ihre Bestände mit speziellen Sammlungen von nicht-gedrucktem Inhalt vervollständigt (zum Beispiel Nachlassbriefe). Wir haben festgestellt, dass sich diese Praxis fortsetzt und im digitalen Bereich an Schwung gewinnt – durch Web-Crawling-Services, Vorveröffentlichung von gedruckten Zeitungsinhalten bzw. die Sammlung ebendieser nach gedrucktem Erscheinen sowie dem Hosting großer Datenbanken.

Sah man Digitalisierung anfangs als mögliches Ende von Konservierungsproblemen, oder war man sich allfälliger Probleme bereits bewusst?

Wer ernsthaft auf digitale Archivierung setzt, realisiert sehr schnell, dass dies mehr ist, als bloß „die Bits zu archivieren“ . Eine der fortlaufenden Herausforderungen lautet, einen Weg zu finden, die Planer, Geldgeber und die Öffentlichkeit darüber zu informieren, dass es auch durch veralterte Formate, Software oder Hardware zu gravierenden Verlusten kommen kann, also auch wenn die Bits gar nicht verloren gegangen sind. Wir bemerken aber ein Bewusstsein dafür, die permanente Finanzierung von Archivierung hat sich in bestimmten Feldern etabliert. Gleichzeitig kann es vorkommen, dass Organisationen zu viel Zeit damit verbringen, zu erklären, wie komplex digitale Archivierung ist, und dabei vergessen sie dann die grundsätzlichen Schritte einzuleiten, um die Informationen zu speichern, die verloren geht, während sie sich weiterhin den Kopf zerbrechen. Darin liegt auch der geniale Ansatz des Internet Archive2: „Es kann keine Archivierung geben, wenn du keine Bits hast. Fang am besten gleich damit an!“

Sehen Sie darin eine Gefahr, wenn Wissen nur noch in digitaler Form aufgezeichnet wird?

Sicherlich, aber ich glaube auch nicht, dass Papier und andere physikalischen Medien ganz verschwinden werden. Zu den Vorteilen von richtig gelagertem Papier gehört, dass Veränderungen leicht zu bemerken sind und dass die einzige Voraussetzung zur zukünftigen Verwendung eine Lichtquelle ist.

Können Institutionen wie die California Digital Library herkömmliche Bibliotheken eines Tages ersetzen?

Es ist offensichtlich, dass sich die Funktionen von digitalen und gemauerten Bibliotheken bereits überlappen; zumindest in Fragen der Informationsbereithaltung und wie diese Information nutzbar gemacht werden kann. Aber ich würde mich hüten zu sagen, eine digitale Bibliothek würde definieren, was eine Bibliothek zu sein hat. Digitale Inhalte werden sicherlich ein wichtiger Teil vieler zukünftiger Bibliotheken sein, daher glaube ich, es wird vordergründig eher das Gegenteil passieren: Der Begriff „digital“ als Beschreibung für Bibliotheken wird wegfallen, wenn herkömmliche Bibliotheken den heute von digitalen Bibliotheken bestellten Bereich übernehmen. David Levy von der University of Washington hat dargelegt, Bibliotheken hätten immer eine evolutionäre Rolle in der Gesellschaft gespielt, und ich glaube, das wird sich fortsetzen – vielleicht mit Gewichtung auf der Bibliothek als Treffpunkt. Öffentliche Bibliotheken in den USA haben sich seit Jahren verstärkt in die digitale Richtung entwickelt und bieten üblicherweise auch öffentlichen Zugang zum Internet. Manche dieser Bibliotheken verkaufen Kaffee an ihre Kunden, veranstalten Leserunden für Kids und sind so ganz nebenbei ungewollt eine Tagesstätte für Obdachlose.

Bezüglich dauerhafter Lesbarkeit von Daten kommen Migration oder Emulation als mögliche Lösung ins Spiel. Können Sie uns die Begriffe kurz erklären?

Dabei handelt es sich um zwei Methoden, dem Problem veralteter Dateiformate und Speichermedien (z.B. CDs, DVDs und Tonbänder), die von aktueller Software nicht mehr gelesen werden können, beizukommen. Der Migrationsansatz besagt, dass Kalifornischer Experte für digitale Langzeitarchivierung: John A. Kunze -  Inhalte regelmäßig aus alten in neue Formate umgewandelt (migriert) werden sollten, damit sie von zeitgemäßen Computern gelesen werden können. Die Emulationsmethode empfiehlt, das originale Format beizubehalten, aber auch dafür zu sorgen, dass die ursprüngliche Hard- und Softwareumgebung am Laufen bleibt.

Was ist unter „Datenaustrocknung“ zu verstehen?

„Datenaustrocknung“ ist eine Archivierungstechnik, bei der aus dem originalen Format eine höchst unverderbliche Format- Version erzeugt wird, die auch dann den „Wert“ des Originals besitzt, wenn sie ein paar der ursprünglichen „Schnick- Schnacks“ verliert. Die Analogie zur Lebensmittelkonservierung besteht darin, dass eine getrocknete Marille zwar nicht länger so gut aussieht oder schmeckt wie eine frische Marille, sie ihren essenziellen Nährwert aber viel länger behält. Beispielsweise ist „unformatierter Text“, der weiterhin aussagekräftig bleibt (ohne Schriftformatierungen oder Bilder) – eines der langlebigsten digitalen Formate, das wir kennen. Wenn sowohl Migration als auch Emulation versagen, kann die ausgetrocknete Version vor totalem Verlust schützen.

Wie würden Sie selbst idealerweise Ihre Daten archivieren?

Ich bin ein wenig wie ein Eichhörnchen. Das heißt, es fällt mir schwer, Sachen wegzuschmeißen. Daher ist meine Sammlung, so wie viele andere, umfangreicher, als sie sein müsste. Während der Wert, den ich bestimmten meiner Objekten beimesse, manchmal steigt oder fällt, bedenke ich auch laufend ihren „voraussichtlichen“ Wert, und gemäß dieser Einschätzung setze ich Prioritäten. Einer der allerwichtigsten Grundsätze, die ich über Archivierungsstrategien nennen kann, egal ob es mich selbst oder eine Institution betrifft, ist darauf zu achten, dass Archive „in Verwendung“ bleiben. Diese Strategie hat zwei Vorteile: Erstens haben Archive, die sich technisch von oft verwendeten Teilen einer Sammlung unterscheiden, einen eingebauten Schutzmechanismus gegen jede Form von Wartung für das zu Erhaltende. Oft sind zusätzliche Geldmittel und Bemühungen für die Wartung notwendig, die auf Basis alten, unaktuell wirkenden Inhalts gerechtfertigt werden müssen. Besser ist es, wenn altes Material technisch gleichwertig zu neuem Material erscheint. Zweitens ist inaktiver Inhalt effektiv unbekannt, außer in der Erinnerung derer, die einst damit gearbeitet haben. Inaktiver Inhalt wird aus der Wahrnehmung verschwinden und an Wert verlieren. Was man nicht kennt, kann man nicht lieben. – - – - – -

Link

John A. Kunze – http://dot.ucop.edu/home/jak/

-

Der Autor

Andreas Kump ist Mitarbeiter von Silver Server und Chefredakteur von SILVER

1 Persistent Identifier: Eindeutige Bezeichner für digitale Inhalte; Persistent Identifier können die URLs im Katalog oder anderen Nachweissystemen ersetzen oder als stabile Referenzen in den Dokumenten selbst angewendet werden.

-

2 siehe Artikel Internet Archive in diesem Heft, Seite 10

 

Kontakt