Kraxner, M. (2016). Kontextsensitive Planung von Langzeitarchivierungsmaßnahmen [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2016.30614
E188 - Institut für Softwaretechnik und Interaktive Systeme
-
Date (published):
2016
-
Number of Pages:
85
-
Keywords:
Langzeitarchivierung; Planung von Langzeitarchivierungsmaßnahmen; Plato
de
Digital Preservation; Preservation Planning; Plato
en
Abstract:
Der Umfang an digitalen Inhalten nimmt rasant zu und stellt Organisationen mit der Verpflichtung diese auf lange Sicht zu erhalten vor neue Herausforderungen. Die Planung von Langzeitarchivierungsmaßnahmen zielt darauf ab, die beste Strategie zu ermitteln um den Zugriff auf diese Inhalte für eine spezifische Zielgruppe über einen längeren Zeitraum zu ermöglichen. Die Entscheidungsfindung sollte dabei durch einen wiederholbaren Prozess auf Basis von objektiven Kriterien erfolgen, und zu reproduzierbaren Ergebnissen führen, die das Vertrauen in die Entscheidung stärken. In den letzten Jahren waren zahlreiche Initiativen darum bemüht, damit verbundene Probleme auf verschiedenen Ebenen zu lösen, und haben zu neuen Erkenntnissen bezüglich der Herausforderungen für die Erhaltung von digitalen Daten geführt. Insbesondere wurde ein Arbeitsablauf für die Planung von Langzeitarchivierungsmaßnahmen definiert. Dieser bietet eine Anleitung, um alle relevanten Fakten - über die Organisation, die Inhalte, Anforderungen, und potentielle Strategien - zu sammeln. Experimente werden mit einer repräsentativen Auswahl von Objekten durchgeführt, und die Ergebnisse in Hinblick auf definierte Anforderungen evaluiert. Sie bilden die Basis um eine informierte Entscheidung zu treffen, und resultieren in einen ausführlich dokumentierten Plan. Bisher ist die Unterstützung durch Tools beschränkt, und auf Grund mangelnder Automatisierung ist es noch immer eine hauptsächlich manuelle und aufwendige Aufgabe. Informationen über Inhalte und die Umgebung müssen manuell gesammelt werden, und Anforderungen werden meist ad-hoc oder Tool-spezifisch beschrieben, was deren Wiederverwendung sowie den Einsatz für andere Zwecke erschwert. Prototypen für Register von Strategien und Evaluierungstools sind zum Teil integriert, jedoch sind diese schwer wart- und erweiterbar. Ebenso können resultierende Pläne im Allgemeinen nicht automatisch ausgeführt werden. Diese Arbeit zielt darauf ab, den Planungsprozess durch Integration mit dem Kontext zu verbessern und den Grad der Automatisierung zu steigern. Dazu werden vorhandene Informationsquellen und Systeme identifiziert, und eine Ontologie wird zur Beschreibung von zusammenhängenden Konzepten verwendet. Um die Integration zu vervollständigen werden fehlende Schnittstellen definiert, und es wird eine Methodologie zur Spezifikation von Bedingungen zur Qualitätskontrolle eingeführt. Eine Prototypimplementierung des Planungstools wird erweitert und anhand einer Fallstudie evaluiert. Es zeigt sich, dass die vorgeschlagenen Maßnahmen nicht nur den Prozess der Planung unterstützen, sondern zudem die kontinuierliche Archivierung von Inhalten ermöglichen.
de
The amount of digital content produced every day is increasing rapidly and challenges organisations with the obligation to preserve it for the long term. Preservation planning aims to select the best suited strategy to keep content accessible for a specific user community over time. This decision should be based on a repeatable process relying on objective criteria that leads to reproducible results and thus provides evidence to further trust. In the last decade a number of initiatives were dedicated to solve related problems on different levels, and provided insight in intricacies of digital preservation. Particularly, a preservation planning workflow was defined. It guides the planner to collect all related information, about the organisation, the content, requirements, and potential strategies. Experiments are conducted with representative samples and results are evaluated against specified requirements, providing the basis to take an informed decision and resulting in a well documented preservation plan. So far tool support is limited, and the lack of automation leaving it a mainly manual and effort intensive task. Information on content and the environment has to be gathered manually, and requirements are described ad-hoc or in a tool specific way, which hinders reuse and adoption for other purposes. Prototypes of registries for strategies and evaluation tools have been built, but they are hard to maintain and extend. And enacting the resulting preservation plan is only possible as proof of concept. This thesis aims to improve the preservation planning process and increase automation by integration with its context. It identifies existing information sources and systems, adopts a common language based on a set of ontologies to describe related concepts, specifies missing interfaces to complete integration, and introduces a methodology to specify monitoring conditions. A prototype implementation of the planning tool is extended and evaluated in a case study. It shows that proposed measures not only benefit the planning process, but can enable continuous preservation of content.