Seitenhierarchie

Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 2 Nächste Version anzeigen »

Speicherbereiche

Der Archival Storage ist in verschiedene Speichersektionen für die unterschiedlichen Status im Objektlebenszyklus unterteilt. Innerhalb der Speichersektionen gibt es abgetrennte Speicherbereiche für jede Institution im Verbund der drei Deutschen Zentralen Fachbibliotheken, in dem die Objekte und die dazugehörigen Metadaten abgelegt werden. Jede Institution kann nur ihre eigenen Objekte einsehen.


  • Transferspeicherbereich mit den Untersektionen Upload und Ingest:
    • Upload: In dieses Verzeichnis werden Objekte hochgeladen, die für den Ingest bereit sind. Es ist das Quellverzeichnis für die Submission Application.
    • Ingest: Dieses Verzeichnis ist das Zielverzeichnis für von der Submission Application erzeugte Rosetta-konforme SIPs.
  • Depositspeicherbereich: In dieses Verzeichnis werden die SIPs aus dem Ingestverzeichnis kopiert und mit den Metadaten aus dem Ingestprozess angereichert. Jedes SIP ist mit einer eindeutigen ID benannt.
  • Operativer Speicherbereich: In diesen Bereich werden geingestete SIPs aus dem Depositspeicherbereich kopiert, die mit einem manuellen Workflow geingested wurden und weiter bearbeitet werden; zum Beispiel werden Nutzungskopien hinzugefügt. Auch die SIPs, die in den technischen Analysebereich umgeleitet wurden, und die temporäre Kopie, die beim Update eines AIP erzeugt wird, sind in diesem Bereich abgelegt.
  • Permanenter Archivspeicher mit den Untersektionen File, IE und Metadata: Die TIB nutzt das Konzept des logischen AIPs und speichert die Files, die METS und die Katalogmetadaten physisch getrennt. Vor Bearbeitungen wird eine Kopie des AIP erzeugt und in den operativen Speicherbereich verschoben. Werden die Änderungen bestätigt, wird das AIP versioniert und die neue Version neben dem Original-AIP abgelegt.
    • File: Dieser Bereich enthält alle Dateien einer Version eines AIPs.
    • IE: Dieser Bereich enthält pro Version eines AIP eine METS-Datei. Die METS-Dateien enthalten Verweise auf die Dateien und die XML-Datei mit den Katalogmetadaten, die zum jeweiligen AIP gehören.
    • Metadaten: Dieser Bereich enthält für jeden Identifier eine XML-Datei mit den Katalogmetadaten.

In Rosetta konfigurierte Speicherregeln definieren, welche Objekte wo gespeichert werden. Die Speicherregeln sind anpassbar und in einer Konsortialkonfigurationsbeschreibung dokumentiert, die einmal im Jahr von den Partnerbibliotheken verabschiedet wird.

Erhalt der Vollständigkeit und Unversehrtheit der Archivpakete

Speichermedien

Für den Archivspeicher des digitalen Langzeitarchivs stehen zwei voneinander unabhängige NAS-Systeme zur Verfügung, die mit ZFS-Dateisystemen verwaltet und als RAID-Z3-Systeme betrieben werden. Jedes RAID-Z3-System beinhaltet mehrere logische Festplattenverbünde, die jeweils aus mehreren physischen Laufwerken bestehen. NAS 1 ist ein High Availability Cluster und dient als Produktivsystem, NAS 2 dient zur Notfallwiederherstellung. Der aktuell vorhandene Speicher ist bis zu circa 3,8 PB (brutto) erweiterbar.

ZFS unterstützt die Sicherung der Datenintegrität durch integrierte Prüfsummenverfahren und die Selbstheilungsfunktionen des RAID-Z3-Systems. ZFS arbeitet mit Copy on Write (COW), sodass das Dateisystem auch nach Stromausfällen und Systemabstürzen konsistent bleibt. Diese Funktion ist besonders wichtig bei der Datenspiegelung von NAS 1 auf NAS 2 (siehe Redundanz).

RAID-Z3 ist ein Festplatten-Verbund mit dreifacher Parität.

Redundanz

Die Dateien werden im RAID-Z3-Verbund verteilt und in bestimmten Grenzen wiederherstellbar gespeichert.

Täglich wird mit ZFS Send und ZFS Receive zu einem festgelegten Zeitpunkt ein inkrementeller Snapshot auf das zweite NAS-System repliziert. Prüfsummen stellen die Konsistenz der Daten bei der Übertragung sicher.

Monitoring und Refreshing

Die NAS-Systeme sind voneinander getrennt in separaten, abgeschlossenen Server-Racks im Rechenzentrum aufgestellt.

Die Server-Racks verfügen über eine Temperaturüberwachung und eine Gas-Löschanlage pro Rack. Es gibt für jedes Storage-System ein Reporting-Tool, mit dem die Speicherkapazität, der Zustand der Festplatten und Jobs wie die Replikation automatisch überwacht werden können. Beim Ausfall oder Defekt einer Festplatte löst das System automatisch eine Meldung an den Administrator aus.

Der Zugang zum Rechenzentrum ist mit einem elektronischen Zugangssystem sowie einer Einbruchmeldeanlage gesichert und auf wenige Mitarbeitende beschränkt. Das Rechenzentrum verfügt über eine Brand- und Rauchmeldeanlage und eine unabhängige Notstromversorgung, die bei Stromausfall das ordnungsgemäße Herunterfahren der Server ermöglicht.

Medienmigration

Die TIB hat einen Service-Vertrag mit einem Dienstleister für den Austausch von defekter Hardware. Die Monitoring-Software benachrichtigt automatisch den Dienstleister, wenn defekte Hardware ausgetauscht werden muss. Der Dienstleister liefert daraufhin Ersatzhardware, die im laufenden Betrieb von der EDV ausgetauscht wird. Die ZFS-Funktion Resilvering stellt die Datenintegrität nach einem Medienausfall wieder her.

Integritätssicherung

Pro Block wird eine Prüfsumme erzeugt und gespeichert. Bei jedem Lesezugriff und bei jedem Datentransfer wird eine Prüfsumme erzeugt und mit der gespeicherten Prüfsumme verglichen. Stimmen die Prüfsummen nicht überein, wird der beschädigte Block aus der verteilten Speicherung im RAID-Z3-System wiederhergestellt.

Stimmen die Prüfsummen bei der Replikation von einem auf das anderen NAS-System nicht überein, wird die Übertragung abgebrochen und gemeldet.

Bei Bedarf kann mittels eines Prüfsummenabgleichs (ZFS-Scrubbing) für alle Blöcke auf dem Dateiserver die Datenintegrität des kompletten Storage-Systems überprüft werden.

Täglich und vor Wartungsarbeiten wird pro NAS-System ein vollständiger Snapshot erstellt. Änderungen an einem System können so sieben Tage rückwirkend eingesehen, nachvollzogen und im Notfall wieder eingespielt werden. Zusätzlich werden die Snapshots der letzten 30 Tage aufbewahrt.

Die digitale Langzeitarchivierungssoftware Rosetta verfügt ebenfalls über Mechanismen für den Erhalt der Datenintegrität.

Wiederherstellung

Die Selbstheilungsfunktion des gewählten ZFS-Systems kann Ausfälle in der Größenordnung von bis zu drei Festplatten eines ZFS-Stripes kompensieren. Wiederherstellungen innerhalb eines Festplattenpools sind in der Monitoring-Software einsehbar.

Kann das RAID-Z3-System die Wiederherstellung nicht mehr durchführen, wird durch den Administrator der Systemtechnik eine Notfallwiederherstellung vom Replikationspartner durchgeführt. Sollte das NAS 1 irreparablen Schaden genommen haben, können die Dateien inklusive des Dateisystems des NAS 2 vollständig auf ein anderes System repliziert werden und dieses dann die Funktion des Produktivsystems übernehmen. Prüfsummen stellen die Konsistenz der Daten bei der Übertragung sicher. Der Administrator der Systemtechnik muss diesen Prozess initiieren und überwachen.

  • Keine Stichwörter