Von der Archivvorstufe zum Archiv: (Forschungs-)Datenmanagement im Kontext von Gestaltung und Kunst
Type
06 - Präsentation
Primary target group
Science
Created while belonging to FHNW?
Yes
Zusammenfassung
Gegenstand des Beitrags ist der sog. "Indexer", ein digitales Werkzeug der Archivvorstufe, das zur Erschliessung / Übernahme digitaler Ressourcen in das digitale Archiv oder digitale Samm-lungen eingesetzt werden kann.
Er erstellt von den eingespeisten Daten einen Index und analysiert die Daten in einer Erken-nungskaskade (vgl. Abb. 1), sodass ein z.B. Dubletten oder Systemfiles (NSRL - National Soft-ware Reference Library) ausgesondert werden können. Ferner wird ein Volltext-Index (SOLR) erstellt, in dem alle Textinformationen sowie die Metadaten durchsuchbar sind; es werden Vor-schaubilder generiert (ImageMagick + FFMPEG) und Vermutungen über das Dateiformat (Mime-Type, Format) erstellt. Bereits im Ingest wird auch die Benennung der unterschiedlichen Quell-pfade geachtet, sodass die Semantik der ursprünglichen Pfadstruktur beibehalten bleibt.