Die bisherige Online-Anwendung der „Jahresberichte für deutsche Geschichte - online“ (JDG) konnte aus technischen Gründen nicht mehr fortgeführt werden. Sie basierte auf Allegro, einem bis in die 2010er Jahre im Bibliothekswesen weit verbreiteten OPAC- und Bibliotheksverwaltungsprogramm. Anfänglich wurde der Betrieb der Datenbank in der Akademiebibliothek gewährleistet. Aufgrund von Sicherheitsbedenken war jedoch eine Weiterführung des Systems nicht möglich. Somit wurde knapp zehn Jahre nach Abschluss des Akademienvorhabens eine technische Erneuerung notwendig.
Die Allegrodaten umfassten ein Konglomerat von mehr als 1 Million Datensätzen unterschiedlichster Art – von Monografien über Zeitschriftenartikel bis hin zu jeglicher Art gedruckter sowie digitaler Quellen. Darunter befanden sich auch spezielle Einträge zu Personen und Orten. Für die neue Webseite der JDG wurden alle Daten aus den Allegrodateien in eine MySQL-Datenbank überführt.
Die Datenstruktur wurde dabei für die Ausgabe vollständig beibehalten. In Allegro war ein Datensatz in verschiedene Codes gegliedert. Diese Codes konnten wir mithilfe der Allegro-Dokumentation in vielen Fällen einer Beschreibung zuordnen. Wenn die Dokumentation keine ausreichenden Informationen bot, ließen wir die Beschreibung bewusst leer, um Fehlinterpretationen zu vermeiden. Als Beispiel dient der folgende Eintrag: Der Code 00 repräsentiert die eindeutige „Identifikationsnummer“ des Werkes, die wir auch als Identifikator in die URL aufgenommen haben. Der Code 20 liefert den „Hauptsachtitel“ des Werkes „Schaumburg: Beispiel einer erfolgreichen regionalen Industrialisierung“, während der Code 40 den Hauptverfasser „Schneider, Karl Heinz“ angibt. Im Code 40 war zudem eine „Gemeinsame Normdatei“(GND)-Nummer verzeichnet, die wir mit den Daten des „Katalogs der Deutschen Nationalbibliothek“ verknüpft haben. Der Code 48, nicht in der Dokumentation beschrieben, lässt vermuten, dass er einen Kurztitel darstellt. Weil wir keine weiteren Informationen finden konnten, haben wir die Beschreibung leer gelassen.
Angesichts der großen Datenmenge und nicht vorhandener finanziellen Ressourcen, die nur schwer eine zeitintensive Projektentwicklung zulassen, konzentriert sich das neue System auf wesentliche Funktionen. Neben der Namens- und Titelsuche stehen nun auch die Suche nach Schlagwörtern, Erscheinungsjahr und Sprache zur Verfügung. Für eine effizientere Durchsuchbarkeit wurden die Daten in speziellen Suchindizes organisiert. Diese enthalten beispielsweise 8 Millionen Titelstichwörter und 0,9 Millionen Autorennamen. Die Daten wurden für die Suche aufbereitet. Dabei wurde entschieden, im Laufe der Zeit entstandene Fehleingaben nicht zu korrigieren, um die Authentizität der Originaldaten zu bewahren (vgl. https://www.jdg-online.de/detail/rn656950). So ist weiterhin eine Suche nach Sprachen möglich, die nicht im ISO 639-3-Format eingegeben wurden (z. B. chi, cze). Da die Daten automatisiert aufbereitet worden sind, kann es in bestimmten Fällen zu fehlerhaften Ergebnissen kommen, da die Daten aus Allegro nicht immer in einer normalisierten Form erstellt worden sind.
Das neue Suchinterface basiert auf dem Laravel-Framework und verwendet zusätzlich TailwindCSS (im Flowbyte Framework), Vanilla JS und Laravel Livewire. Um eine verbesserte Performance zu erreichen, wurde die Anzahl der Suchergebnisse auf 100 Datensätze beschränkt, die nach Erscheinungsjahr, Titel und Autor sortierbar sind. Ein Klick auf ein Suchergebnis zeigt den ursprünglichen Allegro-Eintrag mit den Codes, unserer rekonstruierten Codebeschreibung und dem Inhalt des Feldes an. Wie bereits erwähnt, konnten nicht alle Codes im Zuge der Datenanalyse rekonstruiert werden.
Schlagwörter sind anklickbar. Bei in der JDG vorhandenen Schlagwörter führt dieser Link zu allen Werken in der JDG mit diesem Schlagwort. Verbindungen zur DNB werden über vergebene Normdaten hergestellt.
Wie erwähnt, können die einzelnen Datensätze über Ihre URL persistent adressiert werden. Eine Zitation könnte also so aussehen:
Jahresberichte für deutsche Geschichte, herausgegeben von der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin 2024, url: https://www.jdg-online.de/detail/u200264359b
Eine BEACON-Datei ist hier erreichbar. Sie beinhaltet ca. 30.000 Einträge. Die alten JDG hatten ca. 120.000 GND-Einträge. Wir vermuten, dass in der alten JDG auch Körperschaften und Personen mit einer GND versehen waren, die nicht als Autoren oder Stichworte auftreten, werden diese Informationen in der neuen JDG nicht ausgegeben. Falls nochmals Zeit für eine Weiterentwicklung bleibt, kann dieser Sachverhalt genauer untersucht werden.
Federführend war Claus Franke und wurde von Marcus Lampert unterstützt, aufbauend auf Vorarbeiten von Cristina Vertan. Sie wurden beraten von Markus Schnöpf.