Im Rahmen verschiedener und vielfältigster Projekte rund um Forschungsdaten, Digitalisate, Archivierung und Publikationen – sowohl intern als auch in Zusammenarbeit mit Forschenden und externen Institutionen – generieren wir stetig neue Erfahrungen, die wir in Schulungen und künftige Vorhaben einfliessen lassen.


Die COVID-19 Pandemie zeigt eine beispiellose Dringlichkeit, an zuverlässige Informationen über Therapieoptionen zu gelangen. Vor diesem Hintergrund hat sich ein internationales Forschungsteam unter der Leitung des Departements für klinische Forschung (DKF) Basel zum Ziel gesetzt, solche Informationen zu sammeln und aufzubereiten.

Konkret bedeutet dies, dass Evidenz aus diversen Quellen und Datenbanken gesichtet wird und COVID-19 relevante Publikationen kurz zusammengefasst werden. Im Anschluss werden die Ergebnisse der Studien jeweils kritisch beurteilt, um zu bestimmen, wie sehr wir dem Ergebnis der Studie vertrauen können. Damit hebt sich dieses Projekt von den meisten anderen ab, weil dort oftmals Evidenz gesammelt und verfügbar gemacht wird, ohne etwas über die Zuverlässigkeit der Studien zu sagen.

Die Informationsspezialisten der UB Medizin unterstützen als Projektpartner das COVID-evidence Team mit ihrem Fachwissen über systematische Informationsrecherche.

Die Datenbank wird täglich aktualisiert und umfasst Informationen über alle geplanten, laufenden und abgeschlossenen Studien zu Prävention, Diagnose, Behandlung und klinischem Management von COVID-19. Sie soll ein zuverlässiger Ausgangspunkt sein um Behandlungsentscheidungen zu treffen, neue Studien zu planen oder Praxis-Leitlinien und systematische Reviews zu entwickeln.

Die neue Datenbank ist unter diesem Link einsehbar: https://covid-evidence.org/.

(cap)

Webseite Corona Projekt
Equipment Digitale Forensik
Equipment Datenforensik

Mit einem uni-externen Partner analysierten wir einen Archivbestand, der neben den üblichen analogen Publikationen und Unterlagen eine umfangreiche Sammlung verschiedenster Datenträger aus den 1980er und 1990er Jahren enthielt. Rund 700 Datenträger (Floppy Disk, Iomega Zip, Iomega Jaz, SyQuest, externe Festplatten) dokumentieren das digitale Schaffen des Musikers, der bereits früh in der aufkommenden Digitalisierung mit spezieller Software zu Komposition und Musiksynthesizing zu arbeiten begann. Nicht wenige dieser Datenträger funktionieren nur mit speziellen Synthesizern oder waren – unglücklicherweise – aus Altersgründen nicht mehr lesbar. Im Rahmen der Analyse und der Vorbereitung der Daten für die langfristige Archivierung prüften wir die Datenkonsistenz, die Lesbarkeit der Träger in und mit verschiedenen Systemen, die effiziente Auswertung und Inventarisierung der Datenträgerinhalte als Basis für die wissenschaftliche Bewertung sowie die Möglichkeiten der Dateiformat-Migration und der Aufbereitung der Daten für die authentische und integre Nachnutzung.

(bma)

Zeitungen im Universal Viewer dargestellt
automatisierte Ausgabenerkennung in Goobi dank Machine Learning

Das impresso Projekt ist ein SNF Sinergia Forschungsprojekt, das neuartige Zugänge zu Zeitungsarchiven mit Textminingmethoden entwickelt. Die UB und das SWA lieferten als assoziierte Partner wirtschaftshistorisch relevante Zeitungen und Zeitschriften in das Projekt. Dafür wurde ein effizienter Massendigitalisierungsprozess entwickelt sowie ein KI-gestütztes Verfahren zur Ausgabenerkennung.
Anstatt die Daten auf einer Harddisk an das Projekt zu liefern, suchten wir nach einer Lösung, welche die Zeitungsbestände auch über Projektende im Sinne von FAIR-Data zugänglich macht. Wir publizierten die Zeitungen auf einer standardisierten IIIF-Datenschnittstelle. Das impresso Projekt konnte die Daten über diese Schnittstelle abziehen und in ihrem System weiterverarbeiten.

Der Prototyp kann hier abgerufen werden: 

(elk)

Für das SNF Forschungsprojekt Printed Markets. The Basel Avisblatt 1729-1845 von Prof. Burghartz haben wir die erste Basler Zeitung, das Avis-Blatt, im vollen Umfang von 116 Jahrgängen und 50'000 Seiten unter Berücksichtigung von Spezialanforderungen digitalisiert. 
Ein Jahr bevor das eigentliche Projekt begann, entwickelten wir in Zusammenarbeit mit der Professur und dem Research Navigator einen Prototyp in welchem die digitalen Methoden geprüft wurden. Teil des Prototyps waren die Digitalisierung eines Samples und die OCR-Bearbeitung der Frakturschrift für die Erstellung von Trainingsdaten. Denn es zeigte sich, dass wir für diese alte Frakturschrift viel bessere Volltext-Ergebnissen erzielen (98%), wenn wir den Mehraufwand einer Bearbeitung in Transkribus auf uns nehmen.
Wenn digitale Faksimile den Status von Forschungsdaten annehmen, wirkt sich dies auf die Anforderungen an die Qualität der Digitalisierung aus. Im Gegensatz zur hausüblichen exemplarspezifischen Digitalisierung, welche Ungereimtheiten des Originals abbildet, ging es in diesem Projekt darum, eine lückenlose Überlieferung der gesamten Information zu erhalten. Um dies zu erreichen, mussten wir weitere Exemplare der Zeitung aus anderen Archiven beiziehen und eine mehrstufige Qualitäts- und Vollständigkeitskontrolle vornehmen. Dieses Qualitätslevel erreichten wir durch eine konsequente Zusammenarbeit. Die Mitarbeiter von Projekt und Bibliothek arbeiteten beide in der Workflowsoftware Goobi, wodurch die Qualitätssicherung integriert und effizient abgewickelt werden konnte. Für die nahtlose Bearbeitung der Daten übermittelte die UB die Jahrgänge direkt an die Transkribus-Plattform. Dadurch wurden Wartezeiten verkürzt.

(elk)

Avis-Blatt
Texterkennung beim Avis-Blatt dank Transkribus