Humboldt-Universität zu Berlin - Institut für Bibliotheks- und Informations­wissen­schaft

Berliner Bibliothekswissenschaftliches Kolloquium

07.02.2017 | 18 Uhr | Raum 123 | Dorotheenstraße 26 | IBI

Die semantische Suche der Stasi-Mediathek – Einblicke in ein Online-Angebot des Stasi-Unterlagen-Archivs

Sascha Plischke, Behörde des Bundesbeauftragten für die Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR (BStU), Berlin
Wolf Winkler, retresco


Creative Commons Lizenzvertrag

Folien zum Vortrag


In der Stasi-Mediathek sind erstmals tausende Dokumentenseiten sowie zahlreiche ausgewählte Videos, Fotos und Tonaufnahmen aus dem Stasi-Unterlagen-Archiv online zugänglich. Das Online-Angebot ermöglicht einen direkten Zugriff zu den Hinterlassenschaften des MfS und vermittelt Eindrücke von seinen Strukturen, seiner Funktion und Wirkung als Machtinstrument in der SED-Diktatur.

Alle Unterlagen sind mit einem Volltext hinterlegt: Akten, Tonaufzeichnungen und Filme sind vollständig transkribiert, zu jedem Foto gibt es eine Beschreibung des Bildinhalts. Dies bildet die Grundlage für das Herzstück der Stasi-Mediathek – die semantische Suche. Sie bewertet nicht nur die Anzahl der Treffer zu den eingegebenen Suchbegriffen, sondern erkennt auch, ob in einem durchsuchten Dokument die Suchbegriffe in einem sinnhaften Zusammenhang stehen. Darüber hinaus erkennt die Suche Synonyme und unterschiedliche Schreibweisen und findet so alle Varianten eines Suchbegriffs. Wie wurde die semantische Suche entwickelt? Sascha Plischke, Mitarbeiter der Stasi-Unterlagen-Behörde, und Wolf Winkler, ein Vertreter von retresco, erläutern ihre Funktionsweise im Detail.

Derzeit stehen insgesamt über 2.900 Dokumentenseiten, ca. 480 Einzelbilder, über sieben Stunden Tonaufzeichnungen und 18 Stunden Filme online zur Auswahl. Das Angebot an MfS-Unterlagen wird stetig erweitert.

<< 31.01. OCR Zum Gesamtprogramm