Skip to main content

Graph-basierte Schlüsselworterkennung in historischen Dokumenten

automatische Erkennung und Transkription von Textbildern mit Schlüsselworterkennung.

Auf der ganzen Welt haben zahlreiche Bibliotheken zur Erhaltung des Weltkulturerbes mit der Digitalisierung ihrer wertvollsten Handschriften begonnen. Die Vielzahl der vorhandenen handschriftlichen Dokumentbilder erweckte das Bedürfnis, sie für die Suche zugänglich zu machen. Die automatische Erkennung und die Transkription von Textbildern sind jedoch noch ein weitgehend ungelöstes Problem (vor allem für sehr abgetragene historische Manuskripte). Darüber hinaus ist die Transkription ganzer Texte für die Suche ineffizient und kann zu schlechter Leistung führen, da falsch erkannte Wörter nicht gefunden werden können. Daher schlug man anstelle von kompletten Transkriptionen die Schlüsselworterkennung (Keyword Spotting, KWS) vor. KWS bezieht sich auf den Prozess des Abrufens aller Instanzen eines bestimmten Schlüsselwortes oder eines Schlüsselsatzes in einem Dokument.

Weitere Informationen/Publikationen finden Sie auf http://www.histograph.ch/.

Kontakt

Dr. Kaspar Riesen
Dr. Kaspar Riesen

Dozent, Institut für Wirtschaftsinformatik

Telefon +41 62 957 23 89 (Direkt)

Social Media des Instituts für Wirtschaftsinformatik

Diese Seite teilen: