Copyright AGI-IMC

artificial intelligence for libraries
Digitization & OCR, Indexing & Translation, Retrieval & Sharing

schulzspeyer

Maschinelle Inhaltserschließung

AGI-Information Management Consultants bringen Technologien des Information Retrieval und Language Engineerings zusammen mit dem Alltag von Bibliotheken. Wir wollen deren Leser mit KI-Methoden dichter an die Bestände heranführen und die Bibliotheken personell bei der Erfassung und Erschließung effizienter machen. Sie produzieren mittels intelligentCAPTURE in einer Gemeinschaft von Bibliotheken in Europa unter dem Community-Namen dandelon.com Daten zur teils mehrsprachigen Tiefenerschließung von vorwiegend wissenschaftlichen Publikationen.

Mit Wissen die Welt bewegen

dandelon.com Logotype

dandelon.COMmunity

Blättern und suchen wie am Regal, das ist die Vision von dandelon.com. Wir bauen eine Brücke zwischen Print- und eMedien, digitaler und analoger Welt. Wir produzieren seit 2003 in einer internationalen Gemeinschaft von wissenschaftlichen Bibliotheken und Verlagen in der Community dandelon.com. Die für die Suche und Bewertung hochrelevanten Inhaltsverzeichnisse von gedruckten Büchern, eBooks sowie von Aufsätzen werden mittels unseres intelligentCAPTURE digitalisiert, mehrsprachig maschinell indexiert und in dandelon.com veröffentlicht. Monatlich wächst dandelon.com um 10.000 Titel. Diese Inhalte speichern wiederum die Bibliotheken in ihren Katalogen und Discovery Systemen.

Intelligente Software

schulzspeyer.de

intelligentCAPTURE

intelligentCAPTURE ist Software für die Produktion von neuem Content. Es dient der Digitalisierung und maschinellen Erschließung von gedruckten und digitalen Medien. Über 3 Millionen Inhaltsverzeichnisse verbesseren seit 2001 die Suchbarkeit und Sichtbarkeit von Büchern weltweit. Viele Millionen Seiten wurden gescannt und mit OCR in digitale Texte gewandelt. Aus eBooks zieht es durch Textextraktion und Strukturanalyse gezielt die Inhaltsverzeichnisse. Die Struktur der Inhaltsverzeichnisse von Zeitschriftenheften und Sammelwerken kann es alleine erkennen, in Metadaten zerlegen, Abstracts und mehr erfassen und dem Inhalt analysieren. Texte aus 135 Quellsprachen können mit maschineller Indexierung und Übersetzung in mehrere neue Zielsprachen erschlossen werden. intelligentCAPTURE nutzt das Vorwissen der Bibliothekare zur hochautomatisierten Workflowsteuerung und gibt die Resulte an die Kataloge zurück. In den Engines/Modulen, intern nennen wir sie Shells, zur Analyse stecken mehrere Verfahren der Künstlichen Intelligenz, komplexe regelbasierte Verfahren und jahrzehntelanges Vorwissen von Linguisten und Informatikern. Nicht nur für die Indexierung hochrelevante Inhaltsverzeichnisse und Abstracts werden genutzt, das ganze digitale oder digitalisierte Werk kann in seine Teile zerlegt und analysiert werden und eignet sich auch für Digital Humanities-Anwendungen.

intelligentSEARCH

intelligentSEARCH ist unsere Information Retrieval- und Web-Publishing-Lösung. Wir haben damit eine eigene Discovery-Lösung, die ganze Kataloge mit vielfältigen Medientypen und den Output aus intelligentCAPTURE vereint und in den Dialog mit den Nutzern tritt. Die Suche nutzt Metadaten, maschinelle Indexierung, Übersetzung und die Volltexte. Die Suchbegriffe können über Synonyme und Übersetzungen erweitert werden. Die Facetten rückt AGI vor die Suchergebnisse, um den Benutzer zum Dialog zu motivieren. Statt langer Ergebnislisten werden die gefundenen Inhaltsverzeichnisse, Abstracts, Volltexte sofort angezeigt und die Suchworte im Volltext markiert, um darin zu blättern. dandelon.com ist die größte Implementierung, diese AGI-Homepage die kleinste. intelligentSEARCH ist eine Lösung zur Selbstverwaltung der gesamten wissenschaftlichen Materialien von Forschungsteams mit öffentlichen und internen Daten. Eine kachelartige Suchergebnisliste haben wir für Karteikarten oder Bildobjekte implementiert.

Maßgeschneiderte Dienste

ServerFarm

eBooks leichter finden

Inhaltsverzeichnisse von bislang 320.000 eBooks von Springer-Nature werden wöchentlich in dandelon.com ergänzt. Aus dieser Datenbasis generiert AGI für bislang zwei Bibliotheken die automatische, zweisprache Indexierung in Deutsch und Englisch und liefert die Indexierungsdaten in die Discovery-Umgebungen der Bibliotheken. So werden die eBooks besser gefunden und häufiger genutzt.

Mehr zur Indexierung: Multilinguale Indexierung

In November 2020 führen wir die Erschließung einzelner eBook-Titel durch jede BibliothekarIn ein. Es sind nur wenige Klicks nötig. intelligentCAPTURE for single eBooks


Kataloganreicherung und digitale Bibliotheken

Die Digitalisierung durch AGI zwischen den Regalen erspart Bibliotheken eigene mobile Scansationen, Hardware, Software, Entwicklung, Server, Personal, Projektmanagement und lange Projektlaufzeiten. Inhaltsverzeichnisse von Monografien, ganze Bücher, teils bis auf Absatzebene zerlegt, komplette Zeitschriftenreihen, Jahrbuch-Sammlungen und Jahrzehnte von Tageszeitungen, Karteikarten mit Metadatenerfassung haben wir bislang von Papier oder Mikrofilm ins Web überführt und die Software dafür geschrieben. Das Parlamentsinformationssystem des Landes Vorarlberg hat sämtliche parlamentarischen Dokumente bis zur ersten Parlamentssitzung 1862 online, Liechtenstein viele serielle Printmedien der letzten 160 Jahre.

Latest News

Semantische Strukturanalyse der Inhaltsverzeichnisse von Zeitschriften und Konferenzbänden

Anfang 2020 gaben wir in intelligentCAPTURE Articles die maschinelle Erkennung bibliografischer Strukturen in Inhaltsverzeichnissen von Zeitschriften und Sammelwerken frei, seit Juni gibt es die im Video dargestellte Version. Ohne Training oder manuelle Zuweisungen von Mustern können die wichtigsten europäischen Sprachen verarbeitet werden. Sechs Bibliotheken mit zusammen ca. 1500 Zeitschriftentiteln nutzen diese Version. Wir demonstrieren das semantische Erkennungsverfahren in einem 7-Minuten-Video.

Thesaurus-Terme maschinell erkennen

April 2020: Wir haben den Abgleich unserer mehrsprachigen maschinellen Indexierung gegen den klassischen Thesaurus des Ibero-Amerikanischen Instituts implementiert. Medien aus 11 Quellsprachen werden in 6 Zielsprachen indexiert. Die dabei generierten deutschsprachigen kontrollierten und freien Deskriptoren, Nominalphrasen, Namen von Personen, Organisationen und Orten werden mit der neuen Shell gegen den deutschsprachigen Thesaurus gemappt und als Sachbegriffe, Länder oder Personen ausgegeben. Der Thesaurus kann jederzeit verfeinert und erweitert werden. Neue Thesaurus-Versionen können mit geringem Aufwand längst bearbeitete Medientitel neu analysieren, flächendeckend für eine ganze oder eine über Volltext- oder Feldsuche selektierte Kollektion. Die Resultate sollen in Kürze in den K10plus einfließen.

eBooks besser erschießen

Bibliotheken erfassen immer mehr einzelne eBooks, eReports, eAbschlussarbeiten im Katalog. Um diese gleichwertig zu gedruckten Publikationen zu erschließen, bieten wir "intelligentCAPTURE for single eBooks", eine sehr einfach zu bedienende App, die zu den gängigen Bibliothekssystemen passt und von jeder BibliothekarIn bei der Erfassung genutzt werden kann.

RFID-Konvertierung

August 2024: AGI hat bislang 50 Projekte mit knapp 6 Millionen Medien bundesweit durchgeführt. Für die UB Kiel implementierten wir 2020 die automatische RFID-Konvertierung. Sie erkennt sofort den Transponder und entscheidet selbsttägig womit ein Transponder beschrieben werden soll. Dahinter steht ein Regelwerk, die Abfrage des Katalogs mit unterschiedlichen Barcode-Typen und Syntax. So werden täglich pro Person mit der mobilen, ergonomisch optimalen Konvertierungsstation 2000 bis 3000 Medien konvertiert. Weitere Features: Tägliche Lieferung der Konvertierungdaten auf WebDAV-Verzeichnisse und ein Web-Interface zur stets aktuellen Produktionsstatistik. Gibt es keine Barcodes in den Medien, kein Problem, wir nutzten unsere in der Kataloganreicherung entwickelte Kommunikation mit dem Bibliothekssystem. In der UB Kiel ging es um 1 Million Medien. 6 Stationen und 16 MitarbeiterInnen waren beteiligt. Die gleiche Technik kam 2021 in der Bauhaus Universität in Weimar zum Einsatz und 2024 in der Bibliothek des GWZO in Leipzig.

Software Solutions - Library Services - Search Applications - Company & Contact