Logo AGI-IMC
Künstliche Intelligenz schlüsselfertig für Ihre Bibliothek

Mit Wissen die Welt bewegen

dandelon.com

dandelon.COMmunity

Blättern und suchen wie am Regal, das ist die Vision von dandelon.com. Wir bauen eine Brücke zwischen Print- und eMedien, digitaler und analoger Welt. Wir produzieren seit 2003 in einer internationalen Gemeinschaft von wissenschaftlichen Bibliotheken und Verlagen in der Community dandelon.com. Die für die Suche und Bewertung hochrelevanten Inhaltsverzeichnisse von gedruckten Büchern, eBooks sowie von Aufsätzen werden mittels unseres intelligentCAPTURE digitalisiert, mehrsprachig maschinell indexiert und in dandelon.com veröffentlicht. Monatlich wächst dandelon.com um 10.000 Titel. Diese Inhalte speichern wiederum die Bibliotheken in ihren Katalogen und Discovery Systemen.

Intelligente Software

schulzspeyer.de

intelligentCAPTURE

intelligentCAPTURE ist Software für die Produktion von neuem Content. Es dient der Digitalisierung und maschinellen Erschließung von gedruckten und digitalen Medien. Über 3 Millionen Inhaltsverzeichnisse verbesseren seit 2001 die Suchbarkeit und Sichtbarkeit von Büchern weltweit. Viele Millionen Seiten wurden gescannt und mit OCR in digitale Texte gewandelt. Aus eBooks zieht es durch Textextraktion und Strukturanalyse gezielt die Inhaltsverzeichnisse. Die Struktur der Inhaltsverzeichnisse von Zeitschriftenheften und Sammelwerken kann es alleine erkennen, in Metadaten zerlegen, Abstracts und mehr erfassen und dem Inhalt analysieren. Texte aus 100 Quellsprachen können mit maschineller Indexierung und Übersetzung in mehrere neue Zielsprachen erschlossen werden. intelligentCAPTURE nutzt das Vorwissen der Bibliothekare zur hochautomatisierten Workflowsteuerung und gibt die Resulte an die Kataloge zurück. In den Engines/Modulen, intern nennen wir sie Shells, zur Analyse stecken mehrere Verfahren der Künstlichen Intelligenz, komplexe regelbasierte Verfahren und jahrzehntelanges Vorwissen von Linguisten und Informatikern. Nicht nur für die Indexierung hochrelevante Inhaltsverzeichnisse und Abstracts werden genutzt, das ganze digitale oder digitalisierte Werk kann in seine Teile zerlegt und analysiert werden und eignet sich auch für Digital Humanities-Anwendungen.

schulzspeyer.de

intelligentSEARCH

intelligentSEARCH ist unsere Information Retrieval- und Web-Publishing-Lösung. Wir haben damit eine eigene Discovery-Lösung, die ganze Kataloge mit vielfältigen Medientypen und den Output aus intelligentCAPTURE vereint und in den Dialog mit den Nutzern tritt. Die Suche nutzt Metadaten, maschinelle Indexierung, Übersetzung und die Volltexte. Die Suchbegriffe können über Synonyme und Übersetzungen erweitert werden. Die Facetten rückt AGI vor die Suchergebnisse, um den Benutzer zum Dialog zu motivieren. Statt langer Ergebnislisten werden die gefundenen Inhaltsverzeichnisse, Abstracts, Volltexte sofort angezeigt und die Suchworte im Volltext markiert, um darin zu blättern. dandelon.com ist die größte Implementierung, diese AGI-Homepage die kleinste. intelligentSEARCH ist eine Lösung zur Selbstverwaltung der gesamten wissenschaftlichen Materialien von Forschungsteams mit öffentlichen und internen Daten. Eine kachelartige Suchergebnisliste haben wir für Karteikarten oder Bildobjekte implementiert.

Maßgeschneiderte Dienste

ServerFarm

eBooks leichter finden

Inhaltsverzeichnisse von bislang 250.000 eBooks von Springer-Nature werden wöchentlich in dandelon.com ergänzt. Aus dieser Datenbasis generiert AGI für bislang zwei Bibliotheken die automatische, zweisprache Indexierung in Deutsch und Englisch und liefert die Indexierungsdaten in die Discovery-Umgebungen der Bibliotheken. So werden die eBooks besser gefunden und häufiger genutzt.

Mehr zur Indexierung: Multilinguale Indexierung


Kataloganreicherung, digitale Bibliotheken

Die Digitalisierung durch AGI zwischen den Regalen erspart Bibliotheken eigene mobile Scansationen, Hardware, Software, Entwicklung, Server, Personal, Projektmanagement und lange Projektlaufzeiten. Inhaltsverzeichnisse von Monografien, ganze Bücher, teils bis auf Absatzebene zerlegt, komplette Zeitschriftenreihen, Jahrbuch-Sammlungen und Jahrzehnte von Tageszeitungen, Karteikarten mit Metadatenerfassung haben wir bislang von Papier oder Mikrofilm ins Web überführt und die Software dafür geschrieben. Das Parlamentsinformationssystem des Landes Vorarlberg hat sämtliche parlamentarischen Dokumente bis zur ersten Parlamentssitzung 1862 online, Liechtenstein viele serielle Printmedien der letzten 160 Jahre.

Latest News

Semantische Strukturanalyse der Inhaltsverzeichnisse von Zeitschriften und Konferenzbänden

Anfang 2020 gaben wir in intelligentCAPTURE Articles die maschinelle Erkennung bibliografischer Strukturen in Inhaltsverzeichnissen von Zeitschriften und Sammelwerken frei. Ohne weiteres Training oder manuelle Zuweisungen von Mustern können die wichtigsten europäischen Sprachen verarbeitet werden. Zwei Bibliotheken mit zusammen über 1000 Zeitschriftentiteln nutzen diese Version, weitere Installationen stehen an. Wir demonstrieren das semantische Erkennungsverfahren in einem 5-Minuten-Video.

RFID-Software und Projekte

Im Februar 2020 implementierten wir die vielleicht erste automatische RFID-Konvertierung. Sie erkennt, womit ein Transponder beschrieben werden soll. Dahinter steht ein komplexes Regelwerk, die Abfrage des Katalogs mit unterschiedlichen Barcode-Typen und Syntax und ist angepasst derzeit an die Universitätsbibliothek Kiel mit täglicher Datenlieferung über WebDAV zur Übernahme in den Katalog sowie mit einem Web-Interface zur Produktionsstatistik. Es geht um 1 Million Medien, die zu konvertieren sind.

Thesaurus-Terme maschinell erkennen

April 2020: Wir haben den Abgleich unserer mehrsprachigen maschinellen Indexierung gegen den klassischen Thesaurus des Ibero-Amerikanischen Instituts implementiert. Medien aus 11 Quellsprachen werden in 6 Zielsprachen indexiert. Die dabei generierten deutschsprachigen kontrollierten und freien Deskriptoren, Nominalphrasen, Namen von Personen, Organisationen und Orten werden mit der neuen Shell gegen den deutschsprachigen Thesaurus gemappt und als Sachbegriffe, Länder oder Personen ausgegeben. Der Thesaurus kann jederzeit verfeinert und erweitert werden. Neue Thesaurus-Versionen können mit geringem Aufwand längst bearbeitete Medientitel neu analysieren, flächendeckend für eine ganze oder eine über Volltext- oder Feldsuche selektierte Kollektion. Die Resultate sollen in Kürze in den K10plus einfließen.