>_Vernetzte Datenintelligenz und KI für KMU

Datenextraktion mit KI

>_ Gesi SOFTWARE GmbH

Der Auftrag

>_ Extraktion relevanter Inhalte aus technischen Datenblättern

>_ Strukturierung der gewonnenen Informationen zur nahtlosen Anbindung an das bestehende Unternehmenssystem

Die Herausforderung

>_ Technische Datenblätter mit stark variierenden Layouts und Formaten

>_ Hierarchisch strukturierte Inhalte mit zahlreichen Unterabschnitten

>_ Komplex aufgebaute Tabellen sowie tabellenähnliche Darstellungen

>_ Sicherstellung einer maximalen Extraktionsgenauigkeit, da die Daten zur inhaltlichen Validierung der Datenblätter verwendet werden

Die Lösung

>_ Evaluation geeigneter APIs als Alternative zur bestehenden ChatGPT-API unter Berücksichtigung von Genauigkeit, Kosten und Integrationsfähigkeit

>_ Entwicklung und iterative Optimierung spezialisierter Prompts zur gezielten Extraktion definierter Inhalte aus spezifischen Kapiteln

>_ Validierung der extrahierten Daten durch Abgleich mit Ground Truth

>_ Quantitative Qualitätsbewertung mittels Ähnlichkeitsmetriken (Jaccard-Similarity)