>_Vernetzte Datenintelligenz und KI für KMU

Datenextraktion mit KI

>_ Gesi SOFTWARE GmbH

Der Auftrag

➤ Extraktion relevanter Inhalte aus technischen Datenblättern

➤ Strukturierung der gewonnenen Informationen zur nahtlosen Anbindung an das bestehende Unternehmenssystem

Die Herausforderung

➤ Technische Datenblätter mit stark variierenden Layouts und Formaten

➤ Hierarchisch strukturierte Inhalte mit zahlreichen Unterabschnitten

➤ Komplex aufgebaute Tabellen sowie tabellenähnliche Darstellungen

➤ Sicherstellung einer maximalen Extraktionsgenauigkeit, da die Daten zur inhaltlichen Validierung der Datenblätter verwendet werden

Die Lösung

➤ Evaluation geeigneter APIs als Alternative zur bestehenden ChatGPT-API unter Berücksichtigung von Genauigkeit, Kosten und Integrationsfähigkeit

➤ Entwicklung und iterative Optimierung spezialisierter Prompts zur gezielten Extraktion definierter Inhalte aus spezifischen Kapiteln

➤ Validierung der extrahierten Daten durch Abgleich mit Ground Truth

➤ Quantitative Qualitätsbewertung mittels Ähnlichkeitsmetriken (Jaccard-Similarity)