>_ Gesi SOFTWARE GmbH

Der Auftrag
➤ Extraktion relevanter Inhalte aus technischen Datenblättern
➤ Strukturierung der gewonnenen Informationen zur nahtlosen Anbindung an das bestehende Unternehmenssystem
Die Herausforderung
➤ Technische Datenblätter mit stark variierenden Layouts und Formaten
➤ Hierarchisch strukturierte Inhalte mit zahlreichen Unterabschnitten
➤ Komplex aufgebaute Tabellen sowie tabellenähnliche Darstellungen
➤ Sicherstellung einer maximalen Extraktionsgenauigkeit, da die Daten zur inhaltlichen Validierung der Datenblätter verwendet werden
Die Lösung
➤ Evaluation geeigneter APIs als Alternative zur bestehenden ChatGPT-API unter Berücksichtigung von Genauigkeit, Kosten und Integrationsfähigkeit
➤ Entwicklung und iterative Optimierung spezialisierter Prompts zur gezielten Extraktion definierter Inhalte aus spezifischen Kapiteln
➤ Validierung der extrahierten Daten durch Abgleich mit Ground Truth
➤ Quantitative Qualitätsbewertung mittels Ähnlichkeitsmetriken (Jaccard-Similarity)
