>_ Gesi SOFTWARE GmbH

Der Auftrag
>_ Extraktion relevanter Inhalte aus technischen Datenblättern
>_ Strukturierung der gewonnenen Informationen zur nahtlosen Anbindung an das bestehende Unternehmenssystem
Die Herausforderung
>_ Technische Datenblätter mit stark variierenden Layouts und Formaten
>_ Hierarchisch strukturierte Inhalte mit zahlreichen Unterabschnitten
>_ Komplex aufgebaute Tabellen sowie tabellenähnliche Darstellungen
>_ Sicherstellung einer maximalen Extraktionsgenauigkeit, da die Daten zur inhaltlichen Validierung der Datenblätter verwendet werden
Die Lösung
>_ Evaluation geeigneter APIs als Alternative zur bestehenden ChatGPT-API unter Berücksichtigung von Genauigkeit, Kosten und Integrationsfähigkeit
>_ Entwicklung und iterative Optimierung spezialisierter Prompts zur gezielten Extraktion definierter Inhalte aus spezifischen Kapiteln
>_ Validierung der extrahierten Daten durch Abgleich mit Ground Truth
>_ Quantitative Qualitätsbewertung mittels Ähnlichkeitsmetriken (Jaccard-Similarity)
