Bei der Prowind GmbH aus Osnabrück hat sich, wie bei vielen anderen Unternehmen, über die Jahre eine große Anzahl an unstrukturierten PDF-Dokumenten angesammelt. Bei der Prowind GmbH handelt es sich hierbei vor allem um unterschiedliche Verträge, wie z. B. Projektkaufverträge, Verträge über die Bereitstellung und Bewirtschaftung von Kompensationsflächen, Nutzungsverträge (für temporäre Zuwegungen oder für Kabel und Übergabestation), Gestattungsverträge, Lieferverträge etc., die mit einzelnen Vertragspartnern geschlossen wurden. Im Arbeitsalltag der Mitarbeitenden bei Prowind werden immer wieder einzelne wichtige Informationen, wie z. B. die Vertragslaufzeit, die Verlängerungsbedingungen, Kündigungsmöglichkeiten etc., aus diesen PDF-Dokumenten benötigt. Bisher erforderte dies eine zeitaufwendige manuelle Suche. Gemeinsam mit dem Mittelstand-Digital Zentrum Hannover entwickelte das Unternehmen einen KI-Prototypen, der solche Daten bzw. Informationen aus den meist mehrere Seiten umfassenden Verträgen automatisch identifiziert, ggf. interpretiert und extrahiert.
Die Nadel im Heuhaufen finden
Prowind plant und betreibt Windparks sowie Solaranlagen in ganz Deutschland. Mit dem Erfolg wuchsen auch die Herausforderungen: Über die Jahre entwickelte sich das Dokumentenarchiv zu einer großen Sammlung unterschiedlichster Verträge. Viele dieser Unterlagen lagen ausschließlich als einfache PDF-Dateien vor. Dateinamen waren uneinheitlich und entscheidende Informationen, wie z. B. ein Vertragsbeginn (durch handschriftliches Datum neben der Unterschrift), versteckten sich im Fließtext. Mitarbeitende mussten daher jeden Vertrag einzeln öffnen und händisch nach Fristen, Kündigungsdaten oder Flurstücken suchen. Das kostete viel Zeit und Nerven.
Wenn die Software lesen lernt
Das Mittelstand-Digital Zentrum Hannover untersuchte gemeinsam mit Prowind eine innovative Lösung für dieses Problem und setzte dabei auf Künstliche Intelligenz. Doch wie kann Software aus unübersichtlichen PDFs verlässliche Metadaten extrahieren?
Zunächst kam OCR („Optical Character Recognition“) zum Einsatz. Diese Technik verwandelt gescannte PDFs in maschinenlesbaren Text: Aus einem „Bild“ wird ein maschinell durchsuchbares Dokument. Darauf aufbauend analysierte ein Large Language Model (LLM) die Inhalte. Mit passenden Prompts fand die Software gezielt Metadaten wie Laufzeiten, Vertragspartner oder Kündigungsfristen.
Ergänzend wurde ein Vision-Language Model (VLM) genutzt. Im Unterschied zur OCR-LLM-Kette arbeitet ein VLM direkt auf der visuellen Dokumentseite – es „sieht“ also auch Layout, Tabellen oder Stempel und kann Informationen daraus unmittelbar auslesen.
Vertrauen ist gut, Kontrolle ist besser
Insbesondere die Ergebnisse mit der Nutzung der VLM waren vielversprechend; aber nicht von Anfang an perfekt. Deshalb verglich Prowind die KI-Auswertungen mit einer manuellen Prüfung durch Fachleute. Einfache Daten wie Personen- oder Firmen-Namen erkannte das System fast immer korrekt. Bei komplizierten juristischen Klauseln mussten die Anweisungen, die sogenannten „Prompts“, nachgebessert werden.
Herr Tom Strating von der Prowind GmbH fasst den Mehrwert der Zusammenarbeit so zusammen: „Die Inhalte des MDZ-Projektes waren für uns sehr wertvoll. Wir haben eine anbieterneutrale Einschätzung zur Machbarkeit bekommen, die nicht durch eine ‚Salesbrille‘ getrübt war.“ Diese neutrale Sicht half dem Unternehmen enorm. Denn so konnten sie sicher sein, dass die Technologie für ihren Anwendungsfall wirklich funktioniert.
Erfolgreich in die Zukunft investieren
Das Projekt lieferte die perfekte Entscheidungsgrundlage für die Geschäftsführung. Prowind weiß nun, dass die Technik reif für den Praxiseinsatz ist.
Deshalb startet das Unternehmen jetzt einen großen Testlauf mit einem Start-up. Ziel ist es, die Ergebnisse aus der KI-Analyse direkt in eine neue Software für die Vertragsverwaltung einfließen zu lassen. So werden aus alten PDF-Dateien lebendige Daten, mit denen Prowind effizient arbeiten kann.
Weiterführende Links:
- Erfahren Sie mehr über unsere Angebote, z. B. Orientierungsgespräche.
- Grundlegende Informationen zur Förderinitiative Mittelstand-Digital finden Sie hier.
Teilen Sie diesen Beitrag gerne mit Ihren Netzwerken oder Partnern!
Sie möchten mehr über die Einsatzmöglichkeiten von KI in Unternehmen erfahren? Dann kontaktieren Sie uns gern! Unsere Experten für Digitalisierung & KI, Herr Paolo Pappe und Herr Philipp Harder, stehen Ihnen unter pappe@iph-hannover.de oder +49 (0)511 279 76-446 zur Verfügung.



