Unterstützung des Fußballvereins SV 47 Mutscheid e.V. durch die Digitalisierung von Archivdokumenten mit modernster Technologie, einschließlich KI-gestützter Lösungen, OCR und maßgeschneiderter Software.
Gentlent hat sich kürzlich mit dem SV 47 Mutscheid e.V. zusammengeschlossen, um eine einzigartige Herausforderung anzugehen: die Digitalisierung von jahrzehntelangen historischen Klubdokumenten. Das Projekt zielte darauf ab, die reiche Geschichte des Fußballklubs zu bewahren und gleichzeitig in einem digitalen Format leicht zugänglich zu machen. Was zunächst wie eine entmutigende Aufgabe erschien, wurde durch methodische Planung, innovative Technologie und maßgeschneiderte Lösungen möglich gemacht.
Der Prozess begann mit der Bewertung des Archivmaterials. Die Dokumente wurden in verschiedenen Ordnern gelagert, einige waren ordentlich organisiert, während andere mit nicht zusammenhängenden Gegenständen vermischt waren. Um die Digitalisierung vorzubereiten, zerlegten wir jeden Ordner sorgfältig und gruppierten die Papiere in logische Chargen basierend auf ihrem Inhalt und ihrer Größe. Jede Charge wurde dann sortiert, um sicherzustellen, dass keine Seiten übersehen oder falsch platziert wurden.
Sobald die Organisation abgeschlossen war, wurden die Dokumente durch Hochgeschwindigkeits-Feed-Scanner verarbeitet. Das Ziel war, Hunderte von Seiten schnell und genau zu digitalisieren. Ungefähr 427 Blätter, viele davon doppelseitig, wurden gescannt, was zu einem digitalen Datensatz von 4,91 GB führte. Das schiere Datenvolumen erforderte einen rationalisierten Ansatz, um bei einer so großen Arbeitsbelastung die Konsistenz zu wahren.
Nach dem Scannen bestand der nächste Schritt in der Textextraktion und Optimierung. Mit den APIs von OpenAI entwickelten wir benutzerdefinierte Skripte, die mit Adobes OCR-Funktionen zusammenarbeiteten. Diese Skripte automatisierten Aufgaben wie die Korrektur der Seitenausrichtung, Texterkennung und Dateikomprimierung. Am Ende dieser Phase wurde der Datensatz auf 1,29 GB reduziert, ohne wesentliche Details zu verlieren.
Das digitale Sortieren der Dokumente war eine weitere entscheidende Phase. Eigenentwickelte Programme kategorisierten die Dateien basierend auf Inhalt, Zeitstempeln und Relevanz. Dieser Schritt war besonders wichtig, um eine kohärente Struktur zu schaffen, die die ursprünglichen Archivabsichten widerspiegelte. Diese Algorithmen sparte unzählige Stunden im Vergleich zur manuellen Sortierung.
Mit den organisierten Daten analysierten zusätzliche Skripte, unterstützt durch die Fähigkeiten von OpenAI, die Inhalte der Dateien. Metadaten wie Daten, Themen und Schlüsselnamen wurden automatisch extrahiert. Diese Metadaten wurden dann verwendet, um prägnante Zusammenfassungen zu erstellen, die einen Überblick über die Bedeutung jedes Dokuments bieten, ohne die vollständige Datei öffnen zu müssen.
Der Höhepunkt des Projekts war eine dedizierte Website, archiv.svmutscheid.de, die erstellt wurde, um das digitale Archiv zu hosten und zu präsentieren. Die Seite bietet Klubmitgliedern und der Gemeinschaft einfachen Zugang zu den Dokumenten, bereichert mit KI-generierten Zusammenfassungen für intuitive Navigation. Dieses neue digitale Archiv bewahrt das Erbe des SV Mutscheid und stellt sicher, dass es für zukünftige Generationen zugänglich bleibt.
In weniger als 8 Stunden schloss das Team die vollständige digitale Transformation des Archivs ab. Das Projekt unterstreicht das Potenzial, durchdachte Vorbereitung mit fortschrittlichen KI-Technologien zu kombinieren, um komplexe Herausforderungen zu meistern. Für den SV 47 Mutscheid stellt dieser Einsatz eine Brücke zwischen ihrer reichen Vergangenheit und einer digital unterstützten Zukunft dar.
Tom Klein
Founder & CEO
Gentlent UG (haftungsbeschränkt)
Gentlent
Kundendienst
support@gentlent.com