Unsere Ziele

 

Wir suchen nach einem Algorithmus, der es uns erlaut, eine Vielzahl von Plänen einulesen und zu organisieren. Dies sind unsere wichtigsten Ziele

Automatisches Erkennen unterschiedlicher Planköpfe und Plantypen 
Auslesen des Plankopfes und Übertragung in eine Datenbank
Übertragung des Anwendung auf unbekannte Pläne
alle aufklappen
Hintergründe

Die Deutsche Bahn hat eine Vielzahl von Dokumenten, technischen Zeichnungen etc., die unsere Infrastruktur, also Gebäude und technische Anlagen, abbilden. Diese sollen nun digitalisiert und automatisiert in eine zentrale Datenbank überführt werden. 

Anforderungen

Heute liegen viele Dokumente und Pläne in unterschiedlichster Form und aus unterschiedlichen Bereichen vor. Die Deutsche Bahn überführt diese Pläne in ihre zentralen Datenbanken. Dazu werden die Dokumente gescannt und als pdf abgespeichert. Um den hohen Aufwand einer händischen Übertragung der Meta-Informationen bei Überführung in die Datenbank zu vermeiden, möchte die Deutsche Bahn die Informationen automatisiert erkennen und auslesen lassen. Die Daten sollen dann direkt für den Import in die Datenbank vorbereitet werden. Die Deutsche Bahn verspricht sich hier eine wesentliche Arbeitserleichterung.

Die aktuelle Challenge hat zum Ziel, einen Algorithmus zu erstellen, der in den digitalisierten Legenden die relevanten Metadaten erkennt und richtig in eine vorgegebene Struktur bringt. Da nicht bekannt ist, wie viele unterschiedliche Dokumentenformen existieren, muss der zu entwickelnde Ansatz auch mit unbekannten Legenden zurechtkommen. Der Algorithmus soll daher einfach erweiterbar sein. Unbekannte Dokumente, Zeichnungen und Pläne sollen mittels Training des Algorithmus nachträglich gele.rnt werden können und somit für bisher unbekannte Dokumente nutzbar sein.

Aufgaben

1.   Automatisierter Erkennung von verschieden strukturierten Metadaten und das Einteilen in verschiedene Stapel – Bekannt, unbekannt, nicht lesbar.

2.   Auslesen der Information aus den Dokumententypen, die eine bekannte Ordnung der Metadaten aufweisen und Übertrag in eine geordnete Datenstruktur.

3.   Übertragbarkeit des Algorithmus auf andere, unbekannte Dokumententypen.

Die abschließende Evaluation der Ergebnisse für die Preisverleihung umfasst die Erkennung der Metadatenstruktur (20%), das Auslesen und Ordnen der enthaltenen Informationen (50%) sowie die Übertragung auf andere Dokumentenarten (30%). Ende April werden dann von einer Fachjury von DB Vertretern und externen Experten in der DB mindbox die Sieger verkündet und die Preise vergeben.

Preise

Wir vergeben insgesamt 14.000 Euro an Geldprämien:

  • 1. Platz 8.000 Euro
  • 2. Platz 4.000 Euro
  • 3. Platz 2.000 Euro

Timeline

Start Kommunikation und Bewerbung
05.03.2016
Start der Trainingsphase
13.03.2016
Treffen für offene Fragen
30.03.2016
Ablieferung Ergebnisse
20.05.2016
Prüfung der Algorithmen und Auswahl der Gewinner
25.05.2016

Die Gewinner sind