Auf dieser Seite finden Sie nähere Informationen zur Datenwerkstatt Jena 2026, die vom vom 5. bis 9. Oktober an der Universität Jena stattfindet.
Organisatorisches
| Termin: Ort: Anmeldung: |
5. - 9. Oktober 2026 |
|---|
Datathon Bootcamp
Vor dem Beginn des Bearbeitungszeitraums bieten am 5. und 6. Oktober vorbereitende Workshops an, in denen wir Einführungen in digitale Tools geben, die den Teilnehmenden bei der Bearbeitung der Challenges helfen sollen.
Alle Angebote in dieser Zeit sind optional und können entsprechend der eigenen Interessen wahrgenommen werden.
Projektbearbeitung
Im Rahmen der Veranstaltung bearbeiten die Teilnehmenden vom 7. - 9. Oktober in interdisziplinären Teams an einer der gestellten Challenges. Für den Zeitraum der Veranstaltung stehen für die Gruppen Seminarräume von 9 - 17 Uhr zur Verfügung. Dort bieten wir euch:
- Arbeitsinseln für die Gruppen,
- Unterstützung durch Mentoren bei technischen oder methodischen Fragen,
- kleine Erfrischungen.
Die Gruppen sind für die Arbeit an den Challenges nicht auf diesen Zeitraum beschränkt und können die Arbeit am Projekt innerhalb der drei Tage weitgehend eigenständig organisieren. Es gibt nur einige Agendapunkte, bei denen die Anwesenheit verpflichtend ist. Diese werden vor Beginn der Veranstaltung bekanntgegeben.
Call for Challenges
Für die Veranstaltung haben wir bereits Partner*innen aus der Universität Jena, der Thüringer Universitäts- und Landebibliothek und der Stadtverwaltung Jena gewinnen können.
Im Rahmen des Datathons möchten wir auch anderen Interessierten, beispielsweise aus den Bereichen Studium und Lehre, der Verwaltung oder auch Nicht-Regierungsorganisationen (NGOs), die Möglichkeit bieten, ihre Daten und Challenges in die Veranstaltung einzubringen.
Haben Sie Interesse? Dann können Sie bis zum 31. August 2026 Vorschläge für Challenges via E-Mail an uns senden: dalije@uni-jena.de
Die Challenges
Hier finden Sie die Beschreibungen der verschiedenen Challenges. Zur besseren Orientierung sind Kategorien angegeben, die dabei helfen sollen, die Art der Challenge einzuschätzen.
Klassisch: Daten und Fragestellung werden von unseren Partnern zur Verfügung gestellt und sollen durch Analyse der Daten gelöst werden
Konzeptionell: Entwicklung von Konzepten für die Beantwortung von Fragestellungen (Welche Daten werden benötigt? Wie können diese gewonnen werden? Wie können diese für andere nutzbar gemacht werden?)
Kreativ: Entwicklung von z.B. Visualisierungen, Infografiken oder Dashboards zu Themen
Die Seite befindet sich aktuell im Aufbau und wird kontinuierlich erweitert. Um einen Eindruck zu der Art der Challenges bekommen, können die Themen aus dem letzten Jahr weiterhelfen.
-
Polish & Proof: KI-gestützte Digitalisierung von Texten (ThULB Jena)
Challengetyp: klassisch
Organisator: Tom Meißner
1. Die Ausgangslage
Moderne Systeme zur Digitalisierung analoger Dokumente wie z.B. OCR (Optical Character Recognition) und VLMs (Vision Language Models) sind zwar leistungsstark, produzieren aber oft "schmutzige" Daten:
- Zeichenfehler: "0" statt "O", "l" statt "I".
- Strukturverlust: Tabellen werden flachgedrückt, Zeilenumbrüche zerstört.
- Kontextfehler: Fachbegriffe werden aufgrund schlechter Bildqualität falsch interpretiert.
2. Die Challenge
Im Rahmen der Challenge so eine intelligenter Workflow entwickelt werden, der extrahierte Rohdaten von digitalisierten Texten entgegennimmt (JSON/Text) und sie mithilfe von LLMs und algorithmischen Ansätzen verbessert.
Dazu gehört:
- Validierung: Erkennt das Modell, ob die Extraktion plausibel ist? (z.B. Checksummen bei IBANs, Abgleich mit Datumsformaten).
- Korrektur: Automatisches Fixen von Schreibfehlern (z.B. "Rechnun9" -> "Rechnung").
- Anreicherung & Qualität: Fehlende Infos durch Kontext ergänzen und den Text in ein perfekt strukturiertes Format (z.B. sauberes Markdown oder JSON) überführen.
-
Studien-Dashboards für Transparenz und Orientierung im Studienverlauf (Universität Jena)
Challengetyp: konzeptionell, kreativ
Organisator: David Schneider
Ziel dieser Challenge ist es, nutzerzentrierte Dashboards für Studierende zu entwerfen. Diese sollen den eigenen Studienverlauf verständlich und übersichtlich darstellen. Im Mittelpunkt steht ein zentrales Dashboard mit verschiedenen Ansichten auf wichtige Kennzahlen, zum Beispiel zu Prüfungsanmeldungen, Notenverläufen oder Durchschnittsnoten. Dabei soll geklärt werden, welche Darstellungen wirklich hilfreich sind und welche Kennzahlen für Studierende einen echten Mehrwert bieten.
Ein wichtiger Punkt ist die Frage, ob und wie Vergleichsdaten sinnvoll sind. Dazu gehört etwa der Vergleich der eigenen Leistungen mit der Kohorte oder dem Studiengangsdurchschnitt. Hier müssen auch mögliche psychologische Effekte bedacht werden. Zusätzlich soll geprüft werden, welchen Nutzen erklärende und unterstützende Elemente haben könnten, zum Beispiel durch ein angebundenes Sprachmodell. Diese könnten helfen, die Daten besser zu verstehen und auf passende Unterstützungsangebote hinzuweisen.
Die Ergebnisse der Challenge sollen dazu beitragen, Studierenden ihren Studienverlauf transparenter darzustellen und bei Bedarf passende Angebote der Zentralen Studienberatung besser sichtbar zu machen.
-
KI-Wegweiser für digitales Lehren und Lernen (Universität Jena)
Challengetyp: kreativ, konzeptionell
Organisator: Charlotte Steinke
Über den Uni-MarktplatzExterner Link können Studierende und Lehrende Angebote aus dem Bereich digitale Lehre an der Universität Jena finden. Ähnlich einem Onlineshop kann man dort beispielsweise Qualifizierungsmöglichkeiten, Austausch- und Beratungsangebote oder digitale Tools finden und die Suche über entsprechende Filter eingrenzen.
Viele ähnlicher Plattformen verfügen heute über KI-Chatbots, die Fragen von Nutzer*innen direkt beantworten und auf passende Angebote verweisen können.
Im Rahmen der Challenge soll ein Konzept und ein erster Prototyp für einen KI-Chatbot entwickelt werden, der die Suche nach passenden Angeboten im Uni-Marktplatz erleichtert und auf individuelle Anfragen eingeht.
Dabei sollen Anforderungen aus Sicht der Nutzenden an das System definiert und eine Umsetzung mit den verfügbaren KI-Infrastrukturen der Universität getestet werden. -
Wider die Datenflut – Wie viel ist genug? (Stadt Jena)
Challengetyp: klassisch
Organisator: Stadt Jena
Die Stadt erhebt täglich riesige Mengen an Daten über Sensoren – von Luftqualität und Verkehrsdichten bis hin zu Wetterbedingungen. Diese Daten sind essenziell für Planung, Monitoring und Bürgerdienste. Doch die enormen Datenmengen (bis zu Terabytes pro Jahr) verbrauchen nicht nur viel Speicher und verlangsamen die Analyse, sondern verursachen auch hohe Kosten und erheblichen Energieverbrauch, was im Sinne der ökologischen Nachhaltigkeit problematisch ist. Dabei sind meist nicht alle gesammelten Daten für die eigentliche Fragestellung wirklich nötig.
Die Herausforderung:
Es sollen Ansätze entwickelt werden, mit denen sich die Datenmenge sinnvoll reduzieren lässt ohne die Auswertbarkeit für wichtige Anwendungen zu beeinträchtigen.
Wichtige Leitfragen sind:- Welche Informationen sind für unterschiedliche Anwendungsfälle wirklich relevant?
- Wie kann man Daten so zusammenfassen (aggregieren, komprimieren), dass wichtige Trends und Muster erhalten bleiben?
Gesucht sind praktikable, nachvollziehbare Lösungen, die der Stadt Jena dabei helfen, ihre Daten effizienter, kostengünstiger und nachhaltiger zu speichern.
Datathon Bootcamp
Das Programm der vorgelagerten Workshops wird im Laufe des Sommersemesters veröffentlicht.