KI-Training nur mit realen Daten? Wie Datensynthese Variabilität sicherstellt

Autoren: Wittchen

Kategorie: Freie Themen

Chair: Sträter

Beitragskurzfassung:
Große Datensätze bilden die Grundlage für das Training lernender Algorithmen aus dem Bereich der Künstlichen Intelligenz (KI) bzw. des Machine Learnings (ML) und nehmen entscheidend Einfluss auf die Güte der ML-Modelle. In diesem Zusammenhang ergeben sich einige Risiken bzw. Fragestellungen, u.a.: Sind ausreichend große Trainingsdatensätze vorhanden? Decken diese eine möglichst große Diversität bzw. Variabilität ab? Wie können etwaige Defizite der Datensätze minimiert oder kompensiert werden? Besonders für kleine und mittelständische Unternehmen (KMU) ist dies bezüglich der notwendigen Expertise und Ressourcen herausfordernd. KMU, die innovative Anwendungen mit Hilfe von ML-Verfahren entwickeln wollen, verfügen ggf. nicht über geeignete bzw. nicht ausreichend viele Trainingsdaten. Die Erweiterung des Datenbestandes mit künstlich (synthetisch) erzeugten Daten kann die beschriebenen Defizite kompensieren. Zudem ist diese Methode kosten- und ressourceneffizienter, als die Aufnahme und Nachbearbeitung realer Daten.

Das Promotionsprojekt “MotionSynth” befasst sich mit der KI-basierten Synthese von individuellen menschlichen Bewegungen. Es wird das Ziel verfolgt, entsprechende ML-Modelle und Werkzeuge zur Synthese für ein möglichst breites Anwendungsspektrum zugänglich zu machen und einfach anwendbar zu gestalten. Anwender:innen sollen in die Lage versetzt werden, valide Datensätze eigenständig erstellen zu können, um diese für das Training ihrer ML-Modelle zu verwenden. Eine erste Zielgruppe sind KMU, die Anwendungen zum Anlernen von Industrierobotern basierend auf der Analyse menschlicher Bewegungen entwickeln. Hier sollen für verschiedene Bewegungen synthetische Daten erzeugt werden, in denen die Variabilität der menschlichen Physiologie (z.B. Körpergrößen) abgebildet ist. Diese Parameter haben mitunter großen Einfluss auf die Ausführung einer Bewegung. Daher müssen ML-Modelle, die Bewegungen analysieren und Intentionen ableiten sollen, die physiologischen Einflussfaktoren “erlernen”. Im weiteren Verlauf der Promotion soll eine modulare, domänenübergreifende Pipeline zur Verarbeitung und Synthese von Bewegungsdaten mit generischer Schnittstellen etabliert werden.

Zoom Informationen:

Geschützter Bereich

Dieser Inhalt ist passwortgeschützt. Bitte gebe dein Passwort ein um den Inhalt freizuschalten.

Zeitfenster der Veranstaltung (1)

Raum 1
-
Wittchen