Deutsch Intern
Chair of Computer Science II - Software Engineering

(Bachelor/Master/Praktikum) Generierung und Evaluation synthetischer Daten

11/07/2024

Motivation

Die Nachfrage nach hochwertigen und öffentlich zugänglichen Daten zur Erkenntnisgewinnung und v.a. dem Lernen künstlicher Intelligenz ist gewaltig. Dies gilt sowohl für Forschung als auch Industrie und über die unterschiedlichsten Domänen hinweg, zum Beispiel Bankenwesen oder Medizin. Beides sind aber auch Beispiele für Gebiete, in denen Daten sehr sensitiv sind und selten veröffentlicht werden dürfen. Ein prominenter Lösungsansatz besteht in der Synthese neuer Daten. Dabei werden zunächst die wesentlichen Eigenschaften eines originalen Datensatzes mit Hilfe von KI gelernt, um dann neue Daten mit gleichen Eigenschaften zu generieren. Dabei kann es sich um Bilder, Datenbankeinträge, Aktienkurse, Texte, uvm. handeln.

Patientenakten Aktienkurse Texte Bilder

Ziele

In dieser Arbeit geht es ganz allgemein um Grundlagen, Methoden und Anwendungen zur Generierung oder Evaluation synthetischer Daten. Der genaue Inhalt und die Ziele der Arbeit können bei Interesse individuell festgelegt und Schwerpunkte gesetzt werden. Einige Beispiele zur Orientierung:

  • Entwicklung und Umsetzung neuer Ansätze zur Datengenerierung
  • Analyse und Verbesserung existierender Datengeneratoren
  • Übertragen existierender Methoden von einem Datentyp auf einen Anderen, z.B. von Zeitreihen auf Videos
  • Benchmarking von Datengeneratoren oder Evaluationsmetriken für synthetische Daten
  • Entwurf und Implementierung neuer Evaluationsmetriken

Wir bieten

  • Arbeit an innovativen und neuen Forschungsfeldern
  • Einbringung eigener Ideen bei der Lösungsgestaltung
  • Gute und intensive Betreuung

Dauer
   3 - 6 Monate

Kontakt

Michael Stenger, M.Sc.

michael.stenger@uni-wuerzburg.de

go.uniwue.de/stenger

Back