(Bachelor/Master/Praktikum) Generierung und Evaluation synthetischer Daten
11/07/2024Motivation
Die Nachfrage nach hochwertigen und öffentlich zugänglichen Daten zur Erkenntnisgewinnung und v.a. dem Lernen künstlicher Intelligenz ist gewaltig. Dies gilt sowohl für Forschung als auch Industrie und über die unterschiedlichsten Domänen hinweg, zum Beispiel Bankenwesen oder Medizin. Beides sind aber auch Beispiele für Gebiete, in denen Daten sehr sensitiv sind und selten veröffentlicht werden dürfen. Ein prominenter Lösungsansatz besteht in der Synthese neuer Daten. Dabei werden zunächst die wesentlichen Eigenschaften eines originalen Datensatzes mit Hilfe von KI gelernt, um dann neue Daten mit gleichen Eigenschaften zu generieren. Dabei kann es sich um Bilder, Datenbankeinträge, Aktienkurse, Texte, uvm. handeln.
Patientenakten | Aktienkurse | Texte | Bilder |
---|
Ziele
In dieser Arbeit geht es ganz allgemein um Grundlagen, Methoden und Anwendungen zur Generierung oder Evaluation synthetischer Daten. Der genaue Inhalt und die Ziele der Arbeit können bei Interesse individuell festgelegt und Schwerpunkte gesetzt werden. Einige Beispiele zur Orientierung:
- Entwicklung und Umsetzung neuer Ansätze zur Datengenerierung
- Analyse und Verbesserung existierender Datengeneratoren
- Übertragen existierender Methoden von einem Datentyp auf einen Anderen, z.B. von Zeitreihen auf Videos
- Benchmarking von Datengeneratoren oder Evaluationsmetriken für synthetische Daten
- Entwurf und Implementierung neuer Evaluationsmetriken
Wir bieten
- Arbeit an innovativen und neuen Forschungsfeldern
- Einbringung eigener Ideen bei der Lösungsgestaltung
- Gute und intensive Betreuung
Dauer
3 - 6 Monate
Kontakt
Michael Stenger, M.Sc.
Back