piwik-script

Intern
    Chair of Computer Science II - Software Engineering

    (Bachelor/Praktikum/Master) Analyse-Plattform für Satellitendaten zusammen mit dem DLR

    17.09.2021

    Analysis platform for satellite data in cooperation with DLR

    Motivation

    Am Knotenpunkt zwischen High Performance Computing (HPC) und Big Data -der sogenannten "HPC and Big Data Convergence"- sieht sich aktuell das Deutsche Zentrum für Luft- und Raumfahrt (DLR) mit dem Problem konfrontiert, wie sie effizient und effektiv ihre großen Mengen an Satellitendaten verarbeiten können.
    Diese Daten können in ihrer Analyse unter anderem hohe Rechenanforderungen besitzen und damit in den Bereich des HPC fallen, oder aber auch durch ihre große Menge an z.B. Bilddaten von Erdbeobachtungssatelliten im Bereich Big Data größere Anforderungen an I/O Operationen stellen.
    Um einer einheitlichen Analyse beider Daten-Anforderungen gerecht zu werden und um Wissenschaftler von der konkreten Vorverarbeitung der Daten und Einrichtung spezifischer Umgebungen für selbige zu entkoppeln, setzt das DLR einen zweistelligen Millionenbetrag ein, um eine entsprechende Plattform zu entwerfen, auf der die genannten Anforderungen vereint erfüllt werden können.
    Ein wichtiger Punkt dabei ist, dass sich die Wissenschaftler auf ihre konkreten Fragestellungen konzentrieren können sollen und nicht zwangsläufig die Eigenheiten ihrer Urspungsdaten berücksichtigen müssen.
    Einen in Ansätzen ähnlichen Weg geht die schon verfügbare Google Earth Engine, die als grober Vergleich dienen kann, um sich die hier genannte Thematik etwas greifbarer zu machen.


    Ziele

    Im Rahmen der gemeinsamen Arbeit(en) soll Schritt für Schritt eine zukunftssichere Plattform entstehen, die state-of-the-art Methodiken verwendet um Wissenschaftlern einfachen Zugriff auf komplexe Satellitendaten zu ermöglichen und die Analyse, bzw. Arbeit mit diesen Daten so einfach wie möglich zu gestalten.
    Unsere Arbeiten zu diesem Bereich umfassen unter anderem die Themen "Effiziente Datenspeicherung", die parallele Ausführung von Erdbeobachtungsalgorithmen auf einer Serverless-Infrastruktur, die Infrastruktur einer solchen Plattform als solches, und weitere spannende Unterpunkte, die es zu bearbeiten gilt, bevor die Plattform offiziell an den Start geht.
    Es wird dabei großen Wert auf die Kommunikation und Kooperation mit dem DLR gelegt, welches uns die Möglichkeit bietet direkt mit den Wissenschaftlern vor Ort über ihre aktuellen Algorithmen, Satellitendaten und Arbeitsabläufe zu sprechen, um diese in weiteren Schritten zu optimieren und auf die geplante Plattform zu portieren.

    Da diese Plattform in ihrem Umfang deutlich den Rahmen einer einzelnen BA/MA oder des Masterpraktikums sprengen würde, würde mit dir zunächst ein interessanter Teilaspekt identifiziert, der dann in der jeweiligen Arbeit ausgearbeitet werden soll. Mögliche Teilaspekte könnten sein:

    • Theoretische Erforschung der Möglichkeiten und Anforderungen der geplanten Plattform anhand aktueller Literatur
    • Konzeption der Plattform (i.e. Definition von Anforderungen, Schnittstellen, Vorschläge für nutzbare Frameworks/Programmiersprachen/Stacks)
    • Übertragung eines konkreten Use Case (DLR-Pilotprojekt) aus dem HPC oder Big Data Bereich
    • Die oben genannte Themen "Effiziente Datenspeicherung", "Parallele Ausführung von Erdbeobachtungsalgorithmen" oder auch unterstützende Themen zur Infrastruktur der Plattform

    Deinen eigenen Ideen in unserem genannten Bereich oder individuellen Themenanspassungen gegenüber sind wir sehr aufgeschlossen und würden uns über dein Interesse sehr freuen!


    Wir bieten

    • Innovative Ansätze im Bereich der HPC und Big Data Convergance
    • Eine Arbeit, die lange nach ihrem Abschluss noch Relevanz besitzen wird
    • Spannende und nachhaltige Themengebiete
    • Eine enge Zusammenarbeit mit dem DLR


    Dauer

    • 3 - 6 Monate


    Kontakt

    Dennis Kaiser, M.Sc.
    Dennis.Kaiser@uni-wuerzburg.de
    https://go.uniwue.de/kaiser

    Zurück