Intern
Chair of Computer Science II - Software Engineering

Projektpraktika zu Text-Mining und Information Retrieval

Folgende Themen werden angeboten:

  • Effizientes und robustes Workflow-Design für das SpringerMaterials-Portal
  • Partielle Seitenanalyse für Scans
  • Binär codiertes XML in der Volltextsuche (Thema bereits vergeben)
  • Erkennung und Verwaltung von Bezeichnungen chemischer Substanzen
  • Identifikation von fehlerhaften Scans (Ränder, Drehungen, Unschärfe)
  • Benchmark-Entwicklung für  Volltextsuchen
  • Alignment-Heuristiken zur Identifikation und Normierung von bibliographischen Referenzen
  • PDF-Überlagerungen durch Annotationen
  • Heuristiken zur Fehlertoleranz für OCR-Texte
  • Identifikation von Orts- und Zeitenangaben in historischen Texten

Weitere Themen auf Anfrage.

Die allgemeine Vorbesprechung findet statt am Donnerstag, 22. Oktober 2009, 10:00 Uhr im Raum A109 statt.

Die Bearbeitung eines Themas kann jedoch nach Absprache auch überlappt zum Vorlesungszeitraum erfolgen.