Projektpraktika zu Text-Mining und Information Retrieval
Folgende Themen werden angeboten:
- Effizientes und robustes Workflow-Design für das SpringerMaterials-Portal
- Partielle Seitenanalyse für Scans
- Binär codiertes XML in der Volltextsuche (Thema bereits vergeben)
- Erkennung und Verwaltung von Bezeichnungen chemischer Substanzen
- Identifikation von fehlerhaften Scans (Ränder, Drehungen, Unschärfe)
- Benchmark-Entwicklung für Volltextsuchen
- Alignment-Heuristiken zur Identifikation und Normierung von bibliographischen Referenzen
- PDF-Überlagerungen durch Annotationen
- Heuristiken zur Fehlertoleranz für OCR-Texte
- Identifikation von Orts- und Zeitenangaben in historischen Texten
Weitere Themen auf Anfrage.
Die allgemeine Vorbesprechung findet statt am Donnerstag, 22. Oktober 2009, 10:00 Uhr im Raum A109 statt.
Die Bearbeitung eines Themas kann jedoch nach Absprache auch überlappt zum Vorlesungszeitraum erfolgen.