Projektpraktika zu Digitalen Bibliotheken, Feature Extraction und Multicore-Programmierung
Folgende Themen werden angeboten:
- Indexstrukturen zur Volltextsuche mit Schreibweisen-Varianten inkl. Flexionen und Synonymen (G. Reimers)
- Java Concurrency für Heuristiken zur Texterkennung
- Parallelisierte Volltextsuche auf Multicore-Server-Hardware
- Experimente zu Tag-Clouds und zu hyperbolischen Bäumen (Ch. Simon)
- Feature Extraction bei historischen Landkarten
- Variationen in Scans zur Erzeugung konkurrierender OCR-Ergebnisse (S. Beretta)
- Parsing-Experimente zu bibliographischen Referenzen mit ParsCit
- Apache UIMA-Tools (Unstructured Information Management Architecture) zur Anreicherung von XML-Texten (T. Guttroff)
- Heuristiken zur effizienten Zerlegung von Anfragen in Volltextsuchen
Weitere Themen auf Anfrage.
Die Bearbeitung eines Themas kann nach Absprache auch überlappt zum Vorlesungszeitraum erfolgen.