Deutsch Intern
Chair of Computer Science II - Software Engineering

Projektpraktika zu Digitalen Bibliotheken, Text Mining und Multicore-Programmierung

Die folgenden Themen werden angeboten:

  • Experimente zur Leistungsfähigkeit von Volltextsuchen, u.a. für die Google-Desktop-Suche und Lucene
  • Thread-Pools für Multicore-Server und effizientes Document-Retrieval
  • Parallelisierte Alignment-Algorithmen zur Verbesserung von OCR-Ergebnissen
  • Seitengenaue Integration von Metadaten in PDF-Dokumente
  • Extraktion von „Keyphrases“ aus XML-Texten
  • Ranking für Volltextsuchen mit Klassifikationsheuristiken
  • Fontspezifische Fehlertoleranz-Regeln für OCR-Ergebnisse
  • Ranking-basierte Index-Konstruktion für Volltextsuchen
  • Heuristiken zur Hyperlink-Generierung mit Stemming und Tries


Weitere Themen auf Anfrage.

Eine allgemeine Vorbesprechung findet statt am Dienstag, 21. April 2009 um 11.00 Uhr im Raum A109.

Die Bearbeitung eines Themas kann jedoch nach Absprache bereits vor Beginn des Vorlesungszeitraums erfolgen.