GCC Teaching: HP16: Konzeption und Implementation einer Natural Language-Textanalyse zur Automatisierung der Verschlagwortung von Informationsobjekten, GCC, Paderborn 2006.

THEMES: GCC Teaching\...\Z - Archive
META STRUCTURES: HP\...\Closed | HP\...\Closed
YEAR: 2006
 

Comments/attachments: Close
 
Projektklassifizierung
Das Projektthema ist als Diplomarbeit und im Rahmen einer Projektveranstaltung geeignet.

Nähere Beschreibung:

Die Groupware-Plattform Lotus Notes/Domino ist zu einer der weltweit führenden Industriestandard-Plattformen für Messaging, kollaborative Applikationen und hierbei insbesondere für die Verwaltung elektronischer Dokumente in kollaborativen Arbeitsumgebungen geworden. Zahlreiche auf Lotus Notes/Domino basierende Applikationen unterstützen die tägliche Arbeit im Office-Umfeld und ermöglichen dadurch ein effizienteres Informationsmanagement einer Organisation. Zahlreiche Paradigmen traditionell papierbasierter Arbeitsumgebungen konnten hierfür erfolgreich in elektronische Dokumenten-Management Systemumgebungen abgebildet und zugleich sowohl konzeptionell als auch methodisch optimiert werden. Mit zunehmendem Verständnis der aus den elektronischen Arbeitsumgebungen resultierenden Nutzungsmöglichkeiten und -potentiale kristallisieren sich allerdings neue Schwachstellen und Problemfelder heraus.

Die Verschlagwortung von Informationsobjekten ist bis heute ein vornehmlich manueller Prozess, der aufgrund des individuellen semantischen Verständnisses über das Informationsobjekt und seinen Kontext vorgenommen wird. Entsprechend aufwändig kann sich dieser Vorgang gestalten, wenn zugleich z.B. organisationale Richtlinien oder ein vorgegebenes Glossar für die Verschlagwortung zu nutzen ist. Ziel des Projekts ist die Entwicklung eines Systems zur Generierung von Stichwörtern für unstrukturierte Informationsobjekte (Dokumenten). Hierzu sind die Texte bisher unstrukturierter Informationsobjekte mittels eines Natural Language Processors (NLP) zu analysieren, zentrale, den semantischen Inhalt umschreibende Stichworte durch eine Textanalyse zu identifizieren und dem Dokument automatisiert hinzuzufügen oder als Vorschlagswerte einem Benutzer zur Verfügung zu stellen.

Für die Textanalyse soll ein geeigneter Natural Language Processor identifiziert und in das IBM Unstructured Information Management Framework integriert werden.

Projektablauf:

Das Projektthema ist in den Kontext der Projektgruppe "Contextual and process oriented Document Management" eingebunden. Eine regelmäßig Teilnahme am Projektkolloquium ist verpflichtend.

Werkzeuge/Ressourcen:

Lotus Notes / Domino

IBM Unstructured Information Management Architecture

Natural Language Processor

Zielgruppe sind Studierende der folgenden Studienrichtungen:

Wirtschaftsinformatik, Informatik

Vorausgesetzte Kenntnisse:

  • Kenntnisse über die Entwicklung von Lotus Notes/Domino Applikationen
  • Programmiersprachen Lotusscript oder Java

Betreuung:

Dipl.-Wirt.-Inf. Holger Ploch