|
In der sich abzeichnenden "Informationsgesellschaft" werden Informationen und Dokumente jeglicher Art, darunter vor allem auch Texte, in weithin akzeptierten standardisierten Formaten per Netz ausgetauscht. Diese Informationen und Dokumente sind durch definierte, strukturbezogene und semantische Markierungen angereichert, die die weitere Verarbeitung der Dokumente (wie Filterung, Präsentation in einem bestimmten Medium, Konvertierung) steuern können. Es ist erkennbar, dass die Nutzbarkeit einer größeren Informationsmenge u.a. von der Qualität verarbeitungsbezogener Informationsanreicherung abhängt. Das mehrstufige Forschungsfeld der Forschergruppe kann wie folgt charakterisiert werden. Die Basis bilden auf der ersten Ebene die Möglichkeiten formaler Dokumentdeskriptionen, die XML bietet bzw. die auf XML aufbauen. Diese Basis wird auf der zweiten Ebene zum Ausgangspunkt genommen, um Bedingungen und Möglichkeiten sprachbezogener Informationsmodellierung zu untersuchen. Dies heißt zum einen: Wie können formale Dokumentdeskriptionen genutzt werden, um Eigenschaften sprachlicher Einheiten (Dialogkorpora, Lexika, Fachtexte) zu modellieren, so dass ein Gewinn an Verarbeitungsmöglichkeiten und an fachspezifischem Auswertungspotential erzielt werden kann. Dies heißt zum andern: Wie können formale Dokumentdeskriptionen genutzt werden, um Informationen eines Informationspools so zu verknüpfen, dass semantisch strukturierte Hypertexte und Hypermedien erzeugt werden können. Auf einer dritten Ebene schließlich werden Formen sprachbezogener Informationsmodellierung zum Ausgangspunkt genommen, um deren Semantik und mathematische Modellierbarkeit zu untersuchen: die Semantik bzw. Modellierbarkeit von XML-Dokumenten, Schemasprachen und Hyperdokumenten.
In the developing net-based "information society" information, texts and multimodal documents are exchanged according to information technological standards. Documents are augmented by formal, structure and content related markup which enables efficient document processing (filtering, media-specific presentation, conversion, query etc.). The value of these increasing amounts of information will depend crucially on the quality of the processes which add semantic structure to textual or multimodal documents. This is the domain of the research group. The added structure has several layers. The base layer consists of current information technological developments with respect to formal document descriptions (XML, schema languages). There is a second layer, in which approaches to language-related modelling of information are represented. One goal with respect to this layer is to make use of formal document description devices in order to represent structure- and content-related properties of natural language data (dialog corpora, lexical, technical texts). Another goal is to use formal document representations in order to connect units in an "information pool" (hypertexts, hypermedia). On a third layer theoretical approaches to information modelling are taken as objects of research, focussing on the question of which formal semantics can be given to content augmented documents and to their formal enhancements (document grammar, annotation schema, hyper document linkings).
|