Deutsche Forschungsgemeinschaft DFG
   
Jahresbericht /
Annual Report 2008
Programme und
Projekte /
Programmes and
Projects
* Forschergruppen / Research Units
Suche
Detailsuche
 Programme und Projekte / Programmes and Projects
   Forschergruppen / Research Units
    Gesamtliste / Index
---
    Geistes- und Sozialwissenschaften / Humanities and Social Sciences
     Geisteswissenschaften / Humanities
---

FOR 437 / Research Unit 437

Detailsicht / Detailed Overview

Titel / Title

Texttechnologische Informationsmodellierung Text Technological Modelling of Information

Sprecher / Spokesperson

Professor Dr. Dieter Metzing
Universität Bielefeld
Fakultät für Linguistik und Literaturwissenschaft
Universitätsstraße 25 · 33615 Bielefeld
Tel.: (+49) 521 1063676 ·
E-Mail: dieter.metzing@Uni-Bielefeld.de

WWW

* http://coli.lili.uni-bielefeld.de/Texttechnologie/Forschergruppe/index.html

Förderbeginn / Funded Since

2001

Förderbetrag 2008 / Amount of Funding Received in 2008

0 EUR

Förderbetrag seit Beginn / Amount of Funding Received Since Project Initiation

2,7 Mio EUR

Projekte / Projects

* FOR 437 - Projektliste / FOR 437 - List of Projects

Beteiligte Fachrichtungen / Additional Subject Areas Involved

Computerlinguistik, Informatik, Textlinguistik, Sprachdokumentation, Texttechnologie

Programmbeschreibung / Programme Summary

In der sich abzeichnenden "Informationsgesellschaft" werden Informationen und Dokumente jeglicher Art, darunter vor allem auch Texte, in weithin akzeptierten standardisierten Formaten per Netz ausgetauscht. Diese Informationen und Dokumente sind durch definierte, strukturbezogene und semantische Markierungen angereichert, die die weitere Verarbeitung der Dokumente (wie Filterung, Präsentation in einem bestimmten Medium, Konvertierung) steuern können. Es ist erkennbar, dass die Nutzbarkeit einer größeren Informationsmenge u.a. von der Qualität verarbeitungsbezogener Informationsanreicherung abhängt.
Das mehrstufige Forschungsfeld der Forschergruppe kann wie folgt charakterisiert werden. Die Basis bilden auf der ersten Ebene die Möglichkeiten formaler Dokumentdeskriptionen, die XML bietet bzw. die auf XML aufbauen. Diese Basis wird auf der zweiten Ebene zum Ausgangspunkt genommen, um Bedingungen und Möglichkeiten sprachbezogener Informationsmodellierung zu untersuchen. Dies heißt zum einen: Wie können formale Dokumentdeskriptionen genutzt werden, um Eigenschaften sprachlicher Einheiten (Dialogkorpora, Lexika, Fachtexte) zu modellieren, so dass ein Gewinn an Verarbeitungsmöglichkeiten und an fachspezifischem Auswertungspotential erzielt werden kann. Dies heißt zum andern: Wie können formale Dokumentdeskriptionen genutzt werden, um Informationen eines Informationspools so zu verknüpfen, dass semantisch strukturierte Hypertexte und Hypermedien erzeugt werden können. Auf einer dritten Ebene schließlich werden Formen sprachbezogener Informationsmodellierung zum Ausgangspunkt genommen, um deren Semantik und mathematische Modellierbarkeit zu untersuchen: die Semantik bzw. Modellierbarkeit von XML-Dokumenten, Schemasprachen und Hyperdokumenten.

In the developing net-based "information society" information, texts and multimodal documents are exchanged according to information technological standards. Documents are augmented by formal, structure and content related markup which enables efficient document processing (filtering, media-specific presentation, conversion, query etc.). The value of these increasing amounts of information will depend crucially on the quality of the processes which add semantic structure to textual or multimodal documents. This is the domain of the research group. The added structure has several layers. The base layer consists of current information technological developments with respect to formal document descriptions (XML, schema languages). There is a second layer, in which approaches to language-related modelling of information are represented. One goal with respect to this layer is to make use of formal document description devices in order to represent structure- and content-related properties of natural language data (dialog corpora, lexical, technical texts). Another goal is to use formal document representations in order to connect units in an "information pool" (hypertexts, hypermedia). On a third layer theoretical approaches to information modelling are taken as objects of research, focussing on the question of which formal semantics can be given to content augmented documents and to their formal enhancements (document grammar, annotation schema, hyper document linkings).

 

---
Abkürzungsverzeichnis / Abbreviations

Seitenanfang / top

 

  Jahresbericht / Annual Report 2008 · Impressum / Disclaimer Deutsche Forschungsgemeinschaft DFG
 © 2009 DFG.