Magisterarbeit: Generating Structured Documents

TU Vienna Logo

Magisterarbeit an der Technischen Universität Wien:

Download

Poster

PDF LogoDownload thesis (PDF, 1MB, May 2006).

Download poster (PDF, 600KB, May 2006).

Abstract

Structured documents are omnipresent in businesses as they contain vital information and may be created and processed automated. Apart from text parts and graphics they contain metadata commonly displayed using a characteristic layout. Some examples of structured documents include offers, contracts, business reports, letters, and catalogs. For creating such documents a system which automates this process is very helpful because uniform documents are filled with different data. The processing logic and the layout is defined only once at the beginning. Afterwards an automated process retrieves the data from external system and creates the documents according to the defined rules.

In this thesis existing software applications and technologies are analyzed that are able to create structured documents. Apart from business reporting systems, commonly used within databases, the main focus lies on XML-related systems, for example stylesheet designer and solutions for application integration (EAI). The use of XML enables new ways to create structured documents. Therefore document processing with XML is discussed separately and technologies such as XSLT and XSL-FO are described.

Furthermore the development of such a system is described supporting the integration of external data from CMS, DMS and EAI systems in addition to document creation. These data can be converted automated and repeatedly to appealing documents using templates. The deployment of standardized technologies like XSLT and XSL-FO enables a flexible and open transformation approach. Due to a graphical user interface the creation of such templates is simple and can be performed without specific knowledge about XML and XSLT.

Kurzfassung

Strukturierte Dokumente sind im Geschäftsleben allgegenwärtig, da sie wichtige Informationen enthalten und automatisiert erzeugt und weiter verarbeitet werden können. Neben den einzelnen Text- oder Grafik-Bestandteilen enthalten sie Metainformationen, die meist durch ein bestimmtes Layout dargestellt werden. Beispiele strukturierter Dokumente sind: Angebote, Verträge, Geschäftsberichte, Briefe oder Kataloge. Für solche Dokumente ist ein System, das deren automatisierte Erzeugung unterstützt, besonders hilfreich, weil viele gleichartige Dokumente mit unterschiedlichen Daten gefüllt werden. Die Verarbeitungslogik und das Layout wird einmal zu Beginn festgelegt, während ein automatisierter Prozess in Folge die benötigten Daten aus externen Systemen lädt und die Dokumente entsprechend den Regeln generiert.

Diese Diplomarbeit analysiert Softwaresysteme und Techniken, die strukturierte Dokumente erstellen und verarbeiten können. Neben Business Reporting Systeme, die meistens in Verbund mit Datenbanken angewendet werden, liegt der Schwerpunkt auf XML-bezogene Systeme wie beispielsweise Stylesheet-Designer oder Lösungen zur Anwendungsintegration (EAI). Die Etablierung von XML hat neue Möglichkeiten geschaffen, um strukturierte Dokumente zu erstellen. Deswegen wird das Thema der Dokumentverarbeitung mit XML gesondert behandelt und Techniken wie XSLT und XSL-FO beschrieben.

Weiters wird die Entwicklung eines XML-basierten Dokumentmanagement-Sys\-tems beschrieben, das neben der Dokumenterstellung auch die Einbindung von externen Daten aus CMS, DMS und EAI Systemen ermöglicht. Durch die Anfertigung von Dokumentvorlagen können diese Daten automatisiert und wiederholt zu ansprechenden Schriftstücken weiterverarbeitet werden. Der Einsatz von standardisierten Techniken wie XSLT und XSL-FO ermöglicht einen flexiblen und offenen Ansatz, um die Transformation durchzuführen. Da eine grafische Oberfläche die einfache Erstellung dieser Vorlagen ermöglicht, können jedoch auch Anwender ohne Kenntnisse von XML und XSLT das Programm benutzen.