Diplomarbeit

Arbeitstitel

Towards XML Transformation in the Binary Domain

Betreuer

Hermann Hellwagner, Christian Timmerer

Status

Vergeben

 

Kurzbeschreibung:

In dieser Diplomarbeit soll ausgehend von [Le04] Möglichkeiten zur Transformation von binär-kodierten XML-Daten untersucht werden. Als binäres Kodierformat dient das „MPEG-7 Binary Format for Metadata“ welches XML-Daten in sogenannte Access Units (AUs) und Fragment Update Units (FUUs) unterteilt. Die Struktur der FUUs ermöglicht prinzipiell den Zugriff auf FUUs im binären Bereich. Diese Diplomarbeit soll dabei folgende Ansätze untersuchen:

        Erweiterung des Kontextpfades welcher im allgemeinen zur eindeutigen Identifizierung der XML-Daten in der Payload dient.

        Definition eines Payload-Formats welches einfachen und effektiven Zugriff auf die zur Transformation benötigten XML-Daten im binären Bereich ermöglichen soll.

Alternativ soll die Nutzung eines binären Indexes [Ko05] für die Transformation im binären Bereich in Betracht gezogen werden.

Details bzw. mögliche Ansätze:

        Gewisse Attributwerte beinhalten nur standardisierte Werte wie z.B. Referenzen auf Classification Scheme Terms wie sie im syntacticalLabel-Attribute verwendet werden. Für diese Terms wäre es möglich vordefinierte Tokens zu verwenden anstatt diese mittel zlib zu komprimieren.

        Bei manchen Attributen besteht die Möglichkeit eine Reihe von Werten getrennt durch Leerzeichen anzugeben (z.B. marker-Attribute mit NMTOKENS). Um auf die einzelnen Werte gezielt zugreifen zu können (z.B. auf den x-ten Wert), wäre es günstig, wenn man diese auch getrennt codiert (z.B. markerWert_1=“abc“, markerWert_2=“cdf“, etc.)

        Gibt es alternativen zur zlib für kleine Stringwerte?

        Erweiterung des Kontextpfades um „predicates“ wie folgt zu ermöglichen: gBSDUnit[@marker='meinz'] oder vielleicht sogar auch gBSDUnit[contains(@marker, 'meinz'] bzw. gBSDUnit[Parameter[@name=':J2K:Csiz']]?

        Verwendung des Positionscodes anstatt von Attributwerten – dies führt beispielsweise auch bei normalen XSLT-Transformationen zu Performanceverbesserungen.

        Die Payload parsen und versuchen die geeignete Information zu finden, welche nicht zlib-komprimiert ist, aber als vordefiniertes Token.

        Skipinformationen in die Payload hineincodieren um effizient auf Nachbarkinder innerhalb einer FUU zugreifen zu können.

Zeitlicher Rahmen: Abschluss bis Ende Oktober (spätestens Ende Dezember)

Beträge zu Konferenzen und Standardisierungsgremien:

       MPEG Juli 2005: Vorschlag, was am Standard verändert bzw. hinzugefügt werden muss.

       MPEG Oktober 2005: Möglicher CE-Bericht inklusive Beschreibung der Realisierung.

       ITCom Oktober 2005 (Abstract bis 11. April 2005): Präsentation der Ergebnisse als Konferenzartikel.

Referenzen:

[Le04]   Peter Lederer, Binary Transformation of generic Bitstream Syntax Descriptions in MPEG-21, Diplomarbeit, Universität Klagenfurt, Oktober 2004.

[Ko05]   Andrea Kofler-Vogt, Harald Kosch, INDEXING OF MPEG-7 STREAMS, WIAMIS2005, April 2005.

Weitere Informationen: christian.timmerer@itec.uni-klu.ac.at

Stichwörter: Java, XML, XSLT, MPEG-21, MPEG-7, (MPEG-4, JPEG2000)

Letzte Aktualisierung: 2005/03/17,

Institut für Informationstechnologie,

Christian Timmerer

powered by