Was ist ein XML-Parser

Was ist ein XML-Parser?

Ein Parser ist ein Programm, das ein Dokument (das kann irgendeine Art von Datei sein) einmal "durchliest", und die enthaltenen Informationen darüberliegenden Schichten der Anwendung in irgendeiner Form zur Verfügung stellt.

Nichts anderes macht ein XML-Parser. Er nimmt das XML-Dokument her, und stellt die enthaltenen Informationen (also Elemente, Attribute usw.) der Anwendung zur Verfügung. Will man also ein Programm schreiben, das XML-Daten verarbeiten kann, kommt man nicht umhin entweder selbst einen Parser zu schreiben, oder einen vorhandenen Parser zu benutzen.

Von der zuerst genannten Möglichkeit möchte ich abraten, da das erstens recht aufwendig wird, und zweitens entsprechende XML-Parser frei verfügbar sind. Ihr könnt eure Energien also voll und ganz auf das Schreiben der Anwendung konzentrieren (warum mehr Arbeit machen als nötig?).

Was euch erwartet

Es sind XML-Parser von verschiedenen Firmen und für verschiedene Programmiersprachen (frei) verfügbar. Genannt seien hier als Firmen IBM und Sun. Auch MS hat einen Parser entwickelt, der in den IE 5.0 eingebaut wurde. Will heißen, daß der Internet Explorer XML "versteht" (gebt dem IE einfach mal eine XML-Datei "zu fressen", und guckt was passiert). Allerdings glänzt der MS-Parser nicht grade durch seine Standardkonformität (mal ehrlich, habt ihr was anderes erwartet?).

Ich habe mir 2 Parser herausgegriffen, nämlich den von Sun (Project X TR2) und den von IBM (XML4J v2.0.15), und diese etwas ausprobiert. Die Grundlagen der Benutzung beider Parser möchte ich hier vermitteln. Andere Parser werden sich in der Benutzung nicht wesentlich unterscheiden, da die Schnittstellen großen Teils standardisiert sind. Beide sind komplett in Java geschrieben. Folglich sind auch alle Beispiele in Java.

Erwartet aber bitte nicht, daß ich die Parser bin ins letzte Detail erklären werde. Wie gesagt, ich will die Grundlagen vermitteln. Für weiterführende Lektüre kann ich natürlich nur die API-Doc's empfehlen. Ich werde auch wieder eine Linkliste zur Verfügung stellen.

Falls ihr euch nocht keinen Parser gezogen habt, hier die URL's zum Sun- und IBM-Parser:

http://java.sun.com/j2se/1.4.2/…../package-summary.html (Sun)

http://www.alphaworks.ibm.com/… (IBM)

[ANMERKUNG: Den Parser von IBM gib es in der Form nicht mehr (deshalb ist obiger Link auch tot ;-). Er wurde an Apache übergeben, und heißt jetzt Xalan. Saugen könnt ihr euch den über http://xml.apache.org/ bzw. Xalan-Java Version 2.7.1.
Natürlich hat sich auch bei Sun einiges getan, es gibt neue Produkte und neue Releases. Als Einstieg, nicht nur zum Parser, soll dieser Link dienen: http://java.sun.com/xml/index.html.]

Bei Sun ist eine Registrierung erforderlich, um den Download durchzuführen. Das ist zwar lästig, aber leider nötig. Beide Parser sind dafür kostenlos.

Sowohl der Sun- als auch der IBM-Parser kommen mit Beispielen und Dokumentation, also viel Stoff zum Lesen für euch

zurück              weiter

nach oben