7.9 XML-Schema-Validierung *
XML ist ein sehr freies Format, und Dokumente können leicht XML-Elemente enthalten, die so eigentlich vom Designer nicht vorgesehen waren. Um sicherzustellen, dass XML-Dokumente nicht zu »frei« sind, sondern sich an bestimmte Regeln halten, gibt es unterschiedliche Korrektheitsbeschreibungen. Die populärste ist XML Schema (siehe auch Abschnitt 7.2.3, »Schema – eine Alternative zu DTD«), die das ältere DTD ersetzt hat. Eine XML-Schema-Datei hat ebenfalls das XML-Format (anders als DTD) und wird einem Parser zusammen mit der XML-Datei gegeben. Der liest ein XML-Dokument ein und prüft, ob die Regeln eingehalten werden.
7.9.1 SchemaFactory und Schema
Java unterstützt die Schema-Validierung, die jedoch standardmäßig ausgeschaltet ist. Ein Grund ist, dass die Validierung die Rechenzeit und den Speicherbedarf erhöht. Um die Validierung zu aktivieren, muss zunächst ein Schema-Objekt aufgebaut werden. Bei JAXB haben wir die Validierung schon genutzt und Folgendes geschrieben:
SchemaFactory sf = SchemaFactory.newInstance(
XMLConstants.W3C_XML_SCHEMA_NS_URI );
Schema schema = sf.newSchema(
ValidatingRoomUnmarshaller.class.getResource( "/schema1.xsd" ) );
Das Objekt vom Typ Schema repräsentiert die Schema-Beschreibung.
7.9.2 Validator
Im Fall von JAXB wurde das Schema-Objekt direkt an JAXB festgemacht und zur Validierung genutzt. Unabhängig davon bietet das Schema-Objekt die zentrale Methode newValidator(), die einen Validator liefert, der letztlich die Validierung durchführt.
Schema schema = ...
Validator validator = schema.newValidator();
abstract class javax.xml.validation.SchemaFactory |
- final SchemaFactory newInstance(String schemaLanguage)
Liefert eine SchemaFactory, die die angegebene Schema-Sprache unterstützt. Bei der XML-Schema-Validierung wird der String immer XMLConstants.W3C_XML_SCHEMA_NS_URI sein, also "http://www.w3.org/2001/XMLSchema". Es gibt zwar auch die Konstante RELAXNG_NS_URI für RELAX NG Schema-Validierung, doch JAXP unterstützt dies nicht. - Schema newSchema(File schema) throws SAXException
Parst die Datei und baut das Schema-Objekt aus. Gibt es beim Parsen Fehler, folgt die SAXException. - Schema newSchema(URL schema) throws SAXException
Holt sich die Schema-Datei von der URL, parst sie und baut das Schema-Objekt auf. Gibt es beim Parsen Fehler, folgt die SAXException.
abstract class javax.xml.validation.Schema |
- abstract Validator newValidator()
Liefert einen Validator für das Schema.
7.9.3 Validierung unterschiedlicher Datenquellen durchführen
Dieser Validator bietet die Methode validate(), und ihr wird entweder eine DOMSource, JAXBSource, SAXSource, StAXSource, StreamSource – also ganz allgemein gesprochen ein Objekt vom Typ javax.xml.transform.Source – übergeben. An dem Paket lässt sich ablesen, dass Source ein Typ aus dem XSLT-Paket ist.
Wie ist nun der Weg, um etwa einen DOM-Baum zu validieren? Der DOM-Baum muss als Source-Objekt verpackt und dann der validate()-Methode übergeben werden. Etwa so:
Document document = ...
validator.validate( new DOMSource(document) );
Gibt es Fehler, gibt es eine SAXException, die eine geprüfte Ausnahme ist, also behandelt werden muss. Es lässt sich mit setErrorHandler() ein spezieller ErrorHandler setzen, damit Fehler dort aufgefangen und dokumentiert werden können.
abstract class javax.xml.validation.Validator |
- void validate(Source source) throws SAXException, IOException
Führt die Validierung der Eingabe durch. - abstract void setErrorHandler(ErrorHandler errorHandler)
Setzt ein Objekt zum Auffangen der Fehler.
Ihr Kommentar
Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.