Java дает вам портируемый код, а Exensible Markup Language (XML) дает вам портируемые данные [8].

XML является стандартом, адаптированным Консорциумом World Wide Web (W3C - World Wide Web Consortium) для усовершенствования HTML для обмена данными в среде Web. В этой главе мы опишем XML, инструменты и API для доступа к XML из Java.

Большинство читателей видели HTML, язык для описания Web страниц. В отличие от многих, мы не будем критиковать HTML, он полностью удовлетворяет многим параметрам. HTML не первый язык тэгов, но он, определенно, наиболее часто используемый, наиболее удачный и наиболее широко понимаемый.

Если HTML такой удачный, почему у нас возникла необходимость в XML? Есть несколько причин.

Во-первых, XML облегчает обмен данными. В XML дата и описание того, как они должны быть структурированы (размечены) хранятся в виде текста, так что вы можете легко читать и редактировать. Во-вторых, XML разметка может быть настроена под заказчика и стандартизирована. Это дает нам экстраординарную силу XML. HTML является языком разметки, предназначенным для описания web страниц, но его основная слабость состоит в том, что он смешивает данные и представление. Когда группа пользователей с общей заинтересованностью в тэгах для определенного языка разметки работают с XML, они просто создают настроенный для своих нужд язык разметки. Сотни таких языков были стандартизированы, включая:

  • Bank Internet Payment System (BIPS)
  • Financial Information eXchange protocol (FIX)
  • Telecommunications Interchange Markup (TIM)
  • Mathematics Markup Language (MathML)

Фактически, вы можете добавить расширение в язык разметки, созданное кем-либо еще. Extensible Hypertext Markup Language (XHTML) является XML версией HTML, которая позволяет добавлять элементы на страницу, а браузер отобразит их, как обычный HTML.

XML также великолепен, поскольку XML документ является самоописательным. Вот простейший XML документ:

<?xml version="1.0" encoding="UTF-8"?>

<phonenumber country="us">
    <areacode>215</areacode>
    <number>6424748</number>
</phonenumber>

Каждый элемент XML имеет тэг и вы можете легко понять, какие данные представлены даже спустя годы. Это значит, что XML документ является самодокументируемым.

В-третьих, XML имеет такой синтаксис, который позволяет автору XML документа предать структуру данным. Вложенность элементов данных в другие элементы очень важна, поскольку данные необычайно просты. XML прост в дизайне, но может представлять сложные данных. При использовании HTML вы можете представлять длинный учетный документ, но использовать совместно этот учетный документ с другими программами или организациями будет сложно - они не знают о вашей структуре. HTML был предназначен для представления неопределенной структуры. В XML вы можете построить в соответствии семантическим правилам, которые указывают структуру документа учета. Другой XML документ может быть создан для описания того, как лучше отображать этот учетный документ. XML разделяет структуру и представление.

Что такое XML?

XML Элементы

XML Атрибуты

Набор Символов

XML Технологии

JAXP - Обработка XML

Пространство имен XML

Хорошо Форматированный и Достоверный XML

Синтаксический анализатор с проверкой достоверности: SAX и DOM

SAX

DOM

Плюсы и минусы SAX и DOM

Сериализация XML

Сериализация Xerces

Сериализация DOM Level 3

XML Трансформации

XML в HTML: Отображение меню

Корневой Узел

Заключение