XML es una potente herramienta para definir estructuras de datos susceptibles de ser procesadas por una gran variedad de aplicaciones para realizar un eficiente intercambio electrónico de datos.
El propósito del taller básico no es sumergirse de lleno dentro de la sintaxis del lenguaje XML. En la página web: www.w3.org puede consultarse todos los detalles de su especificación. La finalidad de este taller es explicar qué es y para qué sirve XML, presentar sus elementos principales y, fundamentalmente, trabajar diferentes casos prácticos que ilustren su funcionalidad.
Una vez finalizado el taller los asistentes dispondrán del conocimiento sobre las posibilidades reales que ofrece XML, sabrán cómo evaluar las distintas herramientas XML que ofrece el mercado y cómo preparar una estrategia de formación e implantación de XML en su ámbito de negocio.
XML (eXtensible Markup Language) es un lenguaje orientado a identificar estructuras de datos en un documento. La especificación XML define la manera estándar de cómo hay que realizar el marcado de expresiones en un documento no estructurado , para que con dicho marcado se defina una determinada estructura de datos.
La especificación XML no define el contenido de las estructuras de datos, son los expertos de cada dominio y las entidades reguladoras, los agentes que pueden utilizar el estándar XML para consensuar un lenguaje común que permita transformar los documentos no estructurados en estructuras procesables por un sistema "machine readable system" (SGBD, HL7, EDI, etc.).
Cuando hablamos de un documento nos referimos no solo al concepto tradicional de documento en papel o soporte electrónico sino a todos los tipos de documentos actuales: páginas Web, correo electrónico, gráficos vectoriales, transacciones de comercio electrónico, etc. Un documento XML es un documento que puede ser leído y entendido por una persona "human readable system" y a la vez puede ser procesado por un sistema para extraer información "machine readable system".
Transformar datos en información, añadiéndoles un significado concreto y asociándolos a un contexto, siempre genera valor en la cadena de utilización de los datos fuente por parte de sus clientes. Consideremos la siguiente expresión:
|
|
Si sabemos de antemano que: HC 334455 es el número de historia clínica de un paciente, que Neumología es un punto de asistencia ambulatorio para las consultas externas de un hospital y que bronquitis aguda es un diagnóstico que dispone del código 466.0 dentro del sistema de clasificación CIE9-MC, obviamente este trozo de texto aunque no disponga de ninguna estructura subyacente, para nosotros es significativo. Sin embargo, un ordenador por muy potente que sea poca cosa podrá hacer más que trocear las palabras, indexarlas y procesarlas por separado.
Si ahora intentamos recuperar información con la ayuda de un agente inteligente de búsqueda a cerca de los casos clínicos tratados, la pieza de texto que hemos descrito será presentada como uno de los muchos resultados, con independencia de su relevancia para nuestro propósito de busca.
Transformar datos en información ![]()
Las marcas XML añaden el contexto necesario para indicar a las personas y a los sistemas capaces de leer su especificación, que estamos realizando un derivación donde HC334455 identifica la historia clínica de un paciente, con todos sus datos demográficos, administrativo asistenciales y por supuesto, clínicos; que Neumología es el nombre identificador de un servicio de consulta externa del hospital hacia donde es remitido el paciente, y que bronquitis aguda es el descriptor de un diagnóstico. Conociendo todo esta estructura podremos obtener recuperaciones de información mucho más relevantes y ajustadas a nuestros propósitos de búsqueda.
¿Porqué usar XML para crear estructuras de datos? ![]()
¿Hay otras maneras para estructurar datos que no sean XML? Por supuesto, de hecho cada fabricante de hardware y software desde el origen de los tiempos ha creado sus propios mecanismos propietarios para añadir contexto a datos fuente y definir estructuras de datos. La ventaja de XML es que es un estándar con independencia del tipo de implementación seleccionado. Esto significa que podemos usar herramientas de distintos proveedores para estructurar datos con la especificación XML, almacenarlos en una base de datos, realizar búsquedas o ejecutar cualquier proceso. En conclusión, nuestros datos serán accesibles y procesables por todas las herramientas que siguen el estándar XML con independencia de su plataforma y su fabricante.
La mayoría de compañías han optado por seleccionar los estándares más aceptados en todas sus herramientas de información (un buen ejemplo son los procesadores de textos y los gestores de correo electrónico), con la finalidad de intercambiar información sin tener problemas con el formato del soporte. Cualquier procesador de textos, por muy extendido que esté en el mercado, dispone de un formato específico propiedad de su fabricante que puede ocasionar problemas en el caso de intercambio de datos a través de distintas plataformas. XML establece un formato de datos que representa un estándar abierto independiente de fabricantes y de plataformas (sistemas operativos), también permite producir documentos en entornos multimedia (web, CD-ROM) de manera muy eficiente.
¿Si todo el mundo ya conoce HTML, porqué no seguir usándolo? ![]()
HTML es el estándar de facto en la web. Sin embargo, HTML dispone de un número limitado de etiquetas (tags) diseñadas en su mayoría para mostrar textos en los navegadores (browsers) con diferentes estilos. XML, con su capacidad para definir cualquier nombre de etiqueta y, por lo tanto, marcar de manera precisa una pieza (o una colección de piezas anidadas) de datos, ofrece una gran potencia y flexibilidad para estructurar documentos y realizar un intercambio electrónico de datos de manera muy eficiente.
Para apreciar todas las posibilidades de interoperabilidad de XML es importante saber que fue creado originalmente para poder utilizar documentos con estructuras complejas dentro de la web. De hecho incorpora una serie de nuevos elementos con respecto al HTML, pero sigue siendo una variante evolutiva del SGML. HTML y SGML no están diseñados para definir estructuras de datos. Las últimas versiones del Explorer y Netscape ya soportan la especificación XML y aunque importantes gurús del sector anuncian la extinción del HTML, lo más probable es que ambos cohabiten en las miríadas de páginas web publicadas.
Elementos, marcas y anidamiento ![]()
XML suministra los medios para etiquetar (marcar) piezas de datos (elementos). Por ejemplo, en el caso anterior podíamos haber marcado el paciente con la etiqueta: <Cliente>. Los elementos son marcados rodeándolos por una etiqueta (tag) que indica su punto final de marcado con esta expresión: </Cliente>.
Las etiquetas pueden estar anidadas, es decir, los elementos definidos pueden estar contenidos dentro de otros elementos. Por ejemplo en el caso anterior donde describimos la derivación de un paciente, ésta puede contener los siguientes subelementos para describir la fecha de la derivación, la historia clínica del paciente, el servicio y el diagnóstico que motiva la derivación.
|
<Derivacion>
</Derivacion> |
Este ejemplo está indentado sólo a efectos de ilustrar un anidamiento básico. Normalmente un anidamiento puede disponer de muchos niveles de detalle, por ejemplo, la estructura que define la "Derivación" puede estar contenida en otra estructura mayor definida como "Consulta Externa" y ésta a su vez en otra estructura mayor definida como "Actividad Ambulatoria", y así sucesivamente definiendo un directorio como la estructura general de los documentos de nuestro sistema de información.
En estos ejemplos hemos utilizado diferentes nombres para definir las etiquetas, y esto es así porque a diferencia del HTML (que dispone de un número fijo y predeterminado de etiquetas) con XML no existe ninguna limitación en cuanto al número ni a la diversidad de etiquetas posibles. Cada usuario, o mejor dicho, cada diseñador de documentos, construye estructuras de datos asignando aquellas etiquetas que mejor describen sus datos y, como hemos dicho al principio, son los expertos de cada dominio y las entidades reguladoras, los agentes que pueden utilizar el estándar XML para consensuar un lenguaje común que facilite un intercambio eficiente de datos en su ámbito de actuación.
A partir de ahora vamos a usar el concepto de "documento" para describir una estructura de datos. Un documento puede llegar a describir desde una estructura de datos tan sencilla como un simple mensaje (que no requiere ningún anidamiento) entre distintos ordenadores, a algo tan grande y complejo como la Enciclopedia Británica que dispondrá de una gran cantidad de tipos de elementos y muchos niveles de granularidad en sus anidamientos.
Los documentos XML pueden construirse para ser documentos "válidos" o para ser documentos "bien formados". Si hablamos de un documento válido, es que éste documento está asociado a un conjunto de reglas que definen su estructura lógica. El documento se certifica conforme a estas reglas que en conjunto reciben el nombre de "Definición de tipo de documento" (DTD). Cuando hablamos de un documento bien formado, manifestamos que éste sigue las reglas de sintaxis especificadas para el lenguaje XML, pero no dispone de reglas de certificación asociadas. Un documento bien formado puede ser muy simple, todo lo que necesita contener son elementos de datos.
Un DTD (Definición de tipo de documento) es una colección de reglas usadas con el propósito de identificar un tipo o clase de documento. Por ejemplo, podemos escribir una gran cantidad de informes, pero en general algunos de ellos tendrán una serie de puntos de común. Los informes pueden contener el nombre del autor, el nombre del sujeto a quien se refiere el informe, quizás una lista de distribución, un número de referencia, fecha de creación, título del informe, títulos de secciones, gráficos, etc.
El DTD realiza las siguientes tareas:
Información para realizar el taller básico XML ![]()
Este taller básico puede realizarse en la propia empresa, consta de cuatro unidades distribuidas en 8 horas, que se desarrollan en un solo día, en su modalidad intensiva, o bien, distribuidas en dos o tres días, en función de las necesidades de agenda.
La matrícula incluye la documentación de los casos trabajados en el taller y su importe está en función del número de asistentes y de la modalidad escogida.
Para mayor información contactar con jvilalta@vico.org