6/4/11

Documentos Office Open XML

Los documentos en formato digital son el producto de la actividad de las personas que emplean una tecnología de software para crear un resultado visible en pantalla o impresora.

El resultado consiste, hablando en términos generales, en dos tipos de información:
  • Los datos o contenido intelectual del documento.
  • La información de formato acerca de cómo se presenta ese contenido.
Por ejemplo, el documento digitial creado para un contrato, una propuesta, una carta, un curriculum, un manual o un libro, posee la creación intelectual conocida como contenido, y la forma en la cual el mismo se visualiza para una mejor comprensión que abarca el tipo de letra, el tamaño de la misma, si posee texto en negrita o cursiva, y si el texto se encuentra dentro de un cuadro o tabla.

Los formatos de documento son los medios para contener y describir ambos tipos de información de forma que las aplicaciones de software puedan utilizar y reutilizar la información, sin embargo, cada aplicación de software puede estar utilizando la información de formas distintas en función de sus diferentes capacidades.

OBJETIVO

El fin que se desea al disponer de formatos de documento abiertos es permitir el intercambio libre o la interoperabilidad de toda esta información de un documento a otro y de unas aplicaciones a otras, como por ejemplo, permitir que una aplicación diseñada para guardar y obtener datos de una base de datos, pueda crear automáticamente un documento con formato con la información que administra, y otra aplicación pueda leer el contenido del documento con formato para procesar la información contenida en el mismo.

Supongamos que un sistema que administra el catálogo de productos de la empresa en una base de datos para llevar a cabo los procesos de negocio de la empresa, posea de cada producto su código, nombre, foto, información técnica y precios, y la empresa dentro de sus tareas habituales deba distribuir dicha información a otras empresas en un formato legible por los usuarios.

Sería deseable que en lugar de distribuir una base de datos que requiere de ciertos conocimientos de los usuarios para acceder a la información, el catálogo de productos pueda ser generado en un documento conteniendo formato para una mejor lectura.

Las empresas que reciben dicho catálogo tendrán el beneficio de que sus usuarios puedan leer el documento de manera sencilla, pero que sucede si además, las empresas que reciben dicho catálogo deben incorporar la información contenida en el mismo en sus propios sistemas de negocio?

No sería deseable que los usuarios deban digitar toda la información contenida en el documento en el sistema de su empresa.

Si el mismo documento posee la característica de que tanto los datos de contenido como de formato puedan separarse, además de facilitar la lectura de los usuarios, también podría accederse exclusivamente al contenido para procesar la información del catálogo de productos contenido en el documento e incorporarla dentro de su sistema.

FORMATOS OFFICE OPEN XML

Los documentos en formato Office Open XML (También llamados OOXML u OpenXML) son formatos de archivo abierto y estándar cuyas extensiones más comunes son .docx, .xlsx y .pptx, y son utilizados para representar y almacenar documentos de texto, imágenes, hojas de cálculo, gráficas y presentaciones.

Un archivo Office Open XML contiene principalmente datos basados en el lenguaje de marcado XML (eXtensible Markup Language o Lenguaje de Marcas eXtensible) comprimidos dentro de un archivo ZIP, estando diseñados para ofrecer las máximas posibilidades de acceso a toda la información contenida en los documentos, tanto sea el contenido como el formato.

Un documento XML no es otra cosa que un archivo de texto estructurado con marcas, que es utilizado actualmente para representar datos y texto, y un archivo ZIP es un formato estándar para contener múltiples archivos en uno sólo, lo que facilita la administración, a su vez que también el tamaño de almacenamiento, ya que también poseen un algoritmo que permite comprimir el tamaño.

ESTANDARIZACIÓN

En respuesta a las necesidades de clientes y partners por resolver el intercambio de información sin perder calidad de presentación, Microsoft ha desarrollado los formatos Office Open XML para dar paso a muchos escenarios novedosos que se basan en el uso de información contenida en documentos, y ha documentando, licenciando, distribuido y dado soporte a los formatos Office Open XML de una forma totalmente abierta, para que los clientes pueden utilizar y reutilizar sus contenidos de la manera que deseen, independientemente del software que utilicen para crearlos o editarlos, entregando la especificación de los mismos a ECMA International bajo la supervisión del Comité Técnico TC45 de ECMA International para ser desarrollada como el estándar ECMA-376, proceso que culminó en el año 2006.

Tras un par de años de trabajo y luego de incorporar algunos de los cambios propuestos por miembros de las organizaciones ISO/IEC, se publicó una versión corregida de la especificación como estándar internacional ISO/IEC 29500:2008, Information technology – Office Open XML formats, y como ECMA-376 Office Open XML File Formats - 2nd. Edition.

Este trabajo liderado por Microsoft ha sido acompañado por otras empresas líderes del sector, como Apple, Intel,  y Toshiba entre otras, y la colaboración con el ECMA a fin de estandarizar los formatos de archivo Office Open XML supone que el nuevo estándar abierto internacional sea extremadamente útil bajo condiciones muy variables, facilitando una gran difusión, que contribuye a garantizar el uso de millones de documentos entre millones de clientes del sector público y empresas privadas en todo el mundo.

INTEROPERABILIDAD

No hay restricciones para terceros, ya sean clientes o desarrolladores, para el uso de los formatos Office Open XML, y en la medida en que la gente que trabaja con los formatos ya conoce las tecnologías XML y ZIP, este hecho les facilita el acceso a los datos mediante el uso de XML como tecnología común de interoperabilidad.

Cuando alguien desea pasar datos desde un sistema de un tipo determinado a otro, verá que esta tarea se hace de una forma relativamente sencilla, y al tratarse de un estándar los mecanismos de licencia son totalmente abiertos, y la documentación es abundante, con lo que no deberían aparecer barreras técnicas ni legales para operar con estos formatos.
La elección del formato ZIP se ha debido a que es un estándar ampliamente difundido en el sector, y existen muchas herramientas disponibles para operar con el formato ZIP, y el uso de ZIP aporta una estructura flexible y modular que facilita una extensión de la funcionalidad, con vistas al futuro, por lo tanto, los desarrolladores y usuarios disponen de acceso a todos los contenidos de los documentos Office Open XML usando cualquiera de las numerosas herramientas y tecnologías que actualmente funcionan con los archivos ZIP estándar.

Una vez abierto el archivo contenedor, se pueden manipular cualquiera de las partes del documento contenidas dentro del paquete que define el documento, como por ejemplo, se podría abrir un documento Word que utilice formatos Office Open XML, localizar la parte XML que representa el cuerpo del documento Word, modificarlo usando cualquier tecnología capaz de editar XML y devolverlo al paquete contenedor para crear un documento Word actualizado, o se podría procesar la información cotenida dentro de un archivo Excel con el formato Office Open XML para guardar la información en una base de datos.

LICENCIAMIENTO

La licencia para Office Open XML está disponible y exenta de royalties para todo el mundo, con lo cual los desarrolladores de soluciones poseen libre acceso para trabajar con Office Open XML sin restricciones, pudiendo cualquier cliente o proveedor de tecnología utilizar los formatos de archivo en sus propios sistemas sin que suponga compromiso financiero de ningún tipo hacia Microsoft, ni otra empresa o entidad.

Para un fácil acceso a esta tecnología, ha surgido el Grupo de Desarrollo de formatos Office Open XML, el cual se encuentra abierto sin coste alguno, dedicándose a brindar a la comunidad de desarrolladores el apoyo necesario para utilizar estos formatos abiertos sobre cualquier plataforma. Por más información puede accederse a openxmldeveloper.org.

MICROSOFT OFFICE

La suite Microsoft Office ha incorporado el formato de documentos Office Open XML desde su versión 2007, y Microsoft proporciona herramientas de conversión para documentos creados con versiones anteriores de Office, además de actualizaciones gratuitas para las versiones de Office previas hasta Office 2000, lo que permite a los clientes y al mercado aprovechar las ventajas de los nuevos formatos basados en XML, independientemente de que hayan comprado o no Office 2007 u Office 2010.

Hasta la próxima.

No hay comentarios:

Publicar un comentario