Informática y Sistemas (β)

2010/07/28 - 28 julio 2010

Integración de Datos Estructurados, Semiestructurados y No Estructurados

Las organizaciones actualmente enfrentan el problema de la diversidad de contenidos digitales, que fue incrementándose con el tiempo y la proliferación de incontables sistemas de documentación digital de formatos e igualmente de numerosos. Por ello la disciplina de Inteligencia de Negocios, que se auxilia de la integración de información y condensación de sistemas de gestión de conocimiento, se ve empujada cada vez más a lidiar con este ecosistema digital cada vez más complejo.
Inicialmente su problema inicial, y con una batalla casi ganada, consistió en la integración de sistemas independientes que generalmente trabajan información ordenada y residente en bases de datos relacionales. Sin embargo una gran cantidad de información siguió residiendo en documentos generados por aplicaciones ofimáticas (procesadores de texto, planillas de cálculo), creciendo en forma incontrolada y descentralizada. Asimismo la introducción de elementos multimedia conteniendo asimismo importante información, tanto en formato de presentaciones estilo PowerPoint, como en conjunto de scans, imágenes y videos; siguió diversificando la modalidad de almacenamiento, complicando el gobierno de la información corporativa.
La Inteligencia de Negocios no puede ser ajena a este escenario, dado que para tener una gestión integral necesariamente debe lidiar con la condensación y centralización de la información distribuida. Por este motivo en los recientes años fue evolucionando para atacar el problema con técnicas que le permitieran trabajar no tanto desde el punto de vista de las prestaciones de algún producto particular, sino más bien desde una arquitectura que permitiera incorporar estos elementos.
Estos datos que como antítesis de los Estructurados se denominan genéricamente como No Estructurados, si bien pueden ser contenidos en productos de bases de datos como objetos, la realidad es que no es posible hoy ni se espera a futuro cercano, que dichos productos permitan extraer información útil para su manejo (como reconocimiento de texto u OCR, interpretación de sonidos o de videos). Asimismo los archivos de procesadores de texto y planillas de cálculo no poseen estructuras internas coherentes o fácilmente interpretables como para lograr una integración masiva.
Para poder lidiar con esta información, la técnica adoptada es la generación de metadatos. Los metadatos se asocian al objeto en cuestión permitiendo contar en forma más accesible con atributos que permitan clasificar y resumir la información contenida en el objeto. Los metadatos no vienen a suplir la información del objeto, sino el entregar en forma estructurada datos suficientes para la manipulación, tanto para crear relaciones entre los objetos y modelos estructurados como para efectos de listados y volcados en reportes masivos. Este mix permite conformar los datos semi estructurados, con la ventaja de que pueden manipularse como estructurados gracias a sus atributos promocionados como metadatos, pero con su contenido original a efectos de poder ser explorado a nivel de detalle por parte de los usuarios de los sistemas de BI.
Los metadatos de objetos no son un invento original, de hecho no solo las aplicaciones más elaboradas de bases de datos documentales (como SharePoint) permiten manejar atributos adicionales sobre los objetos, sino que también los sistemas operativos permiten adicionar atributos a los objetos almacenados en sus directorios. Extender esta técnica a la arquitectura de los sistemas de Inteligencia de Negocios potencia notablemente su capacidad, al considerar la unificación de datos estructurados y no estructurados (llevados a la forma semiestructurada) bajo capa de presentación común; como asimismo permitir la interacción enriquecedora de los usuarios que pueden complementar el tejido de relaciones entre los objetos documentales conformando una base de conocimiento que crece naturalmente en forma ordenada, y por ende fácilmente explotable.

(tiny)

Anuncios

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: