Data science | Informática y Sistemas (β)

2023/04/07 - 7 abril 2023

Políticas de distribución de información dentro las organizaciones

Filed under: Comentarios sobre Metodologías,Filosofía y Sistemas de Información,Inteligencia de Negocios,Sobre Arquitectura de Sistemas Informáticos — Mario Mendez @ 22:10
Tags: AI, Business Intelligence, Capacitación, Data science, Desempeño

Llevamos un cuarto de siglo de la gran transformación del acceso de la información, inicialmente segmentada y limitada, a la llegada de la big data en forma generalizada. Suena impresionante lo del cuarto de siglo, sobre todo para quienes son de mi generación y acompañaron día a día estos cambios ahora parece demasiado tiempo, pero más impresionante es la transformación que obró dentro de las misma organizaciones a nivel operativo. Sobre este último punto, y qué tipo de decisiones toman los niveles directivos en consecuencia es de lo que trata el artículo.

Hoy cuesta imaginar una organización desconectada de la web, manejando información en ordenadores personales e intercambiándolas en soportes magnéticos físicos. Sin embargo esa situación era la que reinaba a principio del siglo XXI en organizaciones pequeñas a medianas. La llegada de internet y el reemplazo de las redes propietarias por la web se impuso rápidamente, obviamente por la economía de costos asociados al cambio, pero a la vez logró conectar por primera vez a cualquier organización montada sobre esta red universal. Los intercambios de información era prácticamente instantáneos en formato puramente electrónico, pero además de eso el costo de almacenamiento se abarató tanto o más, permitiendo que la información se acumulara históricamente en forma muy sencilla.

Para mitigar el manejo de los grandes volúmenes de información se masificó el uso de los almacenes de datos o datawarehouse, de los que hablamos ampliamente en artículos anteriores. Esto trae como consecuencia que cualquier área de una organización necesite acceder y revisar estos almacenes con frecuencia. De ahí viene la gran decisión a tomar desde el nivel Directivo de la organización: el permitir el acceso directo a los almacenes de datos, o solo manejarse en función de la reportabilidad que ofrece. Las dos corrientes tienen sus pro y sus contras, veamos por separado las principales características y diferencias.

El acceso democrático a los datos facilita que se alivien las áreas de Sistemas, dado que la característica de autoservicio permite que cada área organice la información que necesita en función de sus propias necesidades y construya sus propios informes o reportabilidad. Desde un punto de vista de costos aliviar el capital humano de Sistemas sigue en cierto modo la línea de minimizar la injerencia de las áreas de Sistemas en todos los ámbitos, tendencia que revisamos ampliamente en este articulo de recuento histórico, sin embargo obliga a que personal no relacionado a sistemas adquiera conocimientos y experiencia en herramientas de acceso y consultas a los almacenes de datos. Es decir que obliga a estudiar temas que exceden las incumbencias profesionales de los puestos diversos, como ser los contables o de ventas, para poder aprovechar los recursos de información con cierto éxito. Por otro lado, hay un conflicto en el acceso mismo a la información que por consideraciones de seguridad no puede estar disponible en su totalidad a todos los ámbitos, siempre se maneja un gran porcentual de información reservada para áreas específicas. Las soluciones de compromiso para superar estas dificultades son principalmente las siguientes:

Capacitar a personal en temas de leguaje (SQL o Python para consultas/data science principalmente) y comprender modelos de datos dimensionales. Esto trae aparejado el gran problema de tomar con liviandad un tema que de por sí es complejo dentro de carreras universitarias y ámbito laboral de los profesionales de sistemas, para preparar a personal sin conocimientos de base suficientes. Los resultados que se obtienen con esta táctica son generalmente pobres y con una curva de aprendizaje larga y costosa.
Adjuntar a las áreas auxiliares con conocimientos de informática como personal de apoyo exclusivo: esto mejora la carga operativa del personal del área en temas que no son su especialidad, pero trae un sobre costo por sumar colaboradores que no son específicos de estas áreas, que al ser auxiliares operativos tampoco tienen grandes conocimientos. Generalmente serán estudiantes o personal temporario sin compromiso, y con una alta rotación al estar asignados en áreas en las que no pueden desarrollarse o crecer profesionalmente en su especialidad.
Para restringir el acceso a la totalidad de la información, obliga a las áreas de Sistemas de Información o las que estén a cargo de los almacenes de datos a segmentar los permisos en forma minuciosa aumentando la carga administrativa de los accesos y esquemas de seguridad, cuando no debilitándola. El complemento lógico a esta rutina es generar tantos datamart como áreas necesiten acceder, para poder consolidar en forma más visual el conjunto de datos que deben manejar cada una según el área de destino, desviando la función de la arquitectura de un datawarehouse corporativo de optimizar sus esquemas de almacenamiento a replicar de manera redundante la información en los distintos datamart, desvirtuando la misión principal de los mismos por temas puramente administrativos.

Estos tres considerandos generalmente provocan que la idea original se convierta en algo desde inmanejable hasta directamente oneroso e insostenible en el tiempo. Solo pensando que la rotación de las áreas no informáticas obliguen a comenzar los ciclos de capacitaciones internas prácticamente invalida a la larga el primer punto, y las transformaciones de la misma organización que reorganicen cada cierto tiempo su organigrama provoquen situaciones de estrés administrativo sobre los almacenes segmentados, convirtiendo esta política inviable con el transcurrir del tiempo salvo contadas excepciones: en organizaciones de poca rotación y alta madurez estructural.

Veamos ahora la política alternativa, la de un almacén de datos centralizado en un área de información. Bajo este esquema, las áreas no conocen los almacenes de datos sino a través de sus reportes o extracto de datos periódicos obtenidos en forma controlada. El área que administra la información aplica la seguridad según la necesidad del volcado de reportes respectos de las diversas áreas, y no tanto en la administración de los accesos que serán internos de su área, limitados en cantidad y roles mejorando el gobierno de la información. Las áreas no necesitan contar con personal especializado en manejo de modelos de datos o lenguajes de consulta, pudiendo utilizar las herramientas más tradicionales de oficina para operar sin problemas. Este esquema tiene el inconveniente que cada área queda limitada al manejo de datos en cantidades que sean manejables por sus herramientas, no teniendo la oportunidad de explorar en profundidad los datos por fuera de reportes estandarizados históricos, o trabajar con la big data. Veamos cuales son las consecuencias de lidiar o mitigar estas dificultades.

El área de Información (sea una Gerencia de Sistemas o como en mi caso una dedicada a BI) debe tener la capacidad suficiente para poder proveer de reportabilidad oportuna a toda la organización. Es decir que deberá contar con un número de colaboradores que exploten la información a medida de la demanda que tenga de reportabilidad nueva o eventual que surja a través del tiempo. Sí implica hacer crecer en personal el área, pero la ventaja del esquema anterior es que estarán mejor aprovechados dado que satisfacen necesidades en forma transversal y no son dedicados a una área específica cada uno. Mejora la sinergia de equipo y minimizarán los tiempos muertos entre requerimientos. Asimismo al pertenecer a un área de información mejorará la calidad profesional de los colaboradores, bajando además su rotación por estar más incentivados.

Concentrará las tareas de data science, o creará los modelos a explotar por las áreas de negocio. Esto implica que necesitará personal especializado en técnicas emergentes de Machine Learning, IA, o modelos neuronales/cuánticos, lo que alivia a las áreas de negocio a incorporar estas especialidades cada vez más alejadas de sus funciones específicas. Como contrapartida de ello es que los profesionales dedicados a explotar la información por estas técnicas deban comprender muy bien las necesidades de las disciplinas a las que abastecerán con sus modelos, lo que excede las funciones de profesionales de sistemas convirtiendo el área de Información en un ámbito multidisplinario. Esto último no debe sorprender, en gran medida es la culminación de un proceso que se viene dado de hace largo tiempo.

Se perderá en gran parte la opción para las áreas de negocio de hacer su propio “data mining” o exploración intuitiva de datos, salvo para conjuntos de información parciales y perdiendo mucho del contexto general. El estudio de los comportamientos desde la información interna y externa de la organización adquiridas en los almacenes de datos residirá principalmente en el equipo de data science, que deberá dividir sus tareas en satisfacer los requerimientos programados y el apoyo en el estudio eventual de información junto a las áreas de negocio sin necesidad de anticipar un entregable definido. Esto obliga a tener una perfecta administración de los tiempos de proyectos y los de servicio adicional, para no atrasar unos no desatender los otros.

En definitiva, si un área dedicada de Información atiende estas necesidades el rendimiento general, y los resultados obtenidos, mejorarán ostensiblemente respecto a la política analizada previamente. La gran desventaja es que necesita de una gran inversión inicial en tiempo y personal para concretarla, mucho más visible a niveles de presupuestos involucrados en un sector que aparentemente otorga un soporte de funcionamiento de la empresa. Esta última visión es la que llevó a disminuir la importancia de lo que eran las Gerencias de Sistemas, como vimos en el artículo previo desmembrada y minimizada prácticamente a un sector menor de servicios, y que de algún modo se van revirtiendo a medida que aparecen nuevas tecnologías de la información que necesitan de personal ultra especializado para aprovecharlas y no dejar estancada al organización en esquemas obsoletos que tenderán a desaparecer. Para ello deben reformular las incumbencias, y dividir definitivamente los que es el soporte de infraestructura y comunicaciones/redes como Gerencia de Servicios, y rescatar las Gerencias de Sistemas como esqueleto fundamental del flujo de la información de las organizaciones, y ahora también del análisis masivo de datos. Un artículo que detalla en forma completa como una unidad de este tipo se conforma en grandes estructuras organizacionales pueden leerlo en esta página.

Deja un comentario

Informática y Sistemas (β)

2023/04/07 - 7 abril 2023

Políticas de distribución de información dentro las organizaciones

Páginas

Posts Más Vistos

Categorías

Buscar

registro de propiedad intelecual

Lectores

Tags

Archivos

Meta

Informática y Sistemas (β)

2023/04/07 - 7 abril 2023

Políticas de distribución de información dentro las organizaciones

Páginas

Posts Más Vistos

Categorías

Buscar

registro de propiedad intelecual

Lectores

Categorías nube

Tags

Archivos

Meta