Isaac Sacolick
Contributing Writer

Los seis riesgos relacionados con los datos que el CIO debe tener muy en cuenta

Desde datos mal clasificados hasta el uso de la inteligencia artificial sin un control de calidad adecuado, el CIO que desee sacar el máximo partido a la toma de decisiones basada en datos tienen mucho de qué preocuparse.

6 data risks
Créditos: Rob Schultz / Shutterstock

Los CIO se ven presionados para ofrecer análisis predictivos y transformar la plantilla con agentes de IA. Sin embargo, las inversiones en gobernanza, operaciones y seguridad de los datos, hasta ahora importantes, ahora quedan con demasiada frecuencia en un segundo plano frente a las iniciativas impulsadas por el negocio, lo que deja el éxito de la IA en el limbo.

Con el objeto de abordar esta brecha y garantizar que la cadena de suministro de datos reciba la atención necesaria, han contratado o se han asociado con directores de datos, a los que han encomendado la tarea de abordar la deuda de datos, automatizar los canales de datos y transformar el modelo hacia una gobernanza de datos proactiva centrada en métricas de salud, calidad de los datos e interoperabilidad de los modelos de datos.

No obstante, los directores de informática han tener cuidado de no delegar demasiadas responsabilidades de gobernanza de datos ni limitarse a observar desde fuera las mejoras operativas de los datos. De ahí que se estén replanteando sus estrategias de transformación digital y buscado cómo obtener valor empresarial de las inversiones en IA; lo que pasa por prestar más atención a los riesgos de los datos que pueden socavar estos objetivos. Una opción es preguntar a los directores de TI sobre las prácticas de gestión de datos para detectar dónde se necesita más atención por parte de la dirección.

En una anterior ocasión he escrito acerca de los riesgos de TI y las oportunidades perdidas de la IA genérica que deben preocupar a los CIO. A continuación, presentamos seis riesgos relacionados con los datos que los CIO deben revisar y asegurarse de que sus equipos cuentan con estrategias de corrección para, en el mejor de los casos, transformar los peligros en oportunidades estratégicas.

Datos mal clasificados y propietarios de datos desvinculados

¿Por qué no pregunta a cualquier responsable de gobernanza de datos cuáles son sus principales dificultades para mejorar la calidad de los datos y cumplir con la normativa? En algún lugar de la lista estará la identificación y la participación de los propietarios de los datos en el establecimiento y cumplimiento de las políticas de datos. Sin propietarios comprometidos, los datos pueden quedar sin clasificar y ser pasto de la IA, lo que podría infringir las normas de privacidad de los datos y otras regulaciones.

En la era de la IA, los datos sin clasificar plantean un segundo reto: ¿deben los científicos de datos utilizarlos sin el cumplimiento necesario, o debe la gobernanza de datos impedir que cualquiera utilice estos datos?

“Las organizaciones deben clasificar su contenido para que los distintos componentes de la infraestructura de seguridad puedan tomar las medidas adecuadas”, afirma Niraj Tenany, director ejecutivo de Netwoven, quien añade: “La clasificación manual es laboriosa y la clasificación automática tiene un número significativo de falsos positivos, por lo que es fundamental encontrar el equilibrio adecuado para tener éxito”.

Los directores de informática que participan en iniciativas de gobernanza de datos suelen gozar de una mayor eficacia a la hora de persuadir a los jefes de departamento para que asignen propietarios de datos. Es demasiada la necesidad de capacidades de ciencia de datos ciudadana y mayor si cabe el deseo de obtener ventajas empresariales de la IA como para que los líderes se resistan a asumir la responsabilidad. Es más, una vez involucrados los propietarios de los datos, hay más oportunidades de comprometerlos en la gobernanza de la IA y de colaborar en la puesta a prueba de agentes de IA.

Propiedad intelectual expuesta a la IA

Muchos directores de informática muestran su preocupación en la sombra por la IA en la cuando los empleados utilizan modelos de lenguaje grandes (LLM) públicos y experimentan con otras herramientas de IA generativa sin aprobar. Es decir: compartir datos mal clasificados y exponer la propiedad intelectual con herramientas de IA son riesgos que los directores de informática deben temer.

Preocupaciones: que los empleados utilicen datos, código, directrices de marca, contratos y secciones de documentos confidenciales en sus indicaciones de IA; que los científicos de datos incluyan propiedad intelectual en modelos de IA, incluyendo la generación aumentada de recuperación (RAG) para LLM y datos para agentes de IA, sin las aprobaciones y salvaguardias necesarias.

Los datos son uno de los activos más valiosos que posee una empresa y deben protegerse como tales”, afirma Joe Locandro, director de informática global de Rimini Street. En su opinión, “los directores de informática deben estar atentos al mal uso de los datos por parte de los empleados, al uso indebido de las herramientas de IA y a la falta de higiene cibernética. Dar prioridad a la formación del personal, aplicar el enmascaramiento de datos en los sistemas centrales y realizar auditorías periódicas de seguridad de los datos son medidas esenciales para proteger la información confidencial”.

Por su parte, Srujan Akula, director ejecutivo de The Modern Data Company, es de la opinión de que “los equipos de marketing adoptan ChatGPT sin decírselo a nadie, los científicos de datos crean modelos con cualquier información que encuentran y, de repente, los datos confidenciales de los clientes pueden acabar alimentando herramientas de IA públicas. Todo un riesgo para los directores de informática, ya que pueden producirse fugas de datos y problemas de cumplimiento normativo que pueden abordarse mediante políticas claras y prácticas y alternativas internas seguras”.

Como fórmula para mitigar los riesgos, Akula aconseja a CIO crear productos de datos a partir de conjuntos de datos seleccionados y fiables, con una propiedad y una gobernanza claras.

Los directores de informática también pueden convertir este riesgo en una ventaja poniendo en marcha programas de alfabetización en materia de datos y promoviendo la innovación abierta, que facilita la presentación de ideas por parte de cualquier empleado. La combinación de estos programas fomenta el aprendizaje y la resolución de problemas, al tiempo que la organización obtiene visibilidad sobre más iniciativas de los empleados de primera línea.

Fuentes de datos de terceros

Se prevé que las empresas estadounidenses gasten 26.100 millones de dólares en datos de marketing en 2025. Estos datos se utilizan normalmente para segmentar a los clientes, personalizar las campañas y mejorar la atribución. Por difícil que parezca garantizar que las prácticas internas en materia de datos cumplan los requisitos reglamentarios y las políticas de gobernanza de datos, el reto consiste en el seguir el cumplimiento de las fuentes de datos de terceros.

“Uno de los riesgos más ignorados es confiar en fuentes de datos o servicios de enriquecimiento de terceros sin verificar cómo obtienen sus datos”, afirma Luis Lacambra, director de producto de SOAX. A su juicio, “si esos datos se extraen o proceden de fuentes públicas utilizando métodos poco fiables o que no cumplen con la normativa, su empresa podría enfrentarse a un escrutinio regulatorio o a puntos ciegos operativos”.

La revisión del cumplimiento de los datos de terceros debe ser una política de gobernanza de datos innegociable no comunicada y gestionada por el CDO. Los CIO pueden añadir un enfoque alternativo con el propósito de abordar los riesgos de los datos de terceros. Las empresas adquieren e integran muchas fuentes que no se utilizan, proporcionan información duplicada con otras fuentes de datos o aportan un valor empresarial marginal. Los CIO que buscan oportunidades de reducción de costes han de realizar una auditoría de coste-beneficio de las fuentes de datos de terceros, revisar su uso y cuantificar los riesgos. La oportunidad consiste en reducir los costes eliminando las fuentes de bajo valor y alto riesgo.

Escasa observabilidad del flujo de datos

La mayoría de las organizaciones invertirán en herramientas de análisis para el usuario final, tales como plataformas de análisis de datos y herramientas de procesamiento de documentos, antes de invertir en integraciones y flujos de datos robustos. Cuanto más dependan los departamentos de los datos en tiempo real para la toma de decisiones, la fiabilidad y el rendimiento de los flujos de datos pueden convertirse en una pesadilla operativa, sobre todo cuando a los administradores de datos les corresponde solucionar problemas de datos de forma rutinaria o si los datos atrasados dan lugar a decisiones erróneas.

“Los directores de informática deben ser muy conscientes de los riesgos relacionados con los datos que amenazan la integridad, la seguridad y la eficacia de la toma de decisiones de la organización”, afirma Josh Mason, director de tecnología de RecordPoint. Y añade: “Un área crítica es la visibilidad limitada de los flujos de datos y los patrones de uso, donde una observabilidad insuficiente puede ocultar problemas subyacentes tales como la latencia, la deriva de los datos, los fallos en los flujos y la presencia y ubicación de datos confidenciales”.

La observabilidad en las operaciones de datos incluye la supervisión de los flujos de datos, la automatización de las respuestas y el seguimiento del rendimiento. Las métricas de DataOps incluyen la fiabilidad de los flujos, las tasas de automatización, las tasas de excepciones y el rendimiento del procesamiento.

Reducir los incidentes de DataOps puede suponer un ahorro de costes para los directores de informática que integran muchas fuentes de datos y utilizan estructuras de datos para centralizar el acceso. Por eso es importante tener en cuenta un factor como las integraciones de datos poco fiables, pues erosionan la confianza, lo que puede frenar a los responsables de los departamentos a la hora de invertir en más prácticas basadas en la inteligencia artificial y los datos.

Brechas en la calidad de los datos

Los CIO llevan mucho tiempo luchando por mejorar la calidad de los datos mediante la asignación de administradores de datos, la automatización de los procedimientos de limpieza de datos y la medición de la salud de los datos. Sin embargo, la mayor parte de este trabajo se ha canalizado hacia fuentes de datos estructuradas en ERP, CRM y almacenes de datos. La IA ha ampliado el alcance de este trabajo, ya que los RAG y los agentes de IA aprovechan las fuentes de datos no estructuradas y los repositorios de documentos para entrenar modelos y proporcionar respuestas cuyo contexto sea relevante.

“El RAG proporciona a las empresas acceso al conocimiento de la organización, pero no está exento de riesgos, como vulnerabilidades en la privacidad de los datos, alucinaciones y retos de integración”, explica Chris Mahl, director ejecutivo de Pryon. “La implementación requiere invertir en la calidad de los datos, establecer marcos de gobernanza y crear sistemas de evaluación antes de ampliar la escala. Las empresas que obtienen un valor real del RAG no sólo acceden a la información de una manera más rápida, sino que toman mejores decisiones al encontrar el equilibrio adecuado entre la innovación y las medidas de seguridad”.

Para abordar las deficiencias en la calidad de los datos, los directores de informática deben considerar la posibilidad de centralizar los datos brutos en lagos de datos, proporcionar la limpieza de datos como un servicio compartido y permitir el acceso a través de estructuras de datos y plataformas de datos de clientes. Dado que existen muchas herramientas de gestión y calidad de los datos, una forma eficaz de abordar la mayor necesidad empresarial de fuentes de datos de IA limpias y el mayor alcance de la limpieza de fuentes de datos no estructurados es el desarrollo de un servicio compartido centrado en la calidad de los datos.

Índice excesivo de resultados de IA sin un control de calidad riguroso

Las siete preguntas para definir la gobernanza de la IA incluyen cuestiones sobre el valor empresarial, la selección de herramientas, el cumplimiento normativo y la gobernanza de los datos. Pero la más importante también constituye un reto en la actualidad: ¿cómo deben los empleados validar y cuestionar la respuesta de un LLM o las recomendaciones de un agente de IA? Esta pregunta es más importante si cabe para los CIO que pretenden desarrollar agentes de IA, ya que las prácticas de control de calidad para probar los LLM están empezando a asomar y a menudo se basan en pruebas manuales.

“Los CIO deben supervisar continuamente la precisión y la fiabilidad de los resultados generados por la IA”, afirma Trisha Price, directora de producto de Pendo. Bajo su punto de vista, “los sistemas de IA no son deterministas, por lo que definir la calidad se vuelve más complejo y los límites entre la ingeniería, el control de calidad y el producto comienzan a difuminarse. Este cambio exige una colaboración más estrecha entre los equipos para garantizar que las experiencias impulsadas por la IA sean fiables, se ajusten a las necesidades de los usuarios y sean capaces de generar resultados empresariales reales”.

Los directores de informática siempre han tenido dificultades para justificar las inversiones en control de calidad, ya que es más fácil vender a la empresa la idea de contratar más desarrolladores o aumentar la resiliencia operativa y de seguridad. Sin embargo, a medida que más desarrolladores de software utilizan generadores de código de IA y se automatizan las operaciones de TI se automatizan, pueden encontrar una mayor necesidad y oportunidad presupuestaria para invertir en capacidades de control de calidad y pruebas de IA.

Es a la vez saludable e importante que los CIO expongan sus recelos sobre los posibles riesgos, especialmente en lo que se refiere a la propiedad intelectual y las capacidades emergentes de la IA. Y es que, los mejores directores de TI hacen algo más que desarrollar planes de mitigación y buscar opciones para convertir los riesgos en oportunidades estratégicas.