Arreglad vuestros Datos y ganaréis con la Inteligencia Artificial.
El 80% de las empresas que implementan Inteligencia Artificial tienen un desorden monumental con sus datos. Y con malos datos, mala IA.
Hace unos años, uno de los coches autónomos de Uber atropelló y mató a un peatón que cruzaba una calle fuera de un paso de peatones. ¿Qué falló? Cuando los técnicos entrenaron al coche para reconocer peatones, utilizaron sobre todo imágenes que contenían un paso de peatones. Sin darse cuenta, habían ‘enseñado’ al sistema de IA que el paso de peatones era la parte importante.
Aunque la mayoría de las empresas que aplican la IA en sus operaciones no se ocupan de algo tan importante como la vida humana, hay una lección importante aquí: Si damos a los sistemas de IA datos erróneos, obtendremos malos resultados. La IA se convertirá sin duda en el próximo gran diferenciador empresarial, pero sólo para las empresas que puedan tener sus datos bajo control.
Malos datos, mala IA.
La IA responsable está de moda porque muchas empresas tienen un grave problema con sus datos: no saben qué datos tienen. Son incoherentes e inseguros. E introducir datos desconocidos y no gestionados en un sistema de IA es sólo pedir que se produzca una violación de datos, una infracción de la legislación vigente, decisiones estratégicas mal informadas, sesgos no intencionados o daños reputacionales.
El problema es que muchas empresas tienen un lío de datos entre manos. O bien tienen una estrategia desordenada o no tienen estrategia alguna para la gobernanza de datos, las normas y procesos para recopilar, utilizar y almacenar datos.
Las empresas no se paran a pensar en su estrategia de datos, sino que persiguen proyectos ‘pintones’ que generen ingresos. Sin embargo, cuando las empresas quieren reunir esos datos, por ejemplo, para una herramienta de IA, no pueden hacerlo porque no existen normas generales sobre cómo manejar los datos. Se quedan con un gran lío que requiere una gran cantidad de tiempo e inversión para desenredarlo.
En otras palabras, la gobernanza de datos puede no parecer emocionante o llamativa, pero constituye la base del éxito de cualquier proyecto de IA. Una obviedad que parece no serlo.
Un enfoque pragmático para arreglar los datos
Aplicar retroactivamente la gobernanza de datos a toda la información de una organización es una empresa colosal. Pero tranquilos, afortunadamente, no es necesario ir tan lejos para embarcarse en vuestro próximo proyecto de IA.
Aquí tenéis un enfoque pragmático y puntual para arreglar vuestros datos, aprovechar el poder de la IA y crear valor de forma incremental por el camino:
· Elegid un caso de uso: empezad por elegir un único caso de uso. ¿Cuál es el principal mandato empresarial en el que la IA os puede ayudar? ¿Sabéis dónde tenéis datos propios o de terceros que se pueden aprovechar? En este caso, seguid el ejemplo de Ricitos de Oro y elegid un caso de uso que no sea ni demasiado grande ni demasiado pequeño, idealmente algo interno. Vuestro primer caso de uso también debe tener requisitos de dominio de datos limitados, es decir, un caso de uso que sólo requiera datos de una fuente.
A continuación, averiguad el estado de los datos con los que vais a trabajar. ¿Qué hay que corregir antes de introducir los datos en un sistema de IA?
· Fijad los datos necesarios para ese caso de uso: una vez que tengáis un caso de uso factible y hayáis evaluado el estado de los datos necesarios para avanzar, es hora de realizar un trabajo de limpieza. No es necesario que los datos sean perfectos, pero sí que comprendáis sus defectos antes de aprovecharlos.
Tendréis que poner en marcha tanta gobernanza y estrategia como sean necesarias para ese único caso de uso. Entre los componentes no negociables de la gobernanza de datos se incluyen:
La adquisición de datos, ¿cómo vais a obtener los datos del sistema de origen y dónde vais a almacenarlos?
La calidad de los datos, ¿en qué medida son completos y precisos? ¿Conllevan los datos riesgo de sesgo de IA? ¿Necesitáis limpiarlos antes de introducirlos en el sistema?
Privacidad de los datos. ¿incluyen información privada o protegida, como información sanitaria? ¿Reunirá el sistema de IA los datos de forma que cause problemas de privacidad?
Por ejemplo, si la IA añade información a los registros genéricos de los clientes que hace identificables a los individuos de forma protegida, eso se llama clasificación por compilación y hay que protegerse contra ella.
Todos estos elementos juntos conforman la gobernanza de datos, un plan sobre cómo se van a obtener los datos, cómo se pueden utilizar y los controles y políticas adecuados para evitar su uso indebido.
Cread una estrategia de datos global. Al mismo tiempo que exploráis vuestro caso de uso, elaborad un marco y una estrategia de datos globales. Esto os dará información sobre cómo recopilar, mantener y proteger los datos en toda la organización de cara al futuro.
Una vez completado el primer caso de uso, escoged otra área en la que centrarse. Aprovechad los éxitos y las lecciones aprendidas en el primer caso. ¿Cómo despejar la fecha para vuestro próximo proyecto? ¿Cómo debéis ajustar su estrategia de datos? Seguid repitiendo, limpiando vuestros datos durante el proceso.
El mantra de este enfoque es pensar a lo grande pero empezar poco a poco. Al ir un caso de uso a la vez que se ponen en orden los datos de la organización, se creará valor con la IA de forma incremental al tiempo que se construye una base sólida de gobernanza de datos para impulsar cualquier iniciativa futura de IA.
Venga, ¡manos a la obra!
Y continuamos con la ‘nueva sección’ que iniciamos en el anterior artículo: las recomendaciones:
¿Un libro?
El acto de crear: una manera de ser, de Rick Rubin. Un gran libro de Rick Rubin, productor musical que luce una gloriosa barba, imagino que fruto de estar más de cuatro años dedicados a escribir este libro sobre el proceso creativo.
Hay pocos detalles biográficos. Más bien, Rubin destila la sabiduría de décadas de trabajo con los mejores artistas de todos los géneros (Run DMC, Beastie Boys, Trent Reznor, Adele, Eminem, Jay-Z, Johnny Cash, etc.).
El libro trata de encontrar, cultivar y dar vida a las ideas. Rubin ofrece ideas intencionadamente generalizadas, para que el lector pueda interpretarlas y aplicarlas a sus propias circunstancias.
Una lección que nos deja el libro es que no se puede crear algo basándose en lo que uno cree que quiere el público. Es una locura creer que puedes adivinar lo que les gusta a millones de personas. Sólo puedes saber con seguridad lo que te gusta a ti... así que hazlo.
¿Un documental?
The Beatles: Get Back:
Rick Rubin dijo en una ocasión que ‘Los Beatles son la prueba de la existencia de Dios’. ¿Por qué? Pues porque tuvieron que ocurrir tantos golpes de suerte y cosas improbables una tras otra para que Los Beatles fueran Los Beatles.
A este respecto, por fin he visto el documental Get Back de Peter Jackson sobre la legendaria banda británica. Es realmente bueno.
Estrenado el Día de Acción de Gracias de 2021, el director de ‘El Señor de los Anillos’ redujo 160 horas de audio y 50 horas de vídeo en una miniserie de 3 capítulos, enfocados en el momento de grabar el álbum ‘Let It Be’: The Beatles están en la cima absoluta de su poder y fama. Sin embargo, John, Paul, Ringo, George siguen sus propios caminos y la ruptura parece inevitable. Pero se reúnen para volver a tocar este disco, más o menos un mes.
Lo mejor del documental es se ve la parte humana de los músicos. Ninguno de ellos tiene aún 30 años. Se toman en serio el proceso artístico y trabajan todos los días de 9 a 5. También hacen mucho el idiota. Luego improvisan y recuerdan sus días anteriores a la fama tocando en bares de mala muerte en Hamburgo... Y luego siguen tonteando. Trabajan en una canción por enésima vez y crean otro éxito clásico.
Queda patente que son unos genios, sobre todo Paul y John. Sobre ello os recomiento, ya que estamos este artículo de Ian Leslie: ‘The banality of genius’.
¿Un podcast?
En pleno ruido de la película Napoleón, pasó por delante de mi un podcast con seis capítulos fantásticos sobre Napoleón. Era Real Dictators. Una pasada.
Se trata de una producción británica de gran calidad, que incluye entrevistas con destacados historiadores y está narrada por el actor de Dr. Who, Paul McGann.
Desde que lo descubrí, he escuchado la mayoría de ellos. Fantásticos todos.
Los conflictos que estamos viendo en Europa y Oriente Próximo, combinados con las crecientes tensiones entre las dos superpotencias mundiales, están devolviendo al mundo a la Historia de la ‘H mayúscula’.
Las lecciones de Real Dictators son más importantes que nunca, y ayudan a entender ciertas decisiones que se están tomando en lugares que presumen de ser democracias.
’If I had a choice of having my scoring record remain intact for another hundreds years or spend one afternoon with my grandchildren, I’d be on the floor in seconds stacking Legos and eating Uncrustables’. Kareem Abdul-Jabbar.
A veces, ni con buenos datos. Yo lo probé con PDFs.