Connect with us

Inteligencia Artificial

Cómo aprovechar al máximo MLOps

José Luis Becerra Pozas

Published

on

cso-ia-machine-learning

Las empresas que buscan aprovechar todos los beneficios comerciales de la Inteligencia Artificial están recurriendo a Machine Learning Operations (MLOps), un conjunto emergente de mejores prácticas y herramientas destinadas a poner en funcionamiento la IA.

Cuando las empresas comienzan a implementar Inteligencia Artificial (IA) y a construir proyectos de aprendizaje automático, el enfoque tiende a estar en la teoría. ¿Existe algún modelo que pueda proporcionar los resultados necesarios? ¿Cómo se puede construir? ¿Cómo se puede entrenar?

Pero las herramientas que usan los científicos de datos para crear estas pruebas de concepto a menudo no se traducen bien en los sistemas de producción. Como resultado, puede tomar más de nueve meses en promedio implementar una solución de IA o ML, según datos de IDC.

“A esto lo llamamos ‘velocidad del modelo’, cuánto tiempo lleva de principio a fin”, explica el analista de IDC Sriram Subramanian.

Aquí es donde entra en juego MLOps (Machine Learning Operations), un conjunto de mejores prácticas, marcos y herramientas que ayudan a las empresas a administrar datos, modelos, implementación, monitoreo y otros aspectos de tomar un sistema de IA de prueba de concepto teórico. y ponerlo a trabajar.

“MLOps reduce la velocidad del modelo a semanas, a veces a días”, afirma Subramanian. “Al igual que el tiempo promedio para crear una aplicación se acelera con DevOps, esta es la razón por la que necesita MLOps”.

Al adoptar MLOps, las empresas pueden construir más modelos, innovar más rápido y abordar más casos de uso. “La propuesta de valor es clara”, agrega.

IDC predice que para 2024, el 60 % de las empresas habrán operacionalizado sus flujos de trabajo de ML mediante el uso de MLOps. Y cuando se encuestó a las empresas sobre los desafíos de la adopción de IA y ML, la falta de MLOps fue un obstáculo importante para la adopción de IA y ML, solo superado por el costo, dice Subramanian.

Aquí examinamos qué es MLOP, cómo ha evolucionado y qué deben lograr y tener en cuenta las organizaciones para aprovechar al máximo esta metodología emergente para hacer operativa la IA.

La evolución de MLOps

Cuando Eugenio Zuccarelli comenzó a crear proyectos de aprendizaje automático hace varios años, MLOps era solo un conjunto de mejores prácticas. Desde entonces, Zuccarelli ha trabajado en proyectos de IA en varias empresas, incluidas las de atención médica y servicios financieros, y ha visto cómo los MLOps evolucionan con el tiempo para incluir herramientas y plataformas.

Hoy en día, MLOps ofrece un marco bastante sólido para hacer operativa la IA, dice Zuccarelli, quien ahora es científico de datos de innovación en CVS Health. A modo de ejemplo, Zuccarelli señala un proyecto en el que trabajó anteriormente para crear una aplicación que predijera resultados adversos, como la readmisión al hospital o la progresión de la enfermedad.

“Estábamos explorando conjuntos de datos y modelos y hablando con médicos para descubrir las características de los mejores modelos”, señala. “Pero para que estos modelos fueran realmente útiles, necesitábamos ponerlos frente a los usuarios reales”.

Eso significaba crear una aplicación móvil que fuera confiable, rápida y estable, con un sistema de aprendizaje automático en el back-end conectado a través de una API. “Sin MLOps no hubiéramos podido asegurar eso”, dice.

Su equipo usó la plataforma H2O MLOps y otras herramientas para crear un tablero de salud para el modelo. “No quieres que el modelo cambie sustancialmente”, señala. “Y no quieres introducir prejuicios. El panel de salud nos permite saber si el sistema ha cambiado”.

El uso de una plataforma MLOps también permitió actualizaciones en los sistemas de producción. “Es muy difícil intercambiar un archivo sin que la aplicación deje de funcionar”, advierte Zuccarelli. “Las herramientas de MLOps pueden intercambiar un sistema aunque esté en producción con una interrupción mínima del sistema en sí”.

A medida que maduran las plataformas MLOps, aceleran todo el proceso de desarrollo del modelo porque las empresas no tienen que reinventar la rueda con cada proyecto, dice. Y la funcionalidad de gestión de canalización de datos también es fundamental para hacer operativa la IA.

“Si tenemos múltiples fuentes de datos que necesitan comunicarse entre sí, ahí es donde pueden entrar los MLOps”, agrega. “Desea que todos los datos que fluyen hacia los modelos ML sean consistentes y de alta calidad. Como dicen, basura adentro, basura afuera. Si el modelo tiene información deficiente, entonces la predicción en sí misma será deficiente”.

Fundamentos de MLOps: un objetivo en movimiento

Pero no crea que sólo porque las plataformas y las herramientas están disponibles puede ignorar los principios básicos de MLOps. Las empresas que recién comienzan a pasar a esta disciplina deben tener en cuenta que, en esencia, MLOps se trata de crear conexiones sólidas entre la ciencia de datos y la ingeniería de datos.

“Para garantizar el éxito de un proyecto MLOps, necesita ingenieros de datos y científicos de datos en el mismo equipo”, dice Zuccarelli.

Además, las herramientas necesarias para protegerse contra el sesgo, garantizar la transparencia, brindar explicabilidad y respaldar las plataformas de ética, aún se están construyendo, dice. “Definitivamente todavía necesita mucho trabajo porque es un campo muy nuevo”.

Por lo tanto, sin una solución llave en mano completa para adoptar, las empresas deben estar versadas en todas las facetas que hacen que MLOps sea tan efectivo para poner en funcionamiento la IA. Y esto significa desarrollar experiencia en una amplia gama de actividades, dice Meagan Gentry, gerente de práctica nacional para el equipo de IA en Insight, una empresa de consultoría tecnológica con sede en Tempe.

MLOps cubre toda la gama, desde la recopilación, la verificación y el análisis de datos, hasta la gestión de los recursos de la máquina y el seguimiento del rendimiento del modelo. Y las herramientas disponibles para ayudar a las empresas se pueden implementar en las instalaciones, en la nube o en el perímetro. Pueden ser de código abierto o propietarios.

Pero dominar los aspectos técnicos es sólo una parte de la ecuación. MLOps también toma prestada una metodología ágil de DevOps y el principio de desarrollo iterativo, dice Gentry. Además, como ocurre con cualquier disciplina relacionada con la metodología ágil, la comunicación es crucial.

“La comunicación en todos los roles es fundamental”, dice ella. “Comunicación entre el científico de datos y el ingeniero de datos. Comunicación con DevOps y con el equipo de TI más grande”.

Para las empresas que recién comienzan, MLOps puede ser confuso. Hay principios generales, docenas de proveedores e incluso más conjuntos de herramientas de código abierto.

“Aquí es donde entran las trampas”, dice Helen Ristov, gerente sénior de arquitectura empresarial de Capgemini Americas. “Mucho de esto está en desarrollo. No hay un conjunto formal de pautas como las que vería con DevOps. Es una tecnología incipiente y se necesita tiempo para que las pautas y las políticas se pongan al día”.

Ristov recomienda que las empresas comiencen sus viajes de MLOps con sus plataformas de datos. “Tal vez tengan conjuntos de datos pero viven en diferentes lugares, pero no tienen un entorno cohesivo”, afirma.

Las empresas no necesitan mover todos los datos a una sola plataforma, pero sí es necesario que haya una manera de traer datos de fuentes de datos dispares, dice, y esto puede variar según la aplicación. Los lagos de datos funcionan bien para las empresas que realizan muchos análisis a altas frecuencias y buscan almacenamiento de bajo costo, por ejemplo.

Las plataformas MLOps generalmente vienen con herramientas para construir y administrar canalizaciones de datos y realizar un seguimiento de las diferentes versiones de los datos de entrenamiento, pero no se trata de presionar y listo, señala.

Luego está la creación de modelos, el control de versiones, el registro, la ponderación de los conjuntos de características y otros aspectos de la gestión de los propios modelos.

“Hay una cantidad sustancial de codificación involucrada en esto”, dice Ristov, y agrega que configurar una plataforma MLOps puede llevar meses y que los proveedores de plataformas aún tienen mucho trabajo por hacer en lo que respecta a la integración.

“Hay mucho desarrollo que va en diferentes direcciones”, añade. “Se están desarrollando muchas herramientas, y el ecosistema es muy grande y las personas simplemente eligen lo que necesitan. MLOps está en una etapa adolescente. La mayoría de las organizaciones aún están buscando configuraciones óptimas”.

Dar sentido al panorama de MLOps

Se espera que el mercado de MLOps crezca a alrededor de 700 millones de dólares para 2025, frente a los 185 millones de dólare en 2020, afirma Subramanian de IDC. Pero ese es probablemente un recuento insuficiente, dice, porque los productos MLOps a menudo se agrupan con plataformas más grandes. El verdadero tamaño del mercado, dice, podría ser de más de 2 mil millones de dólares para 2025.

Los proveedores de MLOps tienden a clasificarse en tres categorías, comenzando con los grandes proveedores de la nube, incluidos AWS, Azure y la nube de Google, que brindan capacidades de MLOps como servicio, dice Subramanian.

Luego están los proveedores de plataformas ML como DataRobot, Dataiku e Iguazio.

“La tercera categoría es lo que solían llamar proveedores de gestión de datos”, dice. “Los gustos de Cloudera, SAS y DataBricks. Su punto fuerte eran las capacidades de gestión de datos y las operaciones de datos, y se expandieron a capacidades de ML y, finalmente, a capacidades de MLOps”.

Las tres áreas están explotando, dice Subramanian, y agrega que lo que hace que un proveedor de MLOps se destaque es si puede admitir modelos de implementación locales y en la nube, si puede implementar una IA confiable y responsable, si es plug-and-play. y con qué facilidad pueden escalar. “Ahí es donde entra la diferenciación”.

Según una encuesta reciente de IDC, la falta de métodos para implementar IA responsable fue uno de los tres obstáculos principales para la adopción de IA y ML, empatado en segundo lugar con la falta de MLOps en sí.

Esto se debe en gran parte a que no hay alternativas para adoptar MLOps, resalta Sumit Agarwal, analista de investigación de inteligencia artificial y aprendizaje automático de Gartner.

“Los otros enfoques son manuales”, dice. “Entonces, realmente, no hay otra opción. Si desea escalar, necesita automatización. Necesita trazabilidad de su código, datos y modelos”.

Según una encuesta reciente de Gartner, el tiempo promedio que lleva llevar un modelo desde la prueba de concepto hasta la producción se redujo de nueve a 7.3 meses. “Pero 7.3 meses sigue siendo alto”, afirma Agarwal. “Hay muchas oportunidades para que las organizaciones aprovechen MLOps”.

Hacer el cambio cultural a MLOps

MLOps también requiere un cambio cultural por parte del equipo de inteligencia artificial de una empresa, argumenta Amaresh Tripathy, líder global de análisis en Genpact.

“La imagen popular de un científico de datos es la de un científico loco que intenta encontrar una aguja en un pajar”, ​​dice. “El científico de datos es un descubridor y un explorador, no una fábrica que produce widgets. Pero eso es lo que necesitas hacer para escalarlo realmente”.

Y las empresas a menudo subestiman la cantidad de esfuerzo que requerirá.

“La gente aprecia mejor la ingeniería de software”, señala. “Hay mucha disciplina sobre la experiencia del usuario, los requisitos. Pero de alguna manera la gente no piensa que si implemento un modelo tengo que pasar por el mismo proceso. Luego está el error de suponer que todos los científicos de datos que son buenos en un entorno de prueba irán naturalmente y podrán implementarlo, o pueden incluir a un par de colegas de TI y poder hacerlo. Hay una falta de aprecio por lo que se necesita”.

Las empresas tampoco entienden que los MLOps pueden causar efectos dominó en otras partes de la empresa, lo que a menudo conduce a cambios drásticos.

“Puede poner MLOps en un centro de llamadas y el tiempo de respuesta promedio en realidad aumentará porque la máquina, la IA, se encarga de las cosas fáciles, y las cosas que llegan al ser humano en realidad toman más tiempo porque son más complejas. Entonces, debe repensar cuál será el trabajo, qué personas necesita y cuáles deberían ser los conjuntos de habilidades”.

Hoy, dice, menos del 5% de las decisiones en una organización están impulsadas por algoritmos, pero eso está cambiando rápidamente. “Anticipamos que del 20 al 25 % de las decisiones serán impulsadas por algoritmos en los próximos cinco años. Cada estadística que miramos, estamos en un punto de inflexión de rápida ampliación para la IA”.

Y MLOps es la pieza fundamental.

“Cien por ciento”, asevera. “Sin eso, no podrá hacer IA de manera consistente. MLOps es el catalizador de escalamiento de la IA en la empresa”.

Maria Korolov, CIO.com

Advertisement
Advertisement

VIDEOS

Resources

Recientes

Advertisement