miércoles, 26 de marzo de 2025
2.9 IBM Evolución de la IA: IA tradicional frente a IA generativa
La IA generativa está de moda. Pero una pregunta que me hacen con bastante frecuencia es: ¿en qué se diferencia la IA generativa de la IA que hacíamos hace 5 , 10, 20, quizás incluso 30 años? Para entenderlo, echemos un vistazo a la IA tal como existía antes, la IA generativa. Por lo general, la forma en que funcionaba era que comenzabas con un repositorio,
Reproduce el video desde ::36 y sigue la transcripción0:36
y un repositorio es exactamente lo que parece. Es justo donde guardas toda tu información. Pueden ser, ya sabes, datos y tablas, filas y columnas , pueden ser imágenes, pueden ser documentos. Realmente podría ser cualquier cosa. Es como una organización, donde guardas toda tu información histórica o cosas. La segunda parte es lo que llamamos una plataforma de análisis.
Reproduce el video desde :1:9 y sigue la transcripción1:09
En el mundo de IBM, un ejemplo de plataforma de análisis es SPSS Modeler o Watson Studio. Luego, el tercer componente es la capa de aplicación.
Reproduce el video desde :1:29 y sigue la transcripción1:29
Digamos que eres una empresa de telecomunicaciones. Tienes toda la información sobre los clientes en el repositorio. Supongamos que quieres saber qué clientes tienen probabilidades de abandonar o cancelar su servicio, por lo que cogerías esa información del repositorio y la trasladarías a una plataforma de análisis. Dentro de la plataforma de análisis, crearía sus modelos. En este caso, es poco probable que quién abandone o cancele su servicio. Luego, una vez que haya construido esos modelos, los colocará en alguna aplicación. La aplicación es donde intentas evitar que esas personas cancelen. Por ejemplo, si es probable que alguien cancele, tal vez te pongas en contacto con él e intentes convencerlo de que no lo haga o darle algún beneficio para que se quede como cliente. Pero esto en sí mismo, no lo llamaría IA. Se trata más de un análisis predictivo o de un modelo predictivo. Para crear esta IA, debes proporcionar un circuito de retroalimentación.
Reproduce el video desde :2:33 y sigue la transcripción2:33
Un circuito de retroalimentación le permite automatizar el proceso. Por ejemplo, si eres una empresa de telecomunicaciones y tienes la información de tus clientes, puedes averiguar quién va a cancelar. Actúas a través de una aplicación para intentar evitar que se cancelen. Pero tus modelos aquí a veces tienen razón, a veces se equivocan. Lo que el ciclo de retroalimentación te permite hacer es aprender de esa experiencia. Si hay situaciones en las que predijiste que alguien cancelaría y no lo hizo, tal vez puedas profundizar y mejorar tus modelos para no cometer el mismo error por segunda vez. Piénsalo así. Si me engañas una vez, qué vergüenza. Engáñame dos veces, qué vergüenza. Eso es lo que quieres que haga tu IA. Quieres que tu IA aprenda de sus errores anteriores y también de sus éxitos anteriores, y un ciclo de retroalimentación te permite hacerlo. Así es como siempre ha existido. Llevo en este negocio más de 30 años y esto es anterior a mí. Sin embargo, con la IA generativa, todo este paradigma ha cambiado. Toda la arquitectura fundamental y la forma en que hacemos las cosas son diferentes ahora. Con la IA generativa, comienzas con datos, no con datos de tu organización, no con un repositorio dentro de las paredes de tu empresa, sino con datos de la tierra. Quizá no la tierra. Pero empiezas con esta enorme cantidad de información. Información sobre todo. Luego, los grandes modelos lingüísticos utilizan esa información.
Reproduce el video desde :4:9 y sigue la transcripción4:09
Pero estos grandes modelos lingüísticos son muy poderosos. Son muy grandes y extraordinarios, sinceramente. Pero muchas veces no tienen los detalles que necesitas para guiarte en tu negocio. Por ejemplo, un modelo lingüístico amplio podría saber, en general, por qué las personas
Reproduce el video desde :4:31 y sigue la transcripción4:31
cancelan un servicio en particular si eres una empresa de telecomunicaciones, pero no tendría los matices ni la idiosincrasia de por qué tus clientes específicos cancelan. Es entonces cuando usas lo que se llama solicitar y afinar.
Reproduce el video desde :4:48 y sigue la transcripción4:48
La capa de solicitud y ajuste es donde se toman los modelos de lenguaje grandes, que son modelos muy generales, y se hacen específicos para su caso de uso. Volviendo a nuestra empresa de telecomunicaciones, que trata de hacer frente a la pérdida de clientes, tendrían este modelo que se basa no solo en la pérdida de clientes o en sus clientes, sino que se basa en cantidades masivas de información que lo contienen todo. Los LLM se derivan de esa enorme cantidad de información. A continuación, utiliza esta capa de solicitud y ajuste para tratar de ajustar esos modelos para que sean específicos de su organización. Luego, la parte final es que tienes una capa de aplicación como la que tienes con la IA tradicional.
La aplicación, una vez más, es el lugar al que se lleva la IA para que se consuma y cumpla su propósito específico. Además, al igual que con la IA tradicional, también tienes un circuito de retroalimentación. Sin embargo, el ciclo de retroalimentación normalmente se reduce a la parte de solicitar y ajustar, ya que normalmente se producen fuera de la organización. Ahí lo tienes. Es por eso que los modelos de lenguaje grande son generativos. La IA es diferente porque la arquitectura fundamental es diferente y, principalmente, tiene que ver con el tamaño y la cantidad, tanto de los datos que ingresan como de los modelos que se están creando. Estos modelos en estos datos son demasiado grandes para que cualquier organización los guarde en el repositorio. Por eso necesitamos una arquitectura fundamentalmente diferente. Muchas gracias por tu tiempo. Espero que esto haya sido útil.
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario