Modelos de Inteligencia Artificial Generativa

Durante los últimos meses, todo lo relacionado a la Inteligencia Artificial (IA) ha estado en auge en el mundo de la tecnología. Más específicamente, la IA Generativa ha pasado a ocupar un lugar destacado como la “mayor novedad” entre las innovaciones basadas en datos. 

¿Qué es la Inteligencia Artificial Generativa? Es una tecnología que utiliza el aprendizaje automático, o Machine Learning (ML), y la inteligencia artificial para permitir que un software cree nuevas imágenes, bloques de texto, video y audio o para que produzca nuevas ideas y planes. La IA Generativa puede identificar patrones en los datos de entrada (inputs) y usarlos para generar respuestas (outputs) similares según lo solicitado. Estos resultados no son una copia, sino objetos nuevos y únicos. 

La IA Generativa abarca una gran cantidad de casos de uso en investigación, negocios o incluso para instituciones gubernamentales. Por esta razón, está siendo adoptada por organizaciones de todos los tamaños y áreas alrededor del mundo. La producción de grandes cantidades de datos útiles en períodos cortos también ayuda a entrenar nuevos modelos de ML. Se podría decir que la IA Generativa está aprovechando su poder para convertirse en una tecnología aún más relevante para el futuro.

No es lo mismo que los Modelos Analíticos

Gracias a su enorme capacidad de procesamiento, las máquinas son mejores que nosotros en el análisis de conjuntos de datos. Inicialmente, la inteligencia artificial se utilizaba exclusivamente para encontrar patrones en los datos para tareas como detección de spam o predicciones, entre otros análisis y trabajos cognitivos. 

Por ejemplo, cuando se hace una búsqueda en Google Maps para definir cómo llegar de un punto a otro en una ciudad, la IA utiliza su poder analítico para mostrar las diferentes rutas que podrían usarse para llegar al destino. Esto lo hace utilizando información de tráfico en tiempo real para obtener la mejor ruta disponible.

Es un gran salto pasar de ejecutar este tipo de tareas a la creación de un poema similar a los escritos por tu poeta favorito, por ejemplo. Entonces, ¿cuál es la diferencia? Estos nuevos modelos de IA requieren una capacitación y un consumo de recursos varias veces mayor para realizar trabajos creativos. Por ello, se necesitaba desarrollar y mejorar la inteligencia artificial analítica antes de que la IA Generativa pudiera dar sus primeros pasos.

La IA Generativa se tomó un tiempo para evolucionar

Después de años de desarrollar modelos de IA “pequeños”, que podían clasificar información o comprender el lenguaje, la potencia de cómputo utilizada por estos modelos comenzó a crecer exponencialmente en la segunda mitad de la década de 2010. En ese momento, la capacidad de las Inteligencias Artificiales de procesar información también se expandió y los primeros modelos “generativos” aparecieron para casos como escribir un chiste o algunas líneas de código. 

El panorama de las aplicaciones de IA generativas. Fuente.

La posibilidad de obtener capacidad de procesamiento y escalabilidad más barato hicieron que la Inteligencia Artificial fuera mejor y más rápida de usar. El año pasado (2022), las cosas realmente comenzaron a mejorar para la IA Generativa y el futuro parece muy prometedor. Como se puede ver en la imagen arriba, la generación de texto, imágenes, videos y código por parte de Inteligencias Artificiales se está desarrollando y utilizando en este momento en múltiples áreas de investigación y corporativas. ¿Tal vez este texto también fue generado por una IA? 😉

¿Cuál es la previsión para el futuro?

Miles de millones de dólares se han invertido en la investigación y el desarrollo de soluciones de IA Generativa en los últimos años. Según Gartner, las aplicaciones de IA Generativa se apoderarán del mundo en breve. Algunas predicciones y casos de uso que se están desarrollando en este momento:

  • IA Generativa para diseñar medicamentos: esto debería reducir el costo de los procesos necesarios para producir un nuevo medicamento y también el tiempo que se tarda en hacerlo. Los expertos de Gartner esperan que el 30% de los medicamentos sean “descubiertos” utilizando técnicas de IA Generativa para 2025.
  • Diseño de nuevos materiales: enfocados en propiedades físicas específicas, se crearán nuevos materiales utilizando IA Generativa para ayudar y acelerar procesos en industrias como la aeroespacial, médica, militar, electrónica, energía y otras.
  • Diseño de piezas nuevas: estas mismas industrias podrían usar la IA para ayudar en el diseño de piezas nuevas que sean más eficientes o tengan un mejor desempeño.
  • Optimización de la colocación de componentes en el diseño de chips semiconductores: también se puede hacer aprovechando la potencia de la IA Generativa. Esto reduciría el tiempo del ciclo de vida del desarrollo de estos productos.
  • Creación de datos sintéticos: la IA Generativa puede crear datos en lugar de recopilarlos del mundo real. Por ejemplo, datos médicos que no exponen la identidad de los pacientes. Estos datos ayudarían a entrenar otros modelos de ML.
  • Contenido de marketing: se espera que los mensajes de marketing enviados a clientes comiencen a generarse sintéticamente. Se espera que el número aumente hasta un 30% para 2025, comparado con el 2% en 2022.
  • Películas de gran presupuesto utilizarán video generado por IA: una de las predicciones más audaces de Gartner. Se espera que, para 2030, al menos el 90% de la duración de una película pueda ser generada por IA. Esto requeriría mucho avance en esta área en los próximos años, pero ciertamente es una posibilidad real ahora.

ChatGPT y otros proyectos relevantes

ChatGPT

ChatGPT es un modelo de lenguaje de IA desarrollado por OpenAI. Es un chatbot en esencia, pero está alimentado por una cantidad enorme de datos y parámetros. Gracias a eso, puede responder preguntas más complejas, escribir historias, hacer revisiones de texto/código y más. Es usado en un contexto conversacional. 

No se puede negar que ChatGPT creó la fiebre por la IA. Grandes cantidades de dinero se han invertido en el desarrollo de esta IA después de su lanzamiento y éxito. Por lo tanto, incluso si acaba siendo reemplazado en el futuro por otras inteligencias artificiales que hagan el mismo tipo de tareas de una forma mejor, ChatGPT seguirá siendo recordado como uno de los pioneros de la industria.

Dall-E

OpenAI también está detrás de la creación de Dall-E y Dall-E 2. Estos dos son modelos de aprendizaje profundo (deep learning) utilizados para la creación de imágenes. La idea detrás de ellos es crear imágenes que reflejen con precisión una instrucción que se le dio en lenguaje natural. Dall-E creará una imagen original y realista combinando conceptos, atributos y estilos. Puede hacer ediciones realistas a imágenes existentes, agregando o eliminando elementos, o creando variaciones basadas en el original, dependiendo de lo que se le pida. De esta forma, se puede utilizar para crear una colección de imágenes únicas que son similares en su concepto. A continuación puedes ver una imagen original (izquierda) y una imagen creada por Dall-E 2 (derecha), como una ampliación de la original.

Una imagen original y una imagen expandida creada por DALL-E. Fuente.

LAMDA

LaMDA de Google es una familia de modelos de lenguaje neuronal conversacional. Google ha estado trabajando en estos modelos durante toda esta década y LaMDA 2 se hizo famoso en 2022 cuando un ingeniero de software senior de Google afirmó que LaMDA se había vuelto consciente. Esta afirmación fue rechazada por una gran parte de la comunidad de tecnología. 

Además, en febrero de 2023, Google anunció el lanzamiento de Bard, un chatbot impulsado por LaMDA, respuesta directa a la popularidad de ChatGPT de Open AI. Se espera que Bard se integre al mecanismo de búsqueda de Google en el futuro.

Stable Diffusion

Otro modelo de texto a imagen que se lanzó en 2022. Stable Diffusion fue desarrollado por el Grupo CompVis en la Universidad Ludwig Maximilian en Munich. Utiliza un modelo de difusión y ha sido entrenado con más de 5 mil millones de pares de imagen-texto. Su código ha sido lanzado públicamente y se puede ejecutar en hardware que no es muy especializado, ya que requiere una modesta unidad de procesamiento gráfico y VRAM.

Scroll to Top