OpenAI presenta Sora y ChatGPT Pro, Google presenta Veo 2 e Imagen 3: las 3 noticias sobre IA más importantes de la semana

Nuestro último AI Digest cubre las principales noticias sobre IA de la semana. Nikolai Chesalin, arquitecto de productos de EPAM, comenta las noticias más destacadas.

Nikolai Chesalin, arquitecto de productos

IA20 diciembre 20243 min de lectura

#1 — Sora, de OpenAI, revoluciona la creación de videos

OpenAI ha presentado Sora, un innovador generador de video basado en IA que transforma simples mensajes de texto en videos de alta calidad. Esta herramienta ofrece una flexibilidad creativa sin precedentes a los creadores de contenidos de diversos sectores, con capacidad para producir videos a 1080p de hasta 20 segundos de duración en distintas relaciones de aspecto. Los creadores pueden incorporar sus propias imágenes y videos a los proyectos, combinando los elementos generados por la IA con los contenidos existentes para obtener resultados únicos y personalizados.

Sora se sirve de modelos de difusión avanzados para producir videos con un nivel de detalle excepcional, texturas realistas y movimientos fluidos. Revoluciona el proceso de creación de guiones gráficos al permitir que los creadores diseñen y visualicen videos fotograma a fotograma. Este control preciso sobre el flujo narrativo y la coherencia visual mejora la eficacia de la producción de videos.

Actualmente, Sora está disponible para los suscriptores de ChatGPT Plus y Pro, y tiene planeado ampliar el acceso en los próximos meses.

Generative AI for managers
A tutorial for project, product, and delivery managers on leveraging GenAI while leading software developer teams.
View coursearrow-right-blue.svg

#2 — ChatGPT Pro: elevar la interacción con la IA

Con el objetivo de ampliar el acceso a las capacidades avanzadas de IA, OpenAI ha presentado ChatGPT Pro, un plan de suscripción con una tarifa de $200 dólares por mes. Este plan ofrece acceso ilimitado a los modelos más sofisticados de OpenAI, incluidos o1, o1-mini, GPT-4o y Advanced Voice.

Exclusivo para usuarios de ChatGPT Pro, el modo o1 pro se sirve de mayores recursos computacionales para proporcionar respuestas más refinadas y perspicaces, especialmente beneficiosas para problemas complejos en campos como la ciencia de datos, la programación y el análisis legal. Los usuarios Pro pueden seleccionar el modo o1 pro en el menú de modelos de la interfaz ChatGPT. Para dar cabida a los tiempos de respuesta más largos asociados con el modo o1 pro, una barra de progreso indicará los tiempos de espera y los usuarios recibirán notificaciones al finalizar la tarea.

ChatGPT Pro está diseñado para investigadores, ingenieros y profesionales que necesitan inteligencia de nivel de investigación para tareas complejas. Para usuarios ocasionales, los planes Free o Plus pueden ofrecer funcionalidad suficiente.

#3 — Veo 2 e Imagen 3 de Google: superar los límites de los medios generados por IA

Google ha anunciado importantes actualizaciones de sus herramientas de inteligencia artificial: Veo 2 e Imagen 3. Veo 2, el último modelo de IA de Google, está diseñado para producir videos de alta calidad con un realismo extraordinario. Admite resoluciones de hasta 4K, puede generar videos de varios minutos de duración y demuestra una mejor comprensión del movimiento y las interacciones humanas, lo que se traduce en resultados más naturales y coherentes. Veo 2 también ofrece efectos cinematográficos avanzados, que permiten que los usuarios especifiquen ángulos de cámara, objetivos y tipos de plano —como “objetivo de 18 mm” o “plano de seguimiento de ángulo bajo”— para lograr los estilos visuales deseados.

El modelo Imagen 3 actualizado se centra en ofrecer imágenes fotorrealistas con texturas más ricas y colores más vivos. Comprende mejor las indicaciones del usuario, lo que le permite generar imágenes que se ajustan mejor a las descripciones detalladas y reducir los artefactos visuales, lo que se traduce en resultados más limpios y precisos.

Ambas herramientas están disponibles actualmente a través de las plataformas de Google: Veo 2 es accesible a través de VideoFX e Imagen 3 a través de ImageFX.

Publicaciones relacionadas
Sigue las noticias en tus plataformas favoritas