OpenAI запустила продвинутый голосовой движок, Midjourney 6.1 теперь еще реалистичнее, опенсорсная FLUX.1 врывается в генерацию медиа-контента — 3 топ-новости недели про AI
В свежем Ай-яй-яй AI дайджесте — самые яркие инфоповоды AI за неделю. Комментирует главное лидер комьюнити Anywhere Club Виктор Шеленченко.
Новость #1 — OpenAI подает голос
OpenAI начала выдавать доступ к своему продвинутому голосовому движку на базе GPT-4o части пользователей платной подписки ChatGPT Plus. Осенью обновление станет доступным для всех подписчиков Plus. Релизнутая версия не отличается от демо — модель может вздыхать, пародировать звуки, натурально поддерживать диалог, считывать эмоции собеседника и учитывать их при генерации своих ответов.
Новость #2 — Midjourney 6.1 стала еще реалистичнее
Midjourney, лидер в ИИ-генерации избражений, выпустила версию 6.1 — одну из самых фотореалистичных моделей. В ней улучшена отрисовка рук, людей, растений и животных, повышена на 25% скорость генерации изображений и усовершенствована детализация мелких объектов на заднем плане. Версия 6.2 ожидается уже в сентябре.
Новость #3 — Новая FLUX.1 может составить конкуренцию Midjourney 6 и Stable Diffusion XL
Плох тот король, на чье место не претендует кто-нибудь другой. Компания Black Forest Labs от бывших сотрудников Stability AI представила свою опенсорсную модель FLUX.1 для генерации медиа-контента. Ее можно разворачивать локально. По бенчмаркам FLUX.1 приближается к уровню Midjourney 6 и может превзойти Stable Diffusion XL. Примеры генераций можно посмотреть в анонсе.