Chat with RTX, новая text-to-image модель Stable Cascade, Gemini Ultra vs GPT-4 — 3 топ-новости недели об AI
В свежем Ай-яй-яй AI дайджесте — самые яркие инфоповоды AI за неделю. Комментирует главное лидер комьюнити Anywhere Club Алексей Картынник.
Новость #1 — Локальный чат-бот от NVIDIA
NVIDIA зарелизили бесплатное ПО Chat with RTX, позволяющее локально запускать LLM на компьютерах с видеокартами NVIDIA 30/40-серии и оперативной памятью от 16Гб и больше. Запустив Chat with RTX, вы можете взаимодействовать с документами на вашем компьютере через удобный чат-бот в приватном режиме. Под работой с документами подразумевается «разговор» с практически любыми текстовыми документами и заметками, транскрибация видео на YouTube и даже выполнение некоторых задач по программированию.
Новость #2 — Новая text-to-image модель от Stability AI
Компания Stability AI представила research preview своей новой text-to-image модели с открытым исходным кодом. Модель Stable Cascade построена поверх архитектуры Würstchen, работает на уровне Stable Diffusion 2, а по некоторым параметрам даже превосходит Stable Diffusion XL. Stable Cascade имеет простой механизм файнтюнинга и умеет не только генерировать изображения по промптам, но и предлагает варианты генераций, а также может генерировать изображения по референсам.
Новость #3 — Gemini Ultra vs GPT-4
В интернете уже гуляют сравнения новой Gemini Ultra от Google и GPT-4 от OpenAI. Кажется, что Gemini проигрывает по качеству ответов, но превосходит GPT-4 по скорости их выдачи, не имеет жестких ограничений по количеству сообщений (в отличие от ChatGPT) и проявляет мультимодальные возможности — например, умеет генерировать изображения и аудио, используя для этого единую обобщенную модель. Попробовать Gemini Ultra можно, если оформить подписку на Gemini Advanced. И да, бренд Gemini полностью заменил собой Bard. Кто-то говорит, что таким образом Google пытается уйти от испорченной репутации Bard, так как он сильно уступал всем конкурентам. Посмотрим, получится ли.
Бонус
В новостях об ИИ как-то сама собой родилась традиция бонусов — где мы на правах спикеров рассказываем о чем-то полезном или веселом, а редактор блога Anywhere Club на это закрывает глаза. Обратите внимание на AI DIAL — опенсорсный LLM-оркестратор от EPAM, который позволяет подключать к вашим продуктам разнообразные LLM посредством единого API. AI DIAL может работать с несколькими облачными провайдерами через единый интерфейс и предоставляет кучу дополнительных инструментов, таких как Helm-чарты, аналитику использования и авторизацию.