Чат-бот Илона Маска начал тренировку, OpenAI займется чипами, а GPT-4o рискует уступить новой Llama 3.1 405B — 3 топ-новости недели про AI
В свежем Ай-яй-яй AI дайджесте — самые яркие инфоповоды AI за неделю. Комментирует главное лидер комьюнити Anywhere Club Виктор Шеленченко.
Новость #1 — Новый игрок Grok AI уже тренируется
Илон Маск анонсировал, что xAI начала тренировку своего чат-бота Grok на свежем суперкластере в Теннеси, США. Кластер оснащен 100 000 видеокартами H100 — их в 4 раза больше по количеству и они 2,5 раза мощнее видеокарт, которые OpenAI использовала для тренировки GPT-4. Лидеры ИИ-рынка пока не сообщали, какая мощность у их текущих кластеров. Ясно одно: Маск серьезно вкатился в ИИ-гонку — на Grok 3 придется обратить пристальное внимание.
Новость #2 — OpenAI будет создавать чипы
Видеокарты для тренировки и работы нейросетей дорого обходятся дата-центрам: все та же H100 от Nvidia стоит от $25 000 за штуку. В прошлом году Сэм Альтман заявил, что OpenAI создаст свое производство чипов. Издание «The Information» опубликовало последние новости об этом:
- Дизайн чипов будет готов не раньше 2026 года.
- OpenAI нанимает инженеров из Google — тех, которые умеют делать чипы.
- OpenAI обсуждает создание совместных производств с Intel, Samsung, TSMC и Broadcom.
- Альтман считает, что потребность в вычислительных мощностях для ИИ увеличится — нужно налаживать производство уже сейчас.
Если OpenAI начнет производить чипы, то она продолжит оставаться одной из самых влиятельных ИИ-компаний в мире.
Новость #3 — Llama 3.1 405B уже доступна
Дождались: вышла Llama 3.1 405B (да-да, на 400 миллиардов параметров). В сети уже появились данные о весах и результатах бенчмарков. По результатам тестов — пониманию школьных задач, ризонингу, написанию кода и владению науками — новая Llama с большим отрывом превосходит GPT-4o — текущего лидера в ИИ-индустрии. Появилась поддержка новых языков: французского, немецкого, хинди, итальянского, португальского, испанского и тайского. Будем ждать ответный ход OpenAI — они рискуют проиграть по производительности open-source модели!