EngX Code Review: начни писать код еще лучше и построй эффективный процесс код-ревью.

Рассылка запретов от Sony, как не влюбиться в ChatGPT, репозиторий llama-from-scratch — 3 топ-новости недели об AI

В свежем Ай-яй-яй AI дайджесте — самые яркие инфоповоды AI за неделю. Комментирует главное лидер комьюнити Anywhere Club Виктор Шеленченко.

Anywhere Club community leader, Viktar Shalenchanka


Новость #1 — Запрет на использование музыки для обучения LLM

Эта неделя в мире ИИ получается довольно скандальной. Так, например, Sony Music Group разослала аж 700 писем с предупреждением не использовать их контент в обучении моделей. Письма получили в основном музыкальные ИИ-стартапы, такие как Suno и Udio. Дело в том, что Sony является одним из крупнейших правообладателей в музыкальной индустрии. Им принадлежат права на многие треки, которые есть в ваших плейлистах прямо сейчас. Компания грозит судом любому, кто будет использовать принадлежащую им музыку в целях обучения LLM. Причем на данный момент все еще не существует нормальных судебных механизмов, позволяющих доказать факт обучения. Но угрожать можно сколько угодно.

Новость #2 — Шансов влюбиться в ChatGPT стало меньше

Второй скандал уже поменьше масштабом. OpenAI выключили в своих приложениях голос озвучки Sky. Причина толком не объясняется, как не обозначается и план возвращения голоса в будущем. Sky — это тот самый фантастически эмоциональный (и даже, как многие считают, заигрывающий) голос из презентации GPT 4o. Один из вариантов выключения голоса, по мнению сообщества, как раз в той самой эмоциональности. Мол, OpenAI боится, что люди будут привязываться к ChatGPT (а кто-то может даже и влюбиться). Хотя, скорее всего, все гораздо банальнее — уж очень голос Sky похож на голос Скарлет Йохансон, а за такое можно получить уже вполне реальный судебный иск в США.

Новость #3 — репозиторий llama3-from-scratch от naklecha

Ну и напоследок давайте отвлечемся от скандалов и перейдем к коду. Теперь каждый может написать свою LLM наподобие Llama 3. Не то чтобы раньше это было невозможно, но теперь, благодаря Github-пользователю naklecha, это сало просто как никогда. Он создал репозиторий "llama3-from-scratch", в котором делится полными инструкциями по написанию своей версии модели. Все расписано по шагам и достаточно подробно. Конечно, вам все еще придется самим искать датасеты. Но в любом случае интересно и полезно изучить, что там под капотом. 

Prompt Engineering Foundations
Master the art of crafting, fine-tuning, and formatting effective prompts for LLMs to improve accuracy and boost productivity.
View coursearrow-right-blue.svg
Материалы по теме
Следи за новостями на любимых платформах