LLM: що це таке і які відкриває можливості
Які існують інструменти та техніки для ефективного промпт інжинірингу? Чим сьогодні хороший ChatGPT, а в чому йому ще належить удосконалюватися? Як йому у цьому допомогти ? На актуальні запитання відповідає продуктовий менеджер Anywhere Club Леонід Ардаєв і ділиться корисними ресурсами для вивчення prompt engineering.
Що таке LLM, або Large Language Models
— LLM — це мовні моделі, що працюють з великою кількістю додаткових параметрів. Тобто це моделі, які використовують великі дані та мережі трансформерів для побудови своєї структури, — пояснює Леонід, — Напевно, вам знайомі такі моделі, як GPT-3, GPT-3.5 і, звісно ж, GPT-4, який використовується в чат-ботах OpenAI. Сьогодні OpenAI не розкриває деталі щодо обсягу інформації та параметрів, з якими працює GPT-4, але є підстави вважати, що на даний момент це одна з найбільших моделей.
Існують й інші менш популярні моделі, які, однак, поступаються OpenAI в багатьох тестах. Це, наприклад, Jurassic 1 і Jurassic 2 від ізраїльської компанії AI21 Labs. Або чат-бот Google Bard на моделі PaLM-2, яка зовсім недавно з’явилася у загальному доступі.
Є кілька цікавих розробок від NVIDIA (NeMo, Picasso та BioNeMo), які створені для цілого спектра різних застосувань — від генерації тексту і відео до наукових досліджень.. Їхні наступні версії, ймовірно, матимуть найбільшу кількість параметрів, що дасть їм змогу враховувати більше деталей під час генерації контенту.
Різноманітність мовних моделей велика, і кожна з них має свої особливості та переваги, а також особливі сфери застосування.
Ще більше про ChatGPT
— GPT (Generative Pre-trained Transformer) — це модель мовного моделювання (LLM), а ChatGPT — продукт, що ґрунтується на моделі GPT і призначений для ведення діалогів із людиною природною для неї мовою, — дає визначення Леонід, — ChatGPT здатний підтримувати діалоги, запам’ятовуючи попередні висловлювання та відповідаючи на них у спосіб, що схожий на розумний людський діалог. Модель навчається на великих обсягах текстових даних та використовує архітектуру трансформера для генерації відповідей.
Сильні сторони ChatGPT
Слабкі сторони ChatGPT
Звичайно, у ChatGPT наразі набагато більше обмежень, але, коли їх буде знято — це питання часу. Зараз просто потрібно пам’ятати про них і намагатися обходити.
Основні правила складання промтів
— Prompt engineering — важливий аспект взаємодії з моделлю ChatGPT, — вважає Леонід, — Щоб отримати точну та правильну відповідь, необхідно ретельно скласти запит. Промпт для моделі не може бути таким самим, як для людини. Людина здатна інтерпретувати невербальні сигнали та додумувати неявні наміри. Однак модель такої здатності не має. Їй потрібен достатній контекст і чітке розуміння завдання. Якщо моделі не надати цю інформацію, вона все одно поверне відповідь, але, найімовірніше, вона не відповідатиме очікуванням і запиту користувача.
Інструменти та техніки для ефективного промпт інжинірингу
Використання інструментів допомагає тестувати та налаштовувати промпти, щоб вибрати найкращі варіанти та отримати бажані результати.
Корисні ресурси для вивчення prompt engineering
— Вже існує безліч додаткових ресурсів, які можна використовувати для глибшого вивчення prompt engineering і застосування його на практиці, — ділиться Леонід:
1. На платформі LinkedIn Learning можна знайти курси, присвячені HRGPT і prompt engineering, які надають професійне та більш поглиблене пояснення цих концепцій. Наприклад:
2. Ресурс Learn Prompting надає корисні матеріали для більш ретельного вивчення процесу складання промптів.
3. Різні IDE (інтегровані середовища розроблення) пропонують широкі можливості та постійно оновлюються, надаючи корисний контекст та інструменти для ефективного створення промптів. Вони також інтегруються з різними мовами програмування та фреймворками для вирішення конкретних завдань.