EngX Code Review: почни писати код іще краще й побудуй ефективний процес код-рев’ю.

Скажи щось айтішною: Data-аналітик

Репорт, дашборд, айдішка, тенденції, трекати — що це все означає і які рішення у Сімо? Data-аналітик Денис Давидов та Web-аналітик Антон Пацай поділилися з блогом Anywhere Club словами, виразами і жартами, з якими стикаються щодня.



Яка буває аналітика

Data-аналітик Денис Давидов

— Аналітика — це сфера, яка розташована між ІТ (безпосередньо розробкою) і клієнтом (бізнес-замовником), — розповідає Денис, — Я уже давно займаюсь аналітикою, і раніше вона була більше сконцентрована на аналізі представлення даних — візуалізації, графіках і діаграмах. Це все залишається і зараз. Але, з одного боку, стало простіше працювати, бо з'явилися різноманітні фреймворки, які все це роблять швидко і просто, а з іншого боку — в роботі аналітика стало більше Data-інжинірингу.

Часто можна побачити, що аналітику малюють як айсберг: 20% — над водою (це числа та графіки, які побудував аналітик) і 80% — під водою (робота над пошуком джерела, протягуванням даних, обробка цих даних, очищення від «сміття» і налаштування логіки). Зараз у моїй роботі усі 90% — це підводна частина, яку користувач не бачить.

Аналітика як айсберг

— Варто зауважити, що я — вебаналітик, а Денис — класичний дата-аналітик, — пояснює Антон. — Тут є незначна різниця. Я більше заточений на налаштування трекінгу на вебсайтах та роботу з інструментами, які дозволяють трекати цей сайт. Слово трекати — це вебаналітична класика. Трекати означає дивитися, відстежувати дії користувачів, збирати дані про щось систематично. Я займаюся налаштуванням трекінгових систем, які, як датчики, спрацьовують на різні дії юзера і надсилають інформацію про це до баз даних, з яких вже або я, або дата-аналітики будують звіти в якихось інструментах, типу Power BI або Tableau, щоб ці дані можна було переглянути. Тобто я отримую завдання, що треба отримати такі звіти, а Денис повинен ці звіти вибудувати.

Web-аналітик Антон Пацай

Детальніше про Data Analyst

Сленг аналітика в IT

— Сленг аналітика в IT дуже залежить від специфіки та фреймворків, з якими працюють аналітики, — стверджує Денис, — Ми на проєкті працюємо з Google-аналітикою, відповідно підтягуються поняття з Google-аналітики. Хтось працює з іншими джерелами — там буде свій сленг, який визначається джерелом. Аналітики можуть працювати у різних фреймворках та програмах, терміни яких і використовуватимуть.

Але є й щось спільне, що треба знати всім аналітикам і не лише їм:

  • Репорт (звіт) — це кінцевий продукт будь-якого аналітика, їх можна робити на базі Data Studio, Power BI тощо. Але є така форма чи різновид репорта, як дашборд, дослівно — панель приладів.
  • Дашборд — це візуалізація даних для клієнта (замовника), щоб той міг їх використовувати та знаходити якісь інсайти щодо поведінки користувача або роботи платформи. Коли ти керуєш літаком, у тебе немає часу вивчати, що означає той чи інший індикатор. Потрібно швидко проглянути і зрозуміти, чи все гаразд. А якщо щось не так, то уважно придивитися та зрозуміти, що робити. Ідея дашборду — все має бути на екрані: основні датчики, якісь лампочки, що горять червоним та зеленим, якісь стрілочки. Заблимав датчик, і ти розумієш, що в тебе закінчується пальне. Значить до найближчого аеродрому стільки-то кілометрів, а пального в запасі на стільки-то кілометрів. Висновок — треба сідати у чистому полі. Таким чином, дашборд — інженерна аналогія панелі приладів. Або приклад зі світу IT: приходить умовний проджект-менеджер, дивиться на дашборд і бачить, що кількість користувачів на сайті різко впала. Значить, щось пішло не так. Він переходить у глибші репорти і там уже дивиться, чому показники знизилися: звідки приходили користувачі, з якої країни, що могло вплинути на їхній відтік, чи не зламалося щось. Аналітика допомагає розібратися у суті проблеми.
  • Айдішка (ID) — ідентифікатори. Якщо аналітик рахує людей, то це айдішки людей, якщо місця, то — локацій. Тобто ми працюємо не з конкретними іменами людей: є ідентифікатори, котрі точно ідентифікують людей чи локацію, країну, місто.

Якщо ми говоримо про вебаналітику, то це ідентифікація cookie користувача, фактично його браузер. Наприклад, якийсь браузер заходив до нас на сайт. Дані пройшли через провайдера тієї чи іншої країни. І ми розуміємо, що це користувач із цієї країни. А за фактом це браузер, який мав IP цієї країни. Насправді це могло бути 10 різних юзерів, які скористалися одним комп'ютером і використовували VPN, а самі були з іншої локації. Це припущення, із якими доводиться працювати.

— Якщо від дата-аналітика вимагають суперточності, то від вебаналітика — скоріше тренди, — пояснює Антон, — достатньо, що ми бачимо тенденцію, що у нас, скажімо, зниження користувачів або зростання у певному відсотковому співвідношенні.

— Але бувають в аналітиці завдання, де потрібна точність до одиниці, — додає Денис, — наприклад складські запаси: на склад надійшло 1000 автомобілів. Дивно, якщо 500 продали, залишилося 300, а де ще 200 — незрозуміло. Але не завжди така точність у аналітиці є. Аналітик ще працює з математичною статистикою, а статистика — це про ймовірності. За більших чисел робляться припущення. Нам все одно потрібна тенденція. Бізнесу, насправді, здебільшого неважливо, прийшло нових користувачів за вчорашній день 500 чи 503. Йому треба розуміти: зростає бізнес чи відбуваються якісь негативні тенденції. Ми найчастіше працюємо з тенденціями.

— Іще один приклад сленгу. Нещодавно мені треба було розібратися з однією проблемою, і я написав в чат з колегами: «Намагаюсь тут кастомний клайнт айді налаштувати для ГТМ прода кастомера. Той, де dataLayer = globalDataLayer. Юзаю рішення від Сімо (темплейт GTAG GET API). Зрозуміло, що воно не працює через назву змінної. Міняв у коді dataLayer на globalDataLayer. І видавав пермішени. Але пуша все одно немає. Що робити?», — згадує Антон, — Людині недосвідченій взагалі незрозуміло, про що мова. По-перше, як і в інших сферах IT, аналітики часто використовують англіцизми, по-друге — ці англіцизми часто пишуть то кирилицею, то латиницею, то впереміш. І це нормально. А по-третє, в аналітиці дуже багато скорочень. Ось деякі з них:

  • GA — Google-аналітика;
  • GTM — Google Tag-менеджер;
  • DataLayer — область даних;
  • Сімо (Сімо Огава) — це ім’я ікони вебаналітики. Він був першопрохідцем в багатьох питаннях вебаналітики, зокрема роботи з ГТМ і Гугл-аналітикою. У нього є свій блог, за яким багато хто з аналітиків стежать і часто використовують якісь рішення, котрі він робив, або беруть за основу його рішення;
  • DQ (data quality) — робота над якістю даних, очищення від непотрібного. Це те, що зазвичай займає багато часу у аналітика;
  • DS (data studio) — гуглівський інструмент для візуалізації;
  • DWH (Data Warehouse) — база даних, яку розробили спеціально для аналітики і бізнес-процесів.

Гумор для своїх 

— До того, як я прийшов в аналітику, мені ці жарти здавалися якимись одноманітними і надто прямолінійними, — згадує Денис. — Але потім я почав їх розуміти. Усі вони зводяться до двох типів: 

  • Коли клієнт не розуміє всю складність збору і перетворення даних. Наприклад, аналітика просять надати до ранку якусь цифру. І дуже дивуються, коли він каже, що на це піде тиждень. Часом береш завдання щось подивитись, йдеш у таблицю, а там дані у якомусь не такому форматі. І їх треба поєднувати з іншою таблицею. Просте завдання займає іноді тижні чи місяці. 
  • Коли аналітики готові довго вибудовувати дані, працювати в складних системах, типу Power BI, а бізнес просить вивантажити все просто в Excel-файл. І аналітик плаче, коли чує ці слова.
Мем про Excel
Із відкритих джерел

— На підготовку даних, звітів витрачається багато часу, — пояснює Денис, — але не менше часу йде і на спілкування з клієнтом: щоб зрозуміти, що ж він хоче отримати в результаті і що потрібно вивести на дашборд, у якому вигляді і за який період. Іноді клієнт точно знає, яка аналітика йому потрібна, а буває, що ми отримуємо запити на кшталт: «покажіть, як у нас справи», «я хочу бачити, у чому в нас проблеми» або «треба, щоб я глянув і міг прийняти рішення, що робити далі». Тому один із найпоширеніших жартів як про аналітика, так і про будь-якого працівника зі сфери IT ось цей:

Пожартуйте як про аналітика, так і про будь-якого айтішника
Із відкритих джерел

Хочете поділитися сленгом айтівців?

Го в Discord
Матеріали за темою
Стеж за новинами на улюблених платформах