Что-то на айтишном: Data-аналитик
Репорт, дашборд, айдишник, тенденции, трекать — что все это значит и какое решение у Симо? Data-аналитик Денис Давыдов и Web-аналитик Антон Пацай поделились с блогом Anywhere Club словами, выражениями и шутками, с которыми сталкиваются каждый день.
Какая бывает аналитика
— Аналитика — это сфера, которая находится между IT (непосредственно разработкой) и клиентом (бизнес-заказчиком), — рассказывает Денис, — Я уже давно занимаюсь аналитикой, и раньше она была больше сконцентрирована на анализе представления данных — визуализацию, построение графиков и диаграмм. Это все остается и сейчас. Но, с одной стороны, стало проще работать в силу того, что появились различные фреймворки, которые все это делают быстро и просто, а с другой стороны — в работе аналитика стало больше Data-инжениринга.
Часто можно увидеть, что аналитику рисуют, как айсберг: 20% — над водой (это числа и графики, которые построил аналитик) и 80% — под водой (работа над поиском источника, протягиванием данных, обработка этих данных, очистка от «мусора» и настройка логики). Сейчас в моей работе и вовсе 90% — это подводная часть, которую пользователь не видит.
— Надо сказать, что я —веб-аналитик, а Денис — классический дата-аналитик, — поясняет Антон, — Здесь есть небольшая разница. Я больше заточен на настройку трекинга на веб-сайтах и работу с инструментами, которые позволяют трекать этот сайт. Слово трекать — это веб-аналитическая классика. Трекать означает смотреть, отслеживать действия пользователей, собирать данные о чем-то систематически. Я занимаюсь настройкой трекинговых систем, которые, как датчики, срабатывают на разные действия юзера и присылают информацию об этом в базы данных, из которых уже либо я, либо дата-аналитики строят отчеты в каких-то инструментах, типа Power BI или Tableau, чтобы эти данные можно было посмотреть. То есть я получаю задачу, что нужно получить такие-то отчеты, а Денис должен эти отчеты выстроить.
Сленг аналитика в IT
— Сленг аналитика в IT очень зависит от специфики и фреймворков, с которыми работают аналитики, — утверждает Денис, — Мы на проекте работаем с Google аналитикой, соответственно подтягиваются понятия из Google аналитики. Кто-то работает с другими источниками — там будет свой сленг, определяемый источником. Аналитики могут работать в разных фреймворках и программах, термины которых и будут использовать.
Но есть и что-то общее, что нужно знать всем аналитикам и не только:
- Репорт (отчет) — это конечный продукт любого аналитика, их можно делать на базе Data Studio, Power BI и т.д. Но есть такая форма или разновидность репорта, как дашборд, дословно – приборная панель.
- Дашборд — это визуализация данных для клиента (заказчика), чтобы тот мог их использовать и находить какие-то инсайты по поведению пользователя или по работе платформы. Когда ты управляешь самолетом, у тебя нет времени изучать, что обозначает тот или иной индикатор. Нужно быстро взглянуть и понимать, все ли в порядке. А если что-то не так, то пристально посмотреть и понять, что делать. Идея дашборда — все должно быть на экране: основные датчики, какие-то лампочки, которые горят красным и зеленым, какие-то стрелочки. Заморгал датчик, и ты понимаешь, что у тебя заканчивается топливо. Значит до ближайшего аэродрома столько-то километров, а топлива в запасе на столько-то километров. Вывод — надо садиться в чистом поле. Таким образом дашборд — инженерная аналогия приборной панели.
- Или пример из мира IT: приходит условный проджект-менеджер, смотрит на дашборд и видит, что резко упало количество пользователей на сайте. Значит, что-то пошло не так. Он переходит в более глубокие репорты и там уже смотрит, почему же оно снизилось: откуда приходили пользователи, с какой страны, что могло повлиять на их отток, не сломалось ли что-то. Аналитика помогает разобраться в сути проблемы.
- Айдишник (ID) — идентификаторы. Если аналитик считает людей, то это айдишники людей, если места, то — локаций. То есть мы работаем не с конкретными именами людей: есть идентификаторы, которые точно идентифицируют людей или локацию, страну, город.
Если мы говорим про веб-аналитику, то это идентификация куки пользователя, фактически его браузер. Например, какой-то браузер заходил к нам на сайт. Данные прошли через провайдера той или иной страны. И мы понимаем, что это пользователь из этой страны. А по факту это браузер, у которого было IP данной страны. На самом деле это могло быть 10 разных юзеров, которые пользовались одним компьютером и использовали VPN, а сами были из другой локации. Это допущения, с которыми приходится работать.
— Если от дата-аналитика требуют суперточность, то от веб-аналитика — скорее тренды, — объясняет Антон, — достаточно, что мы видим тенденцию, что у нас, допустим, снижение пользователей или рост в определенном процентном соотношении.
— Но бывают в аналитике задачи, где нужна точность до единицы, — добавляет Денис, — например, складские запасы: на склад поступило 1000 автомобилей. Странно, если 500 продали, осталось 300, а где 200 — непонятно. Но не всегда такая точность в аналитике есть. Аналитик еще работает с математической статистикой, а статистика — это про вероятности. При больших числах есть допущения. Нам все равно нужна тенденция. Бизнесу на самом деле в большинстве случаев неважно, пришло новых пользователей за вчерашний день 500 или 503. Ему надо понимать: растет бизнес или происходят какие-то негативные тенденции. Мы чаще всего работаем с тенденциями.
— Еще один пример сленга. Недавно мне нужно было разобраться с одной вещью, и я написал в чат с коллегами: «Пытаюсь тут кастомный клайнт айди настроить для ГТМа прода кастомера. Тот где dataLayer = globalDataLayer. Юзаю решение от Симо (темплейт GTAG GET API). Понятно, что оно не работает из-за названия переменной. Менял в коде dataLayer на globalDataLayer. И выдавал пермишены. Но пуша все равно нету. Что делать?», — вспоминает Антон, — непросвещенному человеку вообще непонятно, о чем речь. Во-первых, как и в других областях IT, аналитики часто используют англицизмы, во-вторых — эти англицизмы часто пишут то русскими буквами, то английскими, то вперемешку. И это нормально. А в-третьих — в аналитике очень много сокращений. Вот некоторые из них:
- GA — Google-аналитика;
- GTM — Google Tag-менеджер;
- DataLayer — область данных;
- Симо (Симо Огава) — это имя иконы веб-аналитики. Он был первопроходцем во многих технических вопросах веб-аналитики, в частности работы с ГТМом и Гугл Аналитикой. У него есть свой Блог, за которым многие аналитики следят и зачастую используют какие-то решения, которые он делал, или берут за основу его решения;
- DQ (data quality) — работа над качеством данных, очистка от ненужного. Это то, что обычно занимает очень много времени у аналитика;
- DS (data studio) — гугловский инструмент для визуализации;
- DWH (Data Warehouse) — база данных, сделанная специально для аналитики и бизнес-процессов.
Humor for you
— До того, как я пришел в аналитику, мне эти шутки казались какими-то однообразными и слишком прямолинейными, — вспоминает Денис, — Но потом я стал их понимать. Все они сводятся к двум типам:
- Когда клиент не понимает всю степень сложности получить и преобразовать данные. Например, аналитика просят предоставить к утру какую-нибудь цифру. И очень удивляются, когда он говорит, что на это уйдет неделя работы. Порой берешь задачу что-то посмотреть, идешь в таблицу, а там данные в каком-то не таком формате. И их надо соединять с другой таблицей. Простая задача занимает иногда недели или месяцы.
- Когда аналитики готовы долго выстраивать данные, работать в сложных системах, типа Power BI, а бизнес просит выгрузить все просто в Excel-файл. И аналитик плачет при этих словах.
— На подготовку данных, построение отчетов тратится много времени, — поясняет Денис, — но не меньше времени уходит и на общение с клиентом: чтобы понять, что же он хочет получить в итоге и что нужно вывести на дашборд, в каком виде и за какой период. Иногда клиент точно знает, какая аналитика ему нужна, а бывает, что мы получаем запросы вроде: «покажите, как у нас обстоят дела», «я хочу видеть, в чем у нас проблемы» или «нужно, чтобы я взглянул и мог принять решение, что делать дальше». Поэтому одна из самых распространенных шуток как про аналитика, так и про любого работника из сферы IT вот эта:
Хотите поделиться айтишным сленгом?