Введение
Директор центра аналитических продуктов VK Predict Роман Стятюгин в интервью Hi-Tech Mail — о ключевых продуктах, рынке аналитических сервисов и развитии искусственного интеллекта.
Интервью
Многие знают, что VK занимается не только b2c- сервисами и платформами, но развивает и продукты для бизнеса. Что за направление VK Predict и зачем оно появилось в VK?
VK Predict — это команда внутри VK, которая создает умные инструменты и продукты на базе машинного обучения и искусственного интеллекта. Благодаря им крупные компании и бизнесы могут решать разные задачи, которые раньше казались сложными или невозможными. VK много лет работала с большими объемами данных, создавала технологии для их обработки и строила инфраструктуру, чтобы использовать эти данные для улучшения своих продуктов, в рекламе, рекомендациях и других сферах. В какой-то момент эти технологии стали набирать популярность в компаниях различных индустрий — банки, ритейл и многие другие. Они начали развивать свою экспертизу в работе с данными, обращались в VK с запросом на обмен опытом, и мы делали для них небольшие пилотные проекты.
Потом пришла идея: раз у нас есть всё необходимое — знания, технологии и инфраструктура — почему бы не сделать из этого полноценный бизнес? Так было создано отдельное направление для работы с корпоративными клиентами VK Predict. Мы начали целенаправленно развивать этот проект: собирать команду, ставить цели и создавать продукты. Я был первым человеком в команде, которая стала изучать рынок и формировать портфель коммерческих продуктов, при этом мы, конечно, опирались на опыт и технологическую экспертизу всего VK.
Сегодня VK Predict — это более ста человек. Ядро команды — это специалисты, которые занимаются машинным обучением и анализом данных, а также software-инженеры — те, кто разрабатывает интерфейсы, бэкэнд и, в целом, поддерживает продуктивный контур. Уникальность команды заключается в том, что мы научились работать с входящим потоком совершенно разных задач от разных индустрий — клиентская аналитика, прогнозирование выручки и спроса, выявление потерь электроэнергии, анализ качества мобильной связи и многое другое, научились быстро погружаться в новую предметную область и имеем зрелые технологии проектного управления. Вместе мы стараемся делать умные решения для бизнеса проще и доступнее.
С кого из клиентов начинали?
Наши первые клиенты — это компании из финансового сектора, в основном банки. Есть несколько причин, почему мы начали именно с них.
Во-первых, в банках работают очень сильные аналитики, которые отлично разбираются с данными. Они умеют правильно ставить задачи, анализировать результаты и понимать, по каким метрикам оценивают успех. Они знают, как эти показатели влияют на прибыль и развитие банка. Когда у заказчиков есть такая экспертиза, работать вместе проще и результат получается лучше.
Во-вторых, в банковском бизнесе есть понятные метрики — например, риски. Чем лучше ты оцениваешь риски, тем больше денег зарабатывает банк. Эти показатели можно измерять математически: если ты их улучшаешь хотя бы на один процент — получаешь дополнительную прибыль. Там, где бизнес умеет считать такие метрики и понимать их важность, наши дата-продукты работают отлично и приносят реальную ценность. Такие метрики, конечно, есть не только в банках, но и во многих других индустриях, например, в e-com, ритейле и в телекоме.
Как выглядит продукт, который получает ваш клиент?
У нас есть два типа продуктов — сервисы, которые содержат внутри математические модели и к которым можно обратиться по API, и продукты с пользовательским интерфейсом. Математическая модель обучается в результате совместной работы команд VK Predict и клиента. Результат работы этой модели — это числовые параметры и показатели, которые заказчик использует в своей деятельности для принятия решений. Например, если говорить про банк, то это может быть модель ранжирования, позволяющая определить, кому лучше предложить кредит на покупку товара или путешествия. Или индивидуальная модель для оценки вероятности того или иного события. Допустим, чтобы проверить гипотезу: «Если предложить клиенту оформить кредитную карту, заинтересуется ли он?» Или: «Если предложить клиенту путешествие на Алтай с выгодным кэшбэком по карте банка, купит ли он путевку?».
Наши модели строятся не на одном источнике данных. Их могут быть десятки. Мы работаем с разными видами данных: есть и внешние источники, и данные от клиентов. Самое важное в нашей работе — качество данных. От этого зависит, насколько правильно работают модели и насколько точны принимаемые ими решения. Мы очень внимательно следим за качеством данных и создали многоуровневую систему проверки. Так, данные из разных источников сначала попадают в «карантинную» зону — там проходят разные проверки и тесты. Только когда мы уверены, что данные правильные и корректные, они поступают в основную систему для расчетов и построения моделей.
Второй тип продуктов — это сервисы с пользовательским интерфейсом предназначены для непосредственной работы в них бизнес-пользователей — это и дашборды, и тепловые карты, в последнее время все больше чат-ботов с встроенными языковыми моделями. Такие продукты являются не только системами поддержки принятия решений, как в случае с моделями, но и автоматизируют бизнес-процессы заказчика, освобождая сотрудникам время для решения своих задач.
VK Predict — это достаточно большая команда, развитием каких конкретно сервисов она занимается?
Среди наших ключевых решений — «Рейтинг» для прогнозирования различных признаков целевой аудитории, «Телеком Радар» для оценки качества связи, платформа геоаналитики «ГеоКурсор» для анализа локаций, «Девелопер» для определения оптимальной квартирографии жилых комплексов, а также «Predict AutoML» для создания решений на основе машинного обучения без привлечения ИТ-специалистов. Из наших новых релизов — это ИИ-сервис для маркетологов AI Persona, на котором у нас сейчас большой фокус. Этот продукт объединяет подробную аналитику по сегментам целевой аудитории конкретной компании и возможности LLM для извлечения инсайтов и генерации персонализированных сообщений. Это делает работу маркетологов и CRM-специалистов более эффективной.
Расскажите про «Телеком Радар», какие вопросы решает этот продукт?
«Телеком Радар» — наш продукт для телеком-операторов и провайдеров широкополосного интернета. Сейчас им пользуются три из четырех крупнейших телеком-компаний и почти все крупные виртуальные операторы. Этот продукт состоит из двух частей. Первая — это оценка качества связи на основе реального опыта пользователей. Мы анализируем, как клиенты смотрят видео на своих устройствах: насколько быстро загружается видео, есть ли задержки, в каком качестве идет картинка. Мы создаем общий рейтинг для всего рынка — каждый оператор видит, как его качество связи сравнивается с другими по разным регионам и даже по конкретным локациям. Это помогает операторам понять, где нужно улучшать инфраструктуру, чтобы связь была лучше, а абоненты оставались довольны.
Вторая часть — это оценка доли рынка. Она показывает, сколько абонентов у каждого оператора и как меняется ситуация: кто теряет клиентов, а кто их привлекает, и в каких регионах это происходит. Помимо операторов, наши клиенты — регионы, которые используют «Телеком Радар» для оценки качества связи и быстрого решения проблем с интернетом у жителей. Мы помогаем им делать связь лучше и расширять ее охват.
В каком направлении планируется развивать продукт?
У нас амбициозные планы. Мы хотим совершенствовать продукт и добавлять новые функции по мере роста требований клиентов. Например, будем улучшать детализацию анализа — оценивать качество связи внутри зданий и по этажам. Также мы работаем над созданием прокси-метрик — это такие показатели, которые помогают понять, насколько у компании всё хорошо или плохо. Сейчас мы используем много базовых метрик, а в будущем планируем искать между ними связи и давать общую оценку, например того, есть ли связь между качеством связи и долей рынка. В целом, мы добавляем новые метрики для более точного анализа и делаем их более понятными для бизнеса — чтобы клиенты могли сразу определить, как качество связи влияет на их результаты.
Расскажите про «Геокурсор», какие задачи он помогает решать?
«Геокурсор» — это сервис, который помогает понять, насколько перспективна та или иная локация. Например, розничные сети решают, где открыть новый магазин, банки — где поставить банкоматы. Им важно знать, есть ли в выбранном месте люди, которые заинтересованы в их продуктах или услугах. Например, для «Вкусвилла» это один сегмент клиентов, для «Додо Пиццы» — другой, а для магазина-дискаунтера — третий.
Кроме того, в «Геокурсоре» мы разрабатываем модели, которые оценивают потенциальную выручку торговой точки в конкретной локации. Пользователь может выбирать на карте интересующее его место и модель рассчитает прогноз — какая будет выручка магазина, если его открыть в этой точке.
В «Геокурсоре» есть несколько уникальных функций, например, гравитационные модели, в частности модель Хаффа, которая позволяет прогнозировать поток покупателей в зависимости от локации и привлекательности торговых точек, тем самым выявляя зоны их влияния. Для регионов инструмент геоаналитики тоже очень полезен: он помогает развивать внутренний туризм. Мы анализируем туристические потоки — откуда и зачем люди приезжают в тот или иной регион. На основе этого регион может понять, какие места недооценены и могут стать популярными туристическими точками. Так они могут принимать решения о развитии инфраструктуры и открытии новых достопримечательностей.
**Есть ли у вас решения для работы с большими данными, которые клиент может использовать у себя? ** Да, у нас есть продукт — Predict AutoML. Это low-code/no-code платформа, которая автоматизирует обучение ML-моделей и позволяет быстро вывести их в продуктивный режим.
Кому она нужна?
В первую очередь компаниям, у которых нет сильной команды специалистов по машинному обучению, но есть потребность и понимание ценности моделей для бизнеса. Или тем, у кого есть эксперты, но они хотят автоматизировать работу и освободить аналитиков от рутинных задач, чтобы они сосредоточились на более сложных исследовательских проектах.
Predict AutoML мы тоже изначально делали для своих внутренних целей — чтобы автоматизировать работу с моделями внутри наших инструментов. А потом заметили, что это интересно и другим компаниям, и выпустили его на рынок.
Сегодня на рынке много различных продуктов на основе дата-аналитики и машинного обучения. Ваши конкуренты — кто они?
Наши конкуренты — это одновременно и наши партнеры, и заказчики. Это компании, у которых есть большие объемы данных — например, телеком-операторы, банки и ритейлеры. Они собирают, обрабатывают свои данные для своих целей, у них есть свои технологии и экспертиза. А иногда мы вместе работаем над совместными продуктами для третьих сторон.
В каком направлении будет двигаться рынок? Что будет влиять на его развитие?
Сейчас он постоянно меняется, особенно с появлением и развитием языковых моделей. Раньше рост был примерно одинаковым из года в год, а сейчас из-за увеличения возможностей языковых моделей темп роста может значительно увеличиться. Многие компании хотят попробовать новые технологии или сделать пилот. Сейчас очень много экспериментов вокруг большие языковых и мультимодальных моделей. Я думаю, что за 2−3 года языковые они полностью изменят подход к работе с данными и аналитике. Многие вещи, которые мы делаем сейчас, мы будем делать по-другому — быстрее и лучше.
В каких еще технологиях вы видите потенциал?
Я считаю, что очень перспективно развитие технологий конфиденциальных вычислений, в частности федеративное обучение. Это технология, которая позволяет нескольким компаниям совместно обучать модели машинного обучения на объединенном датасете без фактической передачи данных между ними. Это важно, потому, что иногда сложно или долго собирать необходимые датасеты внутри одной компании, а федеративное обучение помогает работать вместе и делиться знаниями безопасно и удобно.
Технически эта идея уже хорошо проработана, есть открытые решения, но пока их сложно использовать — нужны специальные знания и опыт. Не у всех есть возможность быстро запустить такие системы. Еще важная область — автоматизация машинного обучения. В тех компаниях, где уже используются много моделей (например, банки или ритейл), возникает вопрос: как сделать работу с моделями проще и быстрее? Чем больше автоматизации, тем меньше рутины и ручной работы — а значит, люди могут заниматься более важными задачами.
Первый шаг — автоматическое обучение моделей. Второй — автоматическая их доработка: подключение новых источников данных, проверка и улучшение моделей. Третий уровень — это интерфейсы без кода или с минимальным кодированием (Low-Code), такие как наш Predict AutoML. Они помогают сделать машинное обучение доступным не только специалистам по ML, но и другим сотрудникам компании.
Вопрос данных всегда связан с вопросом безопасности. Как найти баланс между тем, чтобы использовать данные и при этом их защищать?
Безопасность — это главный приоритет. Все компании обязательно решают этот вопрос. Тут нет компромиссов: безопасность должна быть обеспечена в любом случае. Но если все данные запереть в сейфе и никому не показывать, то пользы от них почти не будет. Поэтому нужно искать способы, которые позволяют держать данные в безопасности, защищать их от взломов и сохранять анонимность, но при этом использовать их для обучения моделей и получения ценного результата.
Об этом как раз хорошо говорит идея федеративного обучения. Она позволяет находить закономерности в данных, не передавая их напрямую и не раскрывая конфиденциальную информацию. Таким образом, можно получать пользу и сохранять безопасность одновременно.
** Мы понимаем, что автоматизация уже никуда не исчезнет. Говоря о искусственном интеллекте и его роли в разных сферах, скажите, где он уже успешно помогает и автоматизирует работу? И заменит ли ИИ людей полностью?**
«Людей не будет, будет только ИИ» — так не произойдет. Но уже сейчас в некоторых областях ИИ выполняет задачи намного быстрее и эффективнее, чем люди.
Многие профессии сейчас уже трудно представить без языковых моделей или генеративных систем для работы с изображениями, видео и контентом. Они очень помогают, например, в службах поддержки пользователей, продажах, в исследованиях и поисках инсайтов, написанию текстов и генерации изображений. Мы видим применение ИИ не только в маркетинге и продажах, но и во многих внутренних процессах, в обучении и т. д. То, что раньше требовало много усилий для выполнения однотипных задач, теперь можно делегировать моделям.
При этом ИИ не заменит людей, но изменит их роль в бизнес-процессах. Мы теряем часть работы, которую делают алгоритмы, но эти системы настолько хорошо справляются и облегчают нам жизнь, что это открывает новые возможности. В большинстве случаев ИИ помогает человечеству работать эффективнее и повышать производительность.