Top.Mail.Ru

Как безопасно заработать на своих данных и получить пользу от чужих

Разбираемся, что ограничивает бизнес в использовании информации других игроков, почему  компании не могут делиться своими данными и как уберизация этого рынка поможет решить обе проблемы.

Почему не все делают деньги на данных?

Возможность зарабатывать на big data уже давно не вызывает вопросов.

Страховые компании оценивают с их помощью риски клиентов

Банки принимают решение о выдаче кредитов

Ритейлеры расставляют товары на полках и предлагают скидки

Для интернет-компаний данные — вообще главный источник выручки. Они таргетируют рекламу на основе поведения пользователей в сети, и это приносит им большие деньги.

На онлайн-рекламу приходится более 80% выручки Google и чуть меньше половины — у «Яндекса».

При этом данные большинства компаний ограничены их сферой деятельности и не дают составить более-менее полный портрет потребителя. Ритейлеры, например, знают, какие продукты покупают клиенты, интернет-компании — чем они интересуются, банки — сколько и на что они тратят, операторы связи — где они бывают. Вместе эти данные могут создать объёмную картину и реалистичное представление о клиенте, но доступа ко всем этим источникам одновременно нет ни у кого.

Партнёрства с препятствиями

В последние годы бизнес стремится расширять периметр своих источников данных. Растёт роль сетевой экономики, интегрированных предложений. По оценке McKinsey, доля компаний, вступающих в партнёрства на основе совместного доступа к информации, ещё в 2017—2019 годах выросла вдвое, до 40%. Причём данные объединяют даже конкуренты. Это открывает перед ними большие перспективы: можно получать более достоверную аналитику, создавать совместные продукты и сервисы.

Несмотря на очевидные выгоды от объединения, есть много сдерживающих факторов. Партнёрам надо договориться между собой, чтобы все стороны были уверены в безопасности своих данных. Компания может потерять конкурентное преимущество, если кто-то на стороне партнёра вдруг передаст их конкурентам — намеренно или случайно. Процесс согласований и юридических оценок может занять много месяцев и обернуться большими расходами. В начале пандемии с этим столкнулись IT-компании, которые взялись разрабатывать экспресс-системы диагностики COVID-19 на основе искусственного интеллекта. Медицинские организации не имели права передавать им КТ-снимки пациентов, которые были нужны для машинного анализа.

Компаниям трудно объединять свои данные. Чтобы организовать процесс, нужно преодолеть слишком много барьеров — юридических и технологических. Сложнее всего договориться с партнёром о безопасном использовании данных и соблюсти все требования законодательства. Компании всё равно находят способы для объединения — покупают дорогостоящее ПО и выверяют каждый шаг с юристами, — однако весь процесс занимает гораздо больше сил и денег, чем им хотелось бы.

Данные без границ

Запрос на новые технологии, которые бы снимали эти трудности и облегчали партнёрства для совместной работы с данными, сформировался на рынке ещё несколько лет назад. На сегодняшний день ведущие IT-компании успели на него ответить: появились как аппаратные, так и программные решения. Одна из таких технологий — совместные конфиденциальные вычисления. Она позволяет бизнесу совместно использовать данные, при этом ни одна из сторон не открывает прямой доступ к данным партнёру. Например, несколько компаний хотят выяснить объём общего рынка, но не хотят раскрывать свою выручку. По специальному протоколу их финансовые результаты шифруются и обрабатываются, но ни одна из сторон не получает изначальных входных данных — только общую сумму.

КАК ЭТО РАБОТАЕТ НА ПАЛЬЦАХ

Допустим, компании A, B и C хотят выяснить среднюю выручку на рынке. Скажем, они заработали по 10, 15 и 20 млн рублей, но не хотят делиться своими финансовыми результатами с конкурентами. Каждое из этих чисел они представляют как сумму из двух (например, 9 + 1 = 10, 7 + 8 = 15 или 14 + 6 = 20) и передают партнерам не свою выручку, а только одну часть суммы, оставляя вторую — ключ — у себя. Когда так сделают все три партнера, каждый из них складывает свои числа и делится суммой с остальными. В результате все узнают сумму и среднее значение, но ни один из партнеров не раскрывает своих данных.

То же решение действует и для других случаев совместных вычислений, в том числе самых чувствительных — с персональными данными пользователей. Но если партнёры хотят построить вокруг них совместную работу, имеет смысл делиться не данными, а моделями. Принцип такой: каждый из участников партнёрства сначала обучает модель на своих данных и только потом передаёт результат в совместное пользование. Этот метод — федеративное обучение — несколько лет назад впервые применила компания Google. Она делала сервис для распознавания слов по первым буквам и обучала модели на тысячах пользовательских устройств. Каждый владелец смартфона внёс свой вклад в общее дело, но доступа к личной переписке никому не открывал.

По этому же принципу компании могут организовать совместную работу с данными. Например, ритейлер построит совместный сервис с федеральной сетью фастфуда, а банк безопасно использует в своей скоринг-модели данные интернет-провайдера.

Но, для того чтобы применять технологии федеративного обучения, нужна инфраструктура, доступная только крупным игрокам. Создавать всё это с нуля долго и дорого, а в условиях дефицита технологического оборудования — практически невозможно.

У многих компаний таких инструментов нет, но есть ценные для рынка данные и желание их использовать, поэтому на рынке возникают новые перспективные бизнес-модели. Например, одна из них предполагает уберизацию обмена данными, когда всю необходимую инфраструктуру и безопасные условия обеспечивает третья сторона — платформа для обмена данными и моделями, понятная, как соцсеть.

Для небольших компаний это возможность монетизировать свои данные, получая плату в зависимости от их объёма и востребованности. Они смогут узнать больше о своей аудитории по данным от множества других партнёров платформы. Для крупного бизнеса — это возможность делегировать часть сложных задач и разрабатывать совместные продукты и сервисы на основе своих и чужих данных. Например, локальная сеть пиццерий при помощи такой платформы выяснит что-то новое о предпочтениях своих покупателей по данным транзакций в продуктовых супермаркетах, а банк увеличит точность своей скоринг-модели при помощи данных сотового оператора.

Именно такой сервис для обмена данными мы сейчас готовимся представить рынку

Платформа обмена данными

Это платформа, которая объединит интернет-провайдеров, банки, телеком-сервисы, операторов фискальных данных и локальный бизнес — от салона красоты до микрофинансовой организации. Следите за обновлениями или подпишитесь на наши новости, чтобы узнать обо всём первыми.

Узнать больше

© 2024 Platforma
Skolkovo
,