Начало основного контента

Построение кросс-ID для веб-аналитики

День 2

RU

В своем докладе Артур рассмотрит все стороны построения системы удаленной идентификации пользователей в вебе с учетом современных технических и юридических реальностей.

Мы сохраняем множество транзакционных данных пользователей внутри нашей системы веб-аналитики несмотря на введение ITP 2.x. Расчет и ранжирование метрик первого этапа, которые потом станут фичами модели, можно собрать с учетом cookies-less. Артур расскажет о нескольких библиотеках для расчета фингерпринтов, которые в его команде использовали и используют. Самый важный момент — это последующая векторизация клиентских идентификаторов в Super ID. Это исключительно статистический процесс, который может показывать точность в 99%, а иногда и в 40%. Для проброса данных внутрь модели используется ее развертка как сервис (model deployed as a separate service), но также будет сравнение с вариантами, когда она является встроенной моделью (embedded model) или опубликована как данные (Model published as data). Так как процессы сбора данных, обучения и валидации в задачах реального времени неотделимы друг от друга, Артур расскажет об архитектуре, которая используется для тестирования моделей и переобучении. Несколько технических особенностей архитектуры, такие как распределение обработчиков бэкенда, согласно стране обращений, основаны на применении локальных законов — GDPR и CCPA, и ведут к коллизиям идентификаторам и невозможности собрать их воедино. Закончит спикер парой слов об ошибках использовании k-anonimity в распределенных базах, так как это позволяет делиться обезличенными срезами с партнерами и клиентами.

  • #analitics
  • #cross-device
  • #legal

Спикеры

Приглашенные эксперты