Data Science for Audience Measurement
Ключові послуги, що пропонуються для вимірювання аудиторії, охоплюють data ascription (заповнення прогалин у наборах даних), data integration (об’єднання декількох баз даних), моделювання аудиторії, просунуті методи обробки даних і спеціальну аналітику.
Респонденти все частіше неохоче відповідають на довгі анкети. Проте тиск щодо збору даних продовжується. Один зі способів розв’язання цієї проблеми полягає у виборі кількох коротших опитувань, кожне з яких спрямоване на збір певної інформації, яка є унікальною для кожного опитування. Унікальні дані, зібрані під час опитування, можна «приписати» респондентам, яким не ставили ці питання, але їм ставили інші спільні запитання (наприклад, демографічні, де вони живуть).
Інтеграція даних або ф’южн даних відбувається, коли об’єднуються два або більше окремих дослідження, знову ж таки з використанням спільних даних, зібраних під час усіх досліджень, як спосіб «зіставити» учасників одного з іншим— наприклад, ми можемо збирати дані читачів в одному дослідженні та онлайн-активності в іншому, а потім перенести онлайн дані активності від одного учасника дослідження до відповідного учасника (однакової статі, віку, регіону тощо) з іншого дослідження. Людині фактично не доведеться відповідати на питання про детальну поведінку в інтернеті.
Ми використовуємо моделювання аудиторії у випадках, коли дані опитування не можуть бути використані окремо. Наприклад, ми можемо моделювати читацьку аудиторію газет з низьким тиражом, використовуючи комбінацію даних про тираж, дані перепису та інформацію про саме видання. Перегляд ТБ членами сім’ї може бути змодельованим з використанням детальних даних, отриманих з їхньої телевізійної приставки або інтернет-маршрутизатора (незалежно від того, увімкнено чи вимкнено телевізор, налаштований канал тощо), та іншої інформації про склад сім’ї.