Research insight & big data : vive l'extension du domaine de la recherche !
Chacun le sait, les annonceurs ont désormais à leur disposition une quantité phénoménale de données sur leurs clients et leurs marchés. Quelle place occupent les ‘enquêtes par sondage’ dans cet univers nouveau saturé de données ? en particulier, quel rôle jouent-elles pour améliorer la communication publicitaire et son efficacité, à l’heure du programmatique et de l’optimisation en temps réel ? Des liens sont-ils possibles entre ces deux univers et, si oui, lesquels ?
Pour commencer, il semble utile de rappeler ce qui distingue fondamentalement le monde des études et celui de la data programmatique. L’objet du market research est de produire de la connaissance, afin d’aider les entreprises et les organisations à mieux comprendre les individus, consommateurs, citoyens, salariés. L’objet du programmatique est d’optimiser une action, la distribution automatisée de publicité digitale. D’un côté, la production d’insight, de savoir, pour comprendre. De l’autre, la distribution de messages. D’un côté l’information, de l’autre, l’activation. Pull / Push.
Deux mondes opposés ?
De cette différence initiale dans les buts découle une série de différences dans les moyens.
Représentatif versus massif. La représentativité est à l’origine de l’enquête par sondage, c’est sa raison d’être. Il n’est pas nécessaire d’interroger 100 000 personnes, ni même 10 000 pour savoir si les Français - ou les individus appartenant à un segment de population particulier - préfèrent la publicité A ou B, le produit A ou B, le candidat A ou B. Quelques centaines de répondants suffisent, à condition qu’ils aient été correctement recrutés, autrement dit qu’ils soient représentatifs de la population de référence. A l’inverse, l’activation programmatique, comme la publicité en général, ou le marketing direct, doit s’adresser à l’ensemble de la population de référence. Elle traite des informations élémentaires assez simples (page affichée, temps passé, lien cliqué, … etc) mais en très grande quantité (‘big data’). Idéalement, toute la cible doit être exposée, alors qu’un échantillon seulement de la cible doit être interrogé.
Anonyme vs personnalisé. L’anonymat est une autre pierre angulaire du market research. Les personnes ne sont pas interrogées pour elles-mêmes, mais en tant que ‘représentantes’ d’un groupe plus large. Lors du recrutement, les instituts prennent systématiquement soin de leur préciser que l’information recueillie sera anonymisée, agrégée, et fera uniquement l’objet de traitements statistiques. Cela conditionne non seulement leur participation, mais surtout leur sincérité. Au contraire, le programmatique a besoin de connaitre finement les comportements particuliers de chaque individu et ses coordonnées (nom, adresse, identifiant…) pour pouvoir ensuite leur adresser personnellement des messages (‘le bon message, au bon moment, à la bonne personne’).
Humain vs machine. Les enquêtes s’intéressent aux gens, à leurs désirs et à leurs craintes, à leurs émotions et leurs souvenirs, à leur appréciation et leur opinion. Ce qui se passe « dans leur tête ». Pour le savoir, il n’y a pas d’autres moyens que de les interroger, les inviter à s’exprimer. Le programmatique distribue des messages sur des terminaux (PC, tablette, smartphone) et s’ajuste en fonction des données recueillies. Il mesure ce qui se passe « sur les écrans » ... pour en déduire les comportements probables des individus, leurs centres d’intérêt, leurs intentions. Dans un cas, la personne interrogée déclare qu’elle a, par exemple, l’intention de partir à Berlin ou d’acheter un canapé. Dans l’autre, son intention est déduite de ses fréquentes visites de sites web contenant des informations sur Berlin ou sur des canapés. Dans le langage des sondeurs, la première approche est dite « déclarative », la seconde « passive », automatique. Dans celui des data scientists, la première est « déterministe » ou « avérée » par opposition à la seconde, « probabiliste », ou « modélisée » (la donnée individu est induite par la donnée machine).
Enfin, insight vs real time. La mission d’un institut d’études ne se limite pas à collecter de la donnée. Une part essentielle de sa valeur ajoutée réside évidemment, en aval, dans le traitement et l’analyse de cette donnée par des experts - statisticiens, sociologues, politologues… - dont c’est le métier. Ce travail d’analyse, qui repose sur une connaissance fine des organisations et de leur environnement, prend du temps. Lui seul permet de transformer la donnée brute en insight utile pour le client. La valeur est dans l’insight. Pour le programmatique, la valeur est dans l’instantanéité.
Tout semble ainsi opposer l’enquête au programmatique. D’où vient alors que des liens toujours plus nombreux se tissent aujourd’hui entre ces deux univers ?
Certes, l’enquête est du côté de la connaissance, le programmatique du côté de l’activation. Mais la connaissance produite par le market research est, évidemment, toujours tournée vers l’action. Elle n’a de sens - et de valeur - que si elle est utile à la prise de décision. Elle vise à impacter les marchés, les offres, les business. A l’inverse, la distribution de messages requiert une compréhension préalable de ses destinataires, de leurs goûts, de leurs intentions… L’un et l’autre se complètent. Il en découle deux grands types d’interactions, selon que le programmatique précède l’enquête (‘data to research’) ou la suit (‘research to data’).
Data to research : enrichir, compléter, valider
Les grands instituts de sondage disposent d’access panels, dont les membres sont pré-qualifiés. Même si cette ressource est centrale, elle présente des limites, à la fois quant au degré de qualification des individus, et à leur nombre.
Pour compenser ce manque et accroitre leurs capacités, les sociétés d’études ont noué des partenariats avec des ‘data companies’ comme, par exemple, Ipsos et Weborama en France. En taguant le questionnaire de ses enquêtes pour détecter la présence de cookie, Ipsos enrichit la qualification des répondants avec l’ensemble des informations collectées par Weborama sur leurs usages digitaux. La création par Weborama d’une typologie décrivant finement les centres d’intérêt des internautes (200 clusters : bijoux, cuisine, finance, football, jardinage, parc d’attraction, psychologie, …) à partir de leurs usages (méthode probabiliste) permet ainsi d’accroitre très significativement l’information disponible, et donc les angles d’analyse.
De la même manière, l’envoi de messages de recrutement ciblés (adserving) auprès d’internautes caractérisés par leurs centres d’intérêt (par exemple : le luxe, les produits pour nouveaux nés, ou la ville de Nice…) permet d’accéder à des segments de populations trop rares dans les access panels (typiquement : les clientèles du luxe, les jeunes mères, les habitants de telle ou telle ville…). Dans ce cas, la data élargit massivement les bases de recrutement.
La mesure de l’efficacité publicitaire sur la marque (‘brandlift’) est un autre exemple d’application « data to research ». A la suite d’une campagne digitale, un message est ré-adressé aux individus exposés (‘retargeting’), les invitant à répondre à une enquête de type post-test sur leur perception de la création et leur image de la marque. La mesure automatique de l’exposition (et de ses effets comportementaux : clic, visite, éventuellement achat…) est ainsi complétée par une mesure déclarative des effets plus durables sur la relation à la marque.
Pour valider la pertinence d’un segment de data, il est également possible de constituer des échantillons par segment, puis d’adresser un questionnaire à chacun, et vérifier la cohérence entre les réponses déclarées et les caractéristiques induites par leur usage digital.
Segments de data pour enrichir la donnée d’enquête ou se prêter à une validation par enquête, distribution de publicités pour élargir les bases de recrutement ou se combiner à une mesure des effets sur la marque, les applications ‘data to research’ sont donc nombreuses et variées.
Research to data : cibler puis activer
L’objectif d’une enquête est souvent de caractériser un segment de population particulièrement sensible, réceptif, favorable… à une offre commerciale, publicitaire ou politique. Cette information de grande valeur peut désormais être injectée dans les mégabases de données. Il suffit de taguer les questionnaires pour identifier les individus également présents dans une mégabase, puis de décrire leur profil web (centres d’intérêt). L’opération suivante consiste à trouver, au sein de la mégabase, des jumeaux statistiques (‘look alike’) pour constituer un segment activable, et lui adresser un message. Avec le ‘data expanding’ (réalisé par Ipsos avec, par exemple, Weborama en France ou Acxiom aux Etats-Unis), la volumétrie change d’échelle : de l’enquête (quelques centaines d’individus, ‘cœur de cible’) au programmatique : plusieurs centaines de milliers, voire des millions.
Sauf exception (en particulier l’EFM, Entreprise Feedback Management), les livrables d’un institut d’études sont souvent des documents statiques (rapports, tableaux de bord…), déconnectés des bases relationnelles, opérationnelles, de leurs clients. Cette possibilité nouvelle de déverser une information à haute valeur dans les mégabases rend désormais les livrables activables. Il s’agit d’une transformation capitale du métier. Le résultat d’une enquête, autrefois destiné à ne produire que des indicateurs statistiques fixés sur des slides ou des tableurs, alimente désormais des bases géantes, vivantes, agissantes, en interaction continue avec les gens.
Le schéma des liens entre research et data peut évidemment se complexifier. Par exemple, ‘data to research to data’ : recrutement par adserving, puis enquête, puis data expanding. Ou bien ‘research to data to research’ : enquête et identification de cible ; puis data expanding et adserving ; puis mesure du brand lift, etc... Sous réserve, évidemment, de recueillir le consentement éclairé des individus (Rgpd), la connexion et la déduplication régulières, voire continues, des bases d’enquête et des bases programmatiques génèrent des flux d’enrichissement et de validation, de ciblage et d’activation eux-mêmes continus. Ces deux mondes qui paraissaient étrangers l’un à l’autre se nourrissent alors mutuellement.
Si la vocation et la raison d’être du market research - interroger les gens pour les comprendre et restituer leur parole - reste bien sûr essentielle, cette liaison nouvelle avec la data programmatique lui ouvre un espace de développement vaste et tout à fait inédit. Vive l’extension du domaine de la recherche !