METHODE > Hybridation et fusion de données
L’hybridation et la fusion sont des techniques visant à rapprocher plusieurs sources d’information de nature et de niveaux différents, puis de les combiner pour en créer une troisième plus riche. Dans une fusion, deux ou plusieurs sources de données sont intégrées physiquement dans une base de données unique qui rassemble les enregistrements des sources.
L’hybridation est un rapprochement d’information, et non plus une intégration physique des enregistrements. Cette dernière approche est plus installée dans le monde des enquêtes, grâce aux techniques utilisant l’information auxiliaire (méthodes de calage, estimateur par le ratio, la régression, …)
Les bénéfices recherchés par ces opérations sont de deux natures. Sur le plan « méthodologique », elles permettent une meilleure couverture de la cible et une diminution des biais en mixant les modes ou les bases de sondage, une meilleure précision des mesures en utilisant des données de calage ou en recoupant plusieurs sources de données. Quand l’hybridation ou la fusion permet la mise en commun de plusieurs dispositifs auparavant séparés, les avantages sont aussi d’ordre « marché » : optimisation budgétaire, simplification de la communication, meilleure visibilité, puissance renforcée, … Les avantages sont certains, les limites aussi : il faut les chercher dans la qualité des sources d’information auxiliaires, les biais de sélection ou de mesure, la validité des modèles de rapprochement, la définition des périmètres et les caractéristiques des populations rapprochées.
Ipsos MediaCT a exposé ses convictions lors d’une récente table ronde du SEMO (Salon des Etudes Marketing, Médias et Opinion), animée par Thierry Amar (Offremedia).