De kracht van producttesten met synthetische data
Synthetische data revolutioneert industrieën van gezondheidszorg tot financiële diensten tot de auto-industrie, door simulaties en data-augmentatie mogelijk te maken. Bij Ipsos geloven we dat synthetische data gloednieuwe mogelijkheden biedt voor marktonderzoek, vooral op het gebied van producttesten. Veel bedrijven blijven echter onzeker over de kwaliteit van synthetische data of hoe deze te evalueren.
In dit Ipsos Views-document geven onze experts aanbevelingen voor het genereren en evalueren van hoogwaardige synthetische data en onderzoeken ze hoe synthetische data specifiek kan worden toegepast op producttesten.
Genereren en evalueren van synthetische data
Om synthetische data te genereren die effectief echte data nabootsen, moet een kunstmatige intelligentie (AI)-model eerst getraind worden op relevante, echte data. Zoals besproken in ons eerste document in de Humanizing AI-serie, zijn AI's simpelweg algoritmen; ze hebben geen eigen intelligentie totdat ze getraind zijn. Het is door te leren van trainingsdata dat AI's de intelligentie verwerven die we ermee associëren.
Het evaluatieproces is ook eenvoudig. Synthetische numerieke data moet ten minste echte data weerspiegelen op veelvoorkomende statistische maten. Hoe dichter synthetische data bij menselijke data komt, hoe minder risico we nemen bij het gebruik ervan, maar er is altijd enig risico omdat synthetische data nooit op elk aspect perfect echte data kan nabootsen.
Benaderingen voor het genereren van synthetische data vallen in twee categorieën: LLMs (Large Language Models) en non-LLMs, onderscheiden door hun tekstuele en numerieke aard, respectievelijk. We verkennen beide benaderingen in dit document.
De productervaring is inherent menselijk
Hoe mensen reageren op producten, of het leven in het algemeen, wordt niet alleen in de hersenen vastgelegd als feitelijke of semantische kennis; onze lichamen en zintuiglijke ervaringen spelen ook een belangrijke rol.
Dit document presenteert de bevindingen van onze twee onderzoekslijnen die zijn uitgevoerd om het minimum aantal menselijke respondenten vast te stellen dat nodig is om producten te testen naast synthetische data om levensvatbare resultaten te garanderen. Om de belangrijkste bevindingen van het onderzoek te ontdekken, kunt u ook onze handige infographic downloaden.
"Als een AI niet is getraind op echte data die relevant is voor uw bedrijf, zal het niet in staat zijn synthetische data te genereren die dezelfde eigenschappen heeft als echte data. Zo simpel is het!"
Belangrijkste inzichten:
- Synthetische data zal nooit menselijk zijn.
AI alleen kan nooit onze productervaringen weerspiegelen, die de vijf zintuigen, emoties, verwachtingen en context combineren. Daarom is ons doel om menselijke input aan te vullen met synthetische data, niet om deze te vervangen. - Nauwkeurigheid hangt af van de trainingsdata.
De waarde van synthetische data is niet binair (goed of slecht); de nauwkeurigheid van synthetische data hangt van veel factoren af, waaronder de verschillen in de data die we proberen te repliceren en de representativiteit van de echte data waar we een AI op trainen. Het gebruik van synthetische data moet strategisch zijn, rekening houdend met de bijbehorende risico's en voordelen. - Wanneer nauwkeurig, kan het producttesten aandrijven.
Synthetische data kan de flexibiliteit van marktonderzoek vergroten, waardoor het ideaal is voor middelenintensieve gebieden zoals producttesten - kostenbesparend, tijdsbesparend, met extra voordelen voor gedetailleerde subgroepanalyses.