Die Leistungsfähigkeit von Produkttests mit synthetischen Daten
Synthetische Daten revolutionieren Branchen vom Gesundheitswesen über Finanzdienstleistungen bis hin zur Automobilindustrie, indem sie Simulationen und Datenerweiterung ermöglichen. Wir bei Ipsos glauben, dass synthetische Daten völlig neue Möglichkeiten für die Marktforschung eröffnen, insbesondere im Bereich der Produkttests. Viele Unternehmen sind sich jedoch hinsichtlich der Qualität synthetischer Daten oder ihrer Bewertung unsicher.
In diesem Ipsos Views-Paper geben unsere Experten Empfehlungen zur Generierung und Auswertung hochwertiger synthetischer Daten und untersuchen, wie synthetische Daten speziell für Produkttests eingesetzt werden können.
Generierung und Auswertung synthetischer Daten
Um synthetische Daten zu generieren , die reale Daten effektiv nachahmen, muss ein KI-Modell zunächst auf relevanten, realen Daten trainiert werden. Wie in unserem ersten Beitrag der Reihe Humanizing AI erläutert, sind KIs einfach Algorithmen; sie besitzen keine eigene Intelligenz, bis sie trainiert werden. Durch das Lernen anhand von Trainingsdaten erwerben KIs die Intelligenz, die wir mit ihnen assoziieren.
Auch der Bewertungsprozess ist unkompliziert. Synthetische numerische Daten sollten zumindest reale Daten in Bezug auf gängige statistische Maße widerspiegeln. Je näher synthetische Daten an menschlichen Daten sind, desto weniger Risiko gehen wir bei ihrer Verwendung ein. Natürlich bleibt ein Restrisiko, da es nie eine perfekte Nachahmung realer Daten geben kann.
Ansätze zur Generierung synthetischer Daten lassen sich in zwei Kategorien einteilen: LLMs (Large Language Models) und Nicht-LLMs, die sich durch ihren textuellen bzw. numerischen Charakter unterscheiden. In diesem Artikel untersuchen wir beide Ansätze.
Das Produkterlebnis ist von Natur aus menschlich
Wie Menschen auf Produkte oder das Leben im Allgemeinen reagieren, wird nicht nur in Form von Fakten- oder semantischem Wissen im Gehirn erfasst; auch unser Körper und unsere Sinneserfahrungen spielen eine bedeutende Rolle.
In diesem Dokument werden die Ergebnisse unserer beiden Forschungsstränge vorgestellt, deren Ziel es war, die Mindestanzahl menschlicher Testpersonen zu ermitteln, die zum Testen von Produkten mit synthetischen Daten erforderlich ist, um brauchbare Ergebnisse zu erzielen. Unsere Infografik (hier zum Download) stellt die wichtigsten Ergebnisse anschaulich dar.

Wenn eine KI nicht anhand von realen Daten trainiert wurde, die für Ihr Unternehmen relevant sind, kann sie keine synthetischen Daten generieren, die dieselben Eigenschaften wie reale Daten aufweisen. So einfach ist das!
Key takeaways:
1. Synthetische Daten werden niemals menschlich sein.
KI allein kann niemals unsere Produkterfahrungen widerspiegeln, die die fünf Sinne, Emotionen, Erwartungen und Kontext kombinieren. Daher ist es unser Ziel, den menschlichen Input mit synthetischen Daten zu ergänzen, nicht ihn zu ersetzen.
2. Die Genauigkeit hängt von den Trainingsdaten ab.
Der Wert synthetischer Daten ist nicht binär (gut oder schlecht); die Genauigkeit synthetischer Daten hängt von vielen Faktoren ab, einschließlich der Unterschiede in den Daten, die wir replizieren möchten, und der Repräsentativität der realen Daten, mit denen wir eine KI trainieren, damit sie lernt. Die Verwendung synthetischer Daten sollte strategisch erfolgen und die damit verbundenen Risiken und Vorteile berücksichtigen.
3. Bei hoher Genauigkeit können Produkttests durchgeführt werden.
Synthetische Daten können die Agilität der Marktforschung steigern und sind daher ideal für ressourcenintensive Bereiche wie Produkttests – sie senken Kosten, sparen Zeit und bieten zusätzliche Vorteile für detaillierte Subgruppenanalysen.