O poder do teste de produtos com dados sintéticos
Dados sintéticos estão revolucionando setores como saúde, serviços financeiros e automotivo, permitindo simulações e ampliação de dados. Na Ipsos, acreditamos que dados sintéticos abrem novas possibilidades para pesquisa de mercado, especialmente na área de testes de produtos. No entanto, muitas empresas permanecem incertas sobre a qualidade dos dados sintéticos ou como avaliá-los.
Neste artigo do Ipsos Views, nossos especialistas fornecem recomendações para gerar e avaliar dados sintéticos de alta qualidade e exploram como os dados sintéticos podem ser aplicados especificamente a testes de produtos.
Gerando e avaliando dados sintéticos
Para gerar dados sintéticos que emitem efetivamente dados do mundo real, um modelo de inteligência artificial (IA) deve primeiro ser treinado com dados relevantes do mundo real. Conforme discutido em nosso primeiro artigo da série Humanizando a IA, IAs são simplesmente algoritmos; elas não têm inteligência própria até serem treinadas. É por meio do aprendizado com os dados de treinamento que as IAs adquirem a inteligência que associamos a elas.
O processo de avaliação também é simples. Dados numéricos sintéticos devem, no mínimo, espelhar dados do mundo real sobre medidas estatísticas comuns. Quanto mais próximos os dados sintéticos estiverem dos dados humanos, menor será o risco que assumimos ao utilizá-los, mas sempre há algum risco, pois os dados sintéticos nunca conseguem imitar perfeitamente os dados do mundo real em todos os aspectos.
As abordagens para a geração de dados sintéticos se dividem em duas categorias: LLMs (Large Language Models) e não LLMs, que se distinguem por sua natureza textual e numérica, respectivamente. Exploramos ambas as abordagens neste artigo.
A experiência com o produto é inerentemente humana
A forma como os humanos reagem aos produtos, ou à vida em geral, não é capturada apenas pelo cérebro como conhecimento factual ou semântico; nossos corpos e experiências sensoriais também desempenham um papel significativo.
Este artigo apresenta os resultados de nossas duas linhas de pesquisa, realizadas com o objetivo de estabelecer o número mínimo de entrevistados humanos necessários para testar produtos juntamente com dados sintéticos, a fim de garantir resultados viáveis.
Principais conclusões:
1. Dados sintéticos nunca serão humanos.
A IA sozinha nunca poderá reproduzir nossas experiências com o produto, que combinam os cinco sentidos, emoções, expectativas e contexto. Portanto, nosso objetivo é complementar a contribuição humana com dados sintéticos, não substituí-la.
2. A precisão depende dos dados de treinamento.
O valor dos dados sintéticos não é binário (bom ou ruim); a precisão dos dados sintéticos depende de muitos fatores, incluindo as diferenças nos dados que estamos tentando replicar e a representatividade dos dados do mundo real com os quais estamos treinando uma IA para aprender. O uso de dados sintéticos deve ser estratégico, considerando os riscos e benefícios associados.
3. Quando precisos, podem impulsionar os testes de produtos.
Dados sintéticos podem aumentar a agilidade da pesquisa de mercado, tornando-a ideal para áreas que exigem muitos recursos, como testes de produtos, reduzindo custos, economizando tempo e com benefícios adicionais para análises detalhadas de subgrupos.