O poder dos testes de produto com dados sintéticos

Segunda parta da série Humanizando a Inteligência Artificial.

Ipsos Views: O poder dos testes de produtos com dados sintéticos - Humanizando a IA, parte 2Os dados sintéticos estão a revolucionar setores como a saúde, os serviços financeiros e a indústria automóvel, ao possibilitarem simulações e a ampliação de dados. Na Ipsos Apeme, acreditamos que este tipo de dados abrem novas possibilidades para a pesquisa de mercado, especialmente na área dos testes de produto. No entanto, muitas empresas ainda têm dúvidas sobre a qualidade dos dados sintéticos ou sobre como avaliá-los.

Neste artigo do Ipsos Views , os nossos especialistas apresentam recomendações para gerar e avaliar dados sintéticos de alta qualidade e explicam de que forma estes dados podem ser aplicados especificamente aos testes de produto.

Gerar e avaliar dados sintéticos

Para gerar dados sintéticos que efetivamente emulem dados do mundo real, é necessário primeiro treinar um modelo de inteligência artificial (IA) com dados reais relevantes. Como discutido no nosso primeiro documento da série Humanizar a IA, as IAs são simplesmente algoritmos; não possuem inteligência própria até serem treinadas. É através da aprendizagem a partir dos dados de treino que as IAs adquirem a inteligência que lhes atribuímos.

O processo de avaliação também é simples. Os dados numéricos sintéticos devem, no mínimo, refletir os dados reais em medidas estatísticas comuns. Quanto mais próximos os dados sintéticos estiverem dos dados humanos, menor será o risco associado ao seu uso, mas há sempre algum risco, pois os dados sintéticos nunca poderão imitar perfeitamente os dados do mundo real em todos os aspetos.

As abordagens para gerar dados sintéticos dividem-se em duas categorias: LLMs (Modelos de Linguagem de Grande Escala) e não-LLMs, distinguidas pela sua natureza textual e numérica, respetivamente. Exploramos ambas as abordagens neste artigo.

A experiência do produto é inerentemente humana

O modo como os seres humanos reagem aos produtos, ou à vida em geral, não é armazenada apenas no cérebro como conhecimento factual ou semântico; os nossos corpos e as experiências sensoriais também desempenham um papel significativo.

Este artigo apresenta os resultados de duas vertentes de pesquisa realizadas com o objetivo de determinar o número mínimo de participantes humanos necessários para testar produtos juntamente com dados sintéticos, a fim de garantir resultados viáveis. Para descobrir as principais conclusões da pesquisa, pode também descarregar o infográfico.

Principais conclusões

1. Dados sintéticos não são equivalentes aos provenientes de humanos
A IA sozinha nunca conseguirá reproduzir as nossas experiências com um produto, que combinam os cinco sentidos, emoções, expetativas e contexto. Portanto, o nosso objetivo é complementar a contribuição humana com dados sintéticos, e não substituí-la.

2. A precisão depende dos dados de treino
O valor dos dados sintéticos não é binário (bom ou mau); a precisão dos dados sintéticos depende de muitos fatores, incluindo as diferenças nos dados que estamos a tentar replicar e a representatividade dos dados do mundo real a partir dos quais estamos a treinar uma IA. O uso de dados sintéticos deve ser estratégico, considerando os riscos e benefícios associados.

3. Os dados sintéticos podem potenciar os testes de produto
Os dados sintéticos podem aumentar a agilidade da pesquisa de mercado. São ideais para áreas que exigem muitos recursos, como os testes de produto, reduzindo custos, poupando tempo e com benefícios adicionais para análises detalhadas de subgrupos.