Noticias relacionadas
O bilionário Elon Musk aderiu à teoria do “pico de dados” e destacou que já não há dados humanos suficientes para treinar modelos de inteligência artificial (IA). Ele sugere que o uso de dados sintéticos, gerados pela própria IA, pode ser a solução para superar essa barreira.
Recentemente, especialistas afirmaram que o volume de dados disponíveis para o treinamento de IA atingiu um limite crítico. Essa situação ganhou atenção na esteira da popularização de ferramentas como o ChatGPT, com empresas como Google, Apple e Meta buscando oferecer seus próprios assistentes generativos.
Em declaração ao TechCrunch, Musk revelou que a escassez de dados reais não é um problema recente, mas que já vinha sendo enfrentado desde 2024. Ele reforçou as palavras de Ilya Sutskever, ex-cientista-chefe da OpenAI, que em 2022 chamou atenção para o que definiu como “pico de dados”.
A solução: dados sintéticos
Para Musk, o futuro da IA está na criação de dados gerados por máquinas, os chamados “dados sintéticos”. Empresas como Microsoft, OpenAI, Meta e Anthropic já têm adotado essa abordagem em modelos como Phi-4, Gemma e Claude 3.5 Sonnet. Estima-se que, até 2024, 60% dos dados utilizados para treinamento sejam sintéticos, devido à sua eficiência e menor custo.
No entanto, especialistas alertam para os riscos dessa prática. Dados sintéticos podem amplificar vieses e limitar a criatividade dos modelos, resultando em sistemas que reproduzem os mesmos problemas das informações usadas para treiná-los. Apesar das preocupações, Musk e outras gigantes da tecnologia continuam apostando na solução como um caminho promissor para o avanço da IA.