Chatbots online como ChatGPT da OpenAI e Gemini do Google às vezes enfrentam problemas matemáticos simples. O código de computador que eles geram geralmente apresenta erros e está incompleto. De vez em quando, eles até inventam coisas.
Na quinta-feira, a OpenAI revelou uma nova versão do ChatGPT que poderia amenizar essas falhas. A empresa disse que o chatbot, alimentado por uma nova tecnologia de inteligência artificial chamada OpenAI o1, poderia “raciocinar” através de tarefas que envolvem matemática, codificação e ciências.
“Com modelos anteriores como o ChatGPT, você faz uma pergunta e eles começam a responder imediatamente”, disse Jakub Pachocki, cientista-chefe da OpenAI. “Este modelo pode levar o seu tempo. Ele pode pensar sobre o problema – em inglês – e tentar decompô-lo e procurar ângulos em um esforço para fornecer a melhor resposta.”
Em uma demonstração para o The New York Times, o Dr. Pachocki e Szymon Sidor, pesquisador técnico da OpenAI, mostraram o chatbot resolvendo um acróstico, um tipo de quebra-cabeça de palavras que é significativamente mais complexo do que palavras cruzadas normais. O chatbot também respondeu a uma pergunta de nível de doutorado em química e diagnosticou uma doença com base em um relatório detalhado dos sintomas e do histórico do paciente.
A nova tecnologia faz parte de um esforço mais amplo para construir uma IA que possa raciocinar através de tarefas complexas. Empresas como Google e Meta estão desenvolvendo tecnologias semelhantes, enquanto a Microsoft e sua subsidiária GitHub trabalham para incorporar o novo sistema da OpenAI em seus produtos.
O objetivo é criar sistemas que possam resolver problemas de forma cuidadosa e lógica através de uma série de etapas distintas, cada uma baseada na anterior, semelhante ao raciocínio humano. Estas tecnologias podem ser particularmente úteis para programadores de computador que utilizam sistemas de IA para escrever código. Eles também poderiam melhorar os tutores automatizados de matemática e outras disciplinas.
A OpenAI disse que sua nova tecnologia também poderia ajudar os físicos a gerar fórmulas matemáticas complicadas e auxiliar os pesquisadores de saúde em seus experimentos.
Com a estreia do ChatGPT no final de 2022, a OpenAI mostrou que as máquinas poderiam lidar mais com solicitações como pessoas, responder perguntas, escrever trabalhos acadêmicos e até gerar código de computador. Mas as respostas às vezes eram falhas.
O ChatGPT aprendeu suas habilidades analisando grandes quantidades de texto retirado da Internet, incluindo artigos da Wikipédia, livros e registros de bate-papo. Ao identificar padrões ao longo deste texto, ele aprendeu a gerar texto por conta própria.
Como a internet está cheia de informações falsas, a tecnologia aprendeu a repetir as mesmas inverdades. Às vezes ela inventava coisas.
Dr. Pachocki, Sr. Sidor e seus colegas tentaram reduzir essas falhas. Eles construíram o novo sistema da OpenAI usando o que é chamado de aprendizagem por reforço. Através deste processo – que pode durar semanas ou meses – um sistema pode aprender o comportamento através de extensos testes e erros.
Ao trabalhar em vários problemas matemáticos, por exemplo, ele pode aprender quais métodos levam à resposta correta e quais não. Se ele repetir esse processo com um número enorme de problemas, poderá identificar padrões. Mas o sistema não pode necessariamente raciocinar como um ser humano. E você ainda pode cometer erros e “alucinar”.
“Não será perfeito”, disse Sidor. “Mas você pode confiar que ele trabalhará mais e terá muito mais chances de produzir a resposta correta.”
O acesso à nova tecnologia começou quinta-feira para consumidores e empresas que assinam os serviços ChatGPT Plus e ChatGPT Teams da empresa. A empresa também está vendendo a tecnologia para desenvolvedores de software e empresas que estão construindo seus próprios aplicativos de IA.
A OpenAI disse que a nova tecnologia teve um desempenho melhor do que as tecnologias anteriores em alguns testes padronizados. No exame de qualificação para a Olimpíada Internacional de Matemática, ou IMO – a principal competição de matemática para estudantes do ensino médio – sua tecnologia anterior obteve 13%. OpenAI o1, segundo a empresa, obteve 83%.
Ainda assim, os testes padronizados nem sempre são uma boa medida de como as tecnologias se comportarão em situações do mundo real e, embora o sistema possa ser bom em questões de teste de matemática, ainda pode ter dificuldades para ensinar matemática.
“Há uma diferença entre resolver problemas e oferecer assistência”, disse Angela Fan, cientista pesquisadora da Meta. “Novos modelos que raciocinam podem resolver problemas. Mas isso é muito diferente de ajudar alguém com o dever de casa.”
Veja também
AVIAÇÃO
Trabalhadores da Boeing votam a favor da greve, após rejeitarem acordo oferecido pela empresa
ESTUDAR
Igualdade de gênero poderia aumentar o PIB global em até 11%, injetando R$ 60 trilhões na economia
empréstimo itaú pessoal
divida banco pan
refinanciamento de empréstimo consignado bradesco
taxas de juros inss
empréstimo de valor baixo
simulador de empréstimo consignado banco do brasil
quitar emprestimo fgts banco pan