A OpenAI lançará um assistente de voz altamente antecipado para ChatGPT com um número limitado de usuários, após adiar o lançamento para resolver possíveis problemas de segurança. A startup de inteligência artificial disse que disponibilizará o recurso de voz para um pequeno grupo de clientes pagantes do ChatGPT Plus a partir da próxima terça-feira.
O produto oferecerá quatro vozes predefinidas, mas não será capaz de imitar a fala de outras pessoas, segundo a empresa. A OpenAI também adicionou novos filtros para garantir que o software possa identificar e recusar algumas solicitações de geração de música ou outros tipos de áudio protegidos por direitos autorais.
A opção de voz foi um dos destaques do evento de lançamento da empresa, em maio, do GPT-4o, versão atualizada do modelo GPT-4 e mais eficiente no tratamento de texto, áudio e imagens em tempo real.
A startup havia introduzido uma opção mais limitada para o ChatGPT conversar com os usuários no ano passado, mas o novo recurso promete ser mais rápido e combinado com poderosos recursos de reconhecimento de imagem para transformar o chatbot em um parceiro de conversa muito mais útil e dinâmico.
A OpenAI havia dito anteriormente que pretendia lançar o assistente de voz para um pequeno grupo de assinantes pagos do ChatGPT Plus no final de junho, mas decidiu que precisava de mais um mês para atingir o padrão de lançamento.
A empresa disse que está trabalhando na capacidade do software de identificar e recusar-se a responder a certos tipos de conteúdo e garantir que possa processar com eficácia as solicitações de milhões de usuários.
Em comunicado oficial ontem, a OpenAI disse que, ao implementar o recurso gradualmente, será capaz de monitorar de perto o uso e melhorar a capacidade e a segurança do modelo com base no feedback do mundo real.
Além de reiterar seu plano de disponibilizar o recurso de voz para todos os assinantes pagos do ChatGPT Plus no outono do Hemisfério Norte, e mencionar que continua trabalhando nos recursos de vídeo e compartilhamento de tela demonstrados durante o evento de maio. Esses recursos ainda não têm data de lançamento definida.
Como resultado, o recurso de voz terá uma lista de recursos mais limitada a princípio. Por exemplo, o chatbot não será capaz de acessar um recurso de visão computacional que lhe permitiria oferecer feedback falado sobre os movimentos de dança de uma pessoa simplesmente usando a câmera do smartphone, por exemplo.
Veja também
Petróleo
Petróleo ao preço mais baixo em quase dois meses, afetado pela China e Médio Oriente
Apagão cibernético
Dias após apagão cibernético, Microsoft apresenta falhas em plataforma de computação em nuvem
empréstimo itaú pessoal
divida banco pan
refinanciamento de empréstimo consignado bradesco
taxas de juros inss
empréstimo de valor baixo
simulador de empréstimo consignado banco do brasil
quitar emprestimo fgts banco pan