OpenAI está permitindo que alguns usuários experimentem um novo recurso ChatGPT que usa inteligência artificial para interagir com seu navegador para reservar viagens, comprar mantimentos, encontrar pechinchas e realizar muitas outras tarefas online.
A nova ferramenta, chamada Operador, é um agente de IA. Ele se baseia em modelos de IA treinados em texto e imagens para interpretar comandos e determinar como executá-los usando um navegador da web. A OpenAI afirma ter potencial para automatizar muitas tarefas diárias e tarefas de trabalho.
O Operador da OpenAI segue lançamentos rivais do Google e da Anthropic que demonstraram que a web pode ser usada. Os agentes de IA são amplamente vistos como o próximo passo evolutivo na IA depois dos chatbots, e muitas empresas os têm promovido e lucrado com o hype. Na maioria dos casos, esses recursos são muito limitados e simplesmente utilizam modelos de linguagem para automatizar tarefas que normalmente seriam realizadas em software comum.
“A IA está evoluindo de uma ferramenta que pode responder perguntas para uma que também pode executar fluxos de trabalho complexos de várias etapas e agir em todo o mundo”, disse Peter Welinder, vice-presidente de produtos da OpenAI. “Isso terá um enorme impacto não apenas na produtividade das pessoas, mas também na qualidade do trabalho que serão capazes de realizar”.
A OpenAI reconhece que conceder acesso ao ChatGPT a navegadores da web introduz novos riscos, afirmando que o Operador pode ocasionalmente se envolver em comportamento fraudulento. A empresa afirma que implementou uma série de novas medidas de segurança e planeja expandir a funcionalidade do Operador ao longo do tempo.
Welinder e Yash Kumar, líder de produto e engenharia da OpenAI para Computer using Agent, disseram que o plano é aprender como as pessoas usam a ferramenta. Eles reconheceram que a ferramenta poderia levar a reservas e compras indesejadas, mas acrescentaram que foi feito um grande esforço para fazer perguntas antes de fazer qualquer coisa arriscada. “Isso volta para mim e pede confirmação antes de tomar medidas potencialmente irreversíveis”, disse Kumar.
A OpenAI também lançou hoje um novo “cartão de sistema” descrevendo os problemas que você pode encontrar com os Operadores. Isso inclui a possibilidade de interpretar mal os comandos ou desviar-se dos requisitos do usuário. Abuso do usuário. Ou você pode ser alvo de cibercriminosos.
“Isso também representa desafios de segurança incríveis”, diz Kumar. “Porque o espaço vetorial de ataque e o espaço vetorial de risco aumentam significativamente.”
O Operador estará inicialmente disponível como uma “prévia de pesquisa” para usuários ChatGPT com contas Pro e custará pesados US$ 200 por mês. A empresa afirma que planeja expandir o acesso implantando a ferramenta lentamente, pois inevitavelmente serão cometidos erros ao longo do caminho.
A Operadora demonstrou em diversas demonstrações o potencial da IA para assumir um papel mais ativo como auxiliar da web. Esta ferramenta possui um navegador remoto e uma janela de bate-papo para comunicação com os usuários.
A pedido da WIRED, as operadoras foram solicitadas a reservar viagens de trem da Amtrak de New Haven, Connecticut para Washington, D.C. Acessei o site apropriado, inseri as informações exatas necessárias para visualizar o horário e solicitei mais instruções. Se um usuário estiver conectado a um site da Amtrak ou a um perfil de navegador que tenha informações de cartão de crédito armazenadas, ele poderá reservar uma passagem, embora a operadora tenha sido projetada para pedir permissão primeiro.
Kumar pediu à operadora que reservasse uma mesa no Beretta, um restaurante em São Francisco. O programa visitou o site OpenTable, encontrou um restaurante adequado e verificou a disponibilidade antes de perguntar o que fazer a seguir. A OpenAI afirma ter feito parceria com vários sites populares, incluindo o OpenTable, para garantir que o Operator funcione sem problemas nesses sites.
Esta nova ferramenta é baseada no modelo GPT-4o AI da OpenAI e pode reconhecer navegadores e páginas da web e conversar com o texto que você digita. A ferramenta inclui treinamento adicional desenvolvido para ajudá-lo a entender como realizar tarefas online. A OpenAI também disponibiliza o Computer Use Agent por meio de sua API.