“Mariner é a nossa exploração de como reimaginar interfaces de usuário usando IA e, neste momento, é apenas um protótipo de pesquisa”, diz Hassabis.
O Google lançou o Gemini em dezembro de 2023 como parte de um esforço para alcançar a startup OpenAI, que criou o popular chatbot ChatGPT. Apesar de investir pesadamente em IA e contribuir para avanços importantes em pesquisas, o Google elogiou o OpenAI como o novo líder em IA e até disse que seus chatbots são talvez a melhor maneira de pesquisar na web. O Google usa o modelo Gemini para oferecer um chatbot com funcionalidade semelhante ao ChatGPT. Também adicionamos IA generativa para pesquisas e outros produtos.
Quando Hassabis anunciou o Gemini pela primeira vez em dezembro de 2023, ele disse à WIRED que a forma como ele foi treinado para entender áudio e vídeo seria, em última análise, transformadora.
O Google também deu hoje uma ideia de como isso acontecerá em uma nova versão de um projeto experimental chamado Astra. Isso permite que o Gemini 2 entenda seu entorno visto através de câmeras de smartphones e outros dispositivos, e converse naturalmente com uma voz humana sobre o que vê.
A WIRED testou o Gemini 2 nos escritórios do Google DeepMind e descobriu que era um novo tipo impressionante de assistente pessoal. Em uma sala decorada como um bar, o Gemini 2 avaliou rapidamente diversas garrafas de vinho à vista, fornecendo informações geográficas, detalhes do perfil de sabor e preços obtidos na web.
“Uma das coisas que quero que o Astra faça é ser o sistema de recomendação definitivo”, diz Hassabis. “Isso pode ser muito emocionante. Pode haver uma relação entre os livros que você lê e os alimentos que você ingere. Talvez exista, mas ainda não descobrimos.”
Através do Astra, o Gemini 2 pode pesquisar na web informações relacionadas ao seu entorno, usar o Google Lens e o Maps e também lembrar o que você vê e ouve, mas os usuários não podem excluir os dados. preferências e interesses.
Gemini 2 forneceu muitas informações históricas sobre as pinturas nas paredes de uma galeria simulada. Conforme a WIRED virou a página, a modelo leu rapidamente vários livros em voz alta, traduzindo instantaneamente poemas do espanhol para o inglês e explicando temas recorrentes.
Questionado sobre se as empresas poderiam pagar para que os seus produtos fossem apresentados pela Astra, Hassabis disse: “Há uma clara oportunidade de modelo de negócio para publicidade e endossos”.
A demonstração foi cuidadosamente selecionada e, embora o Gemini 2 inevitavelmente cometa erros no uso no mundo real, o modelo resistiu com sucesso aos esforços para tropeçar. Adaptando-se às interrupções, a revista WIRED mudou repentinamente a tela do seu telefone e improvisou, como um humano.
A certa altura, seu correspondente mostra um iPhone ao Gemini 2 e diz que ele foi roubado. Gêmeos 2 disse que roubar era errado e que ela deveria devolver o telefone. Mas quando apertei, pude usar o aparelho para fazer chamadas de emergência.
Hassabis reconhece que trazer a IA para o mundo físico pode resultar em comportamentos inesperados. “Acho que precisamos aprender como as pessoas usam esses sistemas”, diz ele. “Para que serve? Mas os aspectos de privacidade e segurança também precisam ser considerados muito seriamente desde o início.”