A Google anunciou a integração da Gemini AI, desenvolvida pela DeepMind, nos seus robôs, visando otimizar a sua capacidade de operar em ambientes complexos. Esta tecnologia permite que os robôs aprendam a navegar e a realizar tarefas quotidianas com maior eficiência. Segundo os investigadores da DeepMind, os resultados iniciais são promissores, com os robôs equipados com Gemini a alcançarem uma taxa de sucesso elevada em diversas instruções num espaço operacional alargado.
O Gemini 1.5 Pro destaca-se pela sua habilidade de processar comandos em linguagem natural, permitindo que os robôs executem ações complexas com base em instruções verbais e visuais. A equipa de robótica da DeepMind explicou que esta capacidade possibilita aos robôs não só seguir ordens simples, mas também antecipar e realizar tarefas mais complicadas, como procurar objetos específicos num ambiente familiar.
Durante os testes, os investigadores observaram que os robôs com Gemini atingiram uma taxa de sucesso de 90% em mais de 50 instruções diferentes, dentro de um espaço operacional superior a 9.000 pés quadrados. Um exemplo prático fornecido pela equipa ilustrou um cenário onde um robô, ao ser questionado sobre a disponibilidade de Coca-Cola numa mesa com várias latas, conseguiu determinar a necessidade de ir ao frigorifico, verificar a presença da bebida e informar o utilizador do resultado.
Apesar destes avanços, os investigadores reconheceram a existência de desafios, nomeadamente o tempo necessário para processar instruções, que pode variar entre 10 e 30 segundos por comando. No entanto, a DeepMind está empenhada em continuar a investigar e a melhorar a eficiência operacional dos robôs equipados com a IA Gemini.
A implementação da Gemini AI representa um passo significativo na evolução da robótica, sinalizando um futuro onde robôs poderão desempenhar um papel mais integrado e funcional nas atividades humanas diárias.
Com informações do The Verge