A Google DeepMind continua a inovar no campo da inteligência artificial e agora expande-se para a robótica com os modelos Gemini Robotics e Gemini Robotics-ER, ambos baseados na tecnologia Gemini 2.0.
Estes avanços prometem tornar os robôs mais inteligentes e versáteis, permitindo-lhes compreender comandos complexos e executar tarefas físicas com maior precisão.
O Gemini Robotics é um modelo avançado que combina visão, linguagem e ação física, permitindo que robôs interajam com o ambiente de forma mais sofisticada.
De acordo com a Google, este sistema supera outras soluções do mercado ao interpretar comandos com elevada precisão e generalizar conhecimentos para situações novas.
De entre as capacidades demonstradas, destaca-se a realização de tarefas que exigem destreza, como dobrar origamis ou colocar objetos delicadamente em recipientes.
O Gemini Robotics-ER, por outro lado, centra-se no raciocínio espacial e na integração com sistemas robóticos existentes.
Este modelo oferece um suporte abrangente aos programadores, fornecendo ferramentas essenciais para a perceção, estimativa de estado, compreensão espacial e geração de código.
A sua implementação permite um controlo mais eficiente dos robôs, acelerando o desenvolvimento de aplicações avançadas.
A Google está a colaborar com diversas empresas para potenciar o desenvolvimento destes modelos. Entre os parceiros encontram-se a Apptronik, focada na construção de robôs humanoides, e empresas de renome como Boston Dynamics, Agility Robotics e Enchanted Tools, que estão a testar o Gemini Robotics-ER em diferentes contextos industriais e domésticos.
Com esta aposta, a Google DeepMind procura um futuro onde a inteligência artificial e a robótica se integrem de forma mais natural no quotidiano.
A promessa é de robôs mais adaptáveis, capazes de interagir com humanos de maneira intuitiva e de desempenhar tarefas com um nível de sofisticação sem precedentes.