Os bebês são bolas borbulhantes, fofinhas e risonhas de alegria. Eles também são máquinas de aprendizado extremamente poderosas. Aos três meses de idade, eles já têm intuição sobre como as coisas ao seu redor se comportam – sem que ninguém lhes ensine explicitamente as regras do jogo.
Essa habilidade, apelidada de “física intuitiva”, parece extremamente trivial na superfície. Se eu encher um copo com água e colocá-lo sobre a mesa, sei que o copo é um objeto – algo em que posso envolver minhas mãos sem que derreta em minhas palmas. Não vai afundar na mesa. E se começasse a levitar, eu olhava e imediatamente corria para fora da porta.
Os bebês desenvolvem rapidamente essa capacidade absorvendo dados de seus ambientes externos, formando uma espécie de “senso comum” sobre a dinâmica do mundo físico. Quando as coisas não se movem como esperado – digamos, em truques de mágica onde objetos desaparecem – eles ficam surpresos.
Para a IA, é uma questão completamente diferente. Embora os modelos recentes de IA já tenham derrotado os humanos desde o jogo até a resolução de enigmas científicos de décadas, eles ainda lutam para desenvolver a intuição sobre o mundo físico.
Este mês, pesquisadores da DeepMind, de propriedade do Google, se inspiraram na psicologia do desenvolvimento e construíram uma IA que naturalmente extrai regras simples sobre o mundo assistindo a vídeos. Netflix e chill não funcionaram sozinhos; o modelo de IA só aprendeu as regras do nosso mundo físico quando recebeu uma ideia básica dos objetos, como quais são seus limites, onde estão e como se movem. Semelhante aos bebês, a IA expressou “surpresa” quando mostrou situações mágicas que não faziam sentido, como uma bola rolando em uma rampa.
Apelidado de PLATO (para Aprendizado de Física através de Auto-codificação e Objetos de Rastreamento), a IA foi surpreendentemente flexível. Precisava apenas de um conjunto relativamente pequeno de exemplos para desenvolver sua “intuição”. Uma vez que aprendesse isso, o software poderia generalizar suas previsões sobre como as coisas se moviam e interagiam com outros objetos, bem como sobre cenários nunca encontrados anteriormente.
De certa forma, PLATO atinge o ponto ideal entre natureza e criação. Os psicólogos do desenvolvimento há muito discutem se o aprendizado em bebês pode ser alcançado a partir da descoberta de padrões em dados de experiências apenas. PLATO sugere que a resposta é não, pelo menos não para esta tarefa específica. Tanto o conhecimento interno quanto a experiência são fundamentais para completar toda a história de aprendizagem.
Para sermos claros, PLATO não é uma réplica digital de um bebê de três meses – e nunca foi projetado para ser. No entanto, fornece um vislumbre de como nossas próprias mentes potencialmente se desenvolvem.
“O trabalho… está ultrapassando os limites do que a experiência cotidiana pode e não pode explicar em termos de inteligência”, comentou os Drs. Susan Hespos e Apoorva Shivaram, da Northwestern University e da Western Sydney University, respectivamente, que não participaram do estudo. Pode “nos dizer como construir melhores modelos de computador que simulem a mente humana”.
O enigma do senso comum
Com apenas três meses de idade, a maioria dos bebês não piscará se deixar cair um brinquedo e ele cair no chão; eles já pegaram o conceito de gravidade.
Como isso acontece ainda é desconcertante, mas existem algumas ideias. Nessa idade, os bebês ainda lutam para se contorcer, engatinhar ou se movimentar. Sua entrada do mundo exterior é principalmente através da observação. Essa é uma ótima notícia para a IA: significa que, em vez de construir robôs para explorar fisicamente seu ambiente, é possível imbuir um senso de física na IA por meio de vídeos.
É uma teoria endossada pelo Dr. Yann LeCun, um dos principais especialistas em IA e cientista-chefe de IA da Meta. Em uma palestra de 2019, ele postulou que os bebês provavelmente aprendem por meio da observação. Seus cérebros se baseiam nesses dados para formar uma ideia conceitual da realidade. Em contraste, mesmo os modelos de aprendizado profundo mais sofisticados ainda lutam para construir uma noção do nosso mundo físico, o que limita o quanto eles podem se envolver com o mundo – tornando-os quase literalmente mentes nas nuvens.
Então, como você mede a compreensão de um bebê sobre a física cotidiana? “Felizmente para nós, os psicólogos do desenvolvimento passaram décadas estudando o que as crianças sabem sobre o mundo físico”, escreveu o principal cientista Dr. Luis Piloto. Um teste particularmente poderoso é o paradigma de violação de expectativa (VoE). Mostre a um bebê uma bola rolando morro acima, desaparecendo aleatoriamente ou de repente indo na direção oposta, e o bebê olhará para a anomalia por mais tempo do que faria se estivesse atendendo às suas expectativas normais. Algo estranho está acontecendo.
Esquisitice espacial
No novo estudo, a equipe adaptou o VoE para testar a IA. Eles abordaram cinco conceitos físicos diferentes para construir o PLATO. Entre eles estão a solidez – ou seja, dois objetos não podem passar um pelo outro; e continuidade – a ideia de que as coisas existem e não piscam mesmo quando escondidas por outro objeto (o teste do “esconde-esconde”).
Para construir o PLATO, a equipe começou com um método padrão em IA com uma abordagem em duas frentes. Um componente, o modelo perceptual, recebe dados visuais para analisar objetos discretos em uma imagem. Em seguida vem o preditor dinâmico, que usa uma rede neural para considerar o histórico de objetos anteriores e prever o comportamento do próximo. Em outras palavras, o modelo constrói um tipo de “motor de física” que mapeia objetos ou cenários e adivinha como algo se comportaria na vida real. Essa configuração deu a PLATO uma ideia inicial das propriedades físicas dos objetos, como sua posição e quão rápido eles estão se movendo.
Em seguida veio o treinamento. A equipe mostrou ao PLATO menos de 30 horas de vídeos sintéticos de um conjunto de dados de código aberto. Estes não são vídeos de eventos da vida real. Em vez disso, imagine animações em blocos do tipo Nintendo da velha escola de uma bola rolando por uma rampa, quicando em outra bola ou desaparecendo de repente. PLATO eventualmente aprendeu a prever como um único objeto se moveria no próximo quadro de vídeo e também atualizou sua memória para esse objeto. Com o treinamento, suas previsões sobre a próxima “cena” ficaram mais precisas.
A equipe então jogou uma chave inglesa nos raios. Eles apresentaram a PLATO uma cena normal e uma impossível, como uma bola desaparecendo repentinamente. Ao medir a diferença entre o evento real e as previsões do PLATO, a equipe pôde avaliar o nível de “surpresa” da IA – que passou do teto para eventos mágicos.
O aprendizado generalizou-se para outros objetos em movimento. Desafiado com um conjunto de dados completamente diferente desenvolvido pelo MIT, apresentando, entre outros itens, coelhos e pinos de boliche, PLATO habilmente discriminava entre eventos impossíveis e realistas. PLATO nunca tinha “visto” um coelho antes, mas sem qualquer retreinamento, mostrou surpresa quando um coelho desafiou as leis da física. Semelhante aos bebês, o PLATO foi capaz de capturar sua intuição física com apenas 28 horas de treinamento em vídeo.
Para Hespos e Shivaram, “essas descobertas também são características paralelas que vemos em estudos infantis”.
Intuição digital
PLATO não pretende ser um modelo de IA para o raciocínio infantil. Mas mostra que explorar nossos cérebros de bebês em expansão pode inspirar computadores com um senso de fisicalidade, mesmo quando o “cérebro” do software está literalmente preso dentro de uma caixa. Não se trata apenas de construir robôs humanóides. De próteses a carros autônomos, uma compreensão intuitiva do mundo físico conecta o mundo digital amorfo de 0s e 1s à realidade cotidiana e comum.
Não é a primeira vez que os cientistas de IA pensam em turbinar as mentes das máquinas com uma pitada de engenhosidade infantil. Uma ideia é dar à IA um senso de teoria da mente – a capacidade de se distinguir dos outros e ser capaz de se imaginar no lugar dos outros. É uma habilidade que vem naturalmente para crianças de cerca de quatro anos e, se incorporada aos modelos de IA, pode ajudar drasticamente a entender as interações sociais.
O novo estudo se baseia em nossos primeiros meses de vida como um rico recurso para desenvolver IA com bom senso. Por enquanto, o campo está apenas em sua infância. Os autores estão liberando seu conjunto de dados para que outros possam desenvolver e explorar a capacidade de um modelo de IA de interagir com conceitos físicos mais complexos, incluindo vídeos do mundo real. Por enquanto, “esses estudos podem servir como uma oportunidade sinérgica entre a IA e a ciência do desenvolvimento”, disseram Hespos e Shivaram.
Leia também: Como o cérebro aprende? Entenda como ele funciona e como estimular!