Categorias
Blog

Pesquisadores de IA do Google estão sonhando com um novo mecanismo de pesquisa

Imagine uma coleção de livros – talvez milhões ou até bilhões deles – jogada ao acaso pelos editores em uma pilha em um campo. A cada dia a pilha cresce exponencialmente.

Esses livros estão repletos de conhecimentos e respostas. Mas como um buscador os encontraria? Sem organização, os livros são inúteis.

Esta é a Internet bruta em toda a sua glória não filtrada. É por isso que a maioria de nossas buscas por “iluminação” online começa com o Google (e sim, ainda existem outros mecanismos de busca). Os tentáculos algorítmicos do Google examinam e indexam todos os livros dessa pilha ímpia. Quando alguém insere uma consulta na barra de pesquisa, o algoritmo de pesquisa examina sua versão indexada da Internet, exibe as páginas e as apresenta em uma lista classificada dos principais acessos.

Essa abordagem é extremamente útil. Tão útil, na verdade, que não mudou fundamentalmente em mais de duas décadas. Mas agora, os pesquisadores de IA do Google, a mesma empresa que definiu o padrão para os motores de busca, estão esboçando um plano para o que pode vir a seguir.

Em um artigo sobre o servidor de pré-impressão arXiv, a equipe sugere que a tecnologia para tornar a Internet ainda mais pesquisável está ao nosso alcance. Eles dizem que grandes modelos de linguagem – algoritmos de aprendizado de máquina como o GPT-3 da OpenAI – poderiam substituir totalmente o sistema atual de indexar, recuperar e então classificar.

A IA é o mecanismo de busca do futuro?
Ao buscar informações, a maioria das pessoas adoraria perguntar a um especialista e obter uma resposta diferenciada e confiável, escrevem os autores. Em vez disso, eles pesquisam no Google. Isso pode funcionar ou dar terrivelmente errado.

Embora os mecanismos de pesquisa pareçam conter pelo menos partes de uma resposta, o fardo recai sobre o pesquisador para verificar, filtrar e ler os resultados para reunir essa resposta da melhor maneira possível.

Os resultados da pesquisa têm melhorado muito ao longo dos anos. Ainda assim, a abordagem está longe de ser perfeita.

Existem ferramentas de perguntas e respostas, como Alexa, Siri e Google Assistant. Mas essas ferramentas são frágeis, com um repertório limitado (embora crescente) de questões que podem responder. Embora tenham suas próprias deficiências, grandes modelos de linguagem como GPT-3 são muito mais flexíveis e podem construir novas respostas em linguagem natural para qualquer consulta ou prompt.

A equipe do Google sugere que a próxima geração de mecanismos de pesquisa pode sintetizar o melhor de todos os mundos, dobrando os principais sistemas de recuperação de informações da atualidade em IA em larga escala.

É importante notar que o aprendizado de máquina já está em funcionamento nos mecanismos de pesquisa clássicos de indexação, recuperação e classificação. Mas, em vez de meramente aumentar o sistema, os autores propõem que o aprendizado de máquina poderia substituí-lo totalmente.

“O que aconteceria se nos livrássemos completamente da noção de índice e o substituíssemos por um grande modelo pré-treinado que codifica de forma eficiente e eficaz todas as informações contidas no corpus?” Donald Metzler e co-autores escrevem no paper. “E se a distinção entre recuperação e classificação fosse embora e, em vez disso, houvesse uma única fase de geração de resposta?”

Um resultado ideal que eles imaginam é um pouco como o computador da nave estelar Enterprise em Star Trek. Os buscadores de informações fazem perguntas, o sistema responde de forma coloquial, ou seja, com uma resposta em linguagem natural, como você esperaria de um especialista, e inclui citações oficiais em sua resposta.

No artigo, os autores esboçam o que chamam de exemplo aspiracional de como essa abordagem pode ser na prática. Um usuário pergunta: “Quais são os benefícios do vinho tinto para a saúde?” O sistema retorna uma resposta matizada em prosa clara de várias fontes oficiais – neste caso WebMD e a Clínica Mayo – destacando os benefícios e riscos potenciais de beber vinho tinto.

Não precisa terminar aí, no entanto. Os autores observam que outro benefício dos grandes modelos de linguagem é sua capacidade de aprender muitas tarefas com apenas alguns pequenos ajustes (isso é conhecido como aprendizagem única ou poucas tentativas). Portanto, eles podem ser capazes de realizar todas as mesmas tarefas que os mecanismos de pesquisa atuais realizam, e dezenas de outras também.

Ainda é apenas uma visão
Hoje, essa visão está fora de alcance. Modelos de grande linguagem são o que os autores chamam de “diletantes”.

Algoritmos como GPT-3 podem produzir prosa que é, às vezes, quase indistinguível de passagens escritas por humanos, mas eles também estão sujeitos a respostas sem sentido. Pior, eles refletem imprudentemente preconceitos embutidos em seus dados de treinamento, não têm senso de compreensão contextual e não podem citar fontes (ou mesmo separar fontes de alta e baixa qualidade) para justificar suas respostas.

“Eles parecem saber muito, mas seu conhecimento é superficial”, escrevem os autores. O documento também apresenta os avanços necessários para preencher a lacuna. Na verdade, muitos dos desafios que eles descrevem se aplicam ao campo em geral.

Um avanço importante seria ir além dos algoritmos que apenas modelam as relações entre os termos (como palavras individuais) para algoritmos que também modelam a relação entre as palavras em um artigo, por exemplo, e o artigo como um todo. Além disso, eles também modelariam as relações entre muitos artigos diferentes na Internet.

Os pesquisadores também precisam definir o que constitui uma resposta de qualidade. Isso em si não é uma tarefa fácil. Mas, para começar, os autores sugerem que as respostas de alta qualidade devem ser confiáveis, transparentes, imparciais, acessíveis e conter perspectivas diversas.

Mesmo os algoritmos mais modernos de hoje não chegam perto dessa barreira. E não seria sensato implantar modelos de linguagem natural nesta escala até que sejam resolvidos. Mas se resolvido – e já há trabalho sendo feito para lidar com alguns desses desafios – os mecanismos de pesquisa não seriam os únicos aplicativos a se beneficiar.

‘Early Grey, Hot’
É uma visão atraente. Vasculhar páginas da web em busca de respostas enquanto tenta determinar o que é confiável e o que não é pode ser exaustivo.

Sem dúvida, muitos de nós não fazemos o trabalho tão bem quanto poderíamos ou deveríamos.

Mas também vale a pena especular como uma internet acessada dessa forma mudaria a forma como as pessoas contribuem para ela.

Se consumirmos informações principalmente lendo respostas em prosa e sintetizadas por algoritmos – em vez de abrir e ler as próprias páginas individuais – os criadores publicariam tanto trabalho? E como o Google e outros fabricantes de mecanismos de pesquisa compensariam os criadores que, em essência, estão produzindo as informações que treinam os próprios algoritmos?

Ainda haveria muitas pessoas lendo as notícias e, nesses casos, os algoritmos de pesquisa precisariam fornecer listas de histórias. Mas eu me pergunto se uma mudança sutil pode ocorrer onde os criadores menores adicionam menos e, ao fazer isso, a web se torna menos rica em informações, enfraquecendo os próprios algoritmos que dependem dessas informações.

Não há como saber. Frequentemente, a especulação está enraizada nos problemas de hoje e se mostra inocente em retrospecto. Nesse ínterim, o trabalho continuará sem dúvida.

Talvez possamos resolver esses desafios – e mais à medida que eles surgem – e no processo chegarmos àquele computador de Jornada nas estrelas onisciente e agradavelmente falante que há muito imaginamos.

Jason Dorrier para SingularityHub.

Categorias
Blog

Nüwa, a proposta de cidade construída dentro de um penhasco gigante, em Marte

Apesar de serem capazes de pousar em Marte e pilotar helicópteros lá, parece que os humanos ainda estão um pouco longe de realmente colocarem os pés no planeta vermelho. Mas para um empreendimento sem precedentes como colonizar outro planeta, você tem que sonhar grande – e planejar com antecedência. Isso é o que uma equipe internacional de cientistas e outros especialistas está fazendo, e eles criaram não apenas um projeto, mas um plano completo para construir a primeira cidade marciana, completa com moradia, alimentação, transporte e energia sustentáveis.

Descrita em um artigo publicado em março, a cidade é fruto da imaginação do escritório de arquitetura ABIBOO Studio e de um grupo multidisciplinar de especialistas em espaço da academia e do setor privado chamado SONet (abreviação de Sustainable Offworld Network). A Mars Society solicitou planos para uma cidade marciana em 2020, e este projeto, chamado Nüwa, foi um dos vários finalistas. Um vídeo que parece ter saído diretamente de um filme de ficção científica de Hollywood dá uma ideia do design.

Nüwa seria a capital em um projeto formado por cinco cidades interligadas, cada uma abrigando de 200.000 a 250.000 pessoas. A localização de Nüwa, Tempe Mensa, foi escolhida porque sua geografia atuará como um escudo natural da radiação; a área contém um extenso planalto cercado por altos penhascos íngremes, e a ideia é escavar esses penhascos e construir a cidade dentro deles. A localização e o projeto também dariam aos residentes acesso indireto à luz do sol, protegendo-os de meteoritos caso algum caísse nas proximidades e ajudando a minimizar a diferença na pressão atmosférica entre o interior e o exterior dos edifícios.

“Se construíssemos os edifícios como na Terra, os edifícios tenderiam a explodir com a pressão. A radiação solar e gama em Marte nos obrigou a construir espaços não expostos diretamente ao céu ”, disse Alfredo Muñoz, fundador do ABIBOO Studio, em um comunicado à imprensa.

Os “macro-edifícios” concebidos para a cidade são modulares e em forma de enormes tubos (10 metros de largura por 60 metros de comprimento), com diferentes modelos destinados a habitar e trabalhar. Os módulos seriam interligados por túneis e elevadores, semelhantes aos encontrados em áreas urbanas da Terra. Todos os módulos incluem espaço para áreas verdes, bem como áreas chamadas “domos de neve” que ajudariam a dissipar o calor e limpar o ar por meio da condensação. Cada macro-edifício teria um chuveiro de ar em sua entrada, que os visitantes usariam para esterilizar micróbios e outras substâncias potencialmente prejudiciais.

O interior de uma das “cúpulas verdes” de Nuwa, representação artística. Crédito da imagem: Abiboo Studio / SONet

A infraestrutura para a produção de alimentos e energia será construída no topo plano da meseta. Já que transportar qualquer tipo de material da Terra para Marte em uma base regular não levaria apenas meses, mas teria um custo proibitivo, a cidade precisaria ser autossustentável, com todas as necessidades dos habitantes capazes de ser atendidas usando material local. Parece complicado, já que Marte é atualmente um trecho desolado de rocha avermelhada sem formas de vida identificáveis, certo?

“À medida que a cidade cresce, ela precisa ser capaz de depender apenas dos recursos diretamente de Marte e reciclar o máximo que pudermos”, disse Gisela Detrell, engenheira aeroespacial que faz parte do projeto. “De todas as maneiras que nós, humanos, produzimos, devemos ser capazes de produzir oxigênio, água e alimentos suficientes para sustentar os humanos e fechar o ciclo quase completamente”.

A principal fonte de alimento dos residentes seriam as safras hidropônicas cultivadas em módulos dedicados, onde o ar seria enriquecido com CO2, e a manutenção e a colheita das safras realizadas por sistemas automatizados – talvez semelhantes a algumas fazendas verticais altamente automatizadas já em operação na Terra. Não há muitos detalhes sobre quais plantações especificamente serão cultivadas, embora a equipe observe que as algas seriam uma parte crítica da dieta dos residentes de Nüwa.

Um módulo agrícola de Nuwa, representação artística. Crédito da imagem: ABIBOO Studio / SONet

E, sem surpresa, o planeta vermelho não será um ótimo lugar para carnívoros amantes de carne. O plano menciona a produção de carne celular e áreas de cultivo “relativamente pequenas” para animais e insetos, mas dados os recursos e energia necessários para produzir g