Categorias
Blog

O Google está desenvolvendo uma ferramenta de videoconferência em 3D semelhante a um holograma, chamada Projeto Starline

O fim da pandemia parece estar próximo, mas provavelmente trouxe mudanças duradouras à maneira como trabalhamos, vivemos e nos conectamos. Como as viagens começam a decolar novamente e muitos funcionários voltam aos seus escritórios, outros estão optando por ficar parados, tanto em suas cidades como dentro de suas casas. “Por que voar pelo país para uma reunião quando você pode fazer no Zoom?”, Prossegue o raciocínio. Embora ainda haja um valor imenso e insubstituível em ver outros humanos cara a cara, as empresas estão apostando em pessoas que desejam ou precisam de ferramentas melhores para conexão remota.

Uma dessas empresas é o Google. Esta semana, o gigante das buscas na Internet revelou o Projeto Starline, uma ferramenta de bate-papo por vídeo semelhante a um holograma que faz parecer que a pessoa com quem você está falando está na mesma sala.

O que está na mesma sala é uma cabine, não muito diferente de uma que você sentaria em um restaurante, exceto que esta é decorada com câmeras e sensores. Eles capturam sua imagem e movimentos de vários pontos de vista, e essas imagens são transmitidas para um estande semelhante em uma sala diferente (seja no mesmo prédio ou em outro estado). Você vê a pessoa com quem está se encontrando em uma tela de campo de luz, uma tecnologia que funciona cortando o volume de uma imagem radialmente (da mesma forma que você cortaria um bolo). Também há áudio espacial, fazendo com que pareça que o som da voz da outra pessoa está ao seu redor, em vez de emanar de um pequeno alto-falante.

Surpreendentemente, a Starline não foi concebida durante a pandemia como uma tentativa frenética de manter os humanos socialmente distantes e presos conectados; conforme relatado pela Wired, o chefe de realidade virtual e aumentada do Google, Clay Bavor, disse que o projeto está em andamento há mais de cinco anos.

Bavor vê o Starline como estando em uma categoria diferente de ferramentas como o Zoom. “Eu sei que a pessoa com quem estou sentado não está checando o telefone durante a reunião, e isso é bom”, disse ele à Wired. “Mas a loucura é que eu acordava na manhã seguinte e tinha a memória de: ‘Ah, eu vi Steve ontem’. Não como ‘Tive uma videochamada com Steve ontem’. E há algo diferente sobre como nossas memórias estão estabelecidas. ”

As imagens no vídeo de amostra do Projeto Starline parecem impressionantemente realistas. No entanto, a tecnologia não está perto de estar pronta para uso generalizado; ainda há falhas a serem resolvidas e melhorias a serem feitas, sem mencionar um custo que é, sem dúvida, proibitivamente alto (detalhes de custo não foram divulgados).

Parece, no entanto, que não nos afastaremos da videoconferência no futuro, e a tecnologia para isso vai melhorar lenta, mas seguramente. O Google está longe de ser a única empresa que trabalha com esse tipo de tecnologia. Uma empresa chamada PORTL fabrica uma “caixa de holograma” de 2,10 metros de altura com telas de LCD transparentes em suas paredes, e a pessoa que aparece como um holograma só precisa ter uma câmera e estar de pé contra um fundo branco. O Mesh da Microsoft tem como objetivo, eventualmente, integrar hologramas 3D em tempo real em sua plataforma.

Em breve começaremos a ver que tipo de demanda existe por tecnologia avançada de videoconferência e, por outro lado, até que ponto as pessoas estão dispostas ou ansiosas para voltar para reuniões pessoais e viagens. Meu voto é para o último, mas é bom saber que eventualmente teremos algumas opções de backup sólidas para quando você simplesmente não quiser entrar em um avião, trem ou se estiver em um prédio com vários andares e vários Cabines Starline, um elevador.

Vanessa Bates Ramirez para SingularityHub.

Categorias
Blog

Pesquisadores de IA do Google estão sonhando com um novo mecanismo de pesquisa

Imagine uma coleção de livros – talvez milhões ou até bilhões deles – jogada ao acaso pelos editores em uma pilha em um campo. A cada dia a pilha cresce exponencialmente.

Esses livros estão repletos de conhecimentos e respostas. Mas como um buscador os encontraria? Sem organização, os livros são inúteis.

Esta é a Internet bruta em toda a sua glória não filtrada. É por isso que a maioria de nossas buscas por “iluminação” online começa com o Google (e sim, ainda existem outros mecanismos de busca). Os tentáculos algorítmicos do Google examinam e indexam todos os livros dessa pilha ímpia. Quando alguém insere uma consulta na barra de pesquisa, o algoritmo de pesquisa examina sua versão indexada da Internet, exibe as páginas e as apresenta em uma lista classificada dos principais acessos.

Essa abordagem é extremamente útil. Tão útil, na verdade, que não mudou fundamentalmente em mais de duas décadas. Mas agora, os pesquisadores de IA do Google, a mesma empresa que definiu o padrão para os motores de busca, estão esboçando um plano para o que pode vir a seguir.

Em um artigo sobre o servidor de pré-impressão arXiv, a equipe sugere que a tecnologia para tornar a Internet ainda mais pesquisável está ao nosso alcance. Eles dizem que grandes modelos de linguagem – algoritmos de aprendizado de máquina como o GPT-3 da OpenAI – poderiam substituir totalmente o sistema atual de indexar, recuperar e então classificar.

A IA é o mecanismo de busca do futuro?
Ao buscar informações, a maioria das pessoas adoraria perguntar a um especialista e obter uma resposta diferenciada e confiável, escrevem os autores. Em vez disso, eles pesquisam no Google. Isso pode funcionar ou dar terrivelmente errado.

Embora os mecanismos de pesquisa pareçam conter pelo menos partes de uma resposta, o fardo recai sobre o pesquisador para verificar, filtrar e ler os resultados para reunir essa resposta da melhor maneira possível.

Os resultados da pesquisa têm melhorado muito ao longo dos anos. Ainda assim, a abordagem está longe de ser perfeita.

Existem ferramentas de perguntas e respostas, como Alexa, Siri e Google Assistant. Mas essas ferramentas são frágeis, com um repertório limitado (embora crescente) de questões que podem responder. Embora tenham suas próprias deficiências, grandes modelos de linguagem como GPT-3 são muito mais flexíveis e podem construir novas respostas em linguagem natural para qualquer consulta ou prompt.

A equipe do Google sugere que a próxima geração de mecanismos de pesquisa pode sintetizar o melhor de todos os mundos, dobrando os principais sistemas de recuperação de informações da atualidade em IA em larga escala.

É importante notar que o aprendizado de máquina já está em funcionamento nos mecanismos de pesquisa clássicos de indexação, recuperação e classificação. Mas, em vez de meramente aumentar o sistema, os autores propõem que o aprendizado de máquina poderia substituí-lo totalmente.

“O que aconteceria se nos livrássemos completamente da noção de índice e o substituíssemos por um grande modelo pré-treinado que codifica de forma eficiente e eficaz todas as informações contidas no corpus?” Donald Metzler e co-autores escrevem no paper. “E se a distinção entre recuperação e classificação fosse embora e, em vez disso, houvesse uma única fase de geração de resposta?”

Um resultado ideal que eles imaginam é um pouco como o computador da nave estelar Enterprise em Star Trek. Os buscadores de informações fazem perguntas, o sistema responde de forma coloquial, ou seja, com uma resposta em linguagem natural, como você esperaria de um especialista, e inclui citações oficiais em sua resposta.

No artigo, os autores esboçam o que chamam de exemplo aspiracional de como essa abordagem pode ser na prática. Um usuário pergunta: “Quais são os benefícios do vinho tinto para a saúde?” O sistema retorna uma resposta matizada em prosa clara de várias fontes oficiais – neste caso WebMD e a Clínica Mayo – destacando os benefícios e riscos potenciais de beber vinho tinto.

Não precisa terminar aí, no entanto. Os autores observam que outro benefício dos grandes modelos de linguagem é sua capacidade de aprender muitas tarefas com apenas alguns pequenos ajustes (isso é conhecido como aprendizagem única ou poucas tentativas). Portanto, eles podem ser capazes de realizar todas as mesmas tarefas que os mecanismos de pesquisa atuais realizam, e dezenas de outras também.

Ainda é apenas uma visão
Hoje, essa visão está fora de alcance. Modelos de grande linguagem são o que os autores chamam de “diletantes”.

Algoritmos como GPT-3 podem produzir prosa que é, às vezes, quase indistinguível de passagens escritas por humanos, mas eles também estão sujeitos a respostas sem sentido. Pior,