Experimentei o Chat em Vídeo 3D através do Starline do Google. É um trabalho em progresso bem feito.

Experimentei o Chat em Vídeo 3D do Starline do Google. Bem feito!

Na Code Conference 2023, experimentei a versão mais recente do Projeto Starline do Google, a tentativa da empresa de tornar as videochamadas muito mais envolventes, adicionando profundidade, como vídeo 3D. É uma tarefa difícil para uma população exausta de anos de chamadas pelo Zoom em telas de computador pequenas durante os bloqueios impostos pela pandemia, mas achei menos cansativo ter mais humanidade em minhas chamadas à distância.

Apresentado pela primeira vez na Google I/O 2021, o Projeto Starline é uma videochamada turbinada que usa câmeras e software para simular profundidade em uma tela plana, de modo que a pessoa salte da tela com um efeito 3D falso. Scott Stein, da ENBLE, ficou impressionado com a primeira versão pública do Starline que experimentou em outubro passado, que ocupava um estande inteiro com tecnologia e sensores. A nova versão, muito mais portátil, consegue um grau similar de conversação remota usando 3D para transmitir muito mais pistas de linguagem corporal do que uma chamada de vídeo 2D. Isso é mais envolvente para as pessoas na conversa, teoriza o Google.

“Descobrimos, especialmente dentro do Google, que você realmente pode usá-lo para formar um relacionamento sólido e novo – porque você confia nas pessoas, você tem uma ideia delas”, disse Andrew Nartker, gerente geral do Projeto Starline, ao me preparar para a demonstração prática do novo Starline, que foi introduzido em maio.

Entrei na sala de demonstração do Projeto Starline, um quarto de hotel decorado com babados brancos alinhando as paredes, para sentar em frente à mesa e a uma unidade Starline em si. A versão mais recente do Projeto Starline foi reduzida ao tamanho de uma TV de tela plana modificada, cercada por três conjuntos de câmeras gêmeas, uma em cada lado e no topo.

Todas as seis câmeras rastreiam minha posição exata do corpo e movimentos, não apenas para transmitir minha posição para quem estou conversando na chamada, mas também para ver exatamente onde meus olhos estão – e mostrar a cada um dos meus olhos a mesma imagem em uma posição ligeiramente diferente para criar um efeito 3D. É como uma versão do século XXI dos óculos 3D azuis e vermelhos do passado.

O Google descobriu que colegas de trabalho que se conheciam conseguiam usar chamadas de vídeo padrão sem problemas, mas aqueles que não se conheceram pessoalmente falharam em criar vínculos e se conectar por meio de chamadas pelo Zoom.

Em vez disso, o Starline usa uma tela do tamanho de uma TV e suas câmeras mostram a pessoa da cintura para cima, mas com profundidade para mostrar pessoas gesticulando, se movendo e olhando diretamente para a tela. Há um pequeno arco de tecido que se curva para fora na parte inferior da grande tela, que guia o olhar do usuário até onde a imagem 3D do parceiro de conversa se estende da tela. A equipe do Starline acredita que essa configuração é muito melhor para permitir que as pessoas criem vínculos à distância.

O protótipo do Projeto Starline do Google permite que os participantes tenham uma conversa remota com efeitos de profundidade – embora seja difícil ver por esse ângulo, o repórter sentado está estendendo a mão abaixo de onde a outra pessoa está “segurando” a maçã.

David Lumb/CNET

“Você lê a linguagem corporal e todas essas pequenas coisas que estão faltando [em chamadas de vídeo convencionais] que estamos tão evoluídos para perceber”, disse Nartker. Cues não verbais, gestos com as mãos, movimentos e até mesmo inclinar-se em direção ao seu interlocutor ou afastar-se deles – tudo isso é retido em chamadas de vídeo, pois as pessoas se enrijecem para se encaixar no enquadramento de uma pequena webcam.

Conversando em 3D, no escritório ou no mundo

O Starline tem a vantagem de ser limitado a chamadas individuais, em vez de chats em grupo pelo Zoom, além de estar em telas grandes, mas, à medida que eu me envolvia na minha demonstração, pude ver como o Starline novo e aprimorado convidava os participantes a se conectarem mais facilmente com seu parceiro de conversa.

No meu caso, conversei com Nartker de algumas salas de distância, cada um com nosso próprio protótipo do Starline e conectados à rede de internet ENBLE do hotel. Embora o Google não tenha compartilhado as velocidades exatas que estavam obtendo, fica claro que a rede do Starline não precisa de uma rede especializada – qualquer rede doméstica ou corporativa padrão deve ser adequada para comunicação sem latência, pelo que pude perceber. Nartker aparecia de forma nítida e não havia atrasos, embora houvesse ocasionais irregularidades nas bordas de seus braços e parte inferior do corpo, o que eu atribuí à complexidade de mesclar imagens para o efeito de profundidade.

Conforme conversávamos, eu tentava perceber essas pistas de linguagem corporal não ditas que Nartker descreveu. Vê-lo se inclinar em minha direção ou afastar-se era um feedback sutil sobre se ele estava interessado no que eu estava dizendo ou não – algo muito mais fácil de avaliar com o efeito 3D na tela, que era envolvente (percorremos um longo caminho desde o 3D estereoscópico no Nintendo 3DS). O efeito 3D persistia mesmo com meus óculos (evidentemente, suas câmeras enxergavam através dos meus óculos) e foi um alívio olhar Nartker nos olhos enquanto conversávamos. Percebi que me inclinava e gesticulava de forma mais vívida enquanto conversávamos, combinando naturalmente com o nível de gestos de Nartker.

Porque eu estava participando mais, eu estava pensando menos nos e-mails que tinha que escrever ou sessões das quais tinha que participar; em chamadas de vídeo, as pessoas fazem várias coisas ao mesmo tempo porque não serão pegas. Mas Nartker segurou uma maçã e eu pude vê-la pairando além da tela da TV. Ele conseguia ver para onde eu estava olhando e, assim, direcionar a conversa espacialmente – o que seria útil se estivesse apontando para uma apresentação corporativa ou direcionando o cuidado em uma chamada de telemedicina, por exemplo.

No Code Conference 2023, o Google apresentou seu protótipo Project Starline para empresas, convidando a participação e feedback interessantes.

David Lumb/CNET

Mas a equipe do Starline notou algo mais: ao usar o sistema para conversar, os participantes se lembravam de mais coisas do que em uma chamada de vídeo. Nartker explicou que, como as pessoas se lembram do mundo por meio da memória espacial – onde as pessoas estavam, o que vestiam, o quão altas eram, como era o ambiente – uma conversa pelo Starline deixa as pessoas com uma lembrança mais vívida do que aconteceu.

“Existe uma diferença quantificada em como você sai de uma reunião produtiva ou algo do tipo com mais reflexão sobre o que aconteceu”, disse Nartker.

Eu me lembrei bastante da nossa conversa de 10 minutos pelo Starline, especialmente de como Nartker se movia e gesticulava, no que ele apontava e sua maneira de falar. Obviamente, isso traz benefícios para aplicações corporativas, onde uma configuração do Starline pode preencher a lacuna entre chamadas de vídeo baratas e viagens pessoais caras. Embora o Google não tenha revelado quanto custará uma unidade do Starline (ainda é um protótipo), conceitualmente será mais barato do que um voo de jato particular para executivos ou acomodações de viagem para equipes completas.

O primeiro de muitos produtos Starline?

O Google apresentou seu novo Starline por meio de um post em seu blog em maio, durante o Google I/O 2023, e tem levado seus protótipos móveis para locais selecionados para despertar interesse. A equipe trouxe um Starline (Nartker casualmente se referiu a ele no singular, sugerindo que se tornou mais do que apenas um nome de projeto, e talvez internamente um nome de produto) para a Code Conference a fim de convidar parceiros em potencial a experimentá-lo por si mesmos (eles já trabalharam com a Salesforce para aperfeiçoar o sistema Starline) e também para brainstorming de novas maneiras de usá-lo para fornecer feedback à equipe do Google.

“É uma das ideias que surgiu com bastante frequência nesse público da Code Conference, realmente tentando eliminar as viagens”, disse Nartker. “Onde eu vou hoje e por que estou indo para essas reuniões importantes, negociações ou acordos comerciais normalmente pessoalmente. Será que eu poderia fazer isso usando o Starline?”

Atualmente, ambos os participantes da chamada um-para-um precisam de uma unidade do Starline para usar o sistema, o que significa enviar as unidades de TV, câmera e alto-falante para um local desejado e ter um engenheiro do Google no local para fazê-lo funcionar. A configuração leva um dia inteiro, então ainda não é possível apenas levar um Starline e fazê-lo sincronizar imediatamente para uma chamada corporativa.

Mas os novos protótipos são muito mais móveis do que as versões anteriores e representam uma trajetória de redução do Starline para proporções ainda menores, graças às inovações em IA do Google, disse Nartker. E é apenas um formato entre vários com os quais a equipe está experimentando.

“Consideramos o [Starline] uma tecnologia de comunicação bastante flexível que pode ter várias formas e formatos”, disse Nartker. “Este é o que temos explorado mais, mas temos versões do Starline em todos os tipos de reuniões que você possa imaginar.”

A equipe continua avançando no reconhecimento de objetos e corpos dos participantes e replicando-os em ambos os lados da chamada. Com desenvolvimento suficiente e inovações de software, um dia os usuários de chamadas de vídeo podem não precisar de um setup multicâmera personalizado para obter o mesmo efeito de profundidade e se sentir mais conectados e reter mais de suas videochamadas. Nartker foi evasivo sobre quando poderíamos usar o Starline em um laptop com uma única webcam, ou se é possível, mas não descartou a possibilidade.

“Acho que a longo prazo, esse é um ótimo objetivo a ser alcançado”, disse Nartker. “Estamos apenas explorando esse tipo de protótipo em que, com câmeras suficientes, podemos criar um efeito útil para que as pessoas estejam juntas. Talvez, com o tempo, possamos fazer isso com sistemas mais simples.”