A AI pode reservar um restaurante ou uma consulta com o cabelo, mas não espere uma conversa completa

A AI pode reservar um restaurante ou uma consulta com o cabelo, mas não espere uma conversa completa Claro que o seu assistente de IA pode marcar uma consulta para você, mas e quanto a qualquer conversa significativa? Shutterstock / Bas Nastassia

Google recentemente revelou sua mais recente IA falante, chamada Duplex. Duplex soa como uma pessoa real, completa com pausas, "umms" e "ahhs".

A gigante da tecnologia diz que pode conversar com pessoas por telefone para marcar consultas e verificar o horário comercial.

Duplex agendando uma consulta no salão de cabeleireiro. Google445 KB (Download)

Nas conversas gravadas que foram exibidas no lançamento do Google, ele conversou perfeitamente com os humanos do lado receptor, que pareciam totalmente inconscientes de que não estavam conversando com outra pessoa.

Duplex chamando um restaurante. Google399 KB (Download)

Essas chamadas deixaram o público orientado para a tecnologia no Google mostra ofegante e torcendo. Em um exemplo, a IA até entendeu quando a pessoa com quem estava conversando se confundiu e foi capaz de continuar acompanhando a conversa e responder adequadamente quando lhe disseram que não precisava fazer uma reserva.

A ascensão dos assistentes de IA

Se você já usou algum dos assistentes de voz disponíveis no momento, como Página inicial do Google, Siri da Apple ou Amazon Echo, essa flexibilidade pode surpreendê-lo. Esses assistentes são notoriamente difícil usar para outras coisas que não as solicitações padrão, como telefonar para um contato, tocar uma música, fazer uma simples pesquisa na web ou definir um lembrete.


Receba as últimas notícias do InnerSelf


Quando falamos com esses assistentes da geração atual, estamos sempre cientes de que estamos conversando com uma IA e, com frequência, adaptamos o que dizemos de acordo, de uma maneira que esperamos maximizar nossas chances de fazê-lo funcionar.

Mas as pessoas que conversavam com a Duplex não tinham ideia. Eles hesitaram, recuaram, pularam palavras e até mudaram os fatos parcialmente através de uma frase. Duplex não perdeu nada. Realmente parecia entender o que estava acontecendo.


Leia mais: Alto-falantes inteligentes podem ser o ponto de inflexão para automação residencial


Então, o futuro chegou mais cedo do que se esperava? O mundo está prestes a ficar cheio de assistentes de IA online (e no telefone) conversando alegremente e fazendo tudo por nós? Ou pior, seremos subitamente cercados por IAs inteligentes com seus próprios pensamentos e idéias que podem ou não incluir os humanos?

A resposta é definitivamente não". Para entender o porquê, ajuda a analisar rapidamente o que impulsiona uma IA como esta.

Duplex: como funciona

Isto é o que o Sistema AI duplex parece.

tecnologia O som recebido é processado através de um sistema ASR. Isso produz texto que é analisado com dados de contexto e outras entradas para produzir um texto de resposta que é lido em voz alta por meio do sistema de conversão de texto em fala (TTS). Google

O sistema recebe “entrada” (mostrada à esquerda), que é a voz da pessoa com quem está falando no telefone. A voz passa pelo reconhecimento automático de fala (ASR) e é convertida em texto (palavras escritas). O ASR é ele próprio um sistema avançado de IA, mas de um tipo que já é de uso comum em assistentes de voz existentes.

O texto é digitalizado para determinar o tipo de sentença (como uma saudação, uma afirmação, uma pergunta ou uma instrução) e extrair qualquer informação importante. As informações principais tornam-se parte do Contexto, que é uma entrada extra que mantém o sistema atualizado com o que foi dito até agora na conversa.

O texto do ASR e do Contexto é então enviado ao coração do Duplex, que é chamado de Rede Neural Artificial (RNA).

No diagrama acima, a RNA é mostrada pelos círculos e pelas linhas que os conectam. As RNAs são modeladas livremente em nossos cérebros, que possui bilhões de neurônios conectados em enormes redes.

Ainda não é um cérebro, ainda

RNAs são muito mais simples do que nossos cérebros. A única coisa que este tenta fazer é combinar as palavras de entrada com uma resposta apropriada. A ANN aprende exibindo transcrições de milhares de conversas de pessoas que fazem reservas para restaurantes.

Com exemplos suficientes, ele aprende que tipos de frases de entrada esperar da pessoa com quem está conversando e que tipos de respostas dar para cada uma.

A resposta de texto gerada pela ANN é então enviada para um sintetizador de conversão de texto em fala (TTS), que o converte em palavras faladas que são reproduzidas para a pessoa no telefone.

Mais uma vez, este sintetizador TTS é uma IA avançada - nesse caso, é mais avançada que a do seu telefone, porque soa quase indistinguível de qualquer voz normal.

É tudo o que há para isso. Apesar de ser o estado da arte, o coração do sistema é realmente apenas um processo de correspondência de texto. Mas você pode perguntar - se é tão simples, por que não conseguimos fazer isso antes?

Uma resposta aprendida

O fato é que a linguagem humana e a maioria das outras coisas no mundo real são muito variáveis ​​e desordenadas para serem bem tratadas por computadores normais, mas esse tipo de problema é perfeito para a IA.

Observe que o resultado produzido pela IA depende inteiramente das conversas que foram mostradas enquanto estava aprendendo.

Isso significa que diferentes IAs precisam ser treinadas para fazer reservas de tipos diferentes - assim, por exemplo, uma AI pode reservar restaurantes e outra pode marcar compromissos com os cabelos.

Isso é necessário porque os tipos de perguntas e respostas podem variar muito para diferentes tipos de reservas. É também assim que o Duplex pode ser muito melhor do que os assistentes de voz gerais, que precisam lidar com muitos tipos de solicitações.

Portanto, agora deve ficar claro que não teremos conversas casuais com nossos assistentes de IA tão cedo. De fato, todas as nossas IAs atuais não passam de correspondências de padrões (nesse caso, padrões de texto correspondentes). Eles não entendem o que ouvem, ou o que olham, ou o que dizem.

A correspondência de padrões é uma coisa que nossos cérebros fazem, mas eles também fazem muito mais. A chave para criar uma IA mais poderosa pode ser desvendar mais segredos do cérebro. Queremos? Bem, isso é outra pergunta.A Conversação

Sobre o autor

Peter Stratton, pesquisador de pós-doutorado, A, universidade, de, queensland

Este artigo foi republicado a partir de A Conversação sob uma licença Creative Commons. Leia o artigo original.

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

siga InnerSelf on

facebook-icontwitter-iconrss-icon

Receba as últimas por e-mail

{Emailcloak = off}

DOS EDITORES

Chegou o dia do acerto de contas para o Partido Republicano
by Robert Jennings, InnerSelf.com
O partido republicano não é mais um partido político pró-América. É um partido pseudo-político ilegítimo, cheio de radicais e reacionários, cujo objetivo declarado é perturbar, desestabilizar e…
Por que Donald Trump poderia ser o maior perdedor da história
by Robert Jennings, InnerSelf.com
Atualizado em 2 de julho de 20020 - Toda essa pandemia de coronavírus está custando uma fortuna, talvez 2, 3 ou 4 fortunas, todas de tamanho desconhecido. Ah, sim, e centenas de milhares, talvez um milhão, de pessoas morrerão ...
Olhos Azuis vs Olhos Castanhos: Como o Racismo é Ensinado
by Marie T. Russell, InnerSelf
Neste episódio de 1992 da Oprah Show, a ativista e educadora anti-racismo premiada Jane Elliott ensinou ao público uma dura lição sobre racismo, demonstrando o quão fácil é aprender preconceito.
Uma mudança virá...
by Marie T. Russell, InnerSelf
(30 de maio de 2020) Ao assistir as notícias sobre os eventos na Filadélfia e em outras cidades do país, meu coração está doendo pelo que está acontecendo. Eu sei que isso faz parte da maior mudança que está ocorrendo…
Uma música pode elevar o coração e a alma
by Marie T. Russell, InnerSelf
Eu tenho várias maneiras que eu uso para limpar a escuridão da minha mente quando a vejo penetrar. Uma é a jardinagem, ou o tempo na natureza. O outro é o silêncio. Outra maneira é ler. E um que ...