Daboost/Shutterstock

Com o demissão recente e recontratação rápida de Sam Altman pela OpenAI, os debates em torno do desenvolvimento e uso da inteligência artificial (IA) estão mais uma vez em destaque. O que é mais incomum é que um tema proeminente nas reportagens da mídia tem sido a capacidade de Sistemas de IA para fazer matemática.

Aparentemente, parte do drama na OpenAI estava relacionado ao desenvolvimento da empresa de um novo Algoritmo de IA chamado Q*. O sistema tem sido considerado um avanço significativo e uma de suas características mais salientes foi a capacidade de raciocinar matematicamente.

Mas não é a matemática a base da IA? Como poderia um sistema de IA ter problemas com o raciocínio matemático, visto que computadores e calculadoras podem realizar tarefas matemáticas?

A IA não é uma entidade única. É uma colcha de retalhos de estratégias para realizar cálculos sem instrução direta de humanos. Como veremos, alguns sistemas de IA são competentes em matemática.

No entanto, uma das tecnologias atuais mais importantes, os grandes modelos de linguagem (LLMs) por trás dos chatbots de IA, como o ChatGPT, tem lutado até agora para emular o raciocínio matemático. Isso ocorre porque eles foram projetados para se concentrar na linguagem.


innerself assinar gráfico


Se o novo algoritmo Q* da empresa puder resolver problemas matemáticos invisíveis, então isso pode muito bem acontecer. ser um avanço significativo. A matemática é uma forma antiga de raciocínio humano que modelos de linguagem grande (LLMs) até agora lutaram para imitar. LLMs são a tecnologia subjacente a sistemas como ChatGPT da OpenAI.

No momento em que este artigo foi escrito, os detalhes do algoritmo Q* e suas capacidades eram limitados, mas altamente intrigantes. Portanto, há várias sutilezas a serem consideradas antes de considerar Q* um sucesso.

Por exemplo, a matemática é uma disciplina com a qual todos se envolvem em graus variados, e o nível de matemática em que Q* é competente permanece incerto. No entanto, foram publicados trabalhos acadêmicos que usam formas alternativas de IA para avançar a matemática em nível de pesquisa (incluindo alguns escritos por mim, e um escrito por uma equipe de matemáticos em colaboração com pesquisadores do Google DeepMind).

Esses sistemas de IA poderiam ser descritos como competentes em matemática. No entanto, é provável que Q* não esteja sendo usado para ajudar acadêmicos em seu trabalho, mas sim para outro propósito.

No entanto, mesmo que Q* seja incapaz de ultrapassar os limites da investigação de ponta, é muito provável que se encontre algum significado na forma como foi construído, que poderá criar oportunidades tentadoras para o desenvolvimento futuro.

Cada vez mais confortável

Como sociedade, estamos cada vez mais confortáveis ​​com o uso de IA especializada para resolver tipos predeterminados de problemas. Por exemplo, assistentes digitais, reconhecimento facial e sistemas de recomendação on-line será familiar para a maioria das pessoas. O que permanece indefinido é o chamado “inteligência artificial geral” (AGI) que possui amplas capacidades de raciocínio comparáveis ​​às de um ser humano.

A matemática é uma habilidade básica que aspiramos ensinar a todas as crianças em idade escolar e certamente se qualificaria como um marco fundamental na busca pela AGI. Então, de que outra forma os sistemas de IA matematicamente competentes poderiam ajudar a sociedade?

A mentalidade matemática é relevante para uma infinidade de aplicações, por exemplo, codificação e engenharia, e portanto o raciocínio matemático é uma habilidade vital transferível tanto para a inteligência humana como para a inteligência artificial. Uma ironia é que a IA é, num nível fundamental, baseada na matemática.

Por exemplo, muitas das técnicas implementadas pelos algoritmos de IA resumem-se, em última análise, a uma área matemática conhecida como álgebra matricial. Uma matriz é simplesmente uma grade de números, da qual uma imagem digital é um exemplo familiar. Cada pixel é nada mais do que dados numéricos.

Grandes modelos de linguagem também são inerentemente matemáticos. Com base em uma enorme amostra de texto, uma máquina pode aprender as probabilidades das palavras que são provavelmente seguirá uma solicitação (ou pergunta) do usuário para o chatbot. Se você deseja que um LLM pré-treinado se especialize em um tópico específico, ele pode ser ajustado na literatura matemática ou em qualquer outro domínio de aprendizagem. Um LLM pode gerar texto que parece entender matemática.

Infelizmente, isso produz um LLM que é bom em blefar, mas ruim em detalhes. A questão é que uma afirmação matemática é, por definição, aquela à qual pode ser atribuído um valor booleano inequívoco (isto é, verdadeiro ou falso). O raciocínio matemático equivale à dedução lógica de novas afirmações matemáticas daquelas previamente estabelecidas.

advogado do diabo

Naturalmente, qualquer abordagem ao raciocínio matemático que se baseie em probabilidades linguísticas sairá do seu caminho. Uma maneira de contornar isso poderia ser incorporar algum sistema de verificação formal na arquitetura (exatamente como o LLM é construído), que verifica continuamente a lógica por trás dos saltos dados pelo grande modelo de linguagem.

Uma pista de que isso foi feito poderia estar no nome Q*, que poderia se referir plausivelmente a um algoritmo desenvolvido na década de 1970 para ajudar no raciocínio dedutivo. Alternativamente, Q* poderia referir-se ao Q-learning, no qual um modelo pode melhorar ao longo do tempo, testando e recompensando conclusões corretas.

Mas existem vários desafios para a construção de IAs matematicamente capazes. Por exemplo, algumas das matemáticas mais interessantes consistem em eventos altamente improváveis. Há muitas situações em que se pode pensar que existe um padrão baseado em números pequenos, mas ele falha inesperadamente quando se verificam casos suficientes. Essa capacidade é difícil de incorporar em uma máquina.

Outro desafio pode surpreender: a pesquisa matemática pode ser altamente criativa. Tem que ser, porque os profissionais precisam inventar novos conceitos e ainda assim permanecer dentro dos regras formais de um assunto antigo.

Qualquer metodologia de IA treinada apenas para encontrar padrões em matemática pré-existente poderia presumivelmente nunca criar uma matemática genuinamente nova. Dada a ligação entre a matemática e a tecnologia, isto parece impedir a concepção de novas revoluções tecnológicas.

Mas vamos bancar o advogado do diabo por um momento e imaginar se a IA poderia de fato criar uma nova matemática. O argumento anterior contra isto tem uma falha, na medida em que também se poderia dizer que os melhores matemáticos humanos também foram treinados exclusivamente em matemática pré-existente. Grandes modelos de linguagem já nos surpreenderam antes e o farão novamente.A Conversação

Tom Oliver, Professor, Ciência da Computação e Engenharia, Universidade de Westminster

Este artigo foi republicado a partir de A Conversação sob uma licença Creative Commons. Leia o artigo original.