Daboost/Shutterstock

Con la despido reciente y recontratación rápida de Sam Altman por OpenAI, los debates en torno al desarrollo y uso de la inteligencia artificial (IA) vuelven a estar en el centro de atención. Lo que es más inusual es que un tema prominente en los informes de los medios ha sido la capacidad de Sistemas de IA para hacer matemáticas.

Aparentemente, parte del drama en OpenAI estaba relacionado con el desarrollo por parte de la compañía de un nuevo Algoritmo de IA llamado Q*. Se ha hablado del sistema como un avance significativo y una de sus características más destacadas era la capacidad de razonar matemáticamente.

¿Pero no son las matemáticas la base de la IA? ¿Cómo podría un sistema de IA tener problemas con el razonamiento matemático, dado que las computadoras y calculadoras pueden realizar tareas matemáticas?

La IA no es una entidad única. Es un mosaico de estrategias para realizar cálculos sin instrucción directa de humanos. Como veremos, algunos sistemas de IA son competentes en matemáticas.

Sin embargo, una de las tecnologías actuales más importantes, los grandes modelos de lenguaje (LLM) detrás de los chatbots de IA como ChatGPT, ha tenido dificultades hasta ahora para emular el razonamiento matemático. Esto se debe a que han sido diseñados para concentrarse en el lenguaje.


gráfico de suscripción interior


Si el nuevo algoritmo Q* de la empresa puede resolver problemas matemáticos invisibles, entonces bien podría ser ser un avance significativo. Las matemáticas son una forma antigua de razonamiento humano que modelos de lenguaje grande (LLM) hasta ahora han luchado por emular. Los LLM son la tecnología que subyace a sistemas como ChatGPT de OpenAI.

En el momento de escribir este artículo, los detalles del algoritmo Q* y sus capacidades son limitados, pero muy intrigantes. Por tanto, hay varias sutilezas a considerar antes de considerar que Q* es un éxito.

Por ejemplo, las matemáticas son una materia con la que todos se involucran en distintos grados, y el nivel de matemáticas en el que Q* es competente sigue sin estar claro. Sin embargo, se han publicado trabajos académicos que utilizan formas alternativas de IA para avanzar en las matemáticas a nivel de investigación (incluyendo algunos escritos por mí, y uno escrito por un equipo de matemáticos en colaboración con investigadores de Google DeepMind).

Estos sistemas de IA podrían describirse como competentes en matemáticas. Sin embargo, es probable que Q* no se utilice para ayudar a los académicos en su trabajo, sino que tenga otro propósito.

Sin embargo, incluso si Q* es incapaz de traspasar los límites de la investigación de vanguardia, es muy probable que se encuentre cierta importancia en la forma en que se ha construido que podría generar tentadoras oportunidades para el desarrollo futuro.

Cada vez más cómodo

Como sociedad, nos sentimos cada vez más cómodos con el uso de IA especializada para resolver tipos predeterminados de problemas. Por ejemplo, asistentes digitales, reconocimiento facialy sistemas de recomendación en línea resultará familiar para la mayoría de la gente. Lo que sigue siendo difícil de alcanzar es el llamado “inteligencia general artificial” (AGI) que tiene amplias capacidades de razonamiento comparables a las de un ser humano.

Las matemáticas son una habilidad básica que aspiramos enseñar a todos los escolares y seguramente calificarían como un hito fundamental en la búsqueda de AGI. Entonces, ¿de qué otra manera podrían ayudar a la sociedad los sistemas de IA matemáticamente competentes?

La mentalidad matemática es relevante para una multitud de aplicaciones, por ejemplo, codificación e ingeniería, por lo que el razonamiento matemático es una habilidad transferible vital tanto para la inteligencia humana como para la artificial. Una ironía es que la IA se basa, en un nivel fundamental, en las matemáticas.

Por ejemplo, muchas de las técnicas implementadas por los algoritmos de IA se reducen en última instancia a un área matemática conocida como álgebra matricial. Una matriz es simplemente una cuadrícula de números, de la cual una imagen digital es un ejemplo familiar. Cada píxel es nada más que datos numéricos.

Los modelos de lenguajes grandes también son inherentemente matemáticos. A partir de una enorme muestra de texto, una máquina puede aprender las probabilidades de las palabras que son es más probable que siga un mensaje (o pregunta) del usuario al chatbot. Si desea que un LLM previamente capacitado se especialice en un tema en particular, entonces puede ajustarlo a la literatura matemática o cualquier otro dominio de aprendizaje. Un LLM puede generar texto que se lea como si entendiera matemáticas.

Desafortunadamente, hacerlo produce un LLM que es bueno para farolear, pero malo para los detalles. La cuestión es que un enunciado matemático es, por definición, aquel al que se le puede asignar una valor booleano inequívoco (es decir, verdadero o falso). El razonamiento matemático equivale a la deducción lógica de nuevos enunciados matemáticos a partir de los previamente establecidos.

abogado del diablo

Naturalmente, cualquier enfoque del razonamiento matemático que se base en probabilidades lingüísticas se saldrá de su carril. Una forma de evitar esto podría ser incorporar algún sistema de verificación formal en la arquitectura (exactamente cómo se construye el LLM), que verifique continuamente la lógica detrás de los saltos realizados por el modelo de lenguaje grande.

Una pista de que esto se ha hecho podría estar en el nombre Q*, que podría referirse plausiblemente a un algoritmo desarrollado allá por la década de 1970 para ayudar con el razonamiento deductivo. Alternativamente, Q* podría referirse a Q-learning, en el que un modelo puede mejorar con el tiempo probando y recompensando las conclusiones que sean correctas.

Pero existen varios desafíos para construir IA matemáticamente capaces. Por ejemplo, algunas de las matemáticas más interesantes consisten en acontecimientos muy improbables. Hay muchas situaciones en las que uno puede pensar que existe un patrón basado en números pequeños, pero inesperadamente se rompe cuando se verifican suficientes casos. Esta capacidad es difícil de incorporar a una máquina.

Otro desafío puede resultar sorprendente: la investigación matemática puede ser muy creativa. Tiene que serlo, porque los profesionales necesitan inventar nuevos conceptos y aun así mantenerse dentro de los límites establecidos. reglas formales de un tema antiguo.

Cualquier metodología de IA entrenada únicamente para encontrar patrones en matemáticas preexistentes probablemente nunca podría crear matemáticas genuinamente nuevas. Dada la relación entre matemáticas y tecnología, esto parece impedir la concepción de nuevas revoluciones tecnológicas.

Pero hagamos de abogado del diablo por un momento e imaginemos si la IA podría realmente crear nuevas matemáticas. El argumento anterior en contra de esto tiene un defecto, ya que también podría decirse que los mejores matemáticos humanos también se formaron exclusivamente en matemáticas preexistentes. Los grandes modelos lingüísticos nos han sorprendido antes y lo volverán a hacer.La conversación

Tom Oliver, Profesor, Ciencias de la Computación e Ingeniería, Universidad de Westminster

Este artículo se republica de La conversación bajo una licencia Creative Commons. Leer el articulo original.