Inteligencia artificial

OpenAI presenta GPT-4o, un nuevo modelo de inteligencia artificial capaz de hablar

ChatGPT, el asombro que propulsó el desenfreno capitalista de la IA

OpenAI, creadora de ChatGPT, anuncia la "salida" Sam Altman, su principal ejecutivo

OpenAI, creadora de ChatGPT, anuncia la "salida" Sam Altman, su principal ejecutivo

Carles Planas Bou

Carles Planas Bou

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

ChatGPT se convertirá en un asistente de voz. Este lunes, OpenAI anunció que ha dotado a su nuevo modelo de inteligencia artificial (IA), denominado GPT-4o, de nuevas funciones que le permitirán mantener conversaciones de audio en tiempo real e interactuar con texto e imágenes.

La joven empresa liderada por Sam Altman asegura que su nueva aplicación será capaz de responder a las peticiones de los usuarios mucho más rápido que las anteriores versiones. En una serie de demostraciones retransmitidas por Internet, sus dirigentes han expuesto cómo el nuevo ChatGPT podría desenvolverse, desde realizar traducciones de voz casi instantáneas a ayudar a un niño a resolver una ecuación matemática.

"Estamos contemplando el futuro de la interacción entre nosotros y las máquinas", han pontificado Mira Murati, directora de tecnología de OpenAI, en uno de los vídeos promocionales compartidos. Aunque anteriormente la compañía ya había habilitado una versión de ChatGPT capaz de procesar comandos de voz, GPT-4o concentra esa funcionalidad en un único modelo multimodal más eficiente y con menos latencia que además le permite 'observar' su entorno.

Esta nueva IA se ofrecerá de forma gratuita, si bien los usuarios de pago contarán con una mayor capacidad. "En las próximas semanas" estará disponible en ChatGPT y, por primera vez, en una versión de escritorio.

Carrera empresarial

Con este nuevo movimiento, la 'startup' californiana financiada por Microsoft pretende dar un golpe de efecto para seguir liderando la frenética carrera empresarial por el dominio de esta tecnología emergente. Además, responde a la presión para ampliar la base de usuarios de ChatGPT —crucial para que los inversores puedan revalorizar sus acciones en la bolsa— ante una competencia cada vez mayor.

Antes del anuncio del lunes se especuló con que OpenAI presentaría un nuevo buscador impulsado con IA para intentar disputar a Google la hegemonía de las búsquedas en línea. Aunque esa herramienta aún no se ha materializado, dotar ChatGPT de una función de voz también podría apuntar en esa misma dirección. Además, los usuarios gratuitos del chatbot tendrán acceso a una función de "navegación" que le permitirá responder con información actualizada, según explicó la compañía a Reuters.

Imitar lo humano

La nueva función de ChatGPT incorpora una voz femenina (reforzando así el sesgo de género) y la capacidad de reaccionar si es interrumpida por el usuario, dos características que buscan dotar a este sistema de una similitud humana. "Parece la IA de las películas", ha remarcado Altman, consejero delegado de la empresa. Sus palabras parecen una referencia intencionada a Her, película dirigida por Spike Jonze en la que un hombre solitario, interpretado por el actor Joaquin Phoenix, se enamora de una asistente de IA a la que pone voz Scarlett Johansson. La voz de GPT-4o se parece mucho a la de la actriz.

"El hecho de que OpenAI haga hincapié en la interacción por voz para GPT-4o es astuto y, en cierto modo, revelador: se están inclinando por la máscara de la inteligencia, la voz es emotiva y seductora (y lo hacen increíblemente bien), pero no indica necesariamente un salto adelante en capacidad", ha opinado el periodista estadounidense James Vincent.

Algunos expertos han coincidido en recordar que las aplicaciones de OpenAI no razonan como un humano, sino que simulan que lo hacen, y que pensar que esa IA ha tomado conciencia es una "locura". "Por la propia naturaleza de su arquitectura, ningún LLM (modelo de lenguaje grande) puede razonar", ha explicado el ingeniero de software estadounidense Grady Booch. "Esto no quiere decir que no tengan utilidad —la tienen—, sino que no hay que darles poderes que no poseen y que no pueden poseer".

Dudas y opacidad

Las nuevas funciones de la IA de OpenAI han despertado una ola de fascinación, algo habitual con sus productos. Las demostraciones son ciertamente fascinantes, si bien hay muchas dudas no resueltas. Uno de los grandes problemas de ChatGPT es que sigue sufriendo "alucinaciones", como se conoce el hecho de que se invente cosas y presente como ciertas informaciones falsas. ¿Pasará lo mismo con el nuevo asistente de voz?

Otros expertos han remarcado que si ChatGPT es ahora capaz de escuchar y de hablar eso significa que su sistema recopilará lo que le digas, lo que podría generar problemas para la privacidad. Otros han señalado a la opacidad de la compañía. ¿Con qué datos ha entrenado esta nueva IA para dotarla de capacidades más potentes? ¿Se están violando contenidos con derechos de autor?

En 2018, Google anunció el lanzamiento de un asistente, Google Duplex, que usaba la IA para automatizar conversaciones telefónicas, ofreciendo así unas prestaciones similares, si bien a priori menos potentes, a las que ahora vende OpenAI. En diciembre de 2022, la compañía dejó de ofrecer esta herramienta por su poca aplicación.

El músculo de OpenAI

La demostración del lunes pretende ser una exhibición de músculo de OpenAI. Además, los expertos coinciden en que la fecha elegida por presentar su función de voz es un acto de troleo, pues ha sido un día antes de que Alphabet celebre su conferencia anual de desarrolladores de Google, en la que se espera que muestre sus propias novedades relacionadas con la IA.

El pasado sábado, Bloomberg informó que la 'startup' está finalizando un gran pacto con Apple para que el fabricante del iPhone pueda usar la tecnología GPT en sus dispositivos.