
OpenAI presentó el lunes la nueva versión de su exitoso chatbot de inteligencia artificial ChatGPT, que puede recibir y responder peticiones combinando audio, imagen y texto.
OpenAI presenta ChatGPT-4o
OpenAI ha lanzado la última versión de su exitoso chatbot de inteligencia artificial, ChatGPT. Esta nueva versión, llamada GPT-4o ("o" de "omni"), promete una experiencia revolucionaria al combinar audio, imagen y texto en sus interacciones. Aunque está disponible gratuitamente para todos los usuarios, los suscriptores podrán disfrutar de funciones adicionales.
Puede leer también | Informe: ChatGPT potencialmente impulsará chatbot IA en iPhone
Unificar Funcionalidades
GPT-4o integra en una sola herramienta las funcionalidades de chatbots, asistentes de voz y modelos de procesamiento de imágenes. Esta combinación ofrece a los usuarios una experiencia más completa y versátil. Según el reportero de tecnología de The New York Times, mientras Apple y Google transforman sus asistentes de voz en chatbots, OpenAI está llevando su chatbot a un nuevo nivel, convirtiéndolo en un asistente de voz.
Puede leer también | Apple : Ingenieros están trabajando para tener un IA similiar a chatGPT.
Características Destacadas
La nueva versión es más rápida que sus predecesoras y tiene un tono más conversacional y cálido, a veces incluso coqueto, en sus respuestas. Durante una demostración en vivo, la IA incluso respondió "me estás haciendo sonrojar" cuando recibió un cumplido.
Puede leer también | OpenAI prioriza productos sobre seguridad
Conversaciones Fluidas y Emotivas
GPT-4o puede responder a peticiones de audio en un promedio de 320 milisegundos, con la capacidad de generar voz en varios estilos emotivos, como dramático o sarcástico. Además, permite a los usuarios interrumpir la conversación en cualquier momento.
Puede leer también | OpenAI usará el periodismo del FT para entrenar IA
"Sé Mis Ojos"
La IA puede describir en tiempo real escenas visuales para usuarios con discapacidad visual, identificando objetos y emociones en expresiones faciales. Esta función se desarrolló en colaboración con la aplicación Be My Eyes.
Puede leer también | Los teléfonos son el pináculo de la inteligencia artificial
Traducción en Tiempo Real
GPT-4o puede actuar como traductor en conversaciones entre personas que hablan diferentes idiomas, aunque con algunos errores. También puede identificar objetos mostrados en la cámara y decir su nombre en otro idioma.
Puede leer también | Las ganancias de Amazon se enfocarán en inteligencia artificial
Asistencia en Reuniones
La IA puede transcribir reuniones, tomar notas y resumir lo que sucedió, facilitando la colaboración y la organización del trabajo en equipo.
Puede leer también | La alucinación no se limita únicamente a la inteligencia artificial
Ayuda con las Matemáticas
Capaz de resolver ecuaciones y guiar a los usuarios en la resolución de problemas matemáticos, GPT-4o es una herramienta útil para estudiantes y profesionales.
Puede leer también | La Inteligencia Artificial: Un Legado que se Remonta al Pasado.
Generación de Imágenes
GPT-4o incluye funcionalidades de generación de imágenes como Dall-E, permitiendo crear imágenes a partir de comandos de texto.
Limitaciones y Desafíos
La demostración de la nueva tecnología no fue perfecta y mostró algunos errores, como confusiones en la identificación de objetos y comentarios inoportunos durante las conversaciones. Aunque la tecnología promete grandes avances, aún existen desafíos que superar en términos de confiabilidad y seguridad. el lanzamiento de ChatGPT-4o marca un paso adelante en la evolución de los asistentes virtuales, combinando texto, audio e imágenes de manera fluida e instantánea. Aunque queda por ver cómo se comportará en interacciones reales, la dirección que está tomando OpenAI parece ponerla a la vanguardia en el campo de la inteligencia artificial conversacional.
Puede leer también | Especializada en inteligencia artificial Apple ha comprado Laserlike

