Este grupo de investigadores de la Universidad Stanford han desarrollado unas gafas de realidad aumentada para saber qué decir en todo momento. Para ello, utilizan la tecnología de GPT-4, Whisper AI y un módulo de Monocle.
¿Temes quedarte sin palabras en medio de una cita o entrevista de trabajo? Este grupo de investigadores de la Universidad Stanford tienen la solución para ti. Utilizando el poder del modelo de lenguaje GPT-4 y un par de gafas de realidad aumentada, han creado Rizz GPT, un dispositivo con el que podrás ver en directo lo que han decidido describir como «Carisma como Servicio en tiempo real».
RizzGPT te permite tener, en esencia, un teleprónter privado frente a tus ojos. Utilizando los micrófonos integrados, estas gafas van tomando nota de todo lo que se dice durante la conversación. De esta forma, con ayuda de la tecnología que impulsa a ChatGPT, se genera una respuesta textual que puede ayudarte a continuar la conversación como todo un experto.
«Di adiós a las citas y entrevistas de trabajo incómodas«, escribe Bryan Hau-Ping Chiang, uno de sus creadores, en su cuenta oficial de Twitter. Además, describe que para crear este dispositivo se ha utilizado la tecnología de GPT-4, Whisper –inteligencia artificial para el reconocimiento de dictado– y las gafas de realidad aumentada de Monocle.
El curioso funcionamiento de estas gafas de realidad aumentada con GPT-4 integrado
El primer paso en el desarrollo de RizzGPT fue la construcción de las gafas de realidad aumentada. Para ello, se utilizó un dispositivo con la forma y tamaño de un monóculo, desarrollado y donado por la compañía Brilliant Labs. Este gadget se acopla al cristal de las gafas, lo que le permite mostrar información al portador gracias a su pantalla de alta resolución, una cámara y un micrófono.
Posteriormente, se utilizó la tecnología de inteligencia artificial Whisper. Con ella, las gafas pueden recoger las voces de su entorno y convertirlas a texto. Este último se emplea para alimentar al modelo de lenguaje GPT-4, que posteriormente ofrece una respuesta a las peticiones. Todo este proceso sucede en cuestión de segundos, y Bryan Hau-Ping Chiang nos deja un vídeo en su cuenta de Twitter para estudiar su funcionamiento.
Por supuesto, en el vídeo ya se dejan ver los primeros problemas con las gafas. Uno de ellos es la dificultad para leer el contenido indicado por GPT-4. Esto hace inviable el uso de esta tecnología en casi cualquier ámbito. Además, está el factor humano de agregar emociones al guion mostrado por la inteligencia artificial, algo que puede resultar complicado en una conversación de tipo casual.
Eso sí, no se puede negar que la tecnología es emocionante y divertida. Después de todo, muchas son las películas que nos muestran a una persona guiando a otra durante conversaciones con el uso de un micrófono y un pinganillo. Esto solo es su evolución natural.