Nos pasamos horas hablando en videoconferencias con gente que apenas nos mira a los ojos. Las webcams de los portátiles o de los móviles provocan que casi nadie mire a la cámara ?que es como mirarnos a los ojos? cuando habla: como mucho hablan mirando a la pantalla, lo que hace que para nosotros estén mirando algo para arriba (o para abajo, o para un lado).
Precisamente eso es lo que soluciona NVIDIA Maxine, una SDK que permite corregir la posición de los ojos gracias a un algoritmo de inteligencia artificial. Con eso se logra que siempre estemos mirando a nuestro interlocutor a los ojos aunque estemos mirando a otro lado. La idea es fantástica aunque de momento solo está disponible para desarrolladores.
El SDK NVIDIA Maxine lleva ya algún tiempo disponible, y ofrece una serie de características potenciadas por sus GPUs y por la inteligencia artificial que están destinadas a mejorar la calidad y características de nuestras videoconferencias o sesiones de streaming en directo.
El SDK tiene varios apartados ?efectos de audio, de vídeo o de realidad aumentada? y puede ser combinado con NVIDIA Riva, otro SDK que está pensado para apliaciones conversacionales y que por ejemplo ayuda en tareas como la transcripción o la traducción en tiempo real.
Precisamente ayer NVIDIA destacaba varias novedades en ese ámbito en NVIDIA Maxine. Una de ellas era un efecto de audio que resolvía el problema del 'cocktail party' que filtra sonidos de fondo no deseados, permitiendo que se nos pueda escuchar mejor.
Sin embargo una de las opciones que más llaman la atención es la capacidad de corregir nuestra mirada para simular que siempre estamos mirando a cámara y hacemos "contacto visual" en todo momento con nuestro interlocutor.
En la demostración de Alex Qi, responsable de este proyecto, se podía ver cómo al desviar la vista en realidad sus ojos siempre estaban mirando a cámara, o eso parecía. La función forma parte del SDK de Realidad Aumentada de NVIDIA Maxine, que está disponible para desarrolladores de forma preliminar.
¿Qué significa eso? Pues que de momento no es fácil que podamos disfrutar de esta opción, ya que son los desarrolladores los que podrán acceder a esa función de forma restringida ?hay que firmar un acuerdo de confidencialidad?.
Esta solución está por el momento pensada para que empresas que por ejemplo desarrollan aplicaciones de videoconfernecia ?Zoom, Skype, etc? puedan experimentar con esta función y la incluyan en sus servicios en el futuro. Es desde luego una propuesta estupenda que, eso sí, hará necesaria también una tarjeta gráfica de NVIDIA que dé acceso a esas funciones de inteligencia artificial.
Imagen | Dylan Ferreira
Más información | NVIDIA
.