Parece que eran tantas las ganas de OpenAI de tener una voz como la de la película Her en GPT-4o que fue a pedírsela a la mismísima Scarlett Johansson. Sin embargo, la actriz rechazó la oferta… aunque eso no impidió que la empresa lanzara un modo de voz que suena muy similar.
La semana pasada, OpenAI lanzó una demostración de su nuevo modelo GPT-4o que incluía un video de su “Modo de voz”. Sky, una de las cinco opciones de voz que tiene la empresa de Inteligencia Artificial, les sonaba bastante familiar a muchos usuarios. Es más, la compararon con la IA que escuchamos en la película Her (2013), interpretada por Scarlett Johansson. Y tanto era el parecido entre voces que la misma actriz recientemente contó que estaba “sorprendida” de que Sam Altman de OpenAI lanzara una voz que sonaba “inquietantemente” como ella después de haber rechazado una oferta para dar su voz.
En una declaración publicada el lunes, Scarlett Johansson explicó que en septiembre de 2023 recibió una oferta de Altman para darle voz al sistema ChatGPT 4.0 actual. “Me dijo que sentía que al expresar el sistema, podría cerrar la brecha entre las empresas de tecnología y los creativos y ayudar a los consumidores a sentirse cómodos con el cambio sísmico que afecta a los humanos y a Al. Dijo que sentía que mi voz sería reconfortante para la gente. Después de mucha consideración y por motivos personales, rechacé la oferta”, contó la actriz.
Sin embargo, nueve meses después, Johansson mencionó que sus amigos, familia y el público en general notaron un llamativo parecido de su voz con la de Sky. “Cuando escuché la demostración publicada, quedé sorprendida, enojada e incrédula de que el Sr. Altman usara una voz que sonaba tan inquietantemente similar a la mía que mis amigos más cercanos y los medios de comunicación no podían notar la diferencia”. La actriz también hizo mención a una publicación de Altman que insinuaba la similitud de la voz con la del sistema de chat que escuchamos en Her, llamada Samantha.
“Dos días antes del lanzamiento de la demostración de ChatGPT 4.0, el Sr. Altman se comunicó con mi agente y me pidió que lo reconsiderara. Antes de que pudiéramos conectarnos, el sistema ya estaba disponible. Como resultado de sus acciones, me vi obligada a contratar un asesor legal, quien escribió dos cartas al Sr. Altman y OpenAl, exponiendo lo que habían hecho y pidiéndoles que detallaran el proceso exacto mediante el cual crearon la voz ‘Sky‘”.
Por último, Scarlett Johansson mencionó que OpenAl “aceptó a regañadientes” eliminar la voz de Sky como opción de Modo de voz. “En una época en la que todos lidiamos con los deepfakes y la protección de nuestra propia imagen, nuestro propio trabajo, nuestras propias identidades, creo que estas son preguntas que merecen una claridad absoluta. Espero una resolución en forma de transparencia y la aprobación de una legislación apropiada para ayudar a garantizar que los derechos individuales estén protegidos”, finalizó el comunicado la actriz.
Si bien OpenAI niega las acusaciones de que utilizó la voz de Johansson, la empresa de igual manera suspendió el uso de Sky mientras busca abordar las preocupaciones. “Creemos que las voces de IA no deben imitar deliberadamente la voz distintiva de una celebridad; la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que usa su propia voz natural. Para proteger su privacidad, no podemos compartir los nombres de nuestros locutores”, dijo la compañía.
Además de esto, OpenAI explicó en una publicación de blog su proceso para crear y elegir las voces que usan en ChatGPT, señalando que trabajó con productores y directores de casting “conocidos y galardonados” a principios de 2023 para identificar diferentes actores de doblaje que podrían convertirse en las voces del producto. De entre más de 400 presentaciones que tuvieron, OpenAI se quedó con una lista de 14 para después presentar sus principales cinco voces para Breeze, Cove, Ember, Juniper y Sky.
“Apoyamos a la comunidad creativa y trabajamos estrechamente con la industria de la actuación de voz para asegurarnos de que tomamos las medidas correctas para emitir las voces de ChatGPT“, dice la publicación del blog. “Cada actor recibe una compensación superior a las tarifas más altas del mercado, y esto continuará mientras sus voces se utilicen en nuestros productos“.
Por último, OpenAI mencionó que planean dar acceso a un nuevo modo de voz para GPT-4o en las próximas semanas y que agregarán aún más opciones de voces adicionales “para adaptarse mejor a los diversos intereses y preferencias de los usuarios”.