Synthesia ahora te permite hacer presentaciones de avatar AI utilizando una cámara web.

Synthesia lanzó una opción para crear avatares generados por inteligencia artificial grabando imágenes de ti mismo con una cámara web o tu teléfono.

Synthesia, una startup de inteligencia artificial británica, mostró el lunes una serie de nuevas actualizaciones de productos que incluyen la capacidad de crear tus propias presentaciones al estilo de Apple con avatares de IA utilizando solo una cámara web de laptop o tu teléfono.

La empresa de siete años, respaldada por Nvidia, dijo que las nuevas actualizaciones del producto la convertirán en una suite de producción de video más completa para grandes empresas, en lugar de ser solo una plataforma que ofrece a los usuarios la capacidad de crear avatares generados por IA.

Entre las nuevas actualizaciones que Synthesia está lanzando se encuentra la capacidad de producir avatares de IA utilizando cámaras web o un teléfono, avatares de “cuerpo completo” con manos y brazos, y una herramienta de grabación de pantalla que muestra un avatar de IA guiándote a través de lo que estás viendo.

¿Qué es Synthesia?

Synthesia, que dice ser utilizado por casi la mitad de las empresas del Fortune 500, utiliza avatares de IA para todo tipo de propósitos.

Estos pueden variar desde la creación de videos de capacitación personalizados para guiar a los empleados en ciertos procesos, hasta la generación de material promocional que se puede mostrar en forma de video en lugar de un correo electrónico u otras comunicaciones textuales.

Pero eso no siempre ha sido así. Según el cofundador y CEO Victor Riparbelli, en los primeros tres años de la historia de la empresa, Synthesia en realidad comenzó tratando de vender su tecnología a agencias de Hollywood y compañías de producción de video de gran presupuesto. La empresa utilizaba visión por computadora para una herramienta de doblaje de IA que hacía que los movimientos de la boca fueran más realistas para diferentes idiomas.

LEAR  Arm, propiedad de SoftBank, cancela la licencia de diseño de Qualcomm en medio de una disputa legal.

“Lo que descubrimos fue que el umbral de calidad para hacer algo con estas personas era tan grande, que no importa lo que hagamos, seremos una parte muy pequeña de un proceso mucho más grande”, dijo Riparbelli a CNBC en una entrevista en la oficina de la empresa en Londres.

“Lo que resultó más interesante fue el aspecto de democratización: Hay millones de personas en el mundo que quieren hacer video, pero no están haciendo video hoy porque no tienen el presupuesto.”

En una presentación al estilo de Apple, el CEO de Synthesia presentó los nuevos productos de la empresa, destacándolos como una suite de herramientas más enfocada en la productividad para ser utilizada por empresas, en lugar de ser solo una plataforma que ofrece avatares de IA.

Presentaciones al estilo de Apple con una cámara web

Una de las características más importantes que la empresa mostró fue la opción de crear avatares generados por IA grabando menos de cinco minutos de imágenes utilizando una cámara web o tu teléfono. También puedes clonar tu voz para que los avatares hablen en varios idiomas diferentes.

Típicamente, para hacer un avatar de IA utilizando la plataforma de Synthesia, debes ir personalmente a un estudio. Los actores humanos entran en una cabina de grabación, graban su voz y realizan líneas frente a un fondo verde en un set de filmación real.

Estos son datos de entrenamiento para proporcionar al algoritmo de IA de Synthesia las sutilezas faciales y vocales que necesita para crear avatares humanos que hablen de manera expresiva. A principios de este año, Synthesia presentó nuevos avatares expresivos que pueden transmitir emociones humanas, incluyendo felicidad, tristeza y frustración.

LEAR  Al menos 32 muertos en el ataque a una playa en Somalia, según la policía.

Pero ahora, Synthesia está introduciendo un nuevo software que facilitará a los usuarios producir una versión digital de ellos mismos desde cualquier lugar, utilizando solo una cámara web y el software de Synthesia.

La empresa también está lanzando la capacidad de crear avatares de cuerpo completo. Esto es diferente a los avatares actuales de Synthesia, que están limitados a la vista de retrato. Ahora, puedes ir a un estudio con docenas de cámaras, sensores y luces a tu alrededor para hacer avatares que puedan mover sus manos.

Generar manos es algo que tradicionalmente es difícil para la IA hacer, a menudo porque las manos son solo una pequeña parte del cuerpo humano y no suelen ser el foco en el contenido visual.

Synthesia también presentó la opción de reproducir videos de avatares de IA hablando en el idioma que prefieran, ya sea inglés, francés, alemán o chino.

En el futuro, Synthesia dice que podrá adaptar los avatares de IA para diferentes países: Por ejemplo, un avatar nigeriano guiando a un usuario a través de un tutorial en lugar de uno estadounidense.

El asistente de video de IA de Synthesia puede producir resúmenes de artículos y documentos completos.

Synthesia también lanzó un nuevo asistente de video de IA que puede producir resúmenes de artículos y documentos completos. Esto podría ser un especialista en recursos humanos haciendo un video rápido explicando paquetes de beneficios de la empresa, por ejemplo.

La herramienta de grabación de pantalla de Synthesia muestra a un avatar de IA guiándote a través de lo que estás viendo.

Otra característica importante que la empresa está implementando es una nueva herramienta de grabación de pantalla, que muestra a un avatar de IA guiándote a través de lo que estás viendo.

No persiguiendo un ‘momento de relaciones públicas’

En la entrevista de CNBC con él, Riparbelli caracterizó lo que Synthesia está tratando de hacer como una revisión del producto enfocada en la empresa, que la haría más similar a gigantes como Microsoft, Salesforce y Zoom en la categoría empresarial.

LEAR  Los secretos del éxito con Paul Hudson, CEO de Sanofi, el líder que está utilizando la inteligencia artificial para encontrar el próximo medicamento maravilla farmacéutico.

“El mundo ha quedado asombrado por este tipo de cosas durante los últimos 12 a 18 a 24 meses, lo cual es increíble”, dijo Riparbelli a CNBC.

“Pero ahora hemos experimentado mucho, y hemos encontrado los casos de uso correctos para estas tecnologías que tienen un valor comercial duradero. No son como un simple momento de relaciones públicas a corto plazo.”

“Necesitas tener ese objetivo comercial de reducir los tickets de soporte al cliente mostrando videos en lugar de texto; o vender haciendo videos en lugar de simplemente enviar correos electrónicos”, agregó.

“Ahora las personas están creando flujos de trabajo en torno a eso. Necesitan mejores formas de lograr sus objetivos comerciales, no solo una interfaz con modelos de IA. Eso es hacia donde nos dirigimos como empresa.”

El año pasado, Synthesia recaudó $90 millones de inversores, incluyendo al fabricante de chips estadounidense Nvidia y la firma de capital de riesgo Accel, en una ronda de financiación que la valoró en $1 mil millones y le otorgó el estatus de “unicornio”.

Los competidores de la empresa incluyen herramientas de video de IA como Veed, Colossyan, Elai y HeyGen. Y la aplicación de redes sociales de propiedad china TikTok también presentó recientemente Symphony Assistant, un producto que permite a los creadores hacer sus propios avatares de IA.

La empresa obtiene ingresos a través de varios planes de precios de suscripción que van desde $22 para un plan “starter” y $67 para un plan “creator”, hasta planes “enterprise” personalizados donde el precio se basa en negociaciones con el equipo de ventas de Synthesia.