PM005 – Procedimiento Audiovisual
1. Particularidades de los trabajos audiovisuales
Este tipo de trabajos hacen referencia a todos aquellos cuyos archivos de origen o destino son documentos de audio o vídeo, y pueden requerirse como un trabajo completo (transcripción, traducción, subtitulado, voiceover, etc.) o parcial. En función de lo que requiera el cliente y de lo que nos envíe será necesario realizar una única parte del trabajo o varias. Definimos en primer lugar cada uno de estos pasos de acuerdo a nuestra forma habitual de gestionar estos trabajos:
- Transcripción: se trata de escribir en texto el contenido de un audio o de un vídeo. El resultado estará en el mismo idioma que el original.
- Traducción: se trata de escribir en texto el contenido de un audio o de un vídeo. El resultado estará en otro idioma que el original.
- Subtitulación: se trata de «trocear» y «pautar» un texto de acuerdo con las convenciones usuales de subtitulado, a fin de que los textos se muestren en pantalla a medida que avanza la locución, donde se le marcan los tiempos de entrada y salida de cada uno de esos subtítulos. El resultado puede ser en un mismo idioma o en otro idioma que el original, y el formato suele ser, generalmente, un archivo .srt. El archivo de subtítulos permite al usuario activarlos o desactivarlos en función de sus necesidades.
- Incrustado/quemado: se trata de la inserción de los subtítulos dentro del propio vídeo. El resultado es un vídeo con los subtítulos ya dentro del vídeo, lo que le impide poder activarlos o desactivarlos.
- Voiceover: se trata de una locución para el vídeo/audio, generalmente entregable en formato .wav o .mp3. El voiceover puede estar sincronizado (o no) con otros elementos del vídeo/audio, y puede ser labial (o no), de manera que parezca que la persona que habla está realmente diciendo lo que se escucha. Al voiceover también se le puede llamar «doblaje».
- Maquetado: aunque le damos el nombre genérico de «maquetado», en nuestro caso se trata de todo el proceso de creación de un vídeo final donde se conjugan muchos procesos finales: grafismos, sincronización de audio, música, etc.
Puesto que la mayoría de ocasiones los clientes solicitarán un producto «final» (por ejemplo, una subtitulación), es necesario ser conscientes de qué necesitamos realizar antes a fin de poder obtener ese resultado final. También es muy importante confirmar con el cliente qué es lo que necesita que le entreguemos a fin de poder evitar cualquier malentendido por el uso de la terminología, ya que en muchas ocasiones el cliente no es capaz de expresar correctamente lo que necesita y podría utilizar una terminología diferente a la que nosotros consideramos justo aquí arriba.
2. Transcripción
2.1 Qué se necesita para realizar una transcripción
Tan solo necesitamos un archivo de audio o de vídeo. El trabajo que realizaremos nosotros será el de escribir en texto el contenido de dicho audio o vídeo, en el mismo idioma que el original.
2.2 Qué se entrega con una transcripción
Se entrega un archivo de Word con el contenido en el mismo idioma que el original.
2.3 Consideraciones de una transcripción
- Forma de realización: La forma de realizar una transcripción puede variar en función de los requisitos específicos del cliente o incluso de las preferencias del transcriptor (o las nuestras propias). Por ejemplo, podría ser una transcripción sin indicar los tiempos, o bien pautarse de forma genérica (marcar los tiempos aproximados en los que se habla a lo largo del documento), o indicar quién dice cada frase/párrafo, o bien transcribirse o no los textos visuales en la pantalla…
La transcripción será un trabajo realizado por:
-
- Whisper: Utilizaremos por defecto esta herramienta de inteligencia artificial, que se encuentra en CRM > Recursos > HumanAI+ > «Whisper» con la que se puede obtener la transcripción de un archivo de audio fácil y rápidamente. El resultado será un archivo de texto plano que pasaremos para revisar a un transcriptor.
- Transcriptor: en caso de que por algún motivo (el idioma del vídeo/audio no existe en Whisper, el resultado de la transcripción no es bueno, no hay transcriptores que quieran revisar el resultado de un proceso automático, etc.) no se pueda usar Whisper.
A tener en cuenta:
-
- Por defecto, y a menos que el cliente nos lo especifique de algún modo, en nuestro caso siempre dejaremos el formato a elección del transcriptor, como le sea más cómodo y cuyo resultado final sea entendible. Respecto a los textos visuales en pantalla, siempre preguntaremos al cliente si los requiere o no.
- En lo que respecta a coletillas del hablante, dubitaciones, etc., a menos que el cliente nos indique instrucciones específicas, trataremos de no mostrarlas en la transcripción.
- En proyectos multilingües, la transcripción solamente se realiza una única vez, ya que es llevar a texto el idioma original, que servirá de base para los siguientes pasos.
- Recuentos y plazos:
- Cliente: Las transcripciones se calculan por tiempo en minutos y siempre se redondea al alza. Además, cada uno de los audios/vídeos se tratará de forma independiente y no se realizará una suma del total. Por ejemplo, si el vídeo/audio A dura 4 minutos y 37 segundos, se considerará que dura 5 minutos. Si el vídeo/audio B dura 8 minutos y 2 segundos, se considerará que dura 9 minutos. El total para los recuentos, por lo tanto, sería de 14 minutos (y no 13 minutos que resultaría de la suma del total de vídeos/audios). A efectos de plazo, calculamos que 1 minuto de audio/vídeo equivale a 10 minutos de trabajo. Importante: Si no se llega al mínimo, se aplicará la tarifa mínima.
- Revisor de transcripción: por norma general consideramos que la revisión de una transcripción llevada a cabo por Whisper corresponderá a 1,5 minutos de trabajo por cada minuto de audio/vídeo. Es decir, si un vídeo/audio dura 2 minutos, consideramos que la revisión de la transcripción llevará 3 minutos (2 x 1,5).
- Transcriptor: por norma general consideramos que 1 minuto de audio/vídeo corresponderá a 6 minutos de trabajo. Importante: tanto para el revisor de transcripción como para el transcriptor, la forma habitual de calcular el tiempo que les puede llevar el trabajo se realiza por horas de trabajo. En cualquier caso, podría haber proveedores que prefieran facturar los minutos reales del audio/vídeo y por lo tanto, tendrán una tarifa por minutos. En esos casos, corresponde a la PM evaluar si la tarifa es razonable para el encargo en cuestión.
3. Traducción
3.1 Qué se necesita para realizar una traducción
Para realizar una traducción audiovisual necesitamos el texto escrito, por lo que en caso de que no exista una transcripción del audio/vídeo, será necesario realizar antes el proceso de transcripción. En caso de que el cliente envíe el texto ya escrito, lógicamente no es necesario por nuestra parte realizar el proceso de transcripción previo.
3.2 Qué se entrega con una traducción
Se entrega un archivo de Word con el contenido en otro idioma. Podría ser la traducción del paso previo (transcripción) o bien la traducción del archivo escrito que envíe el cliente.
3.3 Consideraciones de una traducción
- Forma de realización: en lo que respecta al trabajo de traducción propiamente, se tratará según las siguientes características:
- Si solo se requiere traducción: se tratará como un trabajo de traducción estándar.
- Si posteriormente requerirá subtitulado: es importante indicarlo al traductor, junto con la premisa de que es importante ser lo más escueto y breve posible en la traducción.
- Si posteriormente requerirá voiceover: es importante indicarlo al traductor, a fin de que sea lo más natural posible
- Debe tenerse en cuenta el audio/vídeo como referencia contextual.
- Presupuesto: Las traducciones se cotizan por palabras (con la tarifa mínima correspondiente).
- Al cliente: si no disponemos de la transcripción (todavía) o texto por parte del cliente, calcularemos unas 175 palabras/minuto (si hablan mucho, 200 palabras/minuto; si hablan poco 150 palabras/minuto, pero no menos). En caso de que el cliente nos proporcione el texto de antemano, se cotizará el recuento real que ya tengamos, lógicamente.
- Recuentos: solamente para el cálculo de palabras esperables para traducción, se realizará una suma del total del tiempo de los vídeos/audios. Por ejemplo, si el vídeo/audio A dura 1 minuto y 37 segundos, y el vídeo/audio B dura 2 minutos y 52 segundos. Dicho total, lo redondearemos al alza, por lo que resultarían en 5 minutos. Será en base a estos 5 minutos con los que calcularemos las palabras que esperamos para traducir de acuerdo con el cálculo de palabras/minuto indicado anteriormente.
- Al traductor: puesto que al traductor ya le entregaremos el texto transcrito (o proporcionado por el cliente) se le contabilizará el recuento real en el momento de enviarle el trabajo.
- Al cliente: si no disponemos de la transcripción (todavía) o texto por parte del cliente, calcularemos unas 175 palabras/minuto (si hablan mucho, 200 palabras/minuto; si hablan poco 150 palabras/minuto, pero no menos). En caso de que el cliente nos proporcione el texto de antemano, se cotizará el recuento real que ya tengamos, lógicamente.
- Plazos: se calcularán los plazos habituales de traducción.
- Notas: Como excepción, podría darse el caso de que para un audio/vídeo muy pequeñito (alrededor de 1 minuto) se prefiera realizar el paso directo de traducción (a vista/oído) sin necesidad de realizar la transcripción previa (a menos que el cliente necesite que entreguemos también dicha transcripción).
4. Subtitulación
4.1 Qué se necesita para realizar una subtitulación
Para realizar un subtitulado necesitamos el texto traducido, por lo que en caso de que no exista una traducción del audio/vídeo, será necesario realizar antes el proceso de traducción. En caso de que el cliente envíe el texto ya traducido, lógicamente no es necesario por nuestra parte realizar el proceso de traducción previo.
Aunque es raro que nos lo soliciten, también podría realizarse una subtitulación del idioma original (en cuyo caso necesitaríamos la transcripción). Esto suele requerirse en casos de subtitulación para sordos.
4.2 Qué se entrega con una subtitulación
En nuestro caso, la subtitulación va acompañada del pautado, y lo tratamos como un único proceso, es decir, trocear en subtítulos el texto traducido además de añadirle las marcas (tiempos) de entrada y salida de cada uno de los subtítulos. El archivo final generado es un archivo .srt (podrían ser otros, si el cliente así lo requiere). Este archivo puede activarse/desactivarse a fin de que el espectador pueda ver (o no) los subtítulos en pantalla.
Tanto el cliente como nosotros de forma interna podemos hacer la prueba de abrir el vídeo y activar los subtítulos con el programa VLC. Para ello, es necesario guardar en una carpeta tanto el vídeo como el archivo .srt (ambos con el mismo nombre). Es decir, para que un vídeo muestre los subtítulos srt es necesario que el vídeo y el archivo de subtítulos srt se encuentren en la misma carpeta, y que tanto el vídeo como el archivo de subtítulos tengan el mismo nombre (mismo filename).
Aunque de manera estándar es preferible que este proceso lo realice siempre el subtitulador, en caso de necesitar realizar algún cambio en algún subtítulo, podríamos realizarlo nosotros internamente. Ver Resource 05 – Otras herramientas específicas (Apartado 2, Aegisub). Como alternativa, también se puede abrir el archivo .srt con Notepad++ y editarlo directamente.
4.3 Consideraciones de una subtitulación
- Forma de realización: como norma general, y a menos que el cliente nos dé instrucciones específicas al respecto, nos adecuaremos a las convenciones estándar de subtitulado (que por supuesto debe conocer el proveedor). A modo de referencia, pueden verse estas convenciones aquí: https://nuriamasdeu.com/normas-subtitulado/ y https://revistadigital.inesem.es/idiomas/normas-subtitulacion/
- Excepción: en la mayoría de ocasiones, nuestros clientes no son productoras audiovisuales con unas directrices específicas, por lo que podría darse el caso que, debido a diferentes posibles circunstancias (idiomas de trabajo, características del audio/vídeo, etc.) no podamos cumplir al 100% con dichas convenciones. En estos casos, podemos realizar excepciones siempre que se trate de frases concretas y de estar «bordeando» dichas convenciones. Por ejemplo, si alguna frase en concreto necesitamos que tenga 40 caracteres en lugar de 37, sería aceptable. No sería aceptable que la frase tuviera 50 caracteres.
- Presupuesto: las subtitulaciones se cotizan por tiempo en minutos (con la tarifa mínima correspondiente). Para los tiempos, siempre se redondea al alza. Por ejemplo, un audio/vídeo de 27 minutos y 11 segundos se considerará como si fueran 28 minutos. Un audio/vídeo de 1 minuto y 3 segundos se considerará como si fueran 2 minutos (aunque en este caso aplicará la tarifa mínima).
- Recuentos: cada uno de los audios/vídeos se tratará de forma independiente y no se realizará una suma del total. Por ejemplo, si el vídeo/audio A dura 1 minuto y 37 segundos, se considerará que dura 2 minutos. Si el vídeo/audio B dura 1 minuto y 15 segundos, se considerará que dura 2 minutos. El total para los recuentos, por lo tanto, sería de 4 minutos (y no 3 minutos que resultaría de la suma exacta del total de vídeos/audios).
- Plazos: para vídeos pequeños (menos de 5 minutos), el trabajo podría llegar a realizarse en 24h. No obstante, y sobre todo en caso de trabajos mayores, conviene consultar con el proveedor.
- Notas:
- Antes de proceder a la subtitulación de una traducción realizada, hay que pasarle al cliente el texto traducido para que lo revise y modifique lo que considere necesario porque en caso de que el cliente quiera hacer cambios en el texto tras la subtitulación, este trabajo se debería presupuestar (o al menos valorar el motivo de dichos cambios por si fuera algo que debiéramos asumir de forma interna).
- En proyectos multilingües, conviene alterar el orden en el que se realizará el proceso, debido a que el subtitulador no conocerá muchos de los idiomas en los que haya que subtitular. Para ello, el proceso estándar y más eficiente de realización en cuanto a plazos será el siguiente: transcripción, subtitulación del idioma original* (troceo y pautado), traducción de los subtítulos a cada uno de los idiomas (preparar siguiendo las instrucciones del artículo Traducción de archivos de subtítulos SRT: límite de caracteres), reajustes (verificación por parte del gestor de proyectos de que se ha seguido la norma del límite de caracteres, junto con la ayuda del traductor si se necesita, además de la verificación general). En este caso, no sería necesario enviarle al cliente las traducciones para que confirme porque ya se está realizando directamente la subtitulación. Si requiere de cambios, se pueden hacer en los propios documentos de subtítulos.
- * Otra opción podría ser: transcripción, traducción a idioma base, subtitulación de dicho idioma base (troceo y pautado), traducción de los subtítulos a cada uno de los idiomas (preparar siguiendo las instrucciones del artículo Traducción de archivos de subtítulos SRT: límite de caracteres), reajustes (verificación por parte del gestor de proyectos de que se ha seguido la norma del límite de caracteres, junto con la ayuda del traductor si se necesita, además de la verificación general).
- Como excepción, podría darse el caso de que para un audio/vídeo muy pequeñito (alrededor de 1 minuto) se prefiera realizar el paso directo de subtitulación (a vista/oído) sin necesidad de realizar la transcripción o traducción previa (a menos que el cliente necesite que entreguemos también dicha transcripción/traducción).
- En caso de que el vídeo contenga texto escrito en pantalla, es necesario consultar con el cliente si se requiere que ese texto esté en los subtítulos o no.
- Subtitulador: hay proveedores que facturan por tiempo de trabajo, es decir, ellos calculan cuánto tiempo les va a llevar la subtitulación y por lo tanto, aplican una tarifa por horas. El Project Manager debe ser capaz de calcular si el tiempo es más o menos razonable. La mayoría de proveedores, sin embargo, prefieren facturar los minutos reales del vídeo y por lo tanto, tendrán una tarifa por minutos.
5. Incrustado/quemado
5.1 Qué se necesita para realizar un incrustado/quemado
Para realizar un incrustado/quemado necesitamos el archivo de subtítulos (generalmente .srt), por lo que en caso de que no exista un archivo de subtítulos será necesario realizar antes el proceso de subtitulación.
5.2 Qué se entrega con un incrustado/quemado
Se entrega el vídeo original del cliente que ya contiene los subtítulos incrustados/quemados. De esta forma, el espectador no podrá activarlos/desactivarlos.
Lo realizará el propio gestor de proyectos siguiendo el manual Resource 05 – Otras herramientas específicas (Apartado 3, Handbrake). Si se nos pide algo más complicado que una maquetación normal y corriente y no sabemos cómo proceder, le solicitaremos el paso del quemado a la misma persona que ha realizado la subtitulación.
5.3 Consideraciones de un incrustado/quemado
- AVISO IMPORTANTE: Muchos clientes desconocen este paso, y simplemente piden «subtitular», por lo que de forma general pensaremos en el punto anterior. Sin embargo, lo que realmente quieren es que les devolvamos un vídeo con los subtítulos incrustados. Por este motivo, y aunque en nuestros presupuestos se indica de forma expresa qué es lo que se les va a entregar en función de lo que nos solicitan, es muy importante intentar aclarar con el cliente qué necesitan que entreguemos realmente, a fin de presupuestar este paso o no.
- Presupuesto: las incrustaciones/quemados se cotizan por tiempo en minutos (con la tarifa mínima correspondiente). Para los tiempos, siempre se redondea al alza. Por ejemplo, un audio/vídeo de 27 minutos y 11 segundos se considerará como si fueran 28 minutos. Un audio/vídeo de 1 minuto y 3 segundos se considerará como si fueran 2 minutos (aunque en este caso aplicará la tarifa mínima).
- Recuentos: cada uno de los audios/vídeos se tratará de forma independiente y no se realizará una suma del total. Por ejemplo, si el vídeo/audio A dura 1 minuto y 37 segundos, se considerará que dura 2 minutos. Si el vídeo/audio B dura 1 minuto y 15 segundos, se considerará que dura 2 minutos. El total para los recuentos, por lo tanto, sería de 4 minutos (y no 3 minutos que resultaría de la suma exacta del total de vídeos/audios).
- Plazos: para vídeos pequeños (menos de 5 minutos), el trabajo podría llegar a realizarse en 24h. No obstante, y sobre todo en caso de trabajos mayores, conviene consultar con el proveedor.
- Notas:
- Antes de proceder al quemado de una subtitulación realizada por nosotros, hay que pasarle al cliente el archivo de subtítulos junto con una explicación de cómo puede verlos para que los revise y modifique como considere necesario porque en caso de que el cliente quiera hacer cambios en el texto tras el quemado, este trabajo se debería presupuestar (o al menos valorar el motivo de dichos cambios por si fuera algo que debiéramos asumir de forma interna).
- Los programas de quemado, como Handbrake, contienen unos ajustes predefinidos que son los que se utilizarán de modo estándar para realizar los quemados. Sin embargo, en caso de que el cliente lo solicite con unos requisitos específicos, será necesario tenerlos en cuenta para ajustarlos antes de realizar el quemado. Si el cliente envía un vídeo de referencia con subtítulos para que los hagamos igual pero no sabemos exactamente cómo son, podemos consultarle por la tipografía, el tamaño y otras características exactas.
- En caso de que el vídeo contenga texto escrito en pantalla, es necesario consultar con el cliente si se requiere que ese texto esté en los subtítulos/quemado o no.
6. Voiceover
6.1 Qué se necesita para realizar un voiceover
Para realizar un voiceover necesitamos el texto escrito (generalmente la traducción), por lo que en caso de que no exista dicho texto escrito será necesario obtenerlo con anterioridad.
También es necesario saber con total certeza la voz elegida por el cliente. Ver punto 6.3.
6.2 Qué se entrega con un voiceover
Se entrega el archivo de audio obtenido tras realizar la grabación, generalmente en formato .wav (aunque también podría ser un .mp3).
6.3 Consideraciones de un voiceover
- Elección de la voz: En la medida de lo posible, intentaremos que el cliente elija la voz que desea a partir de nuestro banco de voces: https://www.okodia.com/voices/, ya que ahí el cliente también podrá saber el coste que tendrá la voz elegida en función de los parámetros elegidos (tipo de voz, idioma, longitud/duración del texto, etc.). En caso de que el cliente prefiera que la elijamos nosotros, lógicamente podemos ofrecerle las muestras que creamos que se adecuan a su trabajo (que él deberá confirmar), o bien solicitarlo a nuestro proveedor habitual.
- En caso de que la locución deba realizarse por diferentes personas (por ejemplo, un vídeo donde aparecen varias personas que hablan), deberemos tratarlo con nuestro proveedor habitual.
- Tipos de voiceover:
- Sin sincronización: no es habitual en nuestro caso, pero podría ser una locución donde no deba tenerse en cuenta ningún otro aspecto a la hora de realizar la locución (por ejemplo, una locución telefónica).
- Sincronizado con el vídeo: será la opción habitual en el tipo de trabajos que realizamos, dado que el audio deberá estar sincronizado con el vídeo.
- No labial: será la opción habitual en nuestros trabajos. El voiceover estará sincronizado con el vídeo, pero no se tendrá en cuenta la vocalización de los personajes.
- Labial: NO lo ofrecemos. Aún así, deberíamos tenerlo en cuenta para indicarlo al cliente en caso de que se muestren primeros planos donde se ve claramente cómo vocaliza el personaje, dado que podría darse el caso de que los movimientos de la boca no coincidan con lo que se pronuncie.
- Presupuesto: si el cliente elige la voz desde nuestro banco de voces, el presupuesto será el que ahí se indique. En caso contrario, habría que consultar con el proveedor y aplicar un margen de alrededor del 40%.
- Cambios (retake): Es importantísimo tener en cuenta que cada cambio en el texto genera una nueva convocatoria del locutor y por lo tanto ocasiona un nuevo coste de locución. Esto significa que la locución debe realizarse con el texto 100% aprobado por el cliente. En caso de que no lo apruebe con anterioridad, debe informársele explícitamente de que cualquier cambio posterior ocasionará un nuevo coste de locución, en la mayoría de ocasiones similar al coste inicial (puede verificarse con el proveedor). En el mundo audiovisual a este tipo de re-grabaciones se le suele llamar «retake».
- Instrucciones (pronunciación): Junto con el ok del cliente al texto que se locutará es importantísimo que nos dé todas las indicaciones posibles sobre cómo requiere la pronunciación de ciertos aspectos. Ejemplos habituales suelen ser: nombres propios, siglas, abreviaturas, acrónimos… Debe indicarse claramente cómo deben pronunciarse y en caso de dudas o ambigüedades debemos solventarlas antes de iniciar el proceso de locución, ya que son instrucciones específicas que deberemos dar al locutor. En caso de error por parte del locutor (si hemos dado las instrucciones correctamente) el retake correrá de su parte, mientras que si no hemos dado las instrucciones correctamente, el retake correrá por nuestra parte. Si es el cliente quien no ha dado las instrucciones correctamente, deberá ser él quien se haga cargo del retake.
- Plazos: siempre debe consultarse con el proveedor y prever cierto margen para contratiempos.
6.4 Proceso para el voiceover
Cada uno de los audios/vídeos se tratará de forma independiente y no se realizará una suma del total. De forma excepcional, en caso de que el proyecto contenga muchos vídeos/audios que puedan realizarse con la misma voz, podríamos pensar en poder unir todos los vídeos en 1 y después «trocearlo». Este tiempo de manipulación debería presupuestarse aparte (a menos que sea el cliente quien se encargue de ello, lógicamente). En caso de que esto deba realizarse, debemos avisar al cliente del proceso que seguiremos y, con la entrega, que verifique que el troceado/nomenclatura final de la entrega se ha realizado correctamente y que no se ha cometido un posible error humano al asignar dicha nomenclatura.
OPCIÓN A) El cliente elegirá la voz que más le guste (o nosotros le ayudaremos en caso de que no quiera o no sepa cómo hacerlo) mediante nuestro banco de voces en https://www.okodia.com/voices/ donde podrá filtrar por idioma, el género y edad de la voz, etc., además de indicar si la locución tendrá que estar sincronizada con el vídeo:

¿Qué significa «Locución sincronizada con vídeo»?
Si el audio se necesita «sin más», es decir, que no acompañe un vídeo o algo que muestre un vídeo, no debemos tener en cuenta nada en cuanto a que la voz vaya a la vez que el vídeo (por ejemplo una centralita telefónica, un cuento, una audioguía…). En cambio, si la voz acompaña un vídeo donde se está explicando algo, lo habitual es que la voz acompañe lo que dice el vídeo y por lo tanto esa voz deberá estar sincronizada con lo que se muestra en el vídeo. En este último caso es cuando hay que marcar esa casilla de «Locución sincronizada con vídeo».
Como se ve en la captura superior, una vez realizado el filtraje, el usuario podrá escuchar muestras de las voces que cumplen sus criterios y, al lado de ellas el coste de cada una junto con el código de la voz.
En caso de que ayudemos al cliente con la elección de las voces, descargaremos varias que creamos que podrían funcionarle, haciendo click encima del audio con el botón derecho y descargándola:
También se puede realizar desde el CRM > Gestiones > Desencriptar voices (Oir Audio):

IMPORTANTE ANONIMIZAR: Al guardar el audio en nuestro ordenador para posteriormente enviarlo al cliente, debemos anonimizar la muestra, y para ello hay que reemplazar el nombre de la descarga por el código de la voz que nos da nuestro sistema:

Una vez descargada, haremos click encima del archivo con el botón derecho > Propiedades:

Iremos a la pestaña «Detalles»:

Y quitaremos toda la información personal del archivo:

De este modo, podremos ya enviar la muestra al cliente sin problema.
Una vez elegida la voz por parte del cliente, y con el código que ofrece nuestra plataforma, procederemos a desencriptar dicho código con el que necesitaremos para el proveedor del banco de voces (VoiceBunny).
Lo desencriptaremos en: CRM > Gestiones > Desencriptar voices:

Con la elección de la muestra por parte del cliente y con el criterio que ha utilizado para realizar su filtro, el precio mostrado en nuestra plataforma será el precio que se presupuestará, ya que dicho precio contiene nuestro margen de beneficio.
Si con el código del cliente no hay ningún criterio, debemos ir a https://www.okodia.com/voices/, incluir los datos que tengamos, palabras, minutos, etc. y anotar el «Código voz» que aparece en «desencriptar voices». Así, tendremos el presupuesto para el cliente.

Con el código desencriptado obtenido (en color verde), procederemos a realizar la solicitud del trabajo en https://bunnystudio.com/voice/ indicando los parámetros anteriores y la voz que hubiera elegido el cliente:

Crearíamos el proyecto con VoiceBunny, indicando todas las características necesarias sobre pronunciación, etc. (Ver punto 6.3), se realizaría el pago hasta obtener el archivo final locutado. [No se describe en este lugar el proceso interno en VoiceBunny ni cómo realizar el proceso de contratación en la plataforma web]
En Plunet, crearíamos como normalmente el encargo de voiceover (VOV) seleccionando al proveedor Bunny Studio Inc.. Una vez finalizado el trabajo, se debe modificar el status del encargo a «Without invoice».
OPCIÓN B) Por motivos de complejidad del vídeo y cantidad de voces implicadas, o bien por cualquier otra circunstancia, puede ser necesario acudir a nuestro proveedor habitual y solicitar presupuesto específico junto con muestras de voces. El coste que nos ofrezca nuestro proveedor será necesario incrementarlo en un 40% a fin de cubrir nuestro margen de beneficio y cualquier posible contratiempo.
Con el ok del cliente se procederá a la contratación estándar, teniendo siempre en cuenta todas las características necesarias sobre pronunciación, etc. (Ver punto 6.3).
7. Maquetado
7.1 Qué se necesita para realizar el maquetado
Para realizar un maquetado audiovisual necesitamos todas las partes que se vean implicadas en la realización del mismo. Podría ser solo 1 única parte o varias, en función del vídeo final que requiera el cliente. Se enumeran a continuación las partes más habituales:
- Vídeo original (sería mucho más conveniente si el cliente tiene el paquete del proyecto)
- Archivo de subtítulos .srt
- Archivo de voiceover .wav/.mp3
- Música
- Grafismos
7.2 Qué se entrega con una maquetación
En función de los requisitos del cliente, se entrega un vídeo final que contiene todo lo que necesita recibir el cliente. Adicionalmente si lo requiere, también se le puede entregar el paquete del proyecto que se ha utilizado para realizar el vídeo final.
7.3 Consideraciones de una maquetación
- Forma de realización: debemos tener en cuenta que un vídeo es un archivo que contiene varias capas en su proyecto (la capa del vídeo como tal, la capa de subtítulos, la capa de música de fondo, la capa de audio, etc.) que pueden activarse/mostrarse y desactivarse/ocultarse según se necesite. Sin embargo, si el cliente solo nos envía un vídeo final original para obtener un vídeo traducido (y no envía el proyecto completo), lo que nosotros tendremos como «origen» será un vídeo con una especie de 2 capas, la capa «visual» y la capa de «sonido».
- Capa visual: en función del vídeo, podría ser que la capa visual solamente tenga el vídeo como tal, y por lo tanto no habría problema en añadir más capas encima (la capa de subtítulos, por ejemplo), pero también podría ser que el vídeo que el cliente envía tenga algún grafismo, o que ya contenga subtítulos. Al estar todo en una única capa es necesario «individualizar» cada parte de esa capa visual para poder reemplazarlas según corresponda. Esto será más o menos costoso en función del vídeo original.
- Capa de sonido: en función del vídeo, podría ser que la capa de sonido solamente tenga un audio original, y por lo tanto no habría problema en silenciarla y sustituirla por una nueva capa de sonido (voiceover, por ejemplo). Sin embargo, también podría ser que el vídeo que el cliente envía contenga también una música de fondo. Si silenciamos el audio, silenciamos todo, por lo que al añadir el voiceover la música de fondo se perdería. Al estar todo el audio en una única capa sería necesario «individualizar» cada sonido de esa capa de sonido para poder reemplazarlas según corresponda. Esto será más o menos costoso en función del vídeo original.
- Presupuesto: Siempre se solicitará presupuesto al maquetador habitual, a cuyo coste incrementaremos un 50%, ya que siempre surgen cambios a posteriori, que cubriremos con dicho incremento en función de lo que puedan implicar dichos cambios. Evidentemente si los cambios son mayores, se deberán presupuestar aparte. El maquetador nos enviará un presupuesto que variará enormemente en función de si disponemos del proyecto original o de si solamente disponemos de un vídeo, y en función del trabajo que requiera lo que se nos solicite.
- Plazos: se calcularán los plazos habituales de traducción.
- Tipos de trabajos que nos podrían solicitar:
- Incrustación de subtítulos solamente: Formaría parte del punto 5, y no formaría parte de «maquetación». La única excepción sería en caso de que además de realizar la incrustación haya que realizar otros cambios como se enumeran a continuación. En este caso sería el maquetador quien lo realizaría.
- Reemplazo de la «voz»: Se trataría de silenciar el audio de origen y reemplazarlo por el voiceover obtenido en el punto 6. Es probable que se requiera algún ajuste, y por lo tanto entraría dentro de este apartado de maquetación. A tener en cuenta si el vídeo contiene algún otro efecto sonoro, música de fondo, etc., puesto que será necesario que el cliente nos envíe dichas pistas sonoras, o bien sería necesario que nosotros adquiramos otras similares (bajo la aprobación del cliente).
- Reeemplazo de los grafismos: Se trataría de reemplazar los textos que aparecen en pantalla por otros traducidos. En función de la complejidad de los mismos, se podría hacer directamente, o bien sería necesario que el cliente nos envíe los archivos originales editables (lo indicará el maquetador).
- Añadir/eliminar partes del vídeo (frames): Podría ser que no todo el vídeo se necesite editar y que el cliente pida que cortemos el vídeo en el segundo X, por ejemplo.
- Todo o parte de lo anterior: Podría ser que se nos solicite un trabajo en el que sea necesario realizar todos estos tipos de trabajos o parte de ellos; por ejemplo, que se incrusten los subtítulos, que se reemplace la voz (y también se añada una pista de sonido de fondo), que se reemplacen los textos gráficos de fondo y que se añada un último frame con un logo en particular.
