Tribbles y tribulaciones

El capitán Kirk sufre de lo suyo también.

Esta entrada especial en el blog de la Vieja Guardia es para está dedicada a contar los problemas técnicos encontrados para grabar y editar el sonido de nuestro podcast, que han sido por cierto más de los inicialmente esperados. Por supuesto, no podía faltar la imagen de los Tribbles de Star Trek, porque qué menos que otro tópico geek.

El primer problema que nos encontramos al grabar el podcast era el de conectarnos, previo aun al de grabarnos. Como no, pensamos en Zoom, Google algo, etc... pero como cuando empezamos el uso de Zoom era masivo, al final del pasado confinamiento, y además el tiempo de grabación coincidía con la hora punta en América, pues lo desechamos.

Una tecnología alternativa que también se ha popularizado en esta crisis es Jitsi. Jitsi es una aplicación web de codigo abierto que funciona íntegramente en el navegador, sin complementos. Empezamos a usarla desde el primer y tumultuoso episodio, y desde entonces ha funcionado bien. La única pega es que seguimos usando uno de los servidores centrales, al no haber encontrado uno alternativo que nos permita grabar. Tampoco teníamos la intención de montar nuestro propio servidor, eso queda fuera de nuestros objetivos, por lo menos en esta temporada.

Y eso nos lleva al segundo problema, tal vez aun más importante, grabar. Como buenos oyentes de nuestro podcast, sabréis que en la mayoría de episodios, al llegar la hora de grabación se oye una locución: "Recording has stopped". Eso se debe a que Jitsi nos permite grabar la primera hora de audio y vídeo. Aunque el vídeo de desecha, grabamos esa hora de audio en Jitsi por redundancia. Al mismo tiempo usamos OBS, que es un software de código abierto que se suele usar para hacer streaming en directo de videojuegos, pero también permite grabar los audios que se graban y reproducen en un equipo.

Grabamos tanto el micrófono del equipo grabador (input), como la salida del audio (o sonido de escritorio). El proceso suele ser más simple en Windows, en Linux hay que buscar los demonios que de las aplicaciones, especialmente si usáis como yo un micro USB, no déis nada por hecho. Una herramienta muy util para eso, si usáis PulseAudio, es PavuControl. Hemos probado a grabar diferentes pistas, una para el micrófono y otra para la salida de audio de la conferencia, pero el formato de salida mkv no parece soportarlo, así que en la grabación los dos audios van juntos. Otro tema curioso de la entrada de audio de OBS, es que el sonido de micrófono requiere ser aumentado un 1900%. Podéis encontrar más detalles en los foros de OBS sobre ese tema. Parece una ñapa, y de hecho lo es, pero funciona.

Por cierto, si vais a hacer un podcast con un micrófono profesional, acordaos de ajustarlo antes. Por experiencia, una ganacia desajustada distorsiona mucho el sonido. Y haced pruebas de sonido antes, porque no se puede dar por hecho que se va a grabar bien un episodio si no se prueba antes. Yo he usado Mac, Windows y Linux para hacer la grabación, y al final me quedo con Linux por la familiaridad, pero la verdad es que no sabría recomendar ninguno.

Después, llega la hora de montar el episodio. Para eso usamos Audacity, que es un software presente en casi todas las distribuciones Linux, además de estar portado a Windows y a Mac. Supuestamente es un software curtido, pero sorpresivamente nos hemos encontrado problemas al aplicar ciertos plugins, especialmente al aplicarlos a varias pistas al mismo tiempo. El proceso empleado es el siguiente:

  • El audio crudo se importa en Audacity desde el archivo de OBS  (formato mkv). Después se importan la entrada y el cierre, cada uno en su pista.
  • El sonido se edita, cortando lo que sobra y ajustando la entrada y el cierre al principio y final de la grabación. En ocasiones hemos tenido que mezclar dos fuentes diferentes de audio. Descubrir el episodio o episodios en que hemos tenido que hacer eso, queda como un ejercicio para el oyente.
  • Importante: en este punto se mezclan todas las pistas en una sola, para evitar problemas al aplicar los plugins de postprocesado.
  • Se aplica el plugin de Sound Gate y a continuación el de Loudness Normalization, tal y como se describe en la página de datos técnicos. El segundo es el más importante, ya que es importante que el sonido se escuche siempre con el mismo volumen.
  • Una vez la mezcla y adulteración es satisfactoria, se exporta a MP3, en formato mono y a máxima calidad, 320kbps. Pensamos usar OGG o incluso FLAC, por ser formatos abiertos, pero el iVoox sólo admite MP3 para sus originales.
  • Para los vídeos de YouTube, el MP3 se compone con una imagen estática y el resultado final se sube a YouTube.

Como veis el proceso no es tan trivial como parece, y se parece más a la alquimia que a la ciencia. Me temo que cada vez que procesamos un capítulo, Apolo, dios de la música y del audio postprocesado, mata a un gatito. Estamos abiertos a recibir vuestra opinión y escuchar vuestras propuestas sobre cómo mejorar la calidad de nuestro sonido, además de simplificar los pasos anteriores.