¿Dónde está el truco?

Aquí está la explicación audiovisual:

Si lo prefieres como documento PDF —sólo funciona en Acrobat para Windows—, está disponible aquí para descarga.

Elementos audiovisuales

Un vídeo son imágenes sincronizadas con sonido. Analizando cada elemento, se puede mejorar mucho para una presentación con voz. En eso se basa PresVoz para funcionar.

Imagen

Menor cantidad

Un vídeo tiene cerca de al menos 24 fotogramas por segundo para dar a la vista humana sensación de movimiento. Es precisamente esto lo que hizo posible el nacimiento del cinematógrafo hace un siglo1.

De este modo, eso da un mínimo casi 1500 imágenes por minuto. Aunque los formatos de vídeo emplean compresión y ahí hay mucha ganancia, en teoría sería mucho mejor que cada imagen durara lo que fuera necesario.

La propuesta anterior es absurda para cualquier película. Sin embargo, es muy útil en el caso de presentaciones. Porque habitualmente contienen imágenes y texto[^con-vídeo].

Mayor calidad

Además, la imagen tiene mayor ganancia si está directamente de la presentación. Al menos, siempre que se incluya texto y también con muchas imágenes. En todo caso, la calidad no disminuirá nunca respecto al original —lo que puede no darse generando vídeo—.

Un ordenador tiene dos modos de imagen: por trazos —o vectores— y por puntos. Con el primer modo, la imagen no tiene tamaño. Aunque se agrande, no pierde calidad. Con el segundo modo, el tamaño máximo de la imagen lo da su resolución. Si se aumenta el tamaño, los puntos se le notan a la imagen —aunque se intente difuminar informáticamente—.

En realidad, una imagen por puntos se muestra en pantalla. En el caso de una imagen vectorial, el ordenador la dibuja. De ahí que quepa agrandarla infinitamente —porque el ordenador la dibujará cada vez de nuevo—.

No es sólo el menor tamaño, sino que la calidad será siempre la máxima de partida. Con todo lo que sea vectorial, será infinita teóricamente.

No es lo mismo ver un vídeo en la pantalla de un móvil que en un monitor de treinta pulgadas o más.

Sonido

La grabación digital de sonido depende de la cantidad de datos que hay que recoger.

La mayoría de formatos de sonido —-como MP3— son en realidad de compresión de sonido. Comprimen el sonido desechando datos que no son tan relevantes para la calidad final[^pérdida]. Así se reduce el tamaño del archivo final.

La música tiene muchos más datos que la voz hablada. Por eso, hay diferentes calidades en los formatos de sonido. Un modo de verlo es la cantidad de datos por segundo.

Tomando como referencia el formato MP3, la música se puede grabar a 320 kb/s, 256 kb/s, 128 kb/s. A una calidad más baja, la música se resiente mucho. Sin embargo, la voz hablada se puede apurar hasta 32 kb/s.

Si lógica no me falta, un minuto de música a calidad de 320 kb/s es diez veces más que el de voz humana a 32 kb/s. Si no me fallan las matemáticas, son respectivamente 2.34 MB y 240 KB. A 128 kb/s, el minuto está a 960 kb/s.

Eso tiene como consecuencia que si se comprime mejor el sonido adecuándolo a voz grabada, el tamaño final es mucho menor2.

¿Presentaciones animadas?

Hasta donde yo sé, el formato de vídeo vectorial sólo existe con animaciones. Las presentaciones con voz son un caso muy sencillo de presentaciones animadas.

PresVoz propone una solución de un doble modo:

  1. Documento SWF: Flash es experto en hace animaciones. Aquí se muestra cada imagen y cada cierto tiempo se avanza a la siguiente imagen.

  2. Documento PDF: como Acrobat reproduce sonido, también puedes decirle que pase página en los momentos que le pones en el propio documento PDF.

En el fondo, lo único que PresVoz hace es unir diapositivas y voz grabada con la sincronización de tiempos original. Previamente, se han grabado la voz y los tiempos con un programa especial —GVoz—.

Notas

  1. De modo parecido al que en inglés movie viene de moving o motion picture, «cinematografía» es la «escritura del movimiento» —κινήματος γραφή—. 

  2. Por supuesto, existen otros formatos posteriores para comprimir mejor voz humana. Destaca Opus permitiría usar compresión de 16 kb/s sin comprometer la calidad. Esto supondría reducir el tamaño del sonido a la mitad.

    De todas formas, Flash sólo acepta MP3 —o en todo caso, no Opus—. En PDF, teóricamente cabría usar Opus. Sin embargo, Acrobat no es capaz de lidiar con sonido en ese formato. Windows Media Player, que usa Acrobat para reproducir contenidos audivisuales, no entiende formato de sonido Opus