|
| |
Volver página de inicio
MP3 de principio a
fin
Fuente: Ignacio García Santos (www.datosenlaweb.com)
MP3 no sólo es un tipo de archivo común en plena época de apogeo. Tras él hay años
de investigación, por lo que se cuenta a continuación; su historia, relación con los
demás formatos, la digitalización del sonido y todos los pasos necesarios y posibles
para disfrutar de estos archivos.
Su origen y actualidad
Las siglas MP3 responden a la abreviatura de MPEG 1 Layer 3, que es un alogaritmo de
codificación perceptual. Este entre otros fue desarrollado por el Moving Picture Expert
Group (MPEG) (http://www.cselt.it/mpeg/)
junto con el Instituto Tecnológico de Fraunhofer (http://www.ipa.fhg.de/english/).
MPEG 1 no fue siempre el denominador de este sistema, antes de él se llamaba Musicam. El
cual fue la base para crear el MPEG 1 Layer 1 y 2. Pero debido a que Musicam ya se
encontraba registrado en varias partes del mundo, por distintas empresas, se decidió que
llevase el nombre de sus creadores. El formato MPEG es una alternativa para el formato
avi, como MP3 lo es para WAV.
Moving Picture Expert Group es un comité de investigación del ISO/IEC. El MPEG está a
cargo del desarrollo internacional de estándares de compresión, descompresión,
procesamiento y la representación codificada de películas, audio y la combinación de
ambas. Es una institución sin fines de lucro creada en 1988, que reúne tres veces por
año a trescientos (300) expertos de veinte (20) países.
No solo a desarrollado el MPEG 1 Layer 1, 2 y 3 (1992) sino que también existen el MPEG 2
(1994), MPEG 2.5, MPEG 4 versiones 1 (oct. 1998) y 2 (dic. 1999). Hoy en día se encuentra
en desarrollo el MPEG 4 versiones 3, 4 y 5, MPEG 7 y por ultimo el MPEG 21.
A diferencia del MPEG 1 el MPEG 2 tiene en cuenta el sonido envolvente (surround) y la
extensión multilingüe. El MPEG 2.5 fue creado por el Instituto Fraunhofer y a pesar de
que no es una especificación ISO divide una segunda vez la frecuencia de muestreo entre
dos. Funciona bien para ciertas aplicaciones de ancho de banda critico.
ISO (www.iso.ch) es la Organización Internacional de Estándares, que fue establecido en
1947. La importancia de este organismo no gubernamental es considerable ya que sus normas
facilitan el intercambio internacional. Creando así un denominador común entre las
industrias de diversas regiones del mundo. El organismo responsable de ello en la
Argentina es el Instituto Argentino de Normalización (IRAM) (www.iram.com.ar). Al cual se
deberá acudir en caso de buscar las normas ISO con respecto a estos formatos de audio,
estas normas no son gratuitas, de modo que representan el 80% de los ingresos del ISO; el
20 % restante corresponde a publicaciones.
El MP3 fue adoptado como norma ISO en 1992 (IS - 11172 - 3) y (IS 13818 - 3). De este modo
se establecieron estándares de mercado e industria definidos para el MP3.
Reteniendo el sonido
El MP3 es un sistema de compresión con perdida, por lo cual el sonido original y el
comprimido no son iguales. Pero las perdidas no deberían ser perceptibles para el oído
humano, de manera que no se tendría que notar la diferencia.
El sonido es una honda continua que se propaga a través del aire u otros medios, formada
por diferencias de presión, que pueden detectarse mediante la medición de la presión en
un punto determinado. Como se trata de una honda continua es necesario un proceso de
digitalización para representarla como una serie de números. Hoy en día la mayoría de
las operaciones realizadas sobre señales de sonido son digitales y en menor medida se
utilizan señales analógicas. Las señales digitales poseen muchas ventajas sobre las
analógicas, aunque por desgracia esta requiere un ancho de banda mucho mayor que el de la
señal analógica.
El proceso de digitalización se compone de dos etapas: muestreo y cuantizacion. En el
muestreo se divide el eje del tiempo en segmentos discretos; la frecuencia de muestreo
será la inversa del tiempo que haya entre una medida y la siguiente. En estos momentos se
realiza la cuantización, que, en su forma más sencilla, consiste simplemente en medir el
valor de la señal en amplitud y registrarlo. El teorema de Nyquist garantiza que la
frecuencia necesaria para muestrear una señal que tiene sus componentes más altas a una
frecuencia dada f es como mínimo 2f. Por tanto, siendo el rango superior de la audición
humana en torno a los 20 Khz, la frecuencia que garantiza un muestreo ajustado a cualquier
sonido audible será de unos 40 Khz (el CD tiene 44.1Khz). Según el fin que se tenga los
valores pueden llegar a ser muy inferiores a estos. De manera que la voz humana acostumbra
fluctuar entre 6 y 20 Khz y en algunos casos es menor. En cuánto a la cauntizacion se
puede realizar una división a intervalos iguales o según una determinada función de
densidad. De manera que haya mas resolución en determinados tramos. Este proceso es
denominado PCM (Pulse Code Modulación).
Cuantos menos bits se utilicen en el muestreo y la cuantizacion, mayor será el ruido.
Para evitar que el ruido sea excesivo hay que usar una mayor cantidad de bits. Gran parte
de esta información es innecesaria y ocupa un ancho de banda del cual se podría
dispensar, a costa de aumentar la complejidad del sistema decodificador e incurrir en
cierta perdida de calidad. Esto se logra mejor con la cuantizacion a intervalos
determinados por una función de densidad.
El rango de frecuencias que percibe el oído humano esta aproximadamente entre los 20Hz y
los 20kHz siendo este más sensible entre los 2Hz y 4Hz. De manera que el sonido mientras
más cerca este de a los extremos de la escala, mayor será la dificultad audible del
mismo.
La clave del éxito
Cuando se percibe una señal de un volumen alto (agudo o de mayor energía) en una
frecuencia y otra de volumen mas bajo (grave o de menor energía) en una frecuencia
cercana esta ultima no será audible. Este efecto se llama enmascaramiento simultaneo o en
frecuencia (también existe el enmascaramiento asimultáneo o en el tiempo). Y a cierta
distancia de la frecuencia enmascaradora, el efecto se reduce tanto que resulta
despreciable. El rango de frecuencias en las que se produce el fenómeno se denomina banda
critica (critical band). La amplitud de la banda critica varia según la frecuencia en la
que nos situemos y viene dada por determinados datos que demuestran que es mayor con la
frecuencia. De esta manera se trata de desechar todo aquello que el oído humano no
podría captar.
Para aprovechar estas características se utiliza un sistema denominado Codificación de
Sub bandas o CBS (sub-band coding). Donde el MP3 es el ejemplo más popular. En este
proceso la señal original es descompuesta en sub bandas mediante una base de filtros. Las
sub bandas son comparadas con el original mediante el modelo psicoacustico que determina
que bandas son importantes, cuales no y por ultimo cuales pueden ser eliminadas.
Los modelos psicoacústicos se componen a partir de las percepciones de un grupo de
personas entrenadas para rendir al máximo en este campo. Por medio de una serie de
experimentos se puede determinar la sensibilidad del oído humano a una serie de
fenómenos, de forma que aparezcan resultados útiles para el tratamiento del sonido, como
ya hemos visto. Para ello se llevan a cabo experimentos para medir la sensibilidad del
oído humano, el enmascaramiento en frecuencia, el enmascaramiento temporal, y el
enmascaramiento pre - temporal.
Del víbrate que utilicemos para producir la codificación depende la eliminación de
menor o mayor cantidad de datos siguiendo el modelo psicoacustico hasta lograr la
compresión necesaria. Luego se cuantifican y codifican las sub bandas restantes y el
resultado es finalmente comprimido mediante un alogaritmo estándar Huffman o LZW.
Se puede comprimir con distinto ancho de banda (kHz), modo (mono o estéreo) y bibrate
(kbps) (cantidad de bits que se consumen por segundo de audio) obteniendo distintas
calidades según para que se vaya a utilizar ese sonido. Dependiendo de la calidad buscada
estará la elección de la compresión que se lleve a cabo.
La decodificación es más sencilla, ya que no precisa la aplicación de ningún modelo
psicoacustico. Simplemente se analizan los datos y se recomponen las bandas y sus muestras
correspondientes.
El existo que lleva consigo el formato MP3 esta sustentado por tres pilares. Su capacidad
de compresión: es un sistema de compresión de audio con el cual podemos almacenar audio
en 1/12 del espacio original. Calidad de compresión: un método de compresión no es otra
cosa que un alogaritmo (serie de ecuaciones matemáticas) capaz de simplificar la
información. Pero lamentablemente con perdida de calidad. Y por ultimo la facilidad de
distribución: gracias a Internet se puede enviar o recibir sin mayor problema, incluso
con conexiones lentas, tales como las de módems de 14kb.
Para dominar el MP3
Un extractor de audio o CD-ripper es un programa que se encarga de extraer digitalmente la
música que hay en un CD-Audio y guardarla en el disco duro en un archivo con formato WAV.
La particularidad de este proceso es que los datos guardados son exactamente los mismos
que había en el CD-Audio. Existen varios pero los más recomendados son: el winDAC
(Digital Audio Copy) (www.windac.de), el Easy CD-DA Extractor (www.poikosoft.com/cdda/) y
el AudioGrabber (www.audiograbber.com-us.net).
Una vez hemos extraído las pistas de audio del CD y las tenemos guardadas como archivos
en formato WAV debemos comprimirlas a MP3. Los encoders sirven para convertir archivos WAV
a mp3. Para ello existen los siguientes programas: el MP3 compresor
(www.musiccompressor.com), Electronic Cosmo´s MPEG Suite (http://ec2000.xperiment.net),
Audio Catalyst (www.xingtech.com/mp3/audiocatalyst/) &
(http://goinside.com/99/1/ac.html) y el Mplifier.
Otra forma de obtener canciones en formato MP3 es buscando por internet. Para ello existen
programas o sitios que facilitan la búsqueda de MP3 o el intercambio entre usuarios
mediante bases de datos. Estos son: (www.abes.org) (www.getright.com),
(http://freenet.sourceforge.net), (http://gnutella.wego.com), (www.mp3fiend.com),
(www.tucows.com), (www.napster.com), (www.forteinc.com/root/who.htm),
(http://gnute.com/index.html).
Existen varios tipos de sistemas reproductores para escuchar audio, sea música o no, en
formato MP3. Para los que poseen un PC existe el Windows Media Player (www.windows.com),
Kjofol (www.kjofol.org), Wplay (www.mp3rulz.com), Unreal Player, Winamp (www.winamp.com),
Sonique (http://sonique.lycos.com/) o Jukebox creado por Real Networks. Para los usuarios
de Macintosh existe el MacCast (www.macamp.net/download.shtml) o el SoundJam
(www.soundjam.com). Mientras que para aquellos pocos que usan Linux existe el XMMS y el
Xaudio MP3Player. En la Argentina se ofrece la instalación de reproductores de mp3 para
autos en (www.mp3-car.com.ar).
Por último los decoders son programas que convierte archivos mp3 en archivos WAV. Algunos
son Winamp o el WPlay, aunque algunos compresores pueden usarse también como
descompresores. Un ejemplo sería el Electronic Cosmo's MPEG Suite (los sitios ya fueron
dados antes). Para encontrar estos programas u otros no mencionados se pueden visitar
sitios dedicados a software. Aunque aquí menciono dos que poseen una lista generosa de
software para ello (http://wfr.teaser.fr/~mmonserrat/MP3/Encoders_L.htm) y
(http://www.fh-wilhelmshaven.de/~schoonbe/mp3soft.html).
|