Sous-sections

5.2 Formats audio

Plusieurs formats sont disponibles pour encoder les fichiers sonores. Le format WAV constitue le format le plus général mais le moins standardisé. Il est égalemet le plus utilisé pour l'encodage PCM. Outre le WAV, il existe plusieurs autres formats musicaux alternatifs dont certains sont très prometteurs ou très utilisés, d'autres moins. Nous allons présenter quelques formats parmi les plus connus, mais la liste n'est en aucun cas exhaustive.


5.2.1 WAV

Un fichier WAV est un fourre-tout: il peut en fait contenir pratiquement n'importe quoi, y compris des données compressées, textes ou spécifiques à une application. Un tel fichier constitue une archive composée de plusieurs chunks. Chaque chunk comprend dans son en-tête une valeur numérique identifiant de façon espérons-le unique le codec à utiliser pour la lecture. La fréquence d'échantillonnage se situe en général parmi une des valeurs suivantes. Le nombre de bits est 8 ou 16 et il y a un ou deux canaux.

11025
qualité téléphone
22050
qualité radio
44100
qualité CD, celle que l'on va utiliser
48000
qualité DAT

La grande taille des fichiers WAV PCM a occasionné l'émergence de plusieurs algorithmes de compression du signal audio. Le format WAV autorise la compression puisqu'il peut contenir à peu près n'importe quoi. Malheureusement, un codec supportant le format de compression mis en \oeuvre doit être installé sur la machine lisant le fichier WAV.

5.2.1.1 Taille des fichiers WAV

Comment savoir d'avance quelle taille tout les WAV d'un CD Audio prendront sur le disque dur? Un peu de mathématiques vont nous le révéler! Il faut tout d'abord connaître les paramètres du fichier WAV que nous utilisons. Puisque pour un CD Audio, ils sont uniformes, nous pouvons calculer assez facilement. La fréquence d'échantillonnage se chiffre à 44100 hertz, donc 44100 échantillons par seconde. Reste à savoir combien d'octets il y a dans un échantillon. En mode 16 bits, il y a deux octets par échantillon puisque chaque octet prend 8 bits. En en stéréo, deux échantillons, un pour chaque canal, sont requis. Nous multiplierons donc 44100 par 4. Ce qui nous donnera 176400 octets par seconde, la vitesse 1X pour les graveurs et lecteurs CD. Pour obtenir la taille total des fichiers, il suffit de multiplier le coefficient 1X par le nombre de secondes qu'il y a dans 74 minutes, c'est-à-dire, 74*60=4440s. Après la multiplication, nous obtenons finalement 4440*176400=783216000 octets. En divisant ce nombre par 1024 deux fois, ou par 26, nous obtenons approximativement 800 Mo.

Alors, quelque chose d'intriguant devrait vous sauter aux yeux. Sur les pochettes de CD vierges, on peut lire la durée de 74 minutes, mais une taille de 650 Mo. Or, nous venons justement de calculer qu'il entre presque 100 Mo de plus! C'est ici qu'entre en jeu l'organisation des secteurs du disque. Divisons tout d'abord la taille totale en octets par la taille d'un secteur sur le disque. 783216000/2352=333000 secteurs. Puisque le mode 1 limite la taille des données informatiques dans le secteur à 2048 octets, 333000*2048=681984000 octets. Après une division par 26, nous obtenons approximativement 650 Mo! Pour le cas d'un disque de 80 minutes, les calculs sont très similaires. Nous obtenons une taille audio de 807Mo, 360000 secteurs et 700Mo de données. Avec 90 minutes, nous obtenons une taille audio de 908Mo, 405000 secteurs et une taille de données de 791Mo.


5.2.2 MPEG

Afin de minimiser l'espace requis par un ensemble de fichiers sonores, on a recours à la compression. Certains algorithmes sont relativement simples, d'autres très sophistiqués. Le MPEG tire parti de fréquences inaudibles pour l'oreille humaine car masquées par d'autres fréquences. Un algorithme plutôt complexe est requis pour encoder et décoder de telles fichiers, mais la qualité est très proche de l'original en PCM et, avec les processeurs d'aujourd'hui, la réduction de performance dûe à la comperssion est minime.

Il existe plusieurs variantes de MPEG, dont le MPEG-1, MPEG-2 et le nouveau MPEG-4. Ce standard permet la compression vidéo, mais nous nous concentrerons ici sur la compression sonore. Le MPEG-1 est subdivisé en plusieurs sous-formats que l'on appelle layers. Chacun des layers fournit un niveau additionnel de compression mais accroît la complexité des algorithmes mis en \oeuvre pour la réaliser. Le format audio MPEG le plus courant (et le plus menaçant pour l'industrie du disque...) constitue sans aucun doute le MPEG-1 Layer III, le fameux MP3. Ce format est réputé pour faire tenir un CD Audio entier dans un espace de 70Mo, et sans perte audible de qualité pour le commun des mortels. On peut influer la qualité d'un MP3 en agissant sur le bitrate, c'est-à-dire le nombre de bits par seconde utilisés pour la compression.

Quant au MPEG-2, il se concentre davantage sur la vidéo. Sa partie audio autorise non pas deux mais six canaux (gauche, droite, centre, arrière gauche, arrière droite, basses) afin de pouvoir, avec l'aide du décodeur et des enceintres appropriées, restituer un son surround digne du cinéma. Malheureusement, lors de la conception du DVD, les encodeurs MPEG-2 étaient trop coûteux et le format a été remplacé par le Dolby Digital.


5.2.3 Dolby Digital

Le Dolby Digital (ou AC-3) permet d'encoder un signal audio compressé sur plusieurs canaux. Il est grandement utilisé lors sur les disques DVD et procure une excellente qualité sonore. Ses caractéristiques ressemblent beaucoup au MPEG-2, mais il n'est pas compatible avec MPEG. Un décodeur Dolby Digital peut soit restituer un signal stéréo, soit un signal multicanal.


5.2.4 WMA

Le format Windows Media Audio constitue la variante Microsoft de la norme MPEG. La qualité des fichiers WMA étant très semblable à celle des MP3, Microsoft a dû recourrir à des astuces plutôt douteuses pour promouvoir son format propriétaire. Windows Media Player encode les MP3 avec un nombre de bits par seconde toujour inférieurs aux fichiers WMA afin de faire croire à l'utilisateur que la qualité est meilleure avec son format. Le format WMA ajoute des éléments pour la gestion des droits d'auteur et sa lecture est plus difficile avec d'autres applications que Windows Media Player. Les fichiers WMA portent l'extension .wma et peuvent être lus par certains lecteurs DVD indépendants et lecteurs MP3.


5.2.5 RealAudio

Le format RealAudio permet le téléchargement et la lecture simultanés de fichiers audio, même avec des connexions Internet lentes. La compression utilisée ressemble à MPEG, mais les algorithmes utilisés sont propriétaires. La seule application supportant pleinement RealAudio constitue RealPlayer et la version la plus récente n'existe que pour Windows et non pas Linux. Bien que certains logiciels puissent encoder du RealAudio, son usage principal, c'est-à-dire la lecture en temps réel durant le téléchargement, n'est possible qu'avec un serveur RealAudio qui n'est pas gratuit. La qualité du RealAudio est nettement inférieure à celle du MP3 et il est souvent impossible de télécharger le contenu pour le rejouer par la suite. RealAudio n'est ainsi utile que pour fournir une solution de radio Internet ou pour prévisualiser des extraits de disques avant achat en ligne. Des solutions alternatives telles que SHOUTcast [URL114] et Icecast [URL103] semblent aussi adéquates si les bitrates sont suffisamment bas.


5.2.6 Musepack

Le format Musepack [URL107] constitue une alternative au format MP3 qui a été mise au point à une époque où la performance des encodeurs MP3 n'était pas satisfaisante. Ces fichiers avec extension .mpc ne sont pas lisibles par les lecteurs MP3 à moins de dispoer d'un plug-in et le plug-in Musepack ne fonctionne pas sous Linux. Ce format n'est pas d'un très grand intérêt et il vaut mieux utiliser MP3 et Ogg Vorbis.


5.2.7 Le format Ogg Vorbis

La technologie MPEG est liée à des brevets, si bien que les encodeurs MPEG et même les décodeurs sont sujets à des problèmes légaux! Ceci pose des problèmes pour les lecteurs ou encodeurs MP3 sous Linux dont le code source est accessible sur Internet. En raison de ces considérations légales, RedHat a choisi de retirer tout support du MP3 dans les versions 8.0 et 9.0 de sa distribution. Heureusement, il est possible de le réactiver. Le format Dolby Digital, apparu en raison du manque d'encodeurs MPEG-2, pose également problème pour l'encodage et même encore pour le décodage. Quant aux formats WMA et RealAudio, leurs concepteurs peuvent du jour au lendemain concevoir une nouvelle version qui ne sera utilisable que dans leurs applications d'origine. Le format Ogg Vorbis [URL109] représente une alternative à toute cette multitude de formats. L'algorithme de compression utilisé offre même une meilleure qualité que les MP3, en mode multicanal. Ogg Vorbis constitue un format sonore ouvert, sans brevets ni licenses, destiné à remplacer tous les formats audio existants. Des encodeurs et décodeurs existent déjà et fonctionnent très bien. Vorbis utilise un bitrate variable lors de la compression. C'est pourquoi le paramètre de compression principal ne constitue pas le bitrate mais un coefficient de qualité.

Linux intègre, dans ses distributions les plus récentes, le support Ogg Vorbis. Des outils tels que oggenc et oggdec permettent d'encoder ou décoder des fichiers. Plusieurs lecteurs multimédia, dont XMMS et Winamp, intègrent la technologie Ogg et permettent ainsi de relire les fichiers. Puisque la spécification et le code source de l'implantation de référence sont disponibles gratuitement, Ogg Vorbis peut facilement être porté vers d'autres plate-formes. C'est pourquoi il fonctionne déjà sous Windows, Linux et Macintosh. Des plug-ins pour Winamp, Sonique et d'autres lecteurs sont disponibles sous Windows, ainsi que les librairies et outils pour travailler avec les fichiers. Grâce à des librairies et l'absence de licenses restrictives, il est possible d'intégrer le format au sein des applications. Certains jeux utilisent ce format pour compresser la musique plutôt que le MP3, car le MP3 impose des licenses pour usage commercial. À l'heure actuelle, le seul problème réside dans les lecteurs matériels qui en sont toujours au MP3, mais cela pourrait changer.


5.2.8 FLAC

Free Lossless Audio Codec (FLAC, [URL100]) constitue un format audio analogue à Vorbis mais sans aucune perte d'informations. Dans ce sens, il est analogue au format de compression de GZip. Toutefois, il est adapté au son et compresse mieux les fichiers audio que les compresseurs généraux comme GZip ou BZip2. FLAC n'a aucune notion de bitrate mais de qualité. La qualité détermine la complexité des fonctions mathématiques utilisées pour modéliser la courbe du signal audio dans le fichier. Plus ces fonctions sont simples, plus le décodage est rapide mais plus le fichier est volumineux. Quel que soit le coefficient choisie, la qualité du son est identique puisqu'il n'y a aucune perte d'information. Seule la capacité machine nécessaire au décodage varie. Le décodage FLAC s'avère toutefois très rapide, car il n'utilise que de l'arithmétique entière, contrairement à MPEG ou Vorbis. Ce format est idéal pour le stockage de fichiers sonores dans un but d'archivage puisqu'aucune perte d'informations n'a lieu.


5.2.9 Monkey's Audio

Monkey's Audio [URL106] constitue un autre format de compression sans perte de qualité. Du point de vue de son accessiblité et des licenses, il ressemble à FLAC, mais il n'est bien supporté que sous Windows. D'après les comparaisons données sur le site Web, la compression est légèrement meilleure que FLAC. Puisque le code source du codec Monkey's Audio est disponible gratuitement, ce format pourrait, dans le futur, devenir plus portable (support pour Mac et Linux et peut-être même pour des appareils indépendants).

Eric Buist 2005-11-13