Principes de base en audio-numérique
|
|
Avant propos : cet article explicatif des principes de l'audio-numérique provient d'un fil de discussion sur le forum de LinuxMAO.
IntroductionDepuis l'apparition des principes de l'informatique, il est vite apparu qu'il était intéressant d'utiliser ce nouvel outil dans le traitement du son. On peut dater l'apparition de ce principe le jour où le premier système informatique à poussé son premier BEEP.
L'oreille humaine n'est sensible qu'à une vibration de l'atmosphère, de l'air quoi! C'est un système très efficace mais qui a de fortes limitations ! Il ne fonctionne qu'entre 20Hz (Hertz), les sons très graves, et 20000Hz (20kHz), les sons très aigus. Elle ne peut pas percevoir les infra-basses qui sont les fréquences inférieures à 20 Hz ou les fameux ultrasons, au delà de 20 kHz alors que certains animaux le peuvent. L'ordinateur, lui, ne se soucie que des 0 et des 1 ; il n'a donc en théorie aucune limitation. Quant à l'enceinte acoustique, elle n'est qu'assez peu réceptive à ces sollicitations, et ne vibre que pour la fée électricité et ses douces ondulations. Il a donc été nécessaire de réussir à faire cohabiter ces 3 énergumènes. On appellera Analogique la vibration de l'air qui fait bouger les tympans, et les enceintes. On appellera Numérique l'afflux des saints octets et leurs armées de Bits qui inondent nos insatiables processeurs et disques durs. PrincipeIl a donc fallu réussir à transformer la douce vibration de l'air qui chatouille nos tympans en bits disciplinés défilant à la queue-leu-leu. Une mission où une interface chaise/clavier à été nécessaire, j'ai cité l'être humain et son cerveau fertile mais peu performant dans les phases de calculs brut, mais doué d'une imagination sans limites. Il a donc été décidé qu'il faudrait trancher ! On s'est donc employé à faire trancher des signaux analogique aux ordinateurs.Le signal analogique sous forme d'onde électrique est découpé en tranches régulières, on appelle ça l'échantillonnage. On appelle la fréquence d'échantillonnage le nombre de tranches qu'on découpera chaque secondes : Par exemple : 44100 Hz = 44100 tranches par secondes. C'est par ailleurs la fréquence utilisée pour les CD Audio. Ces tranches sont codées sur des octets composés de bits (0 ou 1). Plus le nombre de bits est élevé, plus le nombres de valeurs possible est élevé, il y aura donc moins d'approximations de conversion et une meilleure plage de dynamique. On appelle cela la résolution. On considère une résolution de 16 Bits comme standard en audionumérique car utilisée pour les CD Audio, mais cela est amené à changer dans le futur avec l'apparition de nouveaux supports. On préférera une résolution plus élevée lors des prises de son afin de permettre une conversion plus précise. Il est à noter que les logiciels de traitement de signal travaillent pour la plupart en interne avec une résolution de 32 Bits afin d'éviter les approximations pendant le traitement. Les différentes fréquences d'échantillonnage.
Ce qui nous fait rentrer dans l'ère moderne audionumérique. De manière générale il faut comprendre qu'enregistrer un signal réel en un signal numérique est un procédé qui abime le son. Un enregistrement audio-numérique ne sera jamais qu'une approximation du signal réel. Nous avons donc intérêt à travailler avec des valeurs supérieures afin d'être au plus proche du signal réel, quitte à ré-échantillonner plus tard à des fréquences et résolutions inférieures adaptées au support de diffusion utilisé (CD, DVD, Blue ray, SACD, DAT, MP3, ...). L'intérêt de telles pratiques est d'avoir un rendu précis et surtout, moins d'approximation de calcul dans les traitements de signaux numériques aussi appelés DSP. Pour l'audio, on pourra utiliser un multiple de 44,1 kHz (généralement 88,2 kHz), afin de n'avoir qu'à diviser par un nombre entier lors des calculs de ré-échantillonnage finaux et éviter donc d'arrondir les résultats de calcul. Pour la Vidéo, on pourra utiliser un multiple de 48kHz (généralement 96 kHz, voir 192 kHz), pour les même raisons. Les convertisseursJ'en vois un qui lève la main au fond à côté du radiateur ? Concrètement, on utilisera pour convertir une signal analogique en information numérique, un bête composant électronique appelé convertisseur. Il en existe 2 types :
Selon leurs caractéristiques, ils pourront atteindre des fréquences d'échantillonnage plus ou moins élevées. Ces composants sont très sensibles à la qualité des composants externes qui sont nécessaires à leur fonctionnement ainsi qu'à la qualité de la fréquence d'horloge qui lui est imposée. On pourra ainsi retrouver les mêmes convertisseurs dans des matériels de différentes gammes et qui sonneront plus ou moins bien en fonction du soin apporté à ces paramètres. On trouvera ces composants dans TOUS les appareils de technologies numériques qui produisent ou captent un son. De votre téléphone portable à votre ordinateur, en passant par votre lecteur MP3, jusqu'aux convertisseurs haute gamme utilisés dans les plus grands studios. Les formatsIl nous reste à parler d'une chose : les formats. On parle souvent de mp3, de flac, de ogg vorbis, d'aiff, de wav, etc... Il s'agit en fait du principe d'enregistrement du signal (aussi appelé codec) dans un fichier informatique qui donne aux fichiers leur nom et leur extension (on dit "un mp3"). Ben oui, une fois qu'on a obtenu un signal audio-numérique, il faut bien pouvoir le stocker ! Le PCM, pour Pulse Code Modulation est le format de base qui est simplement une représentation du signal audio tel quel. Il est généralement très volumineux. Pour réduire cette place, on utilise la compression : on va chercher à faire rentrer un maximum d'informations dans un fichier le plus petit possible. Il existe deux grands principes de compression :
Il reste deux formats très connus mais que je n'ai pas encore cité : le WAV et l'AIFF. En fait ce ne sont pas des formats à proprement parler car un WAV peut très bien être encodé en MP3, en WMA ou autre. Il s'agit en fait seulement d'un format conteneur Pour aller plus loinVous pouvez aller lire le dossier son qui reprend plus en profondeur ces éléments. Normalement après l'avoir lu, vous saurez exactement ce que vous manipulez quand vous faites de la MAO, quels paramètres utiliser et pourquoi. Ce dossier présente le son et sa nature, les signaux analogiques, numériques, les effets et les formats.
|
Mégaphone
|