08 Stmm Audio 2 MIDI

53
PRELUCRAREA AUDIO DIGITALA

description

08 Stmm Audio 2 MIDI

Transcript of 08 Stmm Audio 2 MIDI

  • PRELUCRAREA AUDIO DIGITALA

  • Cuprins

    MIDIStandardul MIDICrearea, editarea si interpretarea fisierelor MIDIAcustica muzicala si notatiiCaracteristici ale secventiatoarelor si claviaturilor MIDITipuri si formate de mesaje MIDITransmisia mesajelor MIDISintetizarea sunetelor

    PRELUCRAREA AUDIO DIGITALAMedii de lucru audio digitaleSoftware pentru prelucrare audioTipuri de fisiere audioPrelucrare dinamicaRestaurare audio

  • MIDIUn fisier audio poate fi reprezentat:-colectie de esantioane (cum s-a considerat pana in acest moment);-MIDI (Musical Instrument Digital Interface): memoreaza evenimente de sunet sau realizari umane de sunet. Se utilizeaza un limbaj scripting pentru specificarea de mesaje prin care se indica note, instrumente si durate. Fiecare mesaj descrie un eveniment (adica, schimbarea notei, a cheii, a tempo-ului, etc) ~ interpretarea unei piese muzicale.Mesajele MIDI genereaza sunetul corespunzator prin intermediul unui sintetizator (cauta fiecare sunet intr-o memorie de sunete sau creaza sunetul pe baza unui calcul matematic - in acest caz procesul se numeste sinteza FM) => fisierele MIDI < fisiere de esantioane!Dezavantaj: sunetul poate sa fie artificial, mecanic (in timp ce un fisier de esantioane poate sa memoreze toate subtilitatile interpretului).Avantaj: se poate utiliza un echipament cu clape MIDI conectat la calculator pentru interpretarea si inregistrarea unei piese muzicale, iar ulterior fisierul poate fi editat (modificarea instrumentului care interpreteaza, a notelor, a cheii). De asemenea, deoarece MIDI este un standard se pot transfera fisierele MIDI intre echipamente MIDI sau intre calculatoare.

  • Standardul MIDI

    Primul protocol MIDI (1.0): stabilit in 1983 - colaborarea mai multor firme (Roland Corporation, Sequential Circuits, Oberheim Electronics, Yamaha, Korg, Kawai) => creata si o asociatie (MMA MIDI Manufacturers Association).

    O componenta importanta = GM-1 (General MIDI) standardizeaza asignarea instrumentelor muzicale la numerele de bucata (patch numbers) pe masura ce sunt apelate.

    1999: GM-2, revizuit in 2003 s-a marit numarul de sunete.

    In tabelul urmator se prezinta maparea instrumentelor la numerele de bucata (GM-2):

  • Crearea, editarea si interpretarea fisierelor MIDI

    Dispozitivele hardware care genereaza mesaje MIDI se numesc controllere MIDI (keyboard pian electronic, saxofon, guitara).Dispozitivele care interpreteaza mesajele MIDI generand sunete se numesc sintetizatoare MIDI. Unele dispozitive pot realiza ambele operatii (exemplu anumite keyboard-uri). De asemenea unele placi audio din calculatoare pot sintetiza fisiere MIDI.

    Conectarea unui echipament MIDI la calculator:-la calculatoarele mai vechi: conector special MIDI de 15 pini;-actual prin USB => o conexiune MIDI standard = rata 31.25 kb/s.

    Un secventiator MIDI = dispozitiv hardware (independent de calculator) sau aplicatie software care permite receptia, memorarea si editarea datelor MIDI. Exemple de secventiator MIDI software: Cakewalk Music Creator sau Cubase. Secventiatorul permite vizualizarea unui fisier MIDI in diferite forme:-staff view afisand notatiile muzicale;-piano roll view indicand apasarile clapelor pianului;-lista de evenimente.In figurile urmatoare sunt prezentate aceste vizualizari din aplicatia Cakewalk Music Creator:

  • Asemanatoare secvetiatoarelor, programele de notatie muzicala pot fi utilizate pentru crearea de muzica prin:-introducerea de note una cate una;-click cu mouse-ul pe clapele unui pian;-folosind un editor de evenimente.

    Programele de prelucrare audio de esantioane pot citi si fisiere MIDI si le pot converti intr-un format de esantioane (WAV sau PCM) simplu !Mult mai greu: transformarea unui fisier de esantioane in fisier MIDI !

  • Acustica muzicala si notatiiIn notatia muzicala vestica sunetele muzicale se numesc tonuri sau tonalitati (tones), caracterizate prin inaltime (pitch), timbru si tarie (loudness). Prin adaugarea atac (onset) si durata, un sunet muzical se numeste nota.Pentru doua note caracterizate de frecventele g si h, aflate la n octave distanta exista relatia dintre frecventele corespunzatoare:h = 2n gFrecventa de 440 Hz este un punct de referinta si corespunde notei A. Octava dintre A si A ul mai inalt este divizata in 12 note: A, A sharp, B, C, C sharp, D, D sharp, E, F, F sharp, G, si G sharp. Termenul octava provine de la faptul ca exista opt note intregi in acel domeniu. A sharp este echivalenta cu B flat, etc... Aranjarea notelor pe clapele unui pian:

  • Pentru a calcula diferenta de frecventa pentru doua note succesive, se considera f1 nota de baza si f2=2f1 nota aflata cu o octava mai sus, intre acestea gasindu-se 12 note succesive, la distanta de un multiplicator x:2f1 = ((((((((((((f1x) x) x) x) x) x) x) x) x) x) x) x)=f1x122=x12=> x = 1.05946309436Astfel daca A are frecventa de 440 Hz, A# are frecventa de 440 1.05946309436 = 466.16 Hz, etc.Notatia muzicala se scrie pe o partitura (musical staff), care are la inceputul piesei o cheie (key signature), indicand care note se interpreteaza sharp si care flat.Timbrul unui sunet muzical desemneaza culoarea tonului, fiecare instrument interpretand diferit o anumita nota muzicala. Un instrument pe langa nota de baza (numita prima armonica) genereaza sunete cu frecventele multiplii notei de baza, numite armonici (armonica intai, armonica a doua, etc), care se combina cu nota de baza.Perceptia sunetului este influentata de rezonanta, care amplifica anumite armonici si diminueaza altele, avand un efect asupra timbrului instrumentului.

  • La emiterea unei note muzicale se disting etapele formand anvelopa de amplitudine:-atac (attack) din momentul in care incepe emiterea sa pana cand atinge amplitudinea maxima;-decadere (decay) usoara scadere in amplitudine dupa atac;-sustinere (sustain) cat continua vibratia sunetului la o amplitudine mare;-eliberare (release) oprirea sunetului inainte de stingerea sa naturala.

  • Caracteristici ale secventiatoarelor si claviaturilor MIDIIn functie de cat sunt de sofisticate, controloarele si secventiatoarele MIDI dispun de o serie de caracteristici suplimentare:-numarul de bucata (patch number) specifica instrumentul care trebuie activat, in cadrul mesajelor MIDI fiind referit ca numar de program (uneori la selectarea unui instrument pe o claviatura MIDI acesta este referit ca voce);-banca este o baza de date de numere de bucate;-claviatura polifonica poate interpreta mai multe note simultan (maxim 32 de note);-dispozitivul de iesire MIDI multitimbral poate interpreta simultan mai multe instrumente;-claviatura sensibila la atingere (touch sensitive) poate detecta viteza cu care este apasata o tasta, codifica aceasta intr-un mesaj MIDI si controleaza volumul sunetului;-claviatura sensibila la forta cu care este tinuta apasata o tasta (aftertouch), permitand efecte pentru trompeta si alamuri, cu variantele monofonic (aceeasi valoare pentru toate notele) sau polifonic (efect numai asupra unei note, celelalte ramanand neschimbate);-pedala de sustinere poate intarzia eliberarea unei note;

  • -rotita de modificare a inaltimii notei (pitch bend wheel) modifica inaltimea notei in timp ce este cantata, revenind la pozitia initiala dupa eliberare;-metronom dispozitiv audio pentru temporizare (ticaie in timpul redarii piesei);-software pentru transpozitie (schimbarea cheii), cuantizare temporala (mutarea notelor la intervale mai regulate), schimbarea de tempo si efecte DSP (flange, reverb, delay, echo).

    De facut distinctie intre doi termeni MIDI:-canal (channel) MIDI: o cale de comunicare de date intre doua dispozitive MIDI;-pista (track) MIDI: o zona de memorie in care se pastreaza datele MIDI, corespunzand unui interval de timp al secventiatorului unde pot fi vazute notele MIDI.

  • Tipuri si formate de mesaje MIDI

    Un mesaj MIDI este un pachet de date care codifica un eveniment. Evenimentele MIDI descriu modul cum se interpreteaza o melodie. Clasificarea mesajelor:1) Mesaje de canal: contin informatii relevante pentru canale, fiind de doua tipuri:-mesaje de voce canal : indica momentul cand o nota incepe si cand se termina, cat de tare este apasata, cat de tare este tinuta apasata (aftertouch), care instrument este activat, etc;--mesaje de mod canal : indica dispozitivului MIDI care canal trebuie activat pentru preluarea datelor si cum se interpreteaza acestea.

    2) Mesaje de sistem: contin informatii care nu sunt specifice vreunui canal particular (temporizare, sincronizare, setup).

  • Mesajele MIDI sunt transmise serial pe cuvinte de 10 biti, incep cu un bit 0 de start si se incheie cu un bit 1 de stop, informatia utila fiind pe 8 biti.

    Fiecare mesaj contine un octet de stare si zero sau mai multi octeti de date. Octetul de stare are bitul MSB 1 si indica tipul de mesaj, octetul de date avand bitul MSB 0. Specificarile complete pentru mesajele MIDI sunt date pe site-ul MMA. In tabela urmatoare cateva exemple de mesaje:

  • Exemplu: mesaj pe 3 octeti: x91 x3C x64 semnifica activare nota pe canalul 1, nota 60 (x3C) cu o viteza de apasare 100 (x64).

    MesajOctet stare in hexa (n este canalul)Octet stare in binarInformatia din octetii de dateNote OnX9n1001...Nota redata si viteza de lovire a clapei (2 oct.)Note OffX8n1000....Nota eliberata si viteza de eliberare a clapei (2 oct.)Aftertouch pentru o clapaxAn1010....Nota, presiunea (2 oct.)Aftertouch pentru intregul canalxDn1101....Presiunea (1 oct.)Program changexCn1100....Numar de bucata (1 oct.)Control changexBn1011....Tipul controlului (ex. modulatie, pan, etc.) si modificarea controlului (2 oct.)Pitch bendxEn1110....Scara de frecvente catre care inaltimea tonului este ajustata (2 oct.)

  • Transmisia mesajelor MIDI

    Transmisia mesajelor MIDI se face pe cuvinte de 10 biti la rata de 31.25 kb/s, ordinea bitilor in cadrul unui cuvant fiind LSB primul.

    Este posibil ca pentru note simultane si diferite efecte (rotita de modificare a notei) sa fie generate multe mesaje, ceea ce conduce la intarzieri. In acest caz se poate utiliza running status, o tehnica pentru reducerea cantitatii de date MIDI, eliminand redundantele. O data ce s-a comunicat un octet de stare, acesta nu mai trebuie repetat cat timp se aplica la octetii de date. Exemplu: un acord de trei note pe un canal, se transmite mesajul Note On o singura data, urmat de note si de viteza (de lovire a clapei). Comparatie intre stream-urile in cele doua cazuri: fara running status si cu running status:

  • Sintetizarea sunetelor

    Un dispozitiv care reda fisiere MIDI (de exemplu o placa de sunet sau o claviatura MIDI) poate sa utilizeze pentru sintetizarea sunetelor doua solutii:-sintetizarea cu modulatie de frecventa (FM);-sintetizarea cu tabela de unde (wavetable synthesis).

    Sintetizarea FM este realizata prin operatii matematice pe sunete, ca simple frecvente sinusoidale. Operatiile incep cu o frecventa purtatoare care este apoi modificata cu o frecventa de modulare. Exemplu: se aplica unei functii sinus o alta functie sinus. Ulterior se adauga alte functii pentru modularea sunetului in timp. Tehnica FM poate capta foarte bine timbrul instrumentelor reale si poate crea sunete noi care nu sunt proprii niciunui instrument. Metoda este utilizata in special de placile de sunet.

  • Sintetizarea cu tabela de unde se bazeaza pe stocarea esantioanelor de sunet ale instrumetelor reale, utilizand un dispozitiv de esantionare:-tehnica mai costisitoare decat precedenta;-poate stoca mult mai bine timbrul instrumentelor reale (mai buna fidelitate).Micsorarea numarului de esantioane pentru fiecare instrument: se poate memora o nota produsa de un instrument, iar pentru obtinerea notelor urmatoare, nota poate fi deplasata (shiftata), dar nu cu prea mult, caci fiecare instrument pentru fiecare nota genereaza si o serie de tonuri suplimentare (overtones) specifice, care nu se pot obtine prin calcule (se produce aliasing) => gama de note este impartita in regiuni (key splits), fiind preluata o singura nota pentru fiecare regiune, iar celelalte note din regiune se obtin prin deplasare.

    O alta solutie de reducere a cerintelor de memorie = reducerea dimensiunii esantionului, prin stocarea unui interval foarte scurt de timp, iar la redare esantionul este reluat in bucla pentru a obtine durata necesara. Se pot aplica suplimentar filtrari, de asemenea esantioanele pot fi comprimate => sintetizarea cu tabela de unde este larg adoptata.

  • PRELUCRAREA AUDIO DIGITALA

    Medii de lucru audio digitale

    Exista doua medii importante de lucru cu datele audio digitale:

    -interpretare in direct la teatru, concert (live);

    -studio de inregistrari.

    Echipamentul analogic utilizat anterior:

  • Elementul central: mixerul sau consola de mixare (primeste semnale de la microfoane si instrumente, ajusteaza amplitudinle acestora, egalizeaza componentele de frecventa si trimite iesirile la difuzoare). Fiecare intrare la mixer este un canal, existand chiar si 24 de canale sau mai multe.

    O alta solutie este utilizarea unui mixer digital. Acesta contine convertor analog-digital (ADC), permitand ca prelucrarile ulterioare sa fie facute digital.

  • In continuare se presupune ca elementul central de prelucrare audio (DAW digital audio workstation) este calculatorul personal, avand o placa de sunet cu urmatoarele functii:-conectori de intrare pentru microfoane si surse audio externe;-converteste sunetul din analogic in digital cu un ADC, in timp ce este inregistrat;-conectori de iesire pentru difuzoare si casti;-converteste sunetul din digital in analogic cu DAC, in timp ce este redat;-sintetizeaza esantioane de sunet MIDI utilizand sinteza FM sau cu tabela de unde.

  • Exista doua tipuri de microfoane:

    -microfon dinamic: utilizeaza o bobina de inductie atasata la o diafragma, plasata intr-un camp magnetic, astfel incat bobina se deplaseaza la variatiile de presiune. Aceste microfoane sunt robuste, ieftine, pentru inregistrari acasa. Nu necesita sursa externa de alimentare. Frecventa limita este de 16 kHz.

    -microfon capacitiv: are o diafragma si o placuta de baza, care impreuna formeaza o capacitate. La schimbarea distantei dintre placile condensatorului datorita vibratiilor, capacitatea se modifica, la fel si tensiunea reprezentand sunetul. Microfonul este mult mai sensibil si mai usor. Necesita sursa externa de alimentare. Frecventa limita este de 20 kHz.

  • Calculatorul trebuie sa dispuna de o serie de conectori:

  • -conectori pentru comunicatii de date: Firewire (pentru conectarea audio, video si discuri) cu viteza de 400 Mb/s, fara solicitarea procesorului, in doua variante cu 4 pini si 6 pini si USB2 cu 480 Mb/s, dar cu solicitarea procesorului;-conector S/PDIF (Sony Phillips Digital Interface) pentru conectarea unui recorder audio digital sau interfata externa de sunet, care transfera date audio digitizate;-conector (stereo 1/8) pentru microfon (analogic) la care pe placa de sunet exista un ADC;-conectori TRS sau TR de 1/4 pentru echipamente profesionale (amplificatoare de microfon, casti, ghitara, difuzoare);-conectori XLR pentru conectarea unui microfon de buna calitate la interfete de sunet externe (prin cablu XLR), oferind un semnal de inalta calitate, balansat si impedanta scazuta;-conectori RCA pentru echipament audio si video, existand trei conectori, galben pentru semnal video compus, alb pentru canal stanga sau audio mono si rosu pentru canal audio dreapta.

  • Conectorii se caracterizeaza prin:-impedanta (Z), masurata in Ohms ( ). De exemplu, microfoanele pot fi de joasa impedanta (pana la 600 ), de medie impedanta (intre 600 si 10 k ) si de inalta impedanta (peste 10 k ). Un microfon de impedanta mare poate furniza un semnal de amplitudine mai mare decat un microfon de impedanta scazuta.-lungimea cablului influenteaza semnalul, un cablu lung distorsioneaza frecventele inalte (prin reactanta cablului).-semnal balansat: semnalele balansate dispun de doi conductori de semnal si un ecran. Semnalele sunt defazate cu 180 (adunand doua sinusoide defazate cu 180 suma este zero). Zgomotul care se adauga liniei va fi aproximativ uniform in cele doua canale, iar prin adunarea lor se obtine zgomotul x2, ceea ce permite estimarea acestuia si eliminarea din semnal=> canalele balansate sunt mai putin afectate de zgomot.Semnalele nebalansate utilizeaza un conductor central invelit intr-un ecran. Chiar si asa semnalul este afectat de zgomot.

    Concluzie: cea mai buna solutie pentru inregistrare audio este oferita de microfoanele cu impedanta scazuta (cele cu conexiune XLR).

  • Software pentru prelucrare audio

    Printre cele mai utilizate programe de prelucrare audio sunt: Digidesign Pro Tools (Mac sau Windows), Adobe Audition (Windows), Apple Logic (Mac), Sony Sound Forge (Windows) si Nuendo (Mac sau Windows). Cakewalk Music Creator si Cakewalk Sonar sunt pachete software combinate pentru prelucrare audio / MIDI. Propellerhead Reason (Mac sau Windows) este un pachet sofisticat audio / MIDI furnizand un secventiator, masina de tobe si o varietate larga de sintetizatoare. Acid Pro este un instrument pentru creatia de muzica. Max/MSP (Mac sau Windows) este un mediu de dezvoltare pentru muzica interactiva si prelucrare audio.

    Exista de asemenea o serie de freeware, shareware si instrumente comerciale pentru Linux: DAP, MixViews, ReZound, Slab, JoKosher, KWave, Brahms, Jazz++, TiMidity++, Playmidi, BladeEnc, si aRts.

    Audacity este un program open source pentru Mac, Windows si Linux.

  • Caracteristicile principale ale unui software de prelucrare audio includ:-import si salvare fisiere audio intr-o varietate de formate;-interfata pentru inregistrarea si redarea de sunete;-vizualizarea formei de unda, permitand editarea pana la nivelul de esantion;-editoare multitrack;-instrumente de restaurare audio pentru inlaturarea suieraturilor, clickurilor, pocniturilor si a zgomotului de fond;-abilitatea de preluare de intrari sau furnizare de iesiri de la canale multiple;-efecte speciale reverb, panning, flange;-controale pentru egalizarea si ajustarea volumului si intervalului dinamic;-filtre de frecventa;-gestionarea formatului MIDI alaturi de date audio digitale si integrarea intr-un singur fisier audio;-inregistrarea de esantioane si adaugarea la banca de pachete MIDI;-codecuri de compresie.

  • In Waveform view: reprezentare grafica a undelor sonore (se pot afisa si edita la nivelul esantioanelor). Se mai numeste si editor de esantioane. Pe orizontala se afiseaza timpul, iar pe verticala amplitudinea. Standardul pentru timp este SMPTE (Society of Motion Picture and Television Engineers), divizat in ore, minute, secunde si cadre (frames). De exemplu, un standard (imprumutat din video) poate sa fie de 30 cadre / sec.In Multitrack view se permite inregistrarea de diferite sunete, instrumente si voce pe piste separate, care pot fi prelucrate independent. O pista este o secventa de esantioane audio care poate fi redata si editata ca o unitate separata. De obicei piste separate sunt asociate cu instrumente sau voci separate.Canalul difera de pista, canalul corespunzand unui stream de date audio. Astfel inregistrare pe un canal inseamna mono, iar pe doua canale inseamna stereo. Pe masura dezvoltarii industriei multimedia au aparut inregistrari multicanal: multicanal 5.1 are 5 canale fata-centru, fata-dreapta, fata-stanga, spate-dreapta si spate-stanga, plus un canal LFE (low frequency extension channel), numit subwoofer cu frecvente intre 10-120 Hz, iar multicanal 6.1 are un canal spate-centru suplimentar.

  • Tipuri de fisiere audio

    Formatele de fisiere audio difera printr-o serie de caracteristici:-codificarea esantioanelor:-cuantizare liniara;-cuantizare logaritmica;-valori de esantioane cu semn sau fara semn;-formatul datelor:-existenta unui header;-memorarea octetilor in ordinea litle-endian sau big-endian; -intreteserea canalelor;-tipul de informatii memorate in fisiere:-constrangeri legate de rata de esantionare si/sau adancimea de biti;-constrangeri legate de numarul de canale;-informatii suplimentare, ca timestamps, loop points;-fisierul poate fi comprimat:-utilizand o procedura cu pierderi;-utilizand o procedura fara pierderi;-format open sau proprietar.

    Principalele formate audio sunt prezentate in tabelul urmator:

  • Extensia de fisierTip de fisier sau codecCaracteristici.aacAdvanced Audio CodingCompresie fara pierderi ca imbunatatire MP3, utilizat pentru iPods, cell phones si PlayStations portabile..aifAudio Interchange File Format, format wave standard AppleFormat PCM necomprimat, suporta mono/stereo, 8/16 biti, varietate de rate de esantionare, ordine big-endian..auNeXT/Sun (Java)Poate fi fara compresie sau cu compresie CCITT -law, A-law, G721; suporta mono/stereo, 8/16 biti, varietate de rate de esantionare (fara compresie); utilizat pentru distributie pe Internet si includere in appleturi si aplicatii Java..flacFree Lossless AudioCodec, Xiph.OrgFoundationCodec gratuit fara pierderi, compresie 1.5:1 sau 2:1; pentru compresie fara pierderi pentru web..mp3MPEG-1 Layer 3 audioRata mare de compresie la o calitate buna, inclusiv pentru web..oggOgg Vorbis, Xiph.OrgFoundationCodec gratuit, rata mare de compresie cu buna fidelitate, concurenta cu .mp3..rawFisier RawValori de esantion fara header, la deschiderea fisierului se introduc rata de esantionare, rezolutia si numar de canale..rmReal MediaSuporta stream audio (permite ascultare inainte de descarcarea completa a fisierului).

  • .ttaTrue AudioCodec gratuit fara pierderi, compresie 1.5:1 sau 2:1; pentru compresie fara pierderi pentru web, competitie cu .flac..wav A-law/-lawCCITT standard G.711Fisiere cu esantioane pe 8 biti create din esantioane pe 16 biti folosind codificarea A-law/-law,cu scara dinamica de 13 biti (aprox. 78 dB)..wav DVI/IMAInternational Multimedia Association, versiune ADPCM format .wav cu compresie ADPCMUtilizeaza o metoda diferita (mai rapida) decat Microsoft ADPCM, alternativa la MPEG cu decodificare rapida si compresie audio de buna calitate..wav Microsoft ADPCMMicrosoftUtilizeaza ADPCM, furnizeaza 4 biti/canal date comprimate cu rata 4:1..wav Windows PCMMicrosoftStandardul Windows pentru audio PCM necomprimat, suporta mono/stereo, varietate de adancime de biti si rate de esantionare, conform specificatiilor RIFF..wma/.asfMicrosoft WindowsMedia (audio)Codec Microsoft, permite alegerea calitatii, inclusiv rata de biti constanta (CBR constant bit rate) sau variabila (VBR variable bit rate), compresie cu/fara pierderi, suporta streaming audio.

  • Prelucrare dinamica

    Prelucrarea dinamica este procesul de ajustare a scarii dinamice a unei selectiuni audio fie pentru a reduce, fie pentru a creste diferenta dintre pasajele cele mai puternice (tari) si cele mai reduse (silentioase). In productia de muzica, vocile si instrumentele sunt inregistrate separat, fiecare pe pista sa, iar fiecare pista se poate ajusta dinamic in timp real sau dupa inregistrare.

  • Modificarea scarii dinamice se poate realiza prin patru metode:-compresie in jos (downward compression): micsoreaza amplitudinile semnalului care sunt peste o anumita valoare de prag, fara sa schimbe amplitudinile sub aceasta valoare, reducand astfel scara dinamica;-compresie in sus (upward compression): ridica amplitudinile semnalului care sunt sub o anumita valoare, fara modificarea amplitudinilor peste aceasta valoare, reducand scara dinamica;-expansiune in sus (upward expansion): ridica amplitudinile semnalului care sunt peste o valoare de prag, fara sa schimbe amplitudinile sub aceasta valoare, crescand scara dinamica;-expansiunea in jos (downward expansion): micsoreaza amplitudinile semnalului sub o valoare de prag, fara modificarea amplitudinilor peste aceasta valoare, crescand scara dinamica.

  • Limitarea audio limiteaza amplitudinea unui semnal audio la un nivel desemnat. Se poate realiza hardware, la inregistrare sau software, executandu-se taierea amplitudinilor mari (clipping). Rezulta anumite distorsiuni ale formei de unda.Normalizarea este un proces care creste amplitudinea unui semnal audio si deci si volumul perceput. Deoarece opereaza pe un intreg semnal audio trebuie aplicat dupa inregistrare.

  • Algoritmul de normalizare:1) gaseste amplitudinea cea mai mare din selectia audio;2) gaseste amplificarea necesara pentru a creste amplitudinea cea mai mare la valoarea maxima dorita (implicit 0 dBFS sau o anumita valoare setata de utilizator);3) mareste toate amplitudinile din selectie cu aceasta amplificare.

    Varianta acestui algoritm normalizeaza amplitudinea RMS la o valoare de decibel specificata de utilizator, caci RMS furnizeaza o masura mai buna pentru volumul perceput al sunetului. In unele programe se furnizeaza o setare predefinita impreuna cu o explicatie intuitiva (exemplu: Normalize RMS to 10dB (speech)).

  • Compresia si expansiunea se pot reprezenta matematic printr-o functie de transfer sau grafic. O functie de transfer corespunzatoare primei bisectoare (linie la 45) nu modifica semnalul audio, insa o functie liniara de transfer deasupra primei bisectoare creste amplitdinea, iar sub prima bisectoare scade amplitudinea.Functii liniare de transfer pentru crestere cu 5 dB si micsorare cu 5 dB (fara compresie sau expansiune).

  • Compresia in jos necesita un prag (amplitudinile peste aceasta valoare sunt micsorate). Exemplu de functie de transfer:Amplitudinile mai mari decat -40 dB sunt micsorate cu un raport 2:1.

  • Compresia in sus creste amplitudinea semnalului mai mic decat o valoare de prag. Exemplu de functie de transfer:Amplitudinile mai mici de -30 dB sunt amplificate cu un raport 2:1.

  • Unele programe permit combinarea celor doua operatii intr-una singura In acest caz functia de transfer poate arata astfel:Se executa compresie in jos pentru amplitudinile mai mari decat -20 dB, fara compresie intre -20 si -60 dB si compresie in sus sub -60 dB. Scara dinamica a fost redusa prin compresie in jos si compresie in sus.

  • Exemplu de semnal care a fost prelucrat dinamic prin compresie in jos si compresie in sus, iar apoi normalizat: Semnalul audio initial. Dupa compresie

  • Dupa normalizare.

  • Restaurare audio

    In timpul inregistrarilor audio apar zgomote de fond (aparatul de aer conditionat, motorasul unui harddisk, vantul, etc). Pentru eliminarea acestor zgomote se pot utiliza trei tipuri de restaurare audio: blocarea zgomotului (noise gating), reducerea zgomotului (noise reduction) si inlaturarea click si pop (click and pop removal).Poarta de zgomot (noise gate) blocheaza semnalele cu amplitudine sub un anumit prag. Cand esantioanele sunt sub valoarea de prag, poarta se inchide si esantioanele nu sunt lasate sa treaca. Cand esantioanele cresc deasupra valorii de prag poarta se deschide si lasa sa treaca aceste esantioane. O poarta permite specificarea unor parametri:-nivel de reducere (reduction level): amplitudinea sub care sunt reduse esantioanele;-timp de atac (attack time): timpul de deschidere a portii cand semnalul depaseste valoarea de prag (timp scurt poate sa prinda de exemplu un sunet de tobe);

  • -timpul de eliberare (release time): timpul de inchidere a portii din momentul in care semnalul scade sub prag (o bucata muzicala care scade incet in volum trebuie sa aibe un timp de eliberare mare pentru a prinde efectul);-control de detinere (hold control): timpul minim cat poarta trebuie sa stea deschisa;-control de histerezis (hysteresis control): este util in cazul cand semnalul fluctueaza in jurul valorii de prag, ceea ce ar insemna inchiderea si deschiderea continua a portii (fenomen numit chatter), astfel se poate indica diferenta dintre valoarea care deschide poarta si valoarea care o inchide.

  • Interfata pentru poarta de zgomot (Logic Pro).

  • Interfetele pentru reducerea zgomotului afiseaza de obicei graficul analizei de frecventa: pe axa orizontala se reprezinta frecventele, iar pe axa verticala amplitudinile. Utilizand culori diferite se reprezinta semnalul original, cantitatea de reducere a zgomotului si zgomotul. Setarea principala se refera la reducerea zgomotului.Profilul zgomotului se obtine din analiza Fourier (se determina frecventele la care apar zgomotele si amplitudinile corespunzatoare acestor frecvente). Dupa determinarea profilului zgomotului se compara spectrul de frecvente al intregului semnal cu profilul, iar sectiunile care coincid sunt eliminate.O astfel de interfata permite setarea unor parametrii de netezire:-netezire de timp: timpii de atac si eliberare pentru reducerea zgomotului;-netezire de frecventa: gradul la care zgomotul identificat intr-o banda de frecventa afecteaza schimbarile de amplitudine in benzile de frecvente invecinate;-netezire de tranzitie: seteaza o gama intre amplitudini care sunt considerate zgomote si cele care nu sunt considerate zgomote.

  • Software-ul pentru reducerea zgomotului poate fi setat pentru a cauta un anumit tip de zgomot:-zgomot alb (white noise): apare la amplitudini egale (sau aproape egale) pentru toate frecventele, echivalent cu energii egale in benzi de frecventa de aceleasi dimensiuni (graficul frecventa-amplitudine aprox orizontal, deci ariile de sub grafic sunt egale pentru benzi egale);-zgomot roz (pink noise): energii egale in benzi de octave (pentru o nota trecerea de la o octava la octava urmatoare inseamna dublarea frecventei).Eliminatorul de click si pop detecteaza intr-o portiune selectata a fisierului audio o schimbare brusca de amplitudine si elimina aceasta schimbare prin interpolarea undei de sunet intre punctele de start si sfarsit a click-ului sau pop-ului