Transmisia datelor multimedia in retele de calculatoare Compresia audio II

64
Transmisia datelor multimedia in retele de calculatoare Compresia audio II Conf. Dr. Ing. Costin-Anton Boiangiu <[email protected]> UNIVERSITY POLITEHNICA of BUCHAREST DEPARTMENT OF COMPUTER SCIENCE

description

UNIVERSITY POLITEHNICA of BUCHAREST DEPARTMENT OF COMPUTER SCIENCE. Transmisia datelor multimedia in retele de calculatoare Compresia audio II. Conf. Dr. Ing . Costin-Anton Boiangiu < [email protected] >. Cuprins. O scurta istorie: MPEG-1, MPEG-2, MPEG-4, MEG-7 - PowerPoint PPT Presentation

Transcript of Transmisia datelor multimedia in retele de calculatoare Compresia audio II

Slide 1

Transmisia datelor multimedia in retele de calculatoareCompresia audio IIConf. Dr. Ing. Costin-Anton Boiangiu

UNIVERSITY POLITEHNICA of BUCHARESTDEPARTMENT OF COMPUTER SCIENCECuprinsO scurta istorie: MPEG-1, MPEG-2, MPEG-4, MEG-7Descrierea standardului MPEG-1 Descrierea standardului MPEG-1 Nivelul 3 (MP3)Descrierea standardului MPEG-2 AACStructura datelor in MPEG-1, MP3, MPEG-2 AAC Apreciarea calitatii compresiei audioCompresia prin modulatia diferentiala

O scurta istorieMoving Pictures Expert Glkroup (MPEG, ca acronim) este parte a organizatiei ISO (International Organization for Standardization) si a dezoltat o serie de standarde audio-video cunoscute ca MPEG-1 (MPEG Phase 1) (IS 11172) MPEG-2 (MPEG Phase 2)(IS 13818)Acestea sunt primele standarde internationale in domeniul compresiei audio numerice.

O scurta istorieMPEG-1 acopera codarea surselor stereo la rate de esantionare mari asigurand o calitate transparenta, in timp ce MPEG-2 ofera in plus si codarea stereo la rate mici de esantionareDe asemenea, MPEG-2 introducere tehnica de codare multi-canal cu si fara compatibilitate cu MPEG-1 pentru a asigura o imagine acustica imbunatatita numai pentru aplicatiile audio si pentru sistemele de videoconferinteMPEG-2 fara compatibilitate anterioara se numeste MPEG-2 AAC (Advanced Audio Coding), ofera cea mai mare rata de compresie

O scurta istorieAplicatiile tipice ce folosesc standardul MPEG sunt in productia audio, emisiuni radio digitale, memorare digitala, si alte aplicatii multimediaMPEG nu standardizeaza codoarele sau decodoarele ci doar tipul de informatie care trebuie produs de un codec compatibil MPEGAAC = Advanced Audio CodingPNS = Perceptial Noise SubstitutionLTP = Long Term PredictionTwinVQ = Transform-Domain Weighted INterleave VQ

Nr.TipulAnulDestinatieTrasaturi specifice1MPEG-11992Audio/Video DigitalFs = 32 KHz, 44.1 KHz si 48 KHz.2MPEG-21994Audio/Video Digital TeleviziuneCodare multicanal;Adauga FS=16 KHz, 22.05 KHz si 24 KHz.3 MPEG-2-AAC1997Audio multicanalAACFs de la 8 KHz pana la 96 KHz;Un numar de canale de la 1 la 48.4MPEG-41999MultimediaCodare bazata pe obiectePNS + LTP + TwinVQ5MPEG-72001Se refera la eprezentarea continutului pentru scopuri de cautare a informatiei in multimedia, filtrare, managemnt si procesare.MPEG-1MPEG-1 este numele primei faze a lucrului MPEGLucrul a inceput in 1988 si s-a incheiat in 1992 prin adoptarea standardului IS 11172Partea de codare audio (IS 11172-3) este proiectata sa raspunda la multe aplicatiiMPEG-1 audio consta in trei moduri de operare, numite straturi/niveluri: nivelul 1nivelul 2 nivelul 3 - are cea mai mare complexitate si a fost desemnat sa asigure cea mai mare calitate la debite mici de informatie (128 Kb/s pentru un semnal tipic stereo)Frecvente de esantionare: 32 KHz, 44.1 KHz si 48 KHzMPEG-2MPEG-2 denota a doua faza a dezvoltarii MPEG, prin introducerea unor concepte noi in codarea video Aplicatia de baza este cea a televiziunii digitaleStandardul original MPEG-2 (IS 13818-3) a fost finalizat in 1994 si consta din doua extensii ale lui MPEG-1 audio:codarea audio multicanalse adauga frecvente de esantionare de 16 KHz, 22.05 KHz si 24 KHz.cresterea eficientei codarii la debite de informatie mici

MPEG-2-AAC/MPEG-3MPEG-2-AAC (Advanced Audio Coding)AAC este o schema de codare de generatia a douaSuporta frecvente de esantionare de la 8 KHz pana la 96 KHz si un numar de canale de la 1 la 48MPEG-3Gandit initial pentru codarea video in aplicatii HDTVIntrucat instrumentele dezvoltate pentru MPEG-2 au acoperit si aria necesitatilor HDTV, planul de a dezvolta un standard special MPEG-3 a fost anulatCateodata MPEG-nivelul 3 (sau MP3) este gresit referit ca fiind MPEG-3

MPEG-4Spre deosebire de primele doua standarde care se refera in principal la eficienta compresiei, MPEG-4 se refera la noi functionalitati: terminal utilizator fixe si mobileaccesul bazelor de date, cumunicatii si servicii de tip interactivMPEG-4 consta dintr-o familie de codare audio, pornind de la codarea vorbirii cu debite mici (sub 2 Kbit/s) pana la codari de inalte calitate de 64 Kbit/s pe canalMPEG-4Furnizeaza instrumente pentru codarea obiectelor audio, naturale si artificialePermite reprezentarea sunetelor naturale (vorbire si muzica) si sinteza sunetelor bazata pe descrieri structurateReprezentarea sunetului sintetizat poate fi obtinuta din date de tip text sau din descrierea instrumentului si prin codarea unor parametri pentru a obtine anumite efecte, cum sunt reverberatia si spatialitateaReprezentarile furnizeaza compresie si alte facilitati, cum sunt scalabilitatea si redarea in ordine inversa (play-back) la difierite vitezeMPEG-7MPEG-7 nu defineste algoritmiEste un standard de reprezentare a continutului pentru scopuri de cautare a informatiei in multimedia, filtrare, management si procesare.Furnizeaza:descrieri standardizate si scheme de descriere a structurilor audio si a continutului sunetuluiun limbaj pentru a specifica astfel de descrieri si scheme de descriereDescrierea standardului MPEG-1 AudioStraturile si modurile de operare Standardul consta din trei niveluri/straturi, I, II, si III (Layer I, II, and III) de complexitate, intarziere si calitate subiectiva crescandeDin pdv al hardware-ului si software-ului, straturile superioare contin mai multe blocuriStraturile superioare contin blocurile straturilor inferioare la care se adauga noi blocuriUn decodor audio standard complet (full) MPEG-1 este capabil sa decodeze toate cele trei straturi. Descrierea standardului MPEG-1 AudioIerarhia straturilor standardului MPEG-1/AudioPentru aceeasi calitate a perceptiei, creste raportul de compresie si scade debitul de informatie

Straturile I si IIStraturile MPEG I si II au structuri similareStratul II obtine performante mai bune, intrucat informatia despre factorii de scalare este redusa prin exploatarea redundantei dintre factorii de scalareIn plus, cuantizarea se face pe o scara mai finaCodorul straturilor I si II codeaza intrarea digitala audio in 32 de subbenzi cu ajutorul unor filtre trece banda egal distantatePentru maparea frecvetelor se foloseste o structura de filtru special (polyfazic), fiecare avand 512 coeficientiStructura codecului MPEG-1/audio (Straturile I si II)

Structura de bazaPrimul pas este conversia semnalului audio in componente spectrale cu ajutorul unui bank de filtreStraturile I si II utilizeaza filtrebank de tip sub-banda, iar stratul II foloseste o structura hibridaFiecare componenta spectrala este cuantizata si codata cu scopul de a mentine zgomotul de cuantizare mai mic decat pragul de mascareNumarul de biti pentru fiecare sub-banda si factor de scala este determinat pentru o lungime de tip blocFiecare bloc are 12 (in Stratul I) sau 36 (Straturile II si III) esantioane sub-bandaNumarul de biti de cuantizare este obtinut cu un algoritm de alocare dinamica controlat de modelul psiho-acusticCuvintele de cod pentru sub-benzi, factorul de scala si bitii de alocatie sunt multiplexati pentru a se obtine o secventa (sir) de biti, impreuna cu un antet (header) si cu o serie de date optionale (auxiliare)(ancillary)In decodor are loc filtru bank de sinteza reconstruieste blocul de 32 iesiri de esantioane din sirul de biti demultiplexatiStructura de bazaNumarul de nivele de cuantizare pentru fiecare componenta spectrala se obtine dintr-o regula de alocare dinamica a bitilor controlata de modelul pshiho-acusticProcedura iterativa minimizeaza NMR in fiecare subbandaSe porneste cu numarul de biti zero si cu un factor de scalare zeroLa fiecare pas al iteratiei, circuitul de cuantizare SNR(m), numarul de niveluri este crescut pentru a produce cela mai mare NMR la iesirea cuantizoruluiSe folosesc tabele de corespondenta pentru estimarea SNR(m) functie de mStructura de bazaBlocul de compandare se utilizeaza in procesul de cuantizare, astfel incat se formeaza blocuri de esantioane, in care cel mai mare esantion are valoarea 1, acest lucru fiind obtinut cu ajutorul factorului de scalaIn stratul I, se formeaza blocuri de 12 esantioane scalate si decimate in fiecare subbanda (stanga si dreapta)La frecventa de esantionare de 48 KHz, cele 12 esantionae pentru o subbanda corespund unui interval audio de 8 msIntrucat sunt 32 de blocuri, fiecare cu 12 esantioane, rezulta 32*12=384 esantioane audioExista cate un bit pentru fiecare blocStructura de bazaIn stratul II, in fiecare sub-banda se foloseste un super-bloc de 36 de esantioane, constituit din trei blocuri de 12 esantionae decimateSuper-blocul corespunde unui interval audio de 24 ms la 48 KHz frecventa de esantionareExista un bit alocat pentru fiecare super-bloc cu cate 36 de esantioaneCele 32 super-blocuri, fiecare cu 36 esantioane decimate reprezinta toate impreuna:36*36=1152 esantioane audioCa si in stratul I, pentru fiecare bloc de 12 esantionae se calculeaza un factor de scalarePentru transmiterea factorilor de scalare se foloseste o tehnica de eliminare a redundantei, bazata pe marimea schimbarii factorilor de scala, se transmite unul, doi sau toti trei factori de scala, impreuna cu o informatie de 2 biti pentru selectia coeficientilor de scalare

DecodareaSecventele sub-benzilor sunt reconstruite pe baza blocurilor cu 12 esantioane considerand factorul de scala decodat si informatia de alocare a bitilorDaca o sub-banda nu are biti alocati, esantioanele corespunzatoare acestei sub-benzi sunt considerate zeroLa fiecare calcul a celor 32 sub-benzi se aplica unui fintru bank de sinteza, si se obtin 32 esantioane audio in format PCM fiecare pe 16 bitiIn comunicatiile bidirctionale si in sistemele de inregistrare, filtrul bank poate fi utilizat in mod invers in procesul de decodareDescrierea stratului 3 al standardului MPEG audio

CaracteristiciFlexibilitateIn vederea aplicarii unei largi palete de aplicatii si scenarii, MPEG defineste reprezentari ale datelor incluzand un numar de optiuniMod de operare: MPEG-1 lucreaza pentru semnale mono dar si stereoO tehnica numita codare stereo compusa (joint stereo coding) poate fi utilizata pentru a coda mai eficient canalele stanga si dreapta ale semnalului audio stereofonicNivelul 3 permite codarea duala mijloc/stereo si a intensitatii stereo. Modurile de operare sunt:un canalcanal dublu (doua canele independent, de exemplu continand informatie audio in 2 limbi diferite)stereostereo compus

CaracteristiciDebitul informatiei (Bit-rate)

Alegerea ratei de bit este lasata, intre anumite limite, la optiunea celui care implementeaza codorul MPEG audioPentru nivelul 3, standardul defineste un domeniu al debitelor de la 8Kbit/s la 320 Kbit/sMai mult, decodorul pentru nivelul 3 trebuie sa suporte schimbarea tarei de birt de la un cadru la altulCaracteristiciCodorulCodarea MPEG audio este lasata complet la latitudinea celui care implementeaza standardulStratul III este comun pentru MPEG-1 si MPEG-2Acest strat introduce structuri noi, asa cum se prezinta in figura 11, in particular un filtru bank comutatIn plus, se face o analiza prin sinteza, un control avansat al pre-ecourilor, o cuantizare neuniforma si o codare entropicaO tehnica de memorare, denumita bit reservoir conduce la micsorarea ratei de bitEste singurul strat care furnizeaza suport pentru decodarea codarii cu rata de bit variabilaCaracteristiciFiltru bank hibrid comutatPentru a obtine o rezolutie in frecventa imbunatatita, aproape de partitia in benzi critice, cele 32 de semnale su-banda sunt divizate in continuare prin aplicarea fiecarei sub-benzi, o MDCT in 6 sau 18 puncte, cu 50% suprapunereDeci fereastra va contine, 12 respectiv 36 esantioaneNumarul maxim de componente din frecventa este 32*18=576, fiecare reprezentand o banda de 24000/576 = 41.67 HzTransformarea bloc in 18 puncte se aplica pentru a furniza o rezolutie imbunatatita, in timp ce transformarea bloc in 6 puncte ofera o rezolutie mai buna in domeniul timpAceasta din urma se palica in cazul asteptarii unor pre-ecouriDepinzand de natura pre-ecourilor asteptate, o parte sau toate transformarile sunt schimbate

Structura blocului de compandare

CaracteristiciCuantizare si codareEsantionale iesirii MDCT sunt esantionate neuniform, furnizand astfel o eroare-medie patratica mica si o mascare bunaRezervorul de biti aigura ca bufferul decodorului nu este niciodata gol sau depajit (under-flowand over-flow) cand se prezinta secventa de siboluri binare, cu o rata constanta, la intrarea decodoruluiModelul perceptual fie utilizeaza un analizor (filtru-bank) separat sau combina calculul valorilor energiilor si filtrul principalIesire modelului perceptual consta in valorile pragurilor de mascare pentru fiecare partitie a codoruluilIn nivelul 3, partitiile codorului sunt echivalente in mare cu benzile critice ale auzului umanDaca zgomotul de cuantizare poate fi pastrat sub pragul de mascare pentru fiecare partitie a codorului, atunci rezultatul compresiei trebuie sa nu difere de semnalul originalCaracteristiciCuantizarea este neliniara, astfel incat valorile mari sunt codate automat mai putin precisValorile cuantizate sunt codate HuffmanPentru adaptarea procesului de codare la diferite statistici ale semnalului audio, tabela Huffman este selectata dintr-o multime cu mai multe optiuni, astfel incat se pot folosi diferite tabele Huffman pentru parti diferite ale spectruluiProcesul de cautare al castigului optim si a factorilor de scalare pentru un bloc dat se face uzual prin doua bucle de iterative, ce lucreaza in modul analiza-sintezao bulca internao bucla externaCaracteristiciBucla interna (bucla pentru rata de bit)Tabela Huffman aloca cuvinte de cod scurte valorile cuantizate ce apar cel mai desDaca numarul de biti rezultati din operatia de codare depaseste numarul de biti disponibili pentru a coda un bloc de date, se poate corecta prin ajustarea castigului global pentru a determina un pas de cuantizare mai mare, obtinandu-se un numar mai mic de valori cuantizateBucla se numeste rate loop pentru ca modifica rata globala a codorului pana cand este suficient de micaCaracteristiciO bucla externa (bucla de control a zgomotului): pentru obtinerea unui zgomot de cuantizare la un prag de mascare, factorii de scala sunt aplicati la fiecare factor de scala al benziiSistemul pleaca cu un factor de scala unitial de 1.0 pentru fiecare bandaDaca zgomotul de cuantizare intr-o banda data depaseste pragul auditiei (deci, zgomotul acceptabil) asa cum s-a furnizat de modelul perceptual, factorul de scala pentru aceasta banda este ajustat pentru reducerea zgomotului de cuantizareIntrucat obtinerea unui zgomot de cuantizare mic necesita un numar mare de pasi de cuantizare si deci o rata de bit mare, rata de ajustare a buclei trebuie sa se repete de fiecare data cand se aplica noi factori de scalaBucla externa este executata pana cand zgomotul actual (calculat ca diferenta intre valorile spectrului original si valorile spectrului cuantizate) este mai mic decat pragul de mascare pentru fiecare factor de scala al unei benziComponentele spectrale sunt cuanizate si codate cu scopul mentinerii zgomotului de cuantizare sub pragul de mascare30Descrierea standardului MPEG-2 AACAAC urmeaza aceasi structura ca si stratul 3 analizor de inalta rezolutiecuantizare neuniformacodare Huffmanbucle iterative cu analiza-sintezadar adaugao serie de detalii prin utilizarea unor noi instrumente de codare pentru imbunatatirea calitatii la debite mici de informatieStructura MPEG-2 AAC

Structura MPEG-2 AACImbunatatiri pentru cresterea eficientei codarii:rezolutie in frecventa ridicata: numarul de frecvente in AAC este pana la 1024 in comparatie cu 576 cat foloseste stratul 3Predictie: se imbunatateste predictia in special pentru semnalale ce contine componente armonice (semnale sinusoidale)Codare Huffman imbunatatita: codarea liniilor de frecventa prin considerarea grupurilor de cate 4 linii spectrale, se palica mai desStructura MPEG-2 AACImbunatatiri pentru cresterea calitatii audio:in locul analizorului de tip banc de filtre hybrid (doua filtre in casacada) se utilizeaza filtre cu MDCT cu impuls la raspuns de 5.3 ms la 48 KHz, fata de 18.6 ms cat are stratul IIITehnica TNS (temporal Noise Shaping): se caluleaza anvelopa zgomotului in doemniul frecventelor joase prin folosirea unei predictii in domeniul frecventaEste importanta la imbunatatirea calitatii vorbirii la debite mici de informatiePrin combinarea acestor tehnici se obtine aceeasi calitate a vorbirii dar la un debit de informatie cu 70% mai mic decat al startului IIIStructura datelor (Frame) pentru MPEG-1, straturile I si II

Strat I = 384 esantioane sub-banda; Strat II = 1152 esantioane subbandaPachete = 4-octeti pentru antet si 184 octeti pentru campul de dateStructura datelor (Frame) pentru MPEG-1, straturile I si IIFiecare cadru are un antetprima parte contine 12 biti pentru sincronizare, 20 biti pentru informatia despre sistem, si optional 16 biti pentru CRCPartea a doua contine informatii despre structura, adica despre alocarea bitilor si a factorilor de scalare (si, in Stratul II, informatie pentru seelctia factorilor de scalare)Ca informatie principala, cadrul transporta in total 32*12 esantioane ale sub-benzilor (corespunzator a 384 esantioane audio de intrare in format PCM echivalent la 8 ms la o rata de esantionare de 48 KHz) in stratul Iun total de 32*36 esantioane ale subbenzilor in stratul II (corespunzand la 1152 PCM esantioane de intrare, echivalent cu 24 ms la o rata de 47 KHz)Structura datelor (Frame) pentru MPEG-1, straturile I si IIDe retinut ca toate cadrele sunt autonome, in sensul ca fiecare cadru contine toata informatia pentru decodificareDeci fiecare cadru poate fi decodat in mod independent de cadrele anterioareLungimea unui cadru nu este fixata intrucat:lungimea campului principal de informatie, ce depinde de rata bitilor si de frecventa de esantionareinformatia de structura, care variaza in stratul IIcampul pentru informatia auxiliara, a carui lungime nu este specificataStructura datelor pentru MPEG-1, stratul IIIMPEG-1 impune folosirea unui antet pentru fiecare cadru (fiecare 24 ms la fs=48 KHz)In principal contine:un cuvant de sincronizare: spre deosebire de alte standarde, cuvantul de sincronizare poate apare si in fluxul de dateDe aceea, un circuit de sincronizare trebuie sa verifice aparitia a mai mult de un cuvant de sincronizare si sa se resincronizeze daca nu gaseste cuvinte de sincronizare aflate la offsetul corect data de frecventa de esantionare si de debitul de informatieDebitul de informatie: este specificat intotdeauna pentru intreg fluxul de date si nu pe canalIn cazul stratului III rata de bit se poate schimba determinata de rata de bit folosita la codare

Structura datelor pentru MPEG-1, stratul IIIFrecventa de esantionare: determina schimbarea frecventei de esantionareStratul: se specifica numarul stratului: I, II sau III si daca este MPEG-1 sau MPEG-2Modul de codare: se specifica modul de codare: mono, dual mono, stereo sau stereo compusProtectie la copiere: fiecare antet contine 2 biti pentru SCMS (Serial Copy Management Scheme) pusa pentru protectia la copiereDin cauza posibilitatii modificarii acestora pe cale soft, importanta practica este redusa

Datorita repetitiei intregii informatii necesara decodarii in fiecare cadru, fluxul de date MPEG-1/2 poate fi decodat incepand din orice punct

Structura datelor pentru MPEG-2 AACIn timp ce pentru MPEG-1 formatul de baza audio si sintaxa transportului pentru sincronizare si pentru codarea parametrilor este pastrat impreuna intr-un mod nesaparabil, MPEG-2 AAC le defineste amandoua dara da libertatea aplicatiei sa aleaga sintaxei transportuluiStructura datelor pentru MPEG-2 AACStandardul defienste doua exemple de trasport a datelor audio:ADIF (Audio Data Interchange Format) grupeaza toate datele pentru controlul decodorului (cum este frecventa de esantionare, modul, etc) intr-un singur antet ce precede fluxul de date audio Aceasta optiune este utila pentru schimbul de fisiere (se schima numai antetutul) dar nu permite segmentarea fluxului de date sau inceperea decodarii in orice punct asa cum permite MPEG-1ADTS (Audio Data Trasnport System): impacheteaza datele AAC in cadre cu antete similare antetului folosit de MPEG-1AAC este semnalizat/indicat ca stratul IV al standardului MPEG audio Spre deosebire de startul III, rata cadrelor este variabila, continand intotdeauna datele audio pentru un cadru complet intre doua cuvinte de sincronizareADTS permite decodarea din orice punct al fluxului de dateRecapitularePrin utilizarea unui codor cu performante bune, ambele standarde Startul III si MPEG-2 AAC pot comprima mesajele audio cu mentinerea calitatii CDStratul III are o complexitate mai mica este cel mai folositAAC este considerat succesorul lui MP3 intrucat asigura o o compresie mai bunaInitial .mp3 a fost creat pentru a descrie stratul 3 al standardului MPEG-1 in legatura cu software-ul pentru codorul si decodorul sub windowsDupa standardizarea lui MPEG-2, fisierele sunet codate cu MPEG-2 la rate de esantionare reduse ale stratului III s-au numit tot mp3Uneori MP3 este gresit numit MPEG-3Compresia vorbirii prin modulatia diferentiala a impulsurilor in codLa modulaia impulsurilor n cod (MIC), fiecare eantion era pus n corespoden cu un cuvnt de simboluri binare de lungime n In cazul vorbirii, se constat c eantioanele succesive ale unui semnal real sunt puternic corelateExist o dependen a numrului Ni, cu care se exprim eantionul curent, de numerele Ni-1, Ni-2, Ni-3 ,...., anterior exprimateEvident, dependena scade pe msura ce ne referim la eantioanele mai ndeprtate n timpExistena dependenei conduce la o redundan n transmisie, deoarece nu toate simbolurile semnalului numeric vor conine aceeasi informaieA aprut astfel ideea de a transmite nu valoarea absolutata a semnalului actual i valoarea relativ a acestuia fa de eantionul anteriorAcest lucru conduce la creterea vitezei de transmisie prin emiterea a mai puine semnale, prin transmiterea numai a diferenei dintre dou eantioane

Compresia vorbirii prin modulatia diferentiala a impulsurilor in codDac Dk este diferena dintre dou eantioane consecutive ale mesajului m(t): D(k) =m(kT)-m[(k-1)T]=mk - mk-1 unde T este perioada de eantionare, valoarea medie patratic a diferenei Dk pe multimea esantioanelor este

unde c=E[mk , mk-1] este corelaia dintre dou eantioane consecutive, k i k-1

Compresia vorbirii prin modulatia diferentiala a impulsurilor in codDac c>0,5 valoarea criteriului este mai mic dect valoarea ptratic medie a eantioanelorAcest lucru nseamn c diferena Dk se va putea cuantiza cu un numr mai mic de cuante dect eantionul propriu-zis, mk, adic pentru transmiterea unei anumite cantiti de informaie va fi nevoie de un timp mai scurt sau, echivalent, de o band de frecven mai micSistemul de transmisiune care lucreaz dup acest principiu se numete sistem de transmisiune cu modulaia diferenial a impulsurilor n codModulaia delta este versiunea de un bit a modulaiei difereniale a impulsurilor de codRealizarea unei codri mai simple dar cu pstrarea fidelitii, a impus creterea corelaiei dintre eantioane prin mrirea frecvenei de eantionareModulaia delta uniformLa acest tip de modulaie, prin canal se transmite un singur bit care poart informaia despre semnul diferenei, deci despre tendina pe care o are semnalul supus transmisiei.La recepie se va aduga sau se va scade o cuant din eantionul anterior reconstituit, dup cum bitul recepionat este 1 respectiv 0Dac cuanta este constant, independent de semnalul transmis, vorbim despre o modulaie delta uniformDac cuanta se poate modifica n funcie de dinamica semnalului, vorbim despre o modulaie delta adaptivIntroducerea unei variaii n valoarea cuantei are scopul de a reduce zgomotul care nsoete transmisia ca urmare a cuantizrii, deci mbuntirea raportului semnal/zgomot de cuantizare.

Modulaia delta uniformUn sistem de transmisiune clasic cu modulaie delta cu pas fix se compune din:

modulator

canal de transmisiune

demodulatorSchema bloc a unui sistem cu modulaie delta cu pas fixT este perioada de eantionare, S&H circuit de eantionare i meninere, F()=filtru de ieire, H()=circuit liniar i C=comparator

Modulaia delta uniformSemnalul analogic s(t) este transformat de modulator ntr-un ir de simboluri binare cu ajutorul unui comparator ce compar n mod continuu s(t) cu mesajul refcut, decizia comparatorului fiind eantionatSimbolurile binare, sub forma unor impulsuri negative i pozitive, se introduc ntr-un circuit liniar cu funcia de transfer H() care genereaz un semnal ce urmrete s(t)Cel mai simplu circuit este un integratorModulaia delta uniformSemnalul de intrare s(t), de banda limitat W, este eantionat cu o frecven fs>>2W. La fiecare eantion se calculeaz semnul diferenei dintre eantionul de intrare curent s(k) i ultima aproximaie :

n funcie de semnul acestei diferene se d comanda de cretere sau de scdere a eantionului urmtor, cu o valoare numit cuant de aproximare, conform relaiei:

n acest fel, semnalul de intrare s(t) este nlocuit cu un semnal care l aproximeaz cu o anumit preciziePe canal, se va transmite semnul diferenei bk, din care la recepie se poate reconstitui semnalul s(t)

Distorsiunea de neurmrire i de palierDou tipuri de erori de cuantizare ce apar la modulaia delta liniar:eroare de neurmrire pe poriunile rapid variabile ale semnalului s(t):eroare de palier sau zgomot granular, sau de pauz, pe poriunile lent variabile ale semnaluluiViteza de variaie a semnalului de intrare s(t) este ds(t)/dt, iar viteza de variaie a semnalului este fsPentru a nu avea erori de neurmrire este necesar ca:

Pentru un semnal dat, condiia de mai sus poate fi ndeplinit fie prin mrirea cuantei , fie prin mrirea frecvenei de eantionare fs

Distorsiunea de neurmrire i de palier

Distorsiunea de neurmrire i de palierMrirea frecvenei de eantionare fs, duce la creterea lrgimii de band necesar transmisiei, iar dac aceasta este impus, singura posibilitate de reducere a erorilor de neurmrire va fi aceea de mrire a cuantei Zgomotul granular, care apare pe poriunile lent variabile ale semnalului, se datoreaz modului n care se aproximeaz, odat prin lips, odat prin adaos, poriunile relativ constante ale semnaluluiPentru reducerea acestui tip de zgomot ar fi de dorit ca mrimea cuantei s fie ct mai micDeci, cele dou tipuri de erori duc la cerine contradictorii cu privire la mrimea cuantei Aceast contradicie nu se poate realiza n cadrul modulaiei delta liniare (uniforme), care lucreaz cu cuant constantS-au elaborat algoritmi noi de modificare a cuantei, n cadrul modulaiei delta adaptiveSchema bloc pentru modulaia delta uniform

Modulaia delta uniformCuantizorul genereaz un semnal binar bk n funcie de diferena dintre eantionul curent i eantionul anterior reconstruit:

Eantionul actual reconstituit , se obine printr-o sumare:

Blocul care sumeaz bk i multiplic cu ar putea fi un convertor numeric analogicCuantizorul ar putea fi realizat printr-un comparator de tensiune cruia i se aplic xk i

Modulaia delta uniformDac cuanta este mare, se vor obine erori de neurmrire mici dar i erori granulare mariDac cuanta este mic, vom avea erori granulare mici dar erori de neurmrire mai mariO situaie de compromis, n urma creia raportul semnal/zgomot este mimin, se obine dac se alege

Modulaia delta se utilizeaz n modulatoarele audio dar i n sistemele de reglare automat

Modulatia delta adaptivaO mbuntire important a calitii semnalelor analogice transmise prin modulaia delta uniform, se obine prin utilizarea modulaiei delta adaptive, la care valoarea cuantei nu mai este constant, ci se modific n funcie de panta semnalului de transmis

Principiul modulaiei delta adaptive duce la micorarea ambelor tipuri de distorsiuni, de neurmrie i de palierAproximarea prin modulatie delta adaptiva a unui semnal analogicsemnal trapezoidal pentru transmissemnalul refcut localsimbolurile binare transmise pe canal

Modulatia delta adaptivaModulaia delta adaptiv se bazeaza pe ideea modificrii valorii cuantei n funcie de dinamica (panta) semnalului de intrare, astfel:pe poriunile rapid variabile ale semnalului, se utilizeaz cuante mari;pe poriunile lent variabile se utilizeaz cuante miciValorile cuantelor sint multipli ai unei valori de baza, ordinul de multiplicitate determimindu-se din analiza sirului de decizii anterioareAstfel, calculul valorii cuantei se face dupa o funcie liniar sau neliniar, dependent de:polaritatea semnalelor transmise anterior (succesiunea de simboluri bk)dimensiunea pasului anterior k-1

Modulatia delta adaptivaPentru calculul valorii cuantei la pasul k, este necesar s fie inspectat o secven de lungime minim egal cu cel puindoi bii ai ieirii modulatoruluin cazul cel mai simplu, se compara ultimele dou simboluri transmise bk i bk-1. Dac bk=bk-1 nseamn c avem neurmrire i cuanta trebuie crescutn caz contrar avem o poriune cu panta mic i cuanta trebuie sczutAlgoritmii de modulaie delta adaptiv se deosebesc dup modul n care realizeaz schimbarea cuantein general, aproximarea este performant doar pentru anumite tipuri de semnale, funcie de viteza de variaie a acestoraAlgoritmul de modulaie delta adaptiv SONGDac o este cuanta minim, algoritmul Song de calcul a cuantei la pasul k se formalizeaz astfel:

Regula de asociere:

Pentru aceeai valoare a cuantei, fa de modulaia delta uniform, modulaia adaptiv Song micoreaz ambele tipuri de distorsiuni, de neurmrire i de palierDistorsiunile de palier nu pot fi ns anulate din cauza valorii finite a valorii iniiale a cuantei

Exemplu pentru algoritmul Song

Algoritmul de modulaie delta adaptiv JayantAlgoritmul de adaptare a cuantei este:

n algoritmul Jayant, variaia cuantei este dictat - n principal - de factorul PDin consideraii statistice, se impune, pentru o larg clas de semnale analogice i pentru a realiza o aproximaie bun a semnalului de intrare, ca factorul P s fie ales astfel: 1 P 2Observaie: n cazul p=1.5, relaia de calcul a cuantei este:

Exemplu pentru algoritmul Jayant