5. Curs AM

55
Aplicatii Multimedia Curs 5

description

computers

Transcript of 5. Curs AM

Page 1: 5. Curs AM

Aplicatii Multimedia

Curs 5

Page 2: 5. Curs AM

Cuprins curs

1. Sunetul

2. Linii de comunicatie

3. PCM, RIFF, WAV, MIDI

Page 3: 5. Curs AM

1. Sunetul

Citeva definitii pentru sunet :

1. Este o forma de energie, de genul luminii sau electricitatii. Sunetul este produs si redat datorita fenomenului de vibratie a moleculelor unui mediu dupa un anumit tipar.

2. Este o vibratie invizibila ce se propaga printr-un anumit mediu.

3. Este o unda care se propaga printr-un anumit mediu.

4. Este o variatie f. rapida sub forma de unda a presiunii unui mediu. Variatia (sau oscilatia) se face in jurul unei valori de prag fixe. De exemplu, in cazul aerului, valoare este de 100kPa.

Page 4: 5. Curs AM

Daca variatiile de presiune se petrec cu viteze cuprinse intre 20 si 20.000 de ori pe secunda (respectiv cu frecvente 20Hz-20KHz) atunci respectivele vibratii sint percepute de urechea umana sub forma de sunete.

Sunetele sint produse de obiectele care vibreaza datorita unor cauze mecanice (diapazon, chitara, pian, tobe, etc), electro-magnetice (difuzoare) sau alt cauze fizice (compresie/decompresie aer, frecarea cu aerul, etc).

Vibratii ample, vizibile chiar si cu ochiul liber => tonuri grave, bass

Vibratii f. mici => tonalitati inalte.

Page 5: 5. Curs AM

Perceptia sunetului difera de la persoana la persoana si tine de sensi-bilitatea aparatului auditiv al fiecarui individ.

Odata cu avansarea in virsta intervalul de frecvente audibile scade consi-derabil, frecventele inalte fiind cele mai afectate. Pe aceasta observa-tie se bazeaza multi algoritmi/metode de compresie a sunetului.

Sunetul se ciocneste elastic de obstacole, se reflecta => atenuari, ecouri, interferente, intirzieri.

Page 6: 5. Curs AM

Perceptia sunetului

Exprimata in mod relativ fata de un nivel de referinta dat de capacitatea urechii umane de a percepe sunete.

Page 7: 5. Curs AM

2. Linii de comunicatie

D.p.d.v istoric aplicatiile multimedia actuale isi au radacinile in transmisiile de voce si date (convorbiri telefonice, teleimprimatoare, telex, etc).

Pentru transportul de voce si date s-au folosit linii de comunicatie bazate pe transportul semnalelor electrice prin fire de Cu sau Al (mai putin

populare).

Liniile de comunicatie permiteau la inceput doar comunicatii unidirectionale.

Au urmat comunicatii bidirectionale half-duplex si full-duplex.

Linii analogice -> linii digitale.

Page 8: 5. Curs AM

In telecomunicatii, denumirea de purtătoare T/E (sau linie T/E) se referă la un sistem digital de comunicaţie bazat pe purtătoare multiplexate. Liniile T sînt folosit în America de Nord, Japonia şi Coreea iar liniile E se regasesc, ingeneral, in Europa.

Page 9: 5. Curs AM

Sistemele de tipul „T” au fost concepute iniţial exclusiv pentru transmisii de semnale vocale digitizate.

În prezent sînt folosite pentu orice tip de transmisie de date digitale.

Dacă denumirea liniei este precedată de litera „F” semnificaţia este aceea că linia de comunicatie se bazeaza pe fibra optica, viteza raminind nechimbata.

Page 10: 5. Curs AM

Linia T1 a fost concepută pentru eşantionarea unei benzi de 4KHz cu o rată de eşantionare de 8KHz (de două ori cea mai înaltă frecvenţă, Shanon) şi

folosind 8 biţi pentru codarea eşantioanelor.

=> un canal digital de 64Kbps, numit si DS0 (Digital Signal 0), baza trans-misiilor digitale multiplexate atît în cazul sistemelor americane (T) cît şi în

cazul celor europene (E).

Prin multiplexarea a 24 circuite DS-0 se obţine un „cvasi canal” DS-1 (T1). „cvasi canal” -> o linie T1 foloseste si niste biti pentru înlăturarea si/sau repararea erorilor de transmisie.

Page 11: 5. Curs AM

Fara bitul de control am avea 64x24 = 1.536 Mbps

Capacitatea unei linii T1 este de 1,544 Mb/s

Page 12: 5. Curs AM

Tehnica de multiplexare bazată de divizare frecvenţei a inlaturat problemele tehnologiilor anterioare si a permis cresterea

numarului de apeluri deservite.

Un alt avantaj il reprezinta modul contracarare a pierderii calitatii semna-lului din cauza distantelor lungi. Anterior se foloseau amplificatoare dar acestea amplificau si zgomotele (semnale

parazite, nedorite). Solutia a fostoferita de regeneratoarele digitale de semnal.

Cadrul de 193 biţi (24x8+1) a fost adoptat în 1958. Pentru identificarea biţilor de informaţie din cadrul unui cadru au fost

avute în vedere două variante: i) folosirea unui singur bit, ii) folosirea a 8 biţi pentru fiecare cadru.

Page 13: 5. Curs AM

Varianta ii) ar fi condus la un control mai bun dar si la o dimensiune a

cadrului de 200 biţi (24*8+8). Acest lucru ar fi echivalent cu existenta a

25 de canale dintre care 24 pentru informatie si unul pentru control si administrare.

Varianta cu un singur bit de control a fost aleasa din motive demarketing (cistigul de latime de banda e mic) in ideea ca al 25 canal

arputea fi exploatat (comercializat) ca un canal de voce in sine.

Problemele intilnite la partea de administrare si control au dus ulterior

la impunerea cadrului de control de 8 biti.

Page 14: 5. Curs AM
Page 15: 5. Curs AM
Page 16: 5. Curs AM

Pentru evitarea acestor inconveniente se folosesc repetoare de semnal plasate de-a lungul liniilor, la distante de maxim

200 metri.=> costuri ridicate

Desi liniile T3/E3, T4/E4, T5/E5 asigura o viteza (teoretica) mare/f. mare, ele se confrunta cu o pierdere severa de semnal, astfel incit se recomanda utilizarea lor pentru

distante mici, in caz contrar viteza medie scade datorita corectiilor/retransmisiilor.

O alta varianta ar fi folosire fibrei optice = > costuri ridicate.

Page 17: 5. Curs AM

Standarde si formate audio - I

1. PCM 2. RIFF 3. WAV4. MIDI

Page 18: 5. Curs AM

PCM

PCM = Pulse Code Modulation

Reprezinta cea mai simpla forma de codare a unei forme de unda.

In esenta, PCM este o tehnică de conversie, stocare şi/sau transmitere a unui semnal (în contextul de faţă - audio) analog intr-un semnal digital (necomprimat)

=> dimensiuni f. mari pentru semnalul codat.

Semnalele obţinute prin tehnica PCM sint binare, avînd deci doar două stări 0/1, sus/jos, adevărat/fals, indiferent de complexitatea semnalului analogic.

Folosirea PCM permite digitizarea oricărui semnal analogic inclusiv video, voce, muzică, telemetrie sau realitate virtuală. În cazul unui semnal

analogic audio, forma acestui semnal este sinusoidală, repetitivă.

Page 19: 5. Curs AM

Avantajele stocarii si transmiterii digitale a semnalelor

1. Usurinta in stocare/transmitere si interpretare d.p.v.d al dictionarului (0,1)2. Usurinta in prelucrarea pe calculator sau pe un procesor dedicat (DSP)3. Rezistenta mare la zgomote (aproape imunitate, daca se respecta niste conditii minimale)4. Capabilitati de regenerare => superioritate fata de sistemele analogice ( semnalul poate fi regenerat daca nu a fost sever deteriorat : 0,95 => 1 insa 0,45 nu este sigur 0). In plus, amplificatoarele “ridica” si zgomotul, nu doar semnalul util !5. Costuri reduse6. Posibilitati de multiplexare, si securizare prin criptare7. Usurinta in depistarea si remedierea defectelor

Page 20: 5. Curs AM

Dezavantajele stocarii si transmiterii digitale a semnalelor

1. Incompatibilitate cu sistemele analogice2. Necesar de latime de banda mult mai mare (10-15 ori)3. Necesara o sincronizare perfecta intre ceasurile de tact

Page 21: 5. Curs AM
Page 22: 5. Curs AM

1. Amplitudinea semnalului analogic este eşantionată (măsurată) la intervale de timp egale numite intervale de eşantionare;

2. Numărul de eşantioane luate în acelaşi interval de timp (de regulă 1 secunda) poartă numele de rată de eşantionare;

3. Pentru rezultate optime rata de eşantionare trebuie sa fie cel putin egala cu dublul frecvenţei maxime a semnalului analogic;

4. Valoarea instantanee esantionata a semnalului analogic în cazul se rotunjeşte la cel mai apropiat nivel predefinit – proces ce poartă numele de cuantizare.

5. Numărul nivelelor predefinite este întotdeauna o putere de 2 : 8, 16, 32, 64 – numere ce pot fi reprezentate pe 3, 4, 5, 6 biţi

6. Ieşirea dintr-un modulator PCM este reprezentată de o serie de coduri (numere, secvenţe) binare

Etape codare PCM

Page 23: 5. Curs AM

Reconstituirea exacta a unui semnal continuu din esantioane este posibila

numai daca esantionarea a fost realizata la o frecventa de cel putin doua ori mai

mare decit latimea de banda a semnalului (dublul frecventei maxime a semnalului).

Teorema Shannon-Nyquist

Page 24: 5. Curs AM

Filtrarea este necesara pentru a reduce pe cit posibil cantitatea de infor- matii ce va fi prelucrata, prin inlaturarea frecventelor

nedorite. Se aplica unfiltru “trece banda”.

Pentru voce se pastreaza frecventele cuprinse intre 50Hz si 10 KHz.

Pentru muzica se pastreaza frecventele cuprinse intre 20Hz si 20 KHz.

Page 25: 5. Curs AM

Esantionare si cuantificare

Semnal analogic

I. Esantionare II. Cuantificare

Page 26: 5. Curs AM
Page 27: 5. Curs AM

1. Semnal analogic

2. Esantionare naturala(metoda trapezelor)

3. Esantionare cu nivel ct. (metoda dreptunghiurilor)

Esantionare si cuantificare PCM pe 4 biti

9=1001; 11=1011; 12=1100; 13=1101; 14=1110; 15=1111 …

1001-1011-1100-1101 =>

Page 28: 5. Curs AM

Esantionarea naturala :

Esantionarea cu nivel constant :

• Forma undei esantionate este foarte asemanatoare cu a semnalului original (analogic)

• Codarea (transformarea in cod binar) este mult mai dificila.

• Este f. rar intilnita.

• Forma undei esantionate este denaturata fata de semnalul original

• Procedura de esantionare este mult mai simpla

• Codarea (transformarea in cod binar) este f. simpla

• Este preferential utilizata .

Page 29: 5. Curs AM

La destinatar (sau la redare) este necesar un demodulator PCM . Acesta converteste codurile binare in pulsuri prin parcurgerea etapelor de codare in sens invers. Semnalul reconstituit nu poate fi identic cu semnalul original datori-ta pierderilor date de esantionare. Dat fiind insa faptul ca urechea umană nu este un dispozitiv extrem de pretenţi-os sau precis pe de-o parte şi faptul că tehnologiile actu-ale permit eşantionări la intervale f.f mici de timp (deci frecvenţe f.f mari) pierderea de calitate care se petrece la digitizarea unui semnal audio în aplicaţiile uzuale nu este percepută sau se situează la un nivel acceptabil.

Decodarea PCM

Page 30: 5. Curs AM

Datorita tranziţiilor instantanee ce au loc la generarea semnalului “continuu” pe baza codului binar, este necesara utilizarea unor filtre analogice de netezire a semnalului. In plus, are loc si o eliminare a frecventelor nedorite, respectiv a celor care nu se incadreaza in intervalul asteptat (filtru Trece Banda).

Exista si sisteme la care nu se face filtrarea si netezirea semnalului mergind pe principiul compensarii intre pierderi si eventualele virfuri aparute.

Page 31: 5. Curs AM

Probleme specifice PCM

1. Datorita modului de esantionare si cuantificare, intre 2 esantio-nari consecutive nu se cunosc valorile intermediare. Este posi-bil ca in intervalul respectiv sa se strecoare frecvente egale sau mai mari decit jumatatea frecventei de esantionare => se incalca T. lui Shanon => probleme (pierderi, distorsiuni). Aceasta problema se numeste eroare de aliasing.

2. Procedura de esantionare depinde de timp si de precizia genera-torului de tact si de capacitatea acestuia de a furniza momente precise (intervale perfect egale) de esantionare. Daca generatorul de tact nu este stabil si induce imprecizii in esantionare, atit esantionarea cit si cuantificarea vor fi defectuoase ceea ce va afecta in mod direct acuratetea si calitatea semnalului de iesire. Aceeasi problema va apare si daca ceasul (generatorul de tact) al decodificatorului PCM nu functioneaza corect.

Page 32: 5. Curs AM

În general, tehnica de eşantionare PCM presupune colectarea a 8000 de eşantioane pe durata unei secunde, fiecare eşantion putînd fi reprezentat pe 8 biţi => un necesar maxim de lăţime de bandă de cca 64kbps. Există două standarde reprezentative, Mu-Law (μ-Law) utilizat în special în America de Nord şi Japonia şi A-Law utilizat în restul ţărilor. In telefonie, semnalele audio standard provenite de la un singur telefon sint codate PCM in conformitate cu standardul international G.711

Semnalele PCM pot fi transmise cu uşurinţă prin linii de tipul T1 sau T3. Sistemele purtătoare combină semnalele PCM de la mai mulţi expeditori şi le pot transmite printr-un singur cablu sau o singură fibra optică.

Page 33: 5. Curs AM

În afară de transmiterea semnalului audio la distanţă, PCM reprezintă şi modalitatea digitală de înregistrare/stocare/redare a muzicii pe/de pe CD-uri. Formatul CD Audio impune 2 canale PCM codate pe 16 biti, cu o rata de esantionare de 44100 Hz.

Rata de esantionare de 44100Hz a fost preluata de la o metoda de conver-sie a semnalului digital in semnal analogic in vederea stocarii pe banda video. La vremea ei, aceasta metoda a fost cea mai convenabila pentru transferul datelor de la un studio de inregistrari la producatorul de CD-uri.

Page 34: 5. Curs AM

Prima transmisie de voce bazata pe codare PCM a fost

realizata de catre Aliati in timpul celui de-al doilea

Razboi Mondial folosind un echipament de criptare

numit SIGSALY.

Page 35: 5. Curs AM

Variante PCM

LPCM = Linear PCM

- format audio digital necomprimat. - poate avea pina la 8 canale audio la rate de esantionare de 44.1

KHz, 48KHz sau 96 KHz si 16, 20, 24 sau 32 biti / esantion. - viteza maxima posibila este de 6.144 MB/s. - LPCM precizeaza faptul ca valorile inregistrate sint proportionale

cu amplitudinea, in loc sa stocheze de pilda log(amplitudine) sau un alt gen de relatie. Din acest motiv LPCM nu este lossless.

- cu cit rata de esantionare este mai buna si reprezentarea este facuta pe mai multi biti, LPCM se apropie mai mult de semnalul analogic original.

- LPCM este utilizat cel mai frecvent impreuna cu containerul formatului WAV, format consacrat pentru audio necomprimat.

- LPCM este utilizabil pentru codarea audio pt. CD-uri si DVD-uri. Cea mai des intilnita situatie pina nu demult era reprezentata de formatul cu doua canale (stereofonie), insa in prezent audio surrund (7.1 surround) este din ce in ce mai des intilnit.

Page 36: 5. Curs AM

DPCM = Differential PCM

- tehnica frecvent utilizata in codarea vorbirii- consta in incercarea de predictie a valorii esantionului urmator,

pe baza valorii esantionului curent. - daca predictiile sint bine facute atunci semnalul de eroare dintre

esantionul predictat si esantionul real de voce va avea o varianta mai mica decit in cazul esantioanelor reale.

- se va cuantifica doar semnalul de eroare folosind mai putini biti decit daca am coda intregul semnal. Practic, ideea de baza este aceea de a cuantiza doar niste diferente, nu semnalul integral.

Page 37: 5. Curs AM

ADPCM = Adaptive Differential PCM

- varianta a DPCM care permite modificarea pasului (intervalului) de esantionare in vederea reducerii latimii de banda.

- Algoritmul ADPCM foloseste pentru a converti (comprima) esantioane PCM Mu-Law (sau A-Law) reprezentate pe 8 biti in esantioane ADPCM reprezentate pe 4 biti. Aceasta compresie dubleaza practic capacitatea liniei fara a fi necesara nici o modificare la nivelul fizic al acesteia.

- Aplicarea ADPCM este reglementata in standardul G.726. O parte din tehnicile ADPCM sint folosite in prezent in comunicatii VoIP.

- Pe la jumtatatea anilor 1980 a fost standardizat un codec ADPCM operind la 32kb/s care oferea o calitate a semnalului de tip voce foarte apropiata de aceea oferita de codecurile PCM la 64kb/s. Mai tirziu au fost standardizate si codecuri ADPCM operind la 16,24 si 40 kb/s .

Page 38: 5. Curs AM

RIFF

RIFF = Resource Interchange File Format

- format generic de stocare a datelor grupate în secţiuni marcate (tagged).- introdus în 1991 de Microsoft şi IBM şi utilizat de Microsoft ca format implicit

pentru fişiere multimedia in Windows 3.1. - bazat pe AIFF. - folosit de către Micorsoft pentru fişierele AVI, ANI, WAV.- presupune cunoaştere si precizarea unor informaţii în legătură cu datele salvate

sub formă de blocuri într-un fişier. Toate blocurile de date au acelaşi format, care este descris prin următoarele:

• un identificator, ASCII, 4 octeţi, de ex: „fmt ”, „data”• un integer pe 32 biti care indică dimensiunea blocului, 4 octeţi• cîmp de dimensiune variabilă ce conţine informaţia propriu-zisă.

- bloc de date poate fi format la rindul sau din mai multe blocuri. In această situatie, fisierul RIFF trebuie să inceapa cu secventa „RIFF”.

- implicarea Microsoft in standardul formatului RIFF a condus la o serie de probleme. Cea mai serioasă dintre acestea este reprezentata de faptul că sectiunea INFO de descriere a unui fisier RIFF poate fi plasata atit la inceputul cit şi la sfirsitul fisierului. Plasarea la sfirsit poate produce mici nefunctionalitati in cazul unor aplicatii, cum ar fi neafisarea unui „preview” sau chiar refuzul de a deschide fisierul respectiv.

Page 39: 5. Curs AM

- format introdus de către Electronic Arts in 1985 (in cooperare cu Commodore-Amiga) pentru a facilita transferul de date între diverse aplicaţii.

- fişierele IFF nu au o extensie impusă. - structura unui fişier IFF este foarte asemănătoare cu aceea a

fişierelor RIFF, datele sînt de asemenea organizate în blocuri percedate de anumite informatii de control.

- dată fiind precizarea clară a dimensiunii blocurilor, în cazul în care un bloc de date nu poate fi citit/redat, formatul permite „trecerea” la blocul următor

IFF

IFF = Interchange File Format

Page 40: 5. Curs AM

AIFF

AIFF = Audio Interchange File Format

- format de fişier audio utilizat pentru stocarea sunetului. - dezvoltat in 1988 de Apple Computer- se bazează pe IFF si este cel mai frecvent întîlnit pe calculatoare Apple-

Macintosh - alta mare companie care utilizeaza AIFF pentru produsele sale este Silicon

Graphics Incorporated.- AIFF este un format necomprimat motiv pentru care este utilizat si in studiouri

audio profesionale.- dimensiunea fişierelor AIFF este mare (un minut de sunet stereo la 44.1 KHz,

16 biţi necesita peste 10 MB)- extensia fişierelor AIFF este .aiff sau .aif. - standardul permite si stocarea sunetului comprimat, situatie marcata de obicei

prin adăugarea literei „c” la extensia fisierului. - algoritmii de compresie folositi sint „lossless”, motiv pentru care calitatea AIFF

comprimat este identica cu aceea a AIFF necomprimat - la fel ca RIFF si IFF, formatul AIFF prevede stocarea datelor in blocuri, fiecare

bloc fiind particularizat printr-un ID. Urmatoarele blocuri de date pot fi regăsite într-un fisier AIFF: bloc de control, bloc de date (sunet), bloc de instrumente, bloc de comentarii, bloc de descriere nume, bloc de descriere autor, bloc de copyright, bloc de descriere informaţii înregistrare

Page 41: 5. Curs AM

WAV

Waveform Audio Format

- standardul Microsoft şi IBM pt. stocarea fişierelor audio - variantă a formatului RIFF de stocare a datelor în calupuri, deci

este apropiat şi de formatele IFF şi AIFF folosite pe sisteme Amiga şi MacIntosh.

- deşi fişierele WAV pot stoca şi sunet comprimat, cel mai frecvent întîlnit este cazul în care un fişier WAV conţine sunet necomprimat în format PCM.

- avînd în vedere stocarea informaţiei (audio) într-un mod necomprimat şi fără pierderi, formatul WAV este foarte popular în rîndul utilizatorilor profesionişti, în studiouri de sunet, sau în situaţia în care un anumit domeniu necesită fidelitate şi calitate înaltă pentru analiza diverselor fenomene.

- prelucrarea fişierelor WAV este foarte facilă, nu necesită experienţă foarte vastă, nu necesită aparatură deosebită. De cele mai multe ori, prelucrarea WAV presupune utilizarea unui PC şi a unui software specializat.

Page 42: 5. Curs AM

- fişierele WAV necomprimate au o dimensiune foarte mare. Din acest motiv, vehicularea unor astfel de fişiere printr-un LAN, WAN sau Internet nu este prea intilnita.

- cu excepţia transmiterii la distanţă prin orice tip de reţea, formatul este larg răspîndit pentru ca pastreaza informatia cit se poate de curata si nealterata

- Un alt domeniu în care formatul WAV şi-a făcut intrarea şi şi-a păstrat locul il reprezintă posturile de radio. De exemplu, BBC (Marea Britanie) foloseşte un canal audio WAV la 44.1Khz, 16 biti, 2 canale. Postul naţional radio din Australia foloseşte un sistem propriu ABC "D-Cart” bazat pe formatul WAV (necomprimat, 48KHz, 2 canale, 16 biţi)

- in afară de calitatea f. bună a sunetului stocat şi oferit, formatul WAV are şi avantajul unei mari simplităţi, structura sa fiind bazată în mare măsura pe formatul IFF => usurinta in manipulare si posibilitati mari de interschimb

Caracteristici WAV

Page 43: 5. Curs AM

- fişierele audio salvate în format WAV sînt limitate din punct de vedere al dimensiunii maxime ocupate pe suportul de stocare. Utilizarea unui întreg pe 32 biţi în header pentru precizarea dimensiunii fişierului duce la o limită maximă de 4GB (2^32).

- Această dimensiune poate să fie suficientă pentru stocarea a aprox 6.5 ore de muzică la calitate de CD (44.1KHz, 16 biţi, stereo) însă la rate de esantionare mai mari (48KHz, 96 KHz) timpul de înregistrare scade dramatic. Acelaşi lucru se întîmplă şi daca eşantioanele sînt codate pe mai mulţi biţi.

- O solutie a fost propusă au fost formatele W64 şi RF64, care reprezintă o extensie a WAV. Ca şi cîstig imediat, fişierele pot stoca 2^64 biţi

Limitari ale WAV

Page 44: 5. Curs AM

Un fişier WAV este compus din cel puţin 3 secţiuni diferite: - o secţiune de 12 octeţi pentru IDENTIFICAREA fişierului, - o secţiune (obligatorie – 24 octeţi) ce descrie

FORMATUL fişierului -o secţiune ce contine DATELE propriu-zise (de asemenea obligatorie). Toate aplicaţiile ce folosesc fişiere WAV

trebuie sa poată citi/interpreta sectiuniile obligatorii.

Structura WAV

Page 45: 5. Curs AM

Sectiunea de identificare WAV

Page 46: 5. Curs AM

Sectiunea de FORMAT a WAV

Page 47: 5. Curs AM

- descrie parametrii esenţiali ai semnalului audio (rata de eşantionare, reprezentarea pe un anumit numar de biti, numărul de canale, etc)

#define FormatID 'fmt ‘typedef struct { ID chunkID; long chunkSize; short wFormatTag; unsigned short wChannels; unsigned long dwSamplesPerSec; unsigned long dwAvgBytesPerSec; unsigned short wBlockAlign; unsigned short wBitsPerSample;} FormatChunk;

Sectiunea de FORMAT a WAV

Page 48: 5. Curs AM

- wFormatTag diferit de 1 -> sunet comprimat- wChannels -> numarul canalelor de sunet- dwSamplesPerSec -> rata de eşantionare- dwAvgBytesPerSec -> numărul de biţi/s pentru

codarea eşantioanelor

dwAvgBytesPerSec este util pentru estimarea – dintr-o aplicatie – a necesarului de memorie RAM rezervata pentru bufferul de redare a sunetului fara probleme. Valoarea acestui cimp ar trebui sa fie egala cu: dwSamplesPerSec * wBlockAlign, în vreme ce wBlockAlign = wChannels * wBitsPerSample / 8

Sectiunea de FORMAT a WAV

Page 49: 5. Curs AM

Sectiunea de DATE a WAV

#define DataID 'data' typedef struct { ID chunkID; long chunkSize; unsigned char

waveformData[];} DataChunk

Page 50: 5. Curs AM

- chunkID ->numarul de octeti din sectiune (exceptind 8 octeti pt ID si Size)

- chunkSize -> numarul de octeti folositi pentru codarea sunetului

- waveformData[] ->conţine sunetul codat. Acesta este organizat în (cadre de) eşantioane aranjate în ordinea în care au fost obţinute din sunetul analogic.

Numarul total de esantioane poate fi determinat împărţind chunkSize la wBlockAlign (cîmp aflat în secţiunea FORMAT).

Page 51: 5. Curs AM

MIDI

MIDI = Musical Instrument Digital Interface

acest format nu conţine sunet propriu-zis ci un set de instructi-uni de redare/generare a sunetului de catre placa de sunet sau un dispozitiv electronic.

protocolul în sine a fost conceput pentru înregistrarea si redarea muzicii de la/de catre sintetizatoare electronice dar este imple-mentat si pe majoritatea placilor audio de la PC-uri.

din momentul introducerii în 1983, standardul a suferit putine modificari de esenta, desi tehnologia a inregistrat salturi semnificative.

informaţiile conţinute într-un fişier MIDI şi transmise către dispozitivul de redare pentru (re)producerea sunetului cuprind : note muzicale, viteza de redare, volum de redare, etc. Sunetele redate sint stocate într-un tabel de corespondenta aflat la fiecare instrument sau placa de sunet.

Page 52: 5. Curs AM

fisierele MIDI contin doar instructiuni de redare a sunetului => sint mult mai mici decit fisierele care contin sunet inregistrat si codat.

sint foarte usor de utilizat si nu necesita un anumit software foarte specializat pentru redare.

incarcarea procesorului si a memoriei in cazul utilizarii pe PC-uri este redusa la minim.

au si un mare dezavantaj si anume acela ca sunetul poate sa difere de la placa la placa sau de la instrument la instrument, in functie de implementarea tabelei de corespondenta sunet-instructiune.

Page 53: 5. Curs AM
Page 54: 5. Curs AM

- instrumentele compatibile MIDI sînt echipate cu un transmitator si un receptor.

- interfata de comunicatie necesara opereaza la o rata de transmisie seriala, asincrona, de 31,25 Kbaud.

- fiecare secventa transmisa are, in mod obligatoriu, un bit de start, un bit de sfirsit si 8 biti de date si este transmisa in 320 microsecunde.

- instrumentele sint interconectate prin cabluri conectate 3 posibile porturi MIDI IN, MIDI OUT şi MIDI THRU.

- prin portul MIDI IN se receptioneaza mesaje MIDI (pentru redare pe instrumentul respectiv)

- portul MIDI OUT transmite mesaje (instructiuni) de la o un dispozitiv catre alt dispozitiv (sau computer)

- prin portul MIDI THRU se poate obţine o copie identica a ceea ce se primeste prin portul MIDI IN. In acest fel se poate realiza interconectarea efectiva a dispozitivelor MIDI

Page 55: 5. Curs AM

Potentialul MIDI este exploatat la maxim atunci cind o retea de instrumente este conectata la un computer printr-o interfata MIDI. Functia cea mai importanta a interfetei este aceea de a corela generatoarele de tact ale tuturor dispozitivelor. Interfetele moderne au capabilitati extinse, mergind pina la implementarea unor algoritmi de rutare, marirea numarului de dispozitive de intrare, generarea de semnale sincronizbile cu fluxuri video, etc.

Formatul de date MIDI Comunicaţiile MIDI se desfăsoara, în cea mai mare parte, pe baza unor pachete.

Aceste pachete incep cu un octet de stare (control) urmat de 2 octeţi de date. Octeţii de stare încep întot-deauna cu bitul „1” iar cei de date încep întotdeauna cu „0”. Fiecare octet are un bit de start si unul de stop, deci o secventa MIDI va avea 10 biţi. Secvenţele transmise pot fi încadrate în una din categoriile:• Tip canal: controlează unul din cele 16 canale ale intrumentului, contine

note, informatii de control, etc• Mod canal: defineşte răspunsul instrumentului la mesaje de voce• Informatii generale: mesaje către toate instrumentele si dispozitivele

conectate• Timp real al sistemului: mesaje către toate instrumentele si dispozitivele

conectate. Contine doar informatii de stare si este folosit pentru sincronizarea ceasurilor (generatoarelor de tact ale instrumentelor)

• Rezervat sistemului: folosit pentru coduri specifice fiecarui producator