steganografie

7
1 Securizarea datelor prin steganografie Student: Iuliana Decu Îndrumător: Ş.l.ing. Diana Ştefănescu, Universitatea „Dunărea de Jos” din Galaţi, Facultatea de Ştiinţa Calculatoarelor [email protected] [email protected] ABSTRACT: Reţele moderne de calculatoare fac posibilă distribuirea documentelor, rapid şi economic. Distribuţia electronică a materialelor protejate prin drepturi de autor este, deseori, însoţită de copiere si distribuţie ilegala. Din acest motiv, oamenii s-au gândit cum să-şi protejeze munca, cum să prevină aceste activităţi ilegale şi să urmărească distribuţia unui document. Steganografia vine să rezolve o mare parte din aceste probleme. Prin combinarea tehnicilor de criptare cu steganografia se asigură o bună protecţie a transferului de date în format electronic. CUVINTE CHEIE: Steganografie, steganaliză, criptografie 1. Introducere Steganografia este o tehnică care permite utilizatorilor să ascundă mesaje în alte mesaje; aplicând tehnici steganografice şi watermarking digital este posibilă ascunderea unor informaţii privind drepturile de autor, cum ar fi numele autorului, data apariţiei, etc. Unul dintre cele mai întâlnite formate electronice sub care se găsesc informaţiile în zilele noastre este imaginea digitală. Steganografia pentru imagini reprezintă procesul de modificare a datelor din imagini astfel încât să se poată insera diverse informaţii. În această lucrare voi analiza metodele folosite pentru ascunderea informaţiei în imagini. 2. Steganografie vs. Criptografie Criptarea reprezintă procesul prelucrării unor date sau a unui text (plaintext), printr-o serie de operaţii matematice, care generează o formă alternativă a datelor iniţiale, cunoscută sub numele de text cifrat (ciphertext). Datele criptate pot fi citite doar de către entităţile care au acces la cheia necesară decriptării textului cifrat în forma lui originală. Criptarea nu ascunde informaţii, dar le face greu de citit. Scopul criptografiei este de a nu dezvălui înţelesul unui mesaj. Criptografia dezvăluie faptul că există comunicaţie între două părţi. Derivat din limba greacă, cuvântul steganografie înseamnă „scriere ascunsă", o colecţie de tehnici dedicate camuflării unui mesaj astfel încât, chiar dacă mediul de comunicaţie este interceptat, existenţa vreunui alt transport de informaţie decât cel implicit al mediului sa fie nedetectabilă. Folosind steganografia, informaţia poate fi ascunsă în purtători ca: imagini, fişiere audio, fişiere text,

Transcript of steganografie

Page 1: steganografie

1

Securizarea datelor prin steganografie

Student: Iuliana Decu Îndrumător: Ş.l.ing. Diana Ştefănescu,

Universitatea „Dunărea de Jos” din Galaţi, Facultatea de Ştiinţa Calculatoarelor

[email protected] [email protected]

ABSTRACT: Reţele moderne de calculatoare fac posibilă distribuirea documentelor, rapid şi economic. Distribuţia electronică a materialelor protejate prin drepturi de autor este, deseori, însoţită de copiere si distribuţie ilegala. Din acest motiv, oamenii s-au gândit cum să-şi protejeze munca, cum să prevină aceste activităţi ilegale şi să urmărească distribuţia unui document. Steganografia vine să rezolve o mare parte din aceste probleme. Prin combinarea tehnicilor de criptare cu steganografia se asigură o bună protecţie a transferului de date în format electronic. CUVINTE CHEIE: Steganografie, steganaliză, criptografie

1. Introducere

Steganografia este o tehnică care permite utilizatorilor să ascundă mesaje în alte mesaje; aplicând tehnici steganografice şi watermarking digital este posibilă ascunderea unor informaţii privind drepturile de autor, cum ar fi numele autorului, data apariţiei, etc.

Unul dintre cele mai întâlnite formate electronice sub care se găsesc informaţiile în zilele noastre este imaginea digitală. Steganografia pentru imagini reprezintă procesul de modificare a datelor din imagini astfel încât să se poată insera diverse informaţii. În această lucrare voi analiza metodele folosite pentru ascunderea informaţiei în imagini. 2. Steganografie vs. Criptografie Criptarea reprezintă procesul prelucrării unor date sau a unui text (plaintext), printr-o serie de operaţii matematice, care generează o formă alternativă a datelor iniţiale, cunoscută sub numele de text cifrat (ciphertext). Datele criptate pot fi citite doar de către entităţile care au acces la cheia necesară decriptării textului cifrat în forma lui originală. Criptarea nu ascunde informaţii, dar le face greu de citit.

Scopul criptografiei este de a nu dezvălui înţelesul unui mesaj. Criptografia dezvăluie faptul că există comunicaţie între două părţi.

Derivat din limba greacă, cuvântul steganografie înseamnă „scriere ascunsă", o colecţie de tehnici dedicate camuflării unui mesaj astfel încât, chiar dacă mediul de comunicaţie este interceptat, existenţa vreunui alt transport de informaţie decât cel implicit al mediului sa fie nedetectabilă. Folosind steganografia, informaţia poate fi ascunsă în purtători ca: imagini, fişiere audio, fişiere text,

Page 2: steganografie

2

transmisiuni video şi de date. Când mesajul este ascuns în purtător se formează un stego-purtător. Formatul datelor celor mai des utilizate sunt: .BMP, .JPEG, .mp3, .txt şi .wav.

Steganografia reprezintă modalitatea de ascundere a unui mesaj in alt mesaj. In mod clasic, un mesaj plaintext (text simplu) sau cyphertext (text cifrat) este inclus intr-o fotografie digitală. Pentru un observator neavizat este doar o fotografie; ea poate ascunde insă informatii suplimentare foarte importante.

Scopul steganografiei este de a ascunde existenţa comunicaţiei secrete.

Steganografia implică ascunderea datelor intr-un mesaj deschis, astfel incât să fie dificil pentru un adversar să detecteze şi să înlăture aceste date. Pentru a urma acest scop, există trei principii importante folosite pentru a măsura eficacitatea unei anumite tehnici steganografice: cantitatea de date, dificultatea detectiei si dificultatea inlaturarii.

• Cantitatea de date – cu cat de pot ascunde mai multe date cu atat tehnica este mai buna.

• Dificultatea detectiei – se refera la cat de usor este pentru cineva sa detecteze ca un mesaj a fost ascuns. De obicei, exista o legatura directa intre cat de multe date se pot ascunde si cat de usor este pentru cineva sa le detecteze. Cu cat se mareste cantitatea de date, cu atat se maresc sansele ca cineva sa descopere ca exista infomatie ascunsa în acel fisier.

• Dificultatea stergerii implica faptul ca : o persoana care intercepteaza fisierul nu trebuie sa fie capabila sa stearga în mod usor datele ascunse.

3. Metode steganografice Exista trei moduri esentiale de ascundere a datelor: insertie, substitutie şi generare.

• Insertia - gaseste zone din fisier care sunt ignorate si pune informatia in acele zone. De exemplu, majoritatea fisierelor contin un EOF sau un marcaj end-of-file. Cand se asculta un fisier audio, player-ul se va opri atunci cand ajunge la EOF, deoarece se gandeste ca a ajuns la sfarsitul fisierului. Se poate insera informatie la sfarsitul fisierului fara a afecta sunetul.

• Substitutia - gaseste informatie nesemnificativa in fisierul gazda si o inlocuieste cu noile date. De exemplu, la fisierele de sunet, fiecare unitate de sunet auzita este compusa din cativa octeti. Daca se modifica cel mai putin semnificativ bit, se va modifica usor sunetul, dar atat de usor incat urechea umana nu va sesiza diferenta.

• Generarea - creaza un nou fisier pe baza informatiei din mesajul ascuns. De exemplu, o tehnica de generare va lua fisierul cu informatia ascunsa si va produce o imagine care seamana cu pictura artei moderne. Aceasta se face prin substitutia cu verde pentru fiecare bit 0, si galben pentru fiecare bit 1. Imaginea este creata bazandu-ne pe secventa de biti din fisierul cu informatiile noi.

Procesul steganografic:

Fig. 1. Procesul steganografic

Page 3: steganografie

3

4. Steganaliza Steganaliza este ştiinţa care se ocupa cu spargerea algoritmilor de steganografie şi descoperirea fişierelor care ascund alte mesaje secrete (la fel cum criptanaliza se ocupă cu spargera algoritmilor de criptare). Se consideră că un algoritm de steganografie este bun dacă nu există nici o modalitate ca cineva prin vreo metodă să identifice existenţa mesajului ascuns dându-se un cover-file. Nu este nevoie să fie identificat mesajul, ci doar existenţa lui. Disciplina care se ocupa cu decriptarea mesajelor ascunse poarta numele de steganaliza si se bazeaza pe analiza statistica a imaginilor pentru a detecta pixelii ale caror valori au fost modificate. Daca cel care face analiza dispune de varianta originala a imaginii, atunci este suficienta o simpla comparare cu imaginea in care este stocat mesajul ascuns. 5. Steganografia in imagini Imaginile digitale asupra cărora se pot aplica tehnici steganografice sunt: binare, de intensitate (nivele de gri), color (RGB), indexate

• Imaginile sunt considerate buni purtători pentru că: • Utilizate des, nu trezesc suspiciuni • Uşor transmisibile • Mesajul ascuns poate trece drept zgomot

Tehnici steganografice întâlnite la imagini sunt: • Cel mai puţin semnificativ bit (LSB) • Mascare şi filtrare • Algoritmi şi transformări

In lucrarea mea am abordat metoda de subtituţie iar ca tehnici: cel mai putin semnificativ bitţi subtituţia în paleta de culori. Ca tipuri de imagini, am folosit imagini true-color (RGB) şi imagini indexate.

5.1. Imagini True-Color Imagini cu adâncimi de 24 de biţi au pixelii reprezentaţi de 3 octeţi, câte un octet pentru roşu, verde şi albastru. Procesul de încorporare constă în alegera unui subset {j1, . . . , jl(m)} de elemente din fişierul purtător şi efectuarea operaţiei de substituţiei cji= mi, care schimba cei mai puţini semnificativi biţi din purtator (cover) cji cu biţi din mesaj mi (mi poate fi ori 1 ori 0). Se poate realiza o substituţie chiar şi cu doi biţi mai puţini semnificativi din fiecare octet al purtătorului. În procesul de extracţie, cei mai puţin semnificativi sunt extraşi şi aliniaţi pentru reconstrucţia mesajului secret. Procesul de încorporare a mesajului este descris în algortimul 1, iar procesul de extracţie este descris în algoritmul 2.

Algoritm 1 Procesul de încorporare: substituţia celui mai puţin semnificativ bit

for i = 1,...,l(c) do

si ← ci end for

for i = 1 ...,l(m) do

calculează indexul ji unde va fi stocat al i-lea bit din mesaj

sji ← cji= mi end for

Algoritm 2 Procesul de extracţie: cel mai puţin semnificativ bit

for i = 1,...,l(M) do

calculează indexul ji unde este stocat al i-lea bit din mesaj

Page 4: steganografie

4

mi ←LSB(cji)

end for

Pentru ca destinatarul să poată decoda mesajul secret, el trebuie să aibă secvenţa indicilor elementelor folosiţi in procesul de încorporare. Exemplu:

Se inserează caracterul ‘A’ (10000011) Pixeli gazdă: 3 pixeli vor fi folosiţi pentru ascunderea unui caracter de 8 biţi Pixelii vor fi aleşi prin folosirea unei chei 00100111 11101001 11001000 00100111 11001000 11101001 11001000 00100111 11101001

După codificare: 00100111 11101000 11001000 00100110 11001000 11101000 11001001 00100111 11101001

Avantajele utilizării tehnicii celui mai puţin semnificativ

• Nu schimbă dimensiunea fişierului • Este mai greu de detectat decât alte metode steganografice • Uşor de implementat

Dezavantajele utilizării tehnicii celui mai puţin semnificativ • Trebuie folosit acelaşi program pentru ascunderea şi recuperarea informaţiei

ascunse • Dacă poza cu mesajul secret este compresată, informaţia secretă se poate

pierde 5.2. Imagini indexate O imagine indexată conţine două tabele, o matrice de imagine şi o hartă de culori. Harta de culori este un set ordonat de valori care reprezintă culorile din imagine. Pentru fiecare pixel din imagine, matricea de imagine conţine o valoare care este un index în harta de culori. Imagini GIF au adâncimi de 8 biţi, 256 de culori. Fiecare culoare RGB este reprezentată de un index. În cazul acestor imagini se aplică tehnica LSB indicilor din paleta sortată după luminanţă. În acest caz pixelii sunt reprezentaţi de un singur octet. Dându-se o anumită imagine, paleta de culoare ordonată după luminanţă este cea din fig2. În figura 3, putem observa rezultatele aplicării mesajului secret.

Fig 2. Paleta de culoare a unei imagini cu o adâncime de 8 biţi, ordonată după luminantă

Page 5: steganografie

5

Fig 3. Paleta de culoare a unei imagini cu o adâncime de 8 biţi, ordonată după luminantă, după

inserarea mesajului

6. Detecţie Detecţia imaginilor stego poate cuprinde mai multe etape:

• Examinarea paletei de culori

• A dimensiunii fizice

• A diferenţelor între format, data celei mai recente modificări

• Analize statistice

• Analiza frecvenţei coeficienţilor funcţiei cosinus discrete

Metodele folosite în detecţie sunt:

• Analiză statistică • Analiza frecvenţei coeficienţilor DCT

Fig 4. Histograma imaginii purtător

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4 5 6 7 8 9 10

Pixel value

Re

lative

fre

qu

en

cy

Page 6: steganografie

6

Fig 5. Histograma imaginii stego 7. Concluzii Tehnologiile steganografice sunt o parte foarte importantă a viitorului securităţii Internet-ului pentru sisteme deschise ca acesta. În acest context steganografia a devenit un subiect de actualitate pe net, in contextul intimitatii electronice dar si a protectiei copyright. Domeniul steganografiei este important în securitatea datelor. Impreună cu criptografia poate conduce la o securitate sporită. Cercetările se axează pe două direcţii:

1. Încorporarea informaţiilor drepturilor de autor, ascunse sau invizibile în diverse mijloace media ce urmează să fie publicate

2. La polul opus: cercetări pentru detecţia traficului materialelor ilegale şi a mesajelor ascunse publicate pe Internet

Steganografia ca metodă de codificare isi are si părtile sale bune. Ea se poate dovedi o cale eficientă si mai mult decat alternativă pe directia introducerii unor noi solutii de transmitere si protectie a datelor. Iată cateva exemple.

• NATPE (National Association of Television Program Executives): „Directionarea produselor către locul in care se află utilizatorii” a fost sloganul folosit in 2001. Scopul: corelarea companiilor implicate in introducerea si dezvoltarea de noi tehnologii cu furnizorii de continut.

• O altă aplicatie apartine companiei Lucent Technologies, numită Media TraX, care integrează informatie digitală in imaginile TV intr-un mod imperceptibil pentru ochiul uman. Această informatie poate fi insă recuperată si folosită ulterior.

• In fine, poate cel mai cunoscut caz este „digital watermarking”, procedeul de introducere a informatiei in imagine, muzică sau software, utilizand principiul steganografiei. Un model de biti inserat intr-o imagine digitală, intr-un fisier audio sau video, poate contine toate informatiile legate de copyright (autori, anumite drepturi etc.). Watermark-urile digitale trec complet neobservate, vizual sau auditiv. Ele trebuie să fie indeajuns de stabile pentru a putea face fată schimbărilor normale făcute fisierului, ca de exemplu aplicarea unor algoritmi de compresie.

• Ar mai fi si folosirea procedeelor de „fingerprinting”: Internetul a creat noi modalităti de atragere si mentinere a utilizatorilor, acum apărand din ce in ce mai multe posibilităti de a

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4 5 6 7 8 9 10

Pixel value

Re

lative

fre

qu

en

cy

Page 7: steganografie

7

construi servicii cu valoare adăugată. Aceste cercetări sunt utile in urmărirea si detectarea celor care incalcă regulile de copyright.

Bibliografie

1. Multimedia Security: Steganography and Digital Watermarking Techniques for Protection of Intellectual Property, by Lu, Chun-Shien, Publication: Hershey : Idea Group Publishing, 2005.

2. Hiding in Plain Sight: Steganography and the Art of Covert Communication, by Cole, Eric, Publication: Indianapolis, IN John Wiley & Sons, Inc. (US), 2003.

3. Information Hiding Techniques for Steganography and Digital Watermarking Artech House Computer Security Series, by Katzenbeisser, Stefan.; Petitcolas, Fabien A. P., Publication: Boston Artech House, Inc., 2000.

4. Coding for Data and Computer Communications, by Salomon, D., Publication: New York, NY Springer Science & Business Media, 2005.

5. Techniques and Applications of Digital Watermarking and Content Protection Artech House Computer Security Series, by Arnold, Michael.; Schmucker, Martin.; Wolthusen, Stephen D., Publication: Boston Artech House, Inc., 2003.

6. http://en.wikipedia.org/wiki/Steganography 7. http://www.garykessler.net/library/steganography.html