Tehnologii Dw

download Tehnologii Dw

of 63

Transcript of Tehnologii Dw

  • 7/24/2019 Tehnologii Dw

    1/63

    Tehnologii Data Warehouse

    2011

  • 7/24/2019 Tehnologii Dw

    2/63

    Cuprins1 Introducere. Scopul DataWarehouse. Caracteristici.............................................................

    1.1 Introducere.......................................................................................................................1.2 Scop i Cerine.................................................................................................................1.3 Caracteristici....................................................................................................................

    2 Trecerea de la sisteme operaionale la sisteme de suport decizional...................................2.1 Contextul apariiei. Evoluie..........................................................................................2.2 Accesul la informaie.....................................................................................................

    3 Utilizarea sistemelorData Warehousepentru un operator de telecomunicaii mobile20

    3.1 Piaa Telecomunicaiilor moile....................................................................................

    3.2 ImplementareaData Warehouse !n telecomunicaiile moile......................................3.3 Avanta"ele oferite de #ata $are%ouse !n telecomunicaiile moile..............................

    Consideraii de desi!n..............................................................................................................&.1 'odelarea relaional(. )a*e de date normali*ate..........................................................&.2 'odelarea dimensional(. )a*e de date demormali*ate.................................................&.3 +ranularitatea.................................................................................................................&.& Partiionarea...................................................................................................................&., Indexarea........................................................................................................................&.- Capcane !n modelarea datelor........................................................................................

    " #odelul de date.........................................................................................................................

    ,.1 ivelul Conceptual........................................................................................................,.2 ivelul lo/ic..................................................................................................................,.3 ivelul fi*ic...................................................................................................................,.& Conclu*ie.......................................................................................................................

    $ %iblio!ra&ie................................................................................................................................

  • 7/24/2019 Tehnologii Dw

    3/63

    1 Introducere. Scopul #ata$are%ouse.Caracteristici

    1.1 Introducere0n #ata $are%ouse este o a*a de date proiectat( pentru a satisface necesit(ile

    le/ate de informaiile c%eie din cadrul unei or/ani*aii. Acesta inte/rea*( date dintrunnum(r variat de sisteme operaionale i este de oicei !nc(rcat cu informaii la intervalere/ulate. #epo*itul de date conine informaii ierar%i*ate !n timp ce permit anali*a afactorilor de performana dintro perioad( !ndelun/at(.

    Avnd !n vedere c( cerina de a*( pentru orice sistem informatic este aceea de aasi/ura informarea corecta i !n timp util a tuturor factorilor de deci*ie dintro companieactivitatea de reali*are a sistemelor informatice este acceptata de ma"oritatea specialitilor

    prin prisma utili*(rii te%nicii de calcul pe dou( planuri i anume !n activitatea defundamentare a deci*iilor i !n asistarea activit(ii curente desf(urate !n or/ani*aie.

    Primul plan se caracteri*ea*( prin existena unor produse soft4are speciali*ate !nanali*a alternativelor deci*ionale urm(rinduse /(sirea celei mai favoraile deci*iipentru societatea comerciala. Cel deal doilea plan urm(rete de*voltarea de aplicaiiinformatice de /estiune economic( la nivel de activitate sau /rup de activit(i !n cadrulcompaniei.

    Pentru oinerea performanelor la nivelul proceselor de afaceri asistate seimpune ca sistemele s( controle*e mediul prin primirea datelor prelucrarea lor ireturnarea re*ultatelor suficient de rapid pentru a fi !n m(sur( s( influene*e funcionareaproceselor !n timp real. Prelucrarea !n timp real cere introducerea imediat( !n sistem adatelor a mesa"elor transmise de la terminalele sursa. 0n num(r mare de staii aflate ladistan( i le/ate !n sistem prin intermediul unor ec%ipamente de comunicaie de marevite*a pot lucra simultan5 unele actuali*ea*( fiiere altele particip( la intero/ari etc.

    Sistemele informatice !n timp real se a*ea*( pe soluii te%nolo/ice avansate5procesoare puternice6 memorii de masa cu acces direct6 le/atur( direct( !ntre calculatorulelectronic i sistemul de comunicaie6 terminale diferite adaptate nevoilor6 perfecion(riale ec%ipamentelor i canalelor de comunicatie6 alocarea spaiilor de memorare iprelucrari preliminare !n retea6 reali*area unor te%nici evoluate de pro/ramare asi/urndproducerea soft4areului necesar.

    Acumularea unor mari cantit(i de date necesare funcion(rii activit(ii i lu(riicorecte a deci*iilor nu mai este o prolema din punct de vedere te%nic. Acum se puneprolema extra/erii din multitudinea informaiilor existente a celor mai relevante pentruprolema dat( !ntrun timp scurt i cu un cost cat mai mic. Aa sa n(scut ideeastructur(rii informaiei !n depo*ite de date 7#ata $are%ouse sau #$8. #epo*itele de daterepre*int( o cerin( acut( a or/ani*aiilor moderne 7fie ele !ntreprinderi (nci societ(ide asi/ur(ri sector pulic sau administrativ8 si totodat( o realitate te%nolo/ic( pus( !n

  • 7/24/2019 Tehnologii Dw

    4/63

    practic( din ce !n ce mai frecvent. 0n sonda" reali*at de 'ETA +roup !n 199: arata ca9;< dintre mana/erii intervievai intentionau lansarea unor proiecte de implementare aacestui concept. Se/mentul de pia( le/at de depo*itele de date are o rata anual( decrestere de cca. 3,i*iunea sa despre depo*itelede date se concentrea*( asupra rolului acestora de a*a informational( a deci*ieimana/eriale p(strnd astfel un nivel !nalt de /eneralitate. 0n alt nume important este celal lui Earl ?adden cel care a enuntat a fundamentat i a experimentat cu succes ometodolo/ie ri/uroas( pentru implementarea rapid( a depo*itelor de date 79; da@4inners8. serie de societ(i comerciale iau adus la rndul lor contriuia laclarificarea de*voltarea i populari*area noii te%nolo/ii. Printre acestea se remarc(Soft4are A+ racle Bed )ric= S@stems Prism Solutions 'icroStrate/@ I)' i SAP.

    #in perspectiva economic( /loali*area comerului ascuirea dramatic( aconcurenei scurtarea spectaculoasa a ciclurilor de viaa a produselor datorit( dinamiciite%nolo/iei impunerea unor cerine calitative extrem de ridicate precum i alte asemeneaevoluii au evideniat si mai mult valoarea strate/ic( a informaiei. 'anipulareaoperativ( a informaiei a impus la rndul ei noi modele mana/eriale mai versatile i maieficiente. evoia de a r(spunde !n timp optim cerinelor pieei a condus ladescentrali*area i la reducerea num(rului nivelurilor deci*ionale consacrnd ierar%iileplateD care se a*ea*( pe dele/area puterii deci*ionale operative catre esalonulmana/erial secund. Atat la nivelul mana/ementului strate/ic ct i la nivelulmana/ementului operativ nevoia de informaie pur( i corect( a devenit vitala.

    #in perspectiva te%nolo/ic( ultimii ani au adus puterea de calcul la preuriaccesiile. Servere paralele a*ate pe microprocesoare accesiile ca pre rivali*ea*( ca

    putere cu supercalculatoarele la o fractiune din pretul acestora din urm(. Sistemele dea*e de date pot exploata la maximum ar%itecturile %ard4are paralele iar evoluiile spresisteme desc%ise permit o conectivitate aproape total( la orice fel de surse de date iinteroperailitate !ntre diverse platforme soft4are i %ard4are. 'ediile de stocarema/netice i optice admit volume de ordinul tera i c%iar mai mult. PCurile au a"uns iele la maturitate. Puterea lor este acum suficienta pentru funciile de anali*( i pre*entarecare le sunt re*ervate iar interfeele /rafice intuitive le fac accesiile utili*atorilor nonte%nici sau f(r( o pre/atire special( !n domeniul ultil*(rii intefeelor.

    1.2 Scop i Cerine

    iectivul principal al proiectului este crearea unui sistem de suport deci*onalcare acionnd ca un sin/ur punct !n care se aduc din mai multe surse numaiinformaiile utile s( permit( anali*a suprave/%erea i predicia comport(rii clienilorrespectiv diferitelor departamente ale unei companii de telecomunicaii.

    #iferenierea !ntre a*ele de date informaionale i cele operaionale a ap(rut dincteva motive5

    #atele ce servesc nevoilor operaionale sunt diferite din punct de vedere

  • 7/24/2019 Tehnologii Dw

    5/63

    fi*ic de cele ce servesc unor nevoi de anali*a sau unor nevoi informaionale Te%nolo/ia ce susine procesarea operaional( este fundamental diferita de

    te%nolo/ia folosit( pentru sisteme informaionale sau analitice 0tili*atorii datelor operaionale sunt diferiti de cei ce folosesc datele

    analitice

    Caracteristicile de procesare ale mediului operaional sunt diferite de celeale mediului informaional

    0n astfel de sistem !n domeniul telecomunicaiilor este de important( strate/ic(deoarece companiile de telecomunicaii lucrea*( cu un volum foarte mare de date !ncondiiile unei piee concureniale. >olumul foarte mare de date re*ult( din num(rulclienilor i varietatea serviciilor i este amplificat de nevoia de a p(stra i o istorie pea*a c(reia s( se poata reali*a anali*( sau predicie.

    a polul opus un sistem #ata$are%ouse nu ar fi potrivit pentru o companie mic(.#imensiunile reduse ale domeniului de activitate vor permite anali*area performanelor

    companiei f(r( existena unui sistem inte/rat. Fn acelai timp dac( concurena !ndomeniul respectiv nu este ridicat( investiia !ntrun sistem de suport deci*inal nu se"ustific(.

    Pentru aceste motive i altele care sar putea /(si sistemele operaionale suntseparate de cele informaionale sau analitice i treuie s( !ndeplineasc( o serie de cerinesuplimentare fa( de un alt proiect IT. Cerinele /enerale pe care sistemul de suportdeci*ional treuie s( le !ndeplineasc( pentru o implementare cu succes5

    Sistemul trebuie s' prezinte in&ormaia ast&el (nc)t ea s' &ie accesibil'Pre*entarea datelor treuie s( fie intuitiv( i evident( pentru un utili*ator care !icunoate afacerea. 0tili*atorii doresc s( separe sau s( comine datele !n

    nenumarate cominaii 7proces cunoscut su numele de slicing and dicing8.Aplicaiile de acces treuie s( fie uor de utili*at i !n acelai timp s( returne*ere*ultatul intero/(rilor cu un timp minim de ateptare.

    Datele trebuie s' &ie consistente.#atele vor fi asamlate din variatele surse ale or/ani*iei cur(ate i inte/ratepentru a fi crediile. Informaia disponiil( pentru un departament treuie s( fie !ncorespondent( cu informaia diponiil( altui department. #ac( dou( variaile auacelai nume ele treuie s( reflecte acelai nume sau din contr( dac( dou(variaile au semnificaii diferite ele treuiesc denumite diferit.

    Sistemul trebuie s' &ie adapti* +i s' re&lecte cu u+urin' schimb'rile dinor!anizaie.

    Sc%imarea este o realitate care nu poate fi ne/li"at(. Se pot modifica nevoile deinformaie ale utili*atorilor mediul de afaceri datele !n sine sau te%nolo/ia.Sistemul informaional treuie s( in( cont de aceste sc%im(ri inevitaile.Adaptailitatea sistemului se reflect( !n faptul c( datele existente treuie s( nu fieafectate iar datele noi s( poata fi primite !n warehouse.

    Sistemul de suport decizional trebuie bazat pe un depozit si!ur de date, la

    care nu au acces dec)t utilizatori autorizati.Sistemul treuie s( permit( controlul accesului pentru a prote"a datele

  • 7/24/2019 Tehnologii Dw

    6/63

    confideniale ale or/ani*aiei. Data Warehouse-ul trebuie s' acioneze ca o &undaie pentru (mbun't'irea

    procesului decizional. #atele pre*ente treuie s( fie numai acelea care aduc unplus de informaie !n procesul deci*ional. Outputulunui astfel de sistem treuie s(fie o dovad( a deci*iilor ce vor fi luate.

    Comunitatea de utilizatori trebuie s' accepte sistemul in&ormaional.Spre deoseire de sistemele operaionale pe care utili*atorii sunt de multe orioli/ai de !mpre"ur(ri s( le foloseasc( folosirea sistemului de suport deci*ionalnu impune o constrn/ere atat de ri/id(. Pentru acest motiv este cu att maiimportant ca sistemul s( fie acceptat de utili*atori.

  • 7/24/2019 Tehnologii Dw

    7/63

    1.3 CaracteristiciPutem identifica patru caracterisitici comune ale implement(rilorDataWarehouse

    indiferent de domeniul de aplicailitate. Aceste caracteristici sunt5 Centrarea modelului pe suiect 7Subject Oriented8 Inte/rat( onvolatil( Centrat( pe timp

    Sitemul de fat( ce se aplic( !ntro companie de telecomunicaii respect( toateaceste caracteristici.

    Centrarea modelului pe subiect

    Spre deoseire de sistemele operaionale care sunt or/ani*ate !n "urul uneiaplicaii funcionale ale companiei G spre exemplu aplicaii de facturare 7Billing8 demana/ement al relaiilor cu clienii 7CB'8 sistemele data warehouse au ca nucleu alinformaiei un anumit suiect c%eie a c(rui anali*( se dorete.

    'odelul de date !n proiectul de fa( este or/ani*at !n "urul unui numar de suiectec%eie din domeniul telecomunicaiilor moile. Acestea sunt suiecte pe a*a c(roraputem anali*a urm(ri i m(sura re*ultatele companiei 7 financiare sau nonfinanciare8.Exemple de astfel de suiecte sunt5 Clienti Produse Contracte Parteneri Canale dedistriuie.

    Inte!rate

    Haptul c( !n data warehouse datele sunt inte/rate !nseamn( c( ele sunt or/ani*ate!ntrun unic format de m(sur( i referint( 7sunt m(surate !n acelai fel i refer( acelai

    lucru8. Aceasta este poate cea mai important( caracteristic( a sistemului data warehouse.#atele intr( !n data 4are%ouse din multiple surse disparate. Pentru ca datele s( fieinte/rate ele treuie s( fie convertite reformatate renumerotate sumari*ate etc.Be*ultatul este o unic( ima/ine a activit(ilor companiei.

    #atele operaionale sunt orientate pe aplicaii !n sensul c( or/ani*area lor esteoptimi*at( pentru a servi procesului tran*acional dinamicii sistemului. Fn contrast #$este orientat pe suiectele importante ale procesului economic cum ar fi5 clienifurni*ori produse activit(i. 'ai mult date eseniale din perspectiva operaional( suntcomplet lipsite de relevan( din perspectiva informaional(. Aceste date vor fi exluse dindata warehouse. 7ex. I#uri cu semnificaii locale8

    Baiunea pentru care data warehouse-uleste creat !l constituie asi/urarea datelorpentru a r(spunde nevoilor informaionale ale !ntre/ii or/ani*aii asi/urnd faptul c(rapoartele /enerate pentru diverse compartimente vor furni*a aceleai re*ultate. Sistemuloperaional este de cele mai multe ori format din susisteme semiindependente create lamomente diferite de ec%ipe diferite !n maniere diferite re*ultnd un amal/am care deifuncional si de ne!nlocuit din punct de vedere operaional sistemul nu poate fi folositpentru anali*(. Simpla lui structura !l face imposiil de folosit !n anali*(

  • 7/24/2019 Tehnologii Dw

    8/63

    Exemplul de mai "os ilustrea*( modul de inte/rare a informaiilor referitoare laclient la trecerea lor din sistemele operaionale 7sisteme orientate pe aplicaie8 !n data4are%ouse. !ntro firma de telefonie moil(.

    Aplicaiiile operaionale sunt sisteme independente la desi/nul i de*voltareac(rora fiecare produc(tor are liertatea de a !i staili propriul format. ipsa unorstandarde 7codare convenii de nume atriute m(rimi de atriute8 sau constrn/eridiferite care se aplicau fiec(rei aplicaii !n parte au dus la apariia unor aplicaii diferite!n care aceleai date apar repre*entate fie diferit fie parial.

    0n operator de telefonie moil( de*volt( mai multe linii de afaceri acestea deisunt interconectate au i caracteristci unice. Data Warehouseeste locul !n care toateaceste date sunt consolidate.

    Spre exemplu !n Data Warehouseavem date referitoare la comportamentul deutili*are a serviciilor !n funcie de client !mp(rite pe diferitele linii de servicii oferite. Cu

    Fig 1: Integrarea datelor la ncrcarea lor n Data Warehouse

  • 7/24/2019 Tehnologii Dw

    9/63

    aceleai date putem deasemenea anali*a profitailitatea clientului sau utili*areapotenialul pieei. Fn timp ce acestea pot fi v(*ute ca funcii analitice distincte ele au !ncomun atriute relaionate care pot fi furni*ate dinData Warehouse

  • 7/24/2019 Tehnologii Dw

    10/63

    -on/olatil'

    Data Warehousetreuie s( fie o structur( informaional( stail( a unui mediu desuport deci*ional. 'odelul treuie s( fie astfel proiectat !nct s( susin( o astfel destailitate. #atele nu vor fi direct modificate ci vor fi populate periodic cu datele noi din

    aplicaiile operaionale.Sistemul operaional al unei or/ani*aii tinde mereu s( reflecte realitatea curent(.

    Astfel el se afl( !ntro continu( evoluie iar datele pe care le conine sunt relevante doarpentru momentul !n care sunt accesate. ri*ontul de timp pe care !l acopera este de re/ul(de -; pn( la 9; de *ile deoarece dup( acest interval tran*aciile efectuate sunt ar%ivatefiind considerate de"a de domeniul istoriei deci neinteresante din perspectiva operativ(.Pentru nevoile anali*ei dimpotriv( informaiile cu caracter istoric sunt esenialedeoarece ele pun !n eviden( tendine care repre*int( fundamentul unei pro/no*e corecte.

    Spre deoseire de sistemele operaionale !n care datele sunt !n mod curent scrise

    modificate i accesate !n data warehouse datele sunt !nc(rcate !n mas( 7*ilnics(ptamnal lumar8 iar apoi accesate. #atele din data warehousenu mai sunt modificatepentru a p(stra ima/inea datelor la un anumit moment dat. #ac( se produc sc%im(ri onou( !nre/istrare este inserat(. Fn acest fel !n datawarehousep(str(m date cu caracteristoric. u avem numai ima/inea curent( 7ca !n sistemele operaionale8 ci i ima/ini ladiferite momente de timp. Fn continuare pentru a referi ima/inea datelor la un anumitmoment de timp vom folosi termenul desnapshot.

    Centrat' pe timp

    Aceast( caracteristic( se refer( la faptul c( fiecare !nre/istrare din data

    warehouseeste valail( pe un anumit interval de timp. Fnre/istr(rile vor avea m(rci detimp i versiune 7#ATEHB' #ATET #$ETBJ#ATE >ESI8. Acesteasunt necesare pentru a indica intervalul de timp sau momentul la care !nre/istrarea serefer(.

    #atele din warehouse sunt date despre un ori*ont de timp mult mai mare dect !nca*ul sistemelor operaionale. #ac( !ntrun sistem operaional vom avea date pe 23 luni!n warehousevom p(stra istorie pe ,1; ani deoarece pentru a putea preconi*a evoluiile

    Fig !: "aracterstica de non-#olatitilitate a Data Warehouse-ului n co$para%ie cusiste$ele opera%ionale

  • 7/24/2019 Tehnologii Dw

    11/63

    viitoare i pentru a putea susine procesul deci*ional istoria treuie foarte ine urm(rit(i anali*at(.

  • 7/24/2019 Tehnologii Dw

    12/63

    #$ se constituie !ntrun istoric al sistemului operaional constituit dintro serie deKinstantaneeK ima/ini la diverse momente !n timp. ri*ontul de timp pe care !l acopera#$ este de cel puin cinci ani a"un/nd uneori la *ece ani !n funcie de dinamicaevoluiei pieei i deci de relevana datelor cu caracter istoric pentru nevoile anali*ei.

    #in punct de vedere te%nic acesta implic( faptul c( orice !nre/istrare din #$corespunde unui moment de timp specificat. rice c%eie de acces la informaiile din #$va cuprinde i o component( temporal(.

    Esena aplicaiilor operaionale este actuali*area continu( a coleciilor de dateactuali*are reali*at( !n /eneral pe a*a tran*acional(. rice tran*acie procesat( implic(inserarea unor noi !nre/istr(ri modificarea sau eventual ter/erea altora etc. Cu totulaltfel stau lucrurile !n ca*ul #$ unde o astfel de dinamic( lipsete. Practic aici are locadau/area periodic( a unor date extrase din sistemele operative. #in punctul de vedere alaplicaiilor care folosesc #$ accesul la date este doar pentru citire.

  • 7/24/2019 Tehnologii Dw

    13/63

    2 Trecerea de la sisteme operaionale la sisteme desuport deci*ional.

    2.1 Contextul apariiei. Evoluie

    Sistemele deci*ionale de tip DataWarehouse vin ca un r(spuns la inailitateavec%ilor implement(ri de sisteme de suport deci*ional de a r(spunde nevoilor de raportareale companiei. Spre exemplu departamentul de mar=entin/ dorete s( afle re*ultatulcompanei oinut !ntro anumit( re/iune. #ac( oserv( c( acesta este nesatisf(c(tor vadori investi/area !n am(nunt a re*ultatului pe fiecare produs comparat cu cifra de vn*(ripropus(. Pentru a remedia situaia mana/erul treuie s( ia o deci*ie rapid( lund !nconsiderare toi factorii. Cum informaiile am(nunite nu se /(sesc !ntro sin/ur( surs( vatreui s( adun(m date din mai multe aplicaii pentru a putea construi raportul. Fndiferitele aplicaii din care avem nevoie de date de cele mai multe ori nu vom !ntlni

    acelai format de date sau exact aceleai entit(i. Baportul cerut fie nu va putea fi f(cut !ntimp utill fie datele nu vor fi exacte.

    Putem oserva um(toarea evoluie a sistemelor de suport deci*ional prin care ocompanie trece prin !ncerc(rile sale de a crea un sistem informatic ce s( susin( deci*iilestrate/ice.

    apoarte ad hoc0tili*atorii din departamentele de mar=etin/ sau financiar solicit(

    departamentului IT un anumit raport. #epartamentul IT va crea un pro/ram sau un scriptSL special pentru aceast( cerere. #e oicei cte unul pentru fiecare cerin(.

    ro!rame specializate pentru etracteFn aceasta etap( departamentul de IT !ncearc( s( anticipe*e cerinele ce le vor fi

    solicitate periodic. #epartamentul IT va crea o suit( de pro/rame pe care rulnduleperiodic vor extra/e date din mai multe aplicaii. Pentru acele cereri care nu pot fisatisfacute din aceste extracte departamentul IT va crea un pro/ram special.

    plicaii miciAceasta etap( este o formali*are a pro/ramelor pentru extracte. aplicaie

    simpl( se poate folosi de extractele /enerate anterior pentru a /enera rapoarte !n funciede solicitare. asfel de aplicaie ar putea permite c%iar vi*uali*area direct( a rapoartelor.

    Centre in&ormaionaleSunt definite ca un loc !n care utili*atorii puteau vi*uali*a rapoartele predefinite.

    ameni de IT treuiau s( fie pre*eni pentru a putea crea rapoarte ce nu sunt predefinite.

    Sisteme de suport decizionalAcestea au ca scop furni*area de informaii strate/ice. a fel ca i !ncerc(rile

    timpurii i ele sunt a*ate pe fiiere extrase din diferite aplicaii.

  • 7/24/2019 Tehnologii Dw

    14/63

    Sisteme in&ormaionale la ni*el eecuti*Caracteristca cea mai important( acestora este usurina cu care pot fi utili*ate. Ele

    furni*ea*( informaiii c%eie !n fiecare *i. #ac( se dorete o anali*a dup( produs re/iunesau alta dimensiune aceasta este posiil( numai dac( au fost de"a pro/ramate.

    Cum difer(MOPERAIONAL INFORMAIONAL

    CONINUTUL DATELOR Valori curente Arhivate, derivate,sumarizate

    STRUCTURA DATELOR Optimizate pentrutranzacii

    Optimizate pentru interogricomplexe

    FRECVENAACCESRILOR

    Mare Medie sau Redus

    TIP DE ACCESRI Citire, modificare,tergere Citire

    UTILIZARE redicti!il, repetitiv Ad hoc, aleatoare, euristic

    TIMP DE RSPUNS "e ordinul secundelor "e ordinul minutelor

    UTILIZATORI #umeroi Relativ puini

    2.2 Accesul la informaie0tili*atorii pot accesa datele coninute !n sistemul de suport deci*ionat de tip data

    4are%ouse prin intermediul unor interfee de nivel aplicaie. umim acest nivel nivelulfrontend. Produsele soft4are cel mai adesea !ntalnite pun la dispo*iia eneficiarilor5

    0nelte de raportare i intero/are 7ex5 tas=uri de volum mare vederi orientate pesuiect86

    0nelte de de*voltare de aplicaii 7pentru de*voltarea de aplicaii proprii86 0nelte EIS 7&'ecuti#e in(or$ation s)ste$86 0nelteData $ining. Scopul data $ining!l constituie filtrarea datelor coninute !n

    #$ !n vederea pre/(tirii acestora pentru evaluarea i anali*a ulterioar(. Cel maisimplu tip de filtre !l repre*int( aa numitele Npra/uriD care pot fi ri/ide variailesau adaptive. Pra/urile ri/ide /enerea*( valori fixe !n ca*ul nerespect(rii lor 7la

    oinerea unei valori mai mari sau mai mici8 fiind automat /enerat un mesa" deatentionare. Pra/urile variaile sunt cele a c(ror valoare depinde de context 7deexemplu factorii de se*on8. Pra/urile adaptive sunt orientate dup( modul dedistriuire a deviaiilor valorice astfel ca de exemplu o deviaie a volumului detraffic cu 1;< pe o anumit( *on( /eo/rafic( treuie altfel interpretata !nct s(reali*e*e acelasi procent la nivel /loal.

    On-line anal)tical processing tools 7AP8. )a*a conceptului AP i a anali*eide date multidimensionale formea*( cuuri de date 7Datacube*. #escrierea unei

  • 7/24/2019 Tehnologii Dw

    15/63

    mulimi de dimensiuni i a unei mulimi de m(rimi alc(tuiesc un cu de date.Conceptul AP ofera de asemenea posiilitatea de utili*are a cuurilor virtuale7+irtual "ube8. Similar cu vederile din modelul relaional un cu virtual poate fialc(tuit prin definirea de le/!turi !ntre cuuri de date fi*ice. Pentru utili*atoraccesul la cuurile fi*ice si la cele virtuale este transparent !n sensul c( nu

    percepe nicio diferen( !ntre cele dou( din punctul de vedere al ccesului la date.Cuul virtual nu conine date materiali*ate fiind creat la momentul intero/(rilorasupra cuurilor fi*ice de date. Fn cadrul anali*elor intermediate cu a"utorulte%nolo/iei AP se reali*ea*( operaii specifice5 roll-up, drill-down, slicing,dicing, pi#ot.

  • 7/24/2019 Tehnologii Dw

    16/63

    oll-up este operaiunea prin care datele se a/re/( fie printrun pas !n sus !nierar%ia de dimensiuni fie prin reducerea num(rului de dimensiuni. Spre exemplu !n locs( /rup(m datele dup( *i printro operaiune roll-uple vom /rupa dup( lun( sau trimestrusau an 7urc(m !n ierar%ia de timp8.

    Fn al doilea ca* de roll-up, s( presupunem c( vi*uali*(m o m(rime dup( dataactiv(rii i dup( localitate eliminnd una dintre cele dou( dimensiuni m(rimea se vaa/re/a dup( dimensiunea r(mas(.

    Fig : &'e$plu de

    (olosire a

    (unc%ionalit%ii Drill

    /p n "ognos 0 BI

    Fig : Drill /p

    prin eli$iareade di$ensiuni

  • 7/24/2019 Tehnologii Dw

    17/63

    Drill-down este operaiunea invers( rollup. astfel de operaiune vi*uali*ea*(datele de la date mai /enerale la date specifice detaliate. peraiunea poate fi f(cut( fieprin a folosi o dimensiune de pe un nivel inferior al ierar%iei fie prin a ad(u/a noidimensiuni. Fn exemplul urm(tor vi*uali*(m datele pentru toate re/iunile t(rii coornd

    un pas !n ierar%ie vi*uali*(m datele pe toate "udeele componente ale re/iunii selectatecoornd !nca un pas vi*uali*(m datele dup( !mp(rirea uran O rural a "udeului selectat.

    Slicereali*ea*( o filtrare dup( o dimensiune din cu reali*nd astfel un sucu.Fn exemplul urm(tor am filtrat mic(rile de alan( dup( dimesiunea po*itiv O ne/ativp(strnd numai mic(rile po*itive 7bonus si recharge8.

    Dice este operaiunea prin care putem reali*a fitr(ri dup( mai mult de odimensiune Fn exemplul urm(tor am filtrat pe ln/( tipul mic(rile de alan( i dup( odimensiune de timp5 anul activarii s( fie !ntre 2;;, si 2;;.

    Fig 2: Drill Down

    Fig 3: Slice

  • 7/24/2019 Tehnologii Dw

    18/63

    Fig 4: Dice

  • 7/24/2019 Tehnologii Dw

    19/63

    5i#otoareaeste o operaiune de vi*uali*are prin care se inversea*( axele uneivederi pentru a oferi o nou( perspectiv(. Fn exemplul urm(tor am afiat su forma unorcoloane verticale valoarea veniturilor dup( trimestru pentru fiecare re/iune. Apoi ampivotat /raficul astfel !nct s( afiam su forma unor coloane verticale aceleai venituri!ns( o afiare dup( re/iune pentru fiecare trimestru.

    Fn primul ca* analistul #SS poate oserva foarte uor evoluia de la trimestru latrimestru pentru !ntrea/a companie avnd i informaie despre contriuia fiecarei re/iunila performana /eneral( pe trimestru.

    Fn al doilea ca* poate fi urm(rit( cu uurin( evoluia fiec(rei re/iuni de latrimestru la trimestru mai repede dect evoluia /eneral( de la trimestru la trimestru.

    Fig 0: 5i#otare

  • 7/24/2019 Tehnologii Dw

    20/63

    3 0tili*area sistemelorData Warehousepentru unoperator de telecomunicaii moile

    3.1 Piaa Telecomunicaiilor moile

    Fn ultimele *ece decade industriile din toate sectoarele de activitate au suferitsc%im(ri profunde !n ceea ce privete mediul de afaceri. Concurena avasareate%olo/ic( i /loali*area exercit( o mare presiune asupra operatorilor de telecomunicaiii ailitatea lor de a r(spunde acestor sc%im(ri.

    peratorii actuali de telecomunicaii au de dep(it provoc(ri precum5 Concurena continua provenit( de la o dere/ulari*are /loal(6 'ic(rile puternice de pe pieele !n curs de de*voltare6

    0n declin profund al profitului oinut pe se/mentul de telefonievoce6 Cererile !n cretere le/ate de noile te%nolo/ii din domeniul comunicaiilor6 Beducerea de ac%i*iii.

    Fn industia telecomunicaiilor dere/ulari*area a atras concurena /loal( i pe planlocal. Acest fenomen a determinat i determina !nc( erodarea acestui se/ment de piat( iamenin( profitul oinut.

    Concurena a determinat apariia unor produse alternative cu pre accesiil ca 3+>IP serviciile ce in cont de locaie etc. Aplicaiile multimedia au ad(u/at un marefactor de risc pentru o industire ce are nevoie de o mare infu*ie de capital pentru asi

    !mun(t(i infrastructura i sistemele de facturare. Fn tot acest timp anii cti/ai dintelefonie sunt tot mai puini.

    #rept r(spuns muli operatori de telefonie se lupt( s( oin( i s(i menin(po*iia pe pia( prin5

    Sc%imarea orient(rii de la se/mentul de ac%i*iii spre reinerea clienilorrecti/area se/mentelor de pia( i oinerea unora noi profiatailitate.

    Punerea accentului pe de*voltarea interioar( !n special !n ceea ce privetep(strarea se/mentului de pia(.

    Sc(derea duratei de /aranie i reducerea conturilor provenite din reeleprin m(rirea duratei de utili*are a ec%ipamentelor.

    #e*voltarea vn*area de noi produse la intervale mai scurte de timp. Fmun(t(irea relaiei cu clienii pentru a oine loialitatea acestora. '(rirea puterii de deci*ie a an/a"ailor. Bestructurarea or/ani*aiilor pentru a fi mai receptive la nevoile pieei i

    cerintele clienilor.

    uarea deci*iilor pentru a implementa toate acestea este o adevarat( provocaref(r( un data warehousesau f(r( tool-uri adecvate. uarea deci*iilor corecte !n cel mai

  • 7/24/2019 Tehnologii Dw

    21/63

    scurt timp pote face diferena !ntre supravieuire i faliment pe o pia( foarte competitiv(i !n continua sc%imare.

  • 7/24/2019 Tehnologii Dw

    22/63

    Pentru a trece peste ostacolele !ntlnite operatorii treuie5 S( atra/( ct mai muli clieni ce aduc profit mare 7sau cu un mare

    potenial86 S( m(reasca num(rul produselor care atra/ clieni6 S( diminue*e costurile6

    S( penetre*e noi se/mente de piaa6 S( !mun(t(iasca promovarea de produse c(tre clienii care au un

    potenial mare de a aduce profit6 S( reduc( pierderea de clieni.

    Toate acestea pot fi f(cute prin implementarea unei soluii de data warehouse.Data Warehouseofera informaiile rapid i !ntrun format care spri"in( procesul de luareaa deci*iilor.

    Acest sistem permite exploatarea potenialului informaiei detaliate dar i ainformaiilor a/re/ate din alte a*e de date mai mici acum accesiil( utili*atorilor dinbusiness.

    Business Intelligencei Data Warehouseau urm(toarele utili*(ri frecvente5 Prospectarea clienilor i a se/mentului de ac%i*iii Prevedera pierderilor de clieni i a procesului de reinere a acestora Profitailitatea promoiilor de loialitate recti/are i preluare de clieni Succesul procesului de promovare a produselor i m(sura !n care acestea !i

    atin/ inta. Profitailiatea campaniilor de mar=etin/ Fmun(t(irea sistemelor operaionale

    3.2 ImplementareaData Warehouse !n telecomunicaiile moile

    Sitemul de data warehouseofer( informaiile rapid i !ntrun format care spri"in(procesul deci*ional. 0n data warehousepermite operatorilor s( exploate*e la maximpotenialul infomaional folosinduse de date att la nivel de detaliu ct i !ntrun /radmai mare de sumari*are necesar utili*atorului cu capacitate de deci*ie sau curesponsilitate de raportare.

    0n sistem de data warehousepoate reine informaii despre sectoarele de careoperatorii sunt mai preocupati !n aceasta perioad( i ofer( posiilitatea unei anali*edetaliate asupra acestora5

    Pierderea de clieni6 emulumirile le/ate de procesul de tarifare6 +radul de utili*are al reelei6 Eficiena serviciului de asisten( clieni6 Profitailitatea produselor6 Performaa canalelor de distriuie6 Procesul de reinere a clienilor6

  • 7/24/2019 Tehnologii Dw

    23/63

    Beuita campaniilor efectuate6

    Prolema cu care se confrunt( operatorii nu este le/ata neap(rat de volumul dedate ci de consintena datelor de acurateea i complexitatea lor de actualitatea acestora.Fn ultimii ani pentru aceste proleme sau c(utat o re*olvare i au re*ultat astfel

    urmatoarele sisteme alternative5 Decision Support S)ste$s, &'ecuti#e In(or$ationS)ste$s and 6anage$ent In(or$ation S)ste$s.

    Acestea descarc( datele din sisteme surs( i rulea*( diverse pro/rame pentru a lereda !ntrun format utili*ail care s( permit( rularea de intero/(ri. 'a"oritatea acestorsisteme se a*ea*( pe ar%itecturi $ain(ra$ei sau ucurat de un succes limitat dinurmatoarele cau*e5

    Sistemele TP nu au fost concepute pentru a servi anali*ei de date #atele sunt diverse i complexe Accesul utili*atorului este complex i !n/reunea*a operaiile de business.

    3.3 Avanta"ele oferite de #ata $are%ouse !n telecomunicaiilemoile

    Sistemul de data warehousea"ut( operatorii nu numai s( fac( fa( presiunii la care

    Fig 7: 8rhitectura unui siste$ Data Warehouse

  • 7/24/2019 Tehnologii Dw

    24/63

    sunt supui dar mai mult s( o transforme !ntrun avanta" de business. 'a"oritatease/mentelor de businesssunt avanta"ate de construirea unui data warehouseastfel5

    *anta4e competiionale G cti/ reali*at prin campanii de mar=etin/promovarea de pac%ete de produse oferirea de preuri promoinale vn*area produselor

    pe se/mente de piaa ine determinate.In&ormaii cheie (n relaia cu clientulG cti/at( prin !nele/erea preferinelor

    clientului asupra unei /ame de produse printro aordare preventiv( cu privirea lasatisfacerea nevoilor clientului prin punerea accentului pe construirea i reinerea uneia*e de clieni valoroi.

    educerea riscurilor cti/at( prin prevederea tendinelor de evoluie a pieei.

    Cre+terea pro&itului G prin planuri tarifare optimi*area profitului preuriperformante respectarea unor re/uli privind raportul cost discount

    5&iciena or!anizaional' G cti/at( prin reali*area de aliane profitailemeninrerea unei structuri or/ani*atorice optime recompensarea loialitat(ii i aaducerea de profit mare.

    Avanta"e asupra concurenei pot fi oinute prin folosirea infirmaiilor reinute !ndata warehouse pentru a de*volta strate/ii coerente care s( permit( peratorului s(r(spund( la presiuniea /enerat( de competitori la nevoia de a m(ri ritmul de de*voltareal activit(ilor de mar=etin/ /loali*are i inovaie !n materie de produse.

    Pentru a oine avanta"e de business din aceast( situaie sistemul de datawarehouse

    poate fi folosit !n scopul consolid(rii datelor despre5 Tendinele de businesspe anumite perioade Tipuri de produse cerute i diverse oportunit(i 9argeturi de activitate i performan( portunit(i de vn*are de produse pe anumite se/mente de pia( Fmp(rirea pieei pe anumite tipuri de clieni Performaele canalelor de distriuie 7vn*are de produse i servicii8 Procesul de tarifare

    r/ani*area informaiilor dup( aceste criterii a"ut( la oinerea de avanta"e prinidentificarea oportunit(ilor pentru5

    Campanii de $aretingcu o int( ine determinat( Personali*area produselor Structurarea produselor !n pac%ete 0rm(rirea performaelor Evoluia vn*(rilor #etectarea canalelor de distriuie ineficiente ferirea de preuri promoionale Crearea de aliane competitive

  • 7/24/2019 Tehnologii Dw

    25/63

    Previ*iuni !n le/atur( cu evoluia pieei Emiterea de previ*iuni pentru cti/uri costuri i stailirea unor strate/ii.

  • 7/24/2019 Tehnologii Dw

    26/63

    & Consideraii de desi/n

    Fn domeniul a*elor de date de tip Data Warehouse exist( dou( paradi/merecunoscute.

    aradi!ma lui %ill Inmon6Data warehouseeste parte a unui sistem de suportdeci*ional inte/rat. companie poate avea un data warehousei data $art-urile!i iau informaii din data warehouse. Informaiile stocate !n data warehousesunt!n a treia form( normal(.

    aradi!ma lui alph 7imball6Data warehouseeste un con/lomerat al tuturordata $art-urilor din companie. 'odelul informaional este !ntotdeauna unuldimensional denormali*at.

    Cele dou( paradi/me repre*int( filo*ofii diferite i niciuna din aceste doua idei nupoate fi considerat( corect( sau /reit(. Fn realitate ma"oritatea companiilor folosesc

    sisteme data warehousemai apropiate de ideea lui Balp% Qimall. posiil( explicaie aacestui fapt este c( sistemele data warehouseapar ca un efort al unui departament deci!i au ori/inea !ntrun data $art.Pe m(sur( ce evoluea*( i mai multe data $art-urisuntde*voltate acestea compun de fapt sistemul data warehouse.

    Fn aplicaia ce face oiectul acestei lucr(ri am folosit modelul dimensional. Cutoate acestea pentru a "ustifica ale/erea !n continuare vom pre*enta caracteristicile demodelare ale fiecarei din cele doua idei.

    &.1 'odelarea relaional(. )a*e de date normali*ateecesitatea normali*(rii datelor.Anomalii i forme normale !n a*ele de date

    Fn teoria a*elor de date formele normale sunt un criteriu ce determin( /radul devulnerailitate al unei structuri de a*e de date la inconsistene i anomalii. Hormelenormale se aplic( individual fiecarei taele.

    Anomaliile de inserare modificare i ter/ere sunt situaii care ar putea duce lapierderea inte/rit(ii. Anomaliile au fost identificate i formali*ate de E.H. Codd

    !mpreun( cu primele trei forme normale care au rolul de a a evita circumstanele !n careau loc anomalii.

    nomalia de modi&icareEste un fenomen ce poate s( apar( la repre*entarea aceleiai informaii pe mai

    multe rnduri. 0n updatepe o astfel de tael( poate duce la inconsistene lo/ice. Spreexemplu o tael( !n care avem cmpurile re/iune "ude i localitate pe care dorim s( omodific(m !n sensul sc%im(rii apartenenei unui "ude la o re/iune necesit( modificarea

  • 7/24/2019 Tehnologii Dw

    27/63

    mai multor rnduri. #ac( operaiunea de modificare nu este reali*at( cu succes adic(modificarea este f(cut( asupra unor rnduri dar nu asupra tuturor atunci datele din tael(devin inconsistente i practic inutili*aile.

  • 7/24/2019 Tehnologii Dw

    28/63

    Fnainte de updateid Regiune Judet Localitate

    1 Dobrogea

    Tulcea Localitate 1

    2 Dobrogea

    Tulcea Localitate 2

    3 Dobrogea

    Tulcea Localitate 3

    4 Moldova Galati Localitate 4

    5 Moldova Galati Localitate 5

    6 Moldova Galati Localitate 6

    Presupunem c( "udeul +alai trece !n re/iunea #oro/ea !ns( modificarea nu se!nc%ie cu succes.

    id Regiune Judet Localitate

    1 Dobrogea

    Tulcea Localitate 1

    2 Dobrogea

    Tulcea Localitate 2

    3 Dobrogea

    Tulcea Localitate 3

    4 Dobrogea

    Galati Localitate 4

    5 Dobrogea

    Galati Localitate 5

    6 Moldova Galati Localitate 6

    nomalia de inserarePot exista ca*uri !n care anumite fapte nu pot fi urm(rite deoarece nu exist(

    informaia necesar( la un moment dat. #ei o parte din date sunt disponiile informaia

    complet( nu poate fi inserat( !n a*(.

    nomalia de +ter!ereFn anumite circumstane ster/erea unor date poate atra/e dup( sine ster/erea altor

    date din arii complet diferite a caror ster/ere nu o dorim.

    rima &orm' normal' 71H8O tabel este n pri$a (or$ nor$l daca tabela repre;int cu (idelitate o rela%ie

    si nu con%ine grupuri repetiti#e.Aceast( definiie se presupune urm(toarele5 rndurile nu sunt supuse niciunei relaii de ordonare6 coloanele nu sunt ordonate6

    nu exst( rnduri duplicate6 intersecia unui rnd cu o coloan( conine exact o sin/ur( valoare din

    domeniul dat nu exist( coloane ascunse 7rowid, ti$esta$p-uriascunse8

    Haptul c( taela nu conine /rupuri repetitive face inadmisiile pentru primaform( normal( structuri de tipul urm(tor5

  • 7/24/2019 Tehnologii Dw

    29/63

  • 7/24/2019 Tehnologii Dw

    30/63

    +rupuri repetitive !ntro coloan(Customer Id

    Nume Numar de telefo

    1 !aul "2154#$445% "25#$$5&45

    2 George "2154$5&45

    +rupuri repetitive dea lun/ul coloanelorCustomer Id

    Nume Numar de telefo1

    Numar de telefo2

    Numar de telefo3

    1 !aul "25#$$5&45 "2154#$445

    2 George "2154$5&45

    #efiniia primei forme normale !n varianta ori/inal( a lui E.H Codd pentru a facereferire la atomicitate. >alorile domeniului pe care fiecare relaie este definit( treuie s(fie atomice adic( s( nu poat( fi imp(rite de S+)# !n p(ri mai mici.

    doua &orm' normal' 82-9: tael( avnd forma normal( 1 este !n form( normal( 2 dac( i numai dac( nuinclude dependene partiale6 adic( niciun atriut nu este dependent doar de o poriune dinc%eia primar(. #e remarcat faptul c( o tael( !n prima form( normal( ce nu are nicioc%eie candidat compo*it( este automat i !n a doua form( normal(.

    A doua form( normal( face inadmisiil( structura urm(toare structur( !n carec%eia primar( este cominatia id oferta G id plan tarifar6 planul tarifar determin(discountul iar oferta pretul.

    idoferta

    id 'latarifar

    ume oferta ume 'latarifar

    discout 'ret

    1 1 (boamet cu miute icluse )out* 2" 1""

    1 2 (boamet cu miute icluse +ee,ed 15 1""

    1 3 (boamet cu miute icluse seara 1" 1""

    treia &orm' normal' 83-9: tael( avand forma normal( 2 este !m form( normal( 3 daca i numai daca nu

    conine dependete tran*itive. Cu alte cuvinte orice atriut depinde numai de c%eiaprimar(.

    A treia form( normal( face inadmisiil( structura urm(toare structur( !n care

    "udeul determin( re/iunea iar localitatea determin( "udeul.id Regiune Judet Localitate

    1 Dobrogea Tulcea Localitate 1

    6 Moldova Galati Localitate 6

    9orma normal' %o;ceCodd 8%C-9:este apropiat( de forma normal( 3 dareste mai restrictiv( dect aceasta. tael( se afl( forma normal( )CH dac( fiecare

  • 7/24/2019 Tehnologii Dw

    31/63

    determinant din taela este o c%eie candidat 7 un determinant este orice atriut a c(reivaloare determina alte valori din tupla8. Ca*urile !n care o tael( !n a treia form( normal(nu sunt i !n forma normal( )o@ceCodd sunt foarte rare.

  • 7/24/2019 Tehnologii Dw

    32/63

    patra &orm' normal' 8-9: taela !n form( normal( trei se afl( !n a patra form( normal( dac( i numai

    dac( nu are seturi multiple de dependene ale atriutelor de tip multivaloare

    cincea &orm' normal' 8"-9:, cunoscut( i su numele de Horma ormal(Pro"ectRoin 7PROH8 are rolul de a minimi*a redundana datelor !n cadrul a*elor de daterelaionale. Aceasta minimi*are se produce prin !nre/istrarea faptelor multi valoare ii*olarea relaiilor multiple asociate semantic. taela este !n form( normal( cinci dac( inumai dac( fiecare asociere este implicat( de c%eia primar( sau o c%eie candidat.

    9orma normal' Domeniu Cheie 8D7-9:Acceast( nou( form( normal( este propus( de Bonald Ha/in cercet(tor al

    laoratoarelor I)' , presupune ca o tael( s( nu fie supus( altor constrn/eri dectconstrn/eri de c%eie. tael( este !n forma normala #QH dac( i numai dac( nu areanomalii de inserare i de ster/ere. Spre deoseire de formele normale precedentedefinite !n termeni tradiionali de dependene funcionale multivaloare aceast( form(norml( este definit( de conceptele mult mai simple de domeniu i c%eie !mpreun( cuconceptul /eneral de constrn/ere. #ac( o tael( este !n forma normal( #QH atunci eaaparine i precedentelor forme normale.

    definiie intuitiv( a acestei forme normale spune c( o tael( este !n form(normal( #QH dac( orice constrn/ere poate fi definit( prin simpla cunoatere amulimii numelor atriutelor i a domeniilor pe care acestea sunt a*ate.

    Aceast( nou( teorie redefinete anomaliile de inserare i de ter/ere 7anomaliidefinite anterior de Codd8. Fn noua accepiune o anomalie de inserare presupune ca

    inserarea aparent le/al( a unei sin/ure tuple s( cau*e*e !nc(lcarea unei constrn/eri ataelei. Fn mod asem(n(tor o anomalie de ter/ere !nseamn( ster/erea unei sin/ure tupledintro serie valid( ce duce la !nc(lcarea unei constrn/eri.

    +asea &orm' nomal' 8$-9:extinde teoria normali*(rii a*elor de date pentru alua !n considerare i dimensiunea temporal(.

    'odelul ful/ de *(pad(

    'odelul ful/ de *(pad( pornete de la un model stea !n care !ns( dimensiunile

    sunt normali*are. Procesul de normali*are a dimensiunilor este cunoscut su numele desnow(lae-ing deoarece produce !n model o serie de micro stele !n "urul unei dimensiuni.

    'odelul ful/ de *(pad( estere*ultatul descompunerii unei dimensiuni sau a maimultor dimensiuni care au ierar%ii. Belaiile de tip 7'518 !ntre memrii unei dimensiunise descompun !n taele separate formnd o ierar%ie de taele.

    #iferena eseniala fa( de sc%ema stea este c( dimensiunile sunt normali*ate.

  • 7/24/2019 Tehnologii Dw

    33/63

    Principala motivaie a normali*(rii este spaiul de stocare i evitarea anomaliilor deinserare. #ac( ierar%iile se p(strea*( !n taele separate se consider( c( spaiul de stocarese reduce consistent. Totui eforturile de a normali*a taelele din a*ele de datedimensionale !n scopul de a reduce spatiul de stocare sunt /reoaie i consumatoare detimp. ormali*area dimensiunilor reduce cu mai putin de 1< spaiul total de stocare iar

    vi*uali*area datelor este mai dificil( implicnd un numar mai mare de "onciuni !ntretaele. ormali*area se dovedete cu att mai inutil( !n contextul !n care dimesiunile nusunt structuri de date care s( se modifice frecvent.

    &.2 'odelarea dimensional(. )a*e de date demormali*ate

    ecesitatea model(rii dimensionale'otivele pentru care modelarea dimensional( a datelor este de preferat model(rii

    relaionale !n ca*ul sistemelor data warehouseprovin din !ns(i natura operaiunilorproceselor de afaceri i a modului !n care utili*atorii percep procesele de afaceri.

    serie dintre aceste motive pot fi5 Anali*a proceselor de afaceri se reali*ea*( !n termeni dimensionali. Spre

    Fig 1

  • 7/24/2019 Tehnologii Dw

    34/63

    exemplu analitii pot formula o cerin( prin care doresc s( afle ce venit a /enerat noulprodus de la lun( la lun( !n re/iunea de sud dup( caracteristicile demo/rafice aleutili*atorilor. Aceast( formulare se traduce !n anali*a unei variaile a venuturilordup( dimensiuni /eo/rafice i demo/rafice.

    Aplicaiile de raportare necesit( o modelare dimensional( i au numeroase

    eneficii dac( un astfel de model este folosit. 0tili*atorii /ndesc dimensional #atele sunt !nc(rcate dintro a*( !n care aceeai tael( dimensiune poate fi

    folosit( !n diferite contexte. Accesul la date se reali*ea*a mai rapid. Timpul de procesare a

    intero/(rilor scade deoarece modelul dimensional reduce numarul de le/(turi !ntretaele.

    Componentele modelului multidimensional

    Taela Hact 7colecie de fapte8Taela(actocup( locul central !ntro sc%em( stea i corespunde unei colecii de

    fapte din modelul dimensional. Termenul(act desemnea*( de fapt o variail( a procesuluide afaceri. S( consider(m exemplul unei taele fact pentru vn*area unui serviciu. >omurm(ri fiecare vn*are din fiecare ma/a*in !n fiecare *i. Acesetea se traduc prinm(suratori la intersecia tuturor dimensiunilor 7*i produs ma/a*in8. ista de dimensiuni!n funcie de care se face m(suratoarea defiente /ranularitatea. unitate a /ranularit(iieste atomic( i aparea !n taela fact ca un sin/ur rnd.

    Caracteristicile taelei(act5

    Conine un num(r foarte mare de rnduri 7posiil milioane8. um(rulmaxim de rnduri din tael( repre*int( de fapt produsul carte*ian al dimensiunilor. #eexemplu se dorete anali*a activit(ii de desfacere a unei firme de comunicaii moilecare are un lan de ,;; de repre*entante !n !ntrea/a ar( si care contractea*( 1;; deconect(ri !n fiecare ma/a*in. )a*a de date dimensional( va stoca informaiile referitoarela tran*aciile *ilnice pe o perioad( de doi ani. Taela de fapte va conine,;;U1;;U2U3-, de rnduri.

    #imensiunea taelei fact este !n continu( cretere !n funcie de cantitateade date !ncarcate la fiecare ciclu de !nc(rcare a datelor precum i !n funcie de cantitateade date istorice stocate !n a*a de date .

    Este taela care reflect( re*ultatul activit(ii anali*ate. Conine toi

    indicatorii de performan( importani 7!n sc%ema stea sunt de re/ul( atriute numericeaditive8. C%eia primar( a taelei este o c%eie compus( format( din c%eile primare

    ale taelelor dimensionale. Fntre taela fact i c%eia compus( format( din c%eile primareale dimensiunilor exista o dul( implicaie5 fiecare tael( (actare o c%eie compus( ifiecare c%eie compusa este o tael( de(act.

    Taela(act este o tael( normali*at( ce reali*ea*( o le/atur( indirect(!ntre taelele dimensiune.

  • 7/24/2019 Tehnologii Dw

    35/63

    #imensiunile

    #imensiunile sunt taele care printro asociere cu o taela (act furni*ea*(informaii descriptive despre fiecare m(rime m(surat( de taela(act. #imensiunile conin

    !n /eneral date statice5 datele nu se sc%im( sau care se sc%im( rar. Spre exemplu odimensiune /eo/rafic( va conine cte un rnd pentru fiecare localitate cu atriuteprecum "udet re/iune de interes i ar(. #esi/ur nu ne atept(m ca "udeul din care olocalitate face parte s( se modifice. Cu toate acestea or/ani*aia !i poate redefini periodic/ruparea "udeelor pe re/iuni.

    'odelul dimensional treuie s( permit( modificarea dimensiunilor. +estionareamodific(rilor se poate implementa cu p(strarea istoricului sau cu rescrierea complet( adatelor. P(strarea istoricului dimensiunilor se poate reali*a prin introducerea unui cmpde versionare. #ac( o modificare apare rndurile afectate sunt marcate cu ; !n cmpul deversionare i noi rnduri sunt introduse avnd versiunea 1 pentru a reali*a modificarea.

    alt( metod( de p(strare a istoricului dimensiunilor este de a ad(u/a dou(atriute suplimentare fiec(rei !nre/istr(ri5 #alabil=de=la #alabil=p>n=la care s(marc%e*e data de la care !nre/istrarea nu mai este valail( i data de la care noua!nre/istrare este valail(.

    Fntrun hipercub o dimensiune este repre*entat( printro ax(. #e oiceidimensiunile conin un num(r mare de atriute ce cresc felxiilitatea sc%emei i permitun mod variat de anali*(. #e exemplu dimensiunea ferta poate s( conin( urm(toareleatriute dimensionale5 tipul ofertei num(rul de minute incluse num(rul de S'Surivaloarea !n euro valoarea !n dolari descrierea ofertei etc.

    Fntro sc%em( stea sunt taelele care se dispun radial !n "urul taelei de fapte i semai numesc taele dimensionale. Aceste taele sunt denormali*ate iar c%eia lor primaraeste o c%eie suro/at sau o cominaie de atriute.

    Conceptul de dimensiune este fundamental pentru modelarea multidimensional(.Cei mai multi proiectani utili*ea*( fra*a Ndimensiuni comune afacerilorD. #e exempluun model multidimensional treuie s( includ( timpul ca dimensiune fundamental(. Celemai multe instrumente de anali*( multidimensional( implementea*( facilitatea de apermite conversii de calendar i operaii de a/re/are 7 *i V saptamn( V lun( V an 8automate i c%iar manipularea cu usurin( a seriilor de timp 7 perioade promoionale

    se*oane perioade fiscale etc.8 Alte dimensiuni des !ntlnite !n domenii variate de afacerisunt5 locaia or/ani*aia 7ierar%ia or/ani*aional(8 clientul.

    dimensiune conine mai muli memri. 0n memru este un nume distinct sauun identificator folosit pentru a determina po*itia unui element de data 7!n sc%ema steaapare su denumirea de atriut dimensional8. #e exemplu toate lunile trimestrele i aniiformea*( dimensiunea Timp i toate oraele re/iunile i (rile dimensiunea ocaie.

    Ierar%iile

  • 7/24/2019 Tehnologii Dw

    36/63

    Ierar%iile sunt structuri !n interiorul c(rora exista o le/atur( de suordonare !ntredimensiuni apartinnd aceleiai axe dimensionale. Putem voi de ierar%ii de timp ierar%iide canale de distriuie etc.

    'emrii unei dimensiuni se pot or/ani*a !n una sau mai multe ierar%ii. Hiecare

    ierar%ie poate avea mai multe nivele ierar%ice. 0n memru poate apartine la una sau maimulte ierar%ii sau poate s! nu fie inclus !ntro ierar%ie 7independent8. #e exemplu !ndimensiunea fert( memrul descriere promotional( nu este inclus !n nici o ierar%ie.

    S( consider(m spre exemplu dimensiunea Timp !n care putem avea o ierar%ie !nfuncie de structura anului calendaristic i o ierar%ie !n funcie de structura anului fiscal.'ai mult deoarece o s(pt(mn( nu aparine cu certitunie unei sin/ure luni putemimplementa i o a treia ierar%ie !n care s(pt(mna se suordonea*( trimestrului sau directanului. Pentru a identifica po*iia unui memru !ntro dimensiune se folosesc conceptelede !nalime i adncime !n ierar%ie. Fnalimea se stailete de "os !n sus. #in acest motivnivelul 7;8 al ierar%iei repre*int( nodurile frun*( ale ierar%iei 7!naltimea cea mai mic(8.

    Fn sc%ema stea nivelul ; se lea/( la taela fact.

  • 7/24/2019 Tehnologii Dw

    37/63

    Adncimea !n ierar%ie este stailit( de sus !n "os. Exista posiilitatea ca doimemri care au aceeai !naltime s( aia adncimi diferite i invers. Acestea sunt structuriarorescente neec%ilirate. Structurile arorescente neec%ilirate sunt implementate cusucces !n a*ele de date dimensionale spre deoseire de a*ele de date relationale care nuofer( structurile necesare pentru implementare.

    Fig 11: Ierarhie de ti$p la ni#el de lun

  • 7/24/2019 Tehnologii Dw

    38/63

    Fig 1!: Ierarhie de ti$p la ni#el de spt$>n

  • 7/24/2019 Tehnologii Dw

    39/63

    '(rimile'(rimile sunt atriute numerice al unui element din (act un indicator de

    performan( prin care se poate anali*a activitatea modelat(. >alorile unui indicator semodific( continuu. Pentru fiecare cominaie posiil( !ntre dimensiuni exist( o valoarecorespun*(toare a m(rimii.

    u orice atriut numeric este un indicator. #e exemplu costul pl(tit de clientpentru o ofert( este un atriut numeric 7valoarea ofertei8 i totui nu este un indicator ciun atriut al ofertei deci o dimensiune. #ac( valoarea atriutului numeric varia*(continuu 7costul de livrare cantitatea vndut( volumul vn*arilor8 atunci atriutul esteun indicator iar dac( atriutul este perceput mai mult ca o constant( sau o !nsuire a uneialte dimensiuni atunci este un atriut dimensional.

    Indicatorii pot fi indicatori de a*a 7volumul vn*arilor cantitatea vndut(costurile num(rul de clienti8 sau indicatori derivai care se oin prin cominareaindicatorilor de a*( 7profitul8. Fn funcie de funcia de a/re/are folosit( pentru calculul

    m(rimilor acestea se clasific( astfel5#'rimi distributi*e calculate cu funcii distriutive de a/re/are precumcount78 sum78 min78. Calculul m(rimii pentru un suseturi ale datelor poate fi!nsumat i va returna acelai re*ultat ca i !n ca*ul calculului pentru !ntre/ul set dedate. Aceste m(rimi poart( i numele de m(rimi aditive deoarece totalul se oineprin !nsumare. m(rime aditiv( se poate !nsuma dup( toate dimensiunile. #eexemplu indicatorul volumul vn*(rilor se poate calcula pentru o cate/orie deoferte sau pentru o anumit( re/iune sau pentru a anumit( perioad( de timp.>olumul vn*(rilor cantitatea vndut( i costurile sunt aditive. Aceasta !nseamn(c( are sens de a aduna euro sau cantit(i dea lun/ul oric(rei cominaii timpprodus ma/a*in.

    #'rimi al!ebrice calculate folosind funcii al/erice de a/re/are. funcie dea/re/are este al/eric( dac( poate fi calculat( ca o funcie al/eric( de funciidistriutive. 0n astfel de exemplu este funcia medie av/78 care poate fi calculat(ca sum78Ocount78. Alte funcii al/erice sunt procenta"5 percenta/e78 deviaiastandard.

    #'rimi holistice calculate folosind funcii %olistice de a/re/are. Exemple deastfel de funcii sunt mediana5 $edian78 moda5 $ode78 num(rul distinct5 count?distinct78 8. Aceste funcii au !n comun faptul c( depind !n mod intrinsec de setulde date pe care sunt calculate

    Sc%ema stea

    Este o repre*entare intuitiv( a cuului multidimensional de date !ntrun mediurelaional. Sc%ema stea conine o tael( central( i un set de taele dimensionale aran"ate!ntro manier( radial( !n "urul taelei centrale. Hiecare tael( dimensional( repre*int( odimensiune a activit(ii anali*ate !n timp ce taela central( conine elementele cuului dedate.

  • 7/24/2019 Tehnologii Dw

    40/63

    Sc%ema este asimetric(. Exist( o taela dominant( !n centrul sc%emei sin/urataela din sc%ema cu multiple le/(turi prin care se conectea*( la celelalte taele. Aceast(tael( se numete taela(act. Celelalte taele au numai o sin/ur( "onciune prin care selea/( la taela central( i se numesc taele dimensionale sau dimensiuni. Sc%ema stea

    reduce num(rul de le/(turi !ntre taele i astfel simplific( planul de execuie alintero/(rilor. Acestea sunt "onciuni de e/alitate. Totui denormali*area determin(duplicarea datelor i o nevoie mai mare de capacitate de stocare. Compromisul capacitatede stocare contra putere de procesare dinamic( este unul acceptail !n condiiile !n carememoria este o resurs( mult mai ieftin( dect capacitatea de procesare.

  • 7/24/2019 Tehnologii Dw

    41/63

    colecie de modele stea ce au dimensiuni !n comun alc(tuiesc modelul stea

    extins(

    Fig 1: 6odelul Stea

    Fig1: 6odelul Stea e'tins

  • 7/24/2019 Tehnologii Dw

    42/63

    Conclu*ii

    #ac( am reali*a o comparaie !ntre modelul relaional i modelul dimensionalBelaia care se evidentia*( !ntre cele doua este ca modelul relaional corespunde unui set

    de modele dimensionale i o sin/ur( dia/ram( entitaterelaie 7la nivel de or/ani*atie8corespunde unei mulimi de dia/rame dimensionale. 'odelul re*ultat pentru ocorporaie va consta din aproximativ 1;2, de sc%eme stea. Hiecare sc%em( stea are deoicei &12 taele de dimensiuni.

    'odelul dimensional pre*int( o serie de avanta"e fa( de modelul relaional5 sc%ema stea se pretea*( modific(rilor neateptate ale cerinelor

    utili*atorilor. Toate dimensiunile pot fi /ndite ca puncte de intrare e/al simetrice !ntaela de fapte. Proiectarea lo/ic( este independent( de tipurile de intero/(ri.Strate/iile de intero/are sunt simetrice i codul SLul /enerat pentru modelulmultidimensional este simetric

    sc%ema stea reduce num(rul de le/(turi i permite o administrare uoar(6 modelul dimensional este extensiil. Se pot ad(u/a noi taele (act noi

    dimensiuni noi atriute !n cadrul unei dimensiuni. Acest( extindere se poate reali*af(r( a afecta aplicaia.

    &.3 +ranularitatea

    Acest aspect al desi/nului influentea*( !ntrea/a ar%itectur( a data warehouse-ului.+ranularitatea se refer( la nivelul de detaliu sau de sumari*are a unit(iolor

    informaionale. Cu ct se dorete un nivel de detaliu mai mare cu att /ranularitateascade. Cu ct nivelul de detaliu este mai redus cu att /ranularitatea este mai mare.

    Spre exemplu efectuarea unui apel poate repre*enta cea mai mica unitate deinformaie i are cea mai mic( /ranularitate. um(rul sumari*at al apelurilor pentru o!ntrea/( lun( este un exemplu de mai mare /ranularitate.

    +ranularitatea are un impact direct asupra volumului de date ce treuie stocat inwarehousei deci i a timpului de r(spuns la intero/(ri. - data cu creterea comprim(riidatelor are loc sc(derea /ranularit(ii ceea ce se reflect( asupra necesarului de spaiu destocare 7mai puin spaiu de stocare necesat8 a vite*ei de prelucrare oinute 7vite*( de

    procesare mai mare8 precum i asupra flexiilit(ii Data Warehouse 7felxiilitate mairedus(8.

    Ale/erea nivelului de /ranularitate se va face innd cont de nivelul de detaliu decare este nevoie pentru a susine procesul deci*ional. #e cele mai multe ori desi/nerul vatreui s( reali*e*e un compromis !ntre cele doua5 /ranularitate mare detaliere sla( timpun de r(spuns sau /ranulariate mic( detaliere puternic( timp de r(spuns mai mare. Fnafar( de timpul de r(spuns treuiesc luate !n calcul si necesit(ile de stocare i processare

  • 7/24/2019 Tehnologii Dw

    43/63

    a unui volum mare de date. Se va opta pentru un nivel foarte detaliat numai dac( acestava aduce informaiile necesare.

    S( consideram urm(torul exemplu5 dorim s( !nre/istr(m toate operaiunile dealan( reali*are de clieniiprepaid7reali*area de re!nc(rc(ri primirea de onusuri plata

    de taxe8. #ac( am !nre/istra aceste date o a/re/are *ilnic( la nivel de client am aveanevoie de o !nre/istrarare pe *i pentru fiecare client. a un numar de 1;;; de clieni amavea pe an un maxim de aproximativ1;;; U 3; U 12 W 3-; ;;;. !nre/istr(ri care ar ocupa !n medie un spatiu de stocare deaproximativ 2 ;;; ;;; @tes. #ac( lu(m !n calcul faptul c( !n Bomnia principaliioperatori de telefonie moil( au un num(r de clieni de ordinul milioanelor nevoia decapacitate de stocare crete exponenial.

    Pe de alt( parte dac( am a/re/a datele lunar la nivel de client pentru un eantionde 1;;; de clieni am avea pe an un num(r de maxim 1;;; U 12 W 12 ;;; de !nre/istr(ripentru fiecare tip de micare. Ce se traduce !ntrun spaiu de stocare de aproximativ 2 &;;

    ;;; @tes. 'ai mult dac( scopul anali*ei nu este de a anali*a comportamentul clientilorputem folosi numai o a/re/are lunar( ce va re*ulta !n 12 !nre/istr(ri pe an pentru fiecaretran*acie sau o a/re/are *ilnic( ce va re*ulta !n aproximativ 3-, de !nre/istr(ri pe anpentru fiecare tran*acie.

  • 7/24/2019 Tehnologii Dw

    44/63

    &.& Partiionarea

    Partiionarea unui data warehousenu este !n niciun ca* o consideraie opional(.Prolema !n discuie este cum se va reali*a partiionarea i nu dac( se va partiiona.>olumul foarte mare de date din taelele fact sau din taelele de istoric sunt adev(rateprovoc(ri pentru administratori i desi/neri.

    Prolemele care pot ap(rea datorit( volumului mare de date si care pot fipre!ntampinate prin partiionare. sunt5

    performana sc(*ut( a intero/(rilor inserarea de volume mari de date ster/erea unor volume mari de date atunci cnd dorim ter/erea datelor

    prea vec%i

    Pe ln/( pre!ntampinarea unor proleme partiionarea aduce i o serie deenficii5

    Fmun(t(ire a performantei5 timpul de rulare al intero/arilor scade de la*eci de minute la secunde

    Timpul de disponiilitate al a*ei de date crete consierail5 accesul ladate se poate reali*a 2& de ore pe *i *ile pe s(ptamn(.

    Hacilitea*( mana/ementul a*ei de date deoarece este mult mai uor s(adminstre*i unit(i de date dect un volum nestructurat de date de dimensiuni foartemari.

    'ana/ementul ciclului de via( al informaieiprin utili*are eficient( dinpunct de vedere al costului a unit(ilor de stocare.

    Partiionarea se refer( la !mp(rirea datelor !n unit(i fi*ice separate care s( poatafi tratate independent. Ea este o funcionalitate a sistemului de /estiune a a*ei de date. un( partiionare a datelor poate aduce imun(t(iri ma"ore pentru timpul de accestimpul de !nc(rcare timpul de ar%ivare stocarea i monitori*area datelor.

    0na din functionalit(ile c%eie ale data 4are%ouseului este de a oferi accesflexiil la date. >olumul mare de date face ca aceasta functionalitate de a*a sa para /reude reali*at. #in acest motiv toate datele curente din data 4are%ouse vor fi partitionate.#atele sunt partitionate atunci cand date cu aceeasi structura sunt impartite in untati destocare fi*ica diferite. 'ai mult orice unitate de date apartine numai unei sin/ure partitii.

    #atele pot fi impartite dupa criterii variate cum ar fi5 dup( data dup( linia de produse dup( !mparirea /eo/rafic( dup( unitatea or/ani*ational( dup( toate criteriile de mai sus simultan

  • 7/24/2019 Tehnologii Dw

    45/63

    Putem identifica trei tipuri ma"ore de partiionare5artiionarea an!e. Poate fi folosit atunci cnd datele pot fi !mp(rite din punct

    de vedere lo/ic. 0n exemplu de range partitioningeste partitionarea dup( dat(.artiionarea E0ES'T?JDISTRIBUTE BY HASH(BALANCE_MOVEMENT_TYPE)INTO 4 PARTITIONS

    Ban/e ATEB TA)E #$.A++PBPBE>E0ES'T?J

  • 7/24/2019 Tehnologii Dw

    46/63

    PARTITION BY RANGE(AGG_DATE)(STARTING '1/1/2009'ENDING '12/31/2009'EVERY 1 MONTHS

    )

    &., IndexareaPrincipalul scop al unui index este de a a"uta sistemul de /estiune a a*ei de date

    s( locali*e*e mai usor rndurile stocate !n taele. #aca indexarea este facut( pe coloaneutili*ate frecvent performana operaiilor de acces la date este exponenial !mun(t(it(.'ai mult indecii permit o mai un( concuren( a tran*aciilor ce au nevoie s( accese*eacelai taele !n acelai timp.

    Cu toate acestea eneficiile indecilor vin cu preul unei uoare sc(deri a

    performanei pentru operaiile de inserti de update pentru ca fiecare operaie treuief(cut( att asupra taelei ct i asupra indexului asociat. Consider(m acest compromisenefic pentru un data 4are%ouse unde operaiile de acces la date sunt mult maifrecvente dect cele de insert sau update.

    Tipuri de indecsi

    Indecsi bitmap. Holosesc pentru stocare cmpuri de ii G denumite itmap.Pentru a r(spunde intero/(rilor reali*ea*( operaii lo/ice pe cmpurile de ii. Suntpotrivii pentru cmpuri care au un num(r mic de valori distincte. Indecii itmap auperformane ridicate dac( sunt aplicai taelelor pe care nu sunt frecvente operaiile deupdate.

    Spaiul ocupat !n memorie de indecii itmap este proporional cu cardinalitateacoloanei pe care sunt creai. #ac( domeniul are n valori deci cardinalitate n atunciindexul va avea neoie de n ii pentru fiecare intrare !n indexul itmap. Fn data4are%ouse sunt potrivii pentru a le/a taela fact de taele dimensiune adic( pentru ale/a o tael( de mari dimensiuni de una cu dimensiuni reduse.

    Indec+i de asociere 7join inde'es8. Spre deoseire de indecii tradiionali ceasocia*( o valoare dintro coloan( dat( unei liste de rnduri ce au acea valoare indecii"oin !nre/istrea*( rndurile ce pot fi asociate din doua relaii din a*a de date.Fnre/istr(rile indecilor "oin identific( tuplele care pot fi asociate. peraiile de asocieresunt mai costisitoare dect identificarea prin indeci "oin. Indecii "oin menin le/(tura

    dintre atriutele unei dimensiuni i rndul corespun*(tor !n taela fact.

    &.- Capcane !n modelarea datelor

    Fn modelarea datelor pot ap(rea situaii speciale cunoscute su numele decapcane. Acestea nu indic( neap(rat o prolem( dar sunt situaii care necesit( o ateniespecial(.

    Sunt cunoscute patru astfel de capcane5

  • 7/24/2019 Tehnologii Dw

    47/63

    1. Capcana pr(pastiei !ntre date 7en/. "has$ 9rap8 se refer( la relaiile '5'62. Capcana relaiilor tran*itive apare atunci cnd exist( mai mult de o cale

    !ntre dou( taele63. Capcana conexiunilor apare atunci cnd exist( o cale opional( !ntre

    entit(i diferite6

    &. Capcana ventilatorului 7en/. Fan 9rap8 apare la existena mai multorrelaii 15' ce provin din aceeai tael(.

  • 7/24/2019 Tehnologii Dw

    48/63

    Chasm Trap

    Ca*ul trivial al acestei capcane este o relaie de tipul '5' !ntre dou( taele.Aceast( relaie se traduce prin Nmai multor rnduri dintro tael( le corespund mai multernduri din alt( tael(D. #ei nu este o relaie incorect( atunci cnd elaor(m modelul cu

    o vedere de ansamlu vom descoperi c( aceast( structur( nu poate !nre/istra i meninedatele. Informaia cade !ntro pr(pastie !ntre cele dou( taele de date.

    Exemplul de mai sus ilustrea*( un ca* de chas$ trap!n care un furni*or poatefurni*a mai multe p(ri dar !n acelai timp aceeai parte poate veni de la diferii furni*ori.#ac( potenial fiecare furni*or poate furni*a fiecare parte apare prolema5 cum raporte*furni*orii care au adus anumite p(riM Fn mod tipic aceast( prolem( este re*olvat( cu otael( cu rolul unui pod, ce face trecerea de la o entitate la alta !nre/istrnd detaliilerelaiei.

    Ca*ulcapcanei chas$ cel mai adesea !ntlnitapare atunci cand dorim inteor/areaa trei taele !ntre care avem dou( asocieri 15' ce pornesc de la o sin/ur( tael( c(tre altedou( taele. Implicaia acestor relaii se traduce prin asena unei relaii !ntre cele dou(taele implicate !n relaiile 15'. Aceasta capcan( este cunoscut( i su numele decapcana relaiilor paralele.

    Fn fi/ura urm(toare avem ilustrat un exemplu5

    Fn acest exemplu am presupus ca avem dou( taele de tip (act una !n care aveminformaii despre minute la nivel de ofert( i de client i una !n care avem informaii

    despre veniturile aduse de clieni la nivel de ofert(. Hiecare din cele dou( taele (acteste!n relaie de 15' cu taela dimensiune !n care avem informaii despre oferte. #e oservatc( !ntre cele dou( taele(actnu exist( o le/atur( direct(.

    Aceasta ar%itectura nu ridica proleme dac( sunt intero/ate separat cele dou(taele(act. Prolema apare la intero/area simultan( a celor trei taele.

    S( presupunem ca !n taele avem urmatoarele date5

    Fig 12: "apcana "has$ ca;ul I

    Fig 13: "apcana "has$ ca;ul II

  • 7/24/2019 Tehnologii Dw

    49/63

  • 7/24/2019 Tehnologii Dw

    50/63

    Taela offerdim

    Taela minutesfct

    Taela revenuefct

    S!"# A$%&_*#+, -&(B$##+!_.%)* *_. A, .%-_"# B* A$*_.B$*_.G*& 56 A$%&_*#+7

    Be*ultatul !ntors este corect.

    S!"# A$%&_*#+, -&(C$##+!_&*)* *_. A, *8%&_"# C* A$*_.C$*_.G*& 56 A$%&_*#+7

    Be*ultatul !ntors este corect.

    #ac( utili*atorul dorete un raport !n care s( pre*inte att totalul minutelor ct i

    totalul anilor !ncasai sar atepta ca re*ultatul !ntors s( fie5 oferta * Y ,;; Y ,& !nsc%im re*ultatul !ntors de S+)# este oferta * Y 1,;; Y ,& care nu este un re*ultat corect.

    S!"# A$%&_*#+, -&(C$##+!_&*), -&(B$##+!_.%)* *_. A,.%-_"# B, *8%&_"# C* A$*_.B$*_. +% A$*_.C$*_.G*& 56 A$%&_*#+7

  • 7/24/2019 Tehnologii Dw

    51/63

    Acest comportament se datorea*( faptului c( !ntre cele dou( taele (act7$inutes=(ct Ci re#enue=(ct8 nu exista o le/(tur( direct( i exista diferen( de /ranularitate7$inutes=(ct este la ni#el de detaliu $ai $are decat re#eneue=(c t8 i fiecare rnd dinre#enue=(ct sa multiplicat pentru fiecare rnd din $inutes=(ct avnd loc un produscarte*ian.

    Pentru a re*olva aceast( prolem( putem folosi un proces ET 7e'tract trans(or$and load8 care s( multiplice fiecare rnd din taela re#enue=(ctpentru fiecare rnd din$inutes=(ct dar care s( !nlocuiasc( valoarea propri*is( cu o medie astfel5

    oferta * Y 1---- Y 2; Y 1oferta * Y 1---- Y 22 Y 2oferta * Y 1--- Y 12 Y 3

    Aceast( metod( nu aduce un plus de informaie i nu va contriui la procesuldeci*ional cu informaii noi !ns( evit( afiarea unor date incorecte.

    alt( metod( de evitare a acestei capcane f(r( a modifica datele din taele estede a reali*a dou( inteor/(ri separare i de a re*olva prolema din modul de afiare alsistemului de suport deci*ional.

    Capcana relaiilor tranziti*e

    Capcana de tran*itivitate apare la crearea unei ucle !ntre cel puin trei taele. Fnacest fel !ntre doua taele avem mai mult de o cale prin care taelele relaionea*(. Acesttip de capcan( !n/reunea*( intero/(rile i este posiil ca datele !ntoarse s( nu fie celecorecte deoarece nu este clar care sunt taelele care treuiesc incluse !n uer).

    modalitate de re*olvare a capcanei este de a crea un alias pentru una din taeleoinnd astfel o rupere a uclei !n doua seturi de doua relaii.

    'odalit(ile de re*olvare a uclelor difer( ca implementare de la o aplicaie laalta.SAP propune !n pac%etul de pro/rame deBusiness Objectso re*olvare prin crearea decontexte. Fn mod tipic un context este asociat unei taele de tip (act6 daca ucla include

  • 7/24/2019 Tehnologii Dw

    52/63

    doua taele de acest tip se vor crea dou( contexte. Fn fi/ura urm(toare se poate oservaun exemplu de re*olvare a capcanei de tran*itivitate cu a"utorul contextelor !n aplicaiaBusiness Objects.Cele dou( contexte sunt marcate !n culori diferite.

    #ac( !n ucla este implicat( o taela de tip dimensiune cu utili*(ri diferite se vacrea cte un alias pentru fiecare utili*are a taelei dimensiune. 0n exemplu de utili*arediferita a unei taele dimeniuni poate fi o dimensiune de timp pe care doresc s( o folosescpentru a oine caracteristicile datei de activare a unui client i !n acelai uer) s( ofolosesc pentru a oine detalii despre data unei re!nc(rc(ri.

    I)' prin aplicaia sa Co/nos : )usiness Intelli/ence propune re*olvarea acesteicapcane cu reali*are de scurt(turi ale taelelor care sunt implicate !n relaia tran*itiv(.Acestea funcionea*( ca aliai la aceeai tael(.

    Capcana coneiunilor

    Capcana conexiunilor apare !n situaia !n care !ntre dou( taele care au de"a oasociere !ntre ele mai exista !nca o le/atur(. #e cele mai multe ori acest( le/(tur( esteoptional( sau nu este evident(.

    S( presupunem c( !n taela dimensiune a canalelor de distriuie avem informaiidatate Accesul la aceste informaii se face !n mod normal !n momentul raport(rii datelordin taela(actcu detalii de timp i detalii despre canalele de distriuie. #ac( am dori

    !ns( s( vi*uali*(m o list( numai cu informaiile despre canalele de distriuie i datele dela care acestea sunt active sau datele la care au devenit inactive intero/area taelei(actarfi redundant(. Astfel !ntre dimensiunea de distriuie i dimensiunea de timp va exista oscurtatur( printZin "oin direct.

    #esi/ur scopul unui sistem de suport deci*ional nu este acela de a returna liste cide a returna rapoarte analitice din care s( se poat( extra/e uor informaia. Fn acestcontext le/atura direct( dintre cele dou( dimensiuni nu este evident(.

    Fig 14: "apcana relatiilor tran;iti#e

  • 7/24/2019 Tehnologii Dw

    53/63

    9an Trap

    Fan 9rap apare atunci cnd o tael( se lea/( printro relaie 15' de a alt( tael(care la rndul ei este le/at( de o alt( tael( tot printro relaie 15'. Be*ultatul uneiintero/(ri pe o astfel de structur( va !ntoarce re*ultate incorecte dac( toate cele trei taelesunt incluse !n intero/are.

    Pentru a explica fenomenul ce are loc !ntro astfel de capcan( vom anali*aum(torul exemplu5

    S( presupunem ca !n taele avem urmato(rele date5

    Taela customer

    Taela optfacturate

    Taela optline

    Fig 10: "apcana cone'iunilor

    Fig 17: "apcana Fan

  • 7/24/2019 Tehnologii Dw

    54/63

    Totalul anilor facturai pentru clientul Paul este returnat de intero/area5select A.cust_name, sum(B.pret_optiune) Total_facturatfrom customer A, opt_facturate Bwhere A.cust_i!B.cust_igroup "# A.cust_name$

    #ac( dorim !n sc%im s( afl(m totalul facturat dup( tipul serviciului oferitintero/area va multiplica datele din taela de facturare pentru fiecare rnd din taela cudetalii despre opiunile facturate.

    -!"# A$"&-#_%+, -&(B$*#_#.&%) T#+!_+"#&*+#, C$#.,-&(C$8+!+*) T#+!_-*8."..

    * "&-#* A, #_+"#&*+# B, #_!.% C* A$"&-#_.B$"&-#_. +% B$._+"#C$._+"#:*& 56 A$"&-#_%+, C$#.7

    Prolema poate fi re*olvat( prin crearea unui alias la taela care producemultiplicarea datelor. Aliasul i taela ori/inal( vor fi le/ate de o asociere 151.

    Be*olvarea capcanei (annu aduce informaie !n plus. Totalul facturat nu va fidisponiil pentru fiecare serviciu !n parte deoarece strctura taelelor nu permiteintero/area datelor pentru a afla aceast( informaie. #atele din sistemele surs( nuurm(resc aceast( informaie. Informaia poate c%iar s( nu existe pentru c( nu pre*int(interes. Cu toate acestea re*olvarea capcanei previne afiarea de date eronate.

  • 7/24/2019 Tehnologii Dw

    55/63

    , 'odelul de date

    Exista trei niveluri 3& la care se poate construi modelul de date51. nivelul conceptual 7high-le#el85 modelul entitate relaie7EB#entit)

    relationship diagra$*2. nivelul intermediar 7$idle#el85 modelul lo!ic7#IS GData Ite$ Set83. nivelul cel mai mic de detaliu 7low-le#el*5 modelul &izic

    Holosim acest( !mp(rire pe niveluri deoarece din multitudinea de concepteexistente !n prolematica reali*(rii modelului de date multe din concepte i terminolo/iipre*int( suprapuneri care pot fi confu*e. Celelalte modele de date 7ierar%ic retearelational orientat oiect relationaloiectual conceptual intern extern fi*ic etc.8existente pot fi !ncadrate pe unul din cele trei niveluri. Fmp(rirea pe aceste trei nivele afost pentru prima dat( pre*entat( i adoptat( de ASI !n 19,.

    Putem vedea cele trei niveluri ca pai ce sunt parcuri !n ordine de la anali*( c(tre

    implementare. Primul pas este crearea unor cerine de nivel !nalt asupra datelor acestaeste nivelul conceptual. 0rm(torul pas este modelul fi*ic folosit pentru a descrie sc%emaprecis( i platforma de a*e de date. 0ltimul este nivelul lo/ic folosit pentru a inte/ramodelul conceptual i cel fi*ic pentru a facilita comunicarea cu alte /rupuriOdepartamenteIT. #ei neam fi putut atepta ca nivelul lo/ic s( repre*inte al doilea pas utilitatea lui !iface necesar( crearea aia la sfritul de*volt(rii modelului fi*ic.

    0n important avanta" al modelarii pe trei niveluri este faptul c( ofer( treiperspective independente unul de cel(lalt. Te%nolo/ia de stocare 7storage* se poatesc%ima f(r( a afecta modelul lo/ic sau cel conceptual structura coloanelor taelelor sepoate sc%ima f(r( s( afecte*e modelul conceptual.

    ,.1 ivelul Conceptual

    ivelul conceptual !i are a*ele !n modelul entitate relaie propus de Peter C%en!n 19-. Acest model !ncorporea*( informie semantic( din lumea real(. Sunt unificatepentru prima dat( modelele reea relaional i entitatemulime anali*nd ami/uit(ilesemantice existente !n aceste modele.

    #odelul reteaeste o extindere a nivelului ierar%ic. )a*a de date este privit( ca un/raf orientat. A fost elaorat de C%arles )ac%man i pulicat !n 19-9 de C#ASJ

    NConference on #ata S@stem an/ua/esD. A fost adoptat i ca standard SI.

    #odelul relaionala fost propus !n 19-: de Ed/ar Hran= Codd i este a*at pelo/ica predicativ(. Privete a*a de date ca pe o colecie de variaile predicative peste undomeniu finit de astfel de variaile. >ariailele predicative exprim( constrn/erile de lanivelul a*ei de date. relaie este asociat( fiec(rei astfel de variaile.

    #odelul entitatemulimeeste a*at pe teoria mulimilor i privete datele ca pe

  • 7/24/2019 Tehnologii Dw

    56/63

    entit(i ce pot sau nu s( aparin( unei mulimi. Apartenena este exprimat( prin predicate.

    Consider(m cele trei modele ca fiind !nvec%ite deoarece noul model5 modelulentitate relaie a fost acceptat pe scar( lar/( i a devenit un standard de de*voltareeneficiind i de standarde de notaie foarte ine documentate 7I#EH1[0'8.

    #odelul entitate relaie este modelul cu cel mai !nalt /rad de astracti*are adatelor. Aceast( te%nic( de modelare presupune o aordare de sus !n "os 7 top-down85pornete de la delimtarea scopului modelului i a informailor pe care dorim s( le oinemdin a*a de date pn( la astracti*area termenillor definirea de entit(i i tratareamodurilor i ca*urilor !n care aceste entit(i pot relaiona. #in totalitatea de relaiiposiile !ntre entit(i se vor selecta numai cele care aduc un plus de valoare sau deinformaie modelului.

    entitate poate fi definit( ca un oiect care are o existen( independent( i carepoate fi identificat !n mod unic. Entitatea treuie s( aia un coninut de sine st(t(tor i o

    existen( determinat(. Entit(ile sunt u*ual identificate dup( caracteristica lor de arepre*enta un sustantiv. Exemple de entit(i !n ca*ul unui operator de telefonie moil(sunt5 Client perator Canal de distriuie ferta

    relaie descrie modul !n care entit(ile interacionea*( unele cu altele. relaiepoate fi considerat( i ca o asociere !ntre entit(i. Belaiile sunt percepute !n /eneral cavere ce aduc !n aceeai propo*iie doua sau mai multe entit(i. Spre exemplu dac( unoperator activea*( unul sau mai muli clieni putem spune ca !ntre entitatea Client ientitatea perator exist( relaia de activare.Be/ula minimal( aplicail( este NTot ceea ce este necesar se afl( aici i tot ceea ce se aflaaici este necesarD

    Cardinalitatea unei entit(i !n relaie cu o alt( entitate se refer( la num(rul de

    elemente din entitatea dreapt( respectiv stn/( care sunt puse !n coresponden( prinrelaia dat(. Aftel o cardinalitate 15' se traduce prin Nfiecare rnd din entitatea dreapt(are unul sau mai muli corespondeni !n entitatea stan/( i fiecare rnd din entitateastan/( are un sin/ur corespondent !n entitatea dreapt(. D

    Cele mai !ntlnite tipuri de relaii i cardinalit(i5

  • 7/24/2019 Tehnologii Dw

    57/63

    r. #ia/rama conceptual( Caracteristicile relaiei

    1.

    BelatiaEegtur Belatie opional( ;5;. persoan( poate ocupa un locde parcare dar nu avemnevoie de o persoan( pentru acrea un loc de parcare. Inacelasi timp nu avem nevoiede un loc de parcare pentru adefini o persoan(. #esi acestconcept este relativ simplu !na*a de date nu poate fiimplementat direct. Pentruimplementare am avea nevoieca una din entit(i s( fiedeclarat( entitate dominant(i s( folosim triggere sauprogra$e pentru a limitanum(rul de rndurirelaionate din cealalt( tael(.

    2.

    Belatia Sub tip Belaie 15; opional( !ntrosin/ur( parte. Indic( faptul c(o persoan( poate fi in/ineriar un in/iner cu si/uran(este o persoan(. Este facut(asumpia c( partea oli/atoriea relaiei este partea

    dominant(. a fel ca la relaiaanterioar( riggere sauprogra$e treuiesc folositepentru controlul a*ei dedate.

    3.

    Belatia Seg$ent (i;ic Belaie oli/atorie 151.persoan( poate un i numaiun A#. Acest A# apartinenumai acestei persoane.Aceasta relaie este dificil deimplementat deoarece

    inte/ritatea referentialadeclarativ( va fi prin !ncapcana Nul sau /(inaD.Acest tip de relaiedemonstrea*( necesitateadenormali*(rii. Fn mod curentvor fi implementate ca osin/ur( entitate.

  • 7/24/2019 Tehnologii Dw

    58/63

    r. #ia/rama conceptual( Caracteristicile relaiei

    &.

    Belaia5osesiune Belaie opional( ;5'.Caracteristici5 o persoan( poate avea

    unul sau mai multetelefoane6

    un telefon are cel multun posesor.

    Fn a*a de date seimplementea*( printrocoloan( c%eie str(in( !n taela9ele(on ce refer( taela5ersoana, c%eie care poateavea valoarea null.

    1.

    Belaia "opil Belaie oli/atorie 15'

    oli/atorie !n partea unitar(.Este cel mai comun tip derelaie. persoan( poate saunu s( fie menru dar poate s(fie memru de mai multe ori7spre exemplu dac( entitateamemru exprim( apartena lamai multe cluuri8. 0nmemru este cu si/uran( opersoan(. C%eia strain( !ntaela memru nu poate fi

    null.

    2.

    Belaia "aracteristic Belaie ;5' oli/atorie !npartea mulipl(. Caracteristici5

    o persoan( are celpuin un nume darpoate avea i maimulte

    un nume poate sau nus( fie asociat uneipersoane dar cusi/uran( exist( o

    persoan( cu acestnume.Fn a*a de date vom avea oc%eie str(in( !n taelau$e,c(tre taela 5ersoana Citriggere care vor fora caentitatea5ersoanas( ai( unnume.

  • 7/24/2019 Tehnologii Dw

    59/63

    r. #ia/rama conceptual( Caracteristicile relaiei

    1.

    Belaia5arado' Belaie 15' oli/atorie deamele p(ri. Asem(n(tor cuca*ul se/mentului fi*ic apareparadoxul Nul sau /(inaDdeoarece avem nevoie de opersoan( pentru a avea ocet(enie i de cet(eniepentru a defini o persoan(.

    2.

    Belaia8sociere Belaie '5' opional(.Conceptual se traduce prin5 opersoan( poate sau nu s(lucre*e pentru un an/a"atordat dar poate lucra pentrumai muli ali an/a"atori. 0n

    an/a"ator poate s( nu ai(an/a"ai sau poate avea mulian/a"ai. Cel mai adesea seimplementea*( cu o entitatede asociere auxiliar( pentru a!mp(ri relaia !n dou( relaiide tip ;5'. Aceasta entitateauxiliar( ar putea purtanumele 8ngajat deoarecelea/( persoana de an/a"atorulpentru care aceasta lucre*(.

    'odelul conceptual pentru o corporaie este un compo*it al mai multor vederi aleoamenilor provenind din diferite departamente ale corporaiei. #iferitele comunit(i alecorporaiei !i pot crea propria vedere conceptual(. Aceast( vedere !ns( este limitat( larelaiile i entit(ile v(*ute de respectivul departament. Colectarea tuturor acestor vederialc(tuiete !ntre/ul model conceptual.

  • 7/24/2019 Tehnologii Dw

    60/63

    Pentru a alc(tui dia/rama entitate relaie ce va repre*enta cerinele comunit(ii ceva folosi sistemul de suport deci*ional discuii de anali*( treuiesc reali*ate cu fiecare/rup pentru a cunoate fiecare din aceste vederi. #up( ce toate vederile sunt cunoscuteele vor fi inte/rate !n modelul entitate relatie al corporaiei. Hi/ura urm(toare pre*int(procesul prin care se construiete dia/rama entitate relaie pentru o corporaie. 7Hi/ 2;8

    ,.2 ivelul lo/ic

    ivelul lo/ic este pra/ul la care apar pentru prima dat( ideile IT !n cerinele dede*voltare a sistemului de suport deci*ional. Fn modelul conceptual au fost folositenumele cu care conceptele sunt folosite !n or/ani*aie acum este momentul !n care sede*volt( convenii de nume i alte standarde. Atriutele erau create f(r( consideraiiprivind infrastructura sau ar%itectura existent(. Fn modelul lo/ic sunt mai departe /rupatei aran"ate.

    'odelul lo/ic este folosit !n desi/nul a*elor de date ca pas intermediar !ntredesi/nul conceptual i cel fi*ic. El este intependent de sistemul de /estiune a a*ei dedate. a acest nivel avem structura taelelor i putem reali*a denormali*(ri. data

    modelul lo/ic creat avem structura taelelor c%ei straine i indeci.

    Spre exemplu indeciii nu sunt o cerin( !n fa*a iniial( de anali*( dar dac( sedovedete c( este nevoie de ei. pot fi creai !n etapa nivelului lo/ic. C%eile suro/ate suntadesea ad(u/ate !n aceast( etap( pentru a minimi*a complexitatea c%eilor str(ine. Fn celedin urm( modelul lo/ic va fi destul de aproape de cel fi*ic ca aspect.

    'odelul lo/ic foloseste termeni specifici modelului fi*ic5 coloane taele

  • 7/24/2019 Tehnologii Dw

    61/63

    indecii dar !nc( pre*int( datele la un nivel lipsit de detaliu. Fn cadrul or/ani*aieioamenii interesai de modelul lo/ic sunt cei ce anali*ea*( cerinele mana/erii de proiectde*voltatorii ar%itecii i inte/ratorii de date. #up( ce sturctura i conveniile sunta/reate se poate trece la reli*area modelului fi*ic.

    ,.3 ivelul fi*ic#odelul &iziceste construit pe a*a modelului lo/ic la care se adau/( c%ei

    caracteristici fi*ice i elementele de timp caracteristice pentru warehouse. a acest punctmodelul poate fi v(*ut ca o serie de taele relaionale. Am putea spune c( modelul este/ata s( fie transferat c(tre sistemul de /estiune a a*ei de date 7S+)#8 cu toate acesteadin model lipsesc caracteristicile de optimi*are a performanei. Consideraiile de desi/ncare treuiesc f(cute !n continuare !n ca*ul sistemelor data warehouse se refer( la/ranularitate i partiionare

    ivelul fi*ic este domeniul administratorului a*ei de date. Aici se aplic( asupra

    cerinelor i a datelor constrn/eri ale platformei cum ar fi limit(ri pentru lun/imeanumelui taelelor limit(ri de inte/ritate referenial(. a acest nivel sunt create taeletablespace-uri, triggere proceduri stocate partiii. Toate aceste sunt dependente desistemul de /estiune a a*ei de date.

  • 7/24/2019 Tehnologii Dw

    62/63

    ,.& Conclu*ie

    Cele trei nivele de modelare aduc valoare sistemului !nc( din fa*a de anali*(. Elesunt de un real a"utor dac( sunt folosite !mpreun(. a !nceput prin modelul conceptualsunt strnse cerinele i comunicate !napoi c(trestaeholderi !ntro form( high le#el,cuposiilitatea de a fi detaliate. Apoi nivelul lo/ic permite deprtamentului IT s( aplicestandarde i convenii f(r( a se lovi de limit(ri ale S+)#. Fn cele din urm( modelul fi*iceste folosit de #)A pentru a crea o sc%ema valid( f(r( un editor de text.

    un( modelare i un un pro/ram pentru crearea modelului a"ut( la stailireaunor standarde i la minimi*area efortului de de*voltare. Fn acelai timp !mun(t(ete icomunicarea reducnd posiilitatea de confu*ie.

  • 7/24/2019 Tehnologii Dw

    63/63

    - )ilio/rafie

    1. Peter PinS%an C%en KT%e Entit@Belations%ip 'odelTo4ard a 0nified >ie4 of#ataK 19- 'assac%usetts Institute of Tec%nolo/@ p12:.

    2. Peter PinS%an C%en KEntit@Belations%ip 'odelin/5?istorical Events HutureTrends and essons earnedK 2;;2 ouisiana State 0niversit@ p111.

    3. 'i=e ice4arner- @#ata 'odelin/ a@ers $%@ %ave Conceptual