Post on 07-Feb-2018
ACADEMIA DE STUDII ECONOMICE - COORDONATOR
COFACE ROMANIA CREDIT MANAGEMENT SERVICES S.R.L. - PARTENER
UN NOU MODEL DE EVALUARE A RISCULUI CORPORAȚIILOR: INSTRUMENT
ȘTIINȚIFIC PENTRU MANAGEMENTUL BAZAT PE CUNOȘTINȚE
Raport științific și tehnic
Etapa I
Echipa ASE 2014 Echipa COFACE 2014
Prof.dr. Monica Dudian, director Iancu Guda, coordonator
Prof.dr. Mihai Roman Forika Helga, membru
Prof.dr. Aurelia Stefănescu, membru Maruntelu Maria Nicoleta, membru
Conf.dr. Gabriel Bobeică, membru Neatu Nicolae-Adrian, membru
Conf.dr. Mihaela Hrisanta Mosora, membru Pascu Alexandra, membru
Lect.dr. Raluca Andreea Popa, membru Petcu Ioana-Sorina, membru
Lect.dr. Anca Paraschiv, membru Rotari Elena, membru
Stoicescu Alina-Raluca, membru
Decembrie, 2014
Programul: PN II
Tipul proiectului: PARTENERIATE ÎN DOMENII PRIORITARE
Cod proiect: PN-II-PT-PCCA-2013-4-0873
CUPRINS
ETAPA I. ANALIZA BAZELOR DE DATE DISPONIBILE ŞI CONSTRUIREA
EŞANTIOANELOR PE CARE SE FUNDAMENTEAZĂ ELABORAREA
MODELELOR DE RATING
A. Rezumatul etapei 2
B. Descrierea științifică și tehnică cu punerea în evidență a rezultatelor
etapei și gradul de realizare a obiectivelor
3
B.1. Cercetare industrială 3
I.1. Analiza bazelor de date disponibile 3
I.2. Generarea setului de date pentru sistemul de rating pentru IMM-uri
şi pentru corporaţii
4
I.3. Generarea setului de date pentru sistemul de rating cu variabile
macroeconomice
6
I.5. Studiu asupra tehnicilor predictive utilizate pentru construirea
funcțiilor scoring
9
I.6. Analiza univariată 14
B.2. Diseminarea rezultatelor cercetării 18
I.4. Diseminarea rezultatelor si raportare anuală. Schimburi de bune
practici cu universități din străinătate.
18
I.7. Diseminarea rezultatelor prin participarea la manifestații științifice
în domeniul economic
18
B.3. Rezultatele etapei și gradul de realizare a obiectivelor 19
Bibliografie 20
A. REZUMATUL ETAPEI
Obiectivul general al acestui proiect este să încorporeze informații macroeconomice și
sectoriale în procesul de evaluare a companiilor. Rezultatul esențial constă în realizarea a două
modele noi de rating pentru IMM-uri şi corporaţii, concepute ca instrumente ale unui sistem de
management bazat pe cunoştiinţe. Atingerea obiectivului general implică realizarea a trei obiective
specifice, sintetizate astfel: (i) determinarea probabilității de nerambursare pentru companiile din
România, (ii) determinarea unui indicator de macro-vulnerabilitate specific sectorului de activitate în
care aceste companii activează, ca parte integrantă a modelului de rating și (iii) realizarea unei
analize de tip cluster care să permită ordonarea intertemporală și intersectorială a companiilor.
Prima etapă a proiectului a urmărit în principal construirea bazelor de date relevante pentru
fundamentarea modelelor de rating și selectarea tehnicilor predictive. Principalele activități s-au
succedat astfel: (1) au fost inventariate bazele de date disponibile; (2) a fost generat setul de date
relevant pentru sistemul de rating pentru IMM-uri şi pentru corporaţii; (3) a fost generat setul de
date pentru sistemul de rating cu variabile macroeconomice; (4) au fost selectate tehnicile
predictive care vor fi utilizate pentru construirea funcțiilor scoring în cea de-a doua etapă a
proiectului și (5) s-a realizat analiza univariată. Etapa întâi a prevăzut în plus două tipuri de
activități din categoria diseminare: (1) participarea la manifestări științifice în domeniul
economic și (2) vizite de lucru și schimburi de bune practici cu universități din străinătate.
Analiza bazelor de date disponibile (activitatea I.1) a condus la concluzia ca cea mai
potrivită bază de date pentru realizarea proiectului, din perspectiva completitudinii, este cea a
partenerului Coface, dar vor fi utilizate și baze de date alternative pentru realizarea de studii
comparative și articole științifice. Pornind de la baza de date Coface, a fost generat setul de date
pentru sistemul de rating pentru IMM-uri şi pentru corporaţii (activitatea I.2) pe baza analizei
amănunțite a informațiilor financiare extinse și a celor calitative disponibile pentru toate
companiile pentru perioada 2010 - 2014; s-a constatat ca există cca. 18469 de companii cu date
pentru întreaga perioadă, dintre care 10784 cu informații complete. Baza de date relevantă
incluzând variabilele macroeconomice (activitatea I.3) conţine informaţii care permit
caracterizarea exhaustivă a mediului economic în care operează companiile nefinanciare, precum
şi evidenţierea unor caracteristici structurale ale mediului de afaceri. Variabilele au fost selectate
în funcţie de potenţialul acestora de a identifica poziţia economiei româneşti pe ciclul economic,
principalele influenţe externe, dar şi riscurile cu care se confruntă companiile. Pentru prognoza
funcţiei de distribuție a probabilităților de pierderi asociate portofoliului de credite care va fi
realizată anul viitor au fost selectate următoarele tehnici (activitatea I.5): regresia logistică,
regresia probit, regresia Tobit, arbori de clasificare, rețelele neuronale. Baza de date obținută prin
activitatea I.2. a fost utilizată în analiza determinării factorilor capacității de plata prin utilizarea
unor tehnici diferite (analiza univariată, activitatea I.6).
Diseminarea s-a realizat prin participarea la 4 manifestări știinșifice, dintre care trei
internaționale și două conferințe tip ISI Proceedings și prin publicarea a două articole științifice
în reviste indexate în cel puțin trei baze de date internaționale. Vizita de lucru a presupus un
schimb de experiență cu profesori de la ESSEC Business School Paris.
În concluzie au fost realizate toate activitățile menționate în planul de realizare al
proiectului, etapa întâi și au fost obținute toate rezultatele prevăzute în respectivul plan. Mai mult
decât atât, au fost depășite rezultatele prevăzute pentru diseminare, în condițiile în care au fost
publicate două articole BDI (unul singur era prevăzut) și au fost prezentate două lucrări la
conferințe ISI Proceedings (a fost planificată o singura prezentare).
I. 1. Analiza bazelor de date disponibile
În cadrul acestei activități au fost inventariate și analizate bazele de date disponibile, din
perspectiva completitudinii și relevanței pentru obiectivele specifice proiectului. Principalele
baze de date disponibile în cadrul acestui parteneriat sunt:
1. Baza de date disponibilă de la Oficiul Național al Registrului Comerțului
2. Eikon - Market Data
3. Baza de date privată a Coface Romania
Principalele baze de date utilizate pentru realizarea proiectului vor fi cea a Oficiului Național al
Registrului Comerțului și cea a Coface Romania.
I. 2. Generarea setului de date pentru sistemul de rating pentru IMM-uri şi pentru
corporaţii
In vederea generarii setului de date pentru sistemul de rating pentru IMM-uri si pentru
corporatii au fost incluse urmatoarele:
Tabelul 1. Variabile microeconomice
Nr.
Crt. Nume Frecvența
Prima
observatie
Ultima
observatie
1 Indicatorii de Lichiditate Anuala
1.1. Lichiditatea Curenta Anuala 2010 2014 sem II
1.2. Lichiditatea Imediata Anuala 2010 2014 sem II
1.3. Lichiditatea Numerar Anuala 2010 2014 sem II
1.4. Defensive Interval Ratio (D.I.R.) Anuala 2010 2014 sem II
1.5. Cash Coverage Ratio (C.C.R. ) Anuala 2010 2014 sem II
1.6. Cash Coverage Ratio recalculat-scenarii de stres Anuala 2010 2014 sem II
2 Indicatorii de Activitate & Finantare Anuala
2.1. Durata medie de incasare a creantelor Anuala 2010 2014 sem II
2.2. Durata medie de rotatie a stocurilor Anuala 2010 2014 sem II
2.3. Durata medie de rotatie a datoriilor pe termen scurt Anuala 2010 2014 sem II
2.4. Ciclul de conversie al banilor Anuala 2010 2014 sem II
3 Indicatorii de Profitabilitate Anuala
3.1. Rezultatul Net Anuala 2010 2014 sem II
3.2. Rezultatul Operational Anuala 2010 2014 sem II
3.3. Randamentul Capitalurilor Anuala 2010 2014 sem II
3.4. Randamentul Activelor Anuala 2010 2014 sem II
3.5. Randamentul Operational al Activelor Anuala 2010 2014 sem II
4 Indicatorii de Solvabilitate Anuala
4.1. Gradul de indatorare Anuala 2010 2014 sem II
4.2. Orizontul de finantare Anuala 2010 2014 sem II
4.3. % Active Imobilizate Corporale Anuala 2010 2014 sem II
4.4. Acoperirea Dobanzilor Anuala 2010 2014 sem II
5 Indicatorii privind calitatea Veniturilor |
Cheltuielilor Anuala
5.1. Ritm Capital Expenditure Anuala 2010 2014 sem II
5.2. Ritm Amortizare Anuala 2010 2014 sem II
5.3. Amortizare Anuala 2010 2014 sem II
5.4. Lichiditate v.s. Performanta Anuala 2010 2014 sem II
6 Mediul concurential Anuala
6.1. Cota de piata Anuala 2010 2014 sem II
6.2.
Dinamica cifrei de afaceri precum si cea a
rezultatului operational Anuala
2010 2014 sem II
6.3.
Raportul intre numarul companiilor care isi intrerup
activitatea v.s. numarul companiilor nou inregistrate Anuala
2010 2014 sem II
6.4.
Calibrul companiilor care si-au intrerupt activitatea,
in functie de cifra de afaceri inregistrata Anuala
2010 2014 sem II
6.5. Probabilitatea actiunilor antitrust Anuala 2010 2014 sem II
7 Informatii calitative
7.1. Incidente de plata Nu e cazul Nu e cazul Nu e cazul
7.2. Cereri de insolventa din partea partenerilor Nu e cazul Nu e cazul Nu e cazul
7.3. Importante tranzactii intragrup Nu e cazul Nu e cazul Nu e cazul
7.4.
Actionar persoana fizica implicat in alte companii
in ultimii ani Nu e cazul Nu e cazul
Nu e cazul
7.5.
Articole in presa care denigreaza imaginea
companiei Nu e cazul Nu e cazul
Nu e cazul
7.6. Practici frauduloase Nu e cazul Nu e cazul Nu e cazul
7.7.
Concentrare mare a vanzarilor creantelor in clienti
care comporta risc major Nu e cazul Nu e cazul
Nu e cazul
7.8. Companii infiintare recent Nu e cazul Nu e cazul Nu e cazul
I. 3. Descriere Baza de date relevantă cu variabile macroeconomice
Baza de date relevantă incluzând variabilele macroeconomice (BD-MACRO) a fost
construită prin prisma indicatorului de macro-vulnerabilitate care trebuie elaborat în etapa a
doua. BD-MACRO include: (1) preţuri (în sens larg, nu numai ale bunurilor de consum, ci şi ale
factorilor de producţie); (2) variabile ale sectorului real; (3) variabile ale sectorului financiar; (4)
variabile externe; (5) variabile din sondaj; (6) indicatori structurali.
BD-MACRO include variabile cu frecvenţă lunară, trimestrială şi anuală. Datele
disponibile cu frecvenţă lunară sunt îndeosebi indicatorii pe termen scurt asupra activităţii reale
(de ex. indicele producţiei industriale, volumul comerţului cu amănuntul, lucrările construcţii
etc.), asupra preţurilor (indicele preţurilor de consum, salariul mediu etc.), precum şi unii
indicatori de sondaj, cum ar fi ESI şi Consumer Sentiment Index. Datele cu frecvenţă trimestrială
sunt, în general, datele din Sistemul Conturilor Naţionale (PIB şi componentele acestuia în
termeni reali, deflatorul PIB etc.). Indicatorii structurali privind activitatea întreprinderilor au
frecvenţă anuală. Variabilele financiare (ratele de dobândă, randamentul titlurilor de stat, cursul
de schimb etc.) au frecvenţă zilnică, dar sunt incluse în baza de date la frecvenţă lunară, datele
lunare fiind calculate ca media datelor zilnice.
BD-MACRO include variabilele în forma publicată de către sursa iniţială, dar şi într-o
formă prelucrată, în scopul asigurării unei uniformităţi în ceea ce priveşte modul de exprimare şi
unităţile de măsură. În cazul variabilelor cu frecvenţă lunară sau trimestrială cu comportament
sezonier, pentru care sunt disponibile oficial date ajustate sezonier, în baza de date sunt incluse
seriile de date ajustate sezonier. În cazul variabilelor lunare (de exemplu câştigul salarial mediu
brut, rata înregistrată a şomajului) pentru care nu sunt disponibile oficial date ajustate sezonier,
în baza de date sunt incluse datele ajustate sezonier utilizând metoda TramoSeats implementată
în programul informatic specializat Demetra.
Datele sunt exprimate în forma în care sunt disponibile în sursa iniţială sau într-o formă
echivalentă cu aceasta. De exemplu, indicatorii pe termen scurt (producţia industrială, volumul
comerţului cu amănuntul, lucrările de construcţii, preţurile producţiei industriale etc.) sunt
exprimaţi ca indici cu bază fixă, iar indicatorii din Sistemul Conturilor Naţionale sunt exprimaţi
în preţurile medii ale unui an de bază. Indicatorii financiari sunt exprimaţi în procente sau
lei/euro. Pornind de la forma iniţială în sunt care sunt exprimaţi indicatorii, în baza de date se
calculează automat, în cazul în care acestea sunt relevante, rate de creştere: (a) în raport cu
perioada anterioară, (b) în raport cu aceeaşi perioadă a anului anterior, (c) medii, pentru
intervalul care se termină cu perioada curentă.
b) Actualizare
BD-MACRO se actualizează lunar, prin adăugarea informaţiilor nou disponibile.
Actualizarea nu se limitează însă la adăugarea valorilor nou disponibile, ci implică şi revizuirea
seriilor istorice, ori de câte ori aceasta se realizează de către instituţia care publică oficial datele
respective. Aceasta poate fi rezultatul ajustării sezoniere a seriilor de date completate prin
adăugarea unei noi observaţii, a modificării structurii pe baza cărora sunt calculate valorile
agregate sau a schimbării de metodologie.
Regularitatea cu care sunt disponibile datele:
datele financiare (cursul de schimb, ratele de dobândă de pe piaţa interbancară,
randamentele titlurilor de stat în lei şi CDS România) sunt disponibile zilnic, dar
sunt actualizate în baza de date lunar; datele lunare sunt calculate ca medii ale
datelor zilnice;
variabilele din sondaj (ESI şi Consumer Sentiment Index) sunt disponibile în
timp real, la sfârşitul perioadei de referinţă; de ex. pe 27 noiembrie 2014, pentru
perioada de referinţă noiembrie 2014;
Indicele Preţurilor de Consum (IPC) este disponibil cu o lună întârziere, faţă de
perioada de referinţă; de ex. pe 11 noiembrie 2014 s-a publicat valoarea IPC
pentru luna octombrie 2014;
indicatorii pe termen scurt ai sectorului real (volumul producţiei industriale,
cifra de afaceri în industrie, volumul comerţului cu amănuntul, lucrările de
construcţii, serviciile de piaţă prestate populaţiei şi întreprinderilor), rata
şomajului BIM, preţurile producţiei industriale, câştigul salarial mediu nominal
brut sunt disponibile cu o întârziere de două luni, în raport cu luna de referinţă;
variabilele din conturile naţionale (PIB – total şi pe sectoare, din punctul de
vedere al cererii şi al ofertei, deflatorul PIB) sunt disponibile în cel mult 75 de
zile de la încheierea trimestrului de referinţă;
costul orar al forţei de muncă se publică concomitent cu datele provizorii (1)
pentru PIB şi componente;
indicele preţurilor proprietăţilor rezidenţiale este disponibil la două luni după
încheierea trimestrului de referinţă;
ratele de dobândă la creditele acordate companiilor şi rata creditelor
neperformante sunt disponibile la două luni după încheierea lunii de referinţă;
indicele preţurilor mărfurilor pe pieţele internaţionale este disponibil cu o
întârziere de 1 lună;
sondajul privind standardele de creditare se publică în a doua lună a trimestrului
T(n+1) pentru trimestrul T(n);
datele structurale privind activitatea întreprinderilor se publică spre finalul
anului curent, pentru anul anterior;
publicarea ratei înregistrate a şomajului nu are caracter regulat.
c) Implementare
Baza de date macro este implementată sub forma unui fişier MS Excel. Acesta permite
calculul automat al diverselor forme de exprimare a datelor (diverse forme ale ratelor de creştere,
medii mobile etc.), precum şi importarea în programe specializate, cum ar fi Eviews, SAS sau
Matlab.
Fişierul este structurat în funcţie de frecvenţa datelor: lunară, trimestrială, respectiv
anuală, fiecăreia dintre acestea fiindu-i alocată o foaie de calcul (en. sheet). În interiorul unei foi
de calcul, datele sunt structurate în funcţie de conţinutul economic, urmând clasificarea de la
punctul I. O foaie de calcul este dedicată descrierii variabilelor, fiind prezentate codificarea
acestora, denumirea, sursa, frecvenţa, prima observaţie disponibila, ultima observaţie
disponibilă, unitatea în care sunt exprimate şi alte observaţii. Aceste informaţii sunt prezentate,
pentru varianta iniţială a BD-MACRO, şi în Anexa 1.
d) Sursa datelor
Datele sunt preluate din sursele oficiale, autorizate să calculeze şi să disemineze date
macroeconomice sau referitoare la sistemul financiar-bancar: Institutul Naţional de Statistică
(INS), Banca Naţională a României (BNR), Agenţia Naţională pentru Ocuparea Forţei de Muncă
(ANOFM), Oficiul Naţional pentru Registrul Comerţului (ONRC), EUROSTAT, Comisia
Europeană, Fondul Monetar Internaţional (FMI).
I. 5. Studiu asupra tehnicilor predictive utilizate pentru construirea funcțiilor
scoring
Modelele de rating definesc riscul de credit într-un mod operațional, ca "distribuţia pierderilor
financiare atunci când au loc modificări imprevizibile în calitatea creditului unei contrapartide
implicate într-un contract financiar" (Giesecke, 2004). Modelele referitoare la riscul de credit au
ca scop principal prognoza funcţiei de distribuție a probabilităților de pierderi asociate
portofoliului de credite (Lopez și Saindenberg, 1999).
În 1936, Fischer a introdus funcția liniara discriminantă cu scopul de a găsi o combinație
de variabile care separă cât mai eficient două grupuri ale căror caracteristici erau disponibile.
Fie orice combinație liniară a caracteristicilor
.
Fisher propune ca și măsura de separație
ț ă
ț ș ă
(1)
Regresia logistică
Fie probabilitatea ca i este in incapacitate de plata, scopul este aflarea lui care
aproximeaza cel mai bine
(2)
Partea dreaptă a ecuatiei ia valori intre ș dar partea stanga a ecuatiei este o
probabilitate, drept urmare ia valori intre 0 și 1. Scopul a fost folosirea unei funcții care sa
satisfaca aceasta conditie, si anume functia logistica.
Combinatia liniara a variabilelor este :
(3)
Aplicand exponentiala in ambele parti ale ecuatiei obtinem
(4)
Impartind la ,ecuatia devine:
(5)
Regresia Probit
In 1934, Bliss a introdus modelul probit in care a sugerat transformarea procentului intr-o
unitate de probabilitate. Grablowsky and Talley (1981) au folosit pentru prima data in credit
scoring modelul probit.
Fie N(x) distributia normală cumulata:
(6)
Atunci scopul este estimarea ca si o functie liniara de caracteristici ale variabilelor:
(7)
Asemanator, ia valori intre 0 și 1 0, ia valori intre .
In 2006 Bishop a concluzionat ca rezultatele din regresia probit tind sa fie similare
regresiei logistice.
Regresia Tobit
In 1958 James Tobin a propus modelul care ii poarta numele pentru a descrie relatia
dintre variabile dependente non-negative si un vector independent, astfel estimarea lui se
realizeaza conform relației:
(8)
Un aspect important este partea dreapta a ecuatiei, care trebuie sa fie pozitivă si desi
transformarea tobit trateaza probabilitatile negative, probabilitățile estimate nu sunt mai mari de
1. Un model simetric poate fi scris in modul urmator:
(9)
Arbori de clasificare.
Ideea principală este de a împărți un set de răspunsuri în diferite seturi și apoi stabili
dacă aceste seturi sunt bune sau rele, în funcție de majoritatea din fiecare set. În credit scoring
ideea a fost dezvoltată de Makowski ( 1985) și Coffman ( 1986) .
Setul de date A este primul împărțită în două subgrupuri și fiecare dintre aceste seturi este
apoi din nou împărțit în două, scopul fiind de a produce cat mai multe subseturi omogene, astfel
procesul se repetă, din acest motiv numele tehncii fiind de abordare de partiționare recursivă.
Procesul se oprește atunci când subseturile îndeplinesc cerințele pentru a fi nodurile terminale ale
arborelui. Fiecare nod terminal este apoi clasificat ca membru in A sau B.
Deciziile implica trei proceduri :
• Ce regula ar trebui folosită pentru a împărți seturile în două alte subseturi - regula de împărțire ;
• Cum se decide dacă un set este un nod terminal - regula de oprire ;
• Cum se alocă nodurile terminale pe categorii - regula de alocare .
În realizarea activității I.6 s-a utilizat această tehnică, alături de cea sintetizată în continuare.
Rețelele neuronale
Modele neuronale datează din 1943, o dată cu prima apariție a modelului neuron, model
propus de neurofiziologul WS McCulloch și matematicianul W. Pitts. A fost observant un
interes crescut pentru acest tip de model după prima apariție a lucrărilor în modelarea
matematică a proceselor de învățare. O primă apariție de acest gen a avut loc în 1947, și este
reprezentată de modelul de învățare a D.O Hebb , care a deschis direcții nebănuite în calculele
neuronale. Un alt pas important in cadrul procesului dezvoltării rețelelor neuronale a fost făcut
în 1957, prin apariția lucrarii lui Rosenblatt (1962) care cuprinde un model neuronal cu caracter
probabilistic simplificat, cunoscut sub numele de perceptron. Element fundamental al oricărei
rețele neuronale este un neuron artificial. Neuronii care fac parte din rețele neuronale , au funcții
diferite , ele sunt specializate în efectuarea anumitor tipuri de activități. Din acest punct de
vedere, o rețea neuronală conține trei tipuri de bază de neuroni:
Unități de intrare , care stocheaza valorile variabilelor de intrare sau valorile standard ale
variabilelor de intrare , acest lucru înseamnă că neuronii de intrare nu au nici o
funcționalitate de calcul propriu în sine , ci un rol de interfață , neuronii de intrare
formează așa - numitul strat de intrare;
Neurornii intermediari sunt celulele creierului ce sunt situate între stratul de intrare și
stratul de ieșire având o funcție pur calculator ;
Neuroni de ieșire, care calculează valorile rețelelor neuronale prezise și compara aceste
valori cu valori specifice țintă sau valori de referință; în funcție de rezultatul comparației
ponderile sau conexiunile sunt actualizate .
Fiecare unitate elementară a unei rețele neuronale, adică fiecare neuron are una sau mai multe
stari internă și o ieșire. Funcționalitatea unui neuron constă în aceea că produce o singură ieșire ,
reprezentată de o singură valoare numerică , în funcție de natura sau starea unei astfel de unități ,
stabilite pe baza informațiilor de intrare in neuron .
Fiecare valoare a lui este o variabila iar ponderile, cunoscute si sub numele de
ponderi sinaptice sunt scrise in ordinea (k,p) unde k indica neuronul la care ponderea se aplica
iar p indica variabila.
(10)
(11)
Valoarea este apoi transformata folosind o funcție de activare cunoscuta sub numele de
functie de transfer. Diferite funcții poti fi folosite, ca de exemplu
Threshold (Prag)
(12)
Logistic
(13)
Tangenta hiperbolica
(14)
Pentru a aplica tehnica rețele neuronale problema de a specifica ponderile care sunt utilizate în
arhitectura construita este rezolvată de către algoritmul de învățare care învață rețeaua și iterativ
modifică aceste ponderi până cand o condiție este îndeplinită, in special când eroarea dintre
rezultatul dorit și cel produs de model este minima. Un perceptron pe mai multe nivele este
format dintr-un strat de invatare, un strat de iesire si un numar de neuroni numiti neuroni ascunsi.
Ponderile aplicate neuronilor de intrare pot diferi de ponderile aplicate neuronilor ascunsi. O
retea de acest tip are urmatoarea forma:
Stratul de intrare cu p valori Stratul ascuns cu r neuroni Stratul de iesire cu s neuroni
q=1,... ,p k=1,.., r v=1,..s
Fig.1. Rețea neuronală
(15)
Unde 1 indica primul strat, iar reprezinta outputul din prim strat ascuns; outputul unui strat
devine intrare pentru urmatorul strat, astfel relatia devine:
(16)
unde este rezultatul neuronului v in stratul de rezultate, v=1...s, F2 este functia de transfer din
stratul de rezultate și ponderile aplicate lui sunt .
În 1997, Hand şi Henley au făcut o comparaţie între regresia logistica, reţelele neuronale
şi alte tehnici şi în lucrarea lor se prezintă, de asemenea, criteriul valorii informaţionale
(Information Value) folosit pentru selectarea variabilelor. West et al. (2000) au investigat
acurateţea modelelor de credit scoring prin compararea a cinci tipuri de reţele neuronale cu alte
tehnici cum ar fi regresia logistică, arbori decizionali etc. Rezultatele indică faptul că deşi
reţelele neuronale au furnizat rezultate mai bune, regresia logistică este o bună alternativă la
reţelele neuronale artificiale.
Komorád (2002) a investigat precizia de predicţie şi performanţa modelelor de credit
scoring pe un set de date de la o bancă din Franţa. Au fost comparate rezultatele de la regresia
logistică, multi-layer perceptron (MLP), reţelele neuronale şi reţelele radiale neuronale. O
comparaţie între regresia logistică şi arborele decizional a fost dezvoltată de Kocenda şi Vojtek
(2009); lucrarea lor de cercetare a condus la ideea că, în ciuda faptului că variabilele socio-
demografice sunt importante pentru model, variabilele de comportament ar trebui să fie incluse
pentru gestiunea completă de portofoliu. Andreica et al. (2009) aplică o parte dintre metodele
descrise anterior pe un grup de companii aflate în dificultate și non-dificultate din România,
listate la bursă în perioada 2006-2008, concluzionând că modelele sunt potrivite pentru a
prevedea dificultățile viitoare de plată.
I. 6. Analiza univariată
a) Serii de date
Esantionul de date pentru 10784 de societati a fost utilizat in analiza determinarii
factorilor capacitatii de plata prin utilizarea unor tehnici diferite. Setul de date cuprinde o serie de
indicatori din arii diferite: profitabilitate, solvabilitate si indicatori de crestere. Utilizarea acestor
indicatori nu este una limitativa, ei fiind utilizati in alte cercetari specializate, scopul primar fiind
observarea eficientei tehnicilor utilizand o varietate de factori. Ca si structura a datelor se poate
observa o rentabilitate medie a activelor de 9.6% si una a capitalului de 23.78%; cresterea medie
a cifrei de afaceri este undeva la 61%.
b) Rețele neuronale
Un prim pas in determinarea capacitatii de plata a societatilor analizate a fost stabilirea
unei definitii a societatii de tip “Bun” si “Rau”. Ca si variabila de determinare am considerat
platile restante ale furnizorilor la 90 de zile ca fiind un semnal suficient de semnificativ. Astfel
avand definitia de impartire a societatilor, am incercat comparatia functiilor de activare a
neuronilor in cadrul unei estimari de probabilitati de neplata utilizand tehnica retelelor neuronale.
Un prim pas a fost impartirea seriilor de date intr-un esantion de pregatire si unul de testare.
Astfel esantionul de pregatire constituit din 70% din date a fost utilizat pentru procesul de
invatare din cadrul tehnicilor retelelor neuronale. O data ce aceasta impartire a fost realizata pe
esantionul de pregatire s-au aplicat doua functii de activare si anume logistica si tangenta
hiperbolica. Pentru fiecare din acestea s-au folosit doua metrici de minimizare a erorilor, entropia
si suma patratelor. In tabelul de mai jos sunt prezentate rezultatele pentru cele patru combinatii
pentru fiecare retea neuronala (in continuare denumita RN) fiind prezentare testele de eficienta.
Tabelul 3. Rezultatele aplicării rețelelor neuronale Retea Performanta
pe esantionul
de pregatire
Performanta
pe esantionul
de test.
Metrica
de
eroare
Functia de activare
RN1 78.46546 78.20037 Entropia Tangenta
Hiperbolica
RN2 78.83635 77.96846 Entropia Logistica
RN3 79.38108 78.15399 SPE Tangenta
Hiperbolica
RN4 79.04497 78.06122 SPE Logistica
Prima concluzie pe care o putem trasa este faptul ca prima retea neuronala a inregistrat
cea mai mare acuratete pe esantionul de testare desi pe esantionul de pregatire o performanta mai
mare a avut-o a treia retea. Ce este comun celor doua retele este functia de activare si anume
tangenta hiperbolica. Metoda de oprire a procesului de invatare este data de metrica de eroare, si
anume daca suma patratrelor erorilor scade sub un anumit prag pre-stabilit, procesul reiterativ se
incheie. Rezultatele obtinute sunt apoi aplicate pe esantionul de testare, ceea ce explica de ce
apar diferente de acuratete intre cele doua esantioane pentru cele patru retele comparate.
Performanta data ca medie ne arata eficienta tehnicii utilizate pentru intreg modelul, insa un
lucru de analizat este eficienta clasificarii corecte pe fiecare clasa stabilita. Astfel se defineste
senzitivitatea ca si rata societatilor “rele” ce sunt corect identificate si specificitatea ca rata
societatilor “bune” ce sunt correct clasificate.
Fig. 3. Senzitivitatea modelului
Un model bine definit trebuie sa aiba senzitivitate mare si specificitate mare atat pe
esantionul de pregatire cat si pe cel de testare. In graficele de mai sus, se observa ca pe
esantionul de pregatire nu exista diferente semnificative intre cele patru retele, insa pe
estantionul de testare se evidentiaza cum a doua retea a performat cel mai prost dintre cele patru
analizate.
c) Arbori decizionali
O alta tehnica de clasificare este cea a utilizarii arborilor decizionali, iar pentru aceasta
analiza se pot observa urmatoarele elemente:
Firmele cu o scadere a profitului net mai mare de 100% sunt clasificati “Rai”
Firmele cu un profit per cifra de afaceri negativ sunt clasificati “Rai”
Firmele ce se incadreaza in companii medii, un nivel mare al datoriilor in total active sunt
clasificate ca fiind rau-platnice. Tot din aceasta categorie, dar cu un nivel mai mic al
datoriilor si cu o rentabilitate a activelor negativa sunt clasificate ca fiind “rele”.
Fig. 4. Arborele decizional
In functie de fiecare nod terminal firmele sunt impartite in prognozat bun sau prognozat rau. O
data ce s-a incheiat procesul de impartire, am analizat performanta metodei de clasificare. In
graficul de mai jos se observa cum detectia pentru firmele bune este mult mai mare decat pentru
firmele rele.
Figura 5. Matricea de clasificare
Acest lucru ne indica faptul ca factorii comuni ai societatilor rau-platnice nu sunt omogeni.
Pentru o mai buna detectie a acestor firme, vom compara mai multe reguli de clasificare si mai
multi indicatori.
B.2. Diseminarea rezultatelor cercetării
I.4. Diseminarea rezultatelor si raportare anuală. Schimburi de bune practici cu
universități din străinătate
Schimbul de bune practici s-a realizat în cadrul unei vizite de lucru la ESSEC Business
School din Paris, la invitația unui cercetător cu experiență în metode cantitative și calitative de
cercetare. S-a discutat pe marginea acestor metode și a rezultatelor aplicării lor în cadrul
proiectului de față.
Totodată, prin raportarea anuală și avizarea internă s-a realizat diseminarea internă, în
cadrul ASE, a rezultatelor cercetării.
I.7. Diseminarea rezultatelor prin participarea la manifestări stiintifice in domeniul
economic
a) Conferințe
1. Dudian, M., The Sustainability of SMEs in Romania in the Economic Crisis Context: a
Regional Approach, The 8th International Management Conference. Management Challenges
for Sustainable Development, Academia de Studii Economice, București, 6-7 noiembrie 2014 în
curs de indexare ISI Proceedings;
2. Popa, R.A., The Corporate Social Responsibility Practices in the Context of Sustainable
Development. The Case of Romania, The 2nd Global Conference on Business, Economics,
Management and Tourism, Praga, Republica Cehă, 29 - 31 octombrie 2014;
3. Popa, R.A., Perspectives on FDI. The Case of Sustainable Development, Post-Crisis
Developments in Economics, Academia de Studii Economice, București, 21 - 22 noiembrie 2014,
lucrare acceptată spre publicare în Theoretical and Applied Economics, ISSN 1841-8678;
A fost acceptată la conferința menționată lucrarea:
4. Dudian, M, Biro (Vasile), D., Involvment of the SMEs in the 7th Framework Programme of
the EU. Case Study for Romania, The 15th Eurasia Business and Economics Society Conference,
ISCTE-IUL Instituto Universitario de Lisboa, Portugalia, 8 - 10 ianuarie 2015, de tip ISI
Proceedings.
Toate lucrările vor fi publicate în volumul conferinței sau în revistele participante la conferință.
b) Articole publicate și în curs de publicare
b1) Publicat:
Stefănescu, A. (2014). Difficultes related to the financial position reporting into the public sector
in Romania, SEA - Practical Application of Science, vol. II, 3 (5) /2014, ISSN 2360 – 2554,
pag. 611 - 616.
b2) În curs de publicare
Popa, R.A., Alexa, L. (2014). The Relationship between Profit and Productivity in the IT Sector
from Romania. Analysis with Panel Method, The Annals of “Dunarea de Jos” University -
Fascicle I. Economics and Applied Informatics, vol. 2/2014, ISSN 1584-0409.
Toate lucrările au specificat acknowledgement.
B.3. Rezultatele etapei și gradul de realizare a obiectivelor
Toate obiectivele științifice și tehnice aferente activitățiilor etapei curente au fost
realizate integral, astfel:
Rezultat prevăzut Rezultat obținut Grad de realizare
Baze de date ordonate pentru
selectarea eșantioanelor.
Baza de date ordonată pentru
selectarea eşantioanelor,
rezultat al activității I.1.
Total
Baza de date relevantă cu
companii din România, în
principal IMM-uri, descrisă în
capitolul I.2.
Baza de date relevantă cu
variabile macroeconomice,
descrisă în capitolul I.3.
Pagina web Pagina web Total, actualizată periodic
O lucrare prezentată la o
conferință internațională sau
publicată în revistă BDI.
2 lucrări prezentate la
conferințe internaționale (ISI
Proceedings)
Total
O lucrare acceptată la o
conferință internațională (ISI
Proceedings)
O lucrare prezentată la o
conferință națională
Un articol publicat în revistă
BDI
Un articol acceptat spre
publicare în revistă BDI
pentru luna decembrie
Raport științific de progres Raport științific și tehnic de
progres
Total
În plus, datorită suplimentării finanțării pe parcursul perioadei de derulare a etapei întâi, au mai
fost realizate următoarele:
1. Sinteza tehnicilor predictive pentru construirea funcțiilor scoring, descrise în capitolul I.5;
2. Raport cu privire la analiza univariată, subiect al capitolului I.6.
Bibliografie selectivă
[1] Andreica, M.E., Andreica, M.I., Andreica, M.(2009). Using financial ratios to identify
Romanian distressed companies, Economie. Seria Management, vol 12 (1 special): 47-55.
Disponibil pe http://www.management.ase.ro/reveconomia/2009-1s/10.pdf
[2] Bishop, Christopher (2006). Pattern recognition and machine learning. Berlin: Springer.
[3] Bliss, Cl. (1934). The methods of probits, Science 79 (2037): 38-39.
[4] J. Y. Coffman (1986) The Proper Role of Tree Analysis in the Forecasting the Risk
Behaviour of Borrowers, MDS Reports, Management Decision Systems, Atlanta, pp.47-59.
[5] Fisher, R. A. (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of
Eugenics 7 (2): 179–188.
[6] Giesecke, K. (2005). Default and Information. Journal of Economic Dynamics & Control 30 :
2281–2303. Disponibil pe http://web.stanford.edu/dept/MSandE/cgi-
bin/people/faculty/giesecke/pdfs/paper3.pdf
[7] Grablowsky, B.J., Talley, W. K. (1981) Probit and discriminant functions for classifying
credit applicants: a comparison, Journal of economics and business, vol. 33(3): 254-261
[8] Hand, D.J., Henley, W.E. (1997). Statistical classification methods in consumer credit
scoring: a review, Journal of the Royal Statistical Society, Series A 160: 523–541
[9] Hebb DO (1947). The effects of early experience on problem solving at maturity. American
Psychologist 2: 306–7.
[10] Kočenda E, Martin Vojtek (2009), “Default Predictors and Credit Scoring Models for Retail
Banking”,Working paper, Prague. Disponibil pe
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1519792
[11] Komorád K.(2002), “On Credit Scoring Estimation” Master’s Thesis, Institute for Statistics
and Econometrics, Humboldt University, Berlin. Disponibil pe http://edoc.hu-
berlin.de/master/komorad-karel-2002-12-18/PDF/komorad.pdf
[12] Lopez, J. A., Saindenberg, M. R., (1999). Evaluating Credit Risk Models, Economic
Research Department Federal Reserve Bank of San Francisco. Disponibil pe
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=170008
[13] Makowski, P. (1985). Credit Scoring Branches Out. The Credit World, 75: 30 - 37.
[14] McCulloch, W. S., Pitts, W (1943). A logical calculus of the ideas immanent in nervous
activity. Bulletin of Mathematical Biophysics 5: 115–133.
[15] Rosenblatt, F. (1962). Principles of Neurodynamics:Perceptrons and the Theory of Brain
Mechanisms. Washington: Spartan Books.
[16] Scholkopf, B., A. Smola, R. C. Williamson, and P. L. Bartlett (2000). New support vector
algorithms.Neural Computation 12(5): 1207–1245.
[17] Tobin, J. (1958). Estimation of relationships for limited dependent
variables. Econometrica 26 (1): 24–36. doi:10.2307/1907382
[18] West, D. (2000). Neural network credit scoring models. Computers and Operations
Research, 27(11/12): 1131–1152.
Anexa 1. Variabilele incluse în baza de date relevantă cu variabile macroeconomice (BD-MACRO).
Nr. Nume/ descriere Codificare Sursa Frecvenţa
Prima observaţie
Ultima observaţie
Unitatea de măsură Alte observaţii
1 Date lunare 1.1 Preţuri
1.1.1
Indicele preţurilor producţiei industriale INPP_B-E36 INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100. Date brute, neajustate sezonier.
1.1.2
Indicele preţurilor de consum CPL_IPCT INS Lunară 1990M10 2014M10
Indice cu bază fixă, 2010=100.
Date brute, neajustate sezonier, calculate pe baza datelor INS.
1.1.3
Câştigul salarial mediu nominal brut WB INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100.
Date ajustate sezonier cu programul Demetra, pe baza datelor INS.
1.2 Sector real
1.2.1
Volumul producţiei industriale IND_B-D INS Lunară 1990M01 2014M09
Indice cu bază fixă, 2010=100.
Date ajustate sezonier; ruptură structurală în 2000M01.
1.2.2
Cifra de afaceri din Industrie, în termeni reali TN_B-C INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100.
Calculată pe baza datelor INS, ajustate sezonier. Include Industria extractiva şi Industria prelucrătoare. Deflatarea s-a realizat cu Indicele preturilor producţiei industriale din Industria extractivă şi Industria prelucrătoare.
1.2.3
Volumul cifrei de afaceri din comerţul cu amănuntul COM107B_G47 INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100. Date ajustate sezonier.
1.2.4
Volumul lucrărilor de construcţii CONS105B_F INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100. Date ajustate sezonier.
1.2.5
Indicele volumului cifrei de afaceri pentru serviciile de piaţă PSC107SA_ALL INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100. Date ajustate sezonier.
prestate populaţiei
1.2.6
Cifra de afaceri în serviciile de piaţă prestate în principal întreprinderilor, în termeni reali PSC108B_ALL INS Lunară 2000M01 2014M09
Indice cu bază fixă, 2010=100.
Calculată pe baza datelor INS, ajustate sezonier. Deflatarea s-a realizat cu indicele preţurilor producţiei industriale.
1.2.7
Rata înregistrată a şomajului REMPB ANOFM Lunară 1991M02 2014M10 %
Date ajustate sezonier cu programul Demetra, pe baza datelor ANOFM. Ruptură structurală la începutul anului 2002, ca urmare a implementării Legii venitului minim garantat.
1.2.8 Rata şomajului BIM BURM EUROSTAT Lunară 1997M01 2014M09 % Date ajustate sezonier.
1.3 Sector financiar
1.3.1
Cursul de schimb EUR/RON EUR BNR Lunară 1996M01 2014M10 RON/EUR
Date calculate ca media valorilor zilnice din luna respectivă.
1.3.2
Rata de dobândă de pe piaţa interbancară, în lei ROBOR3M BNR Lunară 1995M08 2014M10 %
Date calculate ca media valorilor zilnice din luna respectivă, pentru ROBOR 3M.
1.3.3
Rata de dobândă la creditele acordate companiilor, în lei N14RL_CSN BNR Lunară 2007M01 2014M09 % Credite noi.
1.3.4
Rata de dobândă la creditele acordate companiilor, în euro N14EL_CSN BNR Lunară 2007M01 2014M09 % Credite noi.
1.3.5
Randamentul titlurilor de stat cu maturitatea de 10 ani, în lei TSFZ_10YMID BNR Lunară 2011M01 2014M10 %
Date calculate ca media valorilor mid zilnice din luna respectivă.
1.3.6 CDS România CDS5YROEUR Reuters Lunară 2012M11 2014M10 % Date calculate ca media valorilor zilnice din luna
respectivă, CDS 5Y, EUR.
1.3.7 Rata creditelor neperformante NPL1,2 BNR Lunară 2009M09 2014M10 %
Modificare de metodologie începând cu 2014M03. Raportul este marcat până la jumătatea anului 2014 de imposibilitatea băncilor de a elimina din bilanţ creditele neperformante, dar provizionate integral.
1.3.8
Număr societăţi intrate în insolvenţă NINS ONRC Lunară 2010M01 2014M10 - Date neajustate sezonier.
1.4 Variabile externe
1.4.1
Indicele preţurilor materiilor prime pe pieţele internaţionale IPCOMM FMI Lunară 1992M01 2014M10
Indice cu bază fixă, 2005=100.
1.4.2
Rata de dobândă de pe piaţa interbancară, în euro I3MEUR EUROSTAT Lunară 1990M01 2014M10 % Maturitatea de 3 luni.
1.5 Variabile din sondaj
1.5.1
Economic Sentiment Index ESI
Comisia Europeană Lunară 1991M07 2014M10 Puncte
1.5.2
Consumer Sentiment Index HHCONF
Comisia Europeană Lunară 2001M05 2014M10 Puncte
2
Date trimestriale
2.1 Preţuri
2.1.1 Deflatorul PIB PIB_P INS Trimestrială 2000Q1 2014Q2
Indice cu bază fixă, 2010=100.
Calculate pe baza valorilor publicate de către INS, ajustate sezonier.
2.1.2
Indicele trimestrial al costului orar al forţei de muncă LC INS Trimestrială 2000Q1 2014Q2
Indice cu bază fixă, 2010=100. Calculate pe baza datelor INS, ajustate sezonier.
2.1.3
Indicele preţurilor proprietăţilor rezidenţiale PRPI INS Trimestrială 2009Q1 2014Q2
Indice cu bază fixă, 2010=100. Calculate pe baza datelor INS.
2.2 Sector real
2.2.1 Produsul intern brut PIB INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.2
Consumul individual efectiv al gospodăriilor populaţiei CONS_PRIV INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.3
Consumul colectiv efectiv al administraţiilor publice CONS_PUB INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.4 Formarea brută de capital fix GFCF INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.5 Exportul de bunuri şi servicii EXXP INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.6 Importul de bunuri şi servicii IMP INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.7
Valoarea adăugată brută în Agricultură, silvicultura şi pescuit AGR INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.8
Valoarea adăugată brută în Industrie IND INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000.
Date ajustate sezonier. Include Industria extractivă; industria prelucrătoare; producţia şi furnizarea de energie electrică şi termică, gaze, apă caldă şi aer condiţionat; distribuţia apei; salubritate, gestionarea deşeurilor, activităţi de decontaminare.
2.2.9
Valoarea adăugată brută în Construcţii CONSTR INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000. Date ajustate sezonier.
2.2.10
Valoarea adăugată brută în Comerţ COMM INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000.
Date ajustate sezonier. Include Comerţul cu amănuntul şi ridicata; repararea autovehiculelor şi motocicletelor; transport şi depozitare; hoteluri şi restaurante.
2.2.11
Valoarea adăugată brută în Serviciile private SERV_PRIV INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000.
Date ajustate sezonier. Include Informaţii şi comunicaţii; Intermedieri financiare şi asigurări; Tranzacţii imobiliare; Activităţi profesionale, ştiinţifice şi tehnice; activităţi de servicii administrative şi activităţi de servicii suport; Activităţi de spectacole, culturale şi recreative; reparaţii de produse de uz casnic şi alte servicii.
2.2.12
Valoarea adăugată brută în Serviciile publice SERV_PUB INS Trimestrială 2000Q1 2014Q2
Milioane lei, preţuri medii ale anului 2000.
Date ajustate sezonier. Include Administraţie publică şi apărare; asigurări sociale din sistemul public; învăţământ; sănătate şi asistenţă socială.
2.3 Variabile externe
2.3.1 PIB al zonei euro PIB_EA EUROSTAT Trimestrială 1995Q1 2014Q2
Milioane euro, preţuri medii ale anului 2010. Date ajustate sezonier.
3 Date anuale
3.1 Indicatori structurali
INS Anuală 2008 2013
Sectoarele sunt clasificate în conformitate cu CAEN2.