Teoria Si Metodologia Evaluarii c Moise

TEORIA SI METODOLOGIA EVALUARII SCOLAREautor: prof.univ.dr. C. MOISE

SCOPUL UNITĂŢII DE CURS

cunoaşterea de către student a elementelor de bază ale teoriei evaluării, odată cu dobândirea capacităţii de aplicare a lor în procesul didactic

OBIECTIVE NOMINALE

familiarizarea studenţilor cu definiţiile, accepţiunile, terminologia aferente domeniului; însuşirea activă a relaţiei logice dintre teoria evaluării şi teoria instruirii; însuşirea relaţiei indisolubile dintre predare, învăţare - pe de o parte şi evaluare, pe de altă

parte; însuşirea şi stăpânirea accepţiunilor conceptului de evaluare, în context didactic; însuşirea, stăpânirea, aplicarea de către student a demersurilor vizând definirea şi

interpretarea funcţiilor evaluării şcolare; stăpânirea informaţiei şi criteriilor necesare interpretării, sistematizării, aplicării corecte a

funcţiilor evaluării şcolare; dobândirea capacităţii de compatibilizare şi armonizare în sistem a tipurilor de evaluare

după diferite criterii raţionale; înţelegerea şi însuşirea de către student a sistemului general al metodelor de evaluare

şcolară; dobândirea informaţiei şi capacităţilor necesare de corelare, în plan teoretic şi practic, a

entităţilor metodologice tradiţionale şi moderne; familiarizarea studenţilor cu modernizarea practicii evaluative, în consens cu reforma

actuală a şcolii româneşti; însuşirea activă a interpretării şi proiectării modalităţilor moderne de evaluare; dobândirea capacităţii de corelare a aspectelor vizând evaluarea randamentului şcolar cu

cele aferente evaluării procesului didactic.

EVALUARE Descriptori de evaluare

După ce vor studia această unitate de curs, studenţii vor fi capabili: să definească evaluarea şcolară în general şi evaluarea randamentului şcolar în special; să distingă, să redea, să explice esenţa fiecărei componente a evaluării randamentului

elevului (examinare, măsurare, descriere calitativă, judecăţi de valoare, notare); să surprindă corect sensurile conceptului de evaluare a rezultatelor elevului, aşa cum

apar în teorie şi în practică; să selecteze şi să interpreteze corect terminologia evaluării; să analizeze şi să sistematizeze logic funcţiile evaluării, pe fondul opiniilor existente şi

prin reflecţie proprie; să selecteze opiniile reprezentative privind tipurile de evaluare a randamentului şcolar; să interpreteze corect diferitele sistematizări ale grupelor de metode de evaluare; să prezinte clar metodologia tradiţională, estimând resursele ei instrumentale în

context contemporan; să selecteze raţional şi să integreze în sistem calităţile pretinse instrumentelor de

evaluare în general; să caracterizeze concret şi corect metodele tradiţionale de evaluare orală, scrisă,

practică; curentă, periodică, globală, invocând avantajele şi limitele fiecăreia;

- 1 -

CONSTANTIN MOISE

să prezinte şi să explice corect testul psihologic în general şi testul docimologic în special;

să definească şi să prezinte inteligibil tipurile de itemi de test, respectând exigenţele; să se orienteze fie după sistematizarea tipurilor de itemi de către autorii americani din

curs, fie după cea a Serviciului Naţional de Examinare şi Evaluare (SNEE); să prezinte câte două exemple din fiecare categorie de itemi (obiectivi, semiobiectivi,

subiectivi) pe care să le definească şi să le explice; să puncteze trei avantaje şi trei limite în dreptul fiecăreia; să redea câte trei - patru

exigenţe de construire pentru fiecare, cu exemplificări; să explice corect calităţile obligatorii ale testului docimologic (nu neapărat cu calcule

minuţioase, dar cu menţionarea şi integrarea lor într-un discurs inteligibil); să prezinte algoritmul de proiectare a testului docimologic, cu redarea, în context, a

calităţilor şi cu calculul doar al indicilor ce reies din analiza de item (nivelul de dificultate, capacitatea de discriminare, calitatea distractorilor);

să abordeze cel puţin două metode complementare; să prezinte şi să explice tipurile de notare; să redea şi să analizeze abaterile de la notarea corectă, cu posibilităţile de contracarare,

respectiv remediere; să formuleze consideraţii esenţiale privind evaluarea componentelor şi factorilor

implicaţi în procesul didactic (elevul, conţinuturile, personalitatea educatorului).

I. DELIMITĂRI GENERALE NECESARE

Cum am afirmat şi în cursul de Teoria instruirii, evaluarea poate fi considerată a treia dimensiune a preocupărilor didactice, alături de predare şi învăţare. Importanţa ei este în afară de orice îndoială, motivându-se atât prin necesitatea certificării şi ierarhizării rezultatelor obţinute de elevi, cât şi prin rolul ei de feedback, deopotrivă pentru elev şi pentru factorii responsabili de proiectarea şi de bunul mers al procesului. Amploarea preocupării este subliniată în ultimii ani în termenii următori: "Se evaluează peste tot şi totul, iar educaţia nu a scăpat acestui val." (Vogler, J., coord., 2000).Definiţii şi explicaţii iniţiale. "A evalua trimite la mai multe verbe, dar între ele există o sinonimie variabilă şi întotdeauna imperfectă: a aprecia, a constata, a estima, a examina, a cântări, a judeca, a măsura, a nota, a valida (sau a invalida), a valoriza (sau a devaloriza)…mai recent, a expertiza…" (idem), iată un punct de sprijin posibil pentru o definire a acestei dimensiuni a procesului educaţional, dar nu o definiţie propriu-zisă.

Dintre definiţiile care i s-au formulat evaluării, în context pedagogic, atrag atenţia mai multe, având conotaţii nuanţate diferit de fiecare autor. O cităm mai întâi pe cea aparţinând lui N. Gronlund, recunoscut ca autoritate notabilă în teoria evaluării: "Din unghiul de vedere educaţional, evaluarea poate fi definită ca un proces sistematic de determinare a nivelului la care obiectivele educaţionale sunt realizate de către elev", cu precizarea că din definiţie trebuie reţinute două aspecte: că ea implică un proces sistematic şi că nu ar fi posibilă fără identificarea anterioară a obiectivelor (Gronlund, N.E., 1971, pp.7-8). Acelaşi autor susţine că interdependenţa celor trei demersuri (predarea, învăţarea, evaluarea) se poate dovedi prin însăşi prezenţa lor solidară în toţi "paşii" esenţiali ai procesului educaţional, respectivii paşi fiind: 1) "identificarea şi definirea obiectivelor în termeni de schimbări dezirabile în

comportamentul elevului" (ce cunoştinţe, ce capacităţi de înţelegere, ce interese, ce atitudini va trebui să posede elevul la sfârşitul procesului?);

2) "planificarea şi direcţionarea experienţelor de învăţare în armonie cu obiectivele stabilite" (când "conţinuturile şi metodele sunt integrate în experienţele de învăţare planificate astfel încât comportamentele elevului să se schimbe în direcţia dorită"); este etapa în care "accentul este mai curând pe proces decât pe produs";

3) "stabilirea progresului elevului în direcţia obiectivelor desemnate" (răspunzând la întrebările: cum să definim, să selectăm, să administrăm tehnicile de evaluare? cum să interpretăm şi să aplicăm rezultatele constatate?);

4) "utilizarea rezultatelor evaluării în îmbunătăţirea procesului de învăţare şi instruire", pas care se împleteşte strâns cu cel anterior. Este etapa când elevul este informat despre progresul său, este ajutat să-şi recunoască dificultăţile, i se indică pregătirea necesară pentru viitoarele sale activităţi de învăţare, ceea ce este folositor în măsură egală pentru educator, în vederea alcătuirii reperelor viitoarei activităţi cu elevul; când se constituie, de

CONSTANTIN MOISE

asemenea, informaţiile necesare pentru părinţi şi pentru conceptorii curriculumului) (Idem, pp. 8-12).

Se înţelege de la sine că "paşii" menţionaţi trebuie să hotărască şi asupra ierarhizării elevilor după rezultatele lor.

Dintr-un recent dicţionar de pedagogie, aflăm o definiţie care, în ciuda aspectului ei de "loc comun", nu este lipsită de interes, servind cel puţin ca element de comparaţie în contextul dat: "…prin evaluarea randamentului se înţelege atât măsurarea cât şi aprecierea randamentului. Procesul evaluării începe cu planificarea şi descrierea obiectivelor şi a conţinuturilor care vor fi controlate mai târziu. În stabilirea succesului şcolar se analizează în ce măsură elevul a făcut progrese, ce poziţie ocupă în grup" (H. Schaub, K. Zenke, 2001, p.101).

Putem cita, apoi, nişte definiţii inscriptibile în contururi mai largi. Una aparţine lui R. Lindeman: "Aplicată în domeniul instruirii, evaluarea este procesul de apreciere a calităţii sistemului educaţional sau a unei părţi a acestui sistem. Astfel, evaluarea este procesul prin care se stabileşte dacă sistemul îşi îndeplineşte funcţiile pe care le are, adică dacă obiectivele lui sunt realizate. Procesul de evaluare include: 1) redarea obiectivelor sistemului sau ale unei secţiuni a lui într-o formă în care realizarea lor poate fi măsurată; 2) obţinerea de dovezi experimentale, sau de altă natură, pe care să se bazeze aprecierea; 3) folosirea acestor date pentru a elabora aprecierea finală." (Lindeman, R., 1978, p. 473). O altă definiţie, aparţinând lui I.T. Radu, reia fidel opinia lui Lindeman: evaluarea este "procesul menit să măsoare şi să aprecieze valoarea rezultatelor sistemului de educaţie sau a unei părţi a acestuia, eficacitatea resurselor, a condiţiilor şi a operaţiilor folosite în desfăşurarea activităţii, prin compararea rezultatelor cu obiectivele propuse, în vederea luării deciziilor privind ameliorarea activităţii în etapele următoare" (Radu, I. T., 1981, pp. 17-18).

Precum se constată, primele surse citate fac trimitere strictă la activitatea elevului şi la rezultatele lui, potrivit căror rezultate el va fi apreciat, orientat, clasificat în grupul din care face parte, certificându-i-se totodată drepturile ce i se cuvin în contextul social dat. Ultimii doi autori menţionaţi, în schimb, ne sugerează că activitatea de evaluare vizează un "sistem", deci nu se limitează la activitatea şi rezultatele elevului. Această extensie (de la rezultatele elevului la întregul sistem) este exprimată şi în mod explicit de către ambii citaţi mai sus. Drept dovadă, afirmaţiile lui Lindeman că "procedeele evaluative oferă jaloane de control pentru întregul sistem ca şi pentru porţiuni individuale ale sistemului", asigurând astfel "menţinerea unei maxime eficienţe în funcţionarea sistemului" (lucr.cit., p. 474 urm.); sau opiniile lui I.T. Radu, în acord cu precedentul, după care teoria evaluării "nu se poate limita la examinarea şi aprecierea rezultatelor obţinute în pregătirea elevilor, ci, în mod necesar, trebuie să-şi extindă investigaţiile asupra eficienţei sistemului şcolar în ansamblul său", ceea ce implică şi "structura sistemului, dezvoltarea învăţământului, conţinutul său, metodele şi mijloacele de învăţământ "şi, se pot adăuga personalitatea educatorului, relaţiile din cadrul procesului (vezi I.T. Radu, lucr.cit., p.13, 275 urm.). În acelaşi sens se exprimă o lucrare foarte recentă despre evaluarea şcolară: "Evaluarea modernă nu se mai rezumă la a aprecia dacă elevii au învăţat bine, ci caută să aprecieze şi eficacitatea ansamblului de procese care trebuie să conducă la învăţare. Obiectul evaluării nu mai este deci doar produsul-elev, ci şi

ansamblul sistemului de producţie (sistemul naţional şi unităţile de producţie care sunt instituţiile). Contrar evaluării tradiţionale, evaluarea modernă implică sistemul instituţional la diferitele sale niveluri: programe naţionale, politice, educative, funcţionarea instituţiilor, metode pedagogice…" (cf. J. Vogler, coord., 2000, p. 159). Este ceea ce ne convinge să avem în vedere accepţiunile diferite ale conceptului de evaluare: una limitată strict la rezultatele elevului, care poate fi denumită şi evaluare docimologică sau latură docimologică a evaluării educaţionale sau evaluare de produs; alta dedicată diverselor alte variabile incluse în procesul didactic, denumită evaluare de proces; alta foarte cuprinzătoare, care vizează şi sistemul (instituţiile, programele naţionale, politicile educaţionale; aşadar, accepţiunea largă a conceptului le cuprinde pe toate. Şi tot adevărat este că, în mai toate lucrările de până în prezent dedicate evaluării, spaţiul majoritar îi este destinat aspectului docimologic al problemei, linie pe care o vom urma şi în acest curs, dar nu fără să nu acordăm o minimă atenţie variabilelor din proces. Dintre variabilele de dincolo de rezultatele elevului, singurele care se bucură de o atenţie constantă sunt: elevul ca premisă a activităţii de învăţare, evaluat sub aspectul aptitudinilor sale la debutul procesului, deci nu al achiziţiilor sale în finalul învăţării; conţinuturile, ca suport de bază al învăţării; profesorul, ca principal actant care să mânuiască şi să le pună în valoare pe toate celelalte. Ceea ce se va constata şi pe întinsul cursului de faţă.

Terminologia evaluării pedagogice în general. În sfera evaluării pedagogice s-au statornicit o întreagă pleiadă de termeni, reprezentând tot atâtea concepte cu care este posibil să operăm în demersul de faţă. Astfel, termenul docimologie exprimă numele ştiinţei "care are ca obiect studierea sistematică a examenelor, în special a sistemelor de notare şi a comportării examinatorilor şi a celor examinaţi". Termenul docimastică desemnează aspectul tehnic al examenului. Vocabula doxologie denumeşte "studierea sistematică a rolului aprecierii în învăţământul şcolar", preocupându-se concret de "efectele stimulante sau inhibitoare ale diverselor forme de examinare"; a "reacţiilor elevilor…faţă de hotărârile profesorului"; a "influenţei părerii profesorului despre elevi asupra predării şi învăţării"; a notării automatizate, a internotării, notării în echipă, lipsei notării şi a rezultatelor lor (pentru explicaţiile despre toţi cei trei termeni, vezi şi Gilbert De Landsheere, 1975). Sintagma randament şcolar defineşte nivelul de pregătire şi dezvoltare a personalităţii prin raportare la programă (cf. T. Şuteu, în Dicţionar de pedagogie, 1979) şi la obiectivele educaţiei, am susţine noi azi. Alături de randamentul şcolar, randamentul pedagogic nu trebuie socotit o simplă preţiozitate lingvistică sau logică, ci rezultat al educatorului, datorat "capacităţii lui de a alege mijloacele, metodele, procedeele" …"şi de a le folosi cu maximum de eficienţă" (Idem). Înrudită cu cele două anterioare trebuie considerată eficienţa învăţământului, caracterizată drept "capacitate a unui sistem de învăţământ de a produce, în bune condiţii, rezultatele proiectate, adică de a promova, la fiecare nivel al său, seriile de elevi (studenţi) planificate, cu pregătirea instructiv-educativă corespunzătoare necesităţilor social-economice"; implică atât aspectele pedagogice (funcţionalitatea sistemului de învăţământ, metodele, pregătirea personalului didactic, rezultatele elevilor), cât şi pe cele administrative (planificarea şi amplasarea unităţilor şcolare), pe cele economice (investiţii pentru fiecare elev sau student, raportate la posibilitatea de recuperare prin munca profesională a acestora) şi pe

CONSTANTIN MOISE

cele sociale (contribuţia absolvenţilor la bunul mers al societăţii prin munca prestată) (cf. D. Muster, în Dicţionar de pedagogie, 1979). La rândul lui, conceptul de eficienţă a învăţării (e.î.) este definit ca indicator redând "raportul dintre capacitatea de utilizare a cunoştinţelor (U) şi capacitatea de învăţare (Î); acest Î rezultă din produsul dintre volumul (V) şi complexitatea (C) cunoştinţelor, produs ce trebuie raportat la timpul (T) necesar asimilării lor.

De unde: ; ; deci (potrivit opiniei lui P. Mureşan, în acelaşi

Dicţionar de pedagogie), fără ca autorul să explice care ar fi valoarea ideală a acestui raport. Termenii performanţă (şcolară) şi progres (la învăţătură) sunt consideraţi a avea conţinuturi (chiar dacă numai puţin) diferite; primul semnifică, după unii autori (vezi şi P. Popescu şi I.T. Radu, 1982, p. 192) "rezultatul obţinut de un elev în pregătirea sa", fără altă precizare de nuanţă valorică (deşi unul dintre autorii citaţi aici se exprimă şi pentru identitatea termenilor performanţă şi randament - cf. I.T. Radu, 1981, p.31); după alţii, performanţa este un rezultat cu valoare notabilă, chiar excepţională; cel de al doilea termen, cel de progres şcolar, exprimă realizarea unei noi calităţi, superioară celor anterioare. În fine, termenii evaluator şi evaluand, menţionaţi de documente de referinţă ale teoriei evaluării (cf. Enciclopedia internaţională a evaluării educaţionale, Oxford Pergamon, 1990 şi 1994): evaluator, adică "agentul" evaluării; evaluand, adică obiectul evaluării (de pildă, această enciclopedie menţionează şase mari evaluanzi: programe, produs, politici, specialişti, scopuri, performanţe).

II. EVALUAREA REZULTATELOR ELEVULUI:COMPONENTE, CORELAŢII, OBIECT

Comentariul de până aici (atât asupra definiţiilor cât şi a terminologiei) a îngăduit concluzia că există o evaluare mai cuprinzătoare, vizând întregul edificiu al procesului şi al sistemului educaţional şi o evaluare cu sferă mai restrânsă, care priveşte numai rezultatele elevului, rezultate pe baza cărora să fie conştientizat asupra situaţiei lui, orientat, îndrumat, clasificat. În titlul de faţă încercăm lămurirea unor întrebări legate strict de această ultimă specie de evaluare menţionată.

Una dintre întrebări ar fi: care sunt acţiunile componente ale evaluării văzute în aceste limite restrânse şi, odată cu aceasta, ce corelaţii logice pot fi considerate între conceptul de evaluare a rezultatelor (randamentului) elevului şi alte entităţi implicate în acest context? Ce se poate constata la prima vedere este că, în mai toate sursele teoretice şi demersurile normative, conceptul de evaluare este însoţit de cel de măsurare, iar în cele româneşti, şi de altele, sinonime sau apropiate măsurării, cum ar fi cele de verificare, examinare, apreciere, notare. Se poate semnala, de asemenea, în literatura dedicată acestui domeniu, intenţia şi efortul unora dintre autori, îndreptate mai ales spre definirea măsurării în raport cu evaluarea, precum şi a relaţiei dintre evaluare şi descriere calitativă.

Între autorii care atrag atenţia, în acest sens, îl putem menţiona pe D. Payne (1968), care, prin referire la evaluare şi măsurare, ne sugerează doar (deci nu rosteşte explicit) relaţia dintre cele două entităţi: "Cuvântul evaluare este cel mai cuprinzător", reprezentând "procesul general de formulare de judecăţi şi decizii", iar măsurarea i se subordonează şi constă din "colectare sistematică, cuantificare şi ordonare a datelor" (lucr.cit., p 3).

O lămurire mai minuţioasă este întreprinsă de Norman Gronlund, ca o completare necesară la definiţia pe care i-o datorăm şi pe care contextul ne obligă să o repetăm: prin restricţie la activitatea elevului, "evaluarea poate fi definită ca proces sistematic de determinare a nivelului la care obiectivele educaţionale au fost realizate de către elev". Completarea pe care o face autorul vizează o "confuzie" care se face uneori prin utilizarea drept sinonimi a termenilor evaluare şi măsurare: "Astfel, când un profesor administrează un test de randament, se poate spune şi că măsoară şi că evaluează, dar cu prea puţină grijă pentru înţelesul specific al celor doi termeni" (lucr.cit., p.7). Acelaşi teoretician, după ce acceptă includerea măsurării în evaluare (căreia i se subordonează), contestă prezenţa măsurării în orice act de evaluare. Mai precis, susţine el, există situaţii când măsurarea (denumită şi "descriere cantitativă") este perfect practicabilă (să zicem, pentru volumul informaţiilor elevului); în altele, însă, este hotărâtoare "descrierea calitativă", (de pildă, când trebuie să evaluăm nivelul şi însuşirile stilului de gândire al elevului), aceasta nemaifiind măsurare. Concluzia este: "Evaluarea include atât descrierea cantitativă, cât şi calitativă a

CONSTANTIN MOISE

comportamentului elevului, plus judecăţile de valoare despre dezirabilitatea acestui comportament". Ceea ce autorul prezintă şi sub formă cvasialgebrică (lucr.cit., p. 8):

"Evaluare = descriere cantitativă (măsurare) + judecăţile de valoare Evaluare = descriere calitativă (nonmăsurare) + judecăţile de valoare".

Concluzia reiese de la sine: aşa trebuie interpretată relaţia dintre evaluare şi cele trei componente, descrierea cantitativă, descrierea calitativă şi judecata de valoare care încheie demersul.

Un ajutor în definirea măsurării şi distingerea ei de alte entităţi implicate în evaluare ne este oferit şi de către J.P. Guilford, care afirmă că "a măsura înseamnă a atribui un număr unui obiect sau unui eveniment" (apud Landsheere, 1975, p.12). În sprijinul acestei precizări vine şi Landsheere, care subliniază că "măsurarea se exprimă obligatoriu prin cifre", ceea ce nu poate precede orice act de apreciere, dată fiind natura obiectului aprecierii, de pildă, "în domeniul atitudinilor şi în cazul tuturor producţiilor de mare complexitate" (Idem). Ceea ce înseamnă o acceptare şi o încurajare tacită a promovării opiniei lui Gronlund, şi în privinţa incluziunii măsurării în evaluare (alături de apreciere), şi în cea a conotaţiei cantitative a măsurării.

Ce putem reţine de aici este mai ales acel sens "comprehensiv" al evaluării rezultatelor elevului, luând seama că mulţi dintre autorii sau comentatorii de azi pe acesta îl promovează. Există însă destule situaţii în care nu acest sens să-i fie atribuit evaluării. Lucrările româneşti ne oferă mai multe exemple de acest fel. Formulările de felul: "..metode de verificare şi evaluare" (I. Radu şi M. Ionescu, 1979); "…activitate de verificare şi evaluare", "… probe de examinare şi evaluare" (P. Popescu, I.T. Radu, 1982); "…metode de verificare şi evaluare", sau chiar distincţia şi mai de amănunt din sintagma "procesul de evaluare şi notare" (I. Radu, 1995 - altul decât I.T. Radu) sunt toate probe că noţiunea de evaluare a randamentului şcolar este văzută (cu sau fără "teorie") în două accepţiuni: una aşa cum o prezintă Gronlund, incluzând măsurarea (vs. descrierea calitativă) împreună cu judecata de valoare aferentă; alta mai restrânsă, exprimând doar judecata de valoare, care urmează examinării (deci măsurării, ori, după caz, descrierii calitative); în plus, unii autori fac distincţie şi între evaluare şi notare (vezi, de exemplu, I. Radu, 1995).

Cât despre distincţia dintre descrierea calitativă (considerată nonmăsurare) şi cea cantitativă (singura socotită măsurare), nu ne putem da seama cine a acceptat-o, dar, oricum, e bine de reţinut şi aceasta.

T E M Ă D E R E F L E C Ţ I E

Încercaţi să formulaţi argumente pro sau contra definiţiei şi nuanţărilor susţinute de Gronlund.

O altă problemă care se pune în acest context se referă la obiectul sau ţinta evaluării. Aşadar ce rezultate ale învăţării trebuie puse în relief ? Autorii preocupaţi de această temă menţionează categoriile (vezi I.T. Radu 1981, p. 161 urm.): cunoştinţe acumulat (cu precizările: volumul informaţiei, precizia, rapiditatea actualizării, capacitatea de transfer);

dezvoltarea capacităţilor intelectuale (concretizată şi valorificată mai ales în "deprinderea elevilor de a învăţa cum să înveţe şi cum să gândească pentru a folosi cele învăţate"); capacităţile de aplicare a cunoştinţelor (obiectivată în "capacităţi de investigare …şi cu deosebire în capacitatea lor de a le folosi în rezolvarea unor probleme teoretice sau practice); capacităţile de creaţie, adică de elaborare de lucrări personale (cu punerea în relief a indicatorilor lor de măsurare şi apreciere: dimensiunile şi calitatea documentării, ordonarea logică a ideilor, modul de argumentare, exactitatea exprimării corectitudinea frazelor, eleganţa exprimării, ortografia şi punctuaţia, acurateţea elaborării); trăsături de personalitate şi de conduită dobândite de elev. Pe scurt, tot ceea ce găsim ordonat ierarhic în fiecare dintre taxonomiile existente, aşa cum au fost elaborate pe fiecare domeniu comportamental, cel mai mare spaţiu fiindu-i acordat domeniului cognitiv.

CONSTANTIN MOISE

III. FUNCŢIILE EVALUĂRII RANDAMENTULUI ŞCOLAR

Destul de mulţi autori şi-au rostit opinia pe această temă. La fel de adevărat pare că mai puţini dintre ei şi-au raportat opinia la punctul de vedere al precursorilor lor, ceea ce face să avem azi un adevărat mozaic de funcţii ale evaluării. Să concretizăm. G. De Landsheere, referindu-se doar la o latură a evaluării (aprecierea), îi atribuie trei roluri. Unul este cel de prognosticare, echivalent cu prevederea succesului (sau insuccesului) elevului în următoarea etapă de învăţare, pe baza achiziţiilor pe care le deţine în prezent: "este oare elevul înzestrat cu calităţile intelectuale şi de caracter şi, totodată, dispune el de cunoştinţele necesare pentru a aborda o materie nouă, sau un ciclu de studii superioare?". Altă funcţie este cea de „cântărire”, concretizându-se în "verificarea achiziţiilor", "aprecierea progresului" elevului prin compararea "cu el însuşi" şi prin plasarea lui într-o ierarhie, în cadrul unei colectivităţi, cum ar fi o clasă, un grup de clase, o serie definită de şcoli (într-un judeţ, o regiune etc.). A treia, de diagnosticare, obiectivată în precizarea insuficienţelor şi a cauzelor lor: "Care materii sau procedee sunt insuficient însuşite de cel ce studiază, care sunt procesele intelectuale responsabile pentru aceasta ?" (cf. 1975, p.11). După alt autor, funcţiile apar mult mai detaliate: unele sunt funcţiile sociale, altele sunt cele pedagogice (cf. I.T. Radu, 1981). Între cele sociale sunt exprimate clar două, adică "de a confirma sau a infirma acumularea de către subiecţii care învaţă a informaţiilor şi abilităţilor necesare unei activităţi social-utile" şi a dezvălui societăţii realizarea unei anume eficienţe economice a investiţiilor în educaţie. Cele pedagogice trebuie să se obiectiveze în: stimularea elevului să se dezvolte (ştiut fiind rolul mobilizator al aprecierii); influenţa asupra preciziei, trăiniciei, caracterului operant al achiziţiilor elevului; formarea însuşirilor lui de personalitate; orientarea şcolară şi profesională a acestuia; sprijin pentru profesor să cunoască elevul, să-l îndrume şi să-l clasifice. Reluate într-o lucrare ulterioară, aceleaşi funcţii aveau să apară în altă nuanţare: funcţia de control (controlul societăţii asupra derulării procesului); funcţia de clasificare şi de selecţie a elevilor; o funcţie educativă (de conştientizare a elevului); o funcţie socială (informarea societăţii asupra rezultatelor instruirii); o funcţie didactică (de autoperfecţionare a educatorului) (cf. P. Popescu, I.T. Radu, 1982, p. 196). Tabloul funcţiilor îşi schimbă din nou nuanţa în ultimul deceniu, cel puţin pe terenul didacticii româneşti. Concret, într-o lucrare datorată unui prestigios colectiv, apare o variantă menţionând funcţiile de: moment al conexiunii inverse (feedback); măsurare a progresului elevului; factor motivaţional; reper al autoevaluării; factor reglator pentru activitatea elevului, a profesorului, a părinţilor (I. Radu, 1995, pp.258-259). Cum se vede, deşi ideea nu este departe de sistematizările anterioare, secvenţierea explicaţiilor este alta. La rândul lui, Serviciul Naţional de Evaluare şi Examinare (mai departe în text, va apărea numai abreviat SNEE) difuzează în întreaga reţea de educaţie varianta sa privind funcţiile aici în discuţie, grupându-le pe două categorii: generale şi specifice. Funcţiile generale se concretizează în: una diagnostică, adică de depistare a minusurilor elevului, în vederea înlăturării lor; una prognostică, adică de anticipare a performanţelor posibile în viitor; alta de selecţie, care să permită clasificarea

elevilor; alta de certificare, adică dovada posedării unor cunoştinţe şi competenţe la încheierea unei perioade semnificative de studiu: un ciclu, o formă de şcolarizare (aceasta din urmă nefiind specificată peste tot); cele specifice, în: una motivaţională, constând din stimularea activităţii de învăţare prin feedback-ul pozitiv oferit de apreciere; alta de orientare şcolară şi profesională, obiectivată în furnizarea de informaţii utile în vederea alegerii şcolii convenabile, sau a profesiei compatibile cu înclinaţiile şi deschiderile elevului. În acelaşi timp cu aceste formulări ale SNEE, apăreau alte propuneri de funcţii ale evaluării, în cadrul unei lucrări special consacrată evaluării şcolare (Strungă, C., 1999), după cum urmează: o funcţie "praxiologică" (zisă şi "operaţională", adică de activizare a procesului didactic); una "axiologică" (de asigurare a "comunicării între lumea valorilor şi universul cunoaşterii"); una "constatativă" (cu rol diagnostic, adică de învederare a realizărilor şi nereuşitelor, în perspectiva măsurilor de optimizare); una "de echilibrare" sau ("de reglare" a procesului, graţie feedback-ului); una "prognostică" (explicată la fel ca în celelalte surse); una "morală" (concretizată în ţinuta imparţială a aprecierii, care să fie transferabilă din şcoală în toate instituţiile sociale) (lucr. cit., p.27 urm.).

O renuanţare a opiniei unuia dintre autori aduce o nouă configuraţie a funcţiilor în discuţie, astfel: funcţii generale, "revenind acţiunilor evaluative, oricare ar fi obiectul acestora"; funcţii specifice, "decurgând din caracteristicile domeniului de desfăşurare a actului de evaluare" (cf. I.T. Radu, 2000, p. 68). Nominalizate, cele generale constau din: "constatare" a stării de fapt (însoţită de aprecierea necesară), "diagnoză etiologică" (adică de relevare a factorilor care au determinat-o), "predicţie" (anticipare, pe baza celor constatate, a rezultatelor viitoare); la rândul lor, cele trei funcţii specifice vizează relaţia dintre procesul de învăţământ şi societate şi se concretizează în: informarea sistemului social asupra eficienţei procesului; "medierea relaţiei dintre produsele sistemului şcolar şi nevoile sociale", în perspectiva punerii lor de acord; asigurarea feedback-ului necesar reglării interne a procesului (Idem, p. 68-71).

Autorii contemporani de "ultimă oră” fac şi ei sistematizări ale funcţiilor evaluării, încercând să redea, în relativ puţine cuvinte, nuanţările pe care le socotesc destul de cuprinzătoare. Astfel, C. Stan (cf. 2001) menţionează funcţiile: constatativă (de a informa asupra "gradului de optimalitate a procesului de învăţământ"); diagnostică (de a scoate în relief insuficienţele pregătirii elevului şi cauzele lor); prognostică (cum să fie restructurate strategiile didactice, ca rezultatele viitoare să se îmbunătăţească); motivaţională (sancţiunea sau recompensa stimulează elevul să înveţe); decizională (asupra locului elevului în ierarhia clasei, conform normelor docimologice); informaţională (pentru elev, părinţi, societate, cu privire la nivelul de realizare a obiectivelor educaţionale). În principiu aceeaşi opţiune cu C. Stan îşi exprimă C. Cucoş (2002), diferenţa dintre cei doi constând din adăugarea de către ultimul a unei singure funcţii, cea "pedagogică", detaliată în conştientizarea, motivarea, stimularea, orientarea elevului, precum şi în feedback pentru profesor.

Aflaţi la finele acestui lung repertoriu de opinii asupra funcţiilor, ne întrebăm dacă este posibilă o compatibilizare a lor, pe baza căreia să rezulte o sinteză acceptabilă şi totodată o linie de urmat pe ansamblul demersului de faţă. Răspunsul este unul optimist, adică afirmativ, păstrând, fireşte, o marjă de relativitate, adică o deschidere pentru eventuale alte intervenţii

CONSTANTIN MOISE

analitice şi propuneri. Oscilaţia opiniilor trebuie văzută ca un semn că teoria evaluării este încă în curs de formare. Iar între puţinele merite pe care ni le apropriem este acela de a fi pus faţă în faţă, relativ amănunţit, opţiunile atâtor autori, încercând să valorificăm din fiecare câte ceva.

Primul lucru pe care vrem să-l susţinem este că din toate variantele enumerate (sau aproape din toate) reies două categorii de funcţii, cum cu dreptate remarca I.T. Radu (1981): funcţii sociale de o parte, funcţii pedagogice de alta. În rândul funcţiilor sociale, esenţială este una: asigurarea feedback-ului necesar societăţii, cu privire la realizarea obiectivelor proiectate de ea şi puse în sarcina şcolii, vizând atât nivelul pregătirii elevilor (pe tot parcursul procesului) cât şi numărul de absolvenţi şi calităţile lor culturale, profesionale, umane, la finele procesului. În cadrul funcţiilor pedagogice, primordiale şi generice pentru toate celelalte sunt două: una orientativ -ameliorativă şi una de decizie prin notare. Toate celelalte, menţionate de autorii citaţi, pot fi cuprinse foarte bine în fondul acestora două, ca aspecte implicite ale lor. Drept urmare, prognoza, diagnoza, orientarea şcolară, feedback-ul pentru profesor pot fi interpretate ca aspecte alcătuitoare ale funcţiei orientativ-ameliorative, după cum certificarea, clasificarea, selecţia se înscriu foarte clar în funcţia de decizie prin notă, decizie care va contribui la întocmirea portretului axiologic şi social al subiectului care învaţă.

În ce priveşte celelalte funcţii, menţionate singular de unii dintre autori, le vom putea socoti nuanţări personale, pe fondul celor de mai sus (cum este cazul funcţiei educative, după P. Popescu şi I.T. Radu; al celei morale, praxiologice, axiologice, după C. Strungă ş.a.).

Precizăm, de asemenea, că în tot demersul nostru care va urma, va trebui să ne raportăm la nomenclatura (adică la cele şase funcţii: prognostică, diagnostică, de certificare, de clasificare, motivaţională, de orientare şcolară şi profesională), propusă de către oficialităţile în domeniu, respectiv de către SNEE, date fiind reglementările existente pe "teren" românesc, prin care această nomenclatură a devenit deja un "instrument de lucru" în reţeaua şcolară.

IV. TIPURI DE EVALUARE A RANDAMENTULUI ŞCOLAR

Şi acest subiect a prilejuit o pluralitate de opinii şi nuanţări, mergând de la simplitate absolută până la preţiozitate. Cauza multiplelor structuri în care se face asamblarea tipurilor se află fie în criteriul utilizat (şi uneori insuficient clarificat), fie în orientarea doctrinară particulară a autorilor, fie pur şi simplu în modul personal de mânuire a limbajului specialităţii. De aici va decurge necesitatea prezentării şi explicării unui eşantion de opinii comparabil ca întindere cu cel de mai sus, privitor la funcţiile evaluării. Prezentarea de mai jos va cuprinde şi un minim de istorie, pentru a sugera cât mai bine cauza divergenţelor de opinie actuale, multe dintre ele fiind datorate simplelor influenţe de conjunctură, sau grabei cu care a fost acceptat un punct de vedere sau altul.

IV.1. După cum este citată de diferiţii comentatori, prima tipologie (în ordine cronologică) pare să aparţină lui Michael Scriven (1967) şi cuprinde tipurile: evaluare formativă şi evaluare sumativă. Ceea ce este interesant de constatat este că ea nu se limitează la rezultatele şi la îndrumarea elevului, accentul căzând pe evaluarea procesului în scopul ameliorării lui. Ce este drept, constatarea calităţii procesului se realizează prin intermediul rezultatelor elevului.

Ce înseamnă evaluare formativă, ce înseamnă evaluare sumativă, în acest context? Aflăm prin intermediul lui R. Gagne şi colaboratorilor săi: "Unul din scopurile pentru care se culeg date asupra valorii unui program instrucţional este acela de a lua decizii asupra modalităţilor de revizuire a acestuia în timpul desfăşurării sale (s.n. - C.M.). Cu alte cuvinte, datele adunate şi interpretate în cadrul fazei de desfăşurare sunt folosite, pentru a forma programul instrucţional însuşi. Dacă se descoperă prin evaluare … că tema propusă nu-şi atinge obiectivele, această informaţie este folosită pentru a se revizui lecţia sau a se înlocui părţi ale temei (s.n.-C.M.), în încercarea de a înlătura defectele care au ieşit la iveală" (cf. M. Scriven, apud Gagné şi Briggs, 1977, p. 258). Cum se precizează în text, avem a face cu o evaluare pentru optimizarea programului de instruire, iar nu în scopul clasificării elevilor. Când aceasta se produce pe părţi limitate, chiar pe parcursul derulării programului, evaluarea se cheamă formativă. Spre deosebire de ea, deşi urmăreşte prioritar tot ajustarea programului de instruire, evaluarea sumativă se referă la părţi mai cuprinzătoare din curs sau la cursul întreg, ea având loc la finele acelor părţi sau la finele cursului în ansamblu: "Evaluarea sumativă are loc de obicei atunci când s-a terminat desfăşurarea unei unităţi instrucţionale, mai degrabă decât în timpul acestei desfăşurări ….". În general, evaluarea sumativă se ocupă de eficacitatea unui sistem instrucţional, a unui curs întreg sau a unei teme întregi. Evaluarea se numeşte sumativă deoarece urmăreşte obţinerea unor date despre efectele sumative ale unui set de lecţii care alcătuiesc o unitate mai mare a instruirii"; iar decizia "pentru care sunt utile datele evaluării sumative se referă la faptul dacă un curs nou sau altă unitate este mai bună decât unitatea înlocuită …" (Idem).

Din cele exprimate aici de către Scriven despre evaluarea formativă vs. sumativă, reiese efectul acestora asupra procesului. Nu este rostit şi impactul celor două tipuri de evaluare - formativă şi sumativă - asupra elevului, adică: îl orientează îl clasifică? NU se precizează. Acest impact va fi arătat mai târziu, de către Bloom şi colaboratorii săi, într-o lucrare consacrată special celor două tipuri de evaluare (cf. Bloom şi colab., 1971).

IV.2. Tipologia pe care Bloom o propune este cea care include evaluarea iniţială, alături de evaluarea continuă (denumită şi formativă) şi de evaluarea sumativă (lucr.cit., p.14); aşadar, cu un tip în plus faţă de Scriven. Începând de aici, această nouă formulă, cu trei tipuri de evaluare (iniţială, formativă, sumativă) va apărea, în opinia mai tuturor autorilor, cu unele diferenţieri de nuanţă, până la noi.

Evaluarea iniţială, adică cea concepută şi înfăptuită înainte de începerea procesului, are rolul să constate şi să diagnosticheze aptitudinea şi starea de pregătire a elevului şi să hotărască asupra plasamentului lui la un profil şcolar sau într-o grupă de nivel potrivită. Se realizează prin înregistrarea achiziţiilor anterioare, teste de diagnostic şi de plasament, sau

CONSTANTIN MOISE

teste de aptitudini, relevante pentru alegerea, de către sau pentru elev, a alternativei de studiu în etapa care urmează.

Este locul unde trebuie să facem o observaţie, anume: enumerarea de către autor, între instrumentele acestei evaluări, şi a altor teste decât cele de randament (adică în afara celor docimologice în sens strict) ne sugerează de ce autorii americani preferă termenul evaluare celui de docimologie: pentru că, aşa cum vom vedea mai departe, evaluarea rezultatelor elevului (deci cea din sfera docimologiei) se împleteşte cu cea de determinare a aptitudinilor elevului la un moment dat, ceea ce nu mai "cade" în domeniul docimologiei, ci în cel al investigării psihologice (vezi mai departe definirea testelor docimologice).


Explicaţi şi conchideţi de ce autorii menţionaţi mai sus nu consideră proprie folosirea termenului docimologie, respectiv expresiei activitate docimologică.

Evaluarea formativă, la rândul ei, este pusă în discuţie pornind de la punctul de vedere al lui Scriven. Bloom afirmă: „În concepţia sa (a lui Scriven - n.n.- C.M.), evaluarea formativă implică culegerea datelor relevante pe timpul constituirii şi probării unui nou curriculum, astfel că revizuirile curriculumului să se poată baza pe aceste evidenţe. Noi privim evaluarea formativă ca fiind utilizată nu numai pentru alcătuirea programului de instruire…” (s. n. -C.M.); "Evaluarea formativă înseamnă pentru noi folosirea sistematică a evaluării în procesul construirii curriculumului, în cel al predării şi al învăţării, cu scopul îmbunătăţirii oricăruia dintre aceste trei procese" (s.n. - C.M.) (Bloom şi colab., 1971, p.117). Cum se poate observa, Bloom vrea să sublinieze că opinia lui Scriven nu este destul de lămuritoare în privinţa ariei de cuprindere a evaluării formative. Mai precis, nu sunt puse în relief nici preocupările vizând activitatea profesorului (predarea) şi nici cele privind îmbunătăţirea muncii elevului (învăţarea). Şi completează Bloom: "Principalul scop al observaţiilor formative este de a determina gradul de stăpânire a sarcinilor de învăţare date, sau de a preciza partea de sarcini încă nestăpânite … Scopul evaluării formative este nu să-l clasifice sau să-l certifice pe elev, ci să-l ajute şi pe elev şi pe profesor să se concentreze asupra efortului de învăţare special care să-l propulseze pe elev spre această stăpânire".

Şi în legătură cu evaluarea sumativă, Bloom reia opiniile lui Scriven într-o formulă mai completă de interpretare. El consideră că, spre deosebire de cea formativă, evaluarea sumativă este îndreptată spre o "mult mai generală apreciere a gradului în care rezultatele au fost atinse, prin raportare la un întreg curs, sau la o parte substanţială a lui", ceea ce susţinuse şi precedentul. În plus faţă de acesta, Bloom afirmă că alt scop esenţial al evaluării sumative este de "a clasifica elevul şi a raporta acest lucru părinţilor şi administratorilor" (lucr. cit., p. 61). Deosebirea dintre cele două tipuri este semnalată şi prin ritmul lor în timp: dacă testele formative au o frecvenţă curentă, cele sumative se aplică de două sau de trei ori de - a lungul unui curs (Idem). Testelor sumative (ca instrumente proprii acestui tip de evaluare) le atribuie şi alte roluri, interferente cu ale testelor formative: certificarea deprinderilor şi abilităţilor, predicţia succesului în cursurile următoare, moment al iniţierii instruirii în studiul următor,

feedback pentru subiectul care învaţă (elevul, studentul), compararea rezultatelor şcolare ale diferitelor grupuri.

Pe ţesătura schemei de interpretare datorată lui Bloom şi preluată de cei care au urmat, se vor alcătui o mulţime de nuanţări particulare ale tipurilor citate, precum şi adăugiri de la autor la autor.

IV.3. În anii ’70, G. De Landsheere venea cu altă sistematizare. Aceasta prelua de la Bloom tipurile: formativă şi sumativă, pe care le va explica în felul său, generând unele clarificări importante, dar şi o nouă relativă complicaţie, cum se va vedea. Iată opinia cunoscutului docimolog belgian: „Aprecierea formativă constă deci în a descompune o sarcină, un curs, o materie … în unităţi şi a determina, pentru fiecare unitate, în ce măsură un elev a învins o dificultate. Este vorba deci de o operaţie diagnostică. … În orice caz, aprecierea formativă are ca unic scop să recunoască unde întâmpină elevul o dificultate, în ce constă ea şi să-l informeze asupra celor constatate.” Această apreciere nu se exprimă în note şi cu atât mai puţin în scoruri. La rândul ei şi spre deosebire de cea formativă, evaluarea sumativă "se adresează fie unei părţi importante dintr-un curs, fie chiar cursului întreg … Deosebirea fundamentală constă mai puţin în volumul procesului de învăţare (sublinierea noastră - C. M.), cât în obiectul aprecierii. Aprecierea sumativă se exprimă printr-un scor" (Idem, p. 223). Complicaţia pe care o anticipam mai sus se concretizează chiar în această interpretare a evaluării sumative Este vorba despre un feedback pentru elev şi pentru profesor" (cf. 1975, p. 213), nu esenţial asociată cu volumul învăţării, cât cu încheierea aprecierii prin notă.

Odată cu cele de mai sus, Landsheere lansa conceptele de evaluare normativă şi evaluare criterială, pe care le comenta pe fondul etalonării testelor, în vederea notării obiective. Aprecierea normativă face trimitere la o normă, adică la "media grupului de referinţă. Testele etalonate în acest mod se numesc din ce în ce mai des teste normative (norm referenced tests), denumire care, desigur, nu este cea mai fericită, dar care a şi intrat în uz" (idem, p. 152). Definirea mai clară apărea într-o ediţie ulterioară a lucrării citate mai sus: "Prin evaluarea normativă se interpretează scorul obţinut în urma unui test clasic de inventariere a cunoştinţelor sau de inteligenţă, iar acest scor este plasat într-o distribuţie statistică: performanţa unui individ este judecată prin raportare la performanţa altuia … distribuţia performanţelor constituind norma" (apud G. Meyer, 2000, p. 27). Cât priveşte evaluarea criterială, acelaşi autor afirmă că "nu mai avem a face cu un grup de referinţă", ci cu raportarea comportamentului realizat de elev doar la obiectivele propuse, însuşi instrumentul măsurării fiind testele axate pe obiective (criterion referenced tests). Altfel spus, raportul se face între nivelul rezultatelor elevului la un moment dat şi fiecare obiectiv ce trebuie atins (cf. De Landsheere, 1975, p. 152).


Redaţi noutatea pe care o aduce, dar şi complicaţia pe care o provoacă Landsheere prin această nuanţare.

CONSTANTIN MOISE

IV.4. Când Bloom revenea (1979) şi adopta aceeaşi distincţie ca şi Landsheere, făcea şi alte precizări, privind atât definirea mai limpede a celor două tipuri de evaluare (normativă şi criterială), cât şi raportul dintre acestea şi alte tipuri: evaluarea sumativă are două ipostaze, adică una normativă (care stabileşte gradul în care au fost atinse obiectivele, comparându-i pe elevi între ei) şi alta criterială (care compară performanţele realizate de fiecare numai cu cele aşteptate) (cf. Bloom, B., 1979, apud Meyer, 2000). Aşadar, cele două sunt nuanţe ale evaluării sumative, cea formativă îmbrăcând doar nuanţa criterială.

IV.5. O intervenţie ulterioară celor de mai sus, datorată lui R. Tousignant (1982), operează nuanţări noi în cadrul evaluării formative. Concret, evaluarea formativă se poate obiectiva, după criteriul temporal, în trei variante: una iniţială, "pentru a rezuma cunoştinţele dobândite anterior şi pentru a-l ajuta pe profesor să aleagă activităţile cele mai potrivite nevoilor fiecărui elev" (deci de orientare); una pe parcursul învăţării, "pentru a sugera noi activităţi apte să remedieze dificultăţile", numită diagnostică sau continuă; alta la finele procesului, denumită de autor sumativă (sic), care "face bilanţul obiectivelor realizate, pentru a planifica mai bine cursurile viitoare" (loc cit., apud Meyer, 2000, p.28). Alte două precizări propuse de acest autor apar astfel: "instrumentarea ei privilegiată (a evaluării formative - n.n., C.M.) este evaluarea criterială" (s.n.- C.M.); "actorul" ei poate fi însuşi elevul, evaluarea formativă devenind astfel şi autoevaluare.

IV.6. La rândul lor, autorii J.-J. Bonniol, G. Nunziati (1990) consideră mai potrivit, în loc de atributul "formativă", pe cel de "formatoare": "Obiectivelor de reglare pedagogică, de gestionarea erorilor şi de întărire a reuşitelor, obiective comune diferitelor modele de evaluare formativă, dispozitivul de evaluare formatoare le mai adaugă o exigenţă, care îl priveşte pe elev: reprezentarea corectă a scopurilor, planificarea acţiunii, însuşirea criteriilor şi autogestionarea erorilor"; altfel spus, "evaluarea formatoare îl ajută pe elev să înveţe cerându-i să anticipeze" (cf. Meyer, lucr.cit., p. 33). Reţinem şi acest tip, dată fiind eventualitatea apariţiei lui în context şi necesitatea explicaţiilor de rigoare.

IV.7. Opinia autoarei Genevieve Meyer (cf. 2000, pp. 38-39), rostită la sfârşitul unei analize, este una de maximă simplificare: să se renunţe la toate atributele ataşate evaluării, reţinându-se numai două, care să individualizeze două tipuri de evaluare, adică: evaluare formativă şi evaluare normativă (în loc de "sumativă"); cea formativă, cu funcţie de reechilibrare a procesului pe tot parcursul învăţării; cea normativă, cu funcţie de orientare (la începutul procesului), funcţie de ierarhizare (pe parcursul învăţării, prin evaluări fracţionate) şi rol de atestare (la sfârşitul itinerarului); cea formativă are ca obiect procesele implicate în învăţare, este internă şi multireferenţială, iar ca instrumente foloseşte concluziile teoriilor învăţării; cea normativă are ca obiect produsul învăţării (capacităţi, competenţe), este externă şi unireferenţială, folosind ca instrumente notele şi calificativele (instrumente relative) pe de o parte, iar pe de alta dihotomiile da/nu, reuşit/nereuşit (instrumente binare) (Meyer, 2000, p.40).

IV.8. Variantele româneşti ale tipurilor de evaluare se păstrează, în linii mari, pe aceleaşi coordonate cu cele prezentate până aici, şi ele fiind marcate pe alocuri de nuanţări ce ţin de firescul discursului fiecărui autor. Astfel putem conchide că, de regulă, comentariul autorilor români gravitează doar în jurul evaluării formative şi sumative, deşi le cuprind pe

acestea în noţiunea gen de strategie, iar nu în cea de tip, cum apar la Bloom, De Landsheere, Meyer etc. Iată câteva dintre aceste opinii. I.T. Radu, de pildă, expune următoarea listă de "tipuri de strategii de evaluare", identificate după o multitudine de criterii (Radu, 2000, p. 137 urm.): după "situaţia de evaluare" (rezultând tipurile: evaluare în circumstanţe obişnuite vs. evaluare specifică, bazate pe o elaborare adecvată); după funcţia dominantă (evaluare diagnostică, din care să reiasă punctele tari şi cele slabe ale elevului şi cauzele lor, vs. evaluare prognostică, cu rol predictiv); după "dimensiunea secvenţei evaluate" (evaluare "de bilanţ", la final de semestru, an şcolar, ciclu şcolar; evaluare "dinamică", efectuată pe parcursul procesului de instruire, pentru a marca progresele sau regresele elevului"; evaluare formatoare, care să învedereze - pe lângă rezultatele elevului - şi procesele de ordin cognitiv şi atitudinile aflate la baza acestor rezultate); după "autorul acţiunii evaluative" (heteroevaluare, când este efectuată de altcineva decât elevul însuşi; autoevaluare, când o face elevul asupra sieşi); după conţinutul predominant evaluat ("evaluare preponderent pedagogică", referindu-se la achiziţiile elevilor pe parcursul instruirii, vs. "preponderent psihologică", vizând aptitudinea de învăţare a subiecţilor, deci ce "ar putea" să realizeze); după "modul de integrare" în procesul didactic (tipurile: evaluare iniţială; evaluare pe parcursul procesului didactic - denumită din nou "dinamică" - având nuanţele: "formativă" şi "cumulativă"; "evaluare finală" cu caracter de bilanţ). Atenţia acestui autor (şi meritul, în acelaşi timp) nu se focalizează doar asupra delimitării tipurilor exprimate aici, cât mai ales asupra caracterizării, prin opoziţie, a celei cumulative şi a celei formative, cu o pledoarie consistentă în favoarea celei formative. La obiect (lucr. cit., p. 153 urm.), cea sumativă are caracterele: este efectuată "punctual" şi se încheie cu cea de bilanţ; efectuându-se prin sondaj, nu poate oferi informaţii complete asupra tuturor conţinuturilor esenţiale; este moştenită din tradiţie; arată la ce nivel a ajuns învăţarea, sancţionând-o prin notă, pozitiv sau negativ; funcţiile de bază constau din verificare, comunicare, certificare; are fidelitate scăzută şi efect slab de reglare a procesului. La rândul ei (idem, p.164 urm.), cea formativă: se extinde şi asupra procesului; prezintă interes pentru evoluţia subiectului care învaţă, putând reliefa atât reuşitele, cât şi lacunele; are efecte reglatorii decisive; se produce predominant pe parcurs, prin interpătrundere cu predarea şi învăţarea; diminuează caracterul de sondaj, până la excludere; se instituie ca un feedback continuu, în sprijinul activităţii de învăţare; face posibilă abordarea mai analitică a învăţării, deschizând drumul unei "reglări punctuale" a procesului; pe baza ei, poate fi promovată o pedagogie "corectivă".

IV.9. Alţi autori care şi-au exprimat opiniile pe teren românesc s-au arătat fideli în principiu aceleiaşi linii împărtăşite de I.T. Radu. Îi menţionăm pe scurt. C. Strungă se arată de acord cu cele două "strategii" (formativă şi sumativă), folosind drept criteriu "raportul dintre predare, evaluare, învăţare": separarea de predare şi învăţare este specifică evaluării sumative; "împletirea celor trei este condiţia sine qua non a evaluării formative (C. Strungă, 1999, p. 89 urm.). În fine, C. Cucoş (2002, p. 379), sintetizând şi alte opinii, conchide că diferitele "forme" de evaluare reies din aplicarea a trei criterii: cel cantitativ, rezultând evaluarea parţială şi globală; cel temporal, din care rezultă evaluarea iniţială, cea continuă şi cea finală; criteriul sistemului de referinţă (după C. Stan, 2000), conducând la tipurile: evaluare formativă, evaluare clasificatorie, evaluare "autocentrică".

CONSTANTIN MOISE

Cum se poate constata, există diferenţe între opiniile atâtor autori, dar există şi destule puncte comune; în intervenţiile lor sunt multe aspecte clare, încât consideraţi fiecare separat, fiecăruia i s-ar putea da dreptate; neclarităţile apar, de regulă, când îi situăm împreună, iar diferitele tipuri de evaluare, propuse după criterii diferite sunt aşezate în aceeaşi listă.

Poziţia cea mai raţională trebuie să fie una de valorificare a tuturor acestor contribuţii, meritorii prin însuşi faptul că au fost formulate, fiecare conţinând „partea ei de adevăr”. Vom considera astfel că Scriven are meritul de a fi delimitat primul cele două tipuri de evaluare: sumativă vs. formativă; că Bloom le-a raportat, tot primul, la urmările lor asupra elevului şi a propus tipul de evaluare iniţială; că De Landsheere a făcut delimitările între normativ şi criterial; că G. Meyer a conceput simplificarea tipurilor până la formula: evaluare normativă - evaluare formativă; că I.T. Radu şi C. Stan propun şi alte criterii de determinare a tipurilor de evaluare; că C. Strungă şi C. Cucoş întreprind nişte interpretări diferenţiatoare sau unificatoare, lista putând continua.

Dar nu poate fi ignorată, pe acest fond, existenţa unor interferenţe de criterii sau chiar numai unor nuanţări lingvistice, conducând la neclarităţile care persistă. De pildă, aşezarea evaluării iniţiale în aceeaşi clasificare cu cea formativă şi cea sumativă pare să încalce unitatea de criteriu; stabilirea şi unei specii de evaluare sumativă, inclusă în cea formativă (cf. Tousignant, 1982),apare ca o excepţie ciudată; inexistenţa, încă, a unei explicaţii clare privind caracterul final sau nonfinal al evaluării sumative, a determinat-o pe G. Meyer să renunţe la această titulatură, înlocuind-o cu cea de evaluare normativă; conceperea unor prea complicate criterii de grupare de către unii autori (cf. I.T. Radu, 2000), ceea ce generează apariţia unuia şi aceluiaşi tip după criterii diferite(de pildă, tipul evaluare dinamică); accepţiunea dată de către unii autori evaluării criteriale (cf. C. Stan, lucr.cit.), diferit de toţi autorii precedenţi, face să apară alte complicaţii de interpretare; ca să cităm pe cele mai vizibile dintre cauzele care iscau judecata: "De altfel, ca simplu "cititor" al literaturii din domeniu, sesizăm o literatură prolixă, deosebit de deturnantă, fiecare autor propunând clasificări, viziuni, valorizări ce cu greu pot fi compatibilizate, sintetizate " (cf. C. Cucoş, 2002).

Procedând optimist, putem încerca o compatibilizare: să continuăm demersul întreprins şi de toţi autorii citaţi, considerând că într-adevăr este necesară o clasificare nuanţată, după mai multe criterii relevante. Astfel, după criteriul timp, putem delimita o evaluare iniţială, practicată prin concursul de admitere, prin testările la începutul unui nou "parcurs" şcolar (de pildă, profesorul de matematică testează nivelul elevilor la începutul clasei a cincea, pentru a şti la ce nivel să desfăşoare predarea în anul de studiu respectiv), sau prin testele de aptitudini, tot în vederea abordării unei materii încă nestudiate (acestea nemaiîncadrându-se în sfera docimologică); una concomitentă şi prin alternare sau chiar interpătrundere cu predarea şi învăţarea (continuă sau nu, deci nu neapărat continuă), obiectivată în ascultarea curentă, lucrările de control curente sau, mai nou, fişele de evaluare (înlocuite, începând cu clase gimnaziale, de extemporalul tradiţional sau de test), verificarea la sfârşitul fiecărui capitol, şi verificarea periodică, fie scrisă (teza tradiţională), fie practică; una finală, la noi practicându-se, în învăţământul preuniversitar, după mai mulţi ani de studiu, cum este cazul examenului de capacitate şi al bacalaureatului.

După criteriul volumului de conţinuturi vizate, se pot identifica: evaluarea secvenţială de o parte, globală de alta. În acest caz, nu mai putem opera cu mărimi absolute. Concret se pot încadra în chip absolut în evaluarea globală respectiv secvenţială numai extremele, adică verificarea din fiecare lecţie - întotdeauna secvenţială, sau examenul - întotdeauna încadrat în cea globală; celelalte îşi capătă statutul de secvenţiale sau globale după elementul de comparaţie (de pildă, dacă o verificare la sfârşit de capitol este comparată cu teza, este secvenţială; dacă este pusă alături de cea din fiecare lecţie, este globală), astfel că probabil mai adecvată ar fi titulatura: de mai mare sau mai mică globalitate. Considerarea criteriului de faţă ar fi şi modul de a ieşi din dilema evaluării sumative, care pentru unii autori face obligatoriu trimitere la cantitatea de conţinuturi, în timp ce pentru alţii această cantitate nu mai contează, esenţială devenind atribuirea unui scor, din care să rezulte nota celui examinat (cum se exprimă De Landsheere mai sus).

Ar trebui invocat, de asemenea, criteriul funcţiei îndeplinite sau al scopului urmărit de fiecare act de evaluare, după care rezultă tipurile evaluare de orientare şi ameliorare vs. evaluare de decizie prin notă, sub "umbrela" celei dintâi încăpând cea formativă, cea prognostică şi cea diagnostică, iar cea din urmă asumându-şi funcţiile şi luând denumirile: de certificare, de selecţie, de clasificare şi, din nou, prognostică. Este replica noastră la propunerea autoarei G. Meyer (evaluare formativă vs. evaluare normativă), propunere de altfel valoroasă, pe fondul complicat al atâtor opţiuni anterioare, mai ales având în vedere definirea neclară a evaluării sumative, când se doreşte ca aceasta să fie raportată obligatoriu la parametrii timp şi cantitate. Am putea exemplifica pentru evaluarea formativă cu acele lecţii organizate special fie pentru revederea materiei pentru teză, fie ca recapitulări pentru bacalaureat sau alt examen, ele meritându-şi în măsură egală numele de lecţii de evaluare formativă; după cum am putea consacra lecţii speciale ascultării şi notării elevilor, intitulându-le lecţii de evaluare finalizată prin notă.

Elementul de referinţă constituie şi el un criteriu foarte limpede. După el vom delimita evaluarea criterială şi evaluarea normativă, prima având ca element de referinţă numai obiectivele de atins, în timp ce ultima adaugă acestui reper un grup de referinţă (de pildă, grupul-clasă), din care face parte cel examinat şi cu rezultatele căruia sunt comparate rezultatele lui, stabilindu-i-se un loc pe scara rezultatelor grupului. După acelaşi criteriu, am putea reţine, fie şi în subsidiar, propunerea tipului evaluare autoreferenţială (cf. C. Stan, lucr.cit.), elementul de referinţă fiind însuşi subiectul evaluat.

Deşi aceste criterii ar putea părea suficiente, nu putem lăsa neluat în considerare unul care a devenit deja loc comun, autori semnificativi acordându-i spaţiu şi importanţă apreciabile: criteriul care răspunde la întrebarea "Cine este examinatorul?". După el rezultă tipurile evaluare internă vs. evaluare externă. Prima este săvârşită de cel care a predat la clasa respectivă, având loc pe parcursul întregului proces şi cumulând toate funcţiile şi relaţionările cu tipurile delimitate după celelalte criterii, fiind deci realizată de fiecare profesor la clasa lui. Cea de a doua se realizează de alţii decât cel care a predat, având ca obiect , de regulă, un volum mare de conţinuturi (ca în cazul examenelor de capacitate, de bacalaureat etc.). Rostul ei este nu numai unul de prevenire a eventualei subiectivităţi a

CONSTANTIN MOISE

examinatorului "intern", ci şi de a asigura o exigenţă unitară a examinării, pe tipurile de instituţii şi pe spaţii teritoriale semnificative.

Aşadar, diferenţiind criteriile, vom reţine tipurile: iniţială, concomitentă (continuă, integrată), finală; secvenţială, globală; de orientare şi ameliorare (formativă, prognostică, diagnostică), de decizie prin notă

(sumativă) (de certificare, de clasificare, de selecţie); normativă, criterială, autoreferenţială; internă, externă.

Iată rezumatul cel mai simplu, după opinia noastră, al unui demers de delimitare a tipurilor de evaluare. Finalizarea lui se bazează pe toate contribuţiile menţionate; în mod special pe sugestiile lui Genevieve Meyer privind simplificarea tipurilor şi renunţarea la atributul "sumativă", pe care noi îl mai păstrăm doar ca echivalent aproximativ al perifrazei "de decizie prin notă", din respect pentru tradiţie; pe multitudinea criteriilor propuse de toţi autorii citaţi, preluându-le selectiv şi adăugând nuanţările ce ne aparţin

Mai facem precizarea că aceste tipuri se pot combina şi pot "convieţui" în unul şi acelaşi act evaluativ, în cele mai diverse formule. Ca să ne limităm la un singur exemplu, un concurs de admitere poate fi considerat în acelaşi timp în categoriile: evaluare iniţială, globală, de decizie prin notă în scopul selecţiei, normativă, externă; ceea ce s-ar putea demonstra si cu alte exemple

V. METODE DE EVALUARE

V.1. PREZENTARE GENERALĂ

Analog demersului de predare şi celui de învăţare, şi evaluarea şi-a constituit sistemul său de metode prin care să se realizeze. Situaţia existentă în diversele surse actuale ne obligă la câteva explicaţii preliminare. De pildă, sursele româneşti actuale menţionează: 1) metode de verificare (constatare):

a) de bază: chestionarea orală curentă (în fiecare lecţie mixtă sau în lecţii special destinate); verificarea scrisă curentă (tradiţionalul extemporal, sau, la clasele mici, lucrarea de control); verificarea practică curentă (impusă de conţinutul specific al unor discipline de învăţământ); verificarea periodică în scris (teza trimestrială sau semestrială); verificarea practică periodică; verificarea cu caracter global, fie în varianta examenului final, fie a examenului concurs de admitere, fiecare dintre ele putând lua forma orală, scrisă, practică, sau a unei combinaţii dintre cele trei forme; verificarea la sfârşitul fiecărui capitol; testul docimologic cu toate variantele lui, respectiv: curent, periodic, final;

b) complementare: observarea sistematică a elevilor; investigaţia; proiectul; portofoliul; autoevaluarea;

2) metode de apreciere: aprecierea verbală, cu rol de orientare; notarea.

Iată şi categoriile de metode de evaluare după sistematizarea aparţinând unui areal pedagogic diferit drastic de concepţia noastră tradiţională (cf. N. Gronlund, 1965;1971; D. Payne, 1968):1) teste de tot felul (focalizate fie în jurul determinării aptitudinii de învăţare, fie al

randamentului şcolar), sistematizate dihotomic sau trihotomic, astfel: orale vs. scrise; informale vs. standardizate; obiective vs. tip eseu; de "stăpânire"; de orientare, diagnostice; de performanţă, verbale, nonverbale; de viteză vs. de forţă;

2) tehnici de autoprezentare: interviul şi chestionarul; 3) tehnici observaţionale: înregistrări "anecdotale" (după relatare); liste de control

(checklists); scale ierarhice (rating scales); tehnici sociometrice (teste de "preferinţe" şi de autopercepere).

Am citat şi acest al doilea "inventar" de metode, având în vedere eventuala necesitate a explicării unor deosebiri faţă de sistemul metodelor noastre autohtone, sau posibilele interferenţe între cele două planuri, sau unele adaptări ale lor pe teren românesc.

Trebuie să reţinem unele observaţii privind sistemul de metode prezentat de autorii americani. Una, că evaluarea la care se referă autorii citaţi vizează nu numai rezultatele obţinute de elev la învăţătură, ci şi premisele acestor rezultate (vezi testele diagnostice), sau, în măsură egală, dimensiunile sociale ale personalităţii elevului (vezi tehnicile sociometrice). Alta, că nu pe toate le consideră instrumente de măsurare (vezi tehnicile prin care se

CONSTANTIN MOISE

realizează descrieri calitative), distincţie pe care Gronlund a subliniat-o şi în mod expres, cum s-a văzut în paginile anterioare.

Înainte de a aborda analitic metodele menţionate, este necesar să avertizăm şi asupra calităţilor pe care acestea ar trebui să le îndeplinească. Iată cum apar ele detaliate de un alt autor american (D. Payne, 1968): relevanţa (validitatea), calitatea de a reda comportamentul cerut astfel încât să reiasă clar

legătura cu obiectivul aferent; echilibrul - adică gradul în care proporţia rezultatelor parţiale coincide cu ansamblul

conţinuturilor, ceea ce poate fi schiţat de un tabel de specificaţii; eficienţa - este redată de cantitatea de răspunsuri raportată la timp; obiectivitatea - calitatea de a permite evaluatorilor să cadă de acord cu precizie asupra

răspunsului corect; specificitatea - să măsoare ceea ce este necesar de măsurat în domeniul dat; dificultatea - conceperea probei în aşa fel încât fiecare item să fie rezolvat de jumătate din

grupul testat; discriminarea - calitatea itemilor de a reflecta corect, prin rezultat, diferenţa dintre elevii

buni şi cei slabi din grup; siguranţa (fidelitatea) - calitatea de a conduce la răspunsuri stabile (neschimbate odată cu

repetarea măsurării); corectitudinea (caracterul nepărtinitor) - calitatea de a oferi fiecărui examinat şansa de a-şi

dovedi cunoştinţele; viteza - calitatea probei conform căreia rapiditate rezolvării să nu aibă influenţă

semnificativă asupra calculării scorului.

Cu toate că aceste însuşiri sunt raportate de autorul citat numai la test, făcând precizări până la nivel de item (vezi, la titlul dedicat testului, ce este itemul), ele pot fi considerate aplicabile oricărei probe, tradiţională sau modernă. Pentru a nu complica prea mult demersul, le vom reţine şi comenta numai pe unele dintre ele, anume: obiectivitatea, fidelitatea, validitatea, dificultatea (rezonabilă), capacitatea de discriminare, cărora le vom adăuga practicabilitatea, având în faţă modelul mai multor autori semnificativi, preocupaţi de tema evaluării: Ausubel şi Robinson (1969; traducerea românească din 1981), De Landsheere (traducerea românească din 1975), Lindeman (traducerea românească din 1978).

V.2. PREZENTARE ANALITICĂ

V.2.1. Metode tradiţionaleSub acest titlu cuprindem toate acele modalităţi de evaluare care, cronologic văzute, au

apărut şi s-au statornicit primele, constituind zestrea tradiţională a teoriei şi practicii româneşti a evaluării şcolare. Constituirea sistemului lor s-a produs treptat, prin contribuţia, nuanţată mai mult sau mai puţin personal, a tuturor autorilor semnificativi de teorie didactică din România, în opera lor putându-se identifica preocupări exprese în acest domeniu. Astfel: I.P.

Eliade (1868, p. 101-113) scria despre "forme examinatoare" (pe atunci, conceptul de metodă de azi era redat prin termenul "formă"), concepute "la fiecare lecţie sau în ore special destinate pentru examen"; E.M. Brandza (1932, p. 172 urm.) menţiona examenele cu caracter global şi termen fix (finale sau de trecere într-un ciclu nou) şi examene "nesorocite", adică fără dată precisă, deci pe tot parcursul procesului; Şt. Bârsănescu (1935) menţiona: "lecţia obişnuită de ascultare", "ascultarea lecţiei de sinteză", "ascultarea scrisă", "ascultarea examen" (lucr. cit., p. 122 urm.), ceea ce se "traduce" prin: verificare orală curentă, extemporal, teză, examen. Aceste modalităţi vor fi reluate de toate cursurile de pedagogie de după al doilea război mondial, cu adăugiri minime. De exemplu, I.Gh. Stanciu le menţiona (1961), adăugându-le "observarea curentă a muncii şi comportării elevilor"; D. Todoran (1964), adăugând verificarea frontală a temelor efectuate acasă; V. Ţârcovnicu (1975) cu adăugarea lucrărilor practice; I. Radu (1979); I. Nicola (1980 şi 1994), încât până azi ele au devenit locuri comune, nemaifiind atribuite unuia sau altuia dintre autori.

Văzute după forma acţiunii care le pune în valoare, metodele de verificare (denumite azi şi "de măsurare"), au fost grupate pe trei categorii: de verificare orală, de verificare scrisă, de verificare practică.

V.2.1.1. Metodele de verificare orală Sunt utilizate în cele mai diverse circumstanţe, date fiind resursele fie de eficienţă, fie

de claritate a demersului, fie de ordin formativ, pe care le implică. O viziune dialectică asupra lor ne obligă să vedem şi eventualele relative inconveniente cu care se însoţesc, chiar dacă nu în mod sistematic.

Verificarea orală curentă (denumită prin tradiţie şi ascultare sau chestionare) se poate produce în două variante, atât după extensia diferită a conţinuturilor pe care le vizează, cât şi după contextul sau tipul de lecţie în care se produc: ascultarea în fiecare lecţie mixtă, de o parte, realizarea mai amplă a aceleiaşi confruntări, în lecţii întregi, de altă parte.

Chestionarea în fiecare lecţie mixtă, reprezentând partea de debut a acestui tip de lecţie, se prezintă ca o conversaţie selectivă, din care să reiasă gradul de însuşire de către elev a conţinuturilor predate în limitele stricte ale lecţiei imediat anterioare. Conţinuturile implicate aici ne apar sub forme multiple, adică: cunoştinţe stăpânite de elevi, dar şi dovezi ale înţelegerii lor de către elev, capacităţi de prelucrare, aplicare, interpretare, includere în "sinteze" mai scurte sau mai largi, sau (în dependenţă de vârsta şi experienţa de învăţare a elevului) chiar de formulare a judecăţilor de valoare corelabile acestor conţinuturi. În această enumerare trebuie să se recunoască suprapunerea ascultării pe nişte obiective, care la rândul lor să se repartizeze pe spaţiul unei întregi taxonomii, cea mai la îndemână fiindu-ne taxonomia lui Bloom (aceasta este şi "etalonul" prezent în toate comentariile americane pe tema evaluării rezultatelor cognitive ale învăţării).

Durata de 15-25 de minute nu îngăduie audierea a mai mult de 3-5 elevi la disciplinele socioumane, până la 6-8 la cele reale, iar în condiţii de dotare modernă (de pildă, existenţa cabinetelor de specialitate înzestrate cu table, dispozitive diverse folosite pentru demonstraţii etc.) acest număr poate fi chiar mai mare.

CONSTANTIN MOISE

Cât priveşte funcţiile acestui fel de evaluare, plecăm de la premisa că principial se au în vedere atât o funcţie orientativ-ameliorativă (formativă), cât şi una decizională prin notă (clasificare). Situaţia concretă nu exclude, însă, schimbarea de accent, acesta putând rămâne prioritar aşezat pe prima funcţie - cea formativă.

Desfăşurarea concretă a verificării de acest fel s-a instituit treptat după "cutumă", ajungând azi la încadrarea în nişte algoritmi, consideraţi de cea mai convenabilă optimalitate. De exemplu, cum se exprimă un autor consacrat în domeniu (I. Radu, 1979 - altul decât I.T. Radu), foarte obişnuită este "formula" care începe cu o conversaţie frontală succintă, după care se stabilesc cu precizie conţinuturile de discutat şi sunt numiţi elevii care, "din bancă" sau "la tablă", vor fi actorii principali ai trecerii în revistă a conţinuturilor proximei lecţii anterioare. În ce îi priveşte pe ceilalţi, participarea lor este necesară din cel puţin următoarele motive: să contribuie la un caracter animat şi nuanţat al evaluării; să-şi verifice propria pregătire prin comparaţie cu principalii chestionaţi (deci să se iniţieze în autoevaluare); să nu-şi formeze, prin neparticipare, tendinţa de a se înstrăina de lecţie.

Întrebările care se formulează sunt grupate de tradiţie în două categorii: întrebări de bază (de "pornire") şi întrebări ajutătoare. Odată pusă întrebarea de bază, se consideră ca o regulă importantă ca elevul să fie lăsat să-şi dezvolte până la capăt răspunsul care i-a fost solicitat. Dacă rezolvarea este corectă, pot urma eventuale intervenţii de adâncire din partea clasei; dacă greşeşte, cea mai indicată procedare este aceea de a fi sprijinit să se autocorecteze; dacă nu reuşeşte, trebuie să intervină ceilalţi; numai dacă şi această încercare este fără succes, se impune rezolvarea de către educator. Nu se consideră indicată "dezmembrarea" răspunsurilor elevului, prin intervenţii la fiecare amănunt greşit, pe parcursul formulării acestora; profitabilă cu adevărat este aprecierea la finele răspunsului, care să vizeze ansamblul lui şi numai pe acest fond erorile din fiecare parte; procedarea contrarie ar produce, pe fondul greşelii, şi un fel de bruiaj absolut în mintea elevului, inducându-i impresia că este incapabil să formuleze un răspuns complet, deci necesitând obligatoriu tutela educatorului. Tot în rândul regulilor elementare se înscrie aceea că, pentru aprecierea elevului cu notă, nu este suficientă solicitarea lui chiar şi foarte restrânsă, ceea ce ar denatura aprecierea, fie în favoarea, fie în defavoarea celui examinat (vezi şi Muster, Hazgan; Popescu, 1969); în această idee a fost propusă o "notare fragmentară", bazată pe o evidenţă de amănunt, în "catalogul educatorului", a prestaţiilor parţiale ale elevului, prin însumarea mai multora trebuind să rezulte o notă "sintetică" (cf. P. Popescu, 1978).

Autorii de teorie pe această temă, arată şi greşelile cele mai frecvente ale începătorilor (dar, adăugăm noi, nu numai ale lor): fie examinarea doar frontală (prin dialog cu întreaga clasă, neglijând deci situarea în prim plan a celor care să fie notaţi), fie exagerarea în sens invers (dialogul doar cu cei "condamnaţi", clasa fiind neglijată); fie insuficienta elaborare a întrebărilor de bază (de pildă, prin formularea imprecisă, de unde suprapunerea lor şi generarea de confuzie; prin enunţul lor în prea multe cuvinte şi idei etc.); fie interpretarea fără discernământ a conceptului de întrebare ajutătoare (de exemplu, în loc să dirijeze elevul spre reflecţie pentru a se autocorecta, îi pun întrebări formale ca: "Mai departe?"; "Şi?", "Altceva?", care nu sunt chiar … ajutătoare); fie limitarea ascultării la repovestirea lecţiei

anterioare (deci fără selecţia celor mai semnificative întrebări); fie atribuirea pur formală a notelor etc.

Pe acest fond şi cu aceste restricţii, trebuie motivată practicarea acestei metode, pe de o parte, şi surprinse dezavantajele ei, pe de alta. Cât priveşte avantajele, s-ar putea menţiona: faptul că uzează de comunicarea directă, îi conferă avantajul de a se putea replia imediat,

asigurând evaluării mersul cel mai convenabil sub aspectul relevanţei şi al nuanţării necesare; altfel zis, examinatul poate fi solicitat să dezvăluie nu numai ce ştie, ci şi ce ar mai trebui să ştie; poate fi dirijat fie doar să "puncteze" aspectele care interesează în prim plan şi să trateze la un nivel analitic mai pronunţat altele, după cum elevul ar trebui să - şi pună în relief o capacitate sau alta;

implică un feedback imediat, ceea ce îi conferă virtutea de a informa elevul chiar "pe viu" asupra nivelului său, din care va decurge şi justificarea eventualei notări; tot din caracterul imediat al feedback-ului decurge conştientizarea rapidă a elevului asupra direcţiei eventualei ameliorări, precum şi posibilitatea scurtării perioadei de producere a ameliorării;

pentru că se realizează pe secvenţe atât de mici, permite cea mai severă continuitate, având împletirea cea mai intimă cu procesul de predare şi deci cele mai vizibile valenţe formative.

La rândul lor, dezavantajele sunt şi ele o realitate, adică: confruntarea directă, în ritmul pe care îl pretinde în mod necesar acest fel de verificare, se

însoţeşte de stări emoţionale stresante pentru aproximativ 60% dintre elevi (cf. I. Radu, 1979), ceea ce, prin procedare excesivă numai pe această cale, poate conduce la stări de veritabilă aversiune faţă de evaluare; este cazul fie al elevilor emotivi, fie al celor cu ritm lent de activitate;

ascultarea pe fragmente mici are, la nivelul unor ansambluri de conţinuturi cuprinzătoare, din principiu o validitate mică;

fărâmiţarea excesivă face, pe de altă parte, ca notarea să nu fie total concludentă; ţinuta orală conduce inevitabil la transparenţă totală; de aici nevoia de a solicita fiecărui

examinat răspuns la alt subiect, ceea ce generează inegalitatea de sarcini; verificările de acest fel sunt mari consumatoare de timp.

Cum verificarea orală curentă reprezintă o specie de conversaţie, ea împletindu-se cel mai strâns cu învăţarea, este necesar ca în limitele ei să fie respectate exigenţele calitative ale întrebărilor şi răspunsurilor, aşa cum au fost formulate în cursul de Teoria instruirii. În sprijinul cursanţilor, le reluăm pe scurt. Astfel, întrebărilor li se pretinde:♦ să fie corect formulate, atât din punct de vedere logic, cât şi gramatical, pentru a fi înţelese

fără efort prea solicitant şi pentru a nu oferi elevului "sugestii" negative de exprimare sau de gândire;

♦ să fie precise (dacă se introduc prin "cum este?", "cum sunt?", "ce poţi spune despre ?", să se enunţe şi criteriul (sub ce aspect "cum"; în ce sens să "putem spune"), fiind chiar mai indicat, în multe cazuri, să renunţăm la astfel de introduceri;

CONSTANTIN MOISE

♦ să aibă concizie convenabilă şi "limită de conţinut" (să nu aibă formulare "dublă" sau "triplă", cerând mai multe răspunsuri în cadrul aceluiaşi enunţ);

♦ să aibă varietate suficientă de cerinţe, tradusă în varietatea nivelului efortului ce trebuie depus de elev (întrebări de simplă reproducere, introduse prin "cine", "când", "care", "unde", "cât"; care pretind explicaţii cauzale, introduse prin "cum", "de ce"; care exprimă situaţii problematice, introduse prin corelativele "dacă…atunci…?"), ceea ce ar asigura acoperirea de principiu a tuturor nivelelor taxonomice din domeniul cognitiv;

♦ să i se asigure elevului timpul de gândire necesar, în funcţie de dificultatea fiecărei întrebări şi prin raportare la individualitatea lui;

♦ să fie evitate sau să fie completate cu cerinţe de justificare a răspunsului întrebările care solicită răspunsuri monosilabice ("da", "nu");

♦ să fie evitate întrebările voit derutante, sau dacă se folosesc să fie conştientizat elevul asupra "regulii jocului".

La rândul lui, răspunsul trebuie "îngrădit" de nişte exigenţe nedezminţite, ştiind că ascultarea constituie, dincolo de verificare, şi o ocazie de exersare a deprinderii elevului de a dialoga corect şi coerent. Drept urmare:♦ şi răspunsului trebuie să i se pretindă corectitudine logică şi de asemenea gramaticală,

examinatorul obligând elevul să se corecteze ori de câte ori se abate de la această exigenţă, indiferent de materia de învăţământ (chiar dacă atunci când se atribuie note, se consideră că logic ar fi, după mai multe opinii, ca greşelile de formă gramaticală să nu fie "penalizate" decât la disciplina la care au fost predate şi exersate, în cazul nostru la limba română);

♦ răspunsul să acopere întreaga sferă a întrebării, exigenţă realizabilă fie prin enumerare ("Care sunt calităţile ale…?" "…sunt următoarele: …"), fie prin exprimarea unei echivalenţe ("Ce înseamnă validitate de conţinut?". "Validitate de conţinut înseamnă…") etc.;

♦ să vizeze precis esenţa întrebării, fără colaterale, fără introduceri care consumă timp şi denaturează răspunsul;

♦ să se conformeze convenţiei stabilite de la început, adică: sunt admise numai răspunsuri sub formă de comunicări complete, sau şi prin comunicări mai concise, chiar eliptice;

♦ să fie drastic evitate, iar când se ivesc, să fie subliniate şi respinse de către examinator, formulările fragmentate, trenante, marcate de adaosuri inestetice şi nefireşti în cadrul comunicării specific umane ("ăăăă…", "îîîîî…"), emisii care pur şi simplu "parazitează" prestaţia examinatului.

Verificarea orală în lecţii special organizate se poate realiza la intervale variabile, în funcţie de vârsta elevilor sau de dificultatea temelor vizate. Diferenţa faţă de verificarea în lecţia mixtă este prezentă şi în planul conţinutului, şi al formei: al conţinutului, constând din cuprinderea materiei predate în mai multe lecţii anterioare (4-6, după experienţa de învăţare a elevilor, dificultatea temelor etc.); al formei şi extensiei în timp (putând ocupa în principiu întreaga durată a orei de clasă şi desfăşurându-se sub forma seriilor de sarcini de rezolvat de

către elevi). În cadrul structurii orientative a acestei lecţii (cu etapele: precizarea temelor de verificat; verificarea sistematică a conţinuturilor; aprecierea rezultatelor; precizări pentru viitor, pe baza rezultatelor verificării), locul esenţial îi revine celei de a doua etape menţionate (cf. I. Roman şi colab., 1970; M. Momanu, 1998). Numărul elevilor ce urmează să fie notaţi se înţelege că este mai mare, iar combinaţia cu forma scrisă devine mai frecventă, ea fiind dictată de diversele exigenţe ale verificării în acest context: problemele de rezolvat, analizele, demonstraţiile concrete, toate văzute ca încheieri aplicative ale demersului teoretic; încât se impune precizarea că demersul verbal este cel predominant, dar nu exclusiv. Şi efortul de elaborare a acestei variante de verificare orală este, fireşte, de mai mare anvergură, presupunând frecvente corelaţii pe fondul temelor incluse, precum şi mai numeroase materiale didactice implicate în lecţie. Funcţia dominantă, în cadrul acestei forme de verificare, capătă o altă orientare, prin comparaţie cu ascultarea în fiecare lecţie mixtă: accentul trece mai mult pe apreciere prin notă.

Avantajele prezentate de această formulă de evaluare, în raport cu precedenta, se concretizează în: ♦ validitate mai mare, date fiind conţinuturile mai cuprinzătoare; lucrul este firesc, atâta

vreme cât dintr-un conţinut mai larg se pot selecta mai multe teme reprezentative; ♦ notarea este mai concludentă, din acelaşi motiv legat de volumul conţinuturilor; nu poate

avea aceeaşi semnificaţie valorică nota luată la fiecare lecţie mixtă (în partea consacrată verificării) cu cea dobândită pe baza prestaţiei sintetice, bazată pe conţinutul mai multor lecţii, ceea ce poate presupune şi efort mai mare de a face corelaţii în cadrul lor.

V.2.1.2. Metode de evaluare în scris Cum am putut constata din prezentarea metodelor de evaluare pe cale orală, ele nu ar

putea acoperi în nici un caz întreaga varietate de conţinuturi, de situaţii şi de competenţe ce trebuie să facă obiectul şi ţinta actului evaluativ. De unde necesitatea ca alături de ele să fie abordate şi puse în valoare seria celor de verificare în scris. Utilizarea lor se motivează prin nişte argumente de cea mai limpede francheţe. Plecând de la motivul de principiu că omul trebuie să-şi exprime competenţele şi în scris, exerciţiu pe care şcoala i-l pune sistematic la îndemână, iată mai jos alte motive care descind din el şi se obiectivează în mai multe avantaje:♦ identitatea exigenţelor este argumentul şi avantajul care contracarează inegalitatea

sarcinilor potenţial existentă în toate probele orale; este ceea ce, în cadrul acestora din urmă, afectează actul evaluativ atât din punct de vedere tehnic, cât şi moral; cum vom vedea mai departe, identitatea probelor scrise va fi punctul de plecare pentru alte avantaje;

♦ productivitatea mult crescută a probelor scrise (care se poate multiplica chiar şi peste 1000%) este de asemenea un avantaj; este uşor de dovedit acest adevăr dacă socotim că, de pildă, o lucrare de control de 15-20 minute îmi permite să verific o întreagă clasă de 30-35-40 elevi, timp în care, pe cale orală, aş fi ascultat 3-4 sau cel mult 7-8, în funcţie de specificul materiei şcolare;

CONSTANTIN MOISE

♦ pornind de la identitatea sarcinilor, devine posibilă comparaţia rezultatelor tuturor participanţilor, ceea ce deschide perspectiva unei obiectivităţi a notării superioară celei realizate în urma aprecierii probelor orale;

♦ modul cum trebuie să fie finalizată proba, la rândul său, reprezintă un avantaj tehnic; plaja de capacităţi şi competenţe puse în relief este mai largă decât în cazul probelor orale: elevul trebuie să probeze capacitatea de elaborare a unei lucrări, ceea ce presupune efort de analiză, sinteză, interpretare, dozare în timp a sarcinilor, adică etalarea unei mai mari complexităţi de rezultate, ele putându-se extinde pe toate nivelele taxonomiilor cognitive;

♦ însuşi suportul material al probei (hârtia) constituie garanţia transparenţei şi revenirii, în caz de necesitate, asupra fiecăreia dintre probe; concret, rezultatele astfel înregistrate se pot păstra mai mult timp, putând fi fie controlate, fie recorectate, cu atât mai mult cu cât există posibilitatea comparării;

♦ aceeaşi natură materială a suportului utilizat, împreună cu posibilitatea comparării lucrărilor, vor îngădui evaluatorului să identifice erorile comune mai multor elevi, între ei chiar elevi de nivel constant-superior; aceasta va reprezenta indicatorul de evaluare a propriei munci şi totodată punctul de plecare spre îmbunătăţirea ei;

♦ timpul de gândire mai cuprinzător şi ritmul neimpus prin presiunea întrebărilor (prin comparaţie cu probele orale) reprezintă un ajutor pentru cei timizi sau cu un ritm mai lent de elaborare, să -şi poată realiza performanţele proprii la nivel convenabil.

Toate aceste avantaje trebuie văzute în corelaţie cu cele câteva dezavantaje contracarate prin folosirea probelor orale, deci care constituiau avantajele acestora din urmă, adică: lipsa feedback-ului imediat, lipsa întăririi pozitive încurajatoare, lipsa posibilităţii de împletire riguroasă a evaluării cu învăţarea prin dirijarea dialogului etc.

Există mai multe variante de probe scrise, fiecare avându-şi locul şi funcţia ei dominantă, care este dependentă atât de extensia probei, cât şi de împrejurarea concretă în care se foloseşte.

PROBA SCRISĂ CURENTĂ TRADIŢIONALĂ (lucrare de control, la clasele mici, extemporal, la clasele şcolii secundare) alternează de câteva ori pe an cu chestionarea orală, îndeplinind, principial în măsură egală, funcţia de consemnare prin notă a achiziţiilor elevului şi funcţia de orientare continuă a acestuia asupra propriului nivel, care se finalizează în plan formativ. Rosturile ei, distincte de ale celorlalte probe scrise, se sintetizează în:♦ menţinerea permanentă a elevului în activitate de învăţare sistematică, tocmai prin

frecvenţa neprevăzută a acestei probe, ceea ce îl ajută să-şi însuşească şi consolideze în ritm omogen conţinuturile învăţate;

♦ contribuţia acestei probe la interpătrunderea pe secvenţe mici a învăţării cu evaluarea, determinând astfel un progres continuu şi precis al capacităţilor elevului;

♦ semnalarea, de asemenea continuă şi în timp util, a minusurilor existente în repertoriul achizitiv al elevilor, fie în plan informaţional fie mai ales în cel al deprinderii de exprimare

în scris; li se oferă astfel şansa de remediere, înainte de a se fi acumulat o cantitate greu surmontabilă.

Cel puţin următoarele exigenţe însoţesc proba scrisă curentă: subiectul să se justifice fie prin caracterul său reprezentativ (să nu se reducă la un

amănunt neimportant, prin care profesorul pretinde că ar controla "minuţiozitatea" pregătirii elevului), fie prin cel formativ;

modul de administrare a probei să fie complet elaborat înainte de intrarea în clasă, pentru a nu se consuma din timpul destinat efectuării (se stabileşte, de pildă, dacă este cazul să se dea subiecte pe numere diferite, în care caz trebuie reflectat asupra unor subiecte de dificultate identică; se elaborează strict explicaţiile necesare privind rezolvarea, instrucţiunile privind instrumentele de lucru şi eventualele surse de informare permise, precum şi obiectele "prohibite";

punctajul aferent fiecărui subiect să le fie comunicat examinaţilor, pentru a-şi doza energia pe măsură (împotriva procedării nepedagogice de a ţine secret acest punctaj până după efectuarea probei); D. Muster, cunoscut cercetător docimolog, afirmă: "Punctajul poate fi anunţat, spre a fi cunoscut dinainte şi a-i stimula pe candidaţi, în orice caz spre a-i determina să-şi organizeze munca în modul de valorificare cel mai favorabil" (cf. 1970, p.103);

cum probele scrise tradiţionale se înscriu de regulă în tipul "compunere", fiind notate prin una dintre metodele "subiective" (de exemplu, prin impresia globală, scara de specimene, determinarea frecvenţelor, metoda analitică) (cf. De Landsheere, 1975, pp.110-148; vezi mai departe la tema "Notarea"), corectura poate deveni cu adevărat utilă numai dacă se foloseşte un ghid, alcătuit dintr-o simbolistică sui generis, care să asigure interpretarea unitară a calităţilor şi tarelor fiecărei lucrări (de pildă, semn-simbol pentru eroare de fond, eroare de ortografie, caracter incomplet etc.);

intervalul dintre efectuarea probei şi comunicarea rezultatelor, după corectură, să fie pe cât posibil mai scurt (ideal ar fi chiar în lecţia imediat următoare), pentru ca elevul să nu fi "ieşit" din atmosfera prilejuită de proba de verificare dată; întârzierea prea mare ar cauza anularea până la totalitate a efectului educativ al lucrării în cauză.

TEZA (fostă trimestrială, azi semestrială) este proba scrisă periodică tipică pentru învăţământul nostru secundar. Este probă cu funcţie dominantă de decizie prin notă asupra certificării capacităţilor şi competenţelor elevului, precum şi asupra locului acestuia în ierarhia grupului din care face parte. Funcţia orientativ-ameliorativă nu este total absentă, putând fi considerată "implicită" şi fiind interpretabilă ca exerciţiu de organizare şi exprimare scrisă monologată a propriilor cunoştinţe acumulate, în perspectiva confruntărilor evaluative cele mai cuprinzătoare (examen final, examen de admitere etc.). Ponderea ei în cadrul deciziei a fost variabilă: 50% din medie, când a fost trimestrială, 25% de când se foloseşte semestrial, fără a se fi formulat o motivaţie a acestei schimbări.

Avantajele speciale ale tezei semestriale (adăugate celor comune tuturor probelor scrise, menţionate mai sus) se pot sintetiza după cum urmează. Mai întâi, că, prin comparaţie

CONSTANTIN MOISE

cu probele curente, ea poate asigura o validitate mai mare, dat fiind că pe o "masă" de conţinuturi de pe un semestru întreg se poate identifica mai clar eşantionul cel mai reprezentativ de conţinuturi de verificat. Apoi, că, pe baza ei, notarea este mai concludentă. Globalitatea ei mai accentuată poate fi considerată prin sine tot un avantaj, oferind şi educatorului oportunitatea de a-şi aprecia randamentul propriei munci pe porţiuni mai mari de conţinuturi.

Ceea ce teza are deficitar este posibilitatea redusă ca feedback-ul pe care îl oferă să fie valorificat în amănunt în optimizarea procesului de instruire.

Tot spre deosebire de verificările scrise curente, teza implică nişte exigenţe specifice (vezi P. Popescu, 1978, p. 101 urm.; I. Roman şi colab., 1970; P. Popescu, I. Roman, 1980). Una dintre ele se referă la necesitatea existenţei unor activităţi destinate anume pregătirii ei, constând fie din recapitulare imediat anterioară, fie din "punctări" în cadrul verificărilor la sfârşit de capitol, având trimitere specială la ea. Rigoarea acestei pregătiri trebuie să fie cu atât mai stringentă cu cât am avea a face cu elevi de clase secundare mici, deci care se află în faza de iniţiere în această modalitate de exprimare. Altă exigenţă vizează formularea subiectelor. Potrivit aceloraşi surse menţionate mai sus, subiectele de teză ar putea fi formulate în diverse maniere, cu condiţia ca ele să se adapteze la experienţa de învăţare a elevului: subiecte-titluri de lecţie, "la începerea studierii unei discipline, ele contribuind la însuşirea

vocabularului şi noţiunilor corespunzătoare necesare redactării lucrărilor de sinteză"; subiecte de sinteză, al căror loc "se cuvine să fie în fruntea preferinţelor", ele oferind

forma cea mai convenabilă de valorificare de către fiecare elev a propriului potenţial intelectual;

subiecte multiple (alcătuite, de pildă, din: o enumerare + o definiţie + aprecierea corectitudinii sau incorectitudinii modului de formulare a unei idei + interpretarea unui citat scurt + rezumarea unui articol), "succesul" lor în faţa candidaţilor bazându-se pe varietatea solicitărilor şi pe posibilitatea de abordare la mai multe nivele;

subiecte reprezentând tematica unui capitol (de exemplu, 4-6 subiecte, în ordinea expunerii în capitol), vizând redarea rezumativă a unei părţi sau a capitolului întreg. Cu sau fără rezerve, potrivit sondajelor noastre în şcoli, această gamă de subiecte este promovată în măsuri variabile cu toate componentele ei. Lucrul este firesc, ştiut fiind că şi în examinări cu caracter global se practică aproximativ aceleaşi variante.

Odată cu propunerea tipurilor de subiecte de teză, autorii citaţi formulează şi motivări specifice pentru fiecare tip. Astfel, se consideră că subiectele-titluri îşi pot exercita valoarea formativă dacă sunt alese în aşa fel încât să solicite elevilor nu numai abilităţi de reproducere, ci şi "capacităţi intelectuale superioare"; subiectele de sinteză, la rândul lor, trebuie să fie precedate de iniţierea elevilor în abordarea lor, pe baza modelelor prezentate de profesor; subiectele multiple, ca şi cele axate pe conţinutul tematic al unui capitol sunt practicabile cu succes numai dacă: sunt concepute astfel încât să fie rezolvabile în timpul rezervat tezei; dificultăţile pe care le conţin sunt ordonate gradat, deci fiecare elev le poate aborda până la un punct, altfel riscându-se descurajarea unei părţi dintre examinaţi.

Între tipurile de subiecte de teză, trebuie să le cităm şi pe cele aparţinând stilului nou de formulare, potrivit cu mersul reformei. Ele descriu o linie de adaptare generală a probelor

scrise la structura testului docimologic, rezultând astfel veritabile stocuri de modele de subiecte pentru fiecare materie de învăţământ (cf. A. Stoica, I. Neacşu, coord., 1996; vezi, de asemenea, toate lucrările care conţin aceste noi modele, în cadrul titlului alocat examenului scris).

Şi între exigenţele tezei putem specifica necesitatea comunicării punctajelor eventualului barem de notare, cum am menţionat în cazul lucrărilor scrise curente.

A P L I C A Ţ I E

Consultând (în acest curs, mai jos) tema "Testul docimologic", stabiliţi din ce constă tendinţa de "mulare" a subiectelor de teză pe modelul acestui test.

Verificarea la sfârşit de capitol. Ultimele decenii au scos la iveală o metodă aparte de verificare în scris (completată, după caz, cu varianta orală), anume evaluarea la sfârşitul fiecărui capitol, cu excepţia acelora care coincid cu perioada tezelor. Este probabil ca metoda să fi fost promovată, la iniţiativa fiecărui educator, şi mai înainte de această perioadă, dar cert este că în anii ’70 devenea temă de cercetare pe bază de experiment (cf. P. Popescu, lucr. cit.; de asemenea I. Roman, P. Popescu, 1980, p.116 urm.). Rezultatele experimentului şi popularizarea care I se făcea avea să determine extinderea ei, fără să fie impusă prin reglementări formale. Rezumativ, aplicarea acestei variante de evaluare se integra în următoarea procedare: stabilirea, de la începutul anului, a ciclurilor de lecţii corespunzătoare fiecărui capitol, odată cu conştientizarea elevilor asupra naturii fiecărei lecţii (lecţie introductivă, de predare, de exersare, de recapitulare, de încheiere prin verificare scrisă obligatorie); dialogul profesor-clasă de la începutul fiecărei lecţii să urmărească nu numai ascultarea cu scop de verificare, ci mai ales felul cum elevii fac legăturile necesare în cadrul capitolului în care se încadrează lecţia (întrebările fiind adresate şi de către elevi profesorului); participarea la verificare în fiecare lecţie să fie evidenţiată chiar şi pe "subunităţi" de răspuns ale fiecărui elev, în "catalogul profesorului" (un caiet special destinat acestor notări parţiale, din care se va compune la un moment dat o notă şi se va consemna în catalogul oficial al clasei); prestaţia slabă din cadrul dialogului iniţial nu se notează, pentru a nu descuraja elevii să participe în număr cât mai mare; data lucrării scrise la sfârşit de capitol se cunoaşte, astfel că fiecare elev o vizează pe tot parcursul predării; în cazul că un elev nu se consideră "apt" pentru probă, atunci când este programată, are dreptul să o reprogrameze.

Motivaţia folosirii acestei probe se află în avantajele pe care le dovedeşte: asigură omogenitatea însuşirii materiei şi ritmul cel mai convenabil al învăţării, dată

fiind regula ca elevul să aibă notă la fiecare capitol şi conştientizarea lui asupra acestui fapt;

asigură caracterul sistematic şi temeinic al pregătirii, date fiind legăturile realizate lejer în fiecare parte de conţinut studiată;

are un foarte vizibil caracter formativ, putând constitui un antrenament al elevului în vederea confruntărilor mai cuprinzătoare, adică făcând trecerea, fie spre exprimarea unor conţinuturi de dimensiunea tezei semestriale, fie mai ales spre capacitatea de a face faţă unui examen, în cazul că materia respectivă nu este prevăzută cu teză;

CONSTANTIN MOISE

realizează o diagnoză precisă, fiind posibil de constatat, pe secvenţe concrete, care sunt părţile tari şi cele slabe ale fiecărui elev;

înlătură stările afective defavorizante pentru elev şi pentru desfăşurarea optimă a procesului didactic, adică frica şi aversiunea faţă de acest proces, datorate nestăpânirii corelaţiilor din fiecare dintre structurile lui alcătuitoare;

determină optimizarea relaţiei profesor - elev: elevul nu se mai consideră "pândit" de profesor să fie verificat şi notat când nu este pregătit, iar profesorul beneficiază permanent de sprijinul elevului, atât pe parcursul predării, cât şi în privinţa planificării şi pregătirii lucrării finale;

însăşi transparenţa rezultatelor în faţa organelor de control şi a altor factori interesaţi este net îmbunătăţită.

Rămâne ca singur şi mare inconvenient volumul de muncă pe care această procedare îl pretinde din partea profesorului. Este şi motivul semnului de întrebare asupra extinderii ei în terenul practicii didactice largi, în urma experimentării şi popularizării pozitive care i s-a făcut.

V.2.1.3. Verificarea practică, atât curentă cât şi periodică, îşi are motivaţia fie în natura conţinuturilor, cum este cazul educaţiei fizice, sau educaţiei artistice, sau educaţiei profesionale în toate specialităţile ei; fie în necesitatea constatării exprese a efectelor formative în plan "instrumental" ale instruirii, pentru partea aplicativă a celor mai diverse materii de învăţământ: fizica, biologia, chimia, studiul limbii materne sau al limbilor străine, enumerarea putându-se extinde asupra mai tuturor. Obiectul evaluării poate să fie, în măsură egală, produsul activităţii elevului sau însuşi modul de organizare şi "execuţie" de către acesta a activităţii în cauză. Potrivit lucrărilor pedagogice în materie (vezi Ausubel şi Robinson, lucr. cit., p. 694 urm.), am putea alcătui o listă foarte cuprinzătoare de astfel de probe: lucrările de laborator, activitatea clinică medicală, probele practice profesionale, rapoartele de cercetare şi actul de cercetare însuşi, desenele de tot felul (afectând disciplinele chiar şi cu pronunţat caracter teoretic), probele sportive şi muzicale, creaţiile artistice şi tehnice, probele de utilizare optimă a instrumentelor, inclusiv a instrumentelor de informare şi prelucrare a informaţiei, între care, în vremea noastră, calculatorul devine pe zi ce trece "cap de afiş". În practica evaluativă actuală sunt denumite şi prin expresia "studiu de caz", luând numele uneia dintre metodele utilizate în învăţare, cu care prezintă similitudini marcante. Acest gen de probe pot îndeplini, după caz, toate funcţiile actului evaluativ: de feedback şi de orientare a învăţării, când au loc prin alternare secvenţială cu predarea; de certificare, ierarhizare, selecţie, diagnoză, prognoză, când fac determinări de mai mare globalitate. Dincolo de acestea, ele pun în evidenţă şi achiziţii în sfera trăsăturilor de personalitate: "flexibilitate, inventivitate, perseverenţă, creativitate", dovedindu-se "mult mai valide decât examinările prin întrebări şi răspunsuri" (ibidem).

Dezavantajele pe care le presupun se obiectivează mai ales în: consum mare de timp şi fonduri; necesitatea de extensie în spaţiu, greu de realizat pentru unele dintre acestea; marea dificultate de eşantionare pentru o parte dintre ele (de pildă pentru probele medicale, în care

examinarea se face pe "cazuri" diferite), ceea ce generează şi dificultăţi de cotare exactă (ibidem).

Din prezentarea de mai sus a caracteristicilor fiecărui tip de probe, cu virtuţile, aplicabilitatea specifică şi insuficienţele fiecăruia, rezultă clar complementaritatea lor. Ceea ce unele prezintă ca valoare certă, altora le lipseşte, rezolvarea realizându-se prin folosirea în completare sau prin alternare a celorlalte. Altfel spus, chiar dacă nici unele nu sunt infailibile, toate pot să-şi acopere insuficienţele prin apel la celelalte.

V.2.1.4. Examenul ca probă cu caracter global În ciuda tuturor protestelor care s-au exprimat din partea elevilor şi părinţilor (vezi

De Landsheere, 1975, p. 17 urm.), examinarea cu caracter global rămâne o probă necesară, atât în varianta scrisă, cât şi orală, iar în unele situaţii şi în ipostaza practică. Motivaţia acestei decizii se focalizează în jurul validităţii mai mari a acestei probe, prin comparaţie cu cele de cuprindere mai limitată, precum şi al caracterului net mai relevant pe care îl asigură notării; lucru normal, dacă ea vizează stăpânirea de către elev a unor conţinuturi atât de extinse şi a unor capacităţi pe măsură. Dar mai trebuie observat că aceste calităţi nu vin de la sine, ci depind, fireşte, de efortul proiectanţilor şi al examinatorilor de a contura şi desfăşura proba după reguli cu adevărat ştiinţifice.

În sistemul nostru şcolar actual, probele globale sunt legate în principal de examenele finale, respectiv de bacalaureat şi de examenul de finalizare a ciclului gimnazial.

PROBELE SCRISE DE EXAMEN. Cum bine se ştie, conceperea lor nu mai cade în sarcina fiecărui profesor pentru elevii săi, aceasta fiind realizată pe plan central şi în forme care se metamorfozează treptat pe linia modernizării. Este ceea ce a făcut ca în ultimii ani să asistăm la o continuă tatonare, pentru instituirea celor mai viabile soluţii, atât de proiectare cât şi de administrare. Profesorul nu trebuie să rămână însă în expectativă absolută. Pentru ca elevul să poată face faţă acestei dinamici, profesorul trebuie să-l orienteze, iar orientarea să fie "mulată" pe noile structuri, aşa cum sunt propuse în mulţimea de ghiduri de evaluare care "stochează " un adevărat univers de subiecte de examen scris (vezi, de pildă: C. Niţă, coord.,1999; G. Chirleşan, coord., 1999; R. Doicescu, coord., 2001; B. Vîlceanu, coord., 2001), sau cum sunt administrate în cadrul simulărilor pe plan naţional. Drept urmare, chiar dacă nu el formulează subiectele de examen, le poate analiza pe cele difuzate, iniţiind elevul în abordarea lor, ceea ce este posibil chiar şi prin nuanţarea subiectelor tezei semestriale pe linia acelor modele. De pildă, cum azi se tinde spre "turnarea" tipurilor tradiţionale de subiecte în "tipare" proprii itemilor de test (vezi mai departe, la tema despre teste, tipurile de itemi), urmează ca şi subiectele de teză trimestrială, de verificare curentă sau de recapitulări speciale, înainte de examen, să adopte treptat aceeaşi ţinută. Aceasta ar veni realmente în sprijinul elevului în acţiunea de pregătire a examenului, în termenii reformei şi în circumstanţa generalizării examinării "externe" (adică cu examinatori din afara şcolii).

Problemele pe care le-au pus până în prezent examenele şi despre care profesorii în general îşi pot exprima opinia sunt legate atât de proiectarea şi administrarea probelor, cât şi de realizarea corecturii şi notării. Disfuncţiile proiectării şi administrării pot rezulta mai ales

CONSTANTIN MOISE

din lipsa cunoaşterii foarte bune, de către managerii examenului, a relaţiei dintre conţinuturile pretinse la examen şi profilul de şcolarizare vizat, de unde eventualitatea administrării improprii a subiectelor, prin raportare la aceste profiluri (s-au citat cazuri, de pildă, în care, la clase cu profil umanist, s-au dat subiecte de matematică proprii claselor de profil real). De aici, sugestia ca în echipele centrale de formulare şi administrare să fie cooptaţi şi profesori din reţeaua practică, pentru toate specializările. La rândul lor, corectarea şi notarea sunt şi rămân dificile la nivel naţional, dată fiind natura subiectivă a multora dintre probe şi deci şi a modalităţii de notare. Sugestia ar fi, în această privinţă, să se elaboreze din timp mai multe variante de scheme de notare, făcând posibilă flexibilitatea alegerii uneia sau alteia dintre ele, după cum ar indica un prim sondaj de corectură (adică o corectură iniţială "de probă", asupra unui eşantion de teze, pentru a vedea dacă în ele se regăsesc criteriile baremului de notare; în cazul că nu se regăsesc, să fie revizuiţi conform cu cei rezultaţi după sondaj) (vezi şi A. Stoica, coord., 2000, p. 85).

Dacă se doreşte cu adevărat ca statutul examenului, cu deosebire a celui scris, să se îmbunătăţească, conceptorii lui ar avea la îndemână un ghid de elaborare destul de concludent, pe care De Landsheere îl propune, pe următorii paşi: precizarea scopului examenului (fie prognostic, fie diagnostic, fie "inventar") şi a obiectivelor lui (pe o schemă taxonomică dată, de pildă cea a lui Bloom, precum şi pe specificul disciplinei vizate); elaborarea concretă a probelor de examen (a "întrebărilor", cum le denumeşte Landsheere); experimentarea probelor prin aplicări multiple, premergătoare examenului (ceea ce şi la noi se încearcă, prin deja cunoscutele "simulări"); finalizarea probelor, după ce prin experimentare li s-a stabilit validitatea, fidelitatea, dificultatea, capacitatea de discriminare (vezi De Landsheere, 1975, p. 55 urm.).

PROBELE ORALE DE EXAMEN. Îşi au, şi ele, specificul şi problemele lor, pe care profesorul, în calitatea sa de examinator, trebuie să le cunoască. Interesează, în plan esenţial, cum va aborda actul examinării, văzut atât sub aspect tehnic, cât şi psihologic şi etic. Sub aspect psihologic, de pildă, este foarte clar justificabil faptul ca, imediat după extragerea biletului de examen, examinatorul să lămurească împreună cu examinatul ce anume pretind subiectele de pe bilet, prevenind eventualele confuzii, consumatoare de timp şi prejudiciante pentru candidat. Apoi, a permite candidatului să abordeze subiectele în ce ordine doreşte este foarte firesc, reprezentând pentru el un sprijin moral, dacă admitem că tot în limitele normalului este ca nu toţi cei examinaţi să răspundă foarte bine la toate subiectele. În lipsa acestei permisiuni, cei timizi, dată fiindu-le sensibilitatea naturală mai accentuată, pot aluneca chiar situaţii de "criză", obiectivate în blocaj (sau plâns, la fete), ambele putând compromite întreaga performanţă.

Cât priveşte desfăşurarea ascultării propriu-zise (cf. I. Roman şi colab., 1970), ea trebuie să respecte în principiu aceeaşi regulă ca în cazul ascultării curente, adică: să se evite fragmentarea răspunsului prin intervenţii frecvente pe parcursul formulării acestuia, aprecierile, corecturile trebuind făcute, iar întrebările suplimentare puse, la încheierea rezolvării fiecărui subiect (cu excepţia doar a situaţiilor când examinatul comite confuzii care pur şi simplu anulează răspunsul).

PROBELE PRACTICE DE EXAMEN. Desfăşurarea lor este foarte diversificată, în funcţie de fiecare specialitate în care se organizează. Lucrul de principiu de care trebuie să se ţină seama este respectarea unei serii de exigenţe, aplicabile în măsură egală probelor practice în general, fie de mai mică sau mai mare anvergură. Aceste exigenţe se rezumă astfel (Ausubel şi Robinson, lucr. cit., p. 695; de asemenea, Roman şi colab., 1970, p. 300): probele să exprime cazuri tipice şi să se asigure uniformitatea lor pentru toţi cei examinaţi; criteriile fiecărei performanţe să fie bine precizate dinainte, în sprijinul îmbunătăţirii

cotării probelor; examinatorii să precizeze şi să dezbată anticipat trăsătura de personalitate şi deprinderea

ce vor fi evaluate şi distribuite pe scala de apreciere; pentru contracararea efectului halo (vezi efectul halo, în cadrul temei privind abaterile de

la notarea corectă), aprecierea să nu se facă pe întreaga probă odată pentru toţi examinaţii, ci pe fiecare item pe întreg grupul (de exemplu, dacă proba are 5 itemi şi este susţinută de 10 candidaţi, se apreciază: primul item la toţi 10, al doilea item la toţi 10 ş.a.m.d.), în acest mod fiind posibilă comparaţia pe fiecare secvenţă.

V.2.2. Testul docimologic ca metodă de evaluare

V.2.2.1. Teste psihologice şi teste docimologice: definiţii, delimitări, tipuriÎn ultimele trei decenii, în teoria şi practica evaluării din ţara noastră şi-a făcut intrarea

şi şi-a consolidat continuu statutul un anumit tip de test: cel docimologic, denumit în unele surse si test de cunoştinţe, sau test pedagogic (vezi Muster, 1970; de asemenea, A. Stoica, coord., 2001), sau test de randament (cf. I.T. Radu, 2000, p. 240). Trebuie să recunoaştem, însă, că suflul nou pe care l-a adus cu sine nu este total lipsit de ambiguităţi, fiind în continuare necesare noi precizări.

Pentru definirea testului în general şi a celui docimologic în special, calea etimologică nu ne este de ajuns, căci faptul că în limba engleză cuvântul test înseamnă probă nu ne sugerează un sprijin relevant în acest sens. În consecinţă, vom porni de la definiţia logic-aristotelică a testului psihologic în general, formulată de către Asociaţia Internaţională de Psihotehnică, astfel: testul "este o probă definită, implicând o sarcină de îndeplinit, identică pentru toţi subiecţii examinaţi, cu o tehnică precisă de apreciere a succesului sau eşecului, precum şi pentru notarea numerică a rezultatului" (cf. H. Pieron - coord., Vocabulaire de la Psychologie, P.U.F., Paris, 1968, apud L. Gavriliu, 1969). Definiţia trebuie completată cu precizările: "sarcina poate presupune o punere în aplicare a cunoştinţelor achiziţionate (teste pedagogice), fie a funcţiilor senzorial-motrice sau mintale (teste psihologice)" (Ariane Lussato, apud A. Stan, 2002, p.106). Testul se compune din articole sau teme sau întrebări ce trebuie rezolvate de către cel examinat, denumite itemi şi fiind cotate cu punctaje riguros precizate (scoruri), prin totalizarea, analiza, compararea, etalonarea cărora se conchide asupra performanţei realizate de cel examinat.

Iată, într-o viziune foarte rezumativă, categoriile de teste psihologice, stabilite după criterii diverse şi autori diferiţi şi prezentate în perechi "opozitive", din care să constatăm interferarea lor cu cele docimologice (cf. A. Stan, lucr.cit., p.111 urm.):

CONSTANTIN MOISE

psihometrice, nepsihometrice (după gradul de standardizare); individuale, colective (după numărul examinaţilor simultani); tip creion-hârtie, de reacţie verbală, de manipulare şi prelucrare a materialelor, teste pe

display, teste aparative (după "mediul informaţional al testului"); verbale, nonverbale (după forma de exprimare); unidimensionale, multidimensionale (după cuprinderea uneia sau mai multor variabile

psihologice); de rapiditate (speed test), de nivel (power test sau level test), după calitatea prioritar vizată

la cel examinat; de aptitudini (aptitude test), de achiziţie (achievement test), primele vizând performanţa

posibilă, ultimele referindu-se la performanţa realizată la finele unui act de învăţare şcolară;

teste normative, teste ipsative (după elementul de referinţă: grupul, la prima categorie menţionată; examinatul însuşi, la a doua);

formale, informale (după rigoarea exigenţelor de interpretare a răspunsurilor la itemii testului).

Atributul "docimologic", ataşat unei categorii de teste utilizate în şcoală, face trimitere la specificul acestei categorii, adică la folosirea lor ca instrumente ale examenului şcolar (atributul citat fiind derivat din grecescul dokime = probă de examen). Deosebirea acestei categorii faţă de testul psihologic văzut în general este, aşadar: în timp ce cel psihologic vizează, în interesul cercetării, constatarea unor însuşiri "date" (existente) la un moment dat, cel docimologic constată rezultatele procesului de învăţare, rezultate care fie vor fi convertite în note şcolare, fie vor constitui premisele unor măsuri ameliorative în sprijinul elevilor în activitatea de învăţare. Consacrarea termenilor emanaţi din acest etimon (dokime) se datorează lui H. Pieron, considerat fondatorul docimologiei.

Având la îndemână lista de mai sus a testelor psihologice, care ne va folosi pentru eventuale comparaţii, încercăm mai jos să constituim un tablou, cât mai apropiat de unul complet, al testelor utilizate în evaluarea şcolară, pe fondul căruia să-l delimităm pe cel docimologic.

Ca punct de plecare, vom folosi opiniile şi enumerarea aparţinând lui Gronlund, care consideră că testele pot fi folosite în şcoală pentru determinarea aptitudinilor, achiziţiilor, atitudinilor şi "pot fi clasificate după trăsăturile lor tehnice în următoarele tipuri contrastante: orale şi scrise; informale şi standardizate; obiective şi eseu; de stăpânire, de sondaj, diagnostice; individuale, colective; de performanţă, verbale, nonverbale; de viteză (speed), de nivel (power)" (cf. Gronlund, lucr.cit., p.25).

Adăugând analiza opiniilor lui De Landsheere (1975), ale lui Bloom şi colaboratorilor (1971), sugestiile altor autori români (vezi I.T. Radu, 2000; Stoica, 2001; Cucoş, 2002) şi ideea criteriilor multiple, adoptată de toţi cei menţionaţi, putem constitui următoarele categorii de teste şcolare, tot în cupluri "contrastante": teste formative vs. teste sumative, după scopul lor (autori de referinţă: B. Bloom,

J.T. Hastings, G.F. Madaus, 1971, p. 60 urm., 116 urm.); primele, aplicate curent sau

periodic, au scopul de a determina nivelul şi mai ales deficitul elevului şi de a-l orienta în procesul învăţării; ultimele, aplicate pe secvenţe mai mari (capitole, semestre) sau pe ansambluri semnificative (an şcolar, ciclu de învăţământ), au ca scop notarea şi clasificarea elevilor (vezi şi A. Stoica, 2001, p.77);

teste obiective vs. teste eseu, după modul de prezentare a răspunsului şi după posibilitatea de notare exactă (autor de referinţă: Gronlund, lucr.cit.); primele solicită şi permit răspunsuri strict identice, precum şi notare exactă; ultimele implică răspunsuri formulate diferit de fiecare candidat, iar corectura şi notarea au, de asemenea, o doză de subiectivitate; variantă actuală: teste obiective vs. teste subiective (cf. Stoica şi colab., 2001);

teste iniţiale, teste de progres, teste finale (după criteriul timp, care corelează obligatoriu cu volumul conţinuturilor evaluate şi scopul urmărit); primele, practicate înaintea începerii unui program şcolar, trebuie" să furnizeze date despre cunoştinţele şi abilităţile elevului raportate la exigenţele noii etape de parcurs, având scop prognostic şi diagnostic (cf. I.T. Radu, 2000, p. 241), iar o variantă a lor fiind testul de plasament, adică de încadrare a elevilor în programe care le sunt compatibile sau necesare (Stoica, lucr.cit., p. 78); următoarele, cu tentă diagnostică, sunt utilizate pe parcursul programului de instruire, în interesul reglării acestuia (I.T. Radu, idem); ultimele, folosite la încheierea unor secvenţe însemnate ale programului (ibidem), sau la finele programului întreg (Stoica, lucr. cit.);

teste elaborate de profesor (teacher made tests) vs. teste standardizate (după rigoarea elaborării şi administrării), al căror model îl întâlnim începând tot cu Gronlund; primele pot apărea în forme fără mari pretenţii de formalizare şi se folosesc în cadrul evaluării interne, nefiind concludente în afara grupului (clasei) pentru care autorul lor le-a conceput; ultimele menţionate sunt concepute după norme riguros formalizate, sunt experimentate şi etalonate pe eşantioane de elevi foarte cuprinzătoare, sunt administrate şi notate după norme identice (vezi cele trei identităţi care le caracterizează: identitate de conţinut, de condiţii de aplicare, de criterii de apreciere - după I.T. Radu, 1981, pp.224-225);

teste de achiziţii vs. teste de aptitudini (după felul conţinuturilor evaluate); cum spune însăşi denumirea, primele vizează conţinuturi dobândite printr-un proces şcolar (cunoştinţe şi abilităţi), având şi alte variante de denumire: teste de cunoştinţe (cf. Stoica, idem), sau teste de randament, sau docimologice (cf. I.T. Radu, 1981; idem, 2000); ultimele se referă dezvoltarea subiectului testat (la zestrea lui psihologică din acel moment) fără a corela aceasta cu o anume activitate de învăţare (altă variantă de denumire: test de "randament posibil", după I.T. Radu, 2000);

teste normative vs. teste criteriale (după entitatea care serveşte ca reper a evaluării), ideea acestor tipuri provenind de la Bloom şi De Landsheere şi fiind legată de teoria despre evaluarea criterială şi despre evaluarea normativă, prezentă în concepţia acestor autori (vezi G. Meyer, 2000, pp.25-26); primele compară performanţele elevului numai cu obiectivele instruirii; ultimele folosesc ca referinţă atât obiectivele instruirii cât şi

CONSTANTIN MOISE

performanţele grupului în care se încadrează cel testat (de pildă, elevul X, care a realizat performanţa Y, ce loc ocupă în clasa sa, în rândul celor promovaţi).

Cele două inventare sumare de mai sus, adică de o parte cel al testelor psihologice, iar de alta cel al testelor utilizate în scopuri evaluative în şcoală, ne oferă sprijinul de rigoare pentru formularea unor consideraţii clarificatoare.

Cea dintâi constatare care se impune este aceea că, în destule cazuri, tipurile propuse de pedagogii evaluatori urmează modelele formulate de psihologi. Să se pună alături, de exemplu, tipurile: teste formale vs. teste informale, sau psihometrice vs. nepsihometrice, propuse de psihologi, cu cuplul: teste construite de profesor vs. teste standardizate, după pedagogi, şi se va dovedi comunitatea de "tipare" între categoriile din sfera evaluării şi cele ale cercetării psihologice; de asemenea, cuplul teste normative vs. teste ipsative, din psihologie, şi cel al testelor criteriale vs. normative, din teoria evaluării; să se ia în considerare conceptele "speed test", "power test"; teste de achiziţie vs. teste de aptitudini, menţionate la fel în ambele domenii, conducând la aceeaşi concluzie. Să se ţină seama, însă, şi de eventualele nuanţări ale acestor tipuri, care sunt încadrate diferit în unele cazuri (de pildă, psihologii, care au primul cuvânt de spus, concep inteligenţa ca pe o aptitudine, în timp ce pedagogii o interpretează altfel; categoriile: speed test, power test nu sunt explicate complet; titulaturile: teste obiective vs. teste subiective fac trimitere la alte entităţi în limbajul psihologilor, faţă de cel al pedagogilor evaluatori; vezi, de pildă, A. Stoica, lucr. cit., p.77; A. Stan, 2002, p. 113), rezultând concluzia că interpretarea acestor categorii încă mai este afectată de unele ambiguităţi, de care trebuie să fim conştienţi.

Altă observaţie care se impune, pe acest fond, este aceea că nu toate testele folosite în evaluarea şcolară pot fi calificate drept docimologice. Autorii români sau străini contemporani, aproape fără excepţie, învederează acest fapt prin menţionarea, tot în sfera evaluării, a testelor de aptitudini în general şi a celor de inteligenţă în special, a testelor de rapiditate (speed tests) şi de nivel (power tests) (cf. Payne, 1968; Gronlund, 1971; I.T. Radu, 2000). Rezultă, din această realitate de fapt, că lista de mai sus cuprinde un ansamblu de teste implicate cu toate în activitatea evaluativă din cadrul şcolii. Denumirea cea mai convenabilă, pentru toate la un loc, ar fi aceea de teste de evaluare folosite în şcoală. În rândul lor sunt încadrabile de o parte testele "de clasă" (classroom tests sau achievement tests, denumire tradusă de către docimologi fie prin teste de cunoştinţe, fie prin teste docimologice, fie prin teste de achiziţii, fie prin teste de randament), iar alături de ele testele "de aptitudini" (aptitude tests) şi celelalte (speed tests, power tests etc.), fiecare dintre ele fiind folosite în scopuri bine definite: cele de achiziţie, pentru evaluarea strictă a rezultatelor realizate prin învăţare de către elevi; cele de aptitudini şi celelalte de factură strict psihologică, pentru evaluarea posibilităţilor de abordare a învăţării şi altor coordonate ale persoanei elevului . Celelalte denumiri din tabloul prezentat rezultă din nuanţarea celor enumerate în fraza anterioară după diferite alte criterii, cum printr-o analiză chiar sumară se poate conchide.

Ca urmare a preocupării sale de bază, profesorul (indiferent de specialitate) va fi interesat strict numai de cele docimologice, pe care le va folosi în mod sistematic, iar în cazuri frecvente le va şi construi. Celelalte se află în sfera preocupărilor psihologului.

Cât priveşte avantajele testelor docimologice, ele pot fi rezumate în termenii următori: permit evaluarea rezultatelor şcolare, pe orice dimensiune, în condiţii de economicitate, de precizie şi concizie, de validitate (concretizată mai ales în exprimarea pe spaţii mici şi în timp scurt a conţinuturilor cele mai reprezentative) şi de notare cât mai apropiată de valoarea reală a răspunsurilor examinaţilor (vezi şi I.T. Radu, 1981, p. 227). Dezavantajele notate cu decenii în urmă în dreptul acestor instrumente docimologice (de pildă, că ar recurge excesiv la detalii, că nu ar favoriza destul capacitatea de sinteză şi nici dezvoltarea creativităţii) apar revolute în vremea noastră, dată fiind tocmai "modelarea" pe tiparul testului a majorităţii probelor tradiţionale.


Cum explicaţi faptul că azi nu mai putem susţine nişte dezavantaje ale testului docimologic?

V.2.2.2. Tipuri de itemi ai testului docimologicPentru a înţelege complet esenţa şi modul de utilizare a testului docimologic, este

normal să ne întrebăm: cum arată părţile lui alcătuitoare, adică itemii din care se compune ? Drept răspuns, va trebui să prezentăm mai întâi lista sistematică a acestor tipuri de itemi, apoi să definim fiecare tip, cu exemplificări, cu precizări legate de înscrierea fiecăruia în plan taxonomic, ce utilizări are, ce reguli implică să fie respectate etc.

În ce priveşte lista sistematică menţionată, putem prezenta două "modele" care se cunosc şi "circulă" deja în terenul teoriei şi practicii evaluării.

Primul model aparţine americanului N. Gronlund (1971, p. 149 urm.) şi propune următoarele categorii de tipuri de itemi:1. itemi obiectivi, cuprinzând tipurile:

a. itemi tip răspuns formulat de către cel examinat (engl.: tip supply), din care: a1. tip răspuns scurt;a2. tip completare;

b. itemi cu răspuns ales (engl.: selected type), din care:b1. tip răspuns alternativ;b2. tip împerechere;b3. tip alegere multiplă

c. tip interpretare;2. itemi tip eseu, cuprinzând:

a. cu răspuns extins;b. cu răspuns restrâns

CONSTANTIN MOISE

Al doilea model, lansa şi explicată de către SNEE (cf. M. Mândruţ, în: A. Stoica şi colab., 2001, p. 95 urm.; d.a., I. Neacşu, A. Stoica, coord., 1996, p. 39 urm.), propune tipurile:

1. itemi obiectivi, cuprinzând: a. itemi cu alegere duală;b. itemi de asociere (sau de tip pereche);c. itemi cu alegere multiplă;

2. itemi semiobiectivi, cuprinzând:a. tip răspuns scurt;b. tip completare; c. întrebări structurate;

3. itemi subiectivi, din care:a. itemi tip rezolvare de probleme;b. itemi tip eseu, diferenţiaţi după dimensiune în: eseu cu răspuns scurt şi

eseu cu răspuns extins, iar după gradul de detaliere a cerinţelor şi criteriilor de elaborare", în: eseu structurat şi eseu liber.

A P L I C A Ţ I E

Încercaţi o privire paralelă asupra celor două modele de grupare a tipurilor de itemi şi surprindeţi asemănările, deosebirile, precum şi posibilităţile de compatibilizare.

Prezentăm mai jos o relativă detaliere, pe care am dori-o şi suficient de inteligibilă. Vom lua ca repere atât tipurile sugerate de primul autor citat, cât a celor propuse de următorii.

A T E N Ţ I E

Pentru a înţelege cele exprimate din acest punct al cursului şi mai departe, luaţi-vă alături taxnomia lui Bloom (din cursul de teoria instruirii, sau dintr-o altă lucrare care o detaliază). Motivul este că pe tot parcursul prezentării tipurilor de itemi se va vorbi de "nivelele taxonomice" în care se înscrie fiecare tip de item, în cadrul taxonomiei respective. Uitaţi-vă, de asemenea, la descriptorii de evaluare aflaţi în preambulul cursului, ca să vedeţi ce vi se pretinde la examen, din această temă. Notaţi-vă schematic, de la fiecare item: definire (descriere); exemplificare, după modelele din curs; avantaje şi inconveniente; cerinţe de construire a fiecărui fel de itemi. Altfel este greu de înţeles şi de reţinut.

V.2.2.2.1. Itemii obiectivi sunt caracterizaţi printr-o structurare riguroasă, astfel încât examinaţii să formuleze răspunsul corect strict identic toţi, iar examinatorii să corecteze de asemenea identic. De altfel, în cea mai bună parte, aceşti itemi sunt prevăzuţi cu răspunsuri gata construite, examinatul trebuind doar să opteze pentru cel considerat corect.

Itemii cu răspuns alternativ sunt denumiţi în unele surse şi itemi cu răspuns dual. Se prezintă sub forma unor enunţuri complete, pe care examinatul să le accepte sau să le

respingă. Marcarea răspunsurilor corecte se face cu ajutorul unor iniţiale ("A", "F", "O", după cum enunţul exprimă un adevăr, o eroare, o opinie) sau al cuvintelor "DA" vs. "NU", plasate în faţa fiecărui enunţ. Un item se alcătuieşte din: o instrucţiune pentru examinat, unu sau mai multe enunţuri conţinând sarcina de rezolvat, acestea fiind precedate de "pârghiile răspunsului", adică de "DA", "NU" etc.

Itemii de acest fel pretind aprecierea de către examinat a exactităţii unor judecăţi şi pot fi folosiţi în cele mai diverse discipline de învăţământ; nivelele taxonomice predominante ale comportamentelor probate sunt cel al recunoaşterii şi al înţelegerii (reperul invocat de toţi autorii este taxonomia lui Bloom), de la recunoaşterea corectă a unor aspecte concrete din realitate, până la recunoaşterea unor relaţii cauză - efect, celelalte nivele fiind reprezentate în forme simple, cum ar fi aprecierea (tot limitată la recunoaştere) corectă a aplicării unor principii, rezolvarea unor probleme simple prin aplicarea unor operaţii numerice etc.

Exemplele care urmează pot demonstra aceste afirmaţii. Exemplul unu:INSTRUCŢIUNE: Citeşte cu atenţie enunţurile de mai jos. Dacă ceea ce exprimă este adevărat,

încercuieşte litera A, dacă nu, încercuieşte litera F.A F 1. Substanţa de culoare roşie din sânge este numită plasmă colorată.A F 2. Substanţa incoloră din sânge este numită plasmă.

Itemul vizează evaluarea unui comportament simplu, respectiv recunoaşterea unei denumiri; nivel taxonomic: achiziţia informaţiei; răspuns corect la1: F; răspuns corect la 2: A.

Puţin mai complicate vor apărea exemplele de mai jos.INSTRUCŢIUNE: Citeşte…….. Reaminteşte-ţi ce înseamnă "opinie". Aşadar, vei încercui fie A,

fie F, fie O (adevărat, fals, opinie).A F O 1. Toate metalele se dilată prin încălzire.A F O 2. Apa îşi măreşte volumul la frig.A F O 3. În atomii metalelor radioactive se pot izola zeci de categorii de

particule.Cum se observă, examinatul trebuie să facă efort de înţelegere (ceea ce corespunde nivelului taxonomic "comprehensiune"), şi pentru a se pronunţa asupra celui de al doilea răspuns, şi pentru a conchide că la al treilea este vorba doar de o opinie (atâta vreme cât nu s-a cercetat şi nu s-a descoperit acest lucru, afirmaţia respectivă nu poate fi considerată nici adevărată, nici falsă; este doar o "părere").

Alte exemple pot ilustra exigenţe tot la nivelul înţelegerii, cu uşoară tendinţă spre aplicare, cum este cazul celor de mai jos.INSTRUCŢIUNE: ……….. se încercuieşte "DA" sau "NU".

DA/ NU 1. Procentul 51% din 23 este mai mare decât 12. DA/NU 2. Jumătate din 4/10 este egal cu 2/5.

Sunt vizate, de această dată, comportamente mai complicate, examinatul trebuind să-şi reactualizeze calculul procentelor, respectiv compararea fracţiilor.

CONSTANTIN MOISE

În alt tip de exemple putem identifica pretinderea unor achiziţii aflate tot în sfera comprehensiunii, axate pe altă dominantă: surprinderea relaţiilor cauzale sau a relaţiilor dintre judecăţi. În exemplul de mai jos, itemii sunt alcătuiţi din două părţi, fiind adevărate ambele, când sunt luate separat; dar puse la un loc pot exprima un neadevăr.

Elevului I se cere să spună dacă a doua parte explică corect de ce prima este adevărată DA/NU 1. Cămilele sunt mamifere DEOARECE au corpul acoperit cu păr.DA/NU 2. Găinile sunt animale ovipare DEOARECE îşi clocesc ouăle.

Opţiunea pentru acest tip de itemi decurge din avantajele: - extensia mare a comportamentelor evaluabile, cum s-a constatat şi din exemplele

prezentate; - productivitate mare a răspunsurilor, datorată "preformulării" acestora de către examinator; - fidelitate şi obiectivitate mare, dată fiind simplitatea şi precizia cerinţelor, precum şi a

punctajelor;Avantajele enumerate nu-i conferă totuşi o folosire fără limite. Cele mai de seamă

limite sunt: validitate în principiu mică (cf. Gronlund, 1971, p. 160), fiind greu de acoperit prea multe

conţinuturi, ceea ce determină utilizarea mai ales pentru nivele taxonomice inferioare; aceasta tocmai datorită formulării categorice în care se prezintă acest tip de itemi; exemplele plasate pe nivele taxonomice mai pretenţioase, sunt de regulă greu de întâlnit şi pretind autorului o pregătire de cea mai mare minuţiozitate;

caracterul lapidar şi fix al răspunsurilor nu permite aprecierea destul de nuanţată a prestaţiei elevului, mare parte din aceasta trebuind "reconstituită" mental de către examinator; astfel valoarea diagnostică este şi ea restrânsă;

este tipul de item cu cea mai mare probabilitate de ghicire a răspunsurilor corecte, teoretic fiind de 50% din totalul acestora.

Cerinţele de construire a acestor itemi sunt următoarele (cf. Payne, 1971, p. 56 urm.; Gronlund, 1971, p. 162 urm.; Mândruţ, 2001, p. 100): să fie evitate adevărurile banale, irelevante, inutile în situaţia de utilizare a testului

(exemplu: "Senzaţia este un proces psihic", dacă acest enunţ intră în componenţa unui item de evaluare, în teza semestrială);

să fie evitate enunţurile negative şi cu deosebire dublu negative, dată fiind potenţialitatea lor derutantă (spre exemplu, enunţul: "Nici unul dintre numerele 2, 3, 5, 17, 19, 31 nu sunt numere neprime" să i se prefere "Toate numerele 2, 3, 5, 17, 19, 31 sunt numere prime");

să se evite formulările lungi şi complicate, care nu permit orientarea elevului cu precizie asupra unui răspuns corect (exemplu, enunţul: "Dacă admitem că 0 este altceva decât nimic, putem afirma că împărţirile exacte au rest 0", trebuie înlocuit cu "Restul 0 este caracteristica împărţirilor exacte");

să se evite includerea în acelaşi enunţ a două idei care nu se află în relaţie de cauză-efect (spre exemplu, enunţul: "Şarpele nu este mamifer, deoarece nu are sânge cald" pune elevul în imposibilitatea de a da vreunul din răspunsurile A, F sau O);

lungimea enunţurilor adevărate să fie aproximativ egală cu a celor false, când i se prezintă elevului în acelaşi item; lungimea diferită sprijină elevul să ghicească răspunsul (exemplu, dacă enunţurile: " Mamiferele îşi nasc puii" şi "Mamiferele îşi gestează puii în propriul corp, îi nasc vii şi îi hrănesc cu lapte propriu" sunt prezentate împreună, enunţul mai lung îi va atrage atenţia, prin minuţiozitatea precizărilor, că este adevărat);

numărul enunţurilor adevărate să fie în relativ echilibru cu al celor false, şi acesta putând determina elevul să ghicească, după cum constată care dintre enunţuri sunt de regulă mai frecvente (cele adevărate, sau cele false).


Găsiţi şi alt exemplu de item cu răspuns alternativ care derutează prin conţinerea a mai mult de o idee de apreciat ca adevărată sau falsă.

Itemii de tip împerechere (matching items) îşi capătă numele după procedura pe care trebuie să o utilizeze examinatul (cf. Gronlund, 1971, p. 164 urm.; Payne, 1968, p. 73urm.): împerecherea unor date care i se prezintă pe două coloane: coloana A, numită a premiselor sau stimulilor; coloana B, a răspunsurilor. Relaţia pe cele două coloane se stabileşte între: evenimente şi date; invenţii şi inventatori; termeni şi definiţii; reguli şi exemple; simboluri şi concepte; autori şi tiluri de cărţi; plante, animale şi clasificări; principii şi aplicaţii; a nivele mai nuanţate şi dificile

(Payne, lucr. cit.), se pot "împerechea" şi: cauze - efecte; afirmaţii teoretice - experimente; fenomene - explicarea lor pe bază de principii, teorii, generalizări.

Cităm un exemplu, adaptat după modelele celor doi autori invocaţi mai sus: INSTRUCŢIUNE: Citeşte cu atenţie formulările din cele două coloane. Scrie în faţa fiecărui

număr din coloana A litera din coloana B, astfel încât să reiasă legătura necesară între cele două formulări. Fiecare formulare de pe coloana B ar putea fi folosită o dată, de mai multe ori sau deloc.

Coloana Ă Coloana B(E) (F) 1. o răscoală ţărănească A. 1848(A) (C) 2. o revoluţie B. 1877 (B) 3. Războiul de independenţă C. 1989 (G) 4. Marea unire a teritoriilor româneşti D. 1359

E. 1784F. 1907G. 1918H. 1889

Autorii de teorie atrag atenţia că, în funcţie de specificul materiei de învăţământ, există şi alte moduri de formulare a stimulilor, respectiv a variantelor de răspuns, prin folosirea unor materiale mai concrete (hărţi, pictoriale, diagrame), care să vină în sprijinul clarităţii cerinţelor către cel examinat. De asemenea, se afirmă că, în cazul şcolarilor mici, se poate utiliza şi alt procedeu de marcare a relaţiei dintre elementele din cele două coloane, cum ar fi unirea directă a lor prin linii, ori prin săgeţi,

CONSTANTIN MOISE

Cum se vede din prezentarea generală, aria de utilizare este foarte cuprinzătoare, ceea ce constituie un avantaj şi deci o motivaţie în favoarea promovării acestui fel de itemi obiectivi. La rândul lui, exemplul de mai sus ne arată că, în unele ipostaze cel puţin, avem a face cu o modalitate complexă, pe care o putem socoti o îmbinare de mai mulţi itemi cu alegere multiplă (mai multe propuneri de răspuns, cerând simultan mai multealegeri corecte; mai mulţi posibili distractori). Conjugată cu omogenitatea obligatorie a conţinuturilor prezentate (pe ambele coloane este prezentat material din acelaşi domeniu, ceea ce împiedică elevul să procedeze prin excludere) şi cu modalitatea de construire a răspunsurilor, această complexitate se constituie într-un obstacol împotriva ghicirii soluţiei. Este ceea ce reprezintă virtutea "de rezistenţă" a itemilor în discuţie. Uşurinţa alcătuirii şi mânuirii itemilor simpli, este un alt avantaj, făcând posibilă abordarea unei cantităţi mari de comportamente în timp scurt.

În mod simetric cu abordarea celorlalte tipuri, iată şi aici neajunsurile esenţiale: se utilizează, în majoritatea situaţiilor pentru determinarea informaţiei de tip factual, deci fără profunzime; este de regulă dificil de asamblat, în astfel de itemi, un material mai complicat, respectând în acelaşi timp exigenţa omogenităţii (vezi şi D. Payne, lucr.cit., p. 75-76).

Iată regulile construirii corecte a itemilor de tip împerechere (Payne, lucr.cit., p. 73; Gronlund, lucr.cit., p. 167; Stoica, coord., 2001, p. 105): pe fiecare coloană (coloana A, a premiselor şi pe coloana B, a răspunsuri -lor propuse) să

fie plasat material omogen; adică să nu fie menţionate pe coloana A, de pildă, opere literare, alături de evenimente istorice şi de enunţuri despre mari descoperiri geografice, iar în coloana B, nume de scriitori, date istorice şi nume de exploratori, aceasta ajutând elevul să procedeze prin excludere şi să ghicească răspunsul;

numărul premiselor să fie inegal faţă de răspunsurile propuse (unii autori optează pentru un număr mai mare al premiselor, alţii pentru varianta inversă), din acelaşi motiv al evitării ghicirii răspunsului corect;

instrucţiunile date elevului să fie bine direcţionate şi complete, ferindu-l să înţeleagă alte sarcini pe care să încerce a le rezolva, sau să-şi consume timpul de răspuns recitind în mod repetat datele;

lista răspunsurilor să aibă o regulă, de exemplu ordinea cronologică, în cazul numerelor şi datelor istorice; ordinea alfabetică, în cazul numelor sau cuvintelor în general; prin aceasta, elevul va fi pe de o parte ajutat să se orienteze repede, pe de alta va fi împiedicat să încerce deducţii nefolositoare;

când este cazul, elevul să fie prevenit dacă unele răspunsuri se pot împerechea cu premisele o dată, mai mult de o dată sau deloc, pentru a nu-l expune riscului de a greşi prea mult;

după unii autori, numărul premiselor nu trebuie să fie mai mare de 10-15 (vezi Payne), după alţii, să nu depăşească 4-5 (vezi Mândruţ, loc.cit.), tot în scopul ca elevul să nu fie derutat de mărimea itemului;

unii autori (vezi Gronlund, loc.cit.) optează pentru aşezarea pe aceeaşi pagină a tuturor itemilor, pentru ca elevul să se poată orienta sinoptic asupra lor şi pentru a se limita foşnetul întoarcerii filelor pe timpul rezolvării.

Itemul tip răspuns cu alegere multiplă este considerat de autorii americani citaţi cel mai suplu, mai flexibil, mai adaptabil la diverse conţinuturi implicate în evaluare (Gronlund, 1971, p. 173 urm.; Payne, lucr. cit.), de unde concluzia că, dintre itemii obiectivi, el are pe drept cea mai largă folosire. Este utilizat pe scară largă în componenţa testelor standardizate. Poate servi la măsurarea unor achiziţii comune cu celelalte tipuri de itemi obiectivi, dar remarcabilă este mai ales utilizarea lui (în unele ipostaze) la nivele taxonomice înalte: analiză, interpretare. Se prezintă sub forma unei structuri cu două elemente alcătuitoare: de o parte tulpina (engl. stem), sau problema, sau, după unii autori (vezi M. Mândruţ, loc cit.) "premisa", formulată fie printr-o întrebare directă, fie printr-un enunţ incomplet; de altă parte un grupaj de răspunsuri propuse ca posibile, denumite alternative, din care una este corectă sau cea mai bună, iar celelalte (nevalabile) au rolul de distractori, constituind obstacole ce trebuie depăşite de către examinaţi. Distractorii nu trebuie interpretaţi atât ca factori derutanţi, cât mai ales stimulativi, mobilizatori ai energiilor şi capacităţilor elevului.

Itemii aici în discuţie pot apărea în două ipostaze de complexitate (vezi Gronlund, loc cit.): ipostaza răspuns corect şi cea tip răspunsul cel mai bun. Încercăm mai jos exemplificări din fiecare, după sugestiile oferite de autorii americani şi cei români menţionaţi în frazele anterioare.

Prima variantă este cea mai simplă, asemănându-se flagrant cu itemii semiobiectivi tip răspuns scurt, respectiv tip completare (vezi la titlul dedicat itemilor semiobiectivi), diferenţa constând doar din efortul elevului de a alege unicul răspuns corect. Nivelul taxonomic al obiectivului de evaluare rămâne de regulă unul inferior, de pildă recunoaşterea unui fapt, unui fenomen, unei însuşiri.EXEMPLU:

TULPINĂ: Care dintre conceptele psihologice notate mai jos redă o entitate cuprinsă în categoria procese şi activităţi reglatoare ?

ALTERNATIVE DE RĂSPUNS: A percepţiaB gândireaC limbajul D atenţiaE imaginaţiaElevul trebuie să încercuiască litera antepusă răspunsului corect. Acelaşi item poate fi construit prin utilizarea, în loc de întrebare, a unui enunţ incomplet: Dintre conceptele psihologice notate mai jos, cel care se cuprinde în categoria procese reglatoare este:

A percepţiaB gândirea C limbajul D atenţiaE imaginaţia

Preferinţa pentru întrebarea directă sau pentru enunţul incomplet depinde de diverşi factori, între care vârsta şi experienţa de învăţare a elevului, relevanţa sau eficienţa în context etc.

CONSTANTIN MOISE

Varianta tip răspunsul cel mai bun ilustrează un nivel taxonomic net mai înalt, fiind mult mai dificil de rezolvat. De această dată, elevul se află în faţa unor alternative de răspuns dintre care mai multe pot prezenta grade diferite de acceptabilitate, el trebuind să o indice pe cea considerată superioară tuturor.

EXEMPLU: TULPINĂ: Care dintre următorii factori condiţionează cel mai mult creativitatea

individuală?ALTERNATIVE DE RĂSPUNS:

A voinţaB imaginaţiaC grupulD calităţile gândirii divergente

Nivelul taxonomic reprezentativ pentru această variantă de item cu alegere multiplă poate fi situat între comprehensiune şi analiză, dominantă fiind analiza datelor factuale şi obligând elevul la un efort de elaborare mai accentuat decât varianta anterioară (de tip răspuns corect). Pentru formularea problemei de rezolvat (tulpina itemului) se poate adopta, şi în acest caz, alternativa enunţului incomplet.

Adăugând consideraţiilor din preambulul prezentării acestui tip de item pe cele care reies din exemplificările de mai sus, credem că nu mai sunt necesare altele, pentru a demonstra avantajele itemilor de tipul "alegere multiplă".

Nu putem trece, însă, peste unele limite pe care le prezintă. De pildă, înseşi formulările fixe pe care le foloseşte împiedică elevul să-şi demonstreze şi capacităţile de felul celei de organizare a conţinuturilor posedate de el, precum şi eventualele lui capacităţi creative. Altă limită se referă la dificultatea construirii, mai ales a conceperii distractorilor; este posibil, de exemplu, ca distractorii să fie atât de contrastanţi cu răspunsul corect, sau să se facă atâtea precizări în varianta de răspuns corectă, încât să sugereze foarte transparent alegerea necesară. Se poate menţiona apoi dificultatea corecturii, când alternativele corecte de răspuns nu se limitează la una singură, sau când nuanţările de acceptabilitate sunt prea dificile, astfel că elevul le rezolvă doar parţial, de unde incertitudinea notării (vezi şi Mândruţ, lucr. cit., p.101 urm.).


Menţionaţi două asemănări şi două deosebiri între itemii de tip împerechere şi cei de tip alegere multiplă.

Regulile de construire a itemilor tip alegere multiplă sunt foarte numeroase (vezi Gronlund, loc. cit., p. 183 urm.; vezi Payne, loc.cit., p. 63 urm.). Încercăm o sinteză a acestora cu nuanţările de rigoare, după cum urmează: problema ("tulpina" sau "trunchiul") itemului să fie clară prin sine şi complet formulată

din punct de vedere logic, nu "eliptică" sau "neterminată", această ultimă formă inducând un răspuns tot imprecis; spre exemplu,

NU în forma: "Eminescu: A A fost poet naţional.B A fost luptător social.

C A fost un poet romantic.D A murit sărac ".

CI în forma: "Prin felul cum şi-a conceput creaţia, Eminescu trebuie considerat: A. un poet naţional

B. un poet simbolist C. un poet romanticD. un poet revoluţionar";

tulpina să nu includă elemente fără legătură cu itemul; de pildă, dacă între răspunsurile propuse în această ultimă variantă a itemului de mai sus am fi introdus şi alternativa: "un mare amator de petrecere", nefiind nici o legătură între un anumit mod de a crea şi petrecere;

pentru simplificarea analizei de către elev a răspunsurilor propuse, este de dorit ca elementele posibil-repetitive în răspunsuri, să fie incluse în premisă; de pildă,

NU: "Sterilizarea instrumentelor medicale se face prin: A. fierberea lor în apă la 80 grade C. B. fierberea lor în apă la 85 grade C. C. fierberea lor în apă la 95 grade C. D. fierberea lor în apă la 100 grade C,CI: "Sterilizarea instrumentelor medicale se face prin fierberea lor în apă la: A 80 grade C B 85 grade C etc.;

să se evite la maximum premisele de formă negativă, care conduc la "voalarea" itemului şi la dificultate de clarificare; de exemplu,

NU forma: "Nici o entitate psihologică din cele următoare nu se încadrează categoria însuşirilor de personalitate, afară de:

A memorie B atenţie C laşitate D sentiment";CI forma: "Care dintre entităţile psihologice următoare se încadrează în categoria

însuşiri de personalitate ? (şi din nou: A, B etc.); să se evite, de asemenea, formulările negative care contorsionează itemul, făcându-l

neclar; spre exemplu, formularea: "Care dintre activităţile de mai jos reprezintă suportul unor funcţii vitale

pentru fiinţa umană ? A. alergarea B. mişcarea C. mersul pe jos D. nici una din cele de mai sus"

nu ar fi profitabilă pe măsura efortului elevului, trebuind să i se prefere cea care înlocuieşte enunţul D cu unul care exprimă concret un proces vital;

poziţia răspunsului corect, între celelalte, să nu fie fixă, pentru a nu sugera elevului "calcule" care să-l conducă la ghicirea răspunsului corect; de exemplu, să nu obişnuim elevul cu plasarea răspunsului corect numai în mijlocul, sau numai la începutul, sau numai la sfârşitul suitei de răspunsuri propuse spre acceptare.;

CONSTANTIN MOISE

distractorii (răspunsurile incorecte adică) să fie astfel aleşi încât să aibă o aparenţă plauzibilă, deci să nu fie de uşurinţă ridicolă; de pildă, plasarea răspunsului cuprinzând numele lui Cristofor Columb, ca descoperitor al Americii, alături de altele care l-ar menţiona în aceeaşi postură pe Twain, sau pe Ludovic al XIV-lea ar fi o absurditate, furnizîndu-i elevului drumul cel mai scurt către răspunsul exact, fără nici un alt efort.

O variantă cu totul specială de itemi obiectivi este reprezentată de itemii tip interpretare, considerată de autorii americani cea mai complexă. Rezultatele pe care le măsoară sunt foarte cuprinzătoare: capacitatea de a aplica principii, de a interpreta relaţii, de a formula şi susţine ipoteze, de a recunoaşte şi a argumenta valabilitatea unor generalizări etc., aşadar la nivelul cel puţin al analizei, fiind puntea dintre itemii obiectivi şi cei de tip eseu (vezi Gronlund, loc cit, p. 197 urm.). Iată un exemplu de item care poate fi folosit pentru a măsura capacitatea de selecţie a informaţiei relevante, capacitate formată prin exerciţii speciale de învăţare, să zicem, într-o şcoală de poliţie.

PROBLEMĂ: Unui bătrân i se fură câinele de companie, fapt pe care îl reclamă şi solicită ca animalul să fie identificat. Oferă informaţii cuprinse în propoziţiile de mai jos. Încercuieşte cuvântul DA sau NU antepus, după cum consideri folositoare sau indiferentă informaţia pe care o cuprinde.DA NU 1. Câinele a fost primit cadou de când avea trei luni.DA NU 2.Este de rasa dog german.DA NU 3. Reacţionează la semnalul "Jar ".DA NU 4. Are ambele urechi "netunse".DA NU 5. Şchioapătă cu piciorul stâng.DA NU 6. Este negru şi are o pată albă între ochiul şi urechea dreaptă.DA NU 7. Are coada scurtă.

Candidatul va fi obligat la un travaliu apreciabil, socotind că chiar dacă informaţiile aflate din propoziţiile 2 şi 6 sunt primele necesare, ele ar putea să nu fie şi suficiente, trebuind completate cu 4, sau cu 3.


Găsiţi elemente de asemănare şi de deosebire între itemii tip alegere multiplă şi cei tip interpretare.

Şi în acest caz se pot sublinia avantaje, precum şi limite. Ambele dimensiuni sunt comparabile cu cele exprimate în dreptul celui de mai sus. Măsurarea componentelor înalte ale comportamentului elevului, odată cu notarea prin procedee obiective, utilizarea posibilă în scopuri formative, respectiv pentru exersarea competenţei de interpretare, reprezintă avantajele esenţiale. Limitele se constituie în jurul dificultăţii de construire a unui număr suficient, al consumului mare de timp pentru prelucrarea datelor şi notare, sau al necuprinderii întregii anverguri taxonomice, nici de către aceşti itemi, capacitatea de organizare a propriului discurs şi creativitatea rămânând tot în afara evaluării pe această cale.

Ca reguli de construire se menţionează: să fie ales materialul introductiv întotdeauna în legătură cu nivelul obiectivului cursului

(cf. Gronlund, idem, p. 211), deci nici sub, nici peste dificultatea acestuia, într-un caz fiind

neformativ, în celălalt fiind greu de relaţionat de către elev cu conţi-nuturile care se discută;

materialul introductiv să fie pe măsura experienţei de învăţare a copiilor; nu vom solicita elevul să interpreteze fapte despre care nu are nici cunoştinţele, nici exerciţiul de abordare necesar; de exemplu, pentru copiii din treptele inferioare să fie folosit mai ales material pictorial, cel bazat pe relatarea scrisă fiind recomandabil pentru cei mari;

noutatea materialului introductiv să fie promovată obligatoriu, cu fiecare item, dar respectând regula evoluţiei treptate, fără salturi descurajatoare pentru elev;

în privinţa raportului dintre lungimea materialului introductiv şi numărul de enunţuri, este de regulă preferabil un material introductiv scurt şi un număr de enunţuri mare, sau un relativ echilibru; este total ineficient raportul bazat pe material stimul lung şi număr mic de enunţuri de interpretare, acesta putând fi înlocuit cu un item cu răspuns alternativ.

V.2.2.2.2. Itemii semiobiectivi îşi datorează denumirea faptului că, fiind vorba de răspunsuri formulate de elev (deci nu alese dintre cele propuse), ei implică o filtrare a răspunsurilor prin individualitatea acestuia din urmă şi deci o nuanţare diferită a notării. Cum deja am stabilit în paginile anterioare, în rândul lor se înscriu: itemii de tip răspuns scurt, cei de tip completare şi cei de tip întrebări structurate.

Itemii tip răspuns scurt fac în realitate corp comun cu cei de tip completare, ambele variante exprimând strict aceleaşi exigenţe. Deosebirea este că în primul caz răspunsul se cere printr-o întrebare directă, în timp ce al doilea se bazează pe un enunţ incomplet, răspunsul costând din completarea necesară a acestuia. Sunt denumiţi în unele surse şi cu titlul de itemi cu răspuns oferit (supply), spre a-i deosebi de cei cu răspuns ales, adică de cei tip răspuns alternativ, de tip împerechere, de tip alegere multiplă şi de tip interpretare. Spre exemplu:

Cine este autorul poemului Luceafărul? (Eminescu) (variantă cu întrebare directă), sau:

Poemul Luceafărul a fost scris de ………….. (variantă tip completare).

Cum se observă, avem a face cu o formă foarte simplă ca alcătuire şi foarte uşor abordabilă ca instrument de evaluare. Acest tip de item este utilizat pentru măsurarea unei multitudini de rezultate ale învăţării, de regulă tot foarte simple. Exemple:

1. Cunoaştere de terminologii:Ansamblul unităţilor de măsură se numeşte……………..(sistem metric)

2. Interpretare simplă de date:În cadrul cuvântului oaie, grupul de sunete oa reprezintă un ….. (diftong)

3. Cunoaştere de reguli: Apa îngheaţă la temperatura ……….(sub O grade)

4. Cunoaşterea de metode şi procedee de acţiune:Ordinea operaţiilor aritmetice este: …………………………. (întâi înmulţire şi împărţire, apoi adunare şi scădere)

5. Abilitatea de a reda echivalentele verbale ale unor conţinuturi prezentate prin desene, hărţi, diagrame etc.

De pildă, pe baza hărţii şi cu sprijinul semnelor convenţionale, elevul să completeze numele zăcămintelor minerale din fiecare localitate.

CONSTANTIN MOISE

6. Chiar capacitatea de a mânui simboluri matematice sau din ştiinţele naturii, sau de a rezolva probleme matematice, reprezentând simple aplicaţii ale operaţiilor aritmetice:

Dacă 4 x b = 36, atunci b= ………….(36: 4).

Iată şi un exemplu, din această categorie de itemi, cules din propunerile SNEE, pentru învăţământul primar:INSTRUCŢIUNE: Citeşte cu atenţie cuvintele următoare: ger, argint, Macela, Maricica. Care

cuvânt conţine grupul ce? (………..). Care cuvânt conţine grupul ci? (………..). Care cuvânt conţine grupul ge? (……). Care cuvânt conţine grupul gi? (………) (cf. V. Păuş, coord., 1999).

Iată altul, propus pentru disciplina Logică şi argumentare, clasa a IX-a (cf. Fl. Oţet, coord., 2000, p. 38 urm.): ENUNŢ: Completează spaţiile punctate astfel încât să obţii afirmaţii adevărate:

"Într-un raport de subalternare se pot afla două propoziţii care au………………" (răspuns corect: "aceeaşi calitate").


Ce factori consideraţi că influenţează mai mult, în specialitatea dumneavoastră, folosirea acestui tip de itemi?

Ce argumente s-au rostit în favoarea, respectiv ce limite au fost semnalate, în dreptul acestor itemi? Cât priveşte argumentele pentru utilizarea lor, toate sursele le menţionează pe următoarele (vezi Payne; Gronlund; vezi ghidurile SNEE): sunt o categorie dintre cele mai uşor de construit; sunt uşor aplicabili pretutindeni; dacă sunt riguros elaboraţi, sunt chiar uşor de corectat şi notat; ghicitul răspunsurilor este practic exclus, atâta vreme cât nu i se oferă elevului variante pe fondul cărora să ghicească. Noi adăugăm unu: dată fiind uşurinţa rezolvării lor, sunt chiar încurajatori pentru oricare categorie de elevi (dovadă, însuşi faptul că, în structura testelor şcolare, de regulă ei sunt plasaţi primii). Dar nici limitele nu pot fi ignorate, adică: exceptând acele probleme matematice elementare şi ecuaţii tot simple, din matematică, fizică, chimie, nivelul taxonomic este exclusiv cel al achiziţiei informaţiei, partea preponderentă a acestei informaţii fiind neînsoţită de explicaţii; corectarea şi notarea întâmpină dificultatea "contaminării" (adică a intervenţiei, în acest plan, a unor entităţi colaterale conţinuturilor de evaluat, cum ar fi insuficienţele de exprimare, erorile de scriere, aspectele estetice, împiedicând sau denaturând notarea corectă).

Regulile de construire a acestor itemi se rezumă astfel (Payne, loc.cit. p. 54 urm.; Gronlund, loc.cit., p. 154 urm.): sarcina pentru elev să fie formulată cu concizie, dar şi destul de explicit; de exemplu,

formulării insuficiente: "Ion Creangă a scris ………………………………………………."

să i se prefere: "Autorul poveştii Soacra cu trei nurori a fost ………………………"

itemii să nu includă prea multe spaţii albe, fiindcă devin greu de înţeles; de pildă, itemul:

"Păsările care …..şi……….anual se numesc……………." nu poate fi decriptat decât cu preţul unui mare efort (pentru a defini categoria "păsări migratoare");

nu este recomandată preluarea din manual a itemilor de acest fel; spre exemplu, formularea

"Numărul 17 este un număr ……", odată scoasă din textul în care era precedată de definirea numerelor prime, devine improbabil de completat cu cuvântul prim (număr prim);

spaţiile albe să fie egale ca lungime, chiar dacă dimensiunea răspunsurilor unor enunţuri, prezentate în acelaşi item, sunt diferite; de exemplu, dacă spaţiul alb din primul din enunţurile:

"Cuvintele care, în cadrul comunicării, fac legătura între elemente din categorii gramaticale diferite se numesc…………………"

şi"Cuvintele care, în cadrul comunicării, fac legătura între entităţi lingvistice din aceeaşi categorie gramaticală se numesc ……………."

ar fi mai lung decât cel din al doilea, ar putea sugera elevului răspunsul corect ("prepoziţie"), tocmai prin această deosebire;

se mai precizează de unii autori că, în itemii de completare, spaţiul alb conferă itemului mai multă claritate dacă este plasat la sfârşitul enunţului, mai puţină în mijloc, iar la început cea mai puţină (cf. Payne, loc. cit., p. 55).

Întrebările structurate (o noutate românească?) sunt definite ca "sarcini formate din mai multe subîntrebări, de tip obiectiv şi semiobiectiv, legate între ele prin înţeles", menite să "acopere spaţiul liber" între itemii obiectivi şi cei subiectivi (M. Mândruţ, 2001, p. 111; Stoica şi Neacşu, 1996). Alcătuirea unui astfel de item constă din: un element stimul (un desen, un tabel statistic, o hartă, un text), urmat de subîntrebările orientatoare, care concretizează sarcinile de rezolvat de către cel examinat; acestea din urmă sunt însoţite de punctaje-le ce se acordă. Iată un exemplu foarte convingător pentru concretizarea definiţiei de mai sus, extras din modelele de subiecte pentru examenul de capacitate din 2001 (cf. B.Vîlceanu, coord., 2001):

Citiţi cu atenţie textul de mai jos:I-a trecut cuiva prin minte să nege sau să conteste continuitatea poporului francez în Galia, a celui spaniol şi portughez în Peninsula Iberică sau a celui italian în Italia?

Pornind de la acest text, răspundeţi următoarelor cerinţe:1. Transcrieţi trei popoare înrudite cu poporul român………….……………….3p.2. Numiţi teoria la care face referire autorul ……………………………………3p.3. Menţionaţi două argumente ale contestatarilor continuităţii daco-romane şi

două contraargumente prin care să combateţi argumentele acestora ………..4p.4. Menţionaţi o cauză care a determinat disputa asupra continuităţii daco-romane

la nordul Dunării ……………………………………………………….……2p.Calităţile care susţin acest tip de itemi sunt rezumate astfel:

CONSTANTIN MOISE

faptul că se bazează pe întrebări deschise face posibilă exprimarea elevului la nivele mai înalte decât recunoaşterea sau reproducerea de cunoştinţe, cum a fost cazul itemilor obiectivi şi a celor semiobiectivi simpli, prezentaţi anterior; întrebările structurate deschid drumul spre explicaţii mai nuanţate, la nivelul analizei, invitând la interpretare ştiinţifică autentică;

prin intermediul subîntrebărilor, înşişi itemii subiectivi pot fi "modelaţi" în aşa fel încât să devină accesibili unui număr cât mai mare de elevi, fiecare putându-şi arăta pregătirea până la un punct.

Acestea sunt valorificabile, însă, cu condiţia depăşirii următoarelor limite: construirea subîntrebărilor este de mare dificultate, tratarea lor cu superficialitate

compromiţând toate avantajele; autorii care le promovează reclamă şi costurile ridicate pentru unele ipostaze ale acestor

itemi.Exigenţele de construire a întrebărilor structurate, deşi nu sunt puţine, sunt mai ales

schiţate, şi mai puţin explicate (vezi Mândruţ, 2000, p. 112): cum vom vedea că este necesar pe ansamblul testului în general, subîntrebările trebuie să

traseze o linie continuă de creştere a dificultăţii, începând cu cele mai uşoare, în interesul prevenirii unei descurajări premature a examinatului;

răspunsul la fiecare subîntrebare să fie astfel solicitat, încât să fie formulat scurt, consistent, concludent, ştiut fiind că răspunsurile lungi, în astfel de circumstanţe, diluează ideile vizate;

subîntrebările să fie independente, adică răspunsul fiecăreia să nu fie condiţionat de cel al alteia;

prin elementele pe care le conţin, subîntrebările să facă trimitere clară la aspecte existente evident în materialul stimul, deci să nu facă apel prioritar la imaginaţia elevului;

conţinuturile stimul să fie de asemenea concepute cu claritatea necesară, pentru a nu constitui prin sine obstacole în calea formulării precise a răspunsurilor; nu sunt recomandate, de pildă, textele prolixe sau întortochiate, nici materialele intuitive şterse sau "stufoase" ca înfăţişare;

să i se asigure elevului suficient spaţiu "alb" pe fişa de răspuns, pentru a nu fi nevoit să restrângă în mod artificial răspunsul, ceea ce ar include eventualitatea de a nu mai fi exact;

punctajul fiecărei subîntrebări să fie stabilit odată cu alcătuirea ei, ceea ce îi conferă acestuia concreteţea şi minuţiozitatea optimă.

V.2.2.2.3. Itemii de tip subiectiv figurează, în literatura domeniului, în mai multe ipostaze. Mai întâi numai ca itemi de tip eseu, în lucrările autorilor americani, fără a face diferenţieri pe subcategorii (Bloom, 1971, p. 201 urm.; Payne, 1968, p. 83-90). Apoi, prin nuanţarea categoriei de item eseu în subcategoriile: itemi eseu tip extins, deosebiţi de itemi eseu tip restrictiv (Gronlund, 1971, p. 219 - 233). În fine, ipostaza lansată de autorii români (Stoica şi Neacşu, coord., 1996; Mândruţ, 2001; toate ghidurile de evaluare ale SNEE), care este cea mai detaliată. Pe de o parte, ea conferă o mai mare cuprindere categoriei itemi subiectivi, încadrând în ea itemii tip rezolvare de probleme alături de itemii tip eseu; pe de altă

parte, delimitează itemii eseu în subcategorii, după două criterii: criteriul dimensiunii, după care rezultă itemii tip eseu cu răspuns restrâns şi itemii tip eseu cu răspuns extins; criteriul "tipul răspunsului aşteptat" (cf. R.Doicescu, coord., 2001, p. 47 urm.), sau al "gradului de detaliere a cerinţelor" (Mândruţ, 2001, p. 118), rezultând itemii tip eseu structurat şi itemii tip eseu liber. Pe această ultimă schemă, vom încerca să alcătuim comentariul de mai jos.

Itemii de tipul "rezolvare de probleme" sunt prezentaţi numai în documentele SNEE, cu precizarea că este mai corect spus "rezolvare de situaţii problemă" (cf. Mândruţ, loc. cit.), făcând probabil trimitere la definiţia rezolvării de probleme după R. Gagné (vezi, în cursul de teoria instruirii, metoda problematizării şi tipurile de învăţare după R. Gagné, unde se găseşte şi definiţia rezolvării de probleme). Caracterizarea acestui tip de item este următoarea (cf. A. Stoica şi colab., 2001): elevul este pus în faţa unei situaţii noi pentru el (Gagné i-a spus inedită), care nu are "o soluţie predeterminată "; sunt fel şi fel de situaţii problematice, de la cele mai simple, "închise", pentru care îi sunt oferite elevului cele mai importante date, de unde şi rezolvarea este simplă, până la cele mai complicate, complet "deschise"; acestea din urmă necesită, din partea elevului, un travaliu foarte minuţios, derulat pe etape, cele mai de seamă fiind:

identificarea problemei; culegerea şi selectarea datelor de bază (relevante); formularea şi validarea unor ipoteze; identificarea metodei de rezolvare; propunerea unei soluţii; evaluarea soluţiei; formularea concluziei asupra rezolvării realizate.

Ca exemplu pentru variantele simple, l-am imaginat pe următorul: I se prezintă elevului de clasa a IV-a o fişă pe care sunt desenate: o păstaie de fasole, o ceapă, un morcov, un măr. I se formulează cerinţa ca, pe baza cunoştinţelor lui despre felul cum se formează fructul unei plante, să grupeze conţinutul desenului pe trei categorii de entităţi. Se stabileşte şi o schemă de notare, cuprinzând câte trei puncte pentru fiecare categorie. Rezolvarea exactă este: categoria fructe: mărul; legume: morcovul şi ceapa; legume dar şi fructe: păstaia).

Exemplul pentru situaţiile complexe l-am preluat din ghidul din anul 2000 pentru evaluarea rezultatelor şcolare la ştiinţele socioumane (cf. Fl. Oţet, coord., 2000, p.50), după cum urmează:

"Activitatea se desfăşoară pe trei etape: în prima etapă, elevii răspund individual, în scris, la două întrebări:

Când învăţ la psihologie, de ce învăţ?Când nu învăţ la psihologie, de ce nu învăţ?

în a doua etapă, profesorul formează grupe de câte 5 elevi, fiecare grupă având următoarele sarcini:

a. Grupaţi răspunsurile la cele două întrebări conform formei de motivaţie în care se încadrează fiecare;

CONSTANTIN MOISE

b. Identificaţi forma de motivaţie dominantă;c. Formulaţi două soluţii posibile pentru asigurarea suportului motivaţional adecvat şi

creşterea performanţei în învăţare; în a treia etapă, fiecare grupă îşi alege un raportor care să prezinte modul în care s-a

realizat activitatea de rezolvare a sarcinii şi soluţiile propuse. Activitatea se încheie cu o discuţie frontală asupra soluţiilor propuse şi posibilităţilor de aplicare a lor.

Schema de notare va ţine cont de: corectitudinea grupării răspunsurilor conform formei de motivaţie în care se încadrează

fiecare; corectitudinea identificării dominantei motivaţionale; caracterul adecvat şi fezabil al soluţiilor propuse."

Motivaţia utilizării acestei variante de item subiectiv este axată tot pe nişte avantaje. Le transcriem după documentele SNEE astfel: stimulează gândirea creativă, prin felul cum formulează sarcinile; contribuie la transferul de proceduri de rezolvare între domenii diferite sau în interiorul

aceluiaşi domeniu; după autorii care o propun, dezvoltă chiar şi abilităţile de cooperare, comunicare, lucru în

echipă; dezvoltă capacităţile autoevaluative; favorizează punerea în relief a capacităţii de "raţionare flexibilă şi operantă" (Fl. Oţet, coord., 2000).

Dezavantaje: timpul îndelungat necesar pentru proiectare, dată fiind complexitatea probei; subiectivitatea şi dificultatea notării, dezavantaje care se complică o dată în plus în cazul

lucrului în echipă (idem).


Analizaţi acest exemplu şi conchideţi în ce tip de evaluare se poate încadra, după criteriul funcţiei dominante.

Probabil datorită dezbaterii mai restrânse asupra acestui tip de itemi regulile şi restricţiile de construire sunt în mai mică măsură exprimate, limitându-se la câteva, adică (cf. Mândruţ, 2001, p. 119): -sarcinile puse în faţa elevului să fie destul de diversificate, pentru ca rezolvarea de

probleme să fie şi un exerciţiu formativ, şi o modalitate de a aprecia nişte capacităţi realmente superioare; spre exemplu, dacă elevului i se vor prezenta de regulă probleme de acelaşi tip, capacitatea pe care o vizăm va degenera în simplă rutină;

-sarcinile să se axeze precis pe obiectivul de evaluare vizat; exemplul simplu de mai sus, de pildă, trebuie să se "muleze" precis pe obiectivul: "elevul să probeze capacitatea de a încadra (prin analiză) în categorii diferite unul şi acelaşi obiect (păstaia).

Itemii de tip eseu. Înainte de analiza lor pe variantele menţionate, iată cum justifică Gronlund necesitatea folosirii itemilor eseu văzuţi în general: "Unele aspecte ale achiziţiilor complexe nu pot fi măsurate în mod obiectiv (adică prin itemi de tip obiectiv - n.n., C.M.). Rezultatele şcolare care arată că elevii trebuie să genereze idei … să organizeze şi să exprime

idei … şi să le integreze într-o abordare globală a unei probleme pretind o mai mare libertate a răspunsului, care este conferită de testul eseu " (loc.cit., p.218).

Reiese foarte limpede, din acest citat, justificarea de principiu a tuturor variantelor subiective ale itemilor de examinare, ele fiind necesare pentru măsurarea la nivelele taxonomice cele mai înalte.

Itemii tip eseu cu răspuns restrâns (numiţi, în documentele SNEE, şi cu termenul de itemi minieseu) sunt caracterizaţi mai întâi de către autorii americani citaţi mai sus ca fiind marcaţi de anume restricţii sau limitări, formulate chiar prin enunţul întrebării, limitări care vizează în măsură egală forma şi conţinutul răspunsurilor pretinse. Adaptăm un exemplu după sugestia oferită de către Gronlund:

"Prezintă, pe o jumătate de pagină, două asemănări şi două deosebiri între gândire şi imaginaţie. Nu relua exemplele comentate deja în clasă."

Caracterizarea tipului de itemi în discuţie de către autorii documentelor SNEE este realizată prin invocarea aceloraşi însuşiri ca mai sus, adică: itemii eseu cu caracter restrictiv sunt cei cărora li se precizează "dimensiunea maximă admisă a răspunsului aşteptat", respectiv număr de paragrafe, de rânduri, de cuvinte (cf. Fl. Oţet, loc. cit.; de asemenea, Stoica, coord., 2001). Mai trebuie adăugată doar observaţia că, în comentariile autorilor români, eseul scurt nu este nuanţat pe variantele eseu structurat vs. eseu nestructurat, ca în cazul celui cu răspuns extins.

Itemii eseu cu răspuns extins sunt comentaţi şi concretizaţi prin exemple mai întâi de autorii americani Payne (1968) şi Bloom (1971), apoi detaliaţi de către Gronlund astfel: sunt itemi eseu care, prin felul cum sunt concepuţi, permit elevului "să aleagă orice informaţii factuale pe care le consideră pertinente, să organizeze răspunsul în acord cu raţionamentele considerate cele mai bune, să- şi integreze şi evalueze ideile cum socoteşte că este mai potrivit" (lucr.cit., p. 220). Este făcută, de asemenea, menţiunea că un item de acest fel alcătuieşte de regulă singur un test întreg. Ca exemplu, potrivit sugestiei autorului, l-am putea prezenta pe următorul:

"Elaborează o lucrare despre tematica "scrisorilor" eminesciene. Poţi invoca orice idee, cu condiţia să încerci a o susţine prin argumente" şi să te încadrezi în timpul de trei ore".

Varianta conceptuală a SNEE, privind itemii eseu cu răspuns extins, face delimitarea între itemii tip eseu structurat şi itemii de tip eseu liber (cf. G. Chirleşan, coord., 1999; Fl. Oţet, 2000; A. Stoica, coord., 2001; R. Doicescu, coord., 2001).

Itemii de tip eseu structurat sunt definiţi prin relativa limitare a libertăţii examinatului în ce priveşte modul de organizare şi aspectele de tratat: "răspunsul aşteptat este orientat prin cerinţele formulate, libertatea de organizare nefiind totală" (M. Mândruţ, loc. cit., p.118); "prin cerinţe explicite, indicaţii sau sugestii, răspunsul elevului este orientat, structurat, organizat, ordonat (cf. Fl. Oţet, loc cit., p. 52). Pentru ilustrare, iată un exemplu din disciplina Fizica (cf. G. Chirleşan, loc. cit., p. 77):

CONSTANTIN MOISE

"OBIECTIV DE EVALUARE: Elevii vor fi capabili să analizeze fenomene, situaţii, fapte, date cu conţinut fizic din realitate.

ENUNŢ: Alcătuiţi un eseu cu tema Electricitatea cea de toate zilele, în care să folosiţi următorul plan de idei:

a. curentul electric (prezentarea fenomenului fizic);b. utilitatea curentului electric în viaţa cotidiană; c. probleme ce pot apărea la utilizarea necorespunzătoare a curentului electric;d. norme de protecţie în utilizarea curentului electric."

În conformitate cu regula prezentă în mai toate ghidurile de evaluare elaborate în prezent la noi, acest fel de itemi ar trebui să se însoţească şi de o schemă de corectare şi notare, care să stabilească, analitic, punctajele care să alcătuiască scorul probei.

Iată şi un alt exemplu din disciplina Limba şi literatura română , mai detaliat decât cel de mai sus (cf. Stoica, coord., 2001, p. 119):

"OBIECTIV DE EVALUARE: Elevul să probeze capacitatea de elaborare, prin îmbinarea diferitelor categorii de cerinţe.

ENUNŢ: Scrie o compunere prin care să redai statutul psihologic şi social al personajului Costache Giurgiveanu, din romanul Enigma Otiliei. Vei avea în vedere următoarele:

prezentarea pe scurt a formulei estetice folosite de romancier în construcţia personajelor;

identificarea tipului uman reprezentat de Costache Giurgiuveanu; argumentarea, pornind de la întrebări şi situaţii selectate din cuprinsul

romanului, a tipologiei identificate; prezentarea raporturilor dintre Costache Giurgiuveanu şi cel puţin două

dintre personajele romanului".Se dau instrucţiuni despre lungimea compunerii, detalii despre modul de notare şi se

anunţă punctajul total. În privinţa schemei de corectare şi notare, de această dată se fac menţiuni despre punctajul acordat pe o mulţime de "dimensiuni" sau "indicatori", cum ar fi: prezentarea metodei utilizate de autorul romanului în alcătuirea estetică a situaţiilor; indicarea modelului de personaj promovat de autor; organizarea ideilor; abilităţile analitice şi critice ale examinatului; folosirea limbii; ortografie; punctuaţie; aşezare în pagină; menţiuni care să fie bine însuşite de către examinator şi aplicate în mod unitar.


Apreciaţi în ce măsură alcătuirea în mod diferit a itemilor de acest fel, de la o specialitate la alta, are influenţă (pozitivă sau negativă) asupra înţelegerii şi aplicării în activitatea evaluatorilor.

Cât despre itemii de tip eseu liber, văzuţi în varianta conceptuală a SNEE, ei sunt prezentaţi, definiţi, concretizaţi în aceeaşi termeni în care americanii citaţi îi descriu pe cei de tip extins. Se pot menţiona unele exemple interesante de astfel de itemi, cuprinse în respectivele documente, cum ar fi: "Explicaţi repartiţia precipitaţiilor medii anuale pe întinderea teritoriului ţării noastre " (Mândruţ, lucr.cit.), sau "Compară regimurile totalitare din perioada interbelică, stabilind asemănări şi deosebiri " (cf. R. Doicescu, coord., 2001, p.59).

Este firesc ca şi în cazul itemilor de tip eseu, în toate variantele prezentate, să fie invocate nişte avantaje care să le susţină şi nişte limite şi dificultăţi care să îndemne la prudenţă în utilizarea lor. Facem aceste precizări, aşezând itemii în discuţie pe linia unui continuum, începând cu itemii cu răspuns restrictiv, continuând cu cei tip eseu structurat şi încheind cu cei tip răspuns extins, sau, după cealaltă denumire, cu itemii tip eseu liber. După definiţiile şi exemplificările prezentate, atât avantajele, cât şi limitele fiecărei categorii sunt lesne de intuit. Altfel spus, dacă ne aflăm în sfera variantei răspuns restrictiv, sau a celei structurate, vom beneficia de avantajele:

uşurinţa mai mare a alcătuirii şi corectării; orientarea mai precisă a examinatului şi rezolvarea mai rapidă; notarea de regulă mai precisă; fidelitate bună

fiind prezentă totodată o limită majoră: posibilitatea redusă de măsurare a competenţelor de nivel maxim.Dacă, dimpotrivă, promovăm varianta răspuns extins, ne vom confrunta cu avantajele

şi limitele exact în sens invers: posibilitatea cvasinelimitată de măsurare a capacităţilor de nivel taxonomic

maxim, bazate pe structura raţionamentului interpretativ, originalitate, reactivitate, iar necesitatea fiindu-i simţită mai ales în domeniul ştiinţelor socioumane, dar fără excluderea utilităţii în toate domeniile (vezi şi Bloom, 1971, p. 193 urm.);

ca avantaj esenţial, dar şi limitele: dificultatea proiectării, în concordanţă cu disponibilităţile elevului (de pildă, este

posibil ca proiectantul să pretindă anume parametri, iar examinatul să-şi focalizeze prestaţia pe alţii);

notare mai dificilă şi cu alocare de timp mai mare; o fidelitate mai mică.


Formulaţi concluzia care vi se pare convenabilă, după constatarea, în paralelă, a avantajelor şi limitelor de mai sus.

Testul eseu, în diferitele lui variante, trebuie să se conformeze următoarelor reguli de proiectare: să fie folosit doar când nu este posibilă măsurarea obiectivă; aceasta din cauza

subiectivităţii pe care o implică în actul notării; utilizarea să ţină seama cu stricteţe de nivelul de înţelegere al elevilor; nu credem necesară

neapărat formula "Scrie un eseu despre………", fie şi la clasele gimnaziale (de cele primare nici nu poate fi vorba, în această privinţă), dacă elevul încă nu şi-a definit bine acest concept, mai proprie fiind "Scrie o lucrare ….."; un lucru nelămurit de la început în modul optim este susceptibil să producă confuzie pe termen lung;

în cazul eseului restrictiv precizia (până foarte aproape de testul obiectiv) cu care este formulată sarcina trebuie să fie calitatea sa prioritară; de pildă:

CONSTANTIN MOISE

NU în forma: "De ce s-au rărit rândunelele ?", CI în varianta: "Formulaţi trei-patru ipoteze pentru a explica dispariţia unei bune părţi

a rândunelelor", trebuie prezentată sarcina elevului; în cazul aceleiaşi variante, să i se facă, de asemenea precizările privind spaţiul de tratare şi

timpul alocat, astfel elevul fiind sprijinit să- şi organizeze prestaţia în formula cea mai productivă.

prin cerinţa formulată, să se facă trimitere exactă la nivelul taxonomic vizat; de pildă, odată cu enunţarea conţinuturilor (temei) de tratat, să i se precizeze elevului şi aspectele ce vor fi notate, cum ar fi: complexitatea şi organizarea logic-cauzală a ideilor, relevanţa argumentelor, capacitatea de interpretare, toate ţinând vizibil de cele mai înalte nivele taxonomice (analiză, sinteză, evaluare);

punctajul şi schema de corectură să fie foarte minuţios elaborate, dată fiind subiectivitatea potenţial mare a notării; la nevoie, schema de notare se poate chiar revizui, după începerea corecturii şi constatarea nonrelevanţei ei în contextul prestaţiei examinatului.

V.2.2.3. Calităţile necesare testului docimologicTestului docimologic i se pretind următoarele calităţi: obiectivitate, aplicabilitate,

validitate, fidelitate, fiind preluate de la testul psihologic, a cărui variantă aplicativă este. Sunt menţionate, de asemenea, calităţile dezirabile pentru fiecare item de test, anume: un nivel semnificativ de dificultate şi o capacitate de discriminare suficientă. Dintre autorii care au fost preocupaţi special de problema evaluării şcolare (cf. Payne, 1971, p. 155 urm.; Ausubel şi Robinson, 1981, p.677 urm.; Gronlund, 1971, p. 74 urm. şi 101 urm.; De Landsheere, 1975, p. 164 urm.; Lindeman, 1978, p. 479 urm.; I.T. Radu, 1981, p. 239 urm.), unii (I.T. Radu, lucr.cit.) le specifică pe toate; alţii ignoră obiectivitatea, socotind-o, poate, absorbită în celelalte, iar asupra aplicabilităţii nu se opresc prea amănunţit, probabil din aceleaşi considerente. Dat fiind caracterul didactic al demersului de faţă, considerăm că este normal să le menţionăm şi definim şi pe acestea, în context pedagogic. Adăugăm observaţia că autorii Ausubel şi Robinson citează în plus, drept calitate obligatorie a testului docimologic, caracterul reprezentativ al testului, care, la ceilalţi, este inclus în validitate. El înseamnă acea calitate a testului de cuprinde ceea ce este relevant în curs, deci nu amănunte fără semnificaţie.

Obiectivitatea se defineşte ca: acea calitate a testului constând din obţinerea aceloraşi rezultate, indiferent de examinatorul (competent) care îl aplică. Este denumită şi prin expresia "concordanţă interpersonală", cu referire la "persoana" celor care examinează. Fireşte că este foarte necesară, putându-se asigura prin diverse măsuri: acordul prealabil al examinatorilor, identitatea administrării, identitatea aplicării instrucţiunilor de notare. Mai trebuie notat că identitatea rezultatelor este relativă (unele surse folosesc sintagma "rezultate comparabile", în loc de "aceleaşi rezultate") (vezi şi L. Gavriliu, 1969, p. 18; de asemenea, A. Stan, 2002, p.139).

Aplicabilitatea testului însumează în sine mai multe variabile: utilitatea informaţiei pentru explicarea randamentului elevilor testaţi; potrivirea sarcinilor de rezolvat, ca formă şi conţinut, cu nivelul de vârstă al subiecţilor; modul de corectare destul de simplu şi rapid;

timpul de aplicare destul de convenabil ca lungime; costuri convenabile. Şi ea este importantă, dar se ia în discuţie numai după satisfacerea celorlalte.

Fidelitatea (denumită şi consecvenţă, precizie, siguranţă) constă din calitatea de a măsura la fel de fiecare dată şi pe întreaga cuprindere a testului; sau: calitatea dată de "cât de statornic este scorul unui test de la o măsurare la alta" (Gronlund, 1971, p. 100); sau din calitatea de a da rezultate "consecvente cu ele însele" (Ausubel şi Robinson, 1981, p. 682). Se poate determina în mai multe feluri. Unul dintre procedee este repetarea aplicării uneia şi aceleiaşi variante de test, numit şi procedeul test-retest, în urma căruia prin statistici specifice şi calcule matematice se poate determina coeficientul de stabilitate. Alt procedeu constă din aplicarea, în paralelă cu testul ce se experimentează, a unei variante cu itemi echivalenţi, prin el putându-se calcula coeficientul de echivalenţă. În fine, putem menţiona procedeul care recurge la gruparea de o parte a itemilor impari, iar de alta a itemilor pari, apoi la stabilirea corelaţiei dintre rezultatele celor două jumătăţi ale testului, fără să mai fie nevoie de repetarea aplicării; se numeşte procedeul înjumătăţirii sau procedeul perechi-neperechi, iar din calcul rezultă tot un coeficient de echivalenţă, numit (doar în acest caz) şi coeficient de fidelitate de clivaj. Toţi aceşti coeficienţi pot fi denumiţi cu termenul generic de coeficienţi de corelaţie, termen utilizat şi pentru stabilirea validităţii, cu deosebirea că, în acel caz, el are alte conotaţii. Mai la îndemână ne este, şi în aceste situaţii, coeficientul de corelaţie Pearson.

Iată mai jos o scurtă demonstraţie de calcul al fidelităţii, prin metoda înjumătăţirii (adică între itemii pereche şi cei nepereche). Pornim de la rezultatele obţinute la itemii impari şi cei pari, centralizate în tabelul de mai jos.

ItemiSubiecţi

Xit.impari

Yit. pari

X y X2 y2 xy

1 6 3 2,64 -0,18 6,97 0,03 -0,48 2 5 4 1,64 0,82 2,69 0,67 1,34 3 4 4 0,64 0,82 0,41 0,67 0,52 4 1 2 -2,36 -1,18 5,57 1,39 2,78 5 1 4 -2,36 0,82 5,57 0,67 - 1,94 6 4 3 0,64 -0,18 0,41 0,03 -0,12 7 5 2 1,64 -1,18 2,69 1,39 -1,94 8 4 5 0,64 1,82 0,41 3,31 1,16 9 2 3 -1,36 -0,18 1,85 0,03 0,24 10 1 2 -2,36 -1,18 5,75 1,39 2,78 11 4 3 0,64 -0,18 0,41 0,03 -0,12

Media3,36

Media3,18

Σ=32,55 Σ= 9,64 Σ= 4,27

Cum se vede, este un tabel cu două intrări: pe intrarea coloanelor sunt redaţi itemii, iar pe cea a rândurilor sunt redaţi subiecţii examinaţi. Datele din tabel reprezintă prelucrarea rezultatelor obţinute la un test (presupus) de 12 itemi de către un număr de 11 subiecţi, numerotaţi pe rânduri, în stânga, de la 1 la 11. Coloana X reprezintă rezultatele de la itemii impari, redate în dreptul fiecărui subiect respondent, iar coloana Y cuprinde rezultatele la itemii pari. Coloana x redă variabila de deviaţie pentru itemii impari, rezultată din diferenţa

CONSTANTIN MOISE

între fiecare scor din coloana X şi media acestor scoruri, notată sub coloana X, adică 3,36 (deci: X - media coloanei X = 6 - 3,36 = 2,64 etc.). Coloana y redă aceeaşi variabilă de deviaţie, dar pentru itemii pari (adică Y – media Y = 3-3,18= -0,18). Coloana x2 redă pătratele variabilei de deviaţie pentru itemii pari, iar coloana y2 redă pătratele acestei variabile pentru itemii pari. Coloana xy reprezintă produsul dintre valorile variabilelor de deviaţie ale itemilor impari şi valorile variabilelor de deviaţie pentru itemii pari. Sub coloanele x2, y2 şi xy sunt notate totalurile lor. De la aceste date pornind, calculăm coeficientul de corelaţie Pearson (r), astfel:

În cazul nostru, fiind vorba doar de o „jumătate” de test, „r”-ul lui Pearson se va nuanţa sub forma r12. Deci:

r12 =

Pe baza acestei corelaţii între jumătăţi, se calculează fidelitatea pe întregul test rt, recurgând la o corecţie, cu ajutorul formulei Spearman-Brown, astfel:

Această cifră reprezintă o corelaţie slabă, considerându-se că valorile acceptabile sunt între 0,70-0,90, iar cele ideale, peste 0,90 (cf. A. Stan, lucr. cit. p.147).

În finalul comentariului privind calculul fidelităţii, trebuie reţinute nişte precizări. Una este că acest calcul pe bază de înjumătăţire este aplicabil doar testelor alcătuite din itemi cu punctaje identice, de pildă de tip 1 punct pe fiecare item. În cazul celor cu punctaje inegale, trebuie recurs la celelalte metode citate, de regulă la metoda test-retest, iar coeficientul de corelaţie să fie stabilit fie tot prin formula Pearson, fie prin alte metode (vezi, de pildă, metoda diferenţei de rang, în: Smith, G.M., 1971, pp.128 urm.).

Iată un exemplu de aplicare a unei formule dintre acestea „altele” citate în fraza anterioară. Formula ilustrează calculul corelaţiei (în cazul nostru, al fidelităţii) prin metoda diferenţei de rang. Ce înseamnă „rang” ştim de la cursul de Statistică, aşadar doar reamintim conceptul pe scurt (rang = loc ierarhic al unui indicator în cadrul unei serii, loc indicat numeric), fără să-l mai explicăm pe larg. Pentru aplicarea formulei de calcul în discuţie, pornim de la datele din următorul tabel. Tabelul redă rezultatele obţinute de un număr de 15 subiecţi la un test, la prima aplicare (cea numită „test”) şi la aplicarea repetată identic (cea numită „retest”).

Subiecţi

Rezultat la prima

aplicare („test”)

Rezultat la

repetare („retest”)

Rang la „test”

Rang la „retest”

Diferenţă de rang (D)

Pătratul diferenţei

(D2)

1 74 83 7 5 -2 42 86 89 2 4 2 43 73 76 8 7 -1 14 75 90 6 3 -3 95 63 68 12 13 1 1

6 72 92 9 2 -7 797 68 74 10,5 9 1,5 2,258 58 70 13 11,5 -1,5 2,259 45 36 15 15 0 010 90 94 1 1 0 011 78 70 4 11,5 -7,5 56,2512 68 73 10,5 10 -0,5 0,2513 48 54 14 14 0 014 81 80 3 6 3 915 77 75 5 8 3 9

n = 15 TOTAL 147

De aici pornind, datele se sintetizează în formula coeficientului de corelaţie (notat în unele locuri cu ρ, în altele cu r’.

Iată formula: ceea ce

ar reprezenta un indice de fidelitate acceptabil. Între factorii care pot influenţa fidelitatea se pot număra (vezi Gronlud, 1971, p. 112

urm; reluare în: Stoica, coord., 2001, p. 75; Ausubel şi Robinson, 1981, p. 684): lungimea testului este în favoarea ei, ca şi dispersia mai mare a scorurilor (punctajelor acordate), ambele generând probabilitatea unei corelaţii mai mari, în cazul repetării, cu răspunsurile de la aplicarea anterioară; tipul itemilor utilizaţi, ştiut fiind că cei obiectivi sunt mai proprii pentru o astfel de calitate; caracterul constant al motivaţiei şi rigoarea schemei de corectare şi notare, de asemenea favorabile unei mai bune fidelităţi.

Validitatea în general este calitatea testului de a măsura ceea ce trebuie să măsoare, sau, altfel spus, calitatea constând din coincidenţa dintre scopul în care a fost construit şi măsurarea concretă pe care o realizează. Sunt menţionate în literatura domeniului mai multe feluri de validitate (Landsheere, 1975; Grondlund, 1971; Lindeman, 1978; A. Stan, 2002, p. 159 urm.): validitate de conţinut, validitate de predicţie, validitate concurentă şi validitate de construct. Fiecare dintre acestea are semnificaţia şi importanţa ei. Validitatea de conţinut constă din corespondenţa între: de o parte obiectivele proiectate şi conţinuturile predate, de altă parte rezultatele (comportamentele) pe care testul îşi propune să le verifice. După sugestiile pe care ni le oferă autorii citaţi, în formularea de mai sus s-ar cuprinde următoarele idei: dat fiind că un test nu poate cuprinde absolut toate conţinuturile tratate, el trebuie să se orienteze asupra celor cu adevărat semnificative (De Landsheere, loc. cit., p. 167); pe de altă parte, testul să nu se axeze pe conţinuturi "puţin subliniate" (Lindeman, lucr.cit., p.480) sau capacităţi neexersate în cadrul procesului de învăţare parcurs (De Landsheere, idem, p. 168); spre exemplu, în cadrul gramaticii din clasele primare, nu am predat nici un fel de informaţie despre morfologie şi sintaxă, iar într-un test de selecţie la începutul ciclului următor îi cerem candidatului să precizeze ce reprezintă o anumită expresie "pe plan morfosintactic"; sau, deşi pe parcursul şcolarizării am cerut elevului, la matematică, să rezolve problemele "cum poate" pur şi simplu, în cadrul aceluiaşi test de selecţie citat îi cerem să le rezolve "pe mai multe căi". La rândul ei, validitatea de predicţie, denumită în unele surse validitate externă (I.T. Radu,

CONSTANTIN MOISE

1981, p. 244), se concretizează în calitatea testului de a anticipa corect un succes viitor al celui examinat. De pildă, dacă examinăm elevul printr-un test care cuprinde itemi de înmulţire şi împărţire, acordându-i un punctaj foarte bun, iar în etapa următoare de instruire el deprinde uşor ridicarea la putere şi extragerea rădăcinii pătrate, este semnul unei bune validităţi de predicţie. Validitatea concurentă (sau concordantă) este dată de corespondenţa dintre rezultatelor unui test dat cu rezultatele obţinute prin alte probe, "paralele" cu ele, sau altfel spus, de măsura în care rezultatele testului pe care îl experimentăm sunt confirmate de alte probe, aplicate "sincronic" şi axate pe acelaşi comportament (Lindeman, idem, p. 481). Să presupunem că testul nostru pune în evidenţă nivelul bun al aptitudinilor matematice bazate pe gândirea divergentă (rezolvarea problemelor prin metode inedite, de pildă), iar aprecierile noastre sunt în acord cu cele obţinute de elev în competiţiile şcolare concomitente, axate pe aceleaşi aptitudini. În fine, pentru prezentarea validităţii de construct (a cărei definire pare mai controversată; cel puţin aşa reiese din unele surse menţionate mai sus) facem apel la spusele lui Gronlund: "Validitatea de construct poate fi definită ca măsura în care performanţele testului pot fi interpretate în funcţie de anumite constructe psihologice"; "Exemple obişnuite de constructe sunt inteligenţa, atitudinea ştiinţifică, gândirea critică, înţelegerea lecturii, abilităţile de studiu, aptitudinea matematică" (1971, p. 90). Dacă, de exemplu, printr-un test ne-am propus să măsurăm abilitatea de a rezolva un anumit tip de probleme, itemii lui să se muleze pe acel "model de comportament" (construct); dacă, dimpotrivă, aceştia se pierd în formulări complicate, care sunt proprii mai ales abilităţii lingvistice sau retorice, el nu măsoară coordonatele constructului vizat.

Şi validitatea poate face obiectul unor calcule matematice. De pildă, pentru validitatea de conţinut, avându-se în vedere marea autoritate a experţilor în materie, a fost propusă o formulă care pune în valoare în mod prioritar opinia lor, bazată pe analiza, în paralelă, a conţinuturilor propuse spre măsurare şi a celor reflectate de test. Este formula "validităţii logice de conţinut" (engl. content validity ratio), redată astfel:

în care Ne = numărul evaluatorilor experţi; N = numărul total al evaluatorilor (experţi şi decidenţi nonexperţi). Exprimat cifric, coeficientul de validitate de conţinut poate varia între +1 şi -1; va fi cu atât mai bun cu cât numărul experţilor este mai bine reprezentat.

Despre determinările matematice privind celelalte tipuri de validitate, putem face, în acest context, doar afirmaţia generală că cele mai accesibile se limitează la coeficienţii de corelaţie între predictor şi criteriu; predictorul este rezultatul obţinut prin testul pe care îl experimentăm, iar criteriul este rezultatul altei probe, care trebuie să-l confirme sau infirme pe acesta. De exemplu: rezultatul unui examen de admitere este predictor pentru rezultatele la învăţătură din anul imediat următor, iar acestea sunt criteriul, confirmând sau infirmând validitatea examenului de admitere. Se poate calcula, între altele, tot prin formula coeficientului de corelaţiei după K. Pearson, ca în cazul calculului fidelităţii (vezi, pentru detalii, A. Stan, 2002, p.156 urm.). Nivelele acceptabile ale acestui coeficient variază între

0,30-0,39 (limită minimă de acceptabilitate), 0,40 - 0,49 (nivel bun) şi 0,50 - peste 0,50 (excelent) (idem, p. 173).

Care sunt factorii care pot influenţa negativ validitatea (vezi şi Gronlund, 1971, p. 93 urm.)? Unii dintre ei "sălăşluiesc" în testul însuşi, cum ar fi: neclaritatea instrucţiunilor, care poate devia răspunsurile de la linia lor normală; dificultatea prea mare, datorată fie vocabularului, fie modului de formulare a itemilor, conducând la abordarea insuficientă de către elevi; lungimea prea mică, de unde lipsa reprezentativităţii conţinuturilor testate; aşezarea şablon a propunerilor de răspuns (de exemplu, itemi cu patru enunţuri, ale căror răspunsuri corecte să fie mereu în ordinea A A F F). Alţi factori emană din modul de administrare, respectiv: timpul limitat de răspuns, determinând parcurgerea incompletă a probei; eventualul sprijin prea mare cerut şi căpătat de elev, făcând ca testul să măsoare nu ce şi-a propus, ci "meritul" celui care l-a ajutat. În fine, se pot cita factori ţinând de starea examinatului pe parcursul probei, cum ar fi emotivitatea crescută sau lipsa de motivare, ambele determinând ineficienţa concentrării. Se înţelege că toţi aceşti factori trebuie preîntâmpinaţi, prin măsurile cele mai proprii.

Redăm un minim de idei şi despre calităţile fiecărui item din alcătuirea testului. Astfel, nivelul de dificultate normal al itemului, se poate defini drept calitatea care asigură abordarea concludentă a acestuia de către subiecţii testaţi, în raport cu scopul urmărit. Exagerarea dificultăţii sau, dimpotrivă, minimalizarea ei denaturează rezultatele în măsură egală: cea dintâi, prin generarea imposibilităţii de abordare pentru o parte însemnată din grupul examinat; cea de a doua, prin desfiinţarea diferenţei dintre grupele de nivel conţinute de grup.

Capacitatea de discriminare a itemului, la rândul ei, reprezintă puterea fiecărui item de a delimita corect grupele de nivel, ale examinaţilor, pe ansamblul testului dat, contribuind la o clasificare echitabilă a acestora din urmă. Cum reiese chiar din frazele imediat anterioare, capacitatea de discriminare poate fi influenţată de nivelul de dificultate; ceea ce dovedeşte legătura indisolubilă dintre cele două.

Ambele însuşiri ale itemilor (nivelul de dificultate şi capacitatea de discriminare) vor influenţa cel puţin unele calităţi ale testului în general, respectiv validitatea şi aplicabilitatea. Trebuie spus, de asemenea, că atât nivelul de dificultate cât şi capacitatea de discriminare pot fi determinate matematic (vezi, în capitolul destinat proiectării testului, analiza de item, cu calculele aferente).


Cum explicaţi influenţa nivelului de dificultate şi al capacităţii de discriminare asupra aplicabilităţii şi validităţii?

V.2.2.4.Proiectarea testului docimologicCu acest titlu desemnăm demersul de alcătuire conform cu scopurile anticipate, de

experimentare şi ajustare a fiecărui test, în contextul practic dat. Demersul în discuţie a fost trasat în mai multe forme şi nuanţe, începând cu schema cea mai simplă, schiţată de Bloom (cf. 1971, p. 63 urm.), continuând cu cele aparţinând lui Payne (cf. 1971, p.27 urm.), lui

CONSTANTIN MOISE

Gronlund (cf. 1971, p. 149 urm.), lui Lindeman (cf. R. Lindeman, 1978) şi încheind cu contribuţiile aplicative româneşti (cf. I. T. Radu, 1981 şi 2000; A. Stoica, coord., 2001; C. Cucoş, 2002 ş.a.).Cum expunerea tuturor opţiunilor şi nuanţelor sugerate de fiecare autor ar fi prea complicată şi nu în totul utilă, vom puncta doar aspectele esenţiale şi modul de implementare a lor într-un demers practic.

Iată cum se prezintă algoritmul acestei proiectări, după Bloom (loc. cit.): se întocmeşte un tabel de specificaţii; se elaborează itemii corespunzători fiecărei celule din cadrul tabelului (vom explica mai

jos ce este o "celulă"); se selecţionează , din total, itemii care vor intra în alcătuirea testului; se asamblează itemii pe subgrupe de comportamente, după un plan sistematic; se stabileşte o schemă de notare (scoring); se elaborează indicaţiile necesare pentru subiecţii examinaţi; se probează calităţile tehnice ale testului, în vederea eventualei revizuiri.

Vom aborda mai jos acelaşi algoritm, valorificând în linii mari şi completările relevante datorate celorlalţi autori citaţi şi subliniind că el este axat net prioritar pe tipul: test elaborat de profesor (şi doar tangenţial se fac referiri la cel standardizat).

Pasul 1: stabilirea tipului de test; de pildă, într-un caz construim un test criterial, în altul, un test normativ; într-un caz, unul prognostic, în alt caz, unul diagnostic etc. Necesitatea acestei precizări este impusă de scopul diferit pe care îl vizează, de conţinuturile diferite cu care poate opera, precum şi de modul diferit în care este interpretat şi eventual revizuit.

Pasul 2: alcătuirea unui tabel de specificaţii (denumit şi matrice de specificaţii). Tabelul este axat pe o temă concretă şi are rostul de a delimita conţinuturile ce vor fi cuprinse în test şi nivelele taxonomice ale obiectivelor cu care ele sunt corelate. Pentru o mai uşoară înţelegere, iată un asemenea tabel, având o temă din sfera matematicii, să zicem, pentru clasa a IV-a:

TEMA: Operaţii cu numere naturale

ConţinuturiObiective

Achiziţia informaţiei Înţelegere Aplicare Analiză Total

1. Terminologie 5/ 1.1, 2.1. 52. Relaţii, transformări 5 20/.... 5 303. Utilizări, aplicaţii 5 20 254. Probleme 5 5 30 40Total 15 30 25 30 100

Cum se vede, avem în faţă un tabel cu două intrări: intrarea pe rânduri se referă la categoriile de conţinuturi cu care vom opera în cadrul testului; intrarea pe coloane indică obiectivele reflectate în itemii testului, pe nivele taxonomice (după taxonomia lui Bloom, redată numai până la nivelul analizei). La fiecare întretăiere a rândurilor cu coloanele se delimitează o "celulă", iar în celulă un număr redă procentele de itemi (din totalul itemilor consacraţi întregii teme) ce vor fi folosiţi în alcătuirea testului. Să spunem că este preconizat

ca testul să fie format din 40 itemi; înseamnă că 5% din total (identificaţi-l în tabel), adică 2 itemi, vor fi alocaţi celulei care vizează terminologia de recunoscut sau de redat din memorie (celulă rezultată din intersectarea conţinuturilor constând din terminologie, cu nivelul taxonomic achiziţia informaţiei); 30%, adică 12 itemi, pentru celula vizând rezolvarea de probleme, la nivelul taxonomic analiză (rezultată din întretăierea rândului conţinuturilor constând din probleme cu coloana reprezentând analiza) etc.

Pasul 3: construirea primei variante a testului (o numim prima, pentru că este posibil să fie revizuită). Este compus din mai multe operaţii, adică (vezi şi I.T. Radu, 2000, p. 242):a) formularea, pentru fiecare celulă, a itemilor aferenţi; din diversele surse reiese că

este indicat să fie construiţi şi unii în plus faţă de cifra din celulă, dată fiind eventualitatea renunţării la unii, propuşi iniţial şi înlocuirii cu alţii dintre cei construiţi în plus; odată cu aceasta, s-ar impune formularea instrucţiunilor pentru elev şi a obiectivelor de evaluare (în scopul orientării punctajului la fiecare răspuns), din care să rezulte atât comportamentul observabil, cât şi nivelul de dificultate (potrivit sugestiei din documentele SNEE, de a însoţi ca fiecare item să fie însoţit şi ghidat de un obiectiv de evaluare);

b) selectarea, din itemii formulaţi, a celor consideraţi mai semnificativi pentru redarea comportamentelor vizate;

c) construirea concretă a testului, prin asamblarea itemilor selectaţid) adoptarea unei scheme de corectare şi notare;.

Câteva precizări sunt strict necesare pentru operaţiile menţionate la punctele a), c) şi d). Precizările pentru punctul a) se rezumă astfel: fiecare item conceput trebuie să respecte lista de cerinţe privitoare la modul de construire a tipului în care el se încadrează. De pildă, să zicem că testul nostru cuprinde un număr de itemi de tip răspuns alternativ, în acest caz trebuind să respectăm cerinţele de alcătuire ale acestui tip de itemi; că ar conţine şi itemi de tip alegere multiplă, cu alte cerinţe de respectat etc. (vezi lista detaliată a acestor cerinţe la titlul dedicat tipurilor de itemi).

Pentru punctul c), precizările se referă la reguli vizând asamblarea testului, pe de o parte, şi conceperea timpului necesar pentru abordarea testului de către elevi, pe de altă parte. Astfel, mai mulţi autori citaţi mai sus (cf. Bloom, lucr.cit., p. 63; Gronlund, loc.cit., p. 237; Lindeman, loc.cit.) menţionează că itemii trebuie să fie grupaţi pe secţiuni omogene (adică fiecare secţiune să cuprindă un singur fel de itemi), iar în interiorul fiecărei secţiuni dificultatea itemilor să apară ordonat, de la mai mică la mai mare. Raţiunea care stă la baza acestei exigenţe constă din evitarea fie a derutei elevului, fie a unui consum mare de energie din partea acestuia, fie din sprijinirea tuturor categoriilor de elevi în abordarea testului, până la nivelul de care este capabil fiecare. În acelaşi scop, al înlesnirii cel puţin a abordării testului în întregime, lungimea lui trebuie concepută astfel încât timpul să permită parcurgerea lui de către aproximativ 80% dintre elevii cărora li se adresează (cf. Lindeman, lucr.cit. p.493). Precizările la punctul d) trebuie să hotărască modul de realizare concretă a corectării şi notării testului pe care tocmai îl proiectăm. Referinţele la acest subiect etalează demersuri şi concluzii diverse. Astfel, un autor român contemporan (A. Stoica, coord., 2001, p.85) afirmă despre notarea itemilor obiectivi şi semiobiectivi că ea ar fi destul de simplă, implicând doar

CONSTANTIN MOISE

însumare de puncte, care au fost stabilite cu rigoare pentru fiecare răspuns. După opinia lui G. De Lansheere, exprimată cu mai mulţi ani în urmă (cf. 1975, p. 51 urm.), când avem a face cu teste formate numai din itemi obiectivi, notarea capătă chiar denumirea de notare obiectivă şi trebuie efectuată după o anume formulă (vezi explicaţia pe larg, la titlul despre notare), precedată de unele demersuri statistice. Mai dificil de realizat se consideră notarea itemilor subiectivi, respectiv a testelor formate numai din itemi de acest fel. Acelaşi autor român citat mai sus (Stoica, lucr. cit.), citându-i pe unii autori occidentali, (de pildă, L. Carey, 1988; J.L. Thyne, 1978) propune utilizarea a două tehnici de notare pentru itemii de acest fel, anume: notarea analitică şi notarea holistică (globală). La rândul său, De Landsheere descrie patru tehnici de notare "subiectivă": metoda impresiei generale, metoda scărilor de specimene, metoda analitică şi metoda însumării frecvenţelor. Luând notă şi de schemele de notare propuse de autorul român, le vom prefera pe cele descrise de De Landsheere, părând mai accesibile şi mai lesne de aplicat. Le vom prezenta mai detaliat în capitolul special consacrat notării.

Pasul 4: pretestarea variantei iniţiale. Este etapa de probă, sau de încercare, constând din aplicare asupra populaţiei şcolare căreia i se va adresa. Rostul acestei etape este de a constata calităţile testului, iar în funcţie de constatări, să se poată opera eventuale îmbunătăţiri. Mai trebuie menţionat că amploarea şi rigoarea experimentării vor fi diferite după statutul testului. Dacă avem a face cu un test "intern" (făcut de profesor în vederea evaluării propriilor elevi), aplicarea va fi de amploare mai mică şi numai în interiorul propriei şcoli, cu sprijinul altor colegi (cf. De Landsheere, lucr.cit., p. 80). Dacă este vorba de un test "extern" şi standardizat , aplicarea este mult mai minuţioasă, implicând o populaţie de subiecţi foarte cuprinzătoare şi fiind realizată de specialişti în domeniul evaluării. Oricum, şi într-un caz, şi în altul, pe baza rezultatelor ce se vor obţine, se vor încerca determinările cuvenite asupra celor patru parametri de primă importanţă ai testului, în atare situaţie: validitatea, fidelitatea, nivelul de dificultate şi capacitatea de discriminare.

Validitatea interesează în diversele ei nuanţe: de conţinut, de predicţie, concurentă. Cea de conţinut este normal să fi fost deja asigurată odată cu construirea testului; de către profesor - cel puţin empiric, prin compararea cerinţelor testului cu conţinuturile cele mai reprezentative pe care le-a predat şi exerciţiile tipice realizate cu elevii; de către specialişti - inclusiv prin consultarea experţilor şi realizarea, odată cu aceasta, a unui bun coeficient al validităţii logice de conţinut (vezi calculul, în capitolul unde este prezentată validitatea). Cea concurentă se poate determina de către ambii conceptori şi pe calea observării concomitente a rezultatelor "concordante" obţinute prin alte probe, şi prin eventual calcul al coeficientului de corelaţie Pearson (dacă structura testului este adecvabilă acestui calcul, ştiind că testul docimologic nu se suprapune total cu "tiparul" testului psihologic în general). Aceleaşi afirmaţii ca în cazul validităţii concurente considerăm valabile în ce priveşte stabilirea validităţii de predicţie; şi ea este pretabilă aceloraşi proceduri, cu aceleaşi condiţii.

Fidelitatea ar putea fi stabilită, de asemenea de ambii conceptori - profesorul, pentru testul intern; grupul de specialişti, pentru cel standardizat - uzând de una din procedurile de calcul prezentate în capitolul anterior: metoda înjumătăţirii, dacă testul conţine itemi cotaţi la fel (fiecare item cu acelaşi punctaj), în acest caz recurgându-se la coeficientul Pearson,

corectat prin formula Spearman-Brown; metoda test-retest (aplicare repetată) şi stabilirea, pe această bază, tot a corelaţiei după formula Pearson. Mai trebuie reţinut că, în cazul testului alcătuit din itemi diferiţi, grupaţi pe secţiuni omogene (de pildă, o secţiune conţine itemi tip alegere duală, alta conţine de cei cu alegere multiplă etc.), psihologii sugerează recurgerea la comparaţie "pe subscale", adică prin gruparea itemilor pe categorii reprezentate de itemi cu acelaşi punctaj.

Este posibil ca, la finele demersului de constatare a validităţii şi fidelităţii, să găsim nişte valori neconvenabile ale coeficienţilor vizaţi. În acest caz trebuie să "consultăm" lista factorilor care le influenţează (vezi în capitolul anterior) şi să încercăm a-i modifica în sensul unei mai bune calităţi a testului.

Ultimele operaţii din cadrul pretestării se obiectivează în determinarea calităţilor fiecărui item: nivelul de dificultate, puterea de discriminare, iar pentru unele tipuri de itemi, chiar şi calitatea distractorilor, ceea ce se realizează prin analiza de item, comentată mai mult sau mai puţin detaliat în toate sursele citate mai sus.

Iată ce secvenţe parcurge această metodă şi cum se finalizează ea în fiecare caz de utilizare (vezi mai ales: Lindeman, lucr.cit., p. 495 urm.; I.T. Radu, 1981, p. 236 urm.). Să presupunem că am aplicat, de probă, testul preconizat odată cu întocmirea tabelului de specificaţii, pe un eşantion de 40 de elevi. Facem mai întâi o situaţie din care să reiasă ce scor total a realizat fiecare subiect respondent. Împărţim apoi totalul respondenţilor, după punctajul realizat la întregul test, în patru segmente egale (unii autori preferă cinci segmente, dar acest amănunt nu este important), astfel: un segment superior (primii 10), două segmente mijlocii (următorii 20), un segment inferior (ultimii 10). Reţinem, pentru calcule, numai segmentele extreme, adică primii 10 clasaţi şi ultimii 10. Pe baza lor, calculăm pe rând cei doi indicatori pentru fiecare item, adică indicele de dificultate şi cel de discriminare, iar unde este cazul, şi puterea de discriminare a distractorilor.

Pentru calculul indicelui de dificultate (Idif) al fiecărui item se procedează astfel: se constată, să presupunem, că un item anume a fost rezolvat de 7 elevi din segmentul superior şi 2 elevi din segmentul inferior; aplicăm formula:

, adică 45% din subiecţi.

Simbolurile din formulă au semnificaţiile: Cs = răspunsuri corecte în segmentul superior; Ci = răspunsuri corecte în segmentul inferior; n = numărul subiecţilor dintr-un segment. Indicele ce se poate realiza variază între 0 şi 1 (notat şi în procente). Cu cât este mai aproape de 0, avem a face cu un item mai greu, după cum apropierea mai mare de 1 denotă o dificultate mai mică. Se consideră că, în cazul unui test normativ, dificultatea optimă este între 0,4 - 0,5, ceea ce dovedeşte că în cazul nostru concret indicele 0,45 este foarte bun.

Discriminarea, la rândul ei, trebuie să se facă între elevii buni şi cei slabi pe ansamblul testului (adică nu după cum îi ştim din activitatea anterioară). Pentru calculul indicelui de discriminare (Idis) se foloseşte o formulă bazată pe numărul răspunsurilor greşite

CONSTANTIN MOISE

din fiecare segment. Procedând prin eliminare, în cazul nostru vom avea 3 răspunsuri greşite în segmentul superior şi 8 în cel inferior. De această dată aplicăm formula:

, adică 50%.

Simbolurile nou apărute sunt: Gi = răspunsuri greşite în segmentul inferior; Gs = răspunsuri greşite în segmentul superior, n fiind deja cunoscut din formula anterioară. Rezultatul posibil al acestui calcul este între -1 şi +1; când este +1, avem a face cu o discriminare maximă în favoarea subiecţilor buni; -1 indică o discriminare negativă, după care toţi din segmentul superior au greşit, iar din segmentul inferior nici unu, ceea ce este absurd, sugerând renunţarea la acel item. În cazul unui test normativ, discriminarea optimă se consideră a fi peste 0,7. De unde rezultă că rezultatul itemului nostru (0,5) nu este destul de discriminant.

Am făcut mai sus menţiunea că observaţiile privind nivelul optim al dificultăţii şi discriminării trebuie raportate numai la testele normative, utilizate în special în scopul clasificării elevilor. Adăugăm că în cazul testelor criteriale, deşi se pot calcula, atât dificultatea cât şi discriminarea, nici una dintre ele nu mai pun probleme de optimalitate şi de revizuire a itemilor. Fiindcă rostul testelor criteriale este să reliefeze realizarea oricăruia dintre obiective (oricât de grele, oricât de uşoare), în perspectiva sprijinirii elevului să-şi îmbunătăţească rezultatele, ele având, deci, scopuri prioritar formative.

În fine, să explicăm din ce constă determinarea forţei distractorilor, adică a variantelor de răspuns neadevărate, ele având rostul de a-i obliga pe examinaţi să facă efort pentru a găsi răspunsul corect. Precizăm mai întâi că această determinare este necesară doar în cazul itemilor cu răspunsuri la alegere, în special alegere multiplă. De dorit este: pe de o parte, fiecare distractor să atragă măcar un minim de opţiuni, adică să fie ales de unii dintre subiecţi; pe de alta, cei care optează pentru distractori să fie mai frecvent din segmentul inferior. Iată un exemplu de item cu mai multe alegeri posibile (apud Lindeman, loc. cit., p. 497):

Variante de răspunsA B C D E

Total răspunsuri

Alegeri subiecţi din segmentul superior 3 5 1 1 0 10Alegeri subiecţi din segmentul inferior 6 0 1 1 2 10

Răspunsul corect este B. Toţi distractorii "funcţionează", dovada fiind că fiecare (adică A,C, D, E) au atras cel puţin câte o opţiune. Cel mai puternic distractor este A, cu 9 alegeri; semnificaţia distragerilor este normală, ele fiind mai mult în segmentul inferior.

Pasul 5: definitivarea testului după constatarea atât a aspectelor normale, cât şi a eventualelor insuficienţe, potrivit analizelor din cadrul pasului 4.Observaţie: elaborarea se opreşte aici, dacă este vorba de teste pentru examene interne. În cazul celor externe, este nevoie şi de definitivarea instrucţiunilor de administrare, precum şi a celor de corectare şi notare.

V.2.3. Metode complementare de evaluare şcolară Este vorba despre o suită de proceduri, determinate pe alocuri şi cu atributul

alternative. După părerea noastră, este bine să preferăm determinantul complementare, care învederează cel mai bine locul şi rolul lor pe lângă cele de bază, descrise până aici, adică de a completa cu ceva demersul acestora, însă nu de a le înlocui. Sunt prezentate şi descrise sub nume şi în număr variabile, de surse diferite: metode "nontest", de către D. Payne (1968, p.30 urm.), "tehnici observative" (observational technics) şi de autoapreciere, de către Gronlund (1971, p.409 urm.), metode complementare, după documentele SNEE (cf. M. Mândruţ, 2001, p.51 urm.). Nominalizate, metodele înscrise în cele trei surse citate se prezintă astfel: observarea sistematică a activităţii şi comportamentului elevilor, investigaţia, proiectul, portofoliul, autoevaluarea. Motivaţia utilizării lor, pe lângă cele de bază, se rezumă astfel: metodele de bază (ascultare, probe scrise tradiţionale, probe practice cu scopuri docimologice, probe tip test) scot în relief mai ales informaţia posedată de elev şi capacităţile lui de ordin cognitiv şi practic-aplicative, în condiţii de confruntare strictă între examinatorul care întreabă şi elevul care răspunde; metodele complementare aduc ceva în plus şi în privinţa rezultatelor măsurate, şi a avantajelor rezultate din forma de aplicare: drept rezultate măsurate, ele scot la iveală şi comportamente de ordin afectiv, şi comportamente sociale bazate pe însuşiri de personalitate, şi capacităţi cognitive deosebit de complexe, chiar capacităţi evaluative, nici unele dintre acestea neputând fi decelate amănunţit prin metodele de bază; ca mod de aplicare, prezintă avantajele că nu întotdeauna solicită prezenţa ambilor actori (evaluator şi evaluat), permiţând derularea simultană cu alte procese, sau că în cea mai bună parte angajează plenar elevul, deprinzându-l să -şi întocmească singur "cartea de vizită", inclusiv să se autoevalueze.

Observarea sistematică a activităţii şi comportamentului elevilor este definită aproape în întregime de titulatura ei, la aceasta adăugând că ea trebuie să fie planificată, repetată pentru a deveni reprezentativă, înregistrată precis în vederea prelucrării. Instrumentele sau suporturile de care dispune se suprapun cu trei tehnici observative descrise de Gronlund: fişele de evaluare (anecdotal reckords), scările de apreciere (rating scales) şi listele de control (checklists).

O FIŞĂ DE EVALUARE are o rubricaţie specifică, cuprinzând: numele elevului, data înregistrării evenimentului, clasa din care face parte elevul, disciplina în cadrul căreia se înregistrează evenimentul, care este evenimentul, cum îl interpretăm. Pe baza evenimentelor cu adevărat relevante, stabilim concluziile care se impun, cu privire la calităţile proprii fiecărui elev, iar odată cu acestea, modul în care să fie orientat, îndrumat, sprijinit. Ca avantaj esenţial, se reţine "independenţa" observatorului faţă de elev, în sensul că, pe parcursul observării, nu trebuie să comunice neapărat cu acesta din urmă. Dezavantajul cel mai important este consumul de timp, ca în cazul metodei observaţiei în genere.

SCARA DE CLASIFICARE (rating scale) este un fel de grilă, pe care se înregistrează nivelul de intensitate a unor atitudini sau rangul unei calităţi, stabilite în cooperare cu cel evaluat. Ca exemple concrete în limitele acestei proceduri, se pot prezenta nişte modele de enunţuri, însoţite de o scară ierarhică a unei însuşiri sau a unei atitudini; de pildă, pe scara Likert (cf. Stoica, coord., 2001, p. 54; vezi şi Gronlund, lucr. cit.), după cum urmează:

CONSTANTIN MOISE

ENUNŢ PENTRU ELEV: "Agreez postura de a accepta şi punctul de vedere al altuia".TREPTE DE INTENSITATE: "acord puternic"; "acord"; "nedecis"; "dezacord";

"dezacord puternic".Enunţului de mai sus i se adaugă altele, cu care să alcătuiască împreună un set de

enunţuri, pentru a face posibile nişte concluzii suficient de semnificative. Elevul trebuie să "bifeze" treapta care îi este proprie. Elementul de referinţă din cadrul treptelor poate fi şi altul, de pildă frecvenţa: mereu, frecvent, ocazional, rar, niciodată.

LISTA DE CONTROL (checklist) este construită mai simplu, sub forma unor enunţuri cu numai două variante: da - nu. Rostul ei este să marcheze doar prezenţa sau absenţa unei însuşiri, deprinderi, atitudini, unui anume comportament etc., deci fără a o mai ierarhiza. Spre exemplu, pe parcursul participării elevului la o suită de manifestări comemorative şi ştiinţifice din şcoală, el a fost investit cu o anume responsabilitate. Considerându-i-se această calitate, s-au înregistrat aspecte semnificative ale comportamentului său, pe următoarea listă de enunţuri:

Elevul X: s-a conformat sarcinilor încredinţate da nu a colaborat bine cu toţi organizatorii da nu a fost remarcat ca bun organizator da nu a asigurat o bună comunicare între participanţi da nu s-a remarcat prin calm şi politeţe da nu

Atât prima listă formulată, cât şi aceasta din urmă sunt utile pentru completarea tabloului evaluativ al fiecărui elev, cu condiţia unei întocmiri clare şi a unei interpretări competente.

Investigaţia poate fi considerată un fel de studiu de caz solicitat elevului spre soluţionare, cu care ocazie el îşi va aplica în mod conştient achiziţiile şcolare, în măsura posibilităţilor chiar creativ. O putem defini, de asemenea, ca un suport al evaluării "învăţării de a învăţa" sau "învăţării de a cunoaşte"(vezi şi I.T. Radu, 2000, p. 224). Se poate concepe ca o temă de lucru pentru elev, cu durata fie de o singură oră, fie de mai multe ore, pe care să o organizeze (împreună cu profesorul) şi să o finalizeze (de preferinţă singur). EXEMPLU: "Stabiliţi printr-o cercetare proprie calităţile esenţiale ale unei cărţi şcolare". Se înţelege că studiul va dura mai mult de o oră.

Lucrările teoretice existente menţionează o suită bine definită de indicatori implicaţi în acest demers, parte dintre ei vizând profesorul, dar cea mai mare fiind în sarcina elevului (cf. Mândruţ, 2001). Astfel, înainte de lansarea investigaţiei, profesorul să aibă bine definite următoarele: ce informaţii, deprinderi, abilităţi posedate de elev vor trebui angajate în demers; la ce nivel de complexitate se va situa cercetarea; care vor trebui să fie rezultatele investigării şi cum vor fi apreciate. Profesorul are de asemenea obligaţia de a participa la unele etape ale investigaţiei, cu deosebire la definirea problemei de investigat şi la alegerea metodologiei adecvate. Şi pentru elev sunt rezervate atribuţii precise: participare la toate trei etapele demersului (definirea problemei, alegerea metodelor, identificarea soluţiilor) şi angajare deplină în acţiunile concrete alcătuitoare ale acestuia (descrierea caracteristicilor obiectelor prezente în investigaţie, utilizarea mijloacelor specifice de cercetare, identificarea factorilor implicaţi în cercetare). Se menţionează, apoi, capacităţile pe care trebuie să le

probeze elevul şi care să fie evaluate, oferind metodei specificul necesar (cf. Stoica, coord., 2001): creativitate şi iniţiativă; capacitate de preluare a conducerii grupului; capacitate de cooperare; perseverenţă; deschidere spre noi idei.

Proiectul, potrivit menţionatelor documente ale SNEE, este definit ca "un demers evaluativ mult mai amplu decât investigaţia", dar evident de aceeaşi esenţă cu aceasta. Începe în clasă odată cu definirea sarcinii şi cu explicaţii asupra soluţionării. Continuă mai multe zile sau săptămâni, în afara clasei, pe "teren", cu adunarea de date, cu prelucrarea lor, cu realizarea unui "produs". Se încheie în clasă prin prezentarea unui raport sau chiar a produsului realizat. Este conceput şi realizat pe un algoritm specific unei acţiuni de mare anvergură, cuprinzând paşii: stabilirea domeniului de interes; stabilirea cadrului conceptual şi metodologic; identificarea surselor de informare; precizarea elementelor de conţinut ale proiectului. Un exemplu de proiect ar fi următorul: "Evoluţia intelectuală a copiilor instituţionalizaţi". Derularea lui se poate produce mai ales ca o suită de studii de caz, realizate prin efort individual şi de grup. Sursele documentare folosite sunt fie primare (obţinute prin observări, anchete, experimente etc.), fie secundare (lucrări de specialitate, articole, studii pe aceeaşi temă etc.). Aprecierea se face atât asupra procesului (înţelegerea sarcinii de către elev; calităţile documentării; creativitatea), cât şi asupra produsului (validitatea proiectului; completitudinea proiectului; structurarea proiectului etc.). În plus, sunt exprimate nişte calităţi proprii elevului participant, anume: capacitatea de prezentare a proiectului; adecvarea metodelor la obiectivele propuse; adecvarea materialelor şi echipamentelor la specificul acţiunii; determinarea corectă a soluţiilor; posibilitatea de generalizare a soluţiilor.

Sursele care susţin cele afirmate în dreptul ambelor ultime metode de mai sus consideră că aceste afirmaţii sunt dovezi suficiente că ele (metodele) reprezintă cele mai proprii modalităţi de reliefare a calităţilor elevului de eventual om de ştiinţă în formare.

A P L I C A Ţ I E

Propuneţi-vă o temă de investigaţie sau de proiect şi schiţaţi derularea ei.

Portofoliul este definit, în lucrările de cultură generală, drept totalitatea lucrărilor aflate la dispoziţia unei edituri, la un moment dat, în vederea publicării. Aşa trebuie să se fi gândit şi iniţiatorul metodei de evaluare cu acest nume, utilizată în plan şcolar. Denumită de unii autori şi cu expresia "raport de evaluare" (vezi I.T. Radu, 2000), iar de alţii "cartea de vizită a elevului" (vezi Stoica, coord., 2001), această procedură fiinţează deja în limbajul şi preocupările chiar şi ale copiilor de şcoală primară, pătrunşi deopotrivă de sonoritatea termenului şi, probabil, de misterul pe care îl ascunde în sine. Este definit ca metodă complexă integrativă, înmănunchind şi rezultate culese de elev prin celelalte metode: ce lucrări reprezentative a realizat, fie în programul strict şcolar, fie în nişte activităţi "paraşcolare"; care i-a fost ascensiunea valorică în îndeletnicirea sa de bază, învăţătura, pe perioade mai lungi sau mai scurte; ce deprinderi sau însuşiri s-au sedimentat treptat în zestrea subiectului care învaţă; pe scurt, cum s-a edificat portretul "longitudinal" (vezi şi C. Cucoş, 2002) al şcolarului la care se referă. Se consideră posibilă axarea portofoliului pe fiecare disciplină şcolară, cum ne dovedesc exemplificările propuse în teoria recentă. După sugestiile

CONSTANTIN MOISE

oferite de aceasta, imaginăm mai jos un exemplu de portofoliu al unui elev, pentru disciplina Biologie, cuprinzând:

exemple de lucrări de control şi teze semestriale; exemple de teste formative; lucrări de cerc la care a fost autor sau coautor; protocoale de cercetare întocmite; liste de autori şi lucrări reprezentative studiate; contribuţii la publicaţiile şcolare în domeniu; grupaje de diapozitive, desene, postere pe teme de specialitate; rapoarte în urma unor experimente.

În mod normal, toate componentele portofoliului trebuie să fi fost proiectate împreună cu profesorul, acesta din urmă trebuind să le fi şi văzut şi apreciat la momentul realizării lor. Aceasta pentru că numai astfel se poate stabili caracterul real al contribuţiei elevului. Cât priveşte semnificaţia unui portofoliu în evaluarea generală a elevului, ea se axează atât pe aprecierea în planul notei la pregătirea informaţională, cât mai ales pe estimarea motivaţiei şi competenţelor lui, care să prognozeze orientarea spre un anumit tip de studii viitoare.

Autoevaluarea,ca metodă curentă a activităţii şcolare, a fost semnalată de mai multă vreme în teoria didactică românească. De exemplu, în anii "80, se afirma că elevul poate şi trebuie să devină "coparticipant în evaluarea rezultatelor obţinute" (vezi I.T. Radu, 1981, p. 261). Tot atunci se iniţiau dezbateri şi acţiuni experimentale pe tema "notării reciproce" sau a "autonotării controlate", aducându-se în sprijinul ideii fie unele experienţe internaţionale, fie iniţiative autohtone (idem). Astăzi se revine asupra problemei, accentul căzând nu asupra notării propriei performanţe de către elev, ci asupra formării şi exersării capacităţilor lor de a-şi evalua corect mai ales comportamentul profesional şi însuşirile de personalitate proprii. Autorii de teorie în domeniu (Stoica, Musteaţă, 1997) ne pun la îndemână nişte instrumente specifice acestui demers: chestionare de autoapreciere, scări de clasificare. Chestionarele cuprind itemi orientaţi spre autoaprecierea unor realizări sau insuficienţe privind o anume activitate, individualizată. Iată itemii adresaţi sau autoadresaţi elevului:

1."Care sunt etapele parcurse în vederea rezolvării sarcinii propuse ?……………………………………………………………………………………………………………………………………………………2.Prin rezolvarea acestei sarcini, am învăţat:

a)……………………………………………………………………….b)……………………………………………………………………….c)……………………………………………………………………….

3.Am întâmpinat dificultăţile:………………………………………………………………………….………………………………………………………………………….4.Mi-aş îmbunătăţi performanţa, dacă:……………………………………………………………………………………………………………………………………………………5. Consider că activitatea mea ar putea fi apreciată ca fiind:…………………………………………………………………………"

La rândul lor, scările de clasificare vizează un fel de inventar de rezultate, de însuşiri şi de comportamente aferente unei perioade date, pe care elevul să şi le evalueze singur . Concret, se prezintă ca nişte tabele cu două intrări:

pe rânduri sunt notaţi indicatorii ce se impun evaluaţi (performanţe şcolare ale perioadei vizate; motivaţie; spirit de iniţiativă; spirit de cooperare; asumarea responsabilităţii în realizarea sarcinilor; disciplina de lucru; progresul realizat);

pe coloane, se notează calificativul considerat corespunzător fiecărui indicator de pe rânduri (slab; mediu; bun; foarte bun; excelent).În ce priveşte modul de finalizare şi valorificare a autoevaluării, aflăm din sursele mai

sus citate că ea poate servi: într-o măsură ca feedback al interacţiunii profesor-elev; ca piesă de portofoliu, ea nuanţându-l pe acesta prin adăugarea componentei autocritice a elevului; ca mijloc de informare a părinţilor şi, în consecinţă, de stimulare a lor ca parteneri educogeni ai şcolii.

VI. NOTAREA CA METODĂ DE APRECIERE ÎN CADRUL EVALUĂRII ŞCOLARE

VI.1. PROBLEME GENERALE

Notarea reprezintă forma cea mai concretă de apreciere şi consemnare în documente a rezultatelor şcolare. Se realizează în moduri diverse, după cum s-a instituit prin tradiţie în fiecare ţară, nefiind excluse unele încercări de reaşezare. Astfel, în unele ţări se notează prin numere, pe scări de diferite anverguri: 20 de trepte (Franţa); 13 trepte (Danemarca); 10 trepte (România, Finlanda); 7 trepte (Suedia, Norvegia); 6 trepte (Elveţia, Bulgaria, Germania); 5 trepte (Rusia, Polonia). În altele, prin litere (Marea Britanie, SUA; literele A,B,C,D,E,F, nota A fiind cea mai mare, celelalte având valoare descrescândă). Temporar, în România, s-au acordat calificative (de pildă, în licee, o perioadă, după 1948, s-au utilizat calificativele: insuficient, suficient, bine, foarte bine), iar azi au fost adoptate din nou în învăţământul primar, în sistemul de pregătire postuniversitară prin doctorat, în aprecierea performanţelor în cadrul unor concursuri etc. (vezi, pe această temă, şi I.T. Radu, 2000, p. 267 urm.; A. Stoica, coord., 2001; Cucoş, 2002, p. 391 urm.). Ceea ce se poate reţine, din detalierea de mai sus, este că fiecare dintre manierele de consemnare a notelor are avantajul şi dezavantajul ei. Scările mai lungi au avantajul de a face diferenţieri mai fine, necesare mai ales în cadrul demersurilor evaluative cu scop de selecţie, dar şi dezavantajul dificultăţii mai mari, iar pentru a evita erorile, care "pândesc" la tot pasul, solicită o minuţiozitate şi un efort considerabile. La rândul lor, cele de anvergură mai mică au avantajul unei aprecieri mai puţin afectată de eroare (oricum, este mai puţin probabil să confundăm o prestaţie de "bine" cu una de "suficient", decât o notă de 5 cu una de 6, sau a oricăror note vecine), dar se însoţesc de insuficienţa nuanţării, încadrând în acelaşi interval elevi destul de diferiţi. În plus de aceasta, cele care operează cu indicatori "noncifrici" (calificativele, de exemplu) nu permit o cuantificare riguroasă, pentru stabilirea mediei recurgând la o convenţie statistică, respectiv la calificativul

CONSTANTIN MOISE

cel mai frecvent obţinut. În cele din urmă, problema care rămâne de pus în ordine nu este într-atât numărul de intervale, ci cum să se ajungă la tehnica cea mai proprie de efectuare a acestei discerneri, în funcţie de diversitatea situaţiilor existente în sfera activităţii şcolare.

VI.2. TIPURI ŞI METODE DE NOTARE

Pentru a ne face o idee despre anume modalităţi în care se poate face notarea, vom schiţa mai întâi o scurtă prezentare a notării practicate în şcoala românească, potrivit tradiţiei, foarte probabil preluată după şcolile europene, în special cea germană (după Şt. Bârsănescu, note de curs, 1961-1962; de asemenea, I. Roman şi colab., 1970, p. 303): notele 2 şi 3, considerate proprii stării de lipsă totală de cunoştinţe şi deprinderi de muncă şcolară, sau comiterea unor confuzii grave, care anulează orice rudiment de pregătire; nota 4, atribuită când elevul posedă doar o parte, insuficientă, a conţinuturilor de bază (adică a acelora fără de care, în acel moment, ar fi imposibil de abordat conţinuturile următoare ca dificultate); notele 5 şi 6, nuanţe ale calificativului "suficient", acordate pentru nivelul minim mulţumitor al stăpânirii cunoştinţelor şi deprinderilor de bază; notele 7 şi 8, corespunzătoare calificativului "bine", atribuibile pentru dovada că elevul cunoaşte bine conţinuturile de bază şi de amănunt, mai întâmpinând dificultăţi de generalizare şi nuanţare fină, în proporţie diferenţiată între cele două valori exprimate numeric; notele 9 şi 10, corespunzătoare nivelului foarte bun al posedării conţinuturilor şi capacităţilor vizate, până la distincţie de mare fineţe, deosebirea ilustrată de cele două cifre rezultând din comparaţia cantitativă, dar mai ales în sfera acurateţii raţionamentului. Demers destul de simplu şi clar aplicabil, iar în lipsa altuia, a rămas cel mai frecvent utilizat, cu toate urmările pe care le vom semnala mai jos.

În ultimele decenii ale secolului trecut, G. De Landsheere (cf. 1975) a făcut o prezentare detaliată a tipurilor şi tehnicilor sau metodelor de notare şcolară: de o parte tipul numit notare subiectivă, de alta notarea obiectivă.

Notarea subiectivă include "orice apreciere făcută de profesori în mod global, fie imediat după examinarea performanţei elevilor, fie după ce au căpătat o vedere de ansamblu a scorurilor individuale"; "orice notă la care s-a ajuns printr-un procedeu ce nu poate fi automatizat este o notă subiectivă" (lucr. cit., p. 122). Este notarea aplicabilă de regulă în cadrul probelor care fie cer elevilor interpretarea personală a conţinuturilor tratate, fie se referă la conţinuturi în general imposibil de "turnat" în forme fixe, forme care să oblige examinatorii la apreciere strict identică. Se înţelege că aici se pot încadra probele teoretice care presupun dezvoltări "verbale" de amănunt (denumite în unele surse "probe de tip compunere"), fie din sfera disciplinelor zise "exacte", fie a disciplinelor socioumane, precum şi cele din terenul exprimării estetice. Varietatea situaţiilor în care trebuie procedat aşa este destul de mare, astfel că a fost nevoie să fie instituite mai multe metode de notare subiectivă, fiecare rezolvând cerinţele situaţiei cu care este cel mai mult compatibilă. Apelând, pe lângă lucrările autorului De Landsheere, şi la alte surse (D. Muster, 1970; Pelaghia Popescu, 1978), putem identifica şi pune în valoare, ca principale metode ale notării subiective: metoda impresiei generale, metoda scărilor de specimene, metoda analitică şi metoda determinării frecvenţelor.

Metoda impresiei generale, recognoscibilă şi în exemplul tradiţiei româneşti, constă din aprecierea unei prestaţii (fie scrise, fie orale) printr-o privire rapidă de ansamblu, în urma căreia să fie aproximată nota.

Fireşte că ea nu trebuie să se rupă de orice sprijin instrumental; tradiţia didactică, de exemplu, a instituit nişte indicatori, cum ar fi cantitatea de informaţii şi deprinderi, iar pe de altă parte calitatea acestora: profunzimea informaţiei, caracterul conştient al însuşirii acesteia, posibilităţile de aplicare şi sistematizare, sau capacitatea celui examinat de a emite judecăţi de valoare etc. Conform autorilor citaţi, ea se potriveşte cel mai bine cu complexitatea lucrărilor de tip compunere şi, adăugăm noi, cu prestaţiile de alt gen ale elevului (de pildă, cu răspunsurile formulate oral, şi ele trebuind notate într-un fel, cel mai potrivit fiind tot în limitele acestei metode). Metoda se justifică mai ales prin ritmul în mod necesar "expeditiv" al aprecierii răspunsurilor orale, dar având în vedere şi faptul că nici în cazul corecturii lucrărilor de tip compunere nu dispunem de timp nelimitat, pentru compararea lor cu eventuali parametri de detaliu.

Supunându-ne, însă, necesităţii perceperii "sinoptice" a răspunsului, pe de o parte, şi rapidităţii necesare, pe de alta, prin utilizarea metodei impresiei globale, trebuie să fim conştienţi că deschidem calea celei mai mari subiectivităţi a notării. Vrând sau nevrând, aceasta este o realitate de care examinatorii trebuie să ţină seama când folosesc metoda în discuţie, asociind această utilizare cu posibile măsuri de apropiere de valoarea reală a notei.

Metoda scărilor de specimene se concretizează în identificarea (printr-un sondaj suficient de cuprinzător) a unor "modele" (specimene) de lucrări. Ele sunt aşa numitele "lucrări robot", care se utilizează ca repere de nivel, cantitativ şi calitativ, prin comparaţie cu ele fiind făcută aprecierea tuturor celorlalte. În practica docimologică, mai frecvent se preferă cinci specimene. Metoda este motivată tocmai prin faptul că asigură o clasificare cu o bază echitabilă, fiecare loc din ierarhie justificându-se prin acea comparaţie; or, aceasta ar reprezenta un fel de împlinire şi a dimensiunii etice a notării. Dezavantajele ce o pot însoţi nu sunt însă chiar neglijabile (vezi şi De Landsheere, lucr. cit., p. 139). Unul ar fi acela că nu toate lucrările elevilor se croiesc pe acelaşi "tipar" (un elev tratează prioritar unele aspecte, altul altele; unul o construieşte într-un număr de părţi, altul, în alt număr etc.), astfel că lucrările sunt doar parţial comparabile. Alt dezavantaj constă din orientarea examinatorilor numai asupra aspectelor comune; or, această procedare poate genera neajunsuri importante: neglijarea părţilor "necomune", dar valoroase, va face o nedreptate celui examinat; neglijarea, pe acelaşi motiv, a unor părţi cu greşeli va determina acordarea pe nedrept a unor avantaje. În al treilea rând, sunt necesare scări diferite, după natura subiectului de tratat şi nivelul elevilor.

Metoda analitică nu este interpretată la fel de toţi autorii care au abordat-o. De pildă, Payne (cf. 1971, p. 87) şi documentele SNEE (cf. Stoica, coord., 2001, p. 85), o interpretează diferit faţă de C. Remondino (cf. Etude factorielle sur la notation de compositions scolaires portant sur la langue maternelle, apud D. Muster, 1970, p. 117), modelul acestuia din urmă fiind preluat de De Landsheere şi de D. Muster. Modelul cuprinde în sine 17 factori, ordonaţi în 4 grupe: forma exterioară, cuprinzând lizibilitatea, estetica, prezentarea;

CONSTANTIN MOISE

folosirea limbii, adică corectitudinea ortografică, exactitatea morfologică, corectitudinea sintactică, caracterul propriu al limbajului, stilul;

conţinutul şi organizarea expunerii, respectiv structura expunerii, bogăţia de idei, pertinenţa ideilor, precizia informării, gradul de completitudine;

aspecte personale ale fondului, adică originalitate, maturitate, imaginaţie.Deşi Remondino şi comentatorii modelului său se referă strict la compunerile care au

rostul să pună în valoare capacitatea examinatului de a organiza conţinuturile şi de a-şi exprima creativ ideile în limba maternă, schema menţionată este adaptabilă, cu corecturile de rigoare, la oricare dintre lucrările de tip compunere. Avantajele asigurate prin adoptarea acestei secvenţieri sunt vizibile, fiindcă chiar dacă nu toţi indicatorii menţionaţi sunt complet aplicabili, modelul reprezintă un punct de plecare încurajator şi în acelaşi timp perfectibil.

Metoda determinării frecvenţelor , considerată de De Landsheere mai mult de natură obiectivă decât subiectivă, constă din acordarea notei pe baza fie a însumării aspectelor pozitive proiectate în raport cu obiectivele urmărite, fie a scăderii de puncte pentru fiecare greşeală, după ce în prealabil au fost stabilite tipurile de greşeli probabile în cadrul fiecărei lucrări. Concret, când trebuie să se adauge puncte, se porneşte de la limita minimă, care se va augmenta (cu puncte sau fracţiuni de puncte) pe măsura satisfacerii de către examinat a exigenţelor proiectate; procedeul scăderii, dimpotrivă, va avea ca punct de plecare nota maximă, care s-ar putea diminua pe măsura acumulării de greşeli. În ce priveşte observaţiile asupra acurateţii tehnice şi chiar implicaţiilor morale ale acestei modalităţi, ele au pus în relief două tendinţe, corelate fiecare cu "sensul" procedeului în discuţie, adică fie cu adăugarea, fie cu scăderea de puncte (vezi şi Pelaghia Popescu, lucr. cit., p. 127 -128). Astfel, tendinţa care însoţeşte procedeul adăugării este una spre rigoarea "cântăririi" fiecărei fracţiuni adăugate, în timp ce procedeul opus ne dezvăluie tendinţa de a "tăia" chiar puncte întregi cu mult mai multă uşurinţă; cu alte cuvinte, este dominantă tendinţa "de a da puţin" şi "de a lua mult" din ceea ce i se cuvine elevului, conform concluziei autoarei citate. Ceea ce denotă că, pentru a ajunge cât mai aproape de adevăr, procedeele amintite trebuie să se acompanieze reciproc.

Notarea obiectivă reprezintă varianta considerată cea mai concretă şi potenţial cea mai apropiată de valoarea reală a prestaţiei examinaţilor. A fost definită prin "atribuirea unor valori numerice pentru eşantioane comportamentale destul de limitate, definite şi controlate, aptă să permită un acord general al judecătorilor sau examinatorilor" (cf. J.C. Flanagan, apud De Landsheere, 1975, p. 151). Cum reiese din definiţie, virtutea obiectivităţii este datorată felului cum sunt concepute probele de examinare, trimiterea fiind făcută limpede la testele obiective, sau, şi mai precis, la cele standardizate. În cazul unui test cu răspunsuri la alegere, exemplifică De Landsheere, notarea se poate face "prin simpla numărare a răspunsurilor alese corect". Realizată doar empiric, notarea este posibilă într-adevăr şi aşa, prin simplă numărare. În acest fel, însă, ar rezulta prea multe note, după diferenţa de fracţiuni de la un rezultat la altul. Canoanele normative pretind şi determinarea poziţiei relative a fiecărei note, în ansamblul notelor din grupul examinat cu aceleaşi probe. "Interpretarea oricărei note necesită un punct de referinţă, un criteriu, o normă", afirmă De Landsheere (idem), odată cu toţi psihologii implicaţi în măsurători de acest fel. Norma menţionată aici constă din "distribuţia performanţelor individuale pentru o sarcină sau un ansamblu de sarcini" (idem). Pe această

bază se află nota obiectivă sau nota etalon în limitele căreia se înscrie rezultatul fiecărui elev examinat.

Unul dintre procedeele la îndemână, pentru calculul notelor etalon, este cuantilajul (nuanţat în centilaj, adică din procent în procent; decilaj, din 10 în 10 procente; cvartilaj, din 25 în 25 etc.). Pentru demonstraţie, vom aborda mai întâi un exemplu de calcul prin decilaj, la un eşantion de 108 elevi (deci 108 note), pentru scoruri (punctaje) între 1 şi 50 puncte, după un model sintetizat de către A. Stan (cf. 2000, p. 392). Algoritmul este următorul: determinarea amplitudinii de distribuţie a scorurilor, după formula:

Xmax - Xmin + 1,în cazul nostru, Xmax = 50, Xmin = 1, deci: 50 - 1 + 1 = 50;

gruparea convenabilă a rezultatelor pe intervale (clase), astfel ca să se poată constitui acelaşi număr "întreg" de trepte pe fiecare interval (adică numărul 50 să se împartă exact), de pildă să stabilim un număr fie de 5, fie de 10 clase, astfel:

,

unde i = număr de trepte pe interval; A = amplitudine; K = numărul de clase (intervale) convenit; deci 50 / 5 = 10 trepte pe interval;

ordonarea scorurilor într-un tabel, pe intervale:

Intervale (i) Frecvenţă simplă (fs) Frecvenţă cumulată (fc) 1 - 10 6 611 - 20 20 2621 - 30 44 7031 - 40 26 9641 - 50 12 108

Urmează calculul propriu-zis al notelor etalon, pe fiecare decil, pornind de la toate datele de mai sus. Pentru fiecare, se procedează astfel: se calculează indicele quota al decilului (calculul se face pe decile); se stabileşte frecvenţa cumulată în care se încadrează; dacă nu se suprapune exact pe una

dintre frecvenţele din tabel, se optează pentru frecvenţa următoare; se aplică formula:

unde: Ned - nota etalon a decilului; i - întinderea fiecărui interval (în cazul nostru, 10 trepte); Vsia - valoarea superioară a scorului din intervalul anterior; q - indicele quota, calculat prin împărţirea la 100 a produsului dintre numărul de note şi procentul la care ne referim; fca - frecvenţa cumulată anterioară; fsi - frecvenţa simplă a intervalului în care ne aflăm.

EXEMPLE:

Pentru decilul 1:

CONSTANTIN MOISE

acestuia îi găsim locul pe coloana frecvenţelor cumulate între 6 şi 26; optăm pentru frecvenţa mai mare, adică 26 (opţiunea pentru valoarea mai mare este dictată de regula calculului după acest procedeu); introducem în formula notei etalon 1:

Se observă că Vsia este 10; i este invariabil 10; fca este 6; fsi este 20. Rezultatul obţinut se rotunjeşte, devenind 12. Aceasta înseamnă că nota etalon 1 (Ned 1) se acordă tuturor celor care au obţinut până la 12 puncte inclusiv.

Pentru decilul 2: .

Corespunde aceleiaşi frecvenţe cumulate, de 26. Introducem în formulă:

Se rotunjeşte şi devine 18. Deci nota etalon 2 se va acorda scorurilor între 13 şi 18.Şi calculul poate continua până la Ned 10, dat fiind că avem 10 decile.Pe baza aceluiaşi caz am putea explica, apoi, atribuirea notelor etalon după alt model,

foarte asemănător, oferit de G. de Landsheere (lucr.cit., p. 154) procedând prin centilaj, adică detaliind datele din procent în procent. Formula este:

,

unde: Cx = rangul notei corespunzătoare unui centil dat; l = media între limita inferioară a intervalului precedent şi limita superioară a intervalului în care se află centilul căutat; N =

numărul de note; = valoarea notei exprimată în centile (quota – n.n. – C.M.); fc =

frecvenţa cumulată a intervalului precedent; fS = frecvenţa simplă a intervalului centilului căutat.

Exemplu de calcul al notei etalon, să zicem, pentru centilul 10.

; aşadar punctajul corespunzător notei etalon a centilului 10 şi, implicit, a decilului 1, potrivit procedeului anterior prezentat.

Cum se vede între nota calculată prin cele două procedee, pentru aceeaşi treaptă, rezultă o diferenţă de 0,5 puncte (adică între 12,4, după primul procedeu, şi 12,9, după al doilea). Diferenţa va apărea în cadrul calculului fiecărei note, dar ea poate fi considerată neglijabilă socotind că ordinea notelor şi distanţa dintre ele rămân aceleaşi.

În încheierea celor de mai sus, conchidem că: chiar dacă profesorul nu aplică în mod curent această metodă de calcul, în cadrul testelor pe care le alcătuieşte, este bine să fie

informat asupra ei, pentru înţelegerea eventualelor notări "externe" a propriilor elevi, în ocazii determinate.

VI.3. ABATERI POSIBILE DE LA NOTAREA CORECTĂ

Cum se ştie, sunt destule situaţii evaluative în care recurgem la itemi subiectivi, de unde şi metoda de notare obligatoriu tot subiectivă. Şi, în mod firesc, unul din marile inconveniente ale acestora constă din posibilitatea, la unele mai mare, la altele mai mică, de abatere de la notarea corespunzătoare valorii reale a prestaţiei elevilor. Să ne gândim numai la tehnica aprecierii generale sau globale, despre care am spus că deschide foarte larg calea acestor abateri, nici celelalte nefiind total ferite de astfel de eventualităţi. Dar mobilul acestor anomalii nu trebuie căutat numai în modalitatea obligatorie de notare, aceasta fiind mai ales condiţie; cauzele cele mai multe se află în altă parte, adică în personalitatea celor care notează.

În ce feluri se concretizează aceste anomalii? Numeroşi autori enumeră o gamă largă de astfel de situaţii, datorate tot atâtor factori perturbanţi (vezi De Landsheere, 1975, p. 31 urm.; I.T. Radu, 1981, p. 254 urm. şi 2000, p. 286 urm.; D. Muster, 1970, p. 99 urm.; C. Moise, 1986, p. 120 urm.; C. Cucoş, 2002, p. 400 urm.). Iată o listă aproximativă a factorilor distorsionanţi.

Efectul halo (numit aşa probabil prin asociere cu un fenomen optic, studiat de Fizică) este menţionat la loc de frunte de toţi autorii, deşi nu toţi îl definesc la fel, în toate ipostazele lui. Cea mai frecventă descriere îl prezintă ca tendinţă de a favoriza elevii cu rezultate în general bune, în acelaşi timp cu defavorizarea celor aflaţi pe trepte mai de jos, acceptând un fel de iradiere a mediei pe ansamblul situaţiei şcolare. Ca exemplu, examinând un elev care are majoritatea notelor 9 şi 10, chiar dacă răspunsul lui se ridică la nivelul doar al notei 5-6, examinatorul ţine seama de situaţia lui generală, acordându-i 1-2 puncte în plus, pe când cu cel cu note mici devine mult mai "principial". Unii autori (vezi De Landsheere) afirmă că acest efect se concretizează şi altfel, de exemplu în calitatea scrisului, acolo unde ea n-ar trebui avută în vedere; în prezentarea fizică sau "atitudinală" agreabilă; în supradimensionarea calităţilor de ordin estetic sau afectiv ale dicţiei celui examinat.

"Ruda" foarte apropiată a efectului halo este efectul oedipian sau efectul Pygmalion, numit astfel prin aluzie fie la personajul sofoclian, Oedip, considerat predestinat să fie nefericit, fie la miticul Pigmalyon, care şi-a însufleţit propria operă cioplită din materie moartă. Se concretizează în notarea marcată în permanenţă de o atitudine inflexibilă a examinatorului faţă de examinat, atitudine datorată imaginii preconcepute asupra unui elev sau altul. Spre exemplu, profesorul consideră , fie şi printr-o privire superficială, că elevul X are capacităţi cu totul limitate şi, deci, nu poate lua decât note cel mult mediocre. Atitudinea în cauză este de neacceptat şi din punct de vedere moral, ştiut fiind că subaprecierea elevului îl descurajează, sporind frecvenţa eşecurilor, din care se vor naşte alte eşecuri.

Efectul ordine concretizează fenomenul de denaturare a notei, datorat "poziţiei cronologice" a examinării fiecărui elev. Mai precis, ordinea corectării sau ascultării

CONSTANTIN MOISE

influenţează mărimea notei. Cauzele stau atât în dispoziţia diferită a examinatorului în momente diferite, cât şi în existenţa sau nonexistenţa unor repere ale evaluării, corelate cu aceste momente: la începutul actului de ascultare sau de corectură a lucrărilor scrise, capacitatea de efort necesar analizei este mai mare, de unde tendinţa de verificare mai riguroasă, precum şi eventuala ţinută mai "strânsă" a notării, pe când spre sfârşit aceste caracteristici se schimbă (intervine ori oboseala, ori "saturaţia" afectivă), devenind inerentă o analiză mai sumară, iar odată cu ea o notare mai neglijentă; de asemenea putem lua în considerare că la început (de exemplu, pentru prima teză corectată sau primul răspuns ascultat), nu există reper pentru comparaţie, în vederea unei notări nuanţate; apariţia treptată a acestui reper poate schimba ţinuta notării. Unii autori subsumează ordinii efectul de contrast: dacă o teză este corectată după alta vizibil mai bună, sau mai ales după mai multe cu această calitate, va apărea tendinţa notării acesteia cu o notă mai slabă decât merită; şi invers, dacă aceasta este precedată de altele mai slabe.

Este menţionată destul de accentuat şi infidelitatea examinatorului faţă de sine, în eventualitatea repetării neprevenite (deci fără să se fi anunţat de la prima corectură) a actului de notare. Exemplificarea făcută de un autor britanic (apud De Landsheere, loc.cit., p. 31) este convingătoare în acest sens:14 profesori de istorie au corectat 15 teze tip "compunere" (sau, după denumirea modernă "test de tip eseu extins"); la recorectare, după 12-19 luni, de către aceiaşi, s-au înregistrat 92 de note diferite, din cele 210 iniţiale (adică 15 teze x 14 corectori).

Tendinţei spre valoarea centrală (cf. I.T. Radu, 1981) noi îi adăugăm o tendinţă spre echilibrarea ansamblului notelor. Prima dintre acestea două este definită ca "tendinţă de a formula aprecieri moderate, de a evita pe cele extreme, izvorâte din precauţia de a nu greşi " (Radu, 1981, p. 259). Cea de a doua apare numai la examinatorii obsedaţi de curba lui Gauss, cei care pleacă de la preconcepţia că într-o colectivitate şcolară este obligatoriu ca notele să se repartizeze cât mai echilibrat; cei care, dacă pe parcursul corectării constată că nu s-au luat toate notele (de exemplu, notele 6 şi 7 sunt prea puţin reprezentate), încep să le "caute" pe fiecare; şi reuşesc să le "găsească".

Ecuaţia personală a fiecărui examinator, la rândul ei, reprezintă un factor distorsionant destul de însemnat, manifestându-se în feluri multiple: unii ţin seamă în mod deosebit de "îndrăzneala" cu care elevul abordează diferitele conţinuturi, alţii pun accent mai mare pe multitudinea unghiurilor de vedere abordate; unii profesori din una şi aceeaşi şcoală şi în cadrul aceleiaşi materii sunt de exigenţe net diferite, fiecare justificând în felul său. Cele mai frapante diferenţe apar în cadrul disciplinelor care presupun interpretări multiple, punând cu adevărat probleme serioase în plan docimologic. Se citează, de pildă, constatarea făcută de către I.M. Nestor (cercetător român interbelic) privind notele acordate de 54 de profesori de filosofie unei teze din acest domeniu, adică (vezi I. Radu, 1979, p. 244): nota 3 - 1 examinator; nota 4 - de 6 ori; nota 5 - de 9 ori; nota 6 - de 11 ori; nota 7 - de 8 ori; nota 8 - de 12 ori; nota 9 - de 5 ori; nota 10 - 1 examinator.

Prudenţa examinatorilor, semnalabilă mai rar, există totuşi, grevând adevărata valoare a notelor acordate, în condiţia utilizării metodei impresiei globale, indiferent de natura materiei de învăţământ. Astfel, se citează pe alocuri profesori sau colective didactice întregi, care adoptă o exigenţă foarte mare în fiecare primă parte a perioadelor şcolare specifice

(trimestre, semestre); "cazul" a fost semnalat mai ales în unele licee cu prestigiu deosebit, iar motivarea este următoarea: dacă se vor acorda note mari de la început, vor fi posibile perioade însemnate de delăsare a elevilor, bazate pe "calcule" şi comoditate (de pildă, obţinerea unui 8, îi permite unui elev "comod" să ia un 4 şi un 3, fără să fie corijent); nu credem, totuşi, că trebuie să judecăm elevii neapărat cu aceste "unităţi de măsură". Se remarcă şi altfel de prudenţă, de astă dată favorabilă elevului: unii profesori, în perioada de început a conlucrării cu un nou colectiv de elevi, acordă note conştient majorate, din dorinţa de a aştepta să cunoască mai bine elevii.


Ce opinie vă exprimaţi şi cum o motivaţi, privitor la această ultimă abatere de la valoarea reală a notei?

Ar mai fi de menţionat şi alţi factori distorsionanţi, mai mult sau mai puţin frecvenţi. Ne limităm la unul singur, dar nu foarte izolat: relaţia "specială" între examinatori şi examinaţi (de pildă, relaţia dintre diriginte şi clasa aflată în grija sa, simpatie sau opusul ei, relaţiile "de familie"), influenţând notarea de regulă în sens favorizant.

Cât priveşte propunerile de preîntâmpinare ale acestor tendinţe, ele au fost formulate şi susţinute în câteva variante nu lipsite de interes, chiar în cadrul unora dintre sursele care le-au menţionat şi explicat. Dat fiind că cel mai mult incriminată este notarea după impresia globală, iar la ea nu se poate renunţa total, primul remediu care se propune este arbitrul multiplu, adică corectarea de către mai mulţi examinatori. Se consideră că în acest fel "ecuaţiile personale" ale fiecărora dintre examinatori se pot anula reciproc, posibilitatea fiind cu atât mai mare cu cât sunt mai mulţi examinatori care să aprecieze acelaşi răspuns. Perspectiva acestei soluţii, dezvăluită printr-un experiment de către H. Pieron (apud Muster, 1970), nu pare încurajatoare. Concluzia a fost următoarea: pentru anularea mulţumitoare a diferenţelor, la o teză de matematică teoretică este nevoie de 13 corectori; pentru una de fizică, 16; pentru o compunere în limba maternă, 78; pentru o teză de filosofie, 127. Ideea a fost totuşi reţinută, cel puţin pentru examenele de importanţă crucială (capacitate, bacalaureat, admitere), în toate fiind utilizaţi cel puţin doi corectori simultani, care notează fără să se influenţeze unul de nota dată de celălalt.

O altă propunere este aceea de extindere a examinării prin itemi obiectivi sau semiobiectivi, pe cât este posibil în paralelă cu probele bazate pe itemi subiectivi. Şi în acest caz apar impedimente, posibilităţile în domeniul ştiinţelor socioumane fiind restrânse pentru itemii obiectivi. Itemii semiobiectivi, de felul întrebărilor structurate ar putea avea mai mari şanse.

Se poate menţiona, apoi, propunerea de utilizare a baremelor pe fiecare subiect la probele scrise, punctajele totale (deci nu în detaliu) pe fiecare subiect trebuind comunicate candidaţilor înainte de efectuarea probei , în scopul orientării lor asupra organizării propriei munci de rezolvare în varianta cea mai productivă (vezi Muster, lucr.cit., p. 103). Deşi în sfera disciplinelor reale această soluţie este relativ simplu de adoptat, în celelalte domenii este mai dificil de ajuns la o soluţie mulţumitoare; aceasta din cauză că, în domeniul disciplinelor socioumane, baremul poate fi interpretat diferit de către fiecare examinator, iar, pe de altă parte, nu este sigur că elevii "cad" exact pe componenţa baremului (să zicem că baremul prevede o definiţie, câteva precizări anume, exemplificări, aplicaţii etc., iar elevul pune accent

CONSTANTIN MOISE

pe alte aspecte, realizând totuşi o lucrare destul de bună). Din acestea rezultă că folosirea baremelor presupune mai mult decât simpla elaborare; condiţia aplicării lor judicioase vizează şi punerea de acord foarte minuţioasă a examinatorilor, iar în cazul nepotrivirii baremului cu pregătirea reală a elevilor să se procedeze la reformularea schemei de notare.

Se mai propune extinderea notării analitice, conform indicatorilor concepuţi de C. Remondino şi E. Valin. Cercetătorul român D. Muster, de pildă, propune o adaptare a acestor indicatori la scara de 10 note, potrivit sistemului românesc, pentru lucrările de tip compunere, după cum urmează (lucr.cit., p. 104 - 105): pentru fondul lucrării - 7 puncte, din care 6 pentru conţinutul de idei, iar 1 pentru prezentarea lor logică; pentru forma lucrării - 2 puncte, din care 1şi 1/2 pentru stil şi ortografie, iar 1/2 pentru prezentarea grafică; pentru factorul personal (sensibilitate, originalitate, caracter excepţional) - 1 punct. Această schemă ar avea şanse de aplicare pentru întreaga sferă a conţinuturilor socioumane, caz în care trebuie hotărât un statut diferenţiat pentru "factorul personal", nefiind sigur că fiecare subiect tratat implică neapărat originalitate. Şi de această dată, ca şi în cazul baremelor, apar din nou: atât problema interpretării diferite a punctajelor de către corectori, cât şi cea a axării candidaţilor pe aceeaşi sumă de indicatori; de unde din nou, pe de o parte obligaţia punerii de acord foarte clară a tuturor examinatorilor în privinţa aplicării unitare a schemei analitice proiectate, iar pe de alta eventualitatea reorientării schemei, în raport cu prestaţia elevilor.

Un cuvânt trebuie rostit şi despre reducerea efectului halo şi a celui oedipian. Asigurarea anonimităţii lucrărilor, prin examen extern (adică realizat de alţi examinatori decât cei care au predat), cum se pronunţă unii autori (vezi Cucoş, lucr.cit., p. 400), ar fi o posibilitate, dar mult prea limitată, dată fiind frecvenţa atât de mică a acestor ocazii. Se impune încercarea de completare a soluţiei, prin intensificarea pregătirii docimologice a profesorului, în privinţa efectului halo şi mai ales a celei psihologice, pentru a înţelege deplin că efectul oedipian implică in primul rând o tară morală, lucru deloc lăudabil pentru un educator.

În fine, nu este de neglijat propunerea unor descriptori de performanţă, meniţi să redea în amănunt calităţile fiecărui răspuns, concretizat pe specificul materiei de învăţământ vizate, corelat cu obiectivele cadru şi cele de referinţă ale fiecărei discipline şcolare şi axat pe o anume capacitate specifică. Altfel spus, ce calităţi să îndeplinească un răspuns, în cadrul unei capacităţi date, pentru a fi cotat cu o notă anume? Deocamdată au fost alcătuiţi descriptorii în cauză numai pentru învăţământul primar, deci numai pentru calificativele (foarte bine, bine, suficient) utilizate în şcoala primară. Aducem un exemplu de descriptori din sfera matematicii: capacitatea vizată - înţelegerea şi efectuarea operaţiilor cu numere naturale; subcapacitatea - înmulţirea numerelor naturale în concentrul 0-100; calificativul foarte bine: elevul scrie o adunare dată, cu termeni egali, (interpretată) ca înmulţire şi invers (fără nici un sprijin - n.n. C.M.); calificativul bine: elevul scrie o adunare dată, cu termeni egali, (interpretată) ca înmulţire şi invers, dirijat prin întrebări; calificativul suficient: elevul scrie o adunare dată, cu termeni egali, (interpretată)ca înmulţire şi invers, după model. Iniţiativa este lăudabilă, dar dificultăţile răsar şi ele de pretutindeni, asociindu-se cu cunoaşterea "psihologică" a fiecărui fragment de conţinut şi cu pregătirea celui care concepe descriptorii, fiind obligatorie formularea tot "psihologică" a fiecăreia dintre calităţile răspunsului.

La ce concluzie trebuie să ajungem după toată dezbaterea de mai sus, despre optimizarea actului de notare? O propunem pe următoarea: atitudinea noastră trebuie să fie una optimistă, dar să nu ne iluzionăm că am putea rezolva problema notării echitabile doar printr-o singură cale din cele citate mai sus; rezolvarea mulţumitoare se obţine prin combinarea necesară, în fiecare caz concret, a două sau mai multe dintre soluţiile propuse; şi nu este exclus ca experienţa practică viitoare să scoată la iveală şi alte soluţii.


Consideraţi că s-ar putea alcătui o ordine de preferinţă a remediilor prezentate mai sus? Dacă da, exprimaţi-o şi motivaţi-o.

VII. ASPECTE ALE EVALUĂRII PROCESULUI DE INSTRUIRE

Ceea ce interesează în mod prioritar pe un pedagog practician sunt rezultatele pe care le obţine elevul şi pe care el, educatorul, trebuie să le evalueze în primul rând. Cum afirmam, însă, chiar din debutul acestui curs, evaluarea nu se poate limita doar la rezultatele elevilor. Ca să avem imaginea completă a procesului ce trebuie permanent optimizat, nu numai aceste rezultate (adică "produsul" obţinut) trebuie determinate. Este nevoie şi de o aplecare specială asupra componentelor şi factorilor acestui proces, pentru a le pune de acord atât cu imperativele sociale ale comunităţii, cât şi între ele, în interesul unei funcţionări cât mai productive. Ideea apare exprimată, chiar dacă numai incomplet, în lucrări cu orientare pedagogică generală destul de vechi (R. Hubert, 1965, p. 623 urm.), sau mai "recente" (I. Roman şi colab., 1970), fiind exprimată strict "la obiect" în anii "80, odată cu referirea la evaluarea factorilor actului pedagogic (cf. I.T. Radu, 1981, p.275 urm.). Ca să fim mai convingători, facem apel la o lucrare foarte recentă, care afirmă acest imperativ: "Astăzi coexistă două sisteme de evaluare. Primul este tradiţional … centrat pe indivizi şi în mod special pe elevi, clasându-i la diferite niveluri de instrucţie sau de merit. Sancţionează prin reuşită şi eşec". Pe lângă aceasta, "s-a dezvoltat şi o altfel de evaluare", cu două ramuri: "o ramură pedagogică" şi "o ramură de gestiune" (cf. J. Vogler, coord., 2000, p.269). În acea "ramură de gestiune" s-ar include şi evaluarea factorilor procesului, invocaţi în frazele de mai sus.

Care sunt aceşti factori? I.T. Radu îi enumeră pe următorii: conţinuturile, metodele, mijloacele, formele de organizare a procesului, organizarea colectivităţilor şcolare, personalitatea profesorului, relaţiile din procesul educaţional, toate acestea fiind considerate condiţiile interne ale procesului; fără să fie lăsate, însă, total în afara discuţiei obiectivele instruirii, particularităţile elevilor, contextul social dat, condiţiile didactico-materiale şi resursele financiare. Ceea ce putem susţine şi azi este că toate trebuie să facă obiectul evaluării, pedagogul practician fiind interesat cel puţin de o parte dintre ele. Este ceea ce justifică şi formularea, despre acestea, a câtorva idei, explicaţii, sugestii, în plan evaluativ. Referirile noastre vor fi numai selective, focalizându-se doar asupra acelor entităţi care interesează în primul rând educatorul practician.

Elevul poate face obiectul evaluării nu numai odată cu aprecierea rezultatelor sale şcolare, ci şi înaintea procesului, adică în calitatea sa de factor implicat în actul instruirii, mai

CONSTANTIN MOISE

precis, ca "punct de plecare" în periplul pe care îl va întreprinde de-a lungul procesului. Sub acest aspect, el va face obiectul uneia sau mai multor evaluări, mai ales iniţiale, pe baza cărora va fi declarat apt sau nu pentru începerea instruirii, la diferite nivele de complexitate. Un exemplu de acest fel poate fi considerată evaluarea elevului la intrarea în clasa întâi: pe baza probelor fizice, a testelor de aptitudine intelectuală, a observării în planul comportamentului social, se stabileşte maturitatea de şcolarizare a lui. Aceasta se exprimă în: dezvoltare şi sănătate fizică normală, un IQ de cel puţin 90-100, adică limita de jos a normalului capacităţii intelectuale, precum şi deprinderi care dovedesc un comportament social normal. Probele trebuie privite cu toată răspunderea, iar dacă copilul dovedeşte nişte deficite acceptabile pe fiecare din cele trei planuri, să poată fi îndrumat, în cunoştinţă de cauză, în cadrul unui program de recuperare sau fortificare. Importanţa probei nu trebuie nesocotită, mai ales în plan intelectual, unde o eroare de cunoaştere poate genera alte erori (vezi, de pildă, efectul oedipian, semnalat între abaterile de la notarea corectă). Evaluarea aptitudinilor va trebui să fie promovată, apoi, la începutul fiecărui nou ciclu şcolar, dată fiind eventualitatea dezvăluirii treptate a unor aptitudini speciale, cu atât mai mult cu cât, sub alte aspecte, apar semne de relativ deficit; lipsa acestei orientări poate genera veritabile ratări. Se cunosc destule cazuri, în care copii de vârsta gimnaziului, declaraţi slabi intelectual în timpul cursului primar, şi-au găsit domeniul de realizare la nivel foarte bun, după ce au fost orientaţi fie spre artă plastică, fie spre cultură fizică şi sport, fie spre muzică.

Conţinuturile instruirii pot fi evaluate "oficial" de către tehnocraţii acestui domeniu, adică de către cei care (calificaţi fiind în materie) sunt încadraţi în forurile academice ale specialităţii, sau în cele de organizare şi control. Dar nici pedagogul practician nu poate rămâne total în afara acestui demers, putând face chiar evaluări meticuloase la toate nivelele de detaliere a conţinuturilor, adică asupra planurilor de învăţământ, a programelor fiecărei materii, a manualelor şi celorlalte instrumente de prelucrare a conţinuturilor (culegeri, cărţi de exerciţii caiete speciale etc.), făcând observaţii şi propuneri de rigoare. Cât priveşte planurile de învăţământ, evaluările pot avea ca repere cel puţin cantitatea, raportată la timpul de învăţare al elevului. De pildă, în perioada postdecembristă au fost introduse în planuri unele discipline noi (să luăm doar exemplul religiei şi al educaţiei civice, respectiv culturii civice), fără să se reducă altele; se pune întrebarea: ce măsuri să fie luate, ca ele să fie "acoperite" în timpul de învăţare al elevului şi în condiţiile săptămânii şcolare de numai cinci zile? La rândul lor, programele fiecărei materii, manualele şi celelalte mijloace de prelucrare didactică pot fi şi trebuie evaluate, toate la un loc, sub aspectul conformării la principiile didactice: programele, prin raportare doar la un principiu al cantităţii optime şi la cel al accesibilităţii (cine cercetează, de exemplu, programa actuală de matematică la clasa a V-a, poate constata un salt foarte mare şi al cantităţii, şi al dificultăţii temelor; şi se pot găsi multe alte exemple); manualele şi celelalte, prin raportare şi la alte principii invocate, pe lângă cele două de mai sus, adică la cele care vizează în mod expres prelucrarea didactică a conţinuturilor, astfel încât elevul să le însuşească fără dificultăţi majore şi cu cel mai bun beneficiu cultural. Este vorba despre principiile: al sistematizării şi continuităţii, al legăturii între teorie şi practică, urmând ca, în cazul fiecărui manual şi suport de prelucrare dintre celelalte, să constatăm: cât de "încărcat" de informaţie pe unitate de conţinut este (conform principiului cantităţii optime), cât de inteligibil (după principiul accesibilităţii), cât de clar se

"leagă" conţinuturile în fiecare unitate de conţinut şi pe ansamblul cărţii (cum pretinde principiul sistematizării şi continuităţii), cât de bine reprezentate sunt exemplificările, exerciţiile aplicative, problemele (cum cere principiul legăturii între teorie şi practică). Şi considerăm că în mod sigur s-ar găsi multe observaţii de făcut, mai ales pe fondul abundenţei de manuale din ţara noastră, abundenţă nu se mai ştie cât de benefică, dată fiind imposibilitatea unei analize comparative, care să separe versiunile valoroase de simplele "emanaţii" de conjunctură.

Personalitatea educatorului, ca obiect al evaluării, ne interesează şi mai pe larg, din motivul că, fie în calitate de educatori ce vom fi, fie în calitate de eventuali manageri care vom avea în subordine educatori, vom fi în postura de a evalua sau de a ne autoevalua. Evaluarea personalităţii educatorului poate fi concepută pe trei grile de calităţi, diferenţiate după unghiul de vedere promovat de fiecare (cf. R. Hubert, lucr.cit.; I. Roman, lucr.cit.; I.T. Radu, lucr.cit.; Ausubel şi Robinson, lucr.cit.): calităţi de ordin general, calităţi de ordin didactic, calităţi în postura de manager.

Calităţile de ordin general pot fi descrise detaliat după cum urmează:1. Calităţi de ordin fizic. Trebuie să menţionăm aici pe cele esenţiale: sănătate, rezistenţă,

integritate fizică, în limite care nu stânjenesc desfăşurarea în ritm şi cu randament normale. Motivaţia este simplă: o sănătate structural şubredă generează întreruperi cu efecte greu de recuperat, ştiut fiind că practica recuperărilor nu este compatibilă decât prin excepţie cu ritmicitatea specială a programului de instruire; un deficit al rezistenţei la efort şi al integrităţii fizice pot fi admise doar în limitele care nu afectează semnificativ buna desfăşurare a tuturor activităţilor specifice profesiei.

2. Calităţi intelectuale. În acest titlu se înscriu mai multe.Inteligenţa. Prin tradiţie, educatorul trebuia să posede o inteligenţă teoretică deosebită.

Azi pretenţia este mai moderată, fiind îngăduit un nivel nu neapărat foarte mare, în ideea că un nivel normal conjugat cu conştiinciozitatea şi cu o muncă sistematică sistematică poate conduce la o condiţie profesională mai mult decât onorabilă. Sunt autori care admit că nu inteligenţa foarte mare este factorul de bază al succesului în profesia didactică (vezi Ausubel şi Robinson, 1981, p.534 şi 633; de asemenea, R. Hubert, lucr. cit., p. 631).

Cultura de specialitate şi psihopedagogică. Un nivel înalt al culturii de specialitate şi o capacitate de a formula raţionamente de mare fineţe sunt calităţi ideale ale educatorului. Se obţine prin efort continuu şi prin dorinţa de a fi "la zi" cu informaţia. Acestea sunt cu atât mai mult necesare cu cât, în ritmul actual de generare a informaţiei, apar fie multiplicări rapide ale acesteia, fie schimbări de interpretare a unor adevăruri mai vechi. Cultura psihopedagogică îi este la fel de necesară unui educator bine cotat, ea făcând parte tot din cultura profesională a lui. O poate realiza prin informare continuă în sfera psihologiei educaţiei, a pedagogiei, a metodicii.

Capacitatea de a stăpâni ansamblul logic al informaţiei. Este una dintre calităţile cheie (dacă nu cea mai definitorie) ale profesiei didactice. Educatorul o poate proba, încercând să exprime rezumativ, simplu, accesibil conţinuturile cele mai complicate. În consecinţă, comportamentul invers (a reda complicat ceea ce este simplu) este semn de inaptitudine, iar exprimarea voit alambicată reprezintă în realitate dovada nestăpânirii domeniului.

CONSTANTIN MOISE

Capacitatea de a distinge valorile de nonvalori, indiferent de domeniul cultural, moral etc. în care face valorizări în faţa elevilor, reprezintă de asemenea o calitate obligatorie a educatorului. Ea este un corolar al altor calităţi, cum ar fi cultura multidisciplinară şi inteligenţa. Inexistenţa ei ar fi un pericol de contaminare negativă a elevilor.

Intuiţia psihologică şi capacitatea de analiză psihologică. Sunt calităţi de asemenea de primă mărime în contextul profesiei didactice. Corolarul lor cel mai de seamă este capacitatea de empatie, trăsătură încadrabilă în măsură egală în sfera calităţilor morale.

A P L I C A Ţ I E

Un profesor de biologie obişnuia să facă şi consideraţii despre măsuri de ordin medical pentru funcţionarea normală a organismului uman. El spunea, de pildă, despre un medicament că este recomandabil în tratamentul unei boli cardiace. Între timp, nu s-a mai informat, spunând în continuare că acel medicament asigură bunul mers al sistemului circulator. A fost de-a dreptul şocat, aflând întâmplător că, la acea dată, medicamentul era considerat nociv pentru sistemul circulator, fiind suspectat de a produce accidente grave. Ce avea deficitar acel profesor ?

3. Calităţi moral-afective Empatia. A fost deja anticipată mai sus. Poate fi considerată tot o capacitate, anume aceea

de a se transpune rapid în situaţia celui de vis-à-vis de el, de a-l înţelege pe acesta înainte de a-l judeca sau a-l pedepsi. O putem socoti însuşire de prim rang între cele din această categorie, având un impact major asupra conştiinţei elevului.

Capacitatea de a accepta, iniţial, educatul aşa cum este, bun sau rău. Coincide unei teze de mare valoare a pedagogiei generale, după care unii autori au formulat principiul ipotezei optimiste în educaţie (vezi A. Dancsuly, 1979). Este însuşirea cea mai autentic umană a celui chemat să-i formeze sau să-i îndrepte pe cei care i-au fost încredinţaţi într-un astfel de scop. Însuşirea opusă acesteia este intoleranţa absolută şi absurdă a celui care vrea ca educatul să fie perfect de la început.

Capacitatea de a renunţa şi, cel puţin moral, de a se sacrifica . Aceasta reprezintă semnul tradiţiei cu adevărat înălţătoare, potrivit căreia educatorul are o misiune comparabilă cu cea a apostolilor. Tradiţia în cauză face trimitere la rolul pe care educatorii trebuie să şi-l asume în momentele de răscruce din viaţa colectivităţilor.

Probitate în faţa adevărului obiectiv. Constă, pe de o parte, în capacitatea de a se supune adevărului, indiferent că îi convine sau nu, că îl avantajează sau îi produce suferinţă morală; pe de altă parte, în forţa, tot morală, de a-şi recunoaşte şi propriile eşecuri. Acestea reprezintă primele semne ale speranţei de îndreptare şi în acelaşi timp un puternic exemplu pentru propriii elevi.

Credinţa în progresul educaţilor şi capacitatea de a se bucura de succesele lor. Este prelungirea firească a atitudinii optimiste, având rolul de încurajare şi mobilizare

permanentă a elevilor, ceea ce joacă un rol la fel de mare ca ajutorul concret pe care li l-ar oferi.

Calitatea de a avea umor şi de a reacţiona adecvat la umor. Este o calitate cu atât mai uşor de susţinut cu cât ne este sugerată de "o voce", pe care ne-o reprezentam sobră şi gravă, a unui pedagog-filosof, R. Hubert (1965, p. 633): "Toate dificultăţile se vor aplana fără suferinţă, dacă educatorul îşi va aborda misiunea cu seninătate şi umor. Nu poate exista educaţie fără veselie."

Calităţile educatorului în activitatea didactică (vezi şi I.T. Radu, 1981). Există şi o serie de calităţi pe care educatorul le poate proba în activitatea strict didactică, adică în lecţie şi pot fi constatate prin asistenţă, repetată de un număr de ori, care să confere observaţiilor relevanţă suficientă. După o schemă simplificată, ele se descriu pe următoarele puncte: 1. Nivelul clasei. Se poate pune în relief prin înregistrarea răspunsurilor orale ale

elevilor şi prin analiza lucrărilor scrise sau aplicative ale acestora. Simpla constatare nu este suficientă, căci se poate ca acest nivel să se datoreze şi altor factori, exteriori activităţii comune a educatorului cu elevii.

2. Măsura în care urmăreşte sistematic obiectivele proiectate pentru fiecare lecţie. Se poate aprecia prin constatarea, la finele lecţiei sau mai în amănunt în lecţia următoare, a coincidenţei dintre comportamentele dobândite de elevi şi obiectivele nominale ale fiecărei lecţii.

3. Realizarea metodologică a lecţiei. Este aspectul care completează cel mai concludent impresia despre nivelul clasei şi mai ales despre factorii cărora el li se datorează. La acest titlu pot fi apreciaţi următorii indicatori:

a. dacă este pusă în valoare metodologia specifică disciplinei predate (ne aflăm la o lecţie de geografie, demonstraţia cu harta; la matematică sau gramatică, sprijinul permanent pe exerciţiul propriu temei studiate etc.);

b. dacă în lecţie acordă atenţie suficientă tuturor categoriilor de elevi, dovedind mai ales capacitatea de a evita generarea unor sentimente de frustrare în rândul elevilor mai slabi;

c. dacă procedarea concretă corespunde nivelului elevilor, fie pe ansamblul clasei, fie pe fiecare grupă de nivel;

d. capacitatea de a folosi varietatea de întrebări necesară (de reproducere, de descriere, de aplicare etc.) şi de a le mânui cu destulă precizie;

e. dacă "stilul" adoptat pe parcursul lecţiei este cel mai potrivit cu materia, cu anul de studiu, cu obiectivul urmărit, cu individualitatea elevului, având în vedere cele două stiluri opuse: stilul "soratic" (bazat pe dialog) şi stilul "recitativ" (obiectivat în forma expunerii) (vezi I.T. Radu, 1981);

f. dacă este capabil să transforme dialogul în dezbatere (conversaţie polilogică), dând astfel şi elevilor posibilitatea de a pune întrebări sau a-şi spune şi susţine opinia.

4. Capacitatea de a-şi evalua corect munca didactică. Se poate constata prin autoanaliza lecţiei, după susţinere. Dacă această capacitate există, ea reprezintă dovada spiritului său obiectiv şi un punct de plecare spre autodepăşire.

CONSTANTIN MOISE

Evaluarea educatorului-manager. Este vorba, în acest caz, despre situaţia în care el are în subordine alte persoane cu acelaşi nivel de pregătire şi de cele mai diverse specialităţi. Calităţile ce trebuie evaluate, din această perspectivă, se focalizează în jurul următoarelor: 1. Pregătirea profesională deosebită. Aceasta este garanţia atât de ordin tehnic

cât şi moral că el este îndreptăţit să-i aprecieze pe ceilalţi. Nu credem că mai este necesar să exprimăm în amănunt consecinţele posibile ale evaluării profesionale a unui educator strălucit, de către un manager ignorant.

2. Capacitatea de "infiltrare", măcar de principiu, în informaţia şi metodologia fiecărei specialităţi profesate de colegii subordonaţi. Este o probă dificilă, dar strict necesară, numai ea făcând posibilă comunicarea profesională relevantă dintre cele două părţi.

3. Capacitatea de empatie. Şi aici, ca şi în cazul relaţiei cu elevii, ar fi dovada suficientă că îşi înţelege colegii şi îi respectă.

4. Capacitatea de a rezolva şi mai ales de a preveni conflictele. Experienţa vieţii noastre profesionale ne-a dovedit că în orice colectiv pot apărea, din varii motive, o multitudine de interese divergente, apte să genereze microgrupuri aflate mereu în contradicţie. Anihilarea influenţei frenatorii a respectivelor contradicţii asupra bunului mers al activităţii colectivului este posibilă mai ales prin priceperea managerului de a comunica, de a fi echidistant şi de a se impune în spiritul dreptăţii.

5. Pregătire suficientă în plan legislativ. Avem în vedere că el va fi în postura de a lua decizii în sfera obligaţiilor şi drepturilor personalului a cărui activitate o coordonează.

6. Calităţi administrativ-gospodăreşti. Le poate dovedi şi prin implicarea directă în această dimensiune a procesului educativ, dar mai ales prin abilitatea de a-şi recruta colaboratorii cei mai apţi să-şi asume această misiune.

A P L I C A Ţ I E

Selectaţi din fiecare categorie de calităţi (generale, didactice, manageriale) câte două-trei pe care le consideraţi cele mai relevante, iar pe baza lor construiţi profilul ideal al educatorului.

BIBLIOGRAFIE * * *, Dicţionar de pedagogie, 1979, E.D.P Bârsănescu, Şt., Tehnologia didactică. Prelegeri universitare, 1939, Albina Românească,

Iaşi Bloom, B., Hastings, J.T., Madaus, G., Sumative and formative evaluation of student

learning, 1971, McGrow Hill Company Brandza, E., Pedagogie şcolară, 1932, Ed. Cartea Românească, Bucureşti Chirleşan, G., Ghid de evaluare la fizică, 1999, SNEE Cucoş, C., Pedagogie, 2002, Ed. Polirom, iaşi Dancsuly, Principiile fundamentale ale educaţiei, în: Dancsuly, Ionescu, Salade, Radu,

Pedagogie, 1979, E.D.P. Doicescu, R., Ghid de evaluare pentru istorie, 2001, Editura ProGnosis, Bucureşti Eliade, I.P., Elemente de pedagogie şi metodologie teoretică şi practică, 1868,

Imprimeria Statului, Bucureşti Gagné, R., Briggs, L., Principii de design al instruirii, 1977, E.D.P Gavriliu, L., Introducere în psihologia educaţiei, litogr. vol. I, 1969, IP Suceava

Gronlund, N.E., Measurement and evaluation in teaching, 1971, McMillan Company, New York

Landsheere, G. De, Evaluarea continuă şi examenele, 1975, E.D.P. Lindeman, R., Evaluarea în procesul instruirii, în: Ball şi Davitz, Psihologia procesului

educaţional, 1978, E.D.P. Lisievici, P., Calitatea învăţământului, EDP. R.A., Bucureşti, 1997 Liţoiu, N., Metode şi instrumente de evaluare, Stoica (coord.), Evaluarea curentă şi

examenele, 2001, Editura ProGnosis, Bucureşti Mândruţ, M., Tipologia itemilor, în: Stoica (coord.), Evaluarea curentă şi examenele,

2001, Editura ProGnosis, Bucureşti Meyer, G., De ce şi cum evaluăm, 2000, Ed. Polirom, Iaşi Moise, C., Evaluarea randamentului şcolar, în Văideanu (coord.), Pedagogie. Ghid pentru

profesori, vol. II, litogr., 1986, UAIC Momanu, M., Proiectarea şi desfăşurarea activităţii didactice în: Cucoş, C. (coord.),

Psihopedagogie pentru examen de definitivare şi grade didactice, 1998, Ed. Polirom, Iaşi Muster, D., Hazgan, A., Popescu, P., Metodologia examinării şi notării elevilor, 1969,

E.D. P. Muster. D., Verificarea progresului şcolar prin teste docimologice, 1970, E.D.P. Neacşu, I., Stoica, A., Ghid general de evaluare, 1996, Editura Aramis, Bucureşti Nicola, I., Pedagogie, 1994, E.D.P. Niţă, C. (coord.), Ghid de evaluare la matematică, 1999, SNEE Oţet, Fl., Ghid de evaluare pentru ştiinţe socio-umane, 2000, Editura ProGnosis,

Bucureşti Payne, D., The specification and measurement of learning outcomes, 1968, Blaisdell

Publishing Company, Waltham Massachusetts, Toronto, London Păuş, V., Ghid de evaluare pentru învăţământul primar, 1999, SNEE Popescu, P., Examinarea şi notarea curentă, 1978, E.D.P. Radu, I. T. şi Popescu, P., Evaluarea randamentului şcolar, în: Salade (coord.), Didactica,

1982, E.D.P. Radu, I. T., Teorie şi practică în evaluarea eficienţei învăţământului, 1981, E.D.P. Radu, I., Elemente de docimologie didactică, în: Ionescu şi Radu (coord.), Didactica

modernă, 1995, Editura Dacia, Cluj Radu, I., Metode de verificare şi evaluare, în Dacsuly, Ionescu, Radu, Salade, Pedagogie,

1979, E.D.P. Radu, I.T., Evaluarea în procesul didactic, 2000, E.D.P. Roman, I. (coord.), Tehnologii didactice active, 1984, Iaşi, Centrul de Şt. Sociale, UAIC Roman, I., Moise, C., Curs de pedagogie, vol. II Didactica, litogr., 1970, IP Suceava Roman, I., Popescu, P., Lecţii în spiritul metodelor active, 1980, E.D.P. Smith, G.M., Ghid simplificat de statistică pentru psihologie şi pedagogie, E.D.P.

Bucureşti, 1971 Stan, A., Testul docimologic, 2002, Ed. Polirom, Iaşi Stan, C., Evaluare şi autoevaluare în procesul didactic, în: Ionescu, M. (coord.),

Pedagogie, 2001, Ed. Presa Universitară Clujeană, Cluj Stanciu, I.Ghe., Metodele de învăţământ în: Stoian, St., Curs de pedagogie generală,

1961, E.D.P. Stoica, A. (coord), Evaluarea curentă şi examenele, 2001, Editura ProGnosis, Bucureşti Stoica, A., Musteaţă, S., Evaluarea rezultatelor şcolare, 1997, Ed. Liceum, Chişinău Strungă, C., Evaluarea şcolară, 1999, Ed. De Vest, Timişoara Todoran, D., Metodele de învăţământ, în: Dancsuly, Manolache, Chircev, Pedagogie,

1964, E.D.P., Bucureşti

CONSTANTIN MOISE

Ţîrcovnicu, V., Pedagogie generală, 1975, Facla, Timişoara Vîlceanu, B. (coord.), Capacitate 2001 – Modele de subiecte, 2001, Editura ProGnosis,

Bucureşti Vogler, J., Evaluarea în învăţământul preuniversitar, 2000, Ed. Polirom, Iaşi Walberg, H.J., Haertel, G. D. (eds.), The International Encyclopedia of Educational

Evaluation, 1994, Oxford, Pergamon Press

Teoria Si Metodologia Evaluarii c Moise

Documents

Transcript of Teoria Si Metodologia Evaluarii c Moise