Universitatea din București, Facultatea de Chimie...

13
Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică Statistică & Informatică –TEME și aplicații Laborator (M. Vlada, 2017) Laborator 1 Tema 1. Calcule statistice, funcții matematice și statistice –facilități oferite de Excel a) (Autosum) Excel b) Sum (...) Excel c) f x Excel , AVERAGE (...) Excel , - Să se genereze într-un tabel pe orizontală și pe verticală serii de numere consecutive folosind Edit Fill Series. Să se utilizeze funcțiile indicate în a)-c) și să se verifice rezultatele. Suma Verificare 1 2 3 20 2 3 20 Media Verificare Tema 2. Indicatori statistici: corelația (Pearson), covarianța, abaterea standard - Se consideră datele (măsuratorile) a două variabile aleatoare/seturi date X și Y, X=(x i ) i=1,n și Y=(y i ) i=1,n , adică (x i ,y i ), i=1,..., n. se calculeze corelația dintre vectorii X și Y cu formula: , a) folosind funcția CORREL (X,Y) Excel , b) folosind covarianța COVAR (X,Y) Excel și abaterea standard STDEVP (X) Excel (Obs. Nu se utilizează STDEV) Y X XY S S Y X Cov r ) , ( , n y y x x Y X Cov n i i i 1 , , n x x S n i i X 1 2 n y y S n i i Y 1 2 , unde Cov(X,Y) este covarianța , S X , S Y sunt abaterile standard. Folosiți HELP Excel , c) folosind Excel pentru calculele directe: se utilizează calculele intermediare (vectori) AVERAGE () SUM () /n (Autosum) Gauss n n 2 ) 1 ( Ref.:M, Vlada, C3-C5-Informatica.pdf, www.unibuc.ro/prof/vlada_m Pentru calculul Sx și Sy nu se utilizează STDEV, deoarece în formulă, la numitor, are expesia (n-1). 2 2 ; ; ; ; B E A D B A C Y Y B X X A . , , || || || || , Y Y B X X A B A B A r XY

Transcript of Universitatea din București, Facultatea de Chimie...

Page 1: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Statistică & Informatică –TEME și aplicații Laborator (M. Vlada, 2017)

Laborator 1

Tema 1. Calcule statistice, funcții matematice și statistice –facilități oferite de Excel

a) ∑ (Autosum) Excel

b) Sum (...) Excel

c) fx Excel , AVERAGE (...) Excel ,

- Să se genereze într-un tabel pe orizontală și pe verticală serii de numere consecutive folosind

Edit Fill Series. Să se utilizeze funcțiile indicate în a)-c) și să se verifice rezultatele.

Suma Verificare

1 2 3 … 20

2

3

20

Media

Verificare

Tema 2. Indicatori statistici: corelația (Pearson), covarianța, abaterea standard

- Se consideră datele (măsuratorile) a două variabile aleatoare/seturi date X și Y, X=(xi)i=1,n și

Y=(yi)i=1,n, adică (xi ,yi), i=1,..., n. Să se calculeze corelația dintre vectorii X și Y cu formula:

,

a) folosind funcția CORREL (X,Y) Excel ,

b) folosind covarianța COVAR (X,Y) Excel și abaterea standard STDEVP (X) Excel (Obs.

Nu se utilizează STDEV)

YX

XYSS

YXCovr

),( ,

n

yyxx

YXCov

n

i

ii

1, ,

n

xx

S

n

i

i

X

1

2

n

yy

S

n

i

i

Y

1

2

,

unde Cov(X,Y) este covarianța , SX , SY sunt abaterile standard. Folosiți HELP Excel ,

c) folosind Excel pentru calculele directe: se utilizează calculele intermediare (vectori)

AVERAGE ()

SUM () /n

∑ (Autosum)

Gaussnn

2

)1(

Ref.:M, Vlada, C3-C5-Informatica.pdf, www.unibuc.ro/prof/vlada_m

Pentru calculul Sx și Sy

nu se utilizează

STDEV, deoarece în

formulă, la numitor, are

expesia (n-1).

22 ;;;; BEADBACYYBXXA

.,,||||||||

,YYBXXA

BA

BArXY

Page 2: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 2

Calcule și reprezentări grafice

Tema 1. Puterile lui 2: Puterile 2k, k > 0. Folosind Fill (generare Series) Să se genereze într-un

tabel valori pentru k de la 1 la 200.

Pentru k > 30 să se determine numărul cifrelor şi cifrele puterii 2k (de exemplu, să se verifice ca

2100

are 31 de cifre şi 2100

= 1267650600228229401496703205376, iar 21000

are 302 cifre).

Verificare 2200

, 2

300.

a) folosin operatorul putere “^”, adică 2^k; b) folosind funcția POWER () Excel ; c) folosind

http://web2.0calc.com/ (Web 2.0 Scientific Calculator) d) folosind

www.wolframalpha/examples/Math.html (Knowledge Computable platform).

k 2^k POWER(2,k)

1 2 2

… … …

Tema 2. Reprezentarea grafică a funcțiilor

a) f : [-10, 10] R , f(x) = x*sin (x), pasul de discretizare interval p=0.1

b) f : [-2, 2] R, f(x) = e-x*x

(clopotul lui Gauss), p=0.1

c) C2 : [0, 120] R, p=1

tktk

ae

a ea eekk

cktC

0

2 (curba de absorbție-eliminare în Farmacocinetică),

unde C0 =10, ka =0.3, ke =0.03

1. folosind tabelerea funcției și programul Excel (DEFINIȚIE. Tabelarea unei funcții

înseamnă generarea unui tabel cu 2 coloane în care prima conține valori ale

argumentului x generate cu pasul p=1 sau 0.1 sau 0.01, și a doua, ce conține valorile f(x)

ale funcției în aceste valori ale lui x)

2. folosind http://web2.0calc.com/ (Web 2.0 Scientific Calculator)

3. folosind http://www.wolframalpha.com/examples/PlottingAndGraphics.html

4. folosind http://www.mathe-fa.de/ro

1. Să se genereze pentru argumentul x, respectiv t, într-un tabel pe verticală, serii de numere

consecutive folosind Edit Fill Series, cu pasul pas = 0.1. Se vor calcula valorile funcției în

aceste valori generate, după care se realizează graficul folosind Chart Line Excel .

2. Comenzi pentru programele ce realizeaza reprezentari grafice - http://web2.0calc.com și

http://www.wolframalpha.com/examples/PlottingAndGraphics.html:

comanda: plot (x*sin(x),x=-50..50), respectiv plot x*sin(x) from x=-50 to 50

comanda: plot (exp(-x*x),x=-2..2)

comanda: plot ((3/(0.03-0.3))*(exp(-0.3*x)-exp(-0.03*x)),x=0..120)

Page 3: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 3 Rezolvarea de probleme și prelucrarea datelor

Aplicatie Indicele de masă corporală (IMC) (Body mass index - BMI) este un indicator statistic al

greutății (G) unei persoane raportată la înălțimea (H) persoanei respective.

Formula are ca rezultat o cantitate exprimată în kg/m

2:

.][

][2 mH

kgGIMC

S-au definit nivele de risc pentru a indica o stare funcție de valoarea IMC:

1. Sub-ponderat – dacă IMC < 18.5;

2. Normal-ponderat – dacă 18.5 ≤ IMC < 25.0;

3. Supra-ponderat - dacă 25.50 ≤ IMC < 30.0;

4. Obezitate I - dacă 30.0 ≤ IMC < 35.0;

5. Obezitate II - dacă 35.0 ≤ IMC < 40.0;

6. Obezitate III – dacă IMC ≥ 40.0.

Exemplu. Pentru 100 de persoane să se genereze aleator valori de greutate (între 30 și 130) și de înăltime

(între 1.4 și 2.10). În tabelul următor să se calculeze IMC și să se determine nivelul acestui indice.

Separat, în 2 coloane se generează aleator valori pentru G și H folosind funcția RAND(), cu

formula „=a+RAND()*(b-a)”, intervalul de generare fiind [a,b]. Formula se bazează pe bijecția

f : [0,1] [a,b], f(t) = a+ t(b-a) ; f(0) = a și f(1) = b. Pentru a nu se modifica valorile generate la

orice acțiune din Excel, acestea se copiază prin Paste Special Values în coloanele

corespunzătoare din tabel. Pentru determinarea nivelului IMC se va utiliza funcția IF(logical_test,value_if_true,value_if_false).

Nr. Crt. G-

greutate H -

inaltime IMC=G/H^2 Stare- indice

1 67 1.8 20.679012 Norm-P

2 35 1.5 15.555556 Sub-P

… … … … …

Celula E10 va conține formula „=IF(D10<18.5,"Sub-P",IF(D10<25,"Norm-P",IF(D10<30,"Supra-

P",IF(D10<35,"Obez-I",IF(D10<40,"Obez-II","Obez-III")))))”

Interpretare date: a) să se calculeze corelația CORREL(), pentru (G,H), (G,IMC), (H,IMC);

b) să se sorteze dupa valorile indicelui IMC pentru a include persoanele în nivelele IMC. Folosind funcția

COUNTIF(range,criteria) să se determine numărul persoanelor pe aceste nivele.

IMC-stare Min Max Nr. persoane

Sub-P 10 18.5 ?

Normal-P 18.5 25 ?

Supra-P 25 30 ?

Obez-I 30 35 ?

Obez-II 35 40 ?

Obez-II 40 50 ?

D10

Se selectează cele 3 coloane

și se utilizează Charts: 2-D

Column

Se selectează coloanele 1 și

4 și se utilizează Charts: 2-

D Pie

Page 4: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 4 Reprezentarea și interpretatrea datelor folosind diagrame (Charts)

Aplicatie. Testarea facilităților oferite de programul Excel în reprezentarea și interpretarea

grafică a datelor. Folosind seturile de date din tabel, să se elaboreze cât mai multe diagrame

(Charts) pentru care au sens reprezentările și interpretările rezultate.

Exemplu. a)Vânzări de medicamente pe cele 4 trimestre în anii 2014-2016; b) Nivelul tensiunii

arteriene.

Trimestru

An

2014

An

2015

An

2016

Trim 1 2000 2200 2500

Trim 2 1600 2500 2200

Trim 3 1500 2100 2200

Trim 4 2400 2800 3000

Nivel Diastolică Sistolică

Foarte scazuta 40 70

Hipotensiune 60 90

Normala 80 120

Usor crescuta 90 140

Hipertensiune 100 190

Tutorial de utilizare.

Meniul principal Chart Tools. Dacă se realizează click-dublu pe suprafata unei diagrame se

activează meniul principal Chart Tools ce oferă instrumente de prelucrare prin cele 2 meniuri:

1. Design – cu submeniurile Type, Data, Chart Layouts, Chart Styles;

2. Layout – cu submeniurile Curent selection, Insert, Labels, Axes, Background,

Analysis, Properties.

Facilitățile meniului Design asupra structurii diagramei. Meniul Desing oferă

adăugarea/modificarea diverselor elemente din structura diagramei:

1. Alegerea tipului (Type) – Change Chart Type, Save as Template;

2. Modificare, adaugare Data – Switch Row/Column, indicarea seturilor de date pentru axa

X si axa Y;

3. Alegerea structurii diagramei se face prin submeniul Chart Layouts – se aleg

componentele dorite în structura diagramei;

4. Alegerea stilului pentru diagrama – Chart Styles

Facilitățile meniului Layuot asupra structurii diagramei:

1. Submeniul Labels - instrumnte pentru adăugarea/modificarea componetelor din structura

unei diagrame: Chart Title, Axis Titles, Legend, Data Labels, Data Table.

2. Submeniul Axes – instrumnte pentru axele X (principala) și Y, pentru grila fiecărei axe.

Trim 1

Trim 2

Trim 3

Trim 4

An 2014 2000 1600 1500 2400

An 2015 2200 2500 2100 2800

An 2016 2500 2200 2200 3000

0500

100015002000250030003500

An 2014

An 2015

An 2016

Page 5: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 5 Rezolvarea de probleme folosind Excel

Tema 1. Rezolvarea problemei lui Gauss.

Un vas conţine 2000 litri dintr-un lichid cu o concetraţie de 80 % alcool. În fiecare zi se scot

din vas 15 litri şi se înlocuiesc cu alţi 12 litri dintr-un lichid a cărui concentraţie în alcool este

de numai 40 %. După câte zile concentraţia lichidului din vas ajunge la 50 % ?

parametrizare (constante variabile);

procesul de calcul (fluxul de calcul);

rezolvarea folosind programul Excel.

Într-o coloana se vor genera 200 valori consecutive pentru x=numărul de operații.

Referință: Online - http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-

Informatica.pdf

Tema 2. Rezolvarea problemei celor n vase cu azot

(Ref.: www.unibuc.ro/prof/vlada_m/docs/2012/apr/09_22_14_22App-demo-2.doc).

a) cazul n=2

b) cazul general n > 1

-parametrizare (constante

variabile) și raționamentul de

rezolvare;

-procesul de calcul (fluxul de

calcul);

-rezolvarea folosind

programul Excel.

Referinta: M. Vlada,

Informatică aplicată, cap. 2

Online - http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-Informatica.pdf

15 l, alcool 80%

12 l alcool 40%

2000 l, alcool 80%

Page 6: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 6 Prelucrarea statistică a datelor experimentale: gruparea în clase/intervale

-Fiind dat un set de date X=(xi)i=1,n, Gruparea statistică a unui set de date este o prelucrare a

datelor printr-o centralizare a datelor pe intervale de variație/clase. Pentru n mare, numărul de

clase r se determină astfel ca 2r > n, sau cu formula lui H. A. Sturges r = [1+ 3,322 ∗ lgn], unde

[.] este funcția partea întreagă. Mărimea intervalelor de grupare a datelor este notată cu K=

[A/r], unde A=xmax – xmin este numită amplitudine.

- Intervalul de variaţie reprezintă diferenţa dintre limita inferioară şi limita superioară a clasei

respective.

- Determinarea celor r intervale/clase: [xmin, xmin + K ], (xmin + K, xmin + 2K ], ... (xmin +(r-1)K,

xmax].

- Frecvența absolută pentru o valoare xi, notată ai, din setul de date reprezintă numărul de

apariții a acestei valori în sirul de date, iar frecvența relativă este dată de raportul fi = ai / n,

unde n este numărul de valori ale setului de date.

-Histograma este reprezentarea grafică (Chart 2-D Column) a distribuției de frecvențe relative

pentru un set de date.

Tema 1. Se consideră 100 de medicamente pentru care se cunoaște prețul de achiziție/vânzare.

Presupunem că valorile acestui preț sunt în intervalul [4,270], valori întregi. Să se realizeze

gruparea în clase de variație și să elaboreze histograma distribuției de frecvențe.

- Vom codifica medicamentele cu numerele de ordine 1-100. Vom genera aleator/intâmplător

100 de valori întregi în intervalul 4-270 folosind functia RAND() oferită de programul Excel,

scriind formula =a+RAND()*(b-a). Se vor sorta crescător aceste valori.

- Se determină r și cele r intervale de variație. Se va genera tabelul claselor și frecvențele

corespunzătoare

- Pentru coloana „Frecvențe” vom folosi funcția COUNT() pentru a calcula, pentru fiecare

interval/clasă, numărul de valori ce apar în setul de date. Se va realiza Histograma.

Nr. crt. Grupe

Frecvențe

ai

Frecvențe relative fi/n

Suma frecvențe absolute

Suma frecvențe relative

1 5-42 13 0,13 13 0,13

2 43-80 10 0,1 23 0,23

3 81-118 17 0,17 40 0,4

4 119-156 11 0,11 51 0,51

5 157-194 16 0,16 67 0,67

6 195-232 15 0,15 82 0,82

7 233-270 18 0,18 100 1

Suma 100 1

Concluzii. Cele mai puține medicamente, în numar de 10, au prețurile în intervalul 43-80, iar cele

mai multe, în număr de 18, au prețuri în ultimul interval 233-270. Conform ultimei coloane

(Suma frecvențe relative) 51% din numărul de medicamente au prețuri mai mici decât 157.

Tema 2. Pentru 200 de studenți se cunosc notele la un examen. Să se realizeze gruparea statistică

și histograma notelor pentru intervalele/clasele 5-6, 7-8, 8-9, 9-10.

Page 7: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 7 Prelucrarea statistică a datelor experimentale: distribuții de probabilitate și funcții de repartiție

Tema 1. Pentru un număr n=75 de studenți, să se genereze aleator note de la 3 la 10. Să se calculeze

numărul studenților ce au primit o anumită notă (fi, frecevența notelor). Frecvența notelor determină

probabilitatea de a obține o anumită notă, p = fi / n . Să se calculeze probabilitatea de apariție a unei note

și să se reprezinte grafic distribuția acestora (Chart 2-D Column si Pie).

Nota Frecvența Probabilitate Procente

3 7 0.093 9.33%

… .. … …

Tema 2. Rezultatul aleatoriu al măsurarii pentru o variabila X=(xi)i=1,n, devine o variabilă

continuă, dacă este exprimată printr-un număr infinit de măsurători, și anume n∞, iar

probabilitatea ca o valoare oarecare x să aibă valoarea xi este P(x=xi) = pi, unde 0≤ pi ≤1.

Histograma (în cazul discret, n=finit) este înlocuită (cazul continuu, n=infinit) cu cu un număr

infinit de dreptunghiuri ce descriu repartiția probabilității prin definirea funcției de probabilitate

f(x) (sau densitatea de probabilitate a variabilei aleatoare X), unde

,1)(,0)(

duufxf 0)(lim)(lim xx

xfxf , și f(x)=F’(x). Funcția de repartiție, notată

F(x): R [0,1] se exprimă prin integrala (aria cuprinsă între curba funcției de probabilitate f(x),

între -∞, până la x, și axa OX) . Pentru o valoare dată ),( x , conform definiţiei funcţiei

de repartiţie, probabilitatea ca X < x este dată de relaţia: F(x) = P ( X < x ) =

x

duuf )( .

Grafice diverse. Folosind www.wolframalpha.com, www.web2.0calc.com si www.mathe-fa.de

a) Repartiția normală Gauss N(μ, σ2) – clopotul lui Gauss. Pentru aceeași dispersie =1, curbele

densităţii de probabilitate cu medii diferite =0,1,2. Curbele densităţii de probabilitate cu aceeaşi

medie (=1) dar dispersii diferite =0.5,1,2. Pentru N(0,1) avem funcția NORMDIST().

b) Repartiţia Weibull (Legea exponenţială), Repartiția Gamma (Γ), Repartiția χ2 - hi patrat

(Helmert-Laplace), Repartiția Snedecor-Legea Fisher.

Page 8: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 8 Prelucrarea datelor experimentale: Estimarea parametrilor și testarea ipotezelor statistice

Pentru repartițiile: normală, χ2, Student, Fisher.

a) Determinarea intervalului de

semnificație/incredere: Se dă probabilitatea /

nivelul de semnificație (1-α) (sau valoarea de risc

α) și se cere să se determine parametrului statistic

– limitele intervalului de semnificație pentru

funcția de repartiție corespunzătoare:

b) Determinarea probabilității/nivelului de

semnificație (1-α): Se dă parametrul statistic –

limitele intervalului de semnificație pentru funcția

de repartiție corespunzătoare, și se cere să se

determine probabilitatea / nivelul de semnificație

(1-α) (sau valoarea de risc α).

Tema 1.

-Repartitia normală standard: pentru a) se va utilizafuncția NORMSINV(p) ce calculează valoarea zα;

pentru b) se va funcția NORMSDIST(z) ce culculează p=(1-α).

-Repartiția χ2: pentru a) se va utiliza CHIINV(α,v) care calculează valoarea limitei, daca se dă ca

argumente valoarea riscului α și v=numărul gradelor de libertate; pentru b) se va utiliza funcția

CHIDIST(x,v) ce calculează valoarea riscului α, dacă se dă ca argumente valoarea x și v=numărul

gradelor de libertate.

-Repartiția Student: pentru a) se va utiliza funcția TINV(2α,v) care calculează valoarea limitei tα, dacă se

da ca argumente valoarea lui 2α (functia TINV() este implementată pentru cazul distributței bilaterale),

v=numărul gradelor de libertate; pentru b) se va utiliza funcția TDIST(tα,v,ind) care calculează valoarea

riscului α, dacă se dă ca argumente valoarea lui tα, v=numărul gradelor de libertate și ind=1, în cazul

repartiției Student cu risc unilateral, respectiv ind=2, în cazul repartiției Student cu risc bilateral.

Aplicație. La Facultatea de Chimie s-a realizat măsurarea greutății tuturor studenților din facultate, în

număr de 457 de studenți, și s-a obținut media greutății μ= 54.4 Kg. Această valoare este contestată de

profesorul de sport. Pentru a face un test statistic, se selecționează un eșantion aleator de 100 de studenți

și se găsește că media M[X]= 53.75 kg. Este această valoare suficientă pentru a respinge afirmația cu

nivelul de semnificație α = 0.05 (5%)?

Etapa 1: Definirea ipotezelor statistice H0: μ = 54.4 Kg ; H1: μ ≠ 54.4 Kg.

Etapa 2: Metoda de verificare a ipotezelor constă din identificarea unui test statistic, specificarea valorii

lui α, determinarea regiunii critice si a valorii critice. Se determină eroarea standard de estimare,

intervalul de semnificație (-Zα/2, Zα/2), adica Zα/2=1.96. Se va apela funcția NORMSINV(0.025) = -

1.959963985.

Etapa 3: Gradul de încredere /scorul standard pentru mediile eșantioanelor este Ztext = 1.204. Valoarea

testului statistic nu este în regiunea critică.

Decizia: Nu respingem ipoteza H0. Justificarea deciziei: Valoarea testului nu este în dezacord cu H0 la

nivelul de risc α = 0.05. Aceasta nu înseamnă că H0 este adevărată. Concluzie: Media M[X]= 53.75 kg nu

contravine ipotezei că media este 54.4 Kg., cănd dispersia este 5.4 kg. O decizie de respingere a lui H0

înseamnă că valoarea testului implică faptul ca H0 este falsă și indică H1.

Page 9: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 9 Analiza datelor experimentale: procedeul de modelare/fitare

Tema 1. Modele de aproximare (liniare-dreaptă de regresie, neliniare-curbe): suport teoretic

Studiul variabilei depentente Y în funcție de

variabila X, Y = f(X), (X și Y au n valori

măsurate,), f reprezintă modelul (funcție), adică

funcția de evoluție a lui Y față de X.

Tipuri de asociere a datelor măsurate,

tipul modelului (funcției) f: f(x)=ax+b

(dreapta); f(x)=ax2+bx+c (polinom gr. 2,

3, ..., 6); f(x)=aebx

(exponențială);

f(x)=a+bln(x) (logaritmică).

Suportul matematic: Metoda celor mai

mici patrate (MCMP)

- se determină coeficienții a,b, ... astfel ca

suma

n

i

ii xfyS1

2)]([ să fie minimă

(valoarea minimă a pătratelor erorilor) – S(a,b, ...) și sistemul dS/da=0, dS/db=0, ...

Tema 2. Procedeul de modelare (fitare): asocierea datelor, determinarea modelelor, comparații

Pasul 1. Reprezentarea norului de puncte (diagrama de imprăștiere) pentru variabilele

X și Y. Pentru acest lucru trebuie să se selecteze valorile aflate în cele 2 coloane ale

celor 2 variabile, se acționeaza Insert Chart și se alege tipul de grafic XY (Scatter)

(Standard Types), de unde din cele 5 variante de grafice se opteaza pentru prima varianta

(Scatter-Compares pairs of values); se parcurg etapele pentru a genera graficul respectiv,

și care va apărea in foaia de calcul;

Pasul 2. Determinarea și reprezentarea modelului. Se selectează graficul obținut la

pasul 1 (norul de puncte) și se acționează Chart Add Trendline, de unde se alege

tipul modelului, ex. Linear (Standard Types), etc.;

a) se alege modelul (se aleg pe rând toate modelele; pasul 2 se repetă plecând de la o

copie a norului de puncte)

b) ATENȚIE! Eticheta Add Trendline Options permite definirea altor atribute ale liniei

de trend: - Display equation on chart – marcarea boxei de control are efectul trecerii pe grafic a

ecuaţiei estimate,

- Display R-squared value on chart – este utilă pentru afişarea coeficientului de

determinare R2 (pătratul coeficientului de corelaţie multiplă).

n

i

i

n

i

ii

xfxfE

xfy

R

1

2

1

2

2

)]())(([

)]([

1 , unde

n

i

ixfn

xfE1

)(1

))(( .

- Să se realizeze tema 2 pentru 2 exemple semnificative și pentru fiecare exemplu să se compare

modelele după criteriul coeficientului de determinare R2.

Referință: M. Vlada, Informatică aplicată, cap. 2 și online -

http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-Informatica.pdf

Page 10: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 10 Analiza datelor experimentale: Modele de aproximare neliniare

Tema 1. Modelul logaritmic f(x)= a +b ln(x)

Dacă pentru variabilele X(cauză), Y(efect) se cunosc n probe (masurări, observații) prin valorile

datelor (xi ,yi), i=1,..., n, modelul logaritmic f(x) = a + b ln(x) este determinat de coeficienții a și

b având următoarele expresii:

n

i

n

i

ii

n

i

ii

n

i

i

n

i

i

n

i

i

xxn

xyxxy

a

1

2

1

2

111

2

1

)ln()(ln

)ln)(ln()(ln)(

n

i

i

n

i

i

n

i

ii

x

xaxy

b

1

2

11

)(ln

lnln

sau

n

i

i

n

i

i

x

nay

b

1

1

ln

Folosind un exemplu de date pentru variabilele X și Y, să se determine:

a) Modelul și coeficienții a și b prin intermediul programului Excel: Chart Add

Trendline b) Direct, valorile coeficienților a și b conform formulelor de mai sus.

Tema 2. Modelul exponențial f(x)= aebx Dacă pentru variabilele X (cauză), Y(efect) se cunosc n probe (masurări, observații) prin valorile

datelor (xi ,yi), i=1,..., n, modelul exponențial f(x) = a ebx

este determinat de coeficienții a și b

având următoarele expresii:

n

i

n

i

ii

n

i

ii

n

i

i

n

i

i

xnx

yxnyx

b

1 1

22

111

)(

)ln(ln

si a= ep

, unde

n

i

i

n

i

i

n

i

ii

x

xbyx

p

1

1

2

1

)ln(

sau n

xby

p

n

i

i

n

i

i

11

ln

- Folosind un exemplu de date pentru variabilele X și Y, să se determine:

c) Modelul și coeficienții a și b prin intermediul programului Excel: Chart Add

Trendline d) Direct, valorile coeficienților a și b conform formulelor de mai sus.

Referință: M. Vlada, Informatică aplicată, cap. 2 și online -

http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C6-C8-Informatica.pdf

Page 11: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Laborator 11 Operații matriceale, rezolvări de sisteme și ecuații; Editarea structurilor chimice

Tema 1. Calcule matriceal, rezolvarea sistemelor și ecuațiilor

a) Operații cu matrice )(. RA nm

- se vor utiliza funcțiile MDETERM (), MINVERSE (), MMULT () Excel .

- În cazul în care destinația unui rezultat este un tablou (array), după scrierea

formulei EXCEL, nu se execută OK, ci se utilizează combinația de taste CTRL +

SHIFT + ENTER.

b) Rezolvarea matriceală a sistemelor liniare

c) Rezolvarea ecuațiilor folosind Goal Seek, Solver Excel

Exemplu: f(x) = 75, unde f(x) = x2

+ sin(x). Pentru a determina o valoare a lui x când

f(x)=75, se va selecta Tools Goal Seek care va afişa fereastra Goal Seek.

Tema 2. Utilizarea programelor ISIS/Draw și JSDraw

- Editarea formulelor și a reactiilor chimice: Produse software: Symyx / ChemSketch / JSDraw

Referinta: M. Vlada, Informatică aplicată, cap. 2 și online -

http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C9-C10-Informatica.pdf

Page 12: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Evaluarea (Colocviul) la cursul de STATISTICĂ & INFORMATICĂ

A) Întrebări referitoare la subiectele de la Curs + Laborator: erori si propagarea erorilor,

parametrizarea și rezolvarea problemelor (Excel), Indicatori statistici, gruparea în clase, Eliminarea

valorilor aberante, Funcții de probabilitate și funcții de repartiție, Estimarea și testarea ipotezelor

statistice, Metoda celor mai mici pătrate (MCMP), Modele de aproximare liniare (dreapta de regresie) și

neliniare, comparația modelelor (coeficientul R2), rezolvarea ecuațiilor și a sistemelor, tabelarea funcțiilor

și scenarii în Excel, reprezentarea moleculelor, structurilor și reacțiilor chimice folosind produsele

software Symyx / ChemSketch / JSDraw / BIOVIO Draw / ChemDraw.

B) Susținerea „face to face” și prezentarea unui Proiect ce va cuprinde (enunțuri + rezolvări):

1. FC-1 (foaia de calcul 1) – parametrizarea și rezolvarea unei probleme folosind Excel. Calcule

folosind indicatori statistici;

2. FC-2 (foaia de calcul 2) – Aplicație privind prelucrarea statistică a datelor experimentale:

gruparea în clase/intervale; eliminarea valorilor aberante; estimarea și testarea ipotezelor

statistice;

3. FC-3 (foaia de calcul 3) – o problemă ce necesită modele de aproximare liniare/neliniare

(căutarea din cele 9 modele oferite de Excel);

4. O prezentare PPT sau Prezi, de 7-8 slide-uri, primele să reprezinte o sinteză de conținut pentru

FC-1, FC-2, FC-3, iar ultimele să cuprindă reprezentări pentru molecule și reacții chimie

folosind Symyx / ChemSketch / JSDraw / BIOVIO Draw.

OBSERVAȚIE: Conținutul digital al proiectului se va descărca prin e-mail la Laboratorul de

informatică.

OBSERVAȚIE. Fiecare student are stocat proiectul ca atașare în e-mailul personal, iar când va

fi prezentat la Colocviu, va descărca fișierele la Laboratorul de Informatica.

Nota finală: FC1 = 2 puncte, FC2= 2 puncte, FC3=3 puncte, (70 % , 7 puncte)

PPT=1 punct, Intrebari cu raspunsuri corecte=1 punct

TOTAL = 9+1 oficiu=10

- la FC1 - dacă problema este prea simplă, în comparație cu problema “vase cu azot”,

punctaj = 0 (Tema 3, Laborator nr. 2, Ref.:

http://www.unibuc.ro/prof/vlada_m/docs/2012/iun/22_16_34_21TEME-Laborator-

2012.pdf).

- la FC2 – dacă nu se dau explicații relevante privind prelucrările statistice realizate, se

depunctează cu 1 punct

- la FC3 – dacă nu sunt calculați direct coeficienții a și b pentru modelul logaritmic sau

exponențial, se depunctează cu 1 punct

- la prezentarea PPT, dacă nu există editare de formule și reacții chimice cu software

specializat si nu se poate proba editarea, se depunctează cu 0.5 puncte

- dacă prezentarea este realizată cu Prezi, se adaugă 1 punct

- dacă la 1-2 intrebări primite, răspunsurile sunt incorecte, se scade 1 punct

- daca studentul nu poate să reproducă unele calcule și editări/reprezentări din Proiect, se

scade 1 punct.

OBSERVAȚIE: În cazurile când, în proiect apar erori de calcul sau reprezentări greșite,

studentul este invitat să le corecteze; dacă acesta reușeste să-si corecteze greșelile, poate primi

0.5.puncte; altfel să fie depunctat cu 0.5 puncte.

Page 13: Universitatea din București, Facultatea de Chimie ...prof.unibuc.ro/wp-content/uploads/2018/02/TEME-Laborator-ChMED-FARM.pdf · 100 de valori întregi în intervalul 4-270 folosind

Universitatea din București, Facultatea de Chimie, Specializarea: Chimie Medicală/Farmaceutică

Extras din FIȘA Disciplinei

10. Evaluare

Tip activitate1

10.1. Criterii de evaluare 10.2. Metode de evaluare

10.3.

Pondere

din nota

finală

10.4. Curs A) Întrebări referitoare la

subiectele de la Curs +

Laborator ; Corectitudinea

răspunsurilor –înţelegerea şi

aplicarea corectă a

problematicii tratate la curs

B) Susţinerea şi prezentarea

proiectului la calculator;

Rezolvarea corectă a

aplicatiilor si problemelor.

- Întrebări pe baza temelor

de la curs şi laborator

- Întrebări pe baza

aplicaţiilor practice ce

rezolva diverse probleme

alese prin opţiunea

studentului

70%

10.5.1. Seminar Corectitudinea răspunsurilor –

însuşirea şi înţelegerea corectă

a problematicii tratate la

laborator. - Rezolvarea corecta

a temelor pe parcursul

semestrului. Obţinerea

rezultatelor corecte la temele de

la laborator

Temele de laborator se

analizează şi se testează în

prezenţa studenţilor.

30%

10.5.2. Laborator (Lp)

10.5.3. Proiect

10.6. Standard minim de performanţă

a) nota 5 (cinci) pentru realizarea a 80% a temelor de laborator şi răspunsuri corecte din

problematica de la curs 50%

b) explicaţii corecte de elaborare a proiectului; realizarea sarcinilor pentru temele de laborator şi

elaborarea punctelor 1,2 şi 4 pentru proiect

Conf. dr. Marin Vlada,

Universitatea din București

16 Martie 2017

1SI – studiu individual; TC – teme de control; AA – activităţi asistate; SF – seminar faţă în

faţă; L – activităţi de laborator; P – proiect, lucrări practice.