Fisa disciplinei BD2 DM 2018-2019 - feaa.uaic.ro · (fișiere text, .csv, .xls, servere de baze de...

7
UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR FIŞA DISCIPLINEI * OB – Obligatoriu / OP – Opţional 3. Timpul total estimat (ore pe semestru şi activităţi didactice) 3.1 Număr de ore pe săptămână 4 din care: curs 2 seminar/laborator 2 3.2 Total ore din planul de învăţământ 56 din care: curs 28 seminar/laborator 14 3.3 Distribuţia fondului de timp ore Studiu după manual, suport de curs, bibliografie şi altele 24 Documentare suplimentară în bibliotecă, pe platformele electronice de specialitate şi pe teren 18 Pregătire seminarii/laboratoare, teme, referate, portofolii şi eseuri 36 Tutoriat 8 Examinări 8 Alte activităţi................................... - 3.4 Total ore studiu individual 94 3.5 Total ore pe semestru 150 3.6 Număr de credite 6 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea “Alexandru Ioan Cuza” din Iaşi 1.2 Facultatea Facultatea de Economie şi Administrarea Afacerilor 1.3 Departamentul Contabilitate, Informatică Economică şi Statistică 1.4 Domeniul de studii Cibernetică, Statistică şi Informatică Economică 1.5 Ciclul de studii Master 1.6 Programul de studii / Calificarea Data Mining 2. Date despre disciplină 2.1 Denumirea disciplinei Baze de date II / Databases II 2.2 Titularul activităţilor de curs PROF.DR.MARIN FOTACHE 2.3 Titularul activităţilor de seminar ASIST.DR.IONUȚ HRUBARU,GEORGE TALABĂ 2.4 An de studiu 1 2.5 Semestru 1 2.6 Tip de evaluare P 2.7 Regimul discipinei OB 4. Precondiţii (dacă este cazul) 4.1 De curriculum Baze de date (sau echivalent) 4.2 De competenţe SQL 5. Condiţii (dacă este cazul) 5.1 De desfăşurare a cursului Video-proiector 5.2 De desfăşurare a seminarului/laboratorului

Transcript of Fisa disciplinei BD2 DM 2018-2019 - feaa.uaic.ro · (fișiere text, .csv, .xls, servere de baze de...

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

FIŞA DISCIPLINEI

* OB – Obligatoriu / OP – Opţional 3. Timpul total estimat (ore pe semestru şi activităţi didactice) 3.1 Număr de ore pe săptămână 4 din care: curs 2 seminar/laborator 2 3.2 Total ore din planul de învăţământ 56 din care: curs 28 seminar/laborator 14 3.3 Distribuţia fondului de timp ore Studiu după manual, suport de curs, bibliografie şi altele 24 Documentare suplimentară în bibliotecă, pe platformele electronice de specialitate şi pe teren 18 Pregătire seminarii/laboratoare, teme, referate, portofolii şi eseuri 36 Tutoriat 8 Examinări 8 Alte activităţi................................... -

3.4 Total ore studiu individual 94 3.5 Total ore pe semestru 150 3.6 Număr de credite 6

1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea “Alexandru Ioan Cuza” din Iaşi 1.2 Facultatea Facultatea de Economie şi Administrarea Afacerilor 1.3 Departamentul Contabilitate, Informatică Economică şi Statistică 1.4 Domeniul de studii Cibernetică, Statistică şi Informatică Economică 1.5 Ciclul de studii Master 1.6 Programul de studii / Calificarea Data Mining

2. Date despre disciplină

2.1 Denumirea disciplinei Baze de date II / Databases II

2.2 Titularul activităţilor de curs PROF.DR.MARINFOTACHE2.3 Titularul activităţilor de seminar ASIST.DR.IONUȚHRUBARU,GEORGETALABĂ 2.4 An de studiu 1 2.5 Semestru 1 2.6 Tip de evaluare P 2.7 Regimul discipinei OB

4. Precondiţii (dacă este cazul) 4.1 De curriculum Baze de date (sau echivalent) 4.2 De competenţe SQL

5. Condiţii (dacă este cazul)

5.1 De desfăşurare a cursului Video-proiector

5.2 De desfăşurare a seminarului/laboratorului

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

• Acces la o mașină reală sau virtuală pe care va fi instalat Oracle Database Server 12c • Acces la o mașină reală sau virtuală pe care va fi instalat R și RStudio • Studenții sunt invitați să-și folosească laptopurile proprii; Oracle Database Server poate fi instalat pe orice laptop cu performanțe medii; R și RStudio poate fi instalat pe orice tip de calculator (cerințele de resurse hardware sunt minime/medii) • Studenții care nu dețin laptopuri se pot conecta la serverul BD cu ajutorul stațiilor din laboratoarele FEAA; pe fiecare stație trebuie instalat clientul standard Oracle (SQL Developer) care poate fi conectat la serverul Oracle FEAA; de asemenea, pe fiecare stație vor fi instalate R și RStudio • Laboratoarele trebuie să conțină sufieciente stații de lucru care să asigure că toți studenții unei grupe pot lucra simultan

6. Competenţe specifice acumulate

Com

pete

nţe

prof

esio

nale

- De preluat din fisa competentelor pentru masterul Data Mining

Com

pete

nţe

tran

sver

sale

• CT1 – Capacitatea de a comunica si colabora in echipe formate din categorii profesionale diferite (0.5 credite)

7. Obiectivele disciplinei (din grila competenţelor specifice acumulate)

7.1.

Obi

ectiv

ul

gene

ral • Furnizarea cunoștințelor fundamentale, metodologiilor și instrumentelor care să permită rezolvarea

problemelor practice legate de stocarea, prelucrarea și pregătirea analizei unor volume mari de date economice

7.2.

Obi

ectiv

ele

spec

ifice

• Însușirea mecanismelor de acces la cele mai importante tipuri de fișiere și servere de date

• Stăpânirea opțiunilor avansate de procesare a datelor pentru două limbaje neprocedurale – SQL și tidyverse (R)

• Deprinderea elementelor procedurale privind procesarea datelor folosind limbajul Oracle PL/SQL

• Deprinderea elementelor procedurale privind procesarea datelor folosind programarea clasică și funcțională în limbajul R

• Însușirea opțiunilor limbajului R pentru importul și prelucrarea datelor seministructurate (JSON și XML)

• Stăpânirea mecanismelor de culegere a datelor în R prin API-uri și web scraping

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

8. Conţinut

8.1 Curs Metode de predare Observaţii (ore şi referinţe bibliografice)

1

Tipologia surselor de date necesare în Data Mining. De la fișiere text la tehnologii Big Data. Importanța bazelor de date. Tipologia limbajelor de procesare a datelor

Prezentare Dezbateri

1 ora [Fotache, 2018] [Fotache, 2009]

2 Opțiuni avansate de prelucrare a datelor în SQL. Funcții OLAP, window și PIVOT

Prezentare/demonstrații de scripturi și module de cod Dezbateri Studii de caz

3 ore [Fotache, 2018] [Fotache, 2009]

3 Limbajul R. Structuri de date. Vectori, cadre de date, liste (creare, acces, filtrare, sortare)

Prezentare/demonstrații de scripturi și module de cod

2 ore [Fotache, 2018] [Grolemund & Wickham, 2017]

4

Limbajul R. Opțiuni de import și export de date (fișiere text, .csv, .xls, servere de baze de date SQL, servere NoSQL, Hadoop, NewSQL, web scrapping, API)

Prezentare/demonstrații de scripturi și module de cod Studii de caz

2 ore [Fotache, 2018]

5 Limbajul R. Procesarea datelor folosind tidyverse

Prezentare/demonstrații de scripturi și module de cod Studii de caz

4 ore [Fotache, 2018] [Grolemund & Wickham, 2017]

6

Procesarea datelor în limbajul Oracle PL/SQL • blocuri, structuri de control • proceduri, funcții, pachete • cursoare, excepții • colecții: vectori asociativi, tabele imbricate, vectori de mărime variabilă • colecții stocabile: persistență și interogări SQL

Prelegere Prezentare/demonstrații de scripturi și module de cod

2 ore [Fotache s.a., 2003] [Fotache, 2009] [Fotache, 2018]

7 Test 1 individual (T1I). Oracle SQL și tidyverse Test 2 ore

8 Programarea structurată în limbajul R. tidyverse și modele statistice.

Prezentare/demonstrații de scripturi și module de cod

4 ore [Fotache, 2018] [Peng, 2016] [Peng et al., 2017]

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

9 Programarea funcțională în R. Pachetele dplyr și purrr

Prezentare/demonstrații de scripturi și module de cod

2 ore [Fotache, 2018] [Grolemund & Wickham, 2017] Wickham, H. [2014, 2018] [Bryan, 2016]

10 Opțiuni R pentru gestionarea datelor de tip XML și JSON

Prezentare/demonstrații de scripturi și module de cod

2 ore [Fotache, 2018]

11 Alte mecanisme de acces la date din limbajul R. API-uri și web scraping

Prezentare/demonstrații de scripturi și module de cod

4 ore [Fotache, 2018]

Bibliografie

Referinţe principale: Bryan, J. (2016). Purrr tutorial, https://jennybc.github.io/purrr-tutorial/index.html Fotache, M., Strîmbei, C., Creţu, L. (2003). Oracle 9i2. Ghidul dezvoltării aplicaţiilor profesionale, Ed. Polirom, Iaşi, 2003 Fotache, M. (2009). SQL. Dialecte DB2, Oracle, PostgreSQL şi SQL Server, Ed. Polirom, Iaşi, 2009 Fotache, M. (2018). Baze de date II, UAIC, FEAA, Iaşi, (pagina cursului pe portalul FEAA și Google Drive) Grolemund, G., Wickham, H. (2017, 2018), R for Data Science, O’Reilly, disponibilă gratuit la adresa http://r4ds.had.co.nz Ismay, C. and Kim, A.Y. (2018).An Introduction to Statistical and Data Sciences via R, Modern Drive, disponibilă gratuit la adresa https://moderndive.com/index.html Peng, R.D. (2016). R Programming for Data Science, LeanPub, disponibilă gratuit la adresa https://bookdown.org/rdpeng/rprogdatascience/ Peng, R.D., Kross, S. and Anderson, B. (2017). Mastering Software Development in R, disponibilă gratuit la adresa https://bookdown.org/rdpeng/RProgDA/ Wickham, H. (2014, 2018). Advanced in R, Chapman & Hall/CRC The R Series, disponibilă gratuit la adresa https://adv-r.hadley.nz Referinţe suplimentare:

Pe perioada derulării cursului vor fi oferite şi alte referinţe prin intermediul platformei Portal FEAA/ Google Drive. 8.2 Seminar / Laborator Mod de lucru Ore alocate

1 Instalarea și configurarea: Oracle Database Server; Oracle SQL

Demonstrații/execuție de scripturi și module de cod 1 oră

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

Developer; Crearea și actualizarea bazelor de date Oracle

2 Oracle SQL. Opțiuni avansate de interogare a datelor

Formulare și analiză cerințe. Redactarea soluțiilor

3 ore

3 Evaluare 1 pe echipe (E1E). Oracle SQL Rezolvarea unei probleme practice. Prezentarea soluției, execuția scripturilor SQL

2 ore

4

Instalare R și RStudio. Opțiuni R de import și export de date în formate text, .csv, .xlsx. Conectarea la surse de date Oracle și alte servere SQL.

Prezentare/demonstrații de scripturi și module de cod 2 ore

5 Limbajul R. Opțiuni de bază privind procesarea datelor

Prezentare/demonstrații de scripturi și module de cod Studii de caz

2 ore

6 Procesarea datelor folosind tidyverse. Studiu de caz

Prezentare/demonstrații de scripturi și module de cod Studii de caz

2 ore

7 Evaluare 2 pe echipe (E2E). tidyverse Rezolvarea unei probleme practice. Prezentarea soluției, execuția scripturilor R

2 ore

8 Proceduri, funcții și pachete PL/SQL; folosirea cursoarelor și colecțiilor

Discuții Demonstrații/execuție de scripturi și module de cod

2 ore

9 Evaluare 3 pe echipe (E3E). PL/SQL Rezolvarea unei probleme

practice. Prezentarea soluției, execuția modulelor PL/SQL

2 ore

10 Programarea structurata în limbajul R. Caz practic.

Formulare și analiză cerințe. Redactarea soluțiilor

2 ore

11 Programarea funcțională în limbajul R. Caz practic.

Formulare și analiză cerințe. Redactarea soluțiilor

2 ore

12 Evaluare 4 pe echipe (E4E). Programare in R

Rezolvarea unei probleme practice. Prezentarea soluției, execuția modulelor R

2 ore

13 API-uri și web scraping în R Discuții

Demonstrații/execuție de scripturi și module de cod

2 ore

14

Evaluare 5 pe echipe (E5E). Proiect R de acces la date pe bază de API/web scrapping și pregatire a datelor pentru analiză

Prezentarea soluției, execuția scripturilor R

2 ore

Bibliografie Cea indicată pentru curs, plus referințele indicate în prezentările și scripturile de pe portal

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR

Data completării Titular de curs Titulari de laborator 24 septembrie 2018 Marin Fotache

Ionuț Hrubaru George Talabă

Data avizării Director de departament

9. Coroborarea conţinutului disciplinei cu aşteptările reprezentanţilor comunităţii, asociaţiilor profesionale şi angajatorilor reprezentativi din domeniul aferent programului

Conţinutul disciplinei este în concordanţă cu ceea ce se face în alte centre universitare din ţară şi din străinătate. Pentru o mai bună adaptare la cerinţele pieţei muncii a conţinutului disciplinei au avut loc întâlniri atât cu reprezentaţi ai mediului de afaceri cât şi cu cadre didactice din alte facultăţi ale universităţii noastre

10. Evaluare

Tip activitate 10.1 Criterii de evaluare 10.2 Metode de evaluare 10.3 Pondere în nota finală (%)

Evaluare 1 pe echipe (E1E). Oracle SQL

Corectitudinea sintaxei SQL. Eleganța soluției

Prezentare și execuție scripturi SQL. Discutarea interogărilor cu fiecare membru al echipei de studenți

15%

Evaluare 2 pe echipe (E2E). tidyverse

Corectitudinea sintaxei R/tidyverse. Eleganța soluției

Prezentarea soluțiilor tidyverse 15%

Test 1 individual (T1I). Oracle SQL și tidyverse

Ințelegerea logicii opțiunilor de procesare a datelor Test scris 25%

Evaluare 3 pe echipe (E3E). PL/SQL

Complexitatea, validitatea și eleganța soluției PL/SQL

Prezentarea soluției PL/SQL 15%

Evaluare 4 pe echipe (E4E). Programare in R

Corectitudinea sintaxei R. Eleganța soluției Prezentarea modulelor R 15%

Evaluare 5 pe echipe (E5E). Proiect R

Complexitatea, validitatea și eleganța soluției Prezentarea modulelor R 15%

10.6 Standard minim de performanţă Culegerea și prelucrarea datelor în vederea pregătirii pentru analiză (data mining, machine learning)

UNIVERSITATEA “ALEXANDRU IOAN CUZA” DIN IAȘI

FACULTATEA DE ECONOMIE ŞI ADMINISTRAREA AFACERILOR