FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea Alexandru Ioan Cuza din Iaşi 1.2 Facultatea Facultatea de Economie şi Administrarea Afacerilor 1.3 Departamentul Contabilitate, Informatică Economică şi Statistică 1.4 Domeniul de studii Cibernetică, Statistică şi Informatică Economică 1.5 Ciclul de studii Master 1.6 Programul de studii / Calificarea Data Mining 2. Date despre disciplină 2.1 Denumirea disciplinei Baze de date II / Databases II 2.2 Titularul activităţilor de curs PROF.DR. MARIN FOTACHE 2.3 Titularul activităţilor de seminar ASIST. DR. IONUȚ HRUBARU, GEORGE TALABĂ 2.4 An de studiu 1 2.5 Semestru 1 2.6 Tip de evaluare P 2.7 Regimul discipinei OB * OB Obligatoriu / OP Opţional 3. Timpul total estimat (ore pe semestru şi activităţi didactice) 3.1 Număr de ore pe săptămână 4 din care: curs 2 seminar/laborator 2 3.2 Total ore din planul de învăţământ 56 din care: curs 28 seminar/laborator 14 3.3 Distribuţia fondului de timp ore Studiu după manual, suport de curs, bibliografie şi altele 24 Documentare suplimentară în bibliotecă, pe platformele electronice de specialitate şi pe teren 18 Pregătire seminarii/laboratoare, teme, referate, portofolii şi eseuri 36 Tutoriat 8 Examinări 8 Alte activităţi... - 3.4 Total ore studiu individual 94 3.5 Total ore pe semestru 150 3.6 Număr de credite 6 4. Precondiţii (dacă este cazul) 4.1 De curriculum Baze de date (sau echivalent) 4.2 De competenţe SQL 5. Condiţii (dacă este cazul) 5.1 De desfăşurare a cursului Video-proiector 5.2 De desfăşurare a seminarului/laboratorului
Acces la o mașină reală sau virtuală pe care va fi instalat Oracle Database Server 12c Acces la o mașină reală sau virtuală pe care va fi instalat R și RStudio Studenții sunt invitați să-și folosească laptopurile proprii; Oracle Database Server poate fi instalat pe orice laptop cu performanțe medii; R și RStudio poate fi instalat pe orice tip de calculator (cerințele de resurse hardware sunt minime/medii) Studenții care nu dețin laptopuri se pot conecta la serverul BD cu ajutorul stațiilor din laboratoarele FEAA; pe fiecare stație trebuie instalat clientul standard Oracle (SQL Developer) care poate fi conectat la serverul Oracle FEAA; de asemenea, pe fiecare stație vor fi instalate R și RStudio Laboratoarele trebuie să conțină sufieciente stații de lucru care să asigure că toți studenții unei grupe pot lucra simultan 6. Competenţe specifice acumulate - De preluat din fisa competentelor pentru masterul Data Mining Competenţe profesionale Competenţe transversale CT1 Capacitatea de a comunica si colabora in echipe formate din categorii profesionale diferite (0.5 credite) 7. Obiectivele disciplinei (din grila competenţelor specifice acumulate) 7.1. Obiectivul general 7.2. Obiectivele specifice Furnizarea cunoștințelor fundamentale, metodologiilor și instrumentelor care să permită rezolvarea problemelor practice legate de stocarea, prelucrarea și pregătirea analizei unor volume mari de date economice Însușirea mecanismelor de acces la cele mai importante tipuri de fișiere și servere de date Stăpânirea opțiunilor avansate de procesare a datelor pentru două limbaje neprocedurale SQL și tidyverse (R) Deprinderea elementelor procedurale privind procesarea datelor folosind limbajul Oracle PL/SQL Deprinderea elementelor procedurale privind procesarea datelor folosind programarea clasică și funcțională în limbajul R Însușirea opțiunilor limbajului R pentru importul și prelucrarea datelor seministructurate (JSON și XML) Stăpânirea mecanismelor de culegere a datelor în R prin API-uri și web scraping
8. Conţinut 8.1 Curs Metode de predare 1 2 3 Tipologia surselor de date necesare în Data Mining. De la fișiere text la tehnologii Big Data. Importanța bazelor de date. Tipologia limbajelor de procesare a datelor Opțiuni avansate de prelucrare a datelor în SQL. Funcții OLAP, window și PIVOT Limbajul R. Structuri de date. Vectori, cadre de date, liste (creare, acces, filtrare, sortare) Prezentare Dezbateri Dezbateri Observaţii (ore şi referinţe bibliografice) 1 ora [Fotache, 2009] 3 ore [Fotache, 2009] [Grolemund & Wickham, 2017] 4 Limbajul R. Opțiuni de import și export de date (fișiere text,.csv,.xls, servere de baze de date SQL, servere NoSQL, Hadoop, NewSQL, web scrapping, API) 5 Limbajul R. Procesarea datelor folosind tidyverse 6 Procesarea datelor în limbajul Oracle PL/SQL blocuri, structuri de control proceduri, funcții, pachete cursoare, excepții colecții: vectori asociativi, tabele imbricate, vectori de mărime variabilă colecții stocabile: persistență și interogări SQL Prelegere 4 ore [Grolemund & Wickham, 2017] [Fotache s.a., 2003] [Fotache, 2009] 7 Test 1 individual (T1I). Oracle SQL și tidyverse Test 8 Programarea structurată în limbajul R. tidyverse și modele statistice. 4 ore [Peng, 2016] [Peng et al., 2017]
9 10 11 Programarea funcțională în R. Pachetele dplyr și purrr Opțiuni R pentru gestionarea datelor de tip XML și JSON Alte mecanisme de acces la date din limbajul R. API-uri și web scraping [Grolemund & Wickham, 2017] Wickham, H. [2014, 2018] [Bryan, 2016] 4 ore Bibliografie Referinţe principale: Bryan, J. (2016). Purrr tutorial, https://jennybc.github.io/purrr-tutorial/index.html Fotache, M., Strîmbei, C., Creţu, L. (2003). Oracle 9i2. Ghidul dezvoltării aplicaţiilor profesionale, Ed. Polirom, Iaşi, 2003 Fotache, M. (2009). SQL. Dialecte DB2, Oracle, PostgreSQL şi SQL Server, Ed. Polirom, Iaşi, 2009 Fotache, M. (2018). Baze de date II, UAIC, FEAA, Iaşi, (pagina cursului pe portalul FEAA și Google Drive) Grolemund, G., Wickham, H. (2017, 2018), R for Data Science, O Reilly, disponibilă gratuit la adresa http://r4ds.had.co.nz Ismay, C. and Kim, A.Y. (2018). An Introduction to Statistical and Data Sciences via R, Modern Drive, disponibilă gratuit la adresa https://moderndive.com/index.html Peng, R.D. (2016). R Programming for Data Science, LeanPub, disponibilă gratuit la adresa https://bookdown.org/rdpeng/rprogdatascience/ Peng, R.D., Kross, S. and Anderson, B. (2017). Mastering Software Development in R, disponibilă gratuit la adresa https://bookdown.org/rdpeng/rprogda/ Wickham, H. (2014, 2018). Advanced in R, Chapman & Hall/CRC The R Series, disponibilă gratuit la adresa https://adv-r.hadley.nz Referinţe suplimentare: Pe perioada derulării cursului vor fi oferite şi alte referinţe prin intermediul platformei Portal FEAA/ Google Drive. 8.2 Seminar / Laborator Mod de lucru Ore alocate Instalarea și configurarea: Oracle Demonstrații/execuție de 1 1 oră Database Server; Oracle SQL scripturi și module de
2 Developer; Crearea și actualizarea bazelor de date Oracle Oracle SQL. Opțiuni avansate de interogare a datelor 3 Evaluare 1 pe echipe (E1E). Oracle SQL 4 Instalare R și RStudio. Opțiuni R de import și export de date în formate text,.csv,.xlsx. Conectarea la surse de date Oracle și alte servere SQL. Formulare și analiză cerințe. Redactarea soluțiilor execuția scripturilor SQL de scripturi și module de 3 ore 5 6 Limbajul R. Opțiuni de bază privind procesarea datelor Procesarea datelor folosind tidyverse. Studiu de caz 7 Evaluare 2 pe echipe (E2E). tidyverse 8 9 10 11 12 13 14 Proceduri, funcții și pachete PL/SQL; folosirea cursoarelor și colecțiilor Evaluare 3 pe echipe (E3E). PL/SQL Programarea structurata în limbajul R. Caz practic. Programarea funcțională în limbajul R. Caz practic. Evaluare 4 pe echipe (E4E). Programare in R API-uri și web scraping în R Evaluare 5 pe echipe (E5E). Proiect R de acces la date pe bază de API/web scrapping și pregatire a datelor pentru analiză de scripturi și module de de scripturi și module de execuția scripturilor R Discuții Demonstrații/execuție de scripturi și module de execuția modulelor PL/SQL Formulare și analiză cerințe. Redactarea soluțiilor Formulare și analiză cerințe. Redactarea soluțiilor execuția modulelor R Discuții Demonstrații/execuție de scripturi și module de Prezentarea soluției, execuția scripturilor R Bibliografie Cea indicată pentru curs, plus referințele indicate în prezentările și scripturile de pe portal
9. Coroborarea conţinutului disciplinei cu aşteptările reprezentanţilor comunităţii, asociaţiilor profesionale şi angajatorilor reprezentativi din domeniul aferent programului Conţinutul disciplinei este în concordanţă cu ceea ce se face în alte centre universitare din ţară şi din străinătate. Pentru o mai bună adaptare la cerinţele pieţei muncii a conţinutului disciplinei au avut loc întâlniri atât cu reprezentaţi ai mediului de afaceri cât şi cu cadre didactice din alte facultăţi ale universităţii noastre 10. Evaluare Tip activitate 10.1 Criterii de evaluare 10.2 Metode de evaluare Evaluare 1 pe echipe (E1E). Oracle SQL Evaluare 2 pe echipe (E2E). tidyverse Test 1 individual (T1I). Oracle SQL și tidyverse Evaluare 3 pe echipe (E3E). PL/SQL Evaluare 4 pe echipe (E4E). Programare in R Evaluare 5 pe echipe (E5E). Proiect R Corectitudinea sintaxei SQL. Eleganța soluției Corectitudinea sintaxei R/tidyverse. Eleganța soluției Ințelegerea logicii opțiunilor de procesare a datelor Complexitatea, validitatea și eleganța soluției PL/SQL Corectitudinea sintaxei R. Eleganța soluției Complexitatea, validitatea și eleganța soluției Prezentare și execuție scripturi SQL. Discutarea interogărilor cu fiecare membru al echipei de studenți Prezentarea soluțiilor tidyverse 10.3 Pondere în nota finală (%) 15% 15% Test scris 25% Prezentarea soluției PL/SQL 15% Prezentarea modulelor R 15% Prezentarea modulelor R 15% 10.6 Standard minim de performanţă Culegerea și prelucrarea datelor în vederea pregătirii pentru analiză (data mining, machine learning) Data completării Titular de curs Titulari de laborator 24 septembrie 2018 Marin Fotache Ionuț Hrubaru George Talabă Data avizării Director de departament