Datu analīze ar Microsoft BI un Python
PROGRAMMAS MĒRĶIS
Sniegt zināšanas un prasmes datu apstrādes, vizualizēšanas un koplietošanas jomā ar programmēšanas valodu R.
Izglītības programma ir izveidota ņemot vērā Eiropas Komisijas Digitālās kompetences ietvarstruktūras (DigComp) vadlīnijas un atbilst DigComp 3. kompetenču līmenim (L3) - pēc sekmīgas programmas apgūšanas izglītojamais spēs patstāvīgi veikt skaidri definētus rutīnas uzdevumus un risināt vienkāršas problēmas, kas rodas šo uzdevumu izpildes gaitā.
Mācību ilgums un formāts
160 mācību stundas:
60 stundas tiešsaistē ar
pasniedzēju un 100 stundas
projektu un patstāvīgais darbs
Mērķauditorija
Ikviens, kurš apkopo un analīzē datus, sadarbojas ar citiem
Tehnoloģijas
Windows operētājsistēma
Microsoft Teams for Education
R Studio
GitHub
Priekšzināšanas un priekšnoteikumi dalībai
Vismaz vidējā izglītība
Mācīšanās rezultāti
Pēc sekmīgas mācību programmas apgūšanas kursa dalībnieki spēs patstāvīgi veikt skaidri definētus rutīnas uzdevumus un risināt vienkāršas problēmas, kas rodas šo uzdevumu izpildes gaitā:
• sagatavot apstrādei datus no vairākiem avotiem un formātiem;
• veikt sākotnējo datu apstrādi, tīrīt datus;
• pielietot paņēmienus datu ticamības pārbaudei;
• pielietot dažādu tipu datus R valodā;
• veidot loģiskus un aritmētiskos operatorus R valodā;
• pielietot pamatstatistikas metodes datu apstrādei;
• vizualizēt datus;
• pielietot paņēmienus proaktīvai datu konfidencialitātes un drošības aizsardzībai;
• plānot un nodrošināt atbalstu visam datu dzīves ciklam (iegūšana, apstrāde, arhivēšana, dzēšana);
• pielietot paņēmienus datu kvalitātes un integritātes nodrošināšanai;
• pielietot datu aizsardzības regulas un politikas datu kvalitātes un atbilstības nodrošināšanai;
• pielietot organizācijas kvalitātes politiku datu kvalitātes un atbilstības nodrošināšanai;
• plānot un izmantot sistemātisku datu iegūšanas, apstrādes un glabāšanas vides novērošanu, lai identificētu un definētu ievainojamības un draudus, kā arī reģistrētu un ziņotu neatbilstības;
• veidot sadarbību ar kolēģiem, partneriem, klientiem, prezentējot datu apstrādes analīzes rezultātus.
Programma attīsta e-kompetences un caurviju kompetences
DIGCOMP 2.1
1.3. Datu, informācijas un digitālā satura pārvaldība.
3.2. Digitālā satura integrēšana un pārstrādāšana
3.4. Programmēšana
5.3. Digitālo tehnoloģiju radoša lietošana
3. līmenis:
persona spēs patstāvīgi veikt skaidri definētus rutīnas uzdevumus un risināt vienkāršas problēmas, kas rodas šo uzdevumu izpildes gaitā.
e-CF 4.0
D.7. Data Science and Analytics L2 & L3
E.6. ICT Quality Management L2
E.8. Information Security Management L2
Caurviju kompetences
-
Komunikācija
-
Pašattīstība
-
Darbs komandā
-
Iniciatīva
-
Pielāgošanās
Materiāli kursa dalībniekiem
Pasniedzēja sagatavota darba burtnīca ar uzdevumu aprakstiem
Kursa tēmas
-
R darba vides sagatavošana:
-
R Studio lejuplādēšana un instalēšana,
-
R Studio vides pielāgošana tālākai darbībai,
-
R pakešu izvēle un sagatavošana darbam.
2. R datu struktūras un to apraksts:
-
mainīgo tipi ,
-
sarakstu un vektoru veidošana,
-
matricu veidošana,
-
datu rāmji .
3. R skriptu un funkciju veidošana:
-
zarošanās un loģiskās izteiksmes,
-
cikla konstrukcijas,
-
R loģiskie operatori,
-
R aritmētiskie operatori,
-
R skriptu veidošana,
-
R funkciju veidošana.
4. Datu importēšana un eksportēšana no CSV, Excel un SQL:
-
datu tīrīšana un sakārtošana,
-
R bibliotēkas un funkcijas datu tīrīšanai,
-
trūkstošo datu problēmas risināšana,
-
datu transformācija ar R bibliotēkām,
-
datu izlases iegūšana ar R bibliotēkām.
5. Datu statistiskā apstrāde:
-
datu vidējie lielumi (moda, mediāna un aritmētiskais vidējais),
-
normālsadalījums,
-
rezultātu interpretēšana un aprakstīšana.
6. Datu prognozēšanas metodes ar R rīkiem:
-
ticamo prognožu sagatavošana,
-
ticamības intervālu izvēle un apraksts.
7. Datu vizualizācija ar R rīkiem:
-
R bibliotēkas grafikas veidošanai,
-
histogrammu veidošana ar R,
-
datu izkliedes laukumu zīmēšana ar R,
-
stilu un krāsu mainīšana,
-
trendu zīmēšana R diagrammās,
-
labas prakses datu vizualizācijai.
8. Datos balstīto pārskatu sagatavošana:
-
datu avotu apraksts,
-
Vispārīgās Datu Aizsardzības Regulas (VDAR jeb GDPR) noteikumu ievērošana,
-
datos balstīto stāstu veidošana,
-
datu analīzes rezultātu prezentācija.