dati_pictogram_white.png

Datu analīze un vizualizācija ar R programmēšanas valodu

PROGRAMMAS MĒRĶIS

Sniegt zināšanas un prasmes datu izpētei, datu analīzei, datu vizualizēšanai un koplietošanai ar programmēšanas valodu R, kā arī uzlabot datu apstrādes produktivitāti.

Mācību ilgums un formāts

48 mācību stundas
Tiešsaistē

Mērķauditorija

Ikviens, kurš apkopo un analīzē datus, sadarbojas ar citiem, aprakstot un prezentējot datus: vadītāji, analītiķi, finanšu speciālisti, pētnieki u.c.

Tehnoloģijas

R Studio
GitHub

Priekšzināšanas un priekšnoteikumi dalībai

Vismaz vidējā izglītība,  vēlme apgūt jaunas lietas, prasmes darbā ar Microsoft Excel (datu aprēķini pēc formulām, datu kārtošana, diagrammas).

Mācīšanās rezultāti

Pēc sekmīgas mācību programmas apgūšanas kursa dalībnieki varēs patstāvīgi vai ar nelielu pieredzējušāku lietotāju atbalstu:

• sagatavot datus no vairākiem avotiem un formātiem analīzei;
• veikt sākotnējo datu apstrādi, tīrīt datus;
• pielietot paņēmienus datu ticamības pārbaudei;
• pielietot dažādu tipu datus R valodā;
• pielietot atbilstošu metodoloģiju datu analītikai; 
• veidot loģiskus un aritmētiskos operatorus R valodā;
• pielietot pamatstatistikas metodes datu apstrādei;
• veidot datu apstrādes plūsmu automatizāciju;
• veidot datu analīzes rezultātu vizualizāciju;
• veidot datu trendu vizualizāciju;
• pielietot regresijas un korelācijas analīzi ar R rīkiem;
• modelēt un testēt hipotēzes; 
• pielietot paņēmienus proaktīvai datu konfidencialitātes un drošības aizsardzībai;
• plānot un nodrošināt atbalstu visam datu dzīves ciklam (iegūšana, apstrāde, arhivēšana, dzēšana);
• pielietot paņēmienus datu kvalitātes un integritātes nodrošināšanai;
• pielietot datu aizsardzības regulas un politikas datu kvalitātes un atbilstības nodrošināšanai;
• pielietot organizācijas kvalitātes politiku datu kvalitātes un atbilstības  nodrošināšanai;
• modelēt un plānot sistemātisku datu iegūšanas, apstrādes un glabāšanas vides novērošanu, lai identificētu un                    definētu ievainojamības un draudus, kā arī reģistrētu un ziņotu neatbilstības;
• veidot sadarbību ar kolēģiem, partneriem, klientiem, prezentējot datu apstrādes analīzes rezultātus. 

Programma attīsta e-kompetences un caurviju kompetences

DIGCOMP 2.1

  • Datu zinātne, datu analīze un datu vizualizācija

    DIGCOMP 2.1 līmenis: 3

e-CF 4.0

  • D.7. Data Science and Analytics L2 & L3

  • E.6. ICT Quality Management L2 

  • E.8. Information Security Management L2

Caurviju kompetences

  • Komunikācija

  • Pašattīstība

  • Darbs komandā

  • Iniciatīva

  • Pielāgošanās

Materiāli kursa dalībniekiem

Pasniedzēja sagatavota darba burtnīca ar uzdevumu aprakstiem.

Kursa tēmas

1. R darba vides sagatavošana:

  • R Studio lejuplādēšana  un instalēšana,

  • R Studio vides pielāgošana tālākai darbībai,

  • R pakešu izvēle un sagatavošana darbam.

2. R datu struktūras un to apraksts:

  • mainīgo tipi un klases,

  • sarakstu un vektoru veidošana,

  • matricu veidošana,

  • datu rāmji (dataframes).

3. R skriptu un funkciju veidošana:

  • zarošanās un loģiskās izteiksmes,

  • cikla konstrukcijas, 

  • R loģiskie operatori,

  • R aritmētiskie operatori,

  • R skriptu veidošana,

  • R funkciju veidošana.

4. Datu importēšana un eksportēšana no CSV, Excel un SQL:    

  • datu tīrīšana un sakārtošana,

  • R bibliotēkas un funkcijas datu tīrīšanai,

  • trūkstošo datu problēmas risināšana,

  • datu transformācija ar R bibliotēkām,

  • datu izlases iegūšana ar R bibliotēkām.

5. Datu statistiskā apstrāde:

  • datu vidējie lielumi (moda, mediāna un aritmētiskais vidējais),

  • izkliedes mēri (amplitūda, standartnovirze),

  • normālsadalījums, 

  • korelācijas analīze,

  • vienfaktora un daudzfaktoru lineārās regresijas analīze,

  • rezultātu interpretēšana un aprakstīšana.

6. Datu prognozēšanas metodes ar R rīkiem:    

  • ticamo prognožu sagatavošana,

  • ticamības intervālu izvēle un apraksts.

7. Hipotēžu formulēšana un testēšana ar R rīkiem:    

  • hipotēžu formulējumi,

  • hipotēžu testēšana,

  • 1. un 2. tipa kļūdas hipotēžu testēšanā.

8. Datu vizualizācija ar R rīkiem:    

  • R bibliotēkas grafikas veidošanai,

  • histogrammu veidošana ar R,

  • datu izkliedes laukumu zīmēšana ar R,

  • stilu un krāsu mainīšana,

  • trendu zīmēšana R diagrammās,

  • labas prakses datu vizualizācijai.

9. Datos balstīto pārskatu sagatavošana:    

  • datu avotu apraksts, 

  • Vispārīgās Datu Aizsardzības Regulas (VDAR jeb GDPR) noteikumu ievērošana,

  • datos balstīto stāstu veidošana,

  • datu analīzes rezultātu prezentācija.

Cena: 1500 EUR + PVN