Tematsko modeliranje in korpusnojezikoslovne metode za analizo podatkov

Opis vsebinskega sklopa

Uvod v strojno učenje in obdelavo naravnega jezika (pregled strojnega učenja (nadzorovano in nenadzorovano učenje), povezava strojnega učenja z obdelavo naravnega jezika, predstavitev terminologije, format CoNNL-U).

Metoda LDA (opis algoritma, značilnosti LDA, predobdelava podatkov, omejitve metode, tematsko modeliranje parlamentarnih razprav).

Priprava podatkov na analizo (Uvoz v program Orange, pregled podatkov, priprava vzorca in predprocesiranje).

Analiza parlamentarnih govorov (teme parlametnarnih razprav: vektorizacija, luščenje tem, opredelitev tem, zastopanost tem po govorih; najizrazitejše teme in povezave med njimi; teme pred in med epidemijo).

Osnove korpusne lingvistike (jezikovni korpusi kot vir za zgodovinopisne raziskave, konkordančniki, korpusnojezikoslovne metode v zgodovinopisju).

Parlamentarni korpusi (parlamentarni korpusi kot vir za jezikovne, zgodovinopisne in mednacionalne primerjalne raziskave, korpus ParlaMint, uporaba orodja TeiTok).

Uporaba korpusnojezikoslovnih metod za analizo parlamentarnih govorov (uporaba orodja noSketchEngine, osnovno in napredno iskanje v kombinaciji s sociodemografskimi informacijami, analiza aktivnosti poslank in poslancev z vidika frekvence in tematskega fokusa, analiza konceptualizacije izbranega pojma).

Urnik izvedbe izobraževanj

Objavljen je urnik izvedbe izobraževanj, ki bodo potekala od oktobra 2024 do januarja 2025. Usposabljanja bodo potekala v živo na različnih lokacijah in v spletnem okolju. Udeleženci bodo imeli možnost interaktivnega...