Sidebar

Lapkričio 3 d., ketvirtadienį, 15.00 val. kviečiame VU Filologijos fakulteto bendruomenės narius į praktinį skaitmeninei humanitarikai skirtą seminarą „Nuo spausdinto iki anotuoto teksto“. Seminaras su nedidele pertrauka truks iki dviejų valandų ir vyks A4 (Kalbų laboratorija 1) kompiuterių klasėje (savo kompiuterių atsinešti nereikia). 

Pirmoji jo dalis bus skirta tekstų skaitmeninimo galimybėms aptarti. T. y. kaip spausdintą fizinėje knygoje esantį tekstą greitai ir kokybiškai perkelti į skaitmeninę terpę, naudojant įvairius viešos prieigos tekstų atpažinimo (OCR) įrankius. Praktiškai išbandysime kelis, palyginsime jų atpažinimo rodiklius bei pabandysime pagerinti atpažįstamo teksto kokybę, naudodamiesi vaizdų redagavimo programa.

Antroji seminaro dalis bus skirta suskaitmeninto teksto bazinei statistinei analizei ir anotavimui. Naudodami R statistinį paketą ir teksto apdorojimui skirtas programines bibliotekas, pabandysime paskaičiuoti paprastas teksto statistikas, tokias kaip žodžių dažniai, išskirti aktualiausius raktažodžius bei morfologiškai ir sintaksiškai suanotuoti tekstą. Nepamiršime rezultatus pateikti vizualiai -- tam pabandysime sugeneruoti juos atvaizduojančias diagramas.

Jokių išankstinių žinių nereikalaujama, visa medžiaga bus pateikta, o programos naudojamos kartu pažingsniui. Net jei patys neatliekate tyrimų, kurie būtų susiję su nurodytomis temomis, tokios žinios galėtų praversti vadovaujant studentų darbams.

Dalyvių skaičius ribotas, todėl prašome užsiregistruoti > 

Seminaro metu naudosime viešos prieigos įrankius ir programas:

  • GNU Image Manipulation Program (GIMP)
  • Internetinius teksto atpažinimo (OCR) ir panašumo nustatymo įrankius
  • R su grafine sąsaja RStudio 

Seminarą ves Skaitmeninės humanitarikos įvado dėstytojos Ernesta Kazakėnaitė ir Justina Mandravickaitė.

Siekdami užtikrinti jums teikiamų paslaugų kokybę, Universiteto tinklalapiuose naudojame slapukus. Tęsdami naršymą jūs sutinkate su Vilniaus universiteto slapukų politika. Daugiau informacijos