Tekstynų lingvistika ir tekstynų naudojimas klasėje

Slides:



Advertisements
Similar presentations
Ma.
Advertisements

Click on each of us to hear our sounds.
Las Vocales En Espanol.
Number Words’ Frequency in Modern Lithuanian Adriano Cerri University of Pisa, Department of Linguistics
HIRAGANA by number of strokes Images from:
Lietuvos vardo kilmė Žmogus, nepažįstantis savo tautos namų – Tėvynės žemės, kurioje nuo seno tėvai ir protėviai gyveno, - nėra savo krašto pilietis! Įsisąmoninkime.
Muzikos ženklų karuselė
PHONICS Repeat each sound. Blend the sounds. Read each word.
ma mu mi mo me pe pi pa pu po si sa so.
Vaizdinė užduotis. Kuriose iš šių valstybių galima pamatyti tokius gyvenamuosius namus? Jemene Tanzanijoje Mongolijoje Indonezijoje A B C D 1.
Parengė Nikolė Jocytė, Ugnė Kavaliauskaitė ir Gabija Sirtautaitė, 4a klasės mokinės.
Comenius Strateginių partnerysčių projektas “PADĖK IR GAUK PAGALBĄ”
MA. ME MI MO MU MÁ MÉ MÍ MÓ MŮ LA LE LI.
Network address translation Tinklo adresų vertimas
PROJEKTAS LIETUVOS IR NORVEGIJOS POLICIJOS BENDRADARBIAVIMAS IR GEBĖJIMŲ STIPRINIMAS KOVOJANT SU SMURTU ARTIMOJE APLINKOJE IR SMURTU LYTIES PAGRINDU.
Culture, Education and Sport Department of Kaunas Region Municipality
LIETUVIŲ KALBA INFORMACINĖJE VISUOMENĖJE
1 paskaita: Įvadas į 3D grafiką OpenGL GLSL = OpenGL Shading Language
Darbą parengė: Viktorija Drūteikaitė IT2
SSGG (SWOT): Organizacijos stiprybės ir silpnybės, galimybės ir grėsmės (nustatymas, grupavimas, vertinimas, rezultatas) Pagrindinė literatūra: Lietuvos.
MAUDYKLŲ VANDENS KOKYBĖS STEBĖSENOS
Robert Andruškevič AT27D.   Tai yra operacinė sistema, daugiausia naudojama išmaniuosiuose telefonuose, nors ją galima įdiegti ir kituose mobiliuosiuose.
CLIL, MY OPEN WINDOW ON THE WORLD AROUND ME
Video kūrimas su Windows Movie Maker 2.0
CC BY-SA mascil consortium 2014
Tekstų redaktorius MS Word 200x
BIOLOGIJA, INFORMATIKA klasės
Kūrybingumo kompetencija: ugdymo ir vertinimo dermės paieškos
LIETUVOS VARTOTOJŲ GALIMYBĖS NAUDOTIS VISATEKSTĖMIS DUOMENŲ BAZĖMIS
PHP „CodeIgniter“ karkaso saugumas
Pagrindinės sąvokos Hipertekstas ir multimedija
Atliko: Jokūbas Rusakevičius VU MIF PS 3k 3g
Daiktavardis Dalykas, ugdymo sritis: Tema: Klasė: Priemonės paskirtis:
R paketas ir jo įdiegimas
JavaScript kalbos apžvalga
By Rita Vickienė MEITT, Vilnius, Lithuania 2010 m. liepos 6 – 16 d.
inovatyvioms mokykloms
IPod MENIU.
Bendradarbiavimu paremtas mokyklų tobulinimas
Nemokami IKT įrankiai ir programos ugdymo individualizavimui
Paprasti skaičiavimai. Uždavinių sprendimas
HIPERTEKSTINĖS TECHNOLOGIJOS
Failai ir jų tvarkymas.
KTU Vaižganto progimnazija
Antrosios kartos interneto technologijos
Regresijos determinuotumas
Tekstiniai uždaviniai
VLKK ir MELC projektas „Pasaulio vietovardžiai“
Saulius Ragaišis, VU MIF
Biomedicinos mokslų informacijos šaltiniai ir paieška
„MARC 21 katalogavimo vadovo“ atnaujinimų pristatymas Įvadas
Doc.dr. Giedra-Marija LINKAITYTĖ Dr. Audronė VALIUŠKEVIČIŪTĖ
Virtualus kompiuteris
Duomenų struktūros ir algoritmai
Funkcijos 9 paskaita.
Operacinė sistema Testas 9 klasė
Studijų pasirinkimas Lietuvoje ir užsienyje: ką svarbu žinoti?
3D skenavimo metodas, jo privalumai. Kam reikalingi avalynės įdėklai?
Kalbos gebėjimų įtaka mokinių pasiekimams
Projektas “Saugesnis internetas”
Daugelio dokumentų sąsaja (angl. Multiple document interface)
Studijos užsienyje.
Windows Ribbon Framework
Tyrimų rezultatų interpretacija
Klaipėdos Simono Dacho progimnazija
Grupinio darbo programinė įranga Lotus Notes
Pranešėjas Jurij Kuznecov
Presentation transcript:

Tekstynų lingvistika ir tekstynų naudojimas klasėje Andrius Utka Inovatyvios gimtosios lietuvių kalbos mokytojų kvalifikacijos tobulinimo programos įgyvendinimas

Pranešimo planas 1 dalis. Tekstynai ir tekstynų lingvistika 2 dalis. Dabartinės lietuvių kalbos tekstynas 3 dalis. Tekstynų naudojimas klasėje 4 dalis. Praktinės užduotys

Tekstynai ir tekstynų lingvistika I dalis Tekstynai ir tekstynų lingvistika

Kas yra tekstynas? Tekstynas (angl. corpus) – tekstų rinkinys (paprastai elektroninis), kuriamas įvairių kalbos reiškinių tyrimų tikslams. Sudarytas iš autentiškų tekstų taip, kad kuo geriau atspindėtų kalbą ar jos atmainą. Tekstynas lingvistui yra tarsi cheminės medžiagos mėginys chemikui. Lingvistas tirdamas šį kalbos mėginį gali daryti empiriniais duomenimis paremtas išvadas.

Reprezentatyvumas Savybė, tai tekstyno savybė, kai nedidelė dalis atspindi visumos įvairovę. RAŠYTINĖ KALBA Tekstynas

Kas nėra tekstynas Neskaitmeninis Ne tekstų (ar jų dalių) rinkinys, pvz. patarlių, citatų, etc. Neatspindintis kalbos ar jos atmainos (kalbos klaidų pavyzdžiai) rinkinys Bet kaip, be jokios sistemos sudarytas Visiškai ar dalinai neapdorojamas programinėmis priemonėmis

Tekstas ir tekstynas Mažesnės apimties Skaitomas visas horizontaliai Turi struktūrą, yra rišlus Skaitomas turinio atž. tiesiogiai Parole pavyzdys Didesnės apimties Skaitomas konkondanso eilutėmis vertikaliai Turi dirbtinę sandarą Tiriamas formos atžvilgiu su spec. priemonėmis Langue pavyzdys

Literatūra R. Marcinkevičienė. 2000. “Tekstynų lingvistka: teorija ir praktika”. Darbai ir dienos 24. R. Marcinkevičienė. 1997. “Tekstynų lingvistika ir lietuvių k. tekstynas”. Lituanistica 1(29). A. Utka. 2000.“Kalbinė programinė įranga ir jos galimybės” J. Sinclair. 1991. Corpus, concordance, collocation. Oxford: OUP. T. McEnery and A. Wilson. 1996. Corpus linguistics. Edinburgh: UP.

Dabartinės lietuvių kalbos tekstynas (DLKT) II dalis Dabartinės lietuvių kalbos tekstynas (DLKT)

Faktai Dabartinės lietuvių kalbos tekstynas yra didžiausias lietuvių rašytinės kalbos tekstynas Lietuvoje. Jis yra sukauptas VDU Kompiuterinės lingvistikos centre. Dabartinis jo dydis yra 140 mln. žodžių. http://tekstynas.vdu.lt (http://donelaitis.vdu.lt)

Dabartinės lietuvių kalbos tekstynas Elektroninių tekstų rinkinys skirtas įvairialypei kalbos analizei; Tęstinis; Bendrasis.

DLKT augimas

Tekstyno sandara

Dviejų rūšių paieškos galimybės Paprastoji paieška Išplėstinė paieška Paieška visame tekstyne ar pasirinktoje dalyje Viso žodžio ar žodžio formos paieška Žodžio dalies, žodžio, frazės paieška Galima pasirinkti konkordanso eilutės plotį Kontekstinio žodžio paieška (galima nurodyti tikslų kontekstinį žodį, to žodžio pradžią arba pabaigą; kurioje pozicijoje pagrindinio žodžio atžvilgiu turi būti kontekstinis žodis). Veikia paieška pagal: autorių, leidinio pavadinimą, leidyklą, laikotarpį.

Konkordansas tai sąrašas eilučių, kuriose rastas tiriamas žodis ar žodžių junginys, paimtas iš teksto ar tekstyno. Konkordanso eilutėje tiriamasis žodis parodomas kontekste.

Tekstynų lingvistikos naudojimas klasėje III dalis Tekstynų lingvistikos naudojimas klasėje

Tekstynų revoliucija ir kalbų mokymas (1) Anglų lingvistai sutartinai teigia, kad “tekstynų lingvistika iš esmės pakeitė kalbotyrą ir joje taikomus tyrimo metodus”, kitaip sakant sukėlė kalbotyroje revoliuciją; Nors tekstynų lingvistika kalbų mokymui atveria daug naujų perspektyvų, klasėje ar auditorijose šiam tikslui ji naudojama palyginti retai.

Tekstynų revoliucija ir kalbų mokymas (2) Galima teigti, kad egzistuoja tam tikra priešprieša: iš vienos pusės tekstynų lingvistų entuziazmas iš kitos pusės mokytojų nenoras keisti tradicinius metodus. Todėl svarbu yra, kad kuo daugiau mokytojų sužinotų apie tekstynus ir jų teikiamą naudą kalbų mokymui.

Kodėl mokytojai turėtų naudoti tekstynus? Tekstynų lingvistika visai kitaip tiria kalbą, nei tradiciniai metodai; Pastebėta, kad reali vartosena dažnai skiriasi nuo tos, kuri deklaruojama preskriptyvinėse gramatikose. Tuo tarpu, tekstynai leidžia nagrinėti tikrai vartojamą kalbą; Tekstynai gali būti aktyviai naudojami kuriant mokymosi medžiagą ir net sudarant mokymosi programos pagrindą.

Panaudojimo sritys Tekstynų naudojimas kalbos mokymo procese (pvz., mokymo žodynų kūrimas); Tekstynų naudojimas kalbos pamokose (mokymas paremtas duomenimis); Specialių mokymo tekstynų naudojimas.

TL įtaka kalbų mokymui Pirmas ir reikšmingiausias pavyzdys randamas leksikografijoje. J. Sinclair iniciatyva 80-aisiais sukurtas pirmasis žodynas 20 mln. žodžių tekstyno pagrindu – Collins COBUILD English Language Dictionary (1987) Naujesnės šio žodyno versijos jau rėmėsi didesniu tekstynu (the Bank of English)

Žodyninio straipsnio pavyzdys

Collins COBUILD žodyno privalumai Duodama žodžio vartojimo dažnumo informacija; Žodis apibrėžiamas pilnu sakiniu: 1. When a dog wags its tail, it repeatedly waves its tail from side to side. [CCED] , plg.: 2. wag = to shake up and down or move from side to side [Oxford Wordpower] Pavyzdžiai yra tipiški tam žodžiui ir autentiški. Straipsniuose dažnai nurodomi tipiški tam žodžiui junginiai.

TL įtaka kalbų mokymui (2) 1990-aisiais pasirodė keletas anglų kalbos tekstynais paremtų gramatikų: Longman Grammar of Spoken and Written English (Biber et al. 1999) An Empirical Grammar of the English Verb System (Mindt 2000) Chemnitz Internet Grammar of English (http://www.tu-chemnitz.de/phil/InternetGrammar/, cf. Schmied 1999)

TL naudojimas klasėje Duomenimis grįstas mokymas Johns and King (1991) aprašė konkordavimo programomis paremtą mokymosi metodą, kurį jie pavadino: duomenimis grįstu mokymu (data-driven learning, DDL)

Duomenimis grįstas mokymas yra: paremtas konkordansų naudojimu tam, kad mokiniai geriau įsisisavintų tipiškus kalbos junginius ir modelius; konkordansais paremtų užduočių ir veiklų kūrimas ir naudojimas klasėje.

Duomenimis grįstas mokymas (2) “Kiekvienas besimokantysis naudodamasis duomenimis tampa kalbos tyrėju, arba kitaip sakant Šerloku Holmsu (Johns 2002: 108)”

1. užduoties pavyzdys: 1. Kokia kalbos dalis slepiasi po žvaigdutėmis? Koks žodis? telius su gėrimais - tas *********** ritualas. - Kas jums ke astiškas, tačiau keistai *********** judesys, tvirtai paspaud ja A. Božonienė. Įsiminė *********** vaizdelis iš mokinių par žovė... "Tai buvo ilgas, ***********, ideališkas pagal nuošir buvo emociškai paveikus, *********** spektaklis - tai baleto ė į Lietuvą buvo veikiau *********** gestas nei kraujo šauksm ingiausias ir labiausiai ***********, matyt, priklauso Audibe galioja. Iš jo lieka tik *********** pasakojimas apie darbini tylos" - kondensuotas ir *********** romanas, paverčiantis pu šen ir ten ir vis labiau *********** sukraunama, kai per kėbu rdiuren, bet jo ilgas ir *********** pasakojimas nepadarė jai Hendersonui labiausiai *********** jų romano momentas buvo, čią ant krėslo. „O, koks *********** reginys! - sušuko ponas s. Reginys - didingas ir ***********, tarsi vaikystėje regėtu nimą visam veikalui, yra *********** dialogas tarp Žmogaus ir imui. Dabar V. Ginzburgą *********** klausimas yra psichologi

1.Užduoties pavyzdys: 1. Kokia kalbos dalis slepiasi po žvaigždutėmis? Koks žodis? telius su gėrimais - tas jaudinantis ritualas. - Kas jums ke astiškas, tačiau keistai jaudinantis judesys, tvirtai paspaud ja A. Božonienė. Įsiminė jaudinantis vaizdelis iš mokinių par žovė... "Tai buvo ilgas, jaudinantis, ideališkas pagal nuošir buvo emociškai paveikus, jaudinantis spektaklis - tai baleto ė į Lietuvą buvo veikiau jaudinantis gestas nei kraujo šauksm ingiausias ir labiausiai jaudinantis, matyt, priklauso Audibe galioja. Iš jo lieka tik jaudinantis pasakojimas apie darbini tylos" - kondensuotas ir jaudinantis romanas, paverčiantis pu šen ir ten ir vis labiau jaudinantis sukraunama, kai per kėbu rdiuren, bet jo ilgas ir jaudinantis pasakojimas nepadarė jai Hendersonui labiausiai jaudinantis jų romano momentas buvo, čią ant krėslo. „O, koks jaudinantis reginys! - sušuko ponas s. Reginys - didingas ir jaudinantis, tarsi vaikystėje regėtu nimą visam veikalui, yra jaudinantis dialogas tarp Žmogaus ir imui. Dabar V. Ginzburgą jaudinantis klausimas yra psichologi

2 užduoties pavyzdys gražus, geras, patrauklus, nuostabus, aukštas, sėkmingas Pasirinkite tris būdvardžius ir paanalizuokite jų konkordansus. Kurie žodžiai dažniausiai atsiranda šalia pasirinktų būdvardžių? Ar jie yra išvardijimų dalis? Aptarkite visos klasės rezultatus.

Žanrinis metodas Analizuojant atskirų žanrų ar funkcinių stilių tekstus, studentams ar mokiniams galima parodyti kaip skirtingai juose veikia kalba. Pavyzdžiui, tų pačių žodžių analizė grožinėje literatūroje, mokslinėje literatūroje, dokumentuose ir sakytinėje kalboje.

Sėkmingo mokymo prielaidos (1) Akivaizdu, kad tokių užduočių sprendimui studentams ar mokiniams reikalingas bent jau pradinis suvokimas apie tekstynų lingvistiką ir pagrindines jos priemones. Mokiniai turėtų žinoti Kas yra tekstynas? Ką galima sužinoti tekstyne ir ko ne? Kaip reikėtų analizuoti konkordansus? Kaip tekstynų duomenyse atsispindi kalbos vartosenos tendencijos?

Sėkmingo mokymo prielaidos (2) Mokiniai turi taip pat turėti galimybę: Dirbti prie kompiuterių; Turėti prieigą prie tekstyno ar tekstynų; Turėti programinę įrangą, kuri leistų analizuoti tekstynus; Turėti internetinę prieigą prie internete prieinamų tekstynų.

Besimokančiųjų kalbos tekstynai (Learner corpora) Mokytojai galėtų susidaryti besimokančiųjų kalbos tekstynus. Kurių analizė leistų: sužinoti tipiškas mokinių daromas klaidas; efektyviau pritaikyti mokymosi medžiagą; parodyti mokiniams jų daromas klaidas. Tokie tekstynai galėtų būti naudojami tiek mokytojų, tiek ir mokinių.

BT analizės pavyzdys Pavyzdžiui, Lorenz (1999) analizavo būdvardžių vartoseną besimokančiųjų tekstyne. Ir nustatė: Per daug vartojamas formas: really big, really important Per mažai vartojamas formas: particularly difficult Neteisingai vartojamas formas: absolutely silly Savos kūrybos formas: a too complex problem

Dažninių charakteristikų naudojimas mokantis užsienio kalbos žodyno Analizuojant bendrojo pobūdžio dabartinės kalbos tekstyną, galima lengvai nustatyti kiek ir kuriuos žodžius gimtakalbiai naudoja kasdieninėje veikloje (O’Keeffe ir kt. (2007)).

Dažniausių žodžių formų užimama teksto dalis 10 mln Dažniausių žodžių formų užimama teksto dalis 10 mln. žodžių tekstyne (anglų k.)

Dažniausių žodžių formų užimama teksto dalis 60 mln Dažniausių žodžių formų užimama teksto dalis 60 mln. žodžių tekstyne (lietuvių k.)

Dažniausių lemų užimama teksto dalis 1 mln. žodžių tekstyne (liet. k.)

50 dažniausių žodžių (lemų) 1 mln. žodžių tekstyne – sudaro 23% teksto ir jng 28174 2 jis įv 18117 3 būti vksm 17128 4 tas 8819 5 į prl 8369 6 kad 7487 7 aš 6522 8 kuris 5831 9 su 5533 10 šis 5309 11 galėti 5181 12 iš 5015 13 o 4816 14 dll 4539 15 darbas dkt 4243 16 kitas 3923 17 kaip 3868 18 turėti 3863 19 visas 3797 20 žmogus 3647 21 Lietuva tikr. dkt 3394 22 kas 3204 23 ar 3148 24 savo 3127 25 nuo 2878 26 toks įv 2844 27 bet jng 2810 28 ne dll 2791 29 apie prl 2759 30 tik prv 2698 31 labai 2546 32 jau 2501 33 metai dkt 2469 34 dar 2451 35 daug 2179 36 tu 2169 37 už 2102 38 bei 2079 39 arba 2061 40 laikas 2056 41 kai 2048 42 pats 2040 43 reikėti vksm 2015 44 po 1993 45 nebūti 1975 46 dėl 1802 47 čia 1794 48 per 1774 49 taip 1764 50 prie 1757

Literatūra Johns, T. ir P. King (eds.) (1991): Classroom Concordancing. Birmingham: University of Birmingham. O’Keeffe, A., M. McCarthy, ir Carter R. (2007) From Corpus to Classroom. Cambridge: CUP. Lorenz, G. (1999): Adjective Intensification - Learners versus Native Speakers: A Corpus Study of Argumentative Writing. Amsterdam: Rodopi.

IV dalis Praktinės užduotys

1 užduotis. Konkordansų analizė Paanalizuokite žodžio formos santūrus kontekstą. Ką žodžio santūrus kontekstas pasako apie žodžio reikšmę?

Kas gali būti santūrus? Kokie dar būdvardžiai naudojami kartu su žodžiu santūrus? Apibendrinta žodžio santūrus reikšmė

2 užduotis. Paieška Dabartinės lietuvių kalbos tekstyne 2.1. Sudarykite šių žodžių visų formų konkordansus: dzin, kraikas, kraigas. Kokie dažniausi su šiais žodžiais sudaromi junginiai? Kokiose tekstyno dalyse šie žodžiai yra dažniau vartojami? 2.2. Koks lietuvių autorius daugiausia rašė apie Šambalą?

3 užduotis. Specialaus tekstyno sudarymas ir jo analizė Sudarykite 10 tūkst. žodžių tam tikros temos tekstyną (pvz., politikos, pasakų, tam tikro autoriaus); Parsisiųskite AntConc programą; Sudarykite dažninį sąrašą; Sudarykite dažniausios daiktavardžio formos konkordansą; Surūšiuokite konkordansą pagal kairįjį arba dešinįjį žodį.