Presentation is loading. Please wait.

Presentation is loading. Please wait.

கணினிவழித் தமிழ்மொழியாய்வில் பொருள்மயக்கம்

Similar presentations


Presentation on theme: "கணினிவழித் தமிழ்மொழியாய்வில் பொருள்மயக்கம்"— Presentation transcript:

1 கணினிவழித் தமிழ்மொழியாய்வில் பொருள்மயக்கம்
Ambiguities in Computer Assisted Tamil Language Processing இல. சுந்தரம் M.A(Tamil)., M.Sc(I.T)., MCA., M.Phil(Tamil)., MBA., (Ph.D) துணைப்பேராசிரியர் ஒருங்கிணைப்பாளர், கணினித்தமிழ்க் கல்வி தமிழ்ப்பேராயம் SRM பல்கலைக்கழகம், செல்பேசி :

2 உள்ளடக்கம் முன்னுரை இயற்கைமொழியாய்வு; கணினிமொழியியல்; மொழித்தொழில்நுட்பம்: பொருள்மயக்கம் - விளக்கம் பொருள்மயக்கம் ஏற்படுவதற்கான நிலைப்பாடுகள் 1. தனிச்சொற்கள் 2. தொடரமைப்பு நிலை 3. சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகிற முறை உருபனியலும் பொருள்மயக்கமும் மொழியியல் வகைப்பாட்டில் பொருள்மயக்கம் பொருள்மயக்கத்தைத் தவிர்ப்பதற்குரிய பொதுவான சில வழிமுறைகள் நிறைவாக

3 முன்னுரை கணினியில் தமிழ்மொழியின் பயன்பாடு பெருகியுள்ளது. தமிழ்மொழியின் வளர்ச்சிக்குக் கணினியின் பங்களிப்பு தவிர்க்கமுடியாத ஒன்றாகிவிட்டது. மொழி ஆய்வுக் கருவியாகக் கணினியைப் பயன்படுத்திவருகிற நிலையில் தமிழ்மொழித் தரவுகளை அதற்கு ஓர் ஒழுங்கமைவுடன் கற்றுத்தரவேண்டியுள்ளது. அதாவது கணித அடிப்படையில் மொழியில் உள்ள மொழியியல் கூறுகளைக் கணினிக்கு ஏற்ற வகையில் மாற்றித்தரவேண்டியுள்ளது. இத்தகைய வழிமுறைகளைக் கொடுப்பதே கணினி மொழியியல். மொழி செயல்படுவதில் உள்ள ஒழுங்குமுறையின் தொகுப்புதான் இலக்கணம். இத்தகைய ஒழுங்குமுறை நவீன, தொழில்நுட்ப வளர்ச்சிகளினாலும் மொழி உலகமயமாக்கச் சூழலினாலும் சிதைந்தும் மாறுபட்டும் வருகிறது. மொழியை இத்தகைய சிதைவுகளிலிருந்து மீட்டெடுக்க மொழியியல் கூறுகளை முறையாகக் கற்று, பயன்படுத்தவேண்டிய கட்டாயம் ஏற்பட்டுள்ளது.

4 நோக்கம் பொருள்மயக்கம் தமிழ்மொழிப் பயன்பாட்டில் உருவாக்குகின்ற நிலைப்பாடுகள். கணினிவழி ஆய்வு செய்யும்போது ஏற்படுகிற மொழியமைப்புச் சிக்கல்கள். அவற்றைத் தவிர்ப்பதற்கான வழிமுறைகள். மொழியியல் கூறும் வகைப்பாட்டு நெறிமுறைகளையும் எடுத்துக்கூறுவதாக இக் கட்டுரை அமைகிறது.

5 இயற்கைமொழியாய்வு; கணினிமொழியியல்; மொழித்தொழில்நுட்பம்:
தமிழ்மொழியின் இயல்புகளைத் தெளிவாக அறிந்துகொள்ள ஒலியனியல், உருபனியல், தொடரியல் மற்றும் பொருண்மையியல் போன்ற மொழியியல் அறிவு இன்றியமையாதன. மனித மூளையைப் போன்று கணினியையும் இயற்கைமொழி அறிவைப் பெறவைத்து, மொழித் தொடர்களைப் புரிந்துகொள்ளவும், உருவாக்கவும், செய்யவைக்கும் முயற்சியே இயற்கை மொழியாய்வு(Natural Language Processing). இத்தகைய இயற்கைமொழியாய்வை மேற்கொள்ள உருவாக்கப்படுகிற வழிமுறைகளும் முறைப்படுத்தலுமே கணினி மொழியியல் (Computational Linguistics). கணினிமொழியியலின் துணையோடு மொழிக்குத் தேவையான மின்னணு மொழிக் கருவிகளை உருவாக்க உதவும் நுட்பமே மொழித்தொழில்நுட்பம்(Language Technology). இவை மூன்றும்தான் தமிழ் மென்பொருள்களை உருவாக்குவதற்கு மேற்கொள்ளப்படுகிற படிமுறை வளர்ச்சிப் பணிகள்.

6 கணினித்தமிழ் வளர்ச்சி என்பது தமிழ்த் தொடர்களைப் புரிந்துகொள்ளவும்(Understanding), அவற்றை உருவாக்கவும்(Generate) தேவையான தமிழ்மொழி அறிவைக் கணினிக்கு அளிப்பதற்காக நாம் மேற்கொள்ளவேண்டிய பணிகளைக் குறிக்கிறது. தமிழ்த் தரவுகளைக் கணினி புரிந்துகொள்ளும் வகையில் கொடுப்பதற்கு மொழியியல் விதிகளும் கோட்பாடுகளும் துணைபுரிகின்றன. கணினிமொழியியல் கோட்பாடுகளைக்கொண்டு மொழியின் அமைப்பை, இலக்கணத்தைக் கணினிக்கேற்ற வகையில் நிரலிகளாக(Programs), மின்னணு இலக்கணமாக மாற்றிக் கொடுத்து, தமிழ்மொழியின் தேவையை நிறைவுசெய்ய வேண்டும். இவ்வாறு தமிழ்மொழியின் அமைப்பை ஒழுங்கமைவுடன், விதிகளாக மாற்றும்போது தமிழ்மொழியின் தற்கால எழுத்து வழக்கில் பல்வேறு முறைகள் பயன்படுத்தப்படுவதால் சொற்களைப் பிரிக்கும்போதும்(Parsing) வரிசைப்படுத்தும்போதும்(Sorting) பல்வேறு மொழிப் பயன்பாட்டுச் சிக்கல்கள் எழுகின்றன. இத்தகைய மொழிப் பயன்பாட்டுச் சிக்கல்களில் ஒன்றுதான் பொருள்மயக்கம்(Word Sense Ambiguity).

7 பொருள் மயக்கம் - விளக்கம்
‘Word Sense Ambiguity’ என்னும் ஆங்கிலச் சொல் தமிழில் தெளிவின்மை, குழப்பம், கருத்துமயக்கம், பொருள்மயக்கம், இருபொருள்படுநிலை, தெளிவற்ற நிலை எனப் பல்வேறு நிலைகளில் பொருள்கொள்ளப்படுகின்றது. எனினும், கணினிமொழியியலில் பொருள்மயக்கம் என்றே கையாளப்படுகின்றது. பொருள் மயக்கங்களைக் களைவதைக் கணினிமொழியியலில் ‘Word Sense Disambiguation(WSD)’ என்று கூறுவர். ஒரு தொடர் தன் அமைப்பில் வெளித்தோற்றத்திலும் உள்தோற்றத்திலும் வெவ்வேறு பொருள்தருகிறது. இத்தகைய பொருண்மை மாறுபாடு ஏற்படுவதற்குரிய சில சொற்களும் சில சூழ்நிலைகளும் இங்கு நோக்கப்படுகின்றன. தமிழ் மரபிலக்கணத்தில் ஒருசொல் குறித்த பல பொருள், பல பொருள் குறித்த ஒருசொல் என்ற வகைப்பாடும் காணப்படுகிறது. அகராதி நிலையில் ஒரு சொல்லுக்குப் பல பொருள்கள் இருக்கலாம். ஆனால், இவற்றிலிருந்து பொருள் மயக்கம் என்பது மாறுபட்டது.  

8 கணினி மொழியியல் - பொருள்மயக்கம்
சந்திப் பிழைதிருத்தி(Sandhi Checker) உருபனியல் பகுப்பாய்வி(Morphological Parser) தொடரியல் பகுப்பாய்வி(Syntactic Parser) அடைவி(Indexing)(சொல்லடைவு, தொடரடைவு, பொருளடைவு) தானியங்கி பேச்சு அறிவான்(Automatic Speech Recognizer-ASR) இயந்திர மொழிபெயர்ப்பு(Machine Translation) ஆகிய மொழியாய்வு மென்பொருள் கருவிகளை உருவாக்குவதில் இத்தகைய பொருள் மயக்கம் இடையூறாக அமைகின்றன. இவற்றைச் சரிசெய்ய, பொருள் மயக்கச் சொல்லகராதியை உருவாக்கவேண்டியது அவசியம்.

9 பொருள் மயக்கம் ஏற்படுவதற்கான நிலைப்பாடுகள்
தமிழ்மொழித் தரவுகள் உலகளாவிய பொதுமொழியின் தன்மைகளைக் கொண்டிருப்பதோடு தமக்கெனச் சில தனித்தன்மைகளைக் கொண்டிருக்கின்றன. வழக்கிழந்த கூறுகளும் புத்தாக்கங்களும் தமிழில் காலங்காலமாக நிகழ்ந்துகொண்டுள்ளன. சாதி, தொழில், வட்டாரம் போன்றவை சார்ந்த வழக்குகளும், துறைசார்ந்த வழக்குகளும் பேச்சு, எழுத்து என்னும் நிலைப்பாடுகளும் தமிழ்மொழித் தரவினைக் கணினியின் ஏற்புத்திறனுக்கு ஏற்றாற்போல் ஒருமைப்படுத்துவதற்கும் பொதுவிதிகளை உருவாக்குவதற்கும் இடையூறுகளாக அமைகின்றன. சொற்களின் இலக்கண வகைப்பாட்டை நாம் நுண்மையான இலக்கண அறிவு(Grammatical Knowledge) மற்றும் உலகியல் அறிவின்(Pragmatic Knowledge) துணையோடு அறிகிறோம். ஆனால் அவற்றைக் கணினிக்குக் கற்றுத்தருவதில் பல்வேறு மொழியமைப்புச் சிக்கல்கள் எழுகின்றன. இவற்றைச் சரிசெய்வதற்கு உருபனியல், தொடரியல் பகுப்பாய்வுகள் துணைபுரிகின்றன. ஒரு தொடரில் ஒன்றுக்கு மேற்பட்ட அமைப்புகள் காணப்படலாம். அதாவது குறிப்பிட்ட தொடரில் இடம்பெறும் சொற்கள் தங்களுக்குள் வெவ்வேறு வகையில் இணையலாம். அப்போது பொருள்மயக்கம் ஏற்படுகிறது.

10 1 2 3 பொருள் மயக்கம் - Word Sense Ambiguity தனிச்சொற்கள்
வாக்கிய அமைப்பு 2 For reproduction steps for this slide, refer to the PowerPoint template titled “Combined picture and text effects for PowerPoint slides” (ANI_TEXT.potx), slide number 8. சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகிற முறை 3

11 ஆங்கிலத்தில் ஒலிபெயர்த்து(Transliterate) எழுதும்போது முறைப்படுத்தப்பட்ட ஒலிக்குறிப்பு எழுத்துக்களைப் பயன்படுத்தவேண்டும். ஆனால் குறில், நெடில், ல,ழ,ள, ற,ர போன்ற எழுத்துக்கள் வேறுபாடுகளின்றிப் பயன்படுத்தப்படுவதால் பொருள் குழப்பமும் அவற்றை உச்சரிக்கும்போது தெளிவில்லாத சூழ்நிலையும் காணப்படுகிறது. எடுத்துக்காட்டாக, பாடம் என்று எழுதுவதைப் ‘Padam’ என்று எழுதினால் படம் என்று படிப்பதற்கும் வாய்ப்பிருக்கிறது. எனவே மக்களின் பெயர், ஊர்ப்பெயர், முகவரி, பொருள்களின் பெயர் போன்றவற்றைத் தவறாக உச்சரிக்கிற நிலை ஏற்படுகிறது. எனவே, இவற்றை ஓர் ஒழுங்குமுறைக்குக் கொண்டுவரவேண்டும். பொருள் வேறுபாட்டிற்கு வேற்றுமை உருபுகளும், சந்தி மாற்றங்களும், ல,ழ,ள, ற,ர வேறுபாடுகளும் முக்கியப் பங்காற்றுகின்றன. மேலும் சாரியைகள், இரட்டித்தல் போன்றவையும் துணைசெய்கின்றன. பாடல்களைப் படிக்கும்போது எளிமையாகப் புரிந்துகொள்ளவேண்டுமென்னும் நோக்கில் சொற்களைப் பிரிப்பதாலும் உரைநடை எழுதும்போது பொருள் மயங்குவது தெரியாமல் சொற்களைப் பிரிப்பதாலும் பொருள் மயங்குகிறது. பொருள் மயக்கம் ஏற்படாதவாறு பிரிக்கவேண்டும் என்பதைக் கவனத்தில்கொள்ளவேண்டியது அவசியம். பொருள் உணரும் திறன் குறைந்த இக் காலத்தில் பாடல்களில் எல்லாச் சொற்களையும் பிரித்தே எழுதுதல் வேண்டும், எளிமைப்படுத்தவேண்டும், சாதாரணப் பேச்சுவழக்கில் இருக்கவேண்டும் என்பது போன்ற தன்மைகள் கடைபிடிக்கப்படுகின்றன. மேலும், எழுத்துநடையில் மற்றவர்களிடமிருந்து தங்களை வேறுபடுத்தவேண்டும் என்பதற்காகவும் இத்தகைய நிலை இருக்கின்றது.

12 1. தனிச்சொற்கள் தமிழில் தனித்த சில சொற்களைத் தொடர்களில் பயன்படுத்தும்போது அவை தோற்றத்தில் ஒன்றுபோலவும் பொருளில் இருவேறு நிலைகளிலும் காணப்படுகின்றது. நான் வேலை வாங்கினேன். வேலையைக்(Work) குறிக்கிறதா? ‘வேல்’ என்னும் ஆயுதத்தைக் குறிக்கிறதா? தொடர் நிலையில் அதற்கு அடுத்து அல்லது அதற்கு முன் அமைந்த சொல்லை வைத்தே, இந்தச் சொல் இதைத்தான் குறிக்கிறது என்று அறியமுடிகிறது. அவரை - அவர் + ஐ அவரைச் செடி வருட - வருடம் தலையை வருட காலை - கால் + ஐ காலைப்பொழுது சொத்தை - சொத்து சொத்தைக் காய்கறி காதை - காது + ஐ காதை - அடைக்கலக்காதை கூட்டை - கூடு + ஐ கூட்டை - சாப்பாட்டு வகை பாத்திரம் - கதாப்பாத்திரம் சமையல்பாத்திரம் ஆறு - ஆறு(River) எண்(Number) எண்ண - எண்ணம்(Thinking) எண்ண(Counting) ஓட்டை - ஓடு + ஐ = ஓட்டை ஓட்டை(Vote) ஓட்டை(hole)

13 காது + ஐ = காதை => காது + இன் + ஐ = காதினை.
மேற்குறித்த சில சொற்களுடன் இரண்டாம் வேற்றுமை உருபு வந்துள்ளதா அல்லது தனிச்சொல்தானா என்ற குழப்பமே இந்தப் பொருள்மயக்கத்திற்குரிய காரணமாகும். இத்தகைய குழப்பமின்றி வேறுபடுத்துவதற்குச் சில இடங்களில் ‘இன்’ சாரியை பயன்படுத்தப்படுகிறது. காது + ஐ = காதை => காது + இன் + ஐ = காதினை. காடு + ஐ = காடை => காடு + ட்(இன்) + ஐ = காட்டை, காட்டினை.

14 2. தொடரமைப்பு நிலை ஒரு தொடர் அமைப்பில் எல்லாச் சொற்களும் சரியான பொருளையே தந்துநின்றாலும் அவை பொருள்கொள்ளும் முறையில் மயக்கம் ஏற்படுகின்றன. 'முட்டாள் குமரனின் மனைவி' என்னும் வாக்கியத்தில் முட்டாள் என்பது குமரனுக்குப் பெயரடையாக வருகிறதா? அல்லது அவன் மனைவிக்குப் பெயரடையாக வருகிறதா? இத்தகைய நிலையில் வேற்றுமை உருபு மறைந்து வருவதாலும் முட்டாள் என்பதற்கு அடுத்து, காற்புள்ளி இட்டு எழுதாததாலும் இத்தகைய குழப்பம் ஏற்படுகிறது. இதனை அமைப்புப் பொருள்மயக்கம்(Structural Ambiguity) என்று மொழியியல் அறிஞர்கள் கூறுவர். தொடரின் புறநிலையிலும் அகநிலையிலும் மாறுபடாமல் குழப்பமின்றி இருந்தாலும் அவை எடுத்துக்கொள்ளும் முறையிலும் சூழல் தரும் பொருளிலும் வேறுபடுகின்றன.

15 3. சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகிற முறை
தமிழில் வேர்ச்சொல்லுடன் பல்வேறுபட்ட ஒட்டுகள் இணைகின்றன. அவ்வாறு இணையும்போது அவற்றுக்குள்ளேயே ஓர் இயைபு விதி உருவாகின்றது. இவ்வாறு சொற்களுடன் ஒட்டுகளை இணைக்கும்போது சொற்களைப் பிரித்தும் சேர்த்தும் எழுதுகின்ற வழக்கம் காணப்படுகின்றது. தமிழில் மொழியியல் விதிப்படி தனித்து நின்று பொருள்தராத துணைவினைகள்(Auxiliary Verb), ஒட்டுகள்(Affixes) மிதவை ஒட்டு(Clitic) போன்றவற்றைப் பிரித்து எழுதக்கூடாது என்பதை மீறுவது பொருள் மயக்கத்திற்கு முக்கியக் காரணமாகும். பொதுவாக ஒரு சொல்லைப் பிரித்தோ சேர்த்தோ எழுதும்போது கூறவந்த கருத்தின் அடிப்படையே மாறுகின்ற நிலை ஏற்படுகிறது. அவனுடனே - with him அவன் உடனே - he at once அவர்கள் படித்துவிட்டுச் சென்றனர். அவர்கள் படித்து விட்டுச் சென்றனர். எனவே மிகக் கவனத்தோடு இடமறிந்து பொருள்மயக்கம் ஏற்படாதவாறு சேர்த்தோ பிரித்தோ எழுதவேண்டும். பல்கலைக்கழகம், தொழில்நுட்பம் போன்ற சில கலைச்சொற்களையும் பிரித்து எழுதுதல் கூடாது. இதுபோல மொழிப் பயன்பாட்டு விதிகளை முறையாகப் பயன்படுத்தினால் கணினிவழி மொழியாய்வுக்கும் பொருள் மயக்கமின்றி வாசிப்பதற்கும் பயன்தரும்.

16 துணைவினைகள் விடு - வந்துவிடு, போய்விடு, படித்துவிடு, தூங்கிவிடு. படு - பாடுபடு, வேதனைப்படு, ஆசைப்படு. இரு - பார்த்துக்கொண்டிரு, படித்துக்கொண்டிரு. இடு - சேர்த்திடு, காட்டிடு, பார்த்திடு. கொண்டு - தெரிந்துகொண்டு, பார்த்துக்கொண்டிரு. கொள்ள - பார்த்துக்கொள்ள, பேசிக்கொள்ள, அறிந்துகொள்ள. விட்டு, விட்டது - பார்த்துவிட்டு, பேசிவிட்டு, பார்த்துவிட்டது, போய்விட்டது. பட்டு, பட்டது - அறியப்பட்டு, விளக்கப்பட்டு, கூறப்பட்டது, சேர்க்கப்பட்டது. வேண்டும் - பார்க்கவேண்டும், செல்லவேண்டும், எழுதவேண்டும். உள்ளது - தெரியவந்துள்ளது, பாடப்பட்டுள்ளது. கொள், உண், ஆம், போடு, வரு, தரு, உள் இதுபோன்ற ஐம்பதுக்கும் மேற்பட்ட துணைவினைகள் எழுத்து வழக்கிலும் பேச்சு வழக்கிலும் காணப்படுகின்றன. ஒரு தொடரில் ஒன்றுக்கு மேற்பட்ட துணைவினைகளும் இணைந்து வரும்.

17 மிதவை ஒட்டு தான் - அதைத்தான், அவன்தான், அப்போதுதான், அதனால்தான். பின்னொட்டு கீழ், மேல் - துறையின்கீழ், தலைமேல். வழி - கணினிவழி, அதன்வழி. விட - அவனைவிட, பேசியதைவிட. வினை விகுதி போது - சொன்னபோது, பார்த்தபோது. படி - அதன்படி, சொன்னபடி. பொதுநிலை கண் - அதன்கண். காலம் - இடைக்காலம், சங்ககாலம். வர - சென்றுவர, நடந்துவர.

18 மொழியியல் வகைப்பாட்டில் பொருள்மயக்கம்
ஒலியனியல்(Phonology) உருபனியல்(Morphology) தொடரியல்(Syntax) சொற்பொருண்மையியல்(Semantics) கருத்தாடல்(Discourse) 1. ஒலியனியல்(சந்தி) ‘வேலை செய்தான்’, ‘வேலைச் செய்தான்’ 1. ‘வேலை’ - பணி 2. ‘வேலை’ - கருவி 2. உருபனியல் ‘நான் கத்தி விற்றேன்’ கத்தி பெயரா? வினையா?

19 3. தொடரியல் ‘நான் இராமனோடு சீதையைப் பார்த்தேன்’ நானும் இராமனும் சீதையைப் பார்த்தோம் நான் இராமனும் சீதையும் சேர்ந்திருக்கும்போது பார்த்தேன். 4. சொற்பொருண்மை ‘பச்சைக் காய்கறி’, ‘பச்சைப் பொய்’, ‘பச்சை உடம்பு’ பச்சை என்ற சொல் மூன்று வேறுபட்ட பொருள்களைக் குறித்து நிற்கிறது. மூன்றில் எந்தப் பொருளை எடுத்துக்கொள்வது என்பது அதன் அடுத்த சொல்லைப் பொறுத்தது. 5. கருத்தாடல் இந் நிலையில், ஏற்படுகிற பொருள் மயக்கத்தைக் கணினிக்குக் கற்றுத்தரமுடியாது. அவற்றை உலகியல் அறிவின்(Pragmatic Knowledge) வாயிலாகவே உணர முடியும். மேற்குறித்த பொருள் மயக்கங்களைத் தீர்த்துவைக்கக்கூடிய அறிவை - வழிமுறைகளை எவ்வாறு கணினிக்கு அளிப்பது குறித்து, பல்வேறு நிலைகளில் ஆராயப்பெறுகின்றன.

20 உருபனியலும் பொருள்மயக்கமும்
ஒரு சொல் ஓர் உருபன் கொண்டதாகவோ அல்லது அதற்கு மேற்பட்ட உருபன்களாகவோ இருக்கலாம். பல்வேறு உருபன்களால் உருவான சொற்களைக் கணினிவழிப் பகுப்பாய்வு செய்வது ‘உருபனியல் பகுப்பாய்வு’. இதற்காக உருபனியல் பகுப்பாய்விகள்(Morphological Parsers) உருவாக்கப்பட்டுவருகின்றன. இவ்வாறு உருவாக்கும்போது பொருள்மயக்கச் சொற்களின் சிக்கல்கள் நோக்கத்தக்கதாக உள்ளன. இயந்திர மொழிபெயர்ப்பில்(Machine Translation) கணினிமொழியியல் விதியான இருநிலை உருபனியல்(Two Level Morphology) என்ற மொழித்தன்மைகுறித்து ஆராய்வர். ஒரு தொடரில் அடிநிலை(Deep Structure), புறநிலை(Surface Structure) ஆகிய இரண்டும் காணப்படும். இவற்றுள் புறநிலையில் எந்தவித மாறுபாடும் ஏற்படுவதில்லை. ஆனால், பொருள் மயக்கச் சொற்கள் வரும்போது அகநிலையில் குழப்பம் ஏற்படுகிறது. தமிழில் காணப்படும் தொடர்களில் வேர்ச்சொற்கள் தனித்தும் விகுதிகளேற்றும் காணப்படுகின்றன.

21 தனித்த சொற்களைக் கண்டறிவதற்கு அகராதிகளைப் பயன்படுத்தலாம்.
மற்றவற்றை உள்ளீடு செய்து ஆய்வுசெய்தே பகுத்தறிய முடியும். வேர்ச்சொற்களையும் ஒட்டுகளையும் பகுத்து, பொருள் மயக்கமின்றி வகைப்படுத்துவதற்கு உருபனியல் பகுப்பாய்வு அவசியமாகிறது.

22 பொருள் மயக்கத்தைத் தவிர்ப்பதற்குரிய பொதுவான சில வழிமுறைகள்
கணினிவழித் தமிழ்த் தொடர்களை ஆய்வு செய்யும்போது ஏற்படுகிற பொருள் மயக்கத்தை நீக்கிப் பொருளைத் தெளிவாகப் புரிந்துகொள்வதற்கு உருபொலியனியல் மாற்றங்கள் துணைபுரிகின்றன. பொருள் மயக்கத்தை இலக்கண வகைப்பாட்டின் வாயிலாகவே தெளிவுபடுத்த முடியும். பெயர், வினை அடிப்படையில் உருவாகும் சொற்களாக உருபனியல், தொடரியல் பகுப்பாய்வுகளைக் கொண்டு அடிச்சொல், விகுதிகள் ஆகியவற்றைப் பகுத்துத்தான் இவற்றைச் சரிசெய்ய முடியும். ‘அவன் நெய்தான் விற்றான்’ 1. அவன் நெய்யைத்தான்(நெய்+தான்) விற்றான் என்று வேற்றுமை மறைந்துநின்று பொருள்தருகிறதா? 2. அவன் துணியை நெய்தான் (நெய்+த்+த்+ஆன்) பிறகு விற்றான் என்ற பொருள்படுகிறதா? இத்தகைய நிலையில் தொடரியல் ஆய்வின் அடிப்படையிலேயே தெளிவுபெற முடியும்.

23 அடிச்சொல்லால் ஏற்படுகிற பொருள்மயக்கத்தை விகுதிகளைக்கொண்டு தெளிவுபெறலாம். விகுதிகளால் ஏற்படுகிற பொருள்மயக்கத்திற்கு அடிச்சொல்லைக்கொண்டு தெளிவுபெறலாம். ‘படித்தான்’ படி பெயர் - படிதான் வினை - படித்தான் அடிச்சொல் வாயிலாகப் பெறமுடிகிறது. ‘ஆல்’ என்னும் விகுதி ‘அவனால் நான் வந்தேன்’ பெயருக்குப் பின் வந்ததால் வேற்றுமை விகுதி ‘வந்தால் நான் வருவேன்’ வினைக்குப் பிறகு வந்ததால் நிபந்தனை விகுதி ‘இரு’ என்ற சொல் இருவேறு பொருள்தருகின்றன. அவற்றை இடப்பொருள் அடிப்படையிலேயே சேர்த்தோ பிரித்தோ எழுதமுடியும். விட்டிசைப்பிற்காகவும், வகைப்படுத்துவதற்காகவும், பொருள் தெளிவிற்காகவும் காற்புள்ளி ‘,’ இட்டு எழுதுவது கட்டாயமாகிறது. இதுபோன்ற பல்வேறு மொழிப் பயன்பாட்டு நெறிகள் தமிழ்மொழி இலக்கணங்களிலும் மொழியியல் விதிகளிலும் காணக்கிடைக்கின்றன.

24 பொருள்மயகச் சொற்பட்டியல்
அணை Dam, Putout, Embrace ஆசியா Asia, blessings – Interrogative ஆடு To dance, goat இணை To join, pair இணைய To join, Internet உரை Cover, to express, Speech எண்ண To Think, thought ஓட்டை Hole, tile-Acc, vote-Acc கட்டு Bandage, to build கட்டை A piece of tree, bunch of materials கல் Stone, read கழி To Subtract, Pass, Stick காடை Forest-Acc, A kind of bird காதலி Lady love, to love காதை Story, Ear-Acc காலை Morning, Leg-Acc கூடை Nest-Acc, Basket கோட்டை Fort, Line-Acc கோப்பை File-Acc,Cup சாரம் Essence, Scaffolding சுடு To shoot, to heat செல்ல Dear, to go சேர் Join. collect, hand over, add தட்டை Plate-Acc, eatable துணி Dare, cloth தேரை Temple car-Acc, tree frog தொகை Compound, Amount நாணயம் Coin, Honesty நிரைய More, to fill நூல் Thread, Book நெய்தான் Wove cloth- He, it is ghee நெல்லை Nellai town, Paddy-Acc படி To Read, step, Allowance ,To measure பட்டை Silk-Acc, band பயணி To travel, passenger பாத்திரம் Character, vessel பாலை Milk-Acc, it is a place பால் Gender, Milk போலியோ Polio, is it Duplicate மணம் Smell, marriage மலை Mountain, be wonder மனை Plot, small chair மொட்டை Bud-Acc, Shaver or hairless state of head. வரவால் Income-Ins ,due to his presence வருகையில் Arrival, on the time of his arrival வருட Year, stroke gently விசிறி Fan, Fan to Actor வித்தை Seed-Acc, feat விந்தை Sperm-Acc, wonder வில்லை Bow-Acc, Coin

25 நிறைவாக… பொருள்மயக்கத்திற்கான அடைப்படைக் காரணங்கள்
பொருள்மயக்கம் ஏற்படுவதற்குரிய நிலைப்பாடுகளை அமைப்பு நிலையில் மூன்றாகப் பகுத்தும் மொழியியல் வகைப்பாட்டிலும் தகுந்த எடுத்துக்காட்டுகளுடன் ஆராயப்பெற்றன. பொருள்மயக்கத்தைத் தவிர்ப்பதற்குரிய பொதுவான சில வழிமுறைகள், கணினிவழித் தமிழாய்வு செய்யும்போது ஏற்படுகிற சிக்கல்களும் ஒரு தொடரை எழுதும்போது பெயர், வினை, துணைவினை போன்ற அடிப்படை வேறுபாடுகளை அறிந்து, பயன்படுத்தினால் பல்வேறு மொழிப் பயன்பாட்டுச் சிக்கல்கள் சரிசெய்யப்படும். அனைவரும் ஒரேவிதமான மொழிப் பயன்பாட்டுக்கொள்கையைப் பயன்படுத்துவதன்வழி, கணினிவழி மொழியாய்வு செய்வதற்கு எளிமையாக இருக்கும். இதுபோன்ற பல்வேறு மொழியமைப்புக் கூறுகளை முறைப்படுத்தவேண்டிய கட்டாயம் ஏற்பட்டுள்ளது என்பதை இக் கட்டுரை சுட்டிக்காட்டுகிறது.

26 துணைநூற்பட்டியல்… முனைவர் ச. அகத்தியலிங்கம், தமிழ்மொழி அமைப்பியல், மெய்யப்பன் தமிழாய்வகம், சிதம்பரம். டாக்டர் பொற்கோ, (2006), இக்காலத் தமிழ் இலக்கணம், பூம்பொழில் வெளியீடு, சென்னை. எம்.ஏ. நுஃமான், (2007), அடிப்படைத் தமிழ் இலக்கணம், அடையாளம், திருச்சி. பேரா. கலாநிதி அ. சண்முகதாஸ், (2008), தமிழ்மொழி இலக்கண இயல்புகள், நியூ செஞ்சுரி புக்ஹவுஸ். முனைவர் செ. வை. சண்முகம், (2004), தொல்காப்பியத் தொடரியல், உலகத்தமிழாராய்ச்சி நிறுவனம். முனைவர் அ. தாமோதரன், துணைவினைகள், ஆய்வுக் கட்டுரை. தமிழ் இணையம் 2010, மாநாட்டுக் கட்டுரைகள். Dr. M. Suseela, (2001), A Historical Study of Old Tamil Syntax, Tamil University. Thomas Lehman, (1993), A Grammar of Modern Tamil, Pondichery Institute of Linguistics and Culture.

27 நன்றி…

28 தெளிவிற்காக… சில ?


Download ppt "கணினிவழித் தமிழ்மொழியாய்வில் பொருள்மயக்கம்"

Similar presentations


Ads by Google