Download presentation
Presentation is loading. Please wait.
Published byImogen West Modified over 6 years ago
1
संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit Girish Nath Jha Associate Professor, Computational Linguistics Special Center for Sanskrit Studies, J.N.U., New Delhi – Mukesh and Priti Chatter Distinguished Professor of History of Science, University of Massachusetts Dartmouth, USA 9/19/2018
2
१) संगणकीय भाषाविज्ञान क्या है ?
Special Centre for Sanskrit Studies, J.N.U., New Delhi १) संगणकीय भाषाविज्ञान क्या है ? मानव भाषा का संगणक द्वारा विश्लेषण और ज्ञान निरूपण 9/19/2018
3
संगणकीय भाषाविज्ञान के उपविषय
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान के उपविषय वक्तृ अभिज्ञान (Speaker Recognition) वाणी अभिज्ञान (Speech Recognition) प्राकृतिक भाषा अंतर्मुख (Natural Language Interface) प्राकृतिक भाषा विश्लेषण(Natural Language Analysis/Understanding) प्राकृतिक भाषा प्रजनन (Natural Language Generation) मशीन अनुवाद (Machine Translation) वाणी प्रजनन (Speech synthesis) 9/19/2018
4
संगणकीय भाषाविज्ञान की दो विधियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018
5
पाणिनि व्याकरण की उपयोगिता
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि व्याकरण की उपयोगिता सांख्यिकीय विधि संभवतः इसलिये महत्त्वपूर्ण होती जा रही है कि संपूर्ण रूपात्मक व्याकरण किसी भाषा में उप्लब्ध नहीं है । पाणिनि व्याकरण किसी भी भाषा का एकमात्र संपूर्ण व्याकरण, लगभग पूरी तरह से रूपात्मक है जिससे इसका पूर्ण संगणकीय रूप बनाया जा सकता है । यदि ऐसा हो सका तो संस्कृत भाषा में कही गई बात को कंप्यूटर समझ पाएगा । ऐसा अब तक किसी भी अन्य प्राकृतिक भाषा में संभव नहीं हो पाया है 9/19/2018
6
पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) नियम-डेटाबेस (सूत्रपाठ)
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) -स्वनिम (Phonemes - १४ शिवसूत्र) -प्रत्याहार (आदिरन्त्येन सहेता) नियम-डेटाबेस (सूत्रपाठ) कोष धातुपाठ गणपाठ सूचियां प्रत्यय नियम-विशेष प्रविष्टियां 9/19/2018
7
पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal)
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal) स्पष्ट प्रक्रिया आसान प्रोग्रामिंग कंप्यूटर-प्रोग्राम जैसी संरचना मानक निर्देश (Variable Instantiation) प्रत्याहार, संज्ञा सूत्र वृद्धि ( evaluation / expansion) संभवतः कंपाइलर डिज़ाइन प्राभावित हुआ हो ( PS rules and replacement procedures may have been influenced by Panini) 9/19/2018
8
संस्कृत व्याकरण कंप्यूटिंग
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत व्याकरण कंप्यूटिंग पाणिनीय व्याकरण का Finite State Automata बनाना जिसमें निम्न अवयव होंगे - ध्वनिविज्ञान मोड्यूल शिवसूत्र आंतरिक-संधि 9/19/2018
9
पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं
Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं 9/19/2018
10
क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ?
Special Centre for Sanskrit Studies, J.N.U., New Delhi क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ? आज हम प्रबुद्ध संगणन(intelligent computing) के युग में हैं मशीन में कृत्रिम ज्ञान-निरूपण से बड़े कार्य किये जा सकते हैं 9/19/2018
11
संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है…
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है… मशीन में प्रोग्रैमिंग भाषा के द्वारा सूचना एनकोड किया जाता है मानव भाषा की अपेक्षा प्रोग्रैमिंग भाषा ज्ञान-निरूपण में असक्षम है दैनिक व्यवहार की भाषाओं का निश्चित स्वरूप नहीं होता, जिससे कंप्यूटर से संवाद संभव नहीं संस्कृत कंप्यूटर की भाषा बन सकती है ? 9/19/2018
12
ज्ञान-निरूपण तकनीकियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi ज्ञान-निरूपण तकनीकियां संस्कृत परंपरा कारक-आकांक्षा-योग्यता आधारित प्रतिरूप ( model) न्याय-वैशेषिक आधारित प्रतिरूप कृत्रिम-प्रज्ञान ( Artificial Intelligence) Conceptual Graph Formal Semantics Unification based approaches 9/19/2018
13
संगणकीय भाषाविज्ञान की दो विधियां
Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018
14
Special Centre for Sanskrit Studies, J.N.U., New Delhi
इसके अन्य लाभ अन्य भारतीय भाषाओं के लिये संगणकीय संसाधन संस्कृत मॉडल पर बनाये जा सकते हैं यदि व्याकरण के साथ नव्यन्याय आधारित तर्क को भी कंप्यूट किया जाय तो संस्कृत मशीन में ज्ञान-निरूपण का माध्यम बन जायेगी 9/19/2018
15
संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है इनपुट-आउटपुट सॉफ़्टवेयर ज्ञान-परंपरा की पुस्तकों का डिजिटाइजेशन ( electronic storage, access and preservation of texts) कोष-निर्माण, सर्च-इंजिन, अनुक्रमणियां आदि हस्तलेखों के कंप्यूटरीकरण ( Optical Character Recognition) शास्त्रों की टीकाएं ( Text Interpretation) कंप्यूटरीकृत संस्कृत शिक्षण और मल्टीमीडिया 9/19/2018
16
संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है…
Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है… संस्कृत-भारतीय भाषा मशीनी अनुवाद संस्कृत-विश्लेषक (Sanskrit Parser) भारतीय-भाषा प्रजनक ( Indian language generator) संस्कृत-अन्यभाषा संगणकीय कोष निर्माण (Sanskrit-Other language dictionary) 9/19/2018
17
जे. एन. यू. संस्कृत विभाग का प्रयास
Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास 9/19/2018
18
Computational Linguistics R&D at JNU
Projects Consultancies Collaborations Research students 9/19/2018
19
जे. एन. यू. संस्कृत विभाग का प्रयास
Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास पोषित परियोजनाएं (Funded projects) 9/19/2018
20
Sanskrit Hindi Machine Translation (SHMT)
Members University of Hyderabad JNU IIIT Hyderabad Tirupati Vidyapeeth Sanskrit Academy Hyderabad Poornaprajna Vidyapeth Bangalore Rajasthan Sanskrit University, Jaipur IIT Bombay BHU Phase1 (2008 – 2012) Phase2 ( ) 9/19/2018
21
भारतीय भाषा कॉर्पोरा उपक्रम Indian Languages Corpora Initiative (ILCI)
9/19/2018
22
Funded by TDIL program of Ministry of C & IT
Phase1 ( ) 3 crores Phase2 ( ) 9.33 crores ILCI consortium Server based Corpora management Corpora tools 9/19/2018
23
Shallow parser for Indian Languages - Maithili
11 languages and partners with University of Hyderabad as leader Approx 5 crores 3 years ( ) SP Tools Consortium 9/19/2018 9/19/2018
24
Consultancies 9/19/2018
25
Microsoft USA Consultancy for Machine Translation
Center for Indic Studies, University of Massachusetts Dartmouth for S&T in Sanskrit LDC, University of Pennsylvania Microsoft Corp for Handwriting Recognition for Devanagari Microsoft Research for Indic languages tagset and annotation CDAC for localization for software 9/19/2018
26
Collaborations Signed - In process
MoU with University of Wurzburg, Germany for Sanskrit, Hindi, Linguistics, Computational Linguistics AoC with MIEF for Sharada Script In process University of Massachusetts, Dartmouth (Center of Indic Studies) Yogyakarta State University, Indonesia 3RFoudation, Massachusetts, USA 9/19/2018
27
Unfunded activities 9/19/2018
28
JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज
J-TESS : JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज 9/19/2018
29
Initiatives for Science & Technology in Sanskrit
Special Centre for Sanskrit Studies, J.N.U., New Delhi SATIAIT Initiatives for Science & Technology in Sanskrit 9/19/2018
30
Special Centre for Sanskrit Studies, J.N.U., New Delhi
What is SATIAIT ? Acronym for “Science And technology In Ancient Indian Text” The joint initiative started with the initiative of Prof Bal Ram Singh, Director, Center for Indic Studies, University of Massachusetts. Special Center for Sanskrit Studies, JNU joined the initiative in 2009 C- SATIAIT Consortium for …. 9/19/2018
31
Mukesh & Priti Chatter endowment
Special Centre for Sanskrit Studies, J.N.U., New Delhi Mukesh & Priti Chatter endowment To Center for Indic Studies, U Mass Dartmouth for provable scientific concepts in Ancient Indian Texts 9/19/2018
32
Summary of activities We have done seminars/workshops
Formed expert groups surveys of S&T resources Collected important texts Digitized them enabled searches Translated some of them Started lab researches at U Mass D 9/19/2018
33
Seminar proceedings Editors: Bal Ram Singh Girish Nath Jha Umesh Kumar Singh Diwakar Mishra 9/19/2018
34
Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras
Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras others 9/19/2018
35
Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा)
Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा) ch2 - copper (तांबा) , iron, brass (पीतल), Mica (अभ्रक) ch3 - sulphur (गन्धक) and other poisonous substances ch4- medicinal use of some of the chemicals ch5 - making tablets from powder and rasa, their usage for different ailments 9/19/2018
36
Special Centre for Sanskrit Studies, J.N.U., New Delhi
Identifying texts… rasaayana-saara – 20th c text on metallurgy from Varanasi by Acarya Shyam Sundar Vaishya, a practicing vaidya himself Has three sections – Definitions (paribhasha prakarana) Mercury (paarad prakarana) Dhatushodhana-maarana-prakarana) He has translated the text himself and in doing so has consulted many other vaidyas of Varanasi 9/19/2018
37
Special Centre for Sanskrit Studies, J.N.U., New Delhi
Translating Texts We have translated the following texts in the area metallurgy rasayana-saara rasasanketa-kalikaa 9/19/2018
38
Special Centre for Sanskrit Studies, J.N.U., New Delhi
Lab experiments … A meeting was organized on July12, 2011 at U.Mass D Dept of Chemistry. They have shown a great interest in the activity The experiments on some metals have started in the chemistry labs of University of Massachusetts Dartmouth The findings are expected to come out as publications 9/19/2018
39
Broadbasing the activity
Special Centre for Sanskrit Studies, J.N.U., New Delhi Broadbasing the activity Courses are being developed at JNU’s Sanskrit center (to be run jointly with CIS, U Mass D) MoU between the two centers is being finalized A larger consortium of universities, institutes, individuals is being developed C-SATIAIT Vedanta congress (Dec 28-31). 9/19/2018
40
Work done by research students
As part of M.Phil and Ph.D research by my students, a large number of tools have been developed mainly for Sanskrit Their tools and dissertations are online on our sever 9/19/2018
41
Publications Springer Cambridge Scholar Lambert DK Printworld
Recent books 9/19/2018
42
Developmental platforms
Online system Front end Java, JSP, HTML, JS Backend MS SQL Server 2005, data files Stored procedures, security features Connectivity MS-JDBC driver Hosting Tomcat/Apache webserver 9/19/2018
43
Some advertisements WILD:RE
Workshop on Indian Languages Data Resource and Evaluation Springer’s LRE Journal (Language Resource Evaluation) 9/19/2018
44
Special Centre for Sanskrit Studies, J.N.U., New Delhi
समस्याएं और संभावनाएं 9/19/2018
45
विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार
Special Centre for Sanskrit Studies, J.N.U., New Delhi विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार अनुदान की समस्या मौलिक तकनीकी सुविधाओं में कमी नौकरियों की कमी टीम में कार्य न करना 9/19/2018
46
Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं पाठ्यक्रम में सुधार प्रायोगिक संस्कृत के अंतर्गत परिवर्तन लाएं भाषाविज्ञान और संगणक को आवश्यक पत्र बनाएं अनुदान की कमी हो तो कंप्यूटर विभाग से सहयोग लें 9/19/2018
47
Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं … संस्कृत के लिये निजी संस्थाओं / व्यक्तियों से दान लिये जा सकते हैं कंप्यूटर बेहद सस्ते हो रहे हैं छात्रों को संस्कृत और अपनी मातृभाषा में typing करायें HTML और मल्टीमीडिया की ट्रेनिंग दें संस्कृत के ग्रंथ ऑनलाइन करवायें 9/19/2018
48
Special Centre for Sanskrit Studies, J.N.U., New Delhi
निदान और नई संभावनाएं…. संस्कृत को आधार बनकर अपनी मातृभाषा के छोटे उपकरण बनाएं – spell checker, dictionary मोबाइल और सॉफ़्ट्वेयर कंपनियां इनको खरीदने में रुचि लेंगीं संस्कृत एनीमेशन का विशाल क्षेत्र है – इसमें छात्रों को प्रशिक्षण दें पौराणिक मल्टीमिडिया प्रकाशन और एनीमेशन फ़िल्मों में करियर बनाएं 9/19/2018
49
Demo http://sanskrit.jnu.ac.in localhost
Special Centre for Sanskrit Studies, J.N.U., New Delhi Demo localhost 9/19/2018
50
Thank you girishjha@gmail.com
Special Centre for Sanskrit Studies, J.N.U., New Delhi Thank you 9/19/2018
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.