संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान और संस्कृत Computational Linguistics and Sanskrit Girish Nath Jha Associate Professor, Computational Linguistics Special Center for Sanskrit Studies, J.N.U., New Delhi – 110067 Mukesh and Priti Chatter Distinguished Professor of History of Science, University of Massachusetts Dartmouth, USA 9/19/2018
१) संगणकीय भाषाविज्ञान क्या है ? Special Centre for Sanskrit Studies, J.N.U., New Delhi १) संगणकीय भाषाविज्ञान क्या है ? मानव भाषा का संगणक द्वारा विश्लेषण और ज्ञान निरूपण 9/19/2018
संगणकीय भाषाविज्ञान के उपविषय Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान के उपविषय वक्तृ अभिज्ञान (Speaker Recognition) वाणी अभिज्ञान (Speech Recognition) प्राकृतिक भाषा अंतर्मुख (Natural Language Interface) प्राकृतिक भाषा विश्लेषण(Natural Language Analysis/Understanding) प्राकृतिक भाषा प्रजनन (Natural Language Generation) मशीन अनुवाद (Machine Translation) वाणी प्रजनन (Speech synthesis) 9/19/2018
संगणकीय भाषाविज्ञान की दो विधियां Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018
पाणिनि व्याकरण की उपयोगिता Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि व्याकरण की उपयोगिता सांख्यिकीय विधि संभवतः इसलिये महत्त्वपूर्ण होती जा रही है कि संपूर्ण रूपात्मक व्याकरण किसी भाषा में उप्लब्ध नहीं है । पाणिनि व्याकरण किसी भी भाषा का एकमात्र संपूर्ण व्याकरण, लगभग पूरी तरह से रूपात्मक है जिससे इसका पूर्ण संगणकीय रूप बनाया जा सकता है । यदि ऐसा हो सका तो संस्कृत भाषा में कही गई बात को कंप्यूटर समझ पाएगा । ऐसा अब तक किसी भी अन्य प्राकृतिक भाषा में संभव नहीं हो पाया है 9/19/2018
पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) नियम-डेटाबेस (सूत्रपाठ) Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम स्वनिम-अवयव (Phonetic Component) -स्वनिम (Phonemes - १४ शिवसूत्र) -प्रत्याहार (आदिरन्त्येन सहेता) नियम-डेटाबेस (सूत्रपाठ) कोष धातुपाठ गणपाठ सूचियां प्रत्यय नियम-विशेष प्रविष्टियां 9/19/2018
पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal) Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि-सिस्टम… अधिक रूपात्मकता ( more formal) स्पष्ट प्रक्रिया आसान प्रोग्रामिंग कंप्यूटर-प्रोग्राम जैसी संरचना मानक निर्देश (Variable Instantiation) प्रत्याहार, संज्ञा सूत्र वृद्धि ( evaluation / expansion) संभवतः कंपाइलर डिज़ाइन प्राभावित हुआ हो ( PS rules and replacement procedures may have been influenced by Panini) 9/19/2018
संस्कृत व्याकरण कंप्यूटिंग Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत व्याकरण कंप्यूटिंग पाणिनीय व्याकरण का Finite State Automata बनाना जिसमें निम्न अवयव होंगे - ध्वनिविज्ञान मोड्यूल शिवसूत्र आंतरिक-संधि 9/19/2018
पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं Special Centre for Sanskrit Studies, J.N.U., New Delhi पाणिनि सूत्रों को हम कैसे प्रोग्राम करते हैं 9/19/2018
क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ? Special Centre for Sanskrit Studies, J.N.U., New Delhi क्या संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है ? आज हम प्रबुद्ध संगणन(intelligent computing) के युग में हैं मशीन में कृत्रिम ज्ञान-निरूपण से बड़े कार्य किये जा सकते हैं 9/19/2018
संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है… Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत कंप्यूटर के लिये उपयोगी हो सकती है… मशीन में प्रोग्रैमिंग भाषा के द्वारा सूचना एनकोड किया जाता है मानव भाषा की अपेक्षा प्रोग्रैमिंग भाषा ज्ञान-निरूपण में असक्षम है दैनिक व्यवहार की भाषाओं का निश्चित स्वरूप नहीं होता, जिससे कंप्यूटर से संवाद संभव नहीं संस्कृत कंप्यूटर की भाषा बन सकती है ? 9/19/2018
ज्ञान-निरूपण तकनीकियां Special Centre for Sanskrit Studies, J.N.U., New Delhi ज्ञान-निरूपण तकनीकियां संस्कृत परंपरा कारक-आकांक्षा-योग्यता आधारित प्रतिरूप ( model) न्याय-वैशेषिक आधारित प्रतिरूप कृत्रिम-प्रज्ञान ( Artificial Intelligence) Conceptual Graph Formal Semantics Unification based approaches 9/19/2018
संगणकीय भाषाविज्ञान की दो विधियां Special Centre for Sanskrit Studies, J.N.U., New Delhi संगणकीय भाषाविज्ञान की दो विधियां १) व्याकरणिक विधि (rule based approach) व्याकरण के नियम संगणकीय प्रारूप में दिये जाते हैं, संगणक इन नियमों को देख कर भाषाई डेटा को प्रोसेस करता है २) सांख्यिकीय विधि (statistical approach) पहले डेटा को देख कर उनसे उभरते हुए पैटर्न को समझता है और नियम बनाता है । इस तकनीक के एक प्रकार को मशीन लर्निंग भी कहा जाता है 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi इसके अन्य लाभ अन्य भारतीय भाषाओं के लिये संगणकीय संसाधन संस्कृत मॉडल पर बनाये जा सकते हैं यदि व्याकरण के साथ नव्यन्याय आधारित तर्क को भी कंप्यूट किया जाय तो संस्कृत मशीन में ज्ञान-निरूपण का माध्यम बन जायेगी 9/19/2018
संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है इनपुट-आउटपुट सॉफ़्टवेयर ज्ञान-परंपरा की पुस्तकों का डिजिटाइजेशन ( electronic storage, access and preservation of texts) कोष-निर्माण, सर्च-इंजिन, अनुक्रमणियां आदि हस्तलेखों के कंप्यूटरीकरण ( Optical Character Recognition) शास्त्रों की टीकाएं ( Text Interpretation) कंप्यूटरीकृत संस्कृत शिक्षण और मल्टीमीडिया 9/19/2018
संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है… Special Centre for Sanskrit Studies, J.N.U., New Delhi संस्कृत के लिये कंप्यूटर उपयोगी हो सकता है… संस्कृत-भारतीय भाषा मशीनी अनुवाद संस्कृत-विश्लेषक (Sanskrit Parser) भारतीय-भाषा प्रजनक ( Indian language generator) संस्कृत-अन्यभाषा संगणकीय कोष निर्माण (Sanskrit-Other language dictionary) 9/19/2018
जे. एन. यू. संस्कृत विभाग का प्रयास Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास 9/19/2018
Computational Linguistics R&D at JNU Projects Consultancies Collaborations Research students 9/19/2018
जे. एन. यू. संस्कृत विभाग का प्रयास Special Centre for Sanskrit Studies, J.N.U., New Delhi जे. एन. यू. संस्कृत विभाग का प्रयास पोषित परियोजनाएं (Funded projects) 9/19/2018
Sanskrit Hindi Machine Translation (SHMT) Members University of Hyderabad JNU IIIT Hyderabad Tirupati Vidyapeeth Sanskrit Academy Hyderabad Poornaprajna Vidyapeth Bangalore Rajasthan Sanskrit University, Jaipur IIT Bombay BHU Phase1 (2008 – 2012) Phase2 (2013-2016) 9/19/2018
भारतीय भाषा कॉर्पोरा उपक्रम Indian Languages Corpora Initiative (ILCI) 9/19/2018
Funded by TDIL program of Ministry of C & IT Phase1 (2009-2012) 3 crores Phase2 (2012-2015) 9.33 crores ILCI consortium Server based Corpora management Corpora tools 9/19/2018
Shallow parser for Indian Languages - Maithili 11 languages and partners with University of Hyderabad as leader Approx 5 crores 3 years (1212-1215) SP Tools Consortium 9/19/2018 9/19/2018
Consultancies 9/19/2018
Microsoft USA Consultancy for Machine Translation Center for Indic Studies, University of Massachusetts Dartmouth for S&T in Sanskrit LDC, University of Pennsylvania Microsoft Corp for Handwriting Recognition for Devanagari Microsoft Research for Indic languages tagset and annotation CDAC for localization for software 9/19/2018
Collaborations Signed - In process MoU with University of Wurzburg, Germany for Sanskrit, Hindi, Linguistics, Computational Linguistics AoC with MIEF for Sharada Script In process University of Massachusetts, Dartmouth (Center of Indic Studies) Yogyakarta State University, Indonesia 3RFoudation, Massachusetts, USA 9/19/2018
Unfunded activities 9/19/2018
JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज J-TESS : JNU Text Encoding & Search for Sanskrit संस्कृत वाङ्मय खोज 9/19/2018
Initiatives for Science & Technology in Sanskrit Special Centre for Sanskrit Studies, J.N.U., New Delhi SATIAIT Initiatives for Science & Technology in Sanskrit 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi What is SATIAIT ? Acronym for “Science And technology In Ancient Indian Text” The joint initiative started with the initiative of Prof Bal Ram Singh, Director, Center for Indic Studies, University of Massachusetts. Special Center for Sanskrit Studies, JNU joined the initiative in 2009 C- SATIAIT Consortium for …. 9/19/2018
Mukesh & Priti Chatter endowment Special Centre for Sanskrit Studies, J.N.U., New Delhi Mukesh & Priti Chatter endowment To Center for Indic Studies, U Mass Dartmouth for provable scientific concepts in Ancient Indian Texts 9/19/2018
Summary of activities We have done seminars/workshops Formed expert groups surveys of S&T resources Collected important texts Digitized them enabled searches Translated some of them Started lab researches at U Mass D 9/19/2018
Seminar proceedings Editors: Bal Ram Singh Girish Nath Jha Umesh Kumar Singh Diwakar Mishra 9/19/2018
Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying S&T texts Potential collections – Jaipur NMM SSU – Banaras others 9/19/2018
Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा) Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying texts rasa-sanketa-kalika ch1 - mercury (पारा) ch2 - copper (तांबा) , iron, brass (पीतल), Mica (अभ्रक) ch3 - sulphur (गन्धक) and other poisonous substances ch4- medicinal use of some of the chemicals ch5 - making tablets from powder and rasa, their usage for different ailments 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi Identifying texts… rasaayana-saara – 20th c text on metallurgy from Varanasi by Acarya Shyam Sundar Vaishya, a practicing vaidya himself Has three sections – Definitions (paribhasha prakarana) Mercury (paarad prakarana) Dhatushodhana-maarana-prakarana) He has translated the text himself and in doing so has consulted many other vaidyas of Varanasi 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi Translating Texts We have translated the following texts in the area metallurgy rasayana-saara rasasanketa-kalikaa 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi Lab experiments … A meeting was organized on July12, 2011 at U.Mass D Dept of Chemistry. They have shown a great interest in the activity The experiments on some metals have started in the chemistry labs of University of Massachusetts Dartmouth The findings are expected to come out as publications 9/19/2018
Broadbasing the activity Special Centre for Sanskrit Studies, J.N.U., New Delhi Broadbasing the activity Courses are being developed at JNU’s Sanskrit center (to be run jointly with CIS, U Mass D) MoU between the two centers is being finalized A larger consortium of universities, institutes, individuals is being developed C-SATIAIT Vedanta congress (Dec 28-31). 9/19/2018
Work done by research students As part of M.Phil and Ph.D research by my students, a large number of tools have been developed mainly for Sanskrit Their tools and dissertations are online on our sever 9/19/2018
Publications Springer Cambridge Scholar Lambert DK Printworld Recent books 9/19/2018
Developmental platforms Online system Front end Java, JSP, HTML, JS Backend MS SQL Server 2005, data files Stored procedures, security features Connectivity MS-JDBC driver Hosting Tomcat/Apache webserver 9/19/2018
Some advertisements WILD:RE Workshop on Indian Languages Data Resource and Evaluation Springer’s LRE Journal (Language Resource Evaluation) 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi समस्याएं और संभावनाएं 9/19/2018
विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार Special Centre for Sanskrit Studies, J.N.U., New Delhi विद्वानों द्वारा परिवर्तन को न स्वीकार करना पाठ्यक्रम में कम सुधार अनुदान की समस्या मौलिक तकनीकी सुविधाओं में कमी नौकरियों की कमी टीम में कार्य न करना 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi निदान और नई संभावनाएं पाठ्यक्रम में सुधार प्रायोगिक संस्कृत के अंतर्गत परिवर्तन लाएं भाषाविज्ञान और संगणक को आवश्यक पत्र बनाएं अनुदान की कमी हो तो कंप्यूटर विभाग से सहयोग लें 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi निदान और नई संभावनाएं … संस्कृत के लिये निजी संस्थाओं / व्यक्तियों से दान लिये जा सकते हैं कंप्यूटर बेहद सस्ते हो रहे हैं छात्रों को संस्कृत और अपनी मातृभाषा में typing करायें HTML और मल्टीमीडिया की ट्रेनिंग दें संस्कृत के ग्रंथ ऑनलाइन करवायें 9/19/2018
Special Centre for Sanskrit Studies, J.N.U., New Delhi निदान और नई संभावनाएं…. संस्कृत को आधार बनकर अपनी मातृभाषा के छोटे उपकरण बनाएं – spell checker, dictionary मोबाइल और सॉफ़्ट्वेयर कंपनियां इनको खरीदने में रुचि लेंगीं संस्कृत एनीमेशन का विशाल क्षेत्र है – इसमें छात्रों को प्रशिक्षण दें पौराणिक मल्टीमिडिया प्रकाशन और एनीमेशन फ़िल्मों में करियर बनाएं 9/19/2018
Demo http://sanskrit.jnu.ac.in localhost Special Centre for Sanskrit Studies, J.N.U., New Delhi Demo http://sanskrit.jnu.ac.in localhost 9/19/2018
Thank you girishjha@gmail.com Special Centre for Sanskrit Studies, J.N.U., New Delhi Thank you girishjha@gmail.com 9/19/2018