Natural language Understanding James Allen

Slides:



Advertisements
Similar presentations
Awe sim.
Advertisements

معاونت درمان امور مامایی اردیبهشت 90. برای ثبت اطلاعات در برنامه نرم افزاری نظام مراقبت مرگ پریناتال ابتدا لازم است برنامه نرم افزار info-path وپرنیان.
روشهاي پارس بهينه. پارس توسط انسان تمام روشهاي پارس که تا کنون مطرح شدند از تکنيکهاي “جستجوي کامل” براي تفسير جمله استفاده مي کردند. به نظر ميرسد که پارس.
فاکتورهای مهم در ایجاد یک مقاله علمی
الگوریتم ژنتیکی. تعریف  الگوریتم ژنتیکی، رویه ای تکراری است که راه حل های انتخابیش را بصورت رشته ای از ژنها که کروموزوم نامیده می شوند، بازنمایی می کند.
Definition. قانون بیز P(b|a) = P(a|b)P(b)/P(a) P(b|a) = P(a|b)P(b)/P(a) این قانون برای استنتاج آماری استفاده می شود. این قانون برای استنتاج آماری استفاده.
ارائه روشي براي شناسايي کاراکترهاي دستنويس، برپايه شبکه LVQ.
Decision Tree.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
روشهاي پارس بهينه ارائه دهنده : دکتر احمد عبدالله زاده تنظيم کننده : پرهام مرادي پائيز 85 دانشگاه صنعتي امير کبير دانشکده مهندسي کامپيوتر و فناوري اطلاعات.
استاد درس: آقای دکتر عبدالله زاده توسط: اسماعیل رضایی ‪
ارائه دهنده: دکتر احمد عبدالله زاده تنظيم کننده:پرهام مرادي
مراحل مختلف اجرای يک برنامه
فایل پردازی در C File based Programming in C. انواع فایل متنی –سرعت بالا –حجم کمتر –امکان دسترسی تصادفی –حفظ امنیت داده ها دودویی (باینری) –امکان باز.
پیدا کردن شواهد علمی. منابع بررسي متون  كتاب ها  گزارش ها  مجله هاي علمي peer reviewed  ايندكس مديكوس  داده هاي الكترونيكي  بانك هاي الكترونيكي.
Lesson four Grade three
Database Laboratory: Session #4 Akram Shokri. DB-Lab 2 Lab Activity You must already created all tables You have to have inserted proper data in tables.
ساختمان داده‌ها پیمایش گراف. مرور °مشکل: چگونه تمام نودهای گراف را مشاهده کنیم؟ °جستجوی اول عمق دنبال کردن مسیرهای بین راسها. °جستجوی اول سطح دیدن تمام.
Arrangements of Lines C omputational Geometry By Samaneh shafi naderi
CS Constraint Satisfaction Constraint Satisfaction Problems Chapter 5 Section 1 – 3 Modified by Vali Derhami.
سيستم خبره مرکب ( ترکيب پيشرو و پسرو ) زماني که يک فرضيه احتمالي براي جواب داشته باشيم، روش backward مي تواند خيلي کاراتر و مناسبتر باشد. اگر هيچ احتمال.
آشنايي با سيستم اعداد.
[c.
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
ویژگی های DHCP جلوگیری از Conflict سرعت بخشیدن به کارها مدیریت متمرکز
بنام خدا زبان برنامه نویسی C (21814( Lecture 12 Selected Topics
SY800 router mode [AD-14-TB ].
ساختمان داده ها جداول درهم سازی
ساختمان داده‌ها الگوریتمهای کوتاهترین مسیر
آزمایشگاه پایگاه داده ها قیود در جداول یک پایگاه داده در SQL Server
Odd-even merge sort مرتب سازی.
چگونه بفهمیم آیا ژورنالی ISI است؟ ایمپکت فاکتور دارد یا خیر؟
سیستم‌های مبتنی بر دانش
دانشگاه علوم پزشکی شهید بهشتی
مدیریت مالی و اقتصاد مدیریت موضوع : نقطه سر به سر زمستان 93
فصل دوم جبر بول.
Route configuration for 5400W ADSL Router
به نام حق مبحث: ارث بری Inheritance.
تکنیک دیماتل DEMATEL: decision making trial and evaluation laboratory.
SSO Single Sign-on Systems
آشنایی با پایگاه داده mysql
آموزش کرک کردن نرم افزار ACTIVE HDL
Tree Sort.
کوئیز از جلسه قبل) کارخانه ای در حال خرید قطعه‌ای برای یکی از ماشین‌آلات خود می باشد اگر نرخ بهره 10% برای محاسبات فرض شود، دو مدل از قطعه ماشین در دسترس.
مدارهای منطقی فصل سوم - خصوصیات توابع سويیچی
ساختمان داده‌ها پیمایش درخت دودویی
اصطکاک Designed By: Soheil Soorghali.
هیدرولیک جریان در کانالهای باز
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
Bucket sort اكرم منوچهري زهرا منوچهري
مقاله ام را کجا Submit کنم؟ تهیه و تنظیم: سودابه طاهری و زهره راخ
راهنمای استفاده از ابزار Mailings در Ms Word
اهداف درس این جلسه حل مساله کوله پشتی با رویکرد حریصانه مقایسه رویکرد حریصانه با برنامه‌نویسی پویا در حل مساله.
پشته و صف پیوندی Give qualifications of instructors: DAP
به نام خدا اين فايل راهنما جهت آشنايی کاربران گرامی با پايگاه اطلاعاتی Sciencedirect و نحوه جستجوی اطلاعات در آن تهيه شده است لطفاً اسلايدهای بعد را مشاهده.
بسم الله الرحمن الرحیم هرس درخت تصمیم Dr.vahidipour Zahra bayat
کاربرد کامپیوتر در داروخانه
جستجوی منابع الکترونیک
فصل ششم مدارهای ترتیبی.
ابزارهای جستجوی پایان نامه
ساختمان داده‌ها درختان و درختان دودویی
Uniprocessor Scheduling
توزیع میانگین نمونه سعید موسوی.
مراحل پیش رو : 1- الگوریتم عقبگرد برای مسئله کوله پشتی صفر و یک
برنامه ریزی خطی پیشرفته (21715( Advanced Linear Programming Lecture 7
ساختمان داده ها مرتب سازی درجی
پشته و صف پیوندی Give qualifications of instructors: DAP
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
ساختمان داده ها گرافها.
Presentation transcript:

Natural language Understanding James Allen In The Name Of God Natural language Understanding James Allen Chapter 3 : Grammers and Parsing 3-4 : A Bottom - Up Chart Parser NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser برای تجزیه و تحلیل و محاسباتی نمودن ساختار جمله به دو مورد زیر باید توجه کرد: گرامر پارس NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser گرامر:یک تعریف قاعده مند برای یک ساختار مجاز در زبان. پارس:روش تحلیل یک جمله نمونه برای تعیین ساختار آن براساس گرامر. - پارس فرآیندی برای کنترل صحت ساختار جمله بر اساس گرامر آن است. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser الگوریتم پارس: الگوریتم پارس روالی را برای تولید درخت از جمله ورودی براساس گرامر آن مشخص میکند. الگوریتم پارس موجب تایید یا عدم تایید صحت جمله ورودی در رابطه با گرامر آن میشود. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser روش های پارس: بالا به پایین(Top Down) پایین به بالا(Buttom Up) NLP -A Bottom-Up Chart Parser Created by S.Ghouth

بالا به پایین : (Top-Down) در این روش از نشانه S عملیات پارس را شروع میکنیم تا به ترمینال هایی برسیم که جمله ورودی را تشکیل داده اند . از S شروع می کنیم تا به ترمینال (symbol)برسیم. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

پایین به بالا: (Buttom-Up) در این روش از ترمینالهایی که در جمله ورودی هستند عملیات پارس را شروع می کنیم و این ترمینالها را با طرف چپ قوانین گرامری (غیر ترمینال) جایگزین می کنیم تا به نشانه s برسیم. از ترمینال شروع می کنیم تا به نشانه s برسیم. S VP NP NP N V ART N ali eats an apple NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser تعریف: Symbol List: در هر مرحله از الگوریتم پارسر ، حالت فعلی با لیستی از سمبل ها نشان داده میشود. S→NP VP با استفاده از قانون بالا حالت پارسر NPVP است. Lexicon : شامل اطلاعاتی در مورد کلمات (ترمینال ها) می باشد. The:ART Can:N,V,AUX State Of Parser : موقعیت پارسر با یک عدد نمایش داده میشود. 1 The Large can can hold the water 2 3 4 5 6 7 8 NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser استراتژی پارس: استراتژي اول – عمق(depth-first strategy) در اين استراتژي حالات ممکنه (possibilities list) در داخل پشته (Stack) قرار مي‌گيرد و به صورت LIFO (Last In First Out) عمل خواهد کرد. استراتژي اول - سطح (breath first strategy) در اين استراتژي حالات ممکنه (possibilities list) در داخل صف (queue) قرار مي‌گيرد و به صورت FIFO (First In First Out) عمل خواهد کرد. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser اختلاف استراتژی پارس: در استراتژي اول عمق (depth-first) : يک مسير ممکن براي جستجو تا زماني که به بن بست يا موفقيت برسد ادامه مي‌يابد. در صورت بن بست، مسير ديگر انتخاب مي‌شود. این استراتژی اغلب سريع به جواب مي‌رسد اما در بعضي مواقع با جستجوي مسير‌هاي بيهوده، زمان زيادي طول مي‌کشد تا به جواب برسد. در استراتژي اول – سطح (breath-first) : تمام مسير‌هاي ممکن در هر مرحله بسط داده مي‌شود. در این استراتژی تمام حالات ممکنه قبل از اينکه وارد عمق پايينتر شود،‌ بررسي مي‌گردد. در هر دو استراتژي به جواب مي‌رسيد اما ترتيب جستجوي آنها با هم متفاوت است. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

مشکلات روش بالا به پایین: ممکن است به حالت پايان نرسند. ممکن است پس از طي مراحل زيادي (نمايي) به جواب برسد و متوقف شود. محاسبات تکراري زياد داريم. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

مشکلات روش پایین به بالا: تمام حالات ممکنه براي زير رشته (substring) توليد شده و ممکن است يک سري از اين حالات اصلا به S ختم نشود و يا اينکه با طرف راست خود نتواند تطبيق پيدا کند. محاسبات تکراري داريم NLP -A Bottom-Up Chart Parser Created by S.Ghouth

A Buttom Up Chart Parser: اختلاف اصلی در روش پارس بالا به پایین و پایین به بالا در نحوه استفاده از قوانین گرامر است. در روش پایین به بالا ، از طرف راست قوانین گرامری به سمت چپ حرکت می کنیم تا به S برسیم در روش پایین به بالا با توجه به عبارت ورودی ، ترتیبی از نشانه ها را در کنار هم قرار می دهیم تا با طرف راست قانون گرامر مطابقت داشته باشد و سپس آن را با طرف چپ قانون جایگزین می کنیم . NP → ART ADJ N در این مثال ، نشانه ها (symbol) را در کنار هم قرار می دهیم تا به ترتیب ART ADJ N برسیم و سپس آن را با NP جایگزین می کنیم. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NP → ART ADJ N پارسر بالا به پایین پارسر پایین به بالا NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser پارسر پایین به بالا را می توان با فرموله کردن فرایند مطابقت بعنوان یک فرایند جستجو در نظر گرفت. حالت(state) شامل لیستی از نشانه ها (symbol list) است. حالات پایانی یا موفقیت ( successor state ) با تشریح همه حالات ممکن تولید می شوند. در این روش ابتدا کلمات (word) را با توجه به طبقه (category)آنها در فرهنگ لغات (Lexicon) بازنویسی میکنیم جایگزین کردن یک رشته از نشانه هایی که طرف راست قوانین گرامری را با طرف چپ مطابقت می دهند. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser Key: کلید : جز اصلی در یک گرامر است. The: ART NP → ART N NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser برای پیدا کردن قوانینی که با رشته ای که شامل کلید است مطابقت داشته باشد ، باید به دنبال قوانینی باشیم که یا با کلید شروع می شوند یا کلمه کلیدی نزدیک به ابتدای جمله باشد. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser A Simple Grammar 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser G: 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP فرض کنید جمله ای با ART شروع میشود. The large can can hold the water 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 2'. NP → ART ◦ ADJ N 3'. NP → ART ◦ N 4'. NP → ADJ ◦ N 2''. NP → ART ADJ ◦ N NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser Active Arcs: Active Arcs سابقه ی قوانینی را که به صورت جزئی مطابقت داده شده اند ولی کامل نیستند نگهداری می کند. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser G: 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP The large 1 2 3 ART1 ADJ1 1 2 3 NP → ART ◦ ADJ N NP → ART ◦ N NP → ADJ ◦ N NP → ART ADJ ◦ N NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser :Agenda عمل اصلی یک پارسر chart-basedشامل ترکیب یک active arc با یک عضو کامل می باشد و نتیجه آن ایجاد یک عضو کامل جدید یا یک active arc جدید است. اعضای کامل جدید در یک لیست بنام agenda نگهداری میشوند تا زمانی که خودشان به chart اضافه شوند NLP -A Bottom-Up Chart Parser Created by S.Ghouth

:The Arc Extension Algorithm NLP -A Bottom-Up Chart Parser Created by S.Ghouth

A Bottom-up chart parsing algoritm: Do until there is no input left: 1.If the agenda is empty, look up the interpretations for the next word in the input and add them to the agenda. 2.Select a constituent from the agenda(lets call it constituent C from position P1 to P2). 3.For each rule in the grammar of form X → C X1 … Xn, add an active arc of from X → C ◦ C ◦ X1 … Xn from position p1 to p2. 4.Add C to the chart using the arc extention algorim above. Created by S.Ghouth NLP -A Bottom-Up Chart Parser

NLP -A Bottom-Up Chart Parser همانطور که در پارسرهای بالا به پایین ممکن است از استراتژی جستجوی سطحی یا عمقی استفاده کنید،agenda هم در یک پشته یا صف اجرا می شود. در اینجا یک مثال با استراتژی اول عمق دنبال می کنیم. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser A sample: Input: The large can can hold the water. Lexicon: the: ART large: ADJ can: N, AUX, V hold: N, V water: N, V NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser G: 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP Input: The large can can hold the water. NP (rule4) NP1(rule2) ART1 ADJ1 N1 AUX1 V1 1 The 2 large 3 can 4 NP → ART ◦ ADJ N NP → ART ◦ N NP → ADJ ◦ N NP → ART ADJ ◦ N S → NP ◦ VP S → NP ◦ VP VP → AUX ◦ VP VP → V ◦ NP NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser The chart after all the NPs are found NP2(rule 4) NP1(rule 2) N1 N2 NP3(rule 3) V1 V2 V3 V4 ART1 ADJ1 AUX1 AUX2 N3 ART2 N4 6 1 The 2 large 3 can 4 can 5 hold The 7 water 8 S → NP ◦ VP S → NP ◦ VP VP → AUX ◦ VP VP → V ◦ NP VP →V◦ NP G: 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP VP → AUX◦ VP VP →V◦ NP NP → ART ◦ ADJ N NP → ART ◦ N S → NP ◦ VP Input: The large can can hold the water. VP →V◦ NP Created by S.Ghouth NLP -A Bottom-Up Chart Parser

G: 1. S → NP VP 2. NP → ART ADJ N 3. NP → ART N 4. NP → ADJ N 5. VP → AUX VP 6. VP → V NP S1(rule 1 with NP1 and VP2) S2(rule 1 with NP2 and VP2) VP3(rule 5 with AUX1 and VP2) NP2(rule 4) VP2(rule 5) NP1(rule 2) VP1(rule 6) N1 N2 NP3(rule 3) V1 V2 V3 V4 ART1 ADJ1 AUX1 AUX2 N3 ART2 N4 6 1 The 2 large 3 can 4 can 5 hold The 7 water 8 The final chart Created by S.Ghouth NLP -A Bottom-Up Chart Parser

NLP -A Bottom-Up Chart Parser پارسرهایی که براساس چارت کار می کنند بطور قابل ملاحظه ای کارآمدتر از پارسرهایی هستند که فقط بر پایه جستجو عمل می کنند زیرا در پارسرهای Chart-based اعضا بیشتر از یکبار ساخته نمی شوند. یک استراتژی جستجوی بالا به پایین یا پایین به بالا به زمانی معادل Cn ، برای پارس جمله ای به طول n نیاز دارند.(C : ثابتی است که بستگی به الگوریتم مورد استفاده دارد.) اما در پارسرهای Chart-basedدر بدترین حالت به K*n3زمان نیاز داریم.(K : ثابتی است که بستگی به الگوریتم مورد استفاده دارد.) - برای مقایسه فرض کنید K=1000 و C=10 باشد و طول جمله 12کلمه باشد پس داریم 1012 برای الگوریتم های جستجویی و123×1000 برای پارسرهای Chart-base. بااین فرضیات پارسر Chart-base 500000 بار سریعتراز الگوریتم های جستجوی می باشد. NLP -A Bottom-Up Chart Parser Created by S.Ghouth

NLP -A Bottom-Up Chart Parser پایان NLP -A Bottom-Up Chart Parser Created by S.Ghouth