Download presentation
Presentation is loading. Please wait.
1
Semantic Web Annotation
In The Name of Allah Computer Engineering Department Sharif University of Technology حاشیه نویسی وب معنایی Semantic Web Annotation سید امير شيخ احمدي : استاد راهنما: دکتر ابوالحسنی استاد مشاور: دکتر قدسی
2
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
3
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
4
تعریف مسئله حجم زیاد اطلاعات روی وب
جستجوی نامناسب ، عدم تبادل اطلاعات توسط عامل ها وب معنایی: افزودن متاداده به وب فعلی نحوه درج متا داده ها؟ استفاده از روش های متفاوت حاشیه نویسی حاشیه نویسی وب معنایی
5
تعریف مسئله(1) آنتولوژی: عناصر تشکیل دهنده آنتولوژی:
توصیف فرمال مفاهیم عناصر تشکیل دهنده آنتولوژی: مفاهیم روابط خصوصیات نمونه ها حاشیه نویسی وب معنایی
6
تعریف مسئله(2) حاشیه نویسی وب معنایی
7
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
8
تعاریف حاشیه نویسی Merriam-Webster: HCI:
یک تذکر که به روش توضیح یا توصیف اضافه می شود. HCI: یک annotation به شکل توضیحی روی یک شی که حاشیه نویس تمایل دارد از هر شی دیگری مجزا باشد،بررسی می شود. استخراج مفاهيم دامنه از صفحات وب با استفاده از آنتولوژي و درج آن ها با ساختار هاي معنايي درون صفحه هاي وب يا سرورهاي خاص مي باشد. حاشیه نویسی وب معنایی
9
زیر فرایند های ایجاد یک حاشیه نویسی
انتخاب (قسمتی از) سند ی که باید حاشیه نویسی شود(منبع) انتخاب عنصر نمایش که نتیجه تابع است(هدف) تعریف نوع و خصوصیات تابع در اتوماتیک همگی نرم افزاری در نیمه اتوماتیک حداقل یک مورد نرم افزاری در دستی همگی توسط عامل انسانی انجام می شود حاشیه نویسی وب معنایی
10
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
11
حاشیه نویسی دستی ويرايش گر اسناد ويرايش گر اسناد حاشيه نويس حاشيه نويس
Tagstags Tags tagsTags tagstagtags agstagstags اسناد حاشيه نويسی شده اسناد ويرايش گر Tagstags Tags tagsTags tagstagtags agstagstags اسناد حاشيه نويسی شده حاشيه نويس اسناد حاشيه نويس حاشیه نویسی وب معنایی
12
ابزارهای حاشیه نویسی دستی
Annotea(2001) مفاهیم اصلی که در توسعه Annotea منظور شده است: استفاده از تکنولوژی باز فقط پشتیبانی از اسناد ساختاریافته از قبیل HTML&XML حاشیه نویسیها باید دارای URI باشند. حاشیه نویسیها باید دارای نوع باشند(که توسط کاربر مشخص می شود.) حاشیه نویسیها در پایگاه داده های عمومی RDF ذخیره می شوند.(سرورها) استفاده از RDF Schema قابل توسعه Client-less هر دونوع حاشیه نویسیهای محلی(خصوصی) و راه دور(اشتراکی)را پشتیبانی می نماید. از سرورهای متعدد برای حاشیه نویسی استفاده می نماید.(برای مقیاس پذیری ) حاشیه نویسی وب معنایی
13
ابزارهای حاشیه نویسی دستی
Annotea(2001) بر اساس تکنولوژی های W3C بنا شده است: XPointer:چه قسمتی از سند حاشیه نویسی شده است. XLink:پیوند محتوا به بدنه حاشیه نویسی GET and POST the metadata :HTTP حاشیه نویسی وب معنایی
14
ابزارهای حاشیه نویسی دستی
Annotea(2001) حاشیه نویسی وب معنایی
15
ابزارهای حاشیه نویسی دستی
حاشیه نویسی وب معنایی
16
ابزارهای حاشیه نویسی دستی
معایب ابزار Annotea: عدم استفاده از ابزارهای استخراج متن مبتنی بر آنتولوژی مشخصی نمی باشد.که این به نوبه خود امکان اشتراک داده های سایتهای مختلف را نمی دهد. اگر کاربر یک سند حاشیه نویسی را ویرایش نماید،Xpointer یک حاشیه نویسی ممکن است به محل اشتباه اشاره نماید ،بنابراین می تواند Annotation گمراه کننده شود.(تا حدودی جبران شده است.) حاشیه نویسی وب معنایی
17
ابزارهای حاشیه نویسی دستی
Semantic Word(2003) محیطی برای تالیف اسناد متنی مبتنی بر MS WORD می باشد که هدفش کاهش بار تالیف حاشیه نویسیهای معنایی می باشد. دامنه کاربرد Semantic Word در موارد زیر مناسب تر است: سندی که می خواهد تالیف شود به موضوعات کم تری محدود باشد.در این حالت تلاش برای راه اندازی محیطی که مناسب این موضوعات باشد ،مناسب می باشد. درجه بالای از استفاده مجدد از محتوا هست.امکان استفاده حاشیه نویسیها در محتوا می باشد. حاشیه نویسی وب معنایی
18
ابزارهای حاشیه نویسی دستی
Semantic Word حاشیه نویسی وب معنایی
19
ابزارهای حاشیه نویسی دستی
Semantic Word ویرایش مستقیم حاشیه نویسیها مولف نیاز به دنبال کردن ترتیب سخت گیرانه ای که شامل مراحل زیادی برای تالیف توصیفات معنایی می شود،ندارد. استفاده مجدد از حاشیه نویسیها استخراج اطلاعات الگوهای حاشیه نویسی Annotation text region : در Semantic Word حاشیه نویسیها در طول متن توزیع شده و به Text region ضمیمه می شوند که محتوایش را حمایت می حاشیه نویسی وب معنایی
20
ابزارهای حاشیه نویسی دستی
(2002)Cream هدف Cream ایجاد ابزاری برای ایجاد متاداده به صورت راحت و موثر می باشد. Cream از روش حاشیه نویسی مبتنی بر آنتولوژی استفاده می نماید. یک ویژگی به خصوص Cream ایجاد متا داده رابطه ای است که امکان ایجاد پیوند بین حاشیه نویسی ها را نیز فراهم می نماید. حاشیه نویسی وب معنایی
21
ابزارهای حاشیه نویسی دستی
سایر ابزارهای حاشیه نویسی دستی: OntoAnnotate: فریم ورکی برای وب معنایی شامل ابزارهایی برای حاشیه نویسی دستی و نیمه اتوماتیک صفحات SHOE: امکان حاشیه نویسی با راهنمایی آنتولوژی های محلی یا ازطریق URI را می دهد. … حاشیه نویسی وب معنایی
22
معایب سیستمهای حاشیه نویسی دستی
امکان بروز خطا به دلایل: میزان آشنایی حاشیه نویس با دامنه میزان آموزش انگیزه شخصی و الگوهای پیچیده حاشیه نویسی دستی یک پروسه گران می باشد معمولا به این مسئله که دیدهای چند گانه از منابع داده ،نیازمند آنتولوژیهای چندگانه،می تواند برای پشتیبانی کاربران متفاوت مفید باشد،نمی پردازد. حاشیه نویسی دستی حجم اسناد موجود روی وب می باشد. حاشیه نویسی وب معنایی
23
حاشیه نویسی نیمه اتوماتیک
ابزار حاشيه نويسي استخراج اطلاعات Tagstags tags Tagtags tagstagstag اسناد حاشيه نويسي شده اسناد حاشيه نويس حاشیه نویسی وب معنایی
24
حاشیه نویسی نیمه اتوماتیک
مفهوم نیمه اتوماتیک،نسبت به سیستمهای تمام اتوماتیک،نیاز بود چرا که هنوز امکان تشخیص اتوماتیک و کلاس بندی تمام موجودیتهای درون اسناد با دقت کامل وجود ندارد. تمام سیستمهای حاشیه نویسی موجود به مداخله انسان در برخی از قسمتهای پروسه حاشیه نویسی نیاز دارند . وزن حاشیه نویسی اسناد جدید را کاهش می دهد. مزیت بالقوه دیگر سازگاری آنتولوژیهای بکار رفته می باشد و استفاده از چند آنتولوژی برای حاشیه نویسی یک سند می باشد. در حاشیه نویسی های نیمه اتوماتیک ما می خواهیم نقش فرد را از حاشیه نویس به ناظر تغییردهیم. حاشیه نویسی وب معنایی
25
حاشیه نویسی نیمه اتوماتیک
معماری عمومی پلت فورم حاشیه نویسی معنایی حاشیه نویسی وب معنایی
26
حاشیه نویسی نیمه اتوماتیک
پلت فورمهای حاشیه نویسی معنایی می توانند براساس نوع روش حاشیه نویسی استفاده شده دسته بندی شوند: مبتنی بر الگو مبتنی بر یادگیری ماشین حاشیه نویسی وب معنایی
27
حاشیه نویسی نیمه اتوماتیک
: Melita برای کمک به حاشیه نویسی از AIE (Amilecare)استفاده می نماید. نوآوری: قابلیت تنظیم سیستم AIEتوسط موتور IE فراهم شده است. روش کار: 1- سندی توسط کاربر حاشیه نویسی می شود. 2-در حالی که کاربر به حاشیه نویسی دومی می پردازد اولی به سیستم IE برای یادگیری فرستاده می شود. 3-تگ های اضافه شده را بر داشته وخود شروع به حاشیه نویسی سند می کند . 4- نتیجه با سند حاشیه نویسی شده دستی مقایسه می کند. آن قدر این عمل تکرار می شود تا به دقت مورد نیاز (که معمولا مشخص می شود)برسد. 5-در این هنگام به کاربر گفته می شود که به حالت ناظر برود و اسناد به شکل اتوماتیک توسط سیستم حاشیه نویسی می شود حاشیه نویسی وب معنایی
28
حاشیه نویسی نیمه اتوماتیک
MnM: ایده استفاده از آنتولوژی به عنوان مبنای حاشیه نویسی،اولین بار توسط MnM به کار گرفته شد . حاشیه نویسی نیمه و تمام اتوماتیک صفحات وب را پشتیبانی می نماید. یکی از اهداف اصلی این ابزار فراهم کردن محیطی برای استفاده توسط کاربران مختلف با هر میزان دانش می باشد. استفاده از چند آنتولوژی حاشیه نویسی وب معنایی
29
ابزارهای حاشیه نویسی نیمه اتوماتیک
مدل پروسه MnM: 1)Browse :مرور صفحه و انتخاب آنتولوژی 2)MarkUp : انتخاب قسمت دلخواه و مرتبط کردن با آنتولوژی 3)Learn :اجرای الگوریتم یادگیری برای آموزش استخراج قوانین tagging , correction: قانون tagging :مشخص نمودن قسمتهایی که باید حاشیه نویسی شوند. قوانین درستی:کاهش درجه خطا 4)Test: می توان با مقایسه قوانین ایجاد شده با صفحات حاشیه نویسی شده دستی،دقت و معیارهای فراخوانی مکانیسم IEرا تعیین نماید. 5)Extraction : قوانین برای استخراج اتوماتیک و حاشیه نویسی صفحات وب استفاده می شود. حاشیه نویسی وب معنایی
30
ابزارهای حاشیه نویسی نیمه اتوماتیک
KIM (Knowledge and Information Management): مدیریت اطلاعات و دانش حاشیه نویسی نیمه/تمام اتوماتیک ذخیره و بازیابی معنایی اطلاعات مبتنی بر آنتولوژی نگهداری مجزای اسناد,متاداده ها و آنتوژیها تکنولوژی های استفاده شده: Sesame Lucence Gate حاشیه نویسی وب معنایی
31
حاشیه نویسی اتوماتیک استخراج اطلاعات اسناد اسناد حاشيه نويسي شده
ابزار حاشيه نويسي استخراج اطلاعات Tagstags tags Tagstag tagtagstagstagstagstags اسناد حاشيه نويسي شده اسناد تلاش های انجام شده: PANKOW C-PANKOW Armadillo …. حاشیه نویسی وب معنایی
32
حاشیه نویسی اتوماتیک (Pattern-based Annotation through Knowledge On the Web) :PANKOW یکی از بزرگترین تلاش ها برای حاشیه نویسی وب معنایی استفاده از وب به عنوان منبع داده که این مسئله مشکل پراکندگی داده را حل می نماید. مبتنی بر الگو بدون ناظر اتوماتیک نمودن حاشیه نویسی حاشیه نویسی نیمه اتوماتیک نتیجه بهتری را می دهد. حاشیه نویسی وب معنایی
33
حاشیه نویسی اتوماتیک فرایند PANKOW حاشیه نویسی وب معنایی
34
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
35
جمع بندی خصوصیات ابزارهای حاشیه نویسی
پلت فورم روش حاشيه نويسي روش استخراج اطلاعات استفاده از يادگيري ماشين استفاده از قوانين دستي آنتولوژي راه انداز نوع آنتولوژي دقت فراخواني AeroDAML[14] نيمه اتوماتيک Rule نه بله WordNet DAML+OIL - Armadillo[8] نيمه/تمام اتوماتيک Pattern Discovery User OWL 91 74 KIM KIMO (RDFS) 86 82 MnM[5] Wrapper Induction KMi RDF ,DAML+OIL 95 90 MUSE 93 92 Ont-O-Mat Amilcare[10] Ont-O-Mat PANKOW 65 28 SemTag[6] TAP Melita AmileCare Semantic word[23] دستي Annotea[4] ندارد بالاترین عمکرد در بین روش های مبتنی بر یادگیری ماشین بالاترین عمکرد در بین روش های مبتنی بر الگو جدول1- جمع بندی خصوصیات ابزارهای حاشیه نویسی حاشیه نویسی وب معنایی
36
موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی
بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری
37
ایده اول برای حل مساله می توان از روشهای مختلفی استفاده نمود:
1-محاسبه شباهت مفاهیم صفحه با تک تک آنتولوژی ها 2-پرس و جو از موتور جستجوی آنتولوژی مانند:Swoogle , OntoSearch 3-ادغام دو آنتولوژی با شباهت بیشتر به متن در این مرحله کلمات کلیدی متن استخراج شده و فهرست بندی می شوند. می توان همچنین آنها را بر اساس تعداد دفعات تکرار مرتب نمود. مخزن آنتولوژی --- - Ontology-based tagging انتخاب آنتولوژی مناسب تایپURL صفحه مورد نظر پیمایش و ذخیره صفحات دامنه(Focus Crawler) آنتولوژی انتخاب شده استخراج آنتولوژی دامنه مرحله یادگیری و استفاده از یادگیری ماشین برای افزودن تگهای بیشتر حاشیه نویسی دامنه مشخص شده دانلود صفحه و تبدیل آن به متن استخراج کلمات کلیدی آنتولوژی انتخاب شده در یک ویرایشگر آنتولوژی باز می شود(مانند OntoEdit) تا امکان ویرایش و افزودن مفاهیم و روابط جدید و غنی سازی آن وجود داشته باشد. اسناد حاشیه نویسی شده بر اساس آنتولوژی دامنه حاشیه نویسی وب معنایی
38
ابزار استخراج اطلاعات مبتنی بر آنتولوژی
ایده دوم برای حل مساله Sharif : <rdf:Description rdf:ID="Sharif"> <rdf:type rdf:resource="#University" /> <rdfs:label ml:lang="en"> Esfahan </rdfs:label> </rdf:Description> مولف Sharif …. انتخابContext و آنتولوژی مناسب ابزار استخراج اطلاعات مبتنی بر آنتولوژی مخزن آنتولوژي حاشیه نویسی وب معنایی
39
معیارهای ارزیابی مدل معیارهای استاندارد برای ارزیابی مدل های حاشیه نویسی : دقت: Precision= فراخوانی: Recall= که all تمام حاشیه نویسی هایی است که توسط فرد ایجاد می شود. Accurate حاشیه نویسی ها درست توسط سیستم Inaccurate حاشیه نویسی های نادرست توسط سیستم accurate all accurate accurate+inaccurate حاشیه نویسی وب معنایی
40
زمان بندی کارهای آتی تهيه يک مجموعه آزمايش براي ارزيابي مدل 1.5ماه
تهيه يک مجموعه آزمايش براي ارزيابي مدل ماه ارائه مدلي براي انتخاب آنتولوژي مناسب ماه انتخاب مدلي مناسب براي استخراج اطلاعات با يادگيري ماه پياده سازي مدل ماه ارزيابي مدل و ارائه مقاله ماه نوشتن پايان نامه ماه حاشیه نویسی وب معنایی
41
فهرست منابع [1]Cimiano, P., Handschuh, S., & Staab, S. (2004). Towards the Self-Annotating Web. Thirteenth International Conference on World Wide Web, New York, NY, USA, [2]S. Handschuh, S. Staab, and F. Ciravegna. S-CREAM — Semi-automatic CREAtion of Metadata.In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management,LNCS/LNAI 2473, pages 358–372, Sig¨uenza, Spain, October Springer. [3] S. Handschuh, S. Staab, and A. Maedche. CREAM — Creating relational metadata with a componentbased,ontology-driven annotation framework. In Proceedings of K-Cap 2001, pages 76–83. ACM Press,2001. [4]J. Kahan, M. Koivunen, E. Prud’Hommeaux, and R. Swick. Annotea: An Open RDF Infrastructure for Shared Web Annotations. In Proceedings of the Tenth International World Wide Web Conference, WWW10, Hong Kong, China, May 1-5, 2001, pages 623–632. ACM Press, 2001. [5]N. Kushmerick. Wrapper Induction: Efficiency and Expressiveness. Artificial Intelligence, 118(1-2):15–68, 2000. [6] M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt, and F. Ciravegna. MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup. In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management, LNCS/LNAI 2473, pages 379–391,Sig¨uenza, Spain, October Springer. [7] Dill, S., Eiron, N., Gibson, D., Gruhl, D., Guha, R., & Jhingran, A. et al. (2003). SemTag and Seeker: Bootstrapping the Semantic Web via Automated Semantic Annotation. Twelfth International World Wide Web Conference, Budapest, Hungary, حاشیه نویسی وب معنایی
42
فهرست منابع [8] Siegfried Handschuh, Steffen Staab, and Raphael Volz. On deep annotation. In Proceeding of the WWW The Twelfth International World Wide Web Conferenceb (to appear), Budapest, HUNGARY,May 2003. [9] Dingli, A., Ciravegna, F., & Wilks, Y. (2003). Automatic Semantic Annotation using Unsupervised Information Extraction and Integration. Proceedings of the Workshop on Knowledge Markup and Semantic Annotation at the Second International Conference on Knowledge Capture (K-CAP 2003), Florida, USA. [10] Erdmann, A. Maedche, H.-P. Schnurr, and S. Staab. From Manual to Semi-automatic Semantic Annotation:About Ontology-based Text Annotation Tools. In P. Buitelaar & K. Hasida (eds). Proceedings of the COLING 2000Workshop on Semantic Annotation and Intelligent Content, Luxembourg, August 2000. [11 Fabio Ciravegna and Yorick Wilks. Designing Adaptive Information Extraction for the Semantic Web in Amilcare. Annotation for semantic web, 2003. [12]P. Cross, L. Miller, and S. Palmer. Using RDF to Annotate the (Semantic)Web. In K-Cap Workshop on Knowledge Markup and Semantic Annotation, Victoria,B.C.,Canada, October 2001. … حاشیه نویسی وب معنایی
43
با تشكر از توجه شما سوال؟ حاشیه نویسی وب معنایی
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.