Semantic Web Annotation

Slides:



Advertisements
Similar presentations
Language Technologies Reality and Promise in AKT Yorick Wilks and Fabio Ciravegna Department of Computer Science, University of Sheffield.
Advertisements

Semantic Web for Generalized Knowledge Management
02/04/09Danica Damljanović1 Natural Language Interfaces to conceptual models: usability and performance Danica Damljanović
SemTag and Seeker: Bootstrapping the Semantic Web via Automated Semantic Annotation Presented by: Hussain Sattuwala Stephen Dill, Nadav Eiron, David Gibson,
Ontology-based Annotation Sergey Sosnovsky
Extraction and Indexing of Triplet- Based Knowledge Using Natural Language Processing From Text to Information.
Towards the Self-Annotating Web Philipp Cimiano, Siegfried Handschuh, Steffen Staab Presenter: Hieu K Le (most of slides come from Philipp Cimiano) CS598CXZ.
Language Technology for the Semantic Web OntoWeb/AgentLink, Barcelona: February 4 th,2003 OntoWeb SIG5 Language Technology in.
The Web of data with meaning... By Michael Griffiths.
1 Introduction to XML. XML eXtensible implies that users define tag content Markup implies it is a coded document Language implies it is a metalanguage.
Surfing the Service Web Sudhir Agarwal, Siegfried Handschuh, and Steffen Staab Presenter: Yihong Ding.
Semi-Supervised, Knowledge-Based Information Extraction for the Semantic Web Thomas L. Packer Funded in part by the National Science Foundation. 1.
CS652 Spring 2004 Summary. Course Objectives  Learn how to extract, structure, and integrate Web information  Learn what the Semantic Web is  Learn.
Annotation for the Semantic Web Yihong Ding A PhD Research Area Background Study.
Low-cost semantics-enhanced web browsing with Magpie Enrico Motta Knowledge Media Institute The Open University, UK.
BTW (“By The Way…”) Information Annotation By Rudd Stevens, Jason Endo University of San Francisco.
Gimme’ The Context: Context- driven Automatic Semantic Annotation with CPANKOW Philipp Cimiano et al.
By ANDREW ZITZELBERGER A Framework for Extraction Ontology Based Information Management.
Samad Paydar Web Technology Laboratory Computer Engineering Department Ferdowsi University of Mashhad 1389/11/20 An Introduction to the Semantic Web.
Knowledge Extraction by using an Ontology- based Annotation Tool Knowledge Media Institute(KMi) The Open University Milton Keynes, MK7 6AA October 2001.
Swoogle Swoogle Semantic Search Engine Web-enhanced Information Management Bin Wang.
1 Information Integration and Source Wrapping Jose Luis Ambite, USC/ISI.
Semantic Web Research: Visual Modelling of OWL-S Services Computer Science Annual Workshop September 2004 Charlie Abela, James Scicluna Department of Computer.
 Copyright 2009 Digital Enterprise Research Institute. All rights reserved Digital Enterprise Research Institute Ontologies & Natural Language.
Semantic Web Technology Evaluation Ontology (SWETO): A test bed for evaluating tools and benchmarking semantic applications WWW2004 (New York, May 22,
06/03/'07 upd 04/03/08CmpE 588 Spring 2008 EMU1 Tools for Semantic Annotation Atilla ELÇİ Dept. of Computer Engineering Eastern Mediterranean University.
Temporal Event Map Construction For Event Search Qing Li Department of Computer Science City University of Hong Kong.
04.10.’04 updated ’06CmpE 583 Fall 2008Terminology- 1 CmpE 583- Web Semantics: Theory and Practice TERMINOLOGY Atilla ELÇİ Computer Engineering Department.
Personalized Information Retrieval in Context David Vallet Universidad Autónoma de Madrid, Escuela Politécnica Superior,Spain.
© Copyright 2008 STI INNSBRUCK Semantic Web Semantic Annotation Dieter Fensel Katharina Siorpaes.
Language Technology for the Semantic Web OntoWeb5,Florida,October 17 th,2003 WP12: Language Technology Overview SIG5 Paul Buitelaar.
Bootstrapping the semantic web (Ontology population & Annotation) Semantic Web - Spring 2008 Computer Engineering Department Sharif University of Technology.
Mining the Semantic Web: Requirements for Machine Learning Fabio Ciravegna, Sam Chapman Presented by Steve Hookway 10/20/05.
Survey of Semantic Annotation Platforms
Authors: Ting Wang, Yaoyong Li, Kalina Bontcheva, Hamish Cunningham, Ji Wang Presented by: Khalifeh Al-Jadda Automatic Extraction of Hierarchical Relations.
OWL Capturing Semantic Information using a Standard Web Ontology Language Aditya Kalyanpur Jennifer Jay Banerjee James Hendler Presented By Rami Al-Ghanmi.
Logics for Data and Knowledge Representation
Information Systems & Semantic Web University of Koblenz ▪ Landau, Germany Semantic Web - Multimedia Annotation – Steffen Staab
SWETO: Large-Scale Semantic Web Test-bed Ontology In Action Workshop (Banff Alberta, Canada June 21 st 2004) Boanerges Aleman-MezaBoanerges Aleman-Meza,
PAUL ALEXANDRU CHIRITA STEFANIA COSTACHE SIEGFRIED HANDSCHUH WOLFGANG NEJDL 1* L3S RESEARCH CENTER 2* NATIONAL UNIVERSITY OF IRELAND PROCEEDINGS OF THE.
Populating Ontologies for the Semantic Web Alexiei Dingli.
1 Technologies for (semi-) automatic metadata creation Diana Maynard.
1 Dr Alexiei Dingli Introduction to Web Science Harvesting the SW.
Introduction to World Wide Web Authoring © Directorate of Information Systems and Services University of Aberdeen, 1999 IT Training Workshop.
AIAI, The University of Edinburgh Jessica Chen-Burger A Few Highlights from IJCAI 2001, Seattle, USA.
updated CmpE 583 Fall 2008 Ontology Integration- 1 CmpE 583- Web Semantics: Theory and Practice ONTOLOGY INTEGRATION Atilla ELÇİ Computer.
© Copyright 2008 STI INNSBRUCK Semantic Annotation Semantic Web Lecture Dieter Fensel.
A Semantic-Web based Framework for Developing Applications to Improve Accessibility in the WWW Michail Salampasis Dept. of Informatics TEI of Thessaloniki.
Problems in Semantic Search Krishnamurthy Viswanathan and Varish Mulwad {krishna3, varish1} AT umbc DOT edu 1.
Evaluating Semantic Metadata without the Presence of a Gold Standard Yuangui Lei, Andriy Nikolov, Victoria Uren, Enrico Motta Knowledge Media Institute,
Workshop on Human Language Technology for the Semantic Web and Web Services 2nd International Semantic Web Conference October 20th 2003, Sanibel Island,
Semi-Automatic Quality Assessment of Linked Data without Requiring Ontology Saemi Jang, Megawati, Jiyeon Choi, and Mun Yong Yi KIRD, KAIST NLP&DBPEDIA.
CMPE 588 ENGINEERING THE SEMANTIC WEB INFORMATION SYSTEM ONTOLOGY-DRIVEN SEMANTIC MARK UP OF UNSTRUCTURED TEXTS EASTERN MEDITERRANEAN UNIVERSITY COMPUTER.
CREAM: Semantic annotation system May 24, 2013 Hee-gook Jun.
Of 33 lecture 1: introduction. of 33 the semantic web vision today’s web (1) web content – for human consumption (no structural information) people search.
Semantic web Bootstrapping & Annotation Hassan Sayyadi Semantic web research laboratory Computer department Sharif university of.
DANIELA KOLAROVA INSTITUTE OF INFORMATION TECHNOLOGIES, BAS Multimedia Semantics and the Semantic Web.
Semantic Web 06 T 0006 YOSHIYUKI Osawa. Problem of current web  limits of search engines Most web pages are only groups of character strings. Most web.
WP1: Application Ontology Management Maria Teresa Pazienza Dept. Of Computer Science University of Rome “Tor Vergata”
Semantic Web Technologies Readings discussion Research presentations Projects & Papers discussions.
WP15- Dissemination & Exploitation INMARK
The Semantic Web By: Maulik Parikh.
Generating Semantic Annotations
Information Extraction from Wikipedia: Moving Down the Long Tail
دانشکده مهندسي کامپيوتر
RDF For Semantic Web Dhaval Patel 2nd Year Student School of IT
Restrict Range of Data Collection for Topic Trend Detection
Zachary Cleaver Semantic Web.
Introduction to Web Science
Hierarchical, Perceptron-like Learning for OBIE
Presentation transcript:

Semantic Web Annotation In The Name of Allah Computer Engineering Department Sharif University of Technology حاشیه نویسی وب معنایی Semantic Web Annotation سید امير شيخ احمدي : 83700838 sheickahmadi@ce.sharif.edu استاد راهنما: دکتر ابوالحسنی استاد مشاور: دکتر قدسی

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

تعریف مسئله حجم زیاد اطلاعات روی وب جستجوی نامناسب ، عدم تبادل اطلاعات توسط عامل ها وب معنایی: افزودن متاداده به وب فعلی نحوه درج متا داده ها؟ استفاده از روش های متفاوت حاشیه نویسی حاشیه نویسی وب معنایی

تعریف مسئله(1) آنتولوژی: عناصر تشکیل دهنده آنتولوژی: توصیف فرمال مفاهیم عناصر تشکیل دهنده آنتولوژی: مفاهیم روابط خصوصیات نمونه ها حاشیه نویسی وب معنایی

تعریف مسئله(2) حاشیه نویسی وب معنایی

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

تعاریف حاشیه نویسی Merriam-Webster: HCI: یک تذکر که به روش توضیح یا توصیف اضافه می شود. HCI: یک annotation به شکل توضیحی روی یک شی که حاشیه نویس تمایل دارد از هر شی دیگری مجزا باشد،بررسی می شود. استخراج مفاهيم دامنه از صفحات وب با استفاده از آنتولوژي و درج آن ها با ساختار هاي معنايي درون صفحه هاي وب يا سرورهاي خاص مي باشد. حاشیه نویسی وب معنایی

زیر فرایند های ایجاد یک حاشیه نویسی انتخاب (قسمتی از) سند ی که باید حاشیه نویسی شود(منبع) انتخاب عنصر نمایش که نتیجه تابع است(هدف) تعریف نوع و خصوصیات تابع در اتوماتیک همگی نرم افزاری در نیمه اتوماتیک حداقل یک مورد نرم افزاری در دستی همگی توسط عامل انسانی انجام می شود حاشیه نویسی وب معنایی

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

حاشیه نویسی دستی ويرايش گر اسناد ويرايش گر اسناد حاشيه نويس حاشيه نويس Tagstags Tags tagsTags tagstagtags agstagstags اسناد حاشيه نويسی شده اسناد ويرايش گر Tagstags Tags tagsTags tagstagtags agstagstags اسناد حاشيه نويسی شده حاشيه نويس اسناد حاشيه نويس حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Annotea(2001) مفاهیم اصلی که در توسعه Annotea منظور شده است: استفاده از تکنولوژی باز فقط پشتیبانی از اسناد ساختاریافته از قبیل HTML&XML حاشیه نویسیها باید دارای URI باشند. حاشیه نویسیها باید دارای نوع باشند(که توسط کاربر مشخص می شود.) حاشیه نویسیها در پایگاه داده های عمومی RDF ذخیره می شوند.(سرورها) استفاده از RDF Schema قابل توسعه Client-less هر دونوع حاشیه نویسیهای محلی(خصوصی) و راه دور(اشتراکی)را پشتیبانی می نماید. از سرورهای متعدد برای حاشیه نویسی استفاده می نماید.(برای مقیاس پذیری ) حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Annotea(2001) بر اساس تکنولوژی های W3C بنا شده است: XPointer:چه قسمتی از سند حاشیه نویسی شده است. XLink:پیوند محتوا به بدنه حاشیه نویسی GET and POST the metadata :HTTP حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Annotea(2001) حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی معایب ابزار Annotea: عدم استفاده از ابزارهای استخراج متن مبتنی بر آنتولوژی مشخصی نمی باشد.که این به نوبه خود امکان اشتراک داده های سایتهای مختلف را نمی دهد. اگر کاربر یک سند حاشیه نویسی را ویرایش نماید،Xpointer یک حاشیه نویسی ممکن است به محل اشتباه اشاره نماید ،بنابراین می تواند Annotation گمراه کننده شود.(تا حدودی جبران شده است.) حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Semantic Word(2003) محیطی برای تالیف اسناد متنی مبتنی بر MS WORD می باشد که هدفش کاهش بار تالیف حاشیه نویسیهای معنایی می باشد. دامنه کاربرد Semantic Word در موارد زیر مناسب تر است: سندی که می خواهد تالیف شود به موضوعات کم تری محدود باشد.در این حالت تلاش برای راه اندازی محیطی که مناسب این موضوعات باشد ،مناسب می باشد. درجه بالای از استفاده مجدد از محتوا هست.امکان استفاده حاشیه نویسیها در محتوا می باشد. حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Semantic Word حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی Semantic Word ویرایش مستقیم حاشیه نویسیها مولف نیاز به دنبال کردن ترتیب سخت گیرانه ای که شامل مراحل زیادی برای تالیف توصیفات معنایی می شود،ندارد. استفاده مجدد از حاشیه نویسیها استخراج اطلاعات الگوهای حاشیه نویسی Annotation text region : در Semantic Word حاشیه نویسیها در طول متن توزیع شده و به Text region ضمیمه می شوند که محتوایش را حمایت می حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی (2002)Cream هدف Cream ایجاد ابزاری برای ایجاد متاداده به صورت راحت و موثر می باشد. Cream از روش حاشیه نویسی مبتنی بر آنتولوژی استفاده می نماید. یک ویژگی به خصوص Cream ایجاد متا داده رابطه ای است که امکان ایجاد پیوند بین حاشیه نویسی ها را نیز فراهم می نماید. حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی دستی سایر ابزارهای حاشیه نویسی دستی: OntoAnnotate: فریم ورکی برای وب معنایی شامل ابزارهایی برای حاشیه نویسی دستی و نیمه اتوماتیک صفحات SHOE: امکان حاشیه نویسی با راهنمایی آنتولوژی های محلی یا ازطریق URI را می دهد. … حاشیه نویسی وب معنایی

معایب سیستمهای حاشیه نویسی دستی امکان بروز خطا به دلایل: میزان آشنایی حاشیه نویس با دامنه میزان آموزش انگیزه شخصی و الگوهای پیچیده حاشیه نویسی دستی یک پروسه گران می باشد معمولا به این مسئله که دیدهای چند گانه از منابع داده ،نیازمند آنتولوژیهای چندگانه،می تواند برای پشتیبانی کاربران متفاوت مفید باشد،نمی پردازد. حاشیه نویسی دستی حجم اسناد موجود روی وب می باشد. حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک ابزار حاشيه نويسي استخراج اطلاعات Tagstags tags Tagtags tagstagstag اسناد حاشيه نويسي شده اسناد حاشيه نويس حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک مفهوم نیمه اتوماتیک،نسبت به سیستمهای تمام اتوماتیک،نیاز بود چرا که هنوز امکان تشخیص اتوماتیک و کلاس بندی تمام موجودیتهای درون اسناد با دقت کامل وجود ندارد. تمام سیستمهای حاشیه نویسی موجود به مداخله انسان در برخی از قسمتهای پروسه حاشیه نویسی نیاز دارند . وزن حاشیه نویسی اسناد جدید را کاهش می دهد. مزیت بالقوه دیگر سازگاری آنتولوژیهای بکار رفته می باشد و استفاده از چند آنتولوژی برای حاشیه نویسی یک سند می باشد. در حاشیه نویسی های نیمه اتوماتیک ما می خواهیم نقش فرد را از حاشیه نویس به ناظر تغییردهیم. حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک معماری عمومی پلت فورم حاشیه نویسی معنایی حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک پلت فورمهای حاشیه نویسی معنایی می توانند براساس نوع روش حاشیه نویسی استفاده شده دسته بندی شوند: مبتنی بر الگو مبتنی بر یادگیری ماشین حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک : Melita برای کمک به حاشیه نویسی از AIE (Amilecare)استفاده می نماید. نوآوری: قابلیت تنظیم سیستم AIEتوسط موتور IE فراهم شده است. روش کار: 1- سندی توسط کاربر حاشیه نویسی می شود. 2-در حالی که کاربر به حاشیه نویسی دومی می پردازد اولی به سیستم IE برای یادگیری فرستاده می شود. 3-تگ های اضافه شده را بر داشته وخود شروع به حاشیه نویسی سند می کند . 4- نتیجه با سند حاشیه نویسی شده دستی مقایسه می کند. آن قدر این عمل تکرار می شود تا به دقت مورد نیاز (که معمولا مشخص می شود)برسد. 5-در این هنگام به کاربر گفته می شود که به حالت ناظر برود و اسناد به شکل اتوماتیک توسط سیستم حاشیه نویسی می شود حاشیه نویسی وب معنایی

حاشیه نویسی نیمه اتوماتیک MnM: ایده استفاده از آنتولوژی به عنوان مبنای حاشیه نویسی،اولین بار توسط MnM به کار گرفته شد . حاشیه نویسی نیمه و تمام اتوماتیک صفحات وب را پشتیبانی می نماید. یکی از اهداف اصلی این ابزار فراهم کردن محیطی برای استفاده توسط کاربران مختلف با هر میزان دانش می باشد. استفاده از چند آنتولوژی حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی نیمه اتوماتیک مدل پروسه MnM: 1)Browse :مرور صفحه و انتخاب آنتولوژی 2)MarkUp : انتخاب قسمت دلخواه و مرتبط کردن با آنتولوژی 3)Learn :اجرای الگوریتم یادگیری برای آموزش استخراج قوانین tagging , correction: قانون tagging :مشخص نمودن قسمتهایی که باید حاشیه نویسی شوند. قوانین درستی:کاهش درجه خطا 4)Test: می توان با مقایسه قوانین ایجاد شده با صفحات حاشیه نویسی شده دستی،دقت و معیارهای فراخوانی مکانیسم IEرا تعیین نماید. 5)Extraction : قوانین برای استخراج اتوماتیک و حاشیه نویسی صفحات وب استفاده می شود. حاشیه نویسی وب معنایی

ابزارهای حاشیه نویسی نیمه اتوماتیک KIM (Knowledge and Information Management): مدیریت اطلاعات و دانش حاشیه نویسی نیمه/تمام اتوماتیک ذخیره و بازیابی معنایی اطلاعات مبتنی بر آنتولوژی نگهداری مجزای اسناد,متاداده ها و آنتوژیها تکنولوژی های استفاده شده: Sesame Lucence Gate حاشیه نویسی وب معنایی

حاشیه نویسی اتوماتیک استخراج اطلاعات اسناد اسناد حاشيه نويسي شده ابزار حاشيه نويسي استخراج اطلاعات Tagstags tags Tagstag tagtagstagstagstagstags اسناد حاشيه نويسي شده اسناد تلاش های انجام شده: PANKOW C-PANKOW Armadillo …. حاشیه نویسی وب معنایی

حاشیه نویسی اتوماتیک (Pattern-based Annotation through Knowledge On the Web) :PANKOW یکی از بزرگترین تلاش ها برای حاشیه نویسی وب معنایی استفاده از وب به عنوان منبع داده که این مسئله مشکل پراکندگی داده را حل می نماید. مبتنی بر الگو بدون ناظر اتوماتیک نمودن حاشیه نویسی حاشیه نویسی نیمه اتوماتیک نتیجه بهتری را می دهد. حاشیه نویسی وب معنایی

حاشیه نویسی اتوماتیک فرایند PANKOW حاشیه نویسی وب معنایی

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

جمع بندی خصوصیات ابزارهای حاشیه نویسی پلت فورم روش حاشيه نويسي روش استخراج اطلاعات استفاده از يادگيري ماشين استفاده از قوانين دستي آنتولوژي راه انداز نوع آنتولوژي دقت فراخواني AeroDAML[14] نيمه اتوماتيک Rule نه بله WordNet DAML+OIL - Armadillo[8] نيمه/تمام اتوماتيک Pattern Discovery User OWL 91 74 KIM KIMO (RDFS) 86 82 MnM[5] Wrapper Induction KMi RDF ,DAML+OIL 95 90 MUSE 93 92 Ont-O-Mat Amilcare[10] Ont-O-Mat PANKOW 65 28 SemTag[6] TAP Melita AmileCare Semantic word[23] دستي Annotea[4] ندارد بالاترین عمکرد در بین روش های مبتنی بر یادگیری ماشین بالاترین عمکرد در بین روش های مبتنی بر الگو جدول1- جمع بندی خصوصیات ابزارهای حاشیه نویسی حاشیه نویسی وب معنایی

موضوعات بررسی شده تعریف مسئله تعاریف حاشیه نویسی بررسی روش های حاشیه نویسی روش دستی روش نیمه اتوماتیک روش اتوماتیک جمع بندی روش های موجود ایده های ما برای حل مساله فهرست منابع حاشیه نویسی وب معنایی سمینار درس موضوعات پیشرفته در سیستمهای نرم افزاری

ایده اول برای حل مساله می توان از روشهای مختلفی استفاده نمود: 1-محاسبه شباهت مفاهیم صفحه با تک تک آنتولوژی ها 2-پرس و جو از موتور جستجوی آنتولوژی مانند:Swoogle , OntoSearch 3-ادغام دو آنتولوژی با شباهت بیشتر به متن در این مرحله کلمات کلیدی متن استخراج شده و فهرست بندی می شوند. می توان همچنین آنها را بر اساس تعداد دفعات تکرار مرتب نمود. مخزن آنتولوژی --- - Ontology-based tagging انتخاب آنتولوژی مناسب تایپURL صفحه مورد نظر پیمایش و ذخیره صفحات دامنه(Focus Crawler) آنتولوژی انتخاب شده استخراج آنتولوژی دامنه مرحله یادگیری و استفاده از یادگیری ماشین برای افزودن تگهای بیشتر حاشیه نویسی دامنه مشخص شده دانلود صفحه و تبدیل آن به متن استخراج کلمات کلیدی آنتولوژی انتخاب شده در یک ویرایشگر آنتولوژی باز می شود(مانند OntoEdit) تا امکان ویرایش و افزودن مفاهیم و روابط جدید و غنی سازی آن وجود داشته باشد. اسناد حاشیه نویسی شده بر اساس آنتولوژی دامنه حاشیه نویسی وب معنایی

ابزار استخراج اطلاعات مبتنی بر آنتولوژی ایده دوم برای حل مساله Sharif : <rdf:Description rdf:ID="Sharif"> <rdf:type rdf:resource="#University" /> <rdfs:label ml:lang="en"> Esfahan </rdfs:label> </rdf:Description> مولف Sharif …. انتخابContext و آنتولوژی مناسب ابزار استخراج اطلاعات مبتنی بر آنتولوژی مخزن آنتولوژي حاشیه نویسی وب معنایی

معیارهای ارزیابی مدل معیارهای استاندارد برای ارزیابی مدل های حاشیه نویسی : دقت: Precision= فراخوانی: Recall= که all تمام حاشیه نویسی هایی است که توسط فرد ایجاد می شود. Accurate حاشیه نویسی ها درست توسط سیستم Inaccurate حاشیه نویسی های نادرست توسط سیستم accurate all accurate accurate+inaccurate حاشیه نویسی وب معنایی

زمان بندی کارهای آتی تهيه يک مجموعه آزمايش براي ارزيابي مدل 1.5ماه تهيه يک مجموعه آزمايش براي ارزيابي مدل 1.5ماه ارائه مدلي براي انتخاب آنتولوژي مناسب 1.5ماه انتخاب مدلي مناسب براي استخراج اطلاعات با يادگيري 1.5ماه پياده سازي مدل 2 ماه ارزيابي مدل و ارائه مقاله 1.5ماه نوشتن پايان نامه 1 ماه حاشیه نویسی وب معنایی

فهرست منابع [1]Cimiano, P., Handschuh, S., & Staab, S. (2004). Towards the Self-Annotating Web. Thirteenth International Conference on World Wide Web, New York, NY, USA, 462-471 [2]S. Handschuh, S. Staab, and F. Ciravegna. S-CREAM — Semi-automatic CREAtion of Metadata.In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management,LNCS/LNAI 2473, pages 358–372, Sig¨uenza, Spain, October 2002. Springer. [3] S. Handschuh, S. Staab, and A. Maedche. CREAM — Creating relational metadata with a componentbased,ontology-driven annotation framework. In Proceedings of K-Cap 2001, pages 76–83. ACM Press,2001. [4]J. Kahan, M. Koivunen, E. Prud’Hommeaux, and R. Swick. Annotea: An Open RDF Infrastructure for Shared Web Annotations. In Proceedings of the Tenth International World Wide Web Conference, WWW10, Hong Kong, China, May 1-5, 2001, pages 623–632. ACM Press, 2001. [5]N. Kushmerick. Wrapper Induction: Efficiency and Expressiveness. Artificial Intelligence, 118(1-2):15–68, 2000. [6] M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt, and F. Ciravegna. MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup. In EKAW02, 13th International Conference on Knowledge Engineering and Knowledge Management, LNCS/LNAI 2473, pages 379–391,Sig¨uenza, Spain, October 2002. Springer. [7] Dill, S., Eiron, N., Gibson, D., Gruhl, D., Guha, R., & Jhingran, A. et al. (2003). SemTag and Seeker: Bootstrapping the Semantic Web via Automated Semantic Annotation. Twelfth International World Wide Web Conference, Budapest, Hungary, 178-186 حاشیه نویسی وب معنایی

فهرست منابع [8] Siegfried Handschuh, Steffen Staab, and Raphael Volz. On deep annotation. In Proceeding of the WWW2003 - The Twelfth International World Wide Web Conferenceb (to appear), Budapest, HUNGARY,May 2003. [9] Dingli, A., Ciravegna, F., & Wilks, Y. (2003). Automatic Semantic Annotation using Unsupervised Information Extraction and Integration. Proceedings of the Workshop on Knowledge Markup and Semantic Annotation at the Second International Conference on Knowledge Capture (K-CAP 2003), Florida, USA. [10] Erdmann, A. Maedche, H.-P. Schnurr, and S. Staab. From Manual to Semi-automatic Semantic Annotation:About Ontology-based Text Annotation Tools. In P. Buitelaar & K. Hasida (eds). Proceedings of the COLING 2000Workshop on Semantic Annotation and Intelligent Content, Luxembourg, August 2000. [11 Fabio Ciravegna and Yorick Wilks. Designing Adaptive Information Extraction for the Semantic Web in Amilcare. Annotation for semantic web, 2003. [12]P. Cross, L. Miller, and S. Palmer. Using RDF to Annotate the (Semantic)Web. In K-Cap Workshop on Knowledge Markup and Semantic Annotation, Victoria,B.C.,Canada, October 2001. … حاشیه نویسی وب معنایی

با تشكر از توجه شما سوال؟ حاشیه نویسی وب معنایی