DBpedia – A Crystallization Point for the Web of Data

Slides:



Advertisements
Similar presentations
ProQuest Digital Dissertations PQDD 学位论文全文库. 1 、数据库简介 PQDD 是世界著名的学位论文数据库,收 录有欧美 1 , 000 余所大学文、理、工、农、医 等领域的博士、硕士学位论文,是学术研究中 十分重要的信息资源。 本数据库为 PQDD 文摘 数据库中部分记录的全文。
Advertisements

Nutch 二次开发介绍.  1.Nutch 二次开发中重点环节介绍 1.1 信息源选择及规范制定 1.2 信息预处理 1.3 索引构建 1.4 排序规则制定 1.5 查询系统及用户界面  2.Nutch 中的 plugin 介绍 2.1 Plugin 介绍 2.2 页面解析.
一、统计范围 注册地在湖里区的具有房地产开发资质的 房地产开发企业 无论目前是否有开发项目 无论开发的项目是在湖里区还是在其他区 没有开发项目的企业需要报送年报和月报 中的资金表(空表)。 新成立的项目公司,要先入库,再报报表。
DBpedia: A Nucleus for a Web of Open Data
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
CSCI 572 Project Presentation Mohsen Taheriyan Semantic Search on FOAF profiles.
PHPCMS 使用指南及二次开发向导 --- 系统设置篇 PHPCMS 网络培训课程 --- 系统设置篇 PHPCMS 项目部 王官庆制作 系统相关设置 1. 站点管理 2. 发布点管理 3. 系统其它设置 管理员设置 1. 角色定义 2. 管理员管理.
2011 年 2 月 产品介绍. 产品介绍 产品目标 产品目标 系统功能特性 系统功能特性 技术特点 技术特点 部署方式 部署方式.
本幻灯为医用耗材集中询价采购网上操作说明,请参考收费说明、供应厂商流程等文件 综合学习。幻灯次序按操作次序进行,可配合自身用户名对照学习。 操作人员:所有类别 操作说明:所有标 new 标志的文件,务必仔细查看。原有用户名和信息均可继续使用,新 使用人员可点击注册申请使用.
嵌入式操作系统 陈香兰 Fall 系统调用 10/27/09 嵌入式 OS 3/12 系统调用的意义  操作系统为用户态进程与硬件设备进行交互提供 了一组接口 —— 系统调用  把用户从底层的硬件编程中解放出来  极大的提高了系统的安全性  使用户程序具有可移植性.
Alexa 排名与 分级信息检索方法 刘骥 刘骥 前言 前言 从促进文献信息的广泛交流, Alexa 网站 排名知识和信息检索,利用网络资源促进利 互联网进行科学研究和提高效率和效益出发。 就 Alexa 网站、 Alexa 排名和分级信息检索方 法进行了阐述。对信息资源的利用、开放获.
万方数据资源系统. 数据库介绍 访问路径 检索方法 1. 数据库介绍 数字化期刊数据库 该库是万方数据资源系统的重 要组成部分,由万方数据自主建设。基本包括了我国 文献计量单位中自然科学类统计源刊和社会科学类核 心源期刊的全文资源,成为您了解 Internet 上中文期刊 的重要窗口。该库内容采用国际流行的.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
IGroup China ACM Digital Library 使用指南 iGroup 亚太资讯集团公司
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
第四章 数据库技术 面向对象数据库技术 多媒体数据库 数据仓库技术 Web 数据库 数据库技术发展概述 数据库系统已从第一代的网状、层次数据库系统,第二代 的关系数据库系统,发展到第三代以面向对象模型为主要 特征的数据库系统。 数据库技术与网络通信技术、人工智能技术、面向对象程 序设计技术、并行计算技术等互相渗透,互相结合,成为.
协同工作环境研究中心 协同共享 助力科研. 主要内容  认识协同及协同软件  协同科研软件 duckling 介绍.
LINKED DATA COMS E6125 Prof. Gail Kaiser Presented By : Mandar Mohe ( msm2181 )
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang
第二章 贝叶斯决策理论 3学时.
江南大学图书馆 2008 年 10 月 江南大学图书馆 彭奇志 基于本体的教学资源库 的构建研究 江南大学图书馆 彭奇志
第二章 通信技术基础 谈英姿 东南大学自控系工业自动化教研室. 通信技术基础 2.1 通信的基本概念 2.2 通信协议与网络层次分析 2.3 常用串行通信技术.
中国科学技术大学 《文献管理与信息分析》第十二讲 文献信息分析 - 引文分析 罗昭锋 中国扩科学技术大学图书馆.
编译原理总结. 基本概念  编译器 、解释器  编译过程 、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.
17 地理信息系统 地理信息系统概述17.1 地理信息系统概述 17.2 空间数据结构及其编码17.2 空间数据结构及其编码 17.3 地理信息系统的基本功能17.3 地理信息系统的基本功能 17.4 地理信息系统的应用及工具软件简介17.4 地理信息系统的应用及工具软件简介.
 符号表  标识符的作用: 声明部分:定义了各种对象及对应的属性和 使用规则。 程序体:对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token : 新表-符号表(种类、类型等信息):
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
流媒体视频文件的截取和插入 电教组 李红娟. 一、系统配置 软件配置:  操作系统: Microsoft Windows XP /2003  应用软件: 1 、 Extra.FLV 1.8 简介: FlV 视频截取软件。 2 、 Klmcodec434 (视频解码器) 简介:视频解码器。 硬件配置:(略)
系统介绍 一 二 系统登录 三 使用流程 四 信息维护 系统介绍 根据中国政府与有关国家政府签署的相互出具《最终用户和最终 用途说明》的协议,为了便利企业申办《最终用户和最终用途说 明》, 商务部机电和科技产业司委托中国国际电子商务中心开发了 《最终用户和最终用途说明》申请系统,企业可通过此系统填写.
西北农林科技大学文献信息搜索平台 建设汇报 北京世纪超星公司 目标: 让读者像使用 Google 、百度 一样搜索使用西北农林科技大学图书 馆学术资源 通过整合技术实现搜索西北农林科技大学 的纸质和电子资源,建设图书馆学术资源 门户.
1 基于数字地球框架的信息聚集服 务的设计与实现 许允飞 北京航空航天大学 数字地球与地理信息系统实验室.
学生成长成才导图填报指南 填报网址:
Entity Recognition via Querying DBpedia ElShaimaa Ali.
读秀学术搜索 是什么? 能够为我们解决 什么问题? 读秀.
Computer Networks and Internets 《计算机网络与因特网》课件 林坤辉
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
超星数字图书馆 一、页面的使用 进入数字图书馆网页 下载超星阅读器 查找图书.
企业产品标准信息公共服务平台 操作介绍 目录 一 、系统架构介绍 二 、企业产品标准自我声明填报系统 三 、企业产品标准公示系统.
表单自定义 “ 表单自定义 ” 功能是用于制作表单的 工具,用数飞 OA 提供的表单自定义 功能能够快速制作出内容丰富、格 式规范、美观的表单。
Introduction to the Semantic Web and Linked Data Module 1 - Unit 2 The Semantic Web and Linked Data Concepts 1-1 Library of Congress BIBFRAME Pilot Training.
检索 聪明的检索 简单自然  一框式检索,无须学习  逐步细化,贴近人的思维,容 易理解 善于甄别  挑选最相关、最权威、最新的 文献 总结联想  论文在检索结果中的学科、期 刊、时间等分布情况  启发思考 有礼貌  快速响应.
演示场景. 类图 配置 HibernateApplicationContext.xml hibernate.cfg.xml 创建数据库 – ooad/ooad 关于 Library/Project 模板.
“ 图书馆资源与服务利用 ” 专题讲座 第 9 讲 JSTOR 数据库与 Kluwer Online 数据库的使用.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
维普基础教育信息服务系统 —— 功能介绍与操作演示 重庆维普资讯有限公司. 维普基础教育信息服务系统( CEIS)  维普基础教育信息服务系统( China Education Information System ,简称 CEIS ),衍生于维普中文科技 期刊数据库,以满足中小学基础教育的各方面需求为目的,
广州国税 官方微信. 如何关注? 方法一:点击 “ 发现 ” , 使用 “ 扫一扫 ” 功能 >>>
开放教育学员入学须知 第一部分:浏览山东理工大学远程与继续 教育学院网站浏览山东理工大学远程与继续 教育学院网站 第二部分:浏览中央电大教学平台浏览中央电大教学平台 第三部分:浏览山东电大教学平台浏览山东电大教学平台 第四部分:浏览淄博电大教学平台浏览淄博电大教学平台 第五部分:淄博电大教学平台使用淄博电大教学平台使用.
曹辉 2013 年 9 月 北京市商业学校 数字化资源中心介绍. 一、信息化发展史 通信领域信息化发展史.
DBpedia - A Crystallization Point
U niversity of S cience and T echnology of C hina VxWorks 及其应用开发 陈香兰 年 7 月.
张勤 人大报刊复印资料 专题全文数据库 简 介简 介 《人大报刊资料全文数据库》是中国人民大 学书报资料中心与北京博利群电子信息有限 公司联合开发研制的大型数据库光盘。它涵 盖面广、信息量大、分类科学、筛选严谨、 结构合理,是国内最具权威的社会科学、人.
§5.6 利用希尔伯特 (Hilbert) 变换 研究系统的约束特性 希尔伯特变换的引入 可实现系统的网络函数与希尔伯特变换.
进口食品标签中介服务平台介绍 上海顺益信息科技有限公司. 目录页 平台操作 平台定义 平台功能 进口食品标签中介服务平台介绍.
第二节. 广告牌为什么会被风吹倒? 结构的稳定性: 指结构在负载的作用下 维持其原有平衡状态的能力。 它是结构的重要性质之一。
北大法意数据库应用. 讲座提要大纲 法律专业能力 法律实践 法律信息检索能力 互联网 法律信息检索能力是法律专业人士的核心能力之一 美国律师协会( ABA )把它明确规定在律师的工 作规范和职业道德中.
高校信息门户建设 清华大学计算机与信息管理中心 2005 年 7 月 高校信息门户及平台建设 清华大学计算机与信息管理中心 刘启新 2005 年 7 月.
资源与服务利用专题讲座 第 10 讲 : 汉语国际教育相关资料查找 徐红梅
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
SME.USTB Human Factors 人机工程学 By Wei Dong Department of Industry Design, SME, USTB.
Linked Data Web that can be processed by machines
Linked Data Platform zhengliang
SPARQL + RDF Based on: Prof. Benny Kimelfled’s lecture notes
Linked (Open) Data Speaker: 呂瑞麟 國立中興大學資訊管理學系教授
Sparql Examples.
DBpedia 2014 Liang Zheng 9.22.
相关工作报告 施林锋 丁文韬 于佳婕.
Introduction to Freebase
Linked Data Ryan McAlister.
Presentation transcript:

DBpedia – A Crystallization Point for the Web of Data Zheng Liang 2012.10

DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. The DBpedia knowledge base currently provides information about more than 3.77 million “things”, including at least: 764,000 persons 573,000 places(including 387,000 populated places) 333,000 creative works (including 112,000 music albums, 72,000 films and 18,000 video games) …… http://wiki.dbpedia.org/About

Contributions of the DBpedia An information extraction framework that converts Wikipedia content into a rich multi-domain knowledge base. Timely and automatically evolves as Wikipedia changes . A Web-dereferenceable identifier for each DBpedia entity .To overcome the problem of missing entity identifiers Publish RDF links pointing from DBpedia into other Web data sources and support data publishers in setting links from their data sources to DBpedia

Outline DBpedia Knowledge Extraction Framework DBpedia Knowledge Base Accessing the DBpedia Knowledge Base Interlinking DBpedia with other Data Sets DBpedia Applications Summary

DBpedia Knowledge Extraction Framework Open Archives Initiative Protocol for Metadata Harvesting

Extracting from Wikipedia Page Label Abstract Interlanguage Links Images Redirects Disambiguates External Links Pagelinks Homepages Categories Geo-coordinates

Extracting Infobox Data http://en.wikipedia.org/wiki/Nanjing http://dbpedia.org/resource/Nanjing dbpedia-owl:country dbpedia:China dbpedia-owl:elevation 15.240000 (xsd:double) dbpedia-owl:governmentType dbpedia-owl:isPartOf dbpedia:Jiangsu dbpedia-owl:populationTotal 8109100 (xsd:integer) dbpedia-owl:populationUrban 7165600 (xsd:integer) ... http://dbpedia.org/resource/Nanjing

http://dbpedia.org/resource/Nanjing

DBpedia常用URI及其含义 http://DBpedia.org/ontology/xxx 对应Wiki Infobox 类 http://DBpedia.org/ontology/Person Person 类 http://DBpedia.org/ontology/Book Book类 http://DBpedia.org/property/xxx Wiki Infobox-specific property http://DBpedia.org/property/reference 外部资源链接地址 http://DBpedia.org/property/wikilink 指向对应的Wiki文章 http://DBpedia.org/property/redirect 重定向信息 http://DBpedia.org/property/disambiguates 消除歧义属性 http://DBpedia.org/property/pageId 页面ID http://DBpedia.org/resource/XXXX 资源的名称信息

DBpedia Knowledge Base DBpedia Ontology is a shallow, cross-domain ontology, which has been manually created based on the most commonly used infoboxes within Wikipedia. The ontology currently covers 359 classes which form a subsumption hierarchy and are described by 1,775 different properties. http://dbpedia.org/ontology/

DBpedia Knowledge Base DBpedia DataSet provides three different classification schemata. Wikipedia Categories; using the SKOS vocabulary and DCMI terms. YAGO Classification; is derived from the Wikipedia category system using WordNet WordNet ; should be more precise than the Wikipedia category system.

Accessing the DBpedia Knowledge Base Querying DBpedia SPARQL Endpoint Public Faceted Web Service Interface DBpedia Linked Data Interface

Querying DBpedia SPARQL Endpoint SPARQL is a query language for RDF. http://DBpedia.org/sparql provided using OpenLink Virtuoso as the back-end database engine Leipzig query builder at http://querybuilder.dbpedia.org; OpenLink Interactive SPARQL Query Builder (iSPARQL) at http://dbpedia.org/isparql; SNORQL query explorer at http://DBpedia.org/snorql (does not work with Internet Explorer); or any other SPARQL-aware client(s).

sparql http://DBpedia.org/sparql PREFIX : <http://dbpedia.org/resource/> PREFIX dbpedia2: <http://dbpedia.org/property/> PREFIX dbpedia: <http://dbpedia.org/> SELECT ?name ?y WHERE { ?name dbpedia2:centre "Nanjing"@en. ?name dbpedia2:postalCode ?y. }

iSPARQL http://dbpedia.org/isparql/ PREFIX : <http://dbpedia.org/resource/> PREFIX dbpedia2: <http://dbpedia.org/property/> PREFIX dbpedia: <http://dbpedia.org/> SELECT ?name ?y WHERE { ?name dbpedia2:centre "Nanjing"@en. ?name dbpedia2:postalCode ?y. } /////// ?point Georess:point

SNORQL http://DBpedia.org/snorql SELECT ?game ?title WHERE {  http://DBpedia.org/snorql SELECT ?game ?title WHERE { ?game <http://purl.org/dc/terms/subject> <http://dbpedia.org/resource/Category:First-person_shooters> . ?game foaf:name ?title . } ORDER by ?title

Public Faceted Web Service Interface Querying DBpedia Public Faceted Web Service Interface There is a public Faceted Browser “search and find” user interface at http://DBpedia.org/fct. Tim Berners-Lee founder http://sw.cyc.com/concept/Mx4r3THFqbCtSyOa3bvfYXUhWg http://dbpedia.org/resource/Nanjing

DBpedia Linked Data Interface Linked Data is a method of publishing RDF data on the Web and of interlinking data between different data sources. The DBpedia data set is served as Linked Data, meaning that all DBpedia URIs are dereferenceable. Browse the DBpedia data set with Semantic Web browsers like DISCO, Marbles, the OpenLink Data Explorer,Tabulator, the Zitgist Data Viewer or the Fluidops Information Workbench.

DISCO a simple browser for navigating the Semantic Web as an unbound set of data sources. This resource description contains hyperlinks that allow you to navigate between resources. While you move from resource to resource, the browser dynamically retrieves information by dereferencing HTTP URIs and by following rdfs:seeAlso links. http://www4.wiwiss.fu-berlin.de/rdf_browser/?

Marbles Marbles is a server-side application that formats Semantic Web content for XHTML clients using Fresnel lenses and formats. Colored dots are used to correlate the origin of displayed data with a list of data sources, hence the name. http://www5.wiwiss.fu-berlin.de/marbles/

Tabulator Using outline and table modes, it provides a way to browse RDF data on the web. http://www.w3.org/2005/ajar/tab http://dbpedia.org/resource/Nanjing http://sw.cyc.com/concept/Mx4r3THFqbCtSyOa3bvfYXUhWg ?v0 <http://dbpedia.org/property/postalCode> ?v2. ////////////////// SELECT ?v0 ?v1 ?v2 WHERE { <http://dbpedia.org/resource/Nanjing> <http://dbpedia.org/property/east> ?v0 . ?v0 <http://dbpedia.org/ontology/type> ?v1 . ?v0 <http://dbpedia.org/property/postalCode> ?v2 . }

Interlinking DBpedia with other Data Sets The DBpedia data set is interlinked with various other data sources.  http://lod-cloud.net/

External Links The DBpedia data set contains HTML links to external web pages as well as RDF links into external data sources. Two types of links to HTML pages: dbpedia:reference links point; foaf:homepage links that point to web pages. RDF links are represented using the owl:sameAs property. Examples of External RDF Links # Two RDF links taken from DBpedia <http://dbpedia.org/resource/Berlin> owl:sameAs <http://sws.geonames.org/2950159/> . <http://dbpedia.org/resource/Tim_Berners-Lee> owl:sameAs <http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007> . http://www4.wiwiss.fu-berlin.de/dblp/snorql/ SPARQL: PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX link: <http://richard.cyganiak.de/2006/link#> PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX map: <file:///Users/richard/D2RQ/DBLP/dblp-mapping.n3#> PREFIX d2r: <http://sites.wiwiss.fu-berlin.de/suhl/bizer/d2r-server/config.rdf#> PREFIX dblp: <http://www4.wiwiss.fu-berlin.de/dblp/terms.rdf#> SELECT * WHERE { ?z dc:creator <http://www4.wiwiss.fu-berlin.de/dblp/resource/person/100007> . ?z rdf:type <http://www4.wiwiss.fu-berlin.de/dblp/terms.rdf#Article>. ?z dc:title ?name }

DBpedia Applications gFacet- Graph-based Faceted Exploration of RDF Data. http://www.visualdataweb.org/gfacet/gfacet.php

DBpedia Applications RelFinder –extracts and visualizes relationships between given objects in RDF data and makes these relationships interactively explorable.  http://www.visualdataweb.org/relfinder/relfinder.php

DBpedia Applications SemLens – uses scatter plots for the analysis of Dependencies in  DBpedia data and semantic lenses for further exploration. http://www.visualdataweb.org/semlens/semlens.php

DBpedia Applications DBpedia Mobile – is a location-centric DBpedia client application for mobile devices consisting of a map view annotated with DBpedia, the Marbles Linked Data Browser and a GPS-enabled launcher application. http://mes-semantics.com/DBpediaMobile/?location=Beijing

Future Work Revolutionize Wikipedia Search Include DBpedia Data in Your Web Page Mobile and Geographic Applications Document Classification, Annotation and Social Bookmarking Multi-Domain Ontology

Summary 对 DBpedia 知识抽取框架,知识库结构,如何访问知识库进行简要介绍,并对现有的查询浏览等工具的功能进行验证。 存在问题: 大多数工具有浏览,提供过滤及SPARQL查询,但大多数针对单个数据集,没有跨多数据源的查询。如何针对众多开放的SPARQL Endpoint进行集成查询? Interlinking 中如果对不同数据集中的相似实体进行匹配关联? 众多SPARQL Endpoint可否与SView系统集成?

Thanks!