Finding Patterns in a Knowledge Base using Keywords to Compose Table Answers/VLDB2015 报告人:胡信晖 2019/1/18.

Slides:



Advertisements
Similar presentations
第 12 章位运算 C 语言兼具高级语言及低级语言的特性,因此 适合编写系统软件。 C 语言具备低级语言的特性 就在于它能直接对硬件进行操作,即位运算。 所谓位运算是指,按二进制位进行的运算。 例如,将一个存储单元中各二进位左移或右移一 位等。
Advertisements

第四章 犯罪概念与犯罪构成. 第一节 犯罪概念 一、犯罪概念的类型  (一)犯罪的形式概念  (二)犯罪的实质概念  (三)犯罪的混合概念.
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
Game Theory 窦衍旭. 什么是博弈论 博弈论,经济学中很著名的理论, 就是在 信息不对称的情况下根据对手可能作出的 决策作出决策,通俗地说,如果我这样做, 那么对手会怎样做,而对手基于我的做法 作出决策,我又该怎么做来应对。
Climate Change Vulnerability and Health: understanding local community vulnerability to aid adaptation planning 气候变化脆弱性与健康 : 了解地区共同体的脆 弱性以完善适应性规划 Professor.
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
You Are What You Do by Mayling Soong If the past has taught us anything, it is that every cause brings effect — every action has a consequence). This thought,
3 .计算题(原创) 草酸的分布分数图为 图中 A , B , C , D 四点的关系如何?请用数学推导进行说 明。
东南大学 吴健雄实验室. 第三节 序列多重比对 目的: 发现多个序列的共性 发现与结构和功能相关的保守序列片段 设:有 k 个序列 s 1, s 2,...,s k ,每个序列由同一个 字母表中的字符组成, k 大于 2 。 通过插入操作,使得各序列达到一样的长度。
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
第六章 犯罪客观方面. 第一节 犯罪客观方面的概述 一、犯罪客观方面的概念  犯罪客观方面,是指刑法规定的,说明行 为对刑法所保护的社会关系造成侵害的客 观外在表现。
论匀强磁场条件下磁通回 路的取法 物理四班 物理四班 林佳宁 (PB ) 林佳宁 (PB ) 指导老师 : 秦敢 指导老师 : 秦敢.
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第四十八讲 ) 离散数学. 例 设 S 是一个非空集合, ρ ( s )是 S 的幂集合。 不难证明 :(ρ(S),∩, ∪,ˉ, ,S) 是一个布尔代数。 其中: A∩B 表示 A , B 的交集; A ∪ B 表示 A ,
第二部分 行政法律关系主体 第一节 行政主体 一、行政主体 (一)行政主体的概念 cc (二)行政主体资格含义及构成要件 CASE1CASE1\CASE2CASE2 (三)行政主体的职权和职责 1 、行政职权的概念及内容 2 、行政职权的特点 3 、行政职责.
— 使用搜索引擎查找信息 我是小小 “ 导游 ” 文昌市华侨中学 王 晨 王 晨. 求助信 亲爱的朋友: 我计划两天后去海南三 亚游玩,但我从没去过海南, 也不了解三亚,请帮忙推荐 三亚一个好玩的景点,谢谢。 我计划两天后去海南三 亚游玩,但我从没去过海南, 也不了解三亚,请帮忙推荐 三亚一个好玩的景点,谢谢。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十九讲 ) 离散数学. 例 设 S 是一个集合, ρ ( S )是 S 的幂集合,集合 的交( ∩ ),并(∪)是 ρ ( S )上的两个代数运算, 于是,( ρ ( S ), ∩ ,∪) 是一个格。而由例 知.
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
OS 进程调度模拟演示 制作人: 钱晶 高上上. OS 进程调度模拟-实验原理 静态优先级原理 在这种方式下,系统一旦把处理机分配给就绪队 列中的优先权最高的进程后,该进程便一直执行下去, 直至完成。或因为发生某事件使该进程放弃处理机,系 统方可再将处理机分配给另一优先级最高的进程。这些 事件包括有优先级更高的进程进入,或是因为某些原因.
非均相物系的分离 沉降速度 球形颗粒的 :一、自由沉降 二、沉降速度的计算 三、直径计算 1. 试差法 2. 摩擦数群法 四、非球形颗粒的自由沉降 1. 当量直径 de :与颗粒体积相等的圆球直径 V P — 颗粒的实际体积 2. 球形度  s : S—— 与颗粒实际体积相等的球形表面积.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
Photoshop CS4 标准培训教程 第三章第三章 在 Photoshop CS4 中所谓的不规则选区指的是随意性强,不被局限在几何形状内, 他们可以是鼠标任意创建的也可以是通过计算而得到的单个选区或多个选区。在 Photoshop 中可以用来创建不规则选区的工具被分组放置到套索工具组、魔棒工具组.
9的乘法口诀 1 .把口诀说完全。 二八( ) 四六( ) 五八( ) 六八( ) 三七( ) 三八( ) 六七( ) 五七( ) 五六( ) 十六 四十八 四十二 二十四 二十一 三十五 四十 二十四 三十 2 .口算, 并说出用的是哪句口诀。 8×8= 4×6= 7×5= 6×8= 5×8=
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
周期信号的傅里叶变换. 典型非周期信号 ( 如指数信号, 矩形信号等 ) 都是满足绝对可 积(或绝对可和)条件的能量信号,其傅里叶变换都存在, 但绝对可积(或绝对可和)条件仅是充分条件, 而不是必 要条件。引入了广义函数的概念,在允许傅里叶变换采用 冲激函数的前提下, 使许多并不满足绝对可积条件的功率.
小组讨论:尹智逊、赵宝忠、刘荣、唐雪宗 Mean Time Between Failure 平均故障时间 Member赵宝忠刘荣尹智逊唐雪宗.
报告人:黄磊 缓冲溶液的积分缓冲容量. 缓冲指数的概念是 Vanslyke 在 1922 年提出 的,意义是当缓冲溶液改变一个单位时需 加入酸碱物质的量 即 这里的缓冲指数指的是微分缓冲容量,是 加酸碱物质的量随着 pH 值的变化率 1 ,微分缓冲容量.
初中几何第三册 弦切角 授课人: 董清玲. 弦切角 一、引入新课: 什么是圆心角、圆周角、圆周角定理的内容是什么? 顶点在圆心的角叫圆心角。 顶点在圆上,并且两边都和圆相交的角叫做圆周角。 定理:一条弧所对的圆周角等于它所对的圆心角的一半。 A B′ C B O.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
首 页 首 页 上一页 下一页 本讲内容本讲内容 视图,剖视图(Ⅰ) 复习: P107 ~ P115 作业: P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
Introduction to Automatic Control The Laplace Transform Li Huifeng Tel:
There is a zoo in Anna’s neighborhood. She likes to spend time there on weekends. She loves to watch the monkeys climbing around. The monkeys sometimes.
? 小数乘整数 制作人:吴运粮 复习 1.下面乘积得多少? 8 × 3= 8 × 3用加法表示什么意思? 3个8相加 24.
名探柯南在侦查一个特大盗窃集团过程 中,获得藏有宝物的密码箱,密码究竟 是什么呢?请看信息: ABCDEF( 每个字 母表示一个数字 ) A :是所有自然数的因数 B :既有因数 5 ,又是 5 的倍数 C :既是偶数又是质数 D :既是奇数又是合数 EF :是 2 、 3 、 5 的最小公倍数.
定语从句 日照一中 徐文华. 引导定语从句的关联词, 可根据在从句中所缺的成分来决定用哪个。 缺主语、宾语、表语 时,用: which , that (先行词是物时) that , who,whom (先行词是人时) 缺定语 时: whose = of which (the…) ( 指物时) whose.
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
外研版 高一年级 ( 必修 3) Module 1. 1) Do you know European Union? 2) Where is it? 3) Is it one country? 4) Is the United kingdom its member? 5) How many countries.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
数学广角——优化 沏茶问题.
演示场景. 类图 配置 HibernateApplicationContext.xml hibernate.cfg.xml 创建数据库 – ooad/ooad 关于 Library/Project 模板.
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
1 第 4 章 速度瞬心及其应用 ● 利用速度瞬心进行机构的速度分析 ● 将低副机构转变为高副机构 ( 瞬心线机 构,共轭曲线机构) ● 用低副机构的分析方法对高副机构进 行结构和运动分析 ( 高副低代 )
海军工程大学信息安全系 汇报人:周学广 教授 基于主题情感混合模型 的无监督文本情感分析. 海军工程大学信息安全系 主要内容 一 LDA 模型 二 UTSU 模型 三 实验对比与分析.
参考文献管理软件. 常见参考文献管理软件 : 中文 : CNKI E-learning (目前免费) NoteExpress NoteFirst 英文: Refworks Endnote (网络版免费) Mendeley……
第五章 特征值与特征向量 —— 幂法 /* Power Method */ 计算矩阵的主特征根及对应的特征向量 Wait a second, what does that dominant eigenvalue mean? That is the eigenvalue with the largest.
数据库系统 1 §1 并发控制概述 在多用户数据库系统中,当多个用户并发存取数据 库时就会产生多个事务同时存取同一数据的情形。若不 加控制,可能会存取和存储不正确的数据,造成数据库 的不一致性。 在并发操作情况下,对事务的操作序列的调度是随 机的,考虑飞机订票系统,若按下面的序列调度:
张勤 人大报刊复印资料 专题全文数据库 简 介简 介 《人大报刊资料全文数据库》是中国人民大 学书报资料中心与北京博利群电子信息有限 公司联合开发研制的大型数据库光盘。它涵 盖面广、信息量大、分类科学、筛选严谨、 结构合理,是国内最具权威的社会科学、人.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
欢 迎 使 用 《工程流体力学》 多媒体授课系统 燕 山 大 学 《工程流体力学》课程组. 第九章 缝隙流动 概述 9.1 两固定平板间的层流流动 9.2 具有相对运动的两平行平板 间的缝隙流动 9.3 环形缝隙中的层流流动.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
本章讨论有限自由度结构系统,在给定载荷和初始条件激励下的系统动力响应计算方法。 第 六 章
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
限制性定语从句和非限制性定语从句: My sister, who is twenty, works in a bank. The man who came here yesterday has come again. 限制性定语从句 是先行词在意义上不可缺少的定语, 如果去掉,主句的意思就不完整或失去意义。这种从.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
3D 老虎机 最好是在线老虎机游戏是一个赚钱而获 得乐趣的明确方式。 而他们愿意毫不犹豫地花钱。 在线老虎机游戏会给你一个很公平的优 势,因为它依赖运气和时间。
Introduction to Freebase
Presentation transcript:

Finding Patterns in a Knowledge Base using Keywords to Compose Table Answers/VLDB2015 报告人:胡信晖 2019/1/18

Content Previous work Problem Approach index structure search algorithm Experiments 2019/1/18

Previous work Finding the subtrees of the knowledge graph that contain all the keywords and return them in ranked order The returned subtrees with a heterogeneous mass of shapes might correspond to different interpretations of the query Not adequate when the user’s query is to look for a table of entities 2019/1/18

This article’s target 2019/1/18

This article’s target 原先的方法: 文章的方法 2019/1/18

Two basic definition Path patterns. The path pattern for w is the concatenation of node/edge types on the path T(w). Tree patterns. A vector with the ith entry as the path pattern of the root-leaf path containing the ith keyword wi. 2019/1/18

INDEXING PATH PATTERNS The problem of counting the number of tree patterns with height at most d for a keyword query q in a knowledge is #P- Complete. 所以文章首先给图的path pattern建立索 引。 2019/1/18

INDEXING PATH PATTERNS 2019/1/18

INDEXING PATH PATTERNS 索引的结果就是每一条路径长度小于 threshold d的完整的path以及path对应 的pattern、path的root、root的关键词 For IMDB, the knowledge graph contains only paths of length at most three, and the size of the indexes is 0.8 GB 2019/1/18

INDEXING PATH PATTERNS 2019/1/18

SEARCHING WITH PATH INDEX Pattern Enumeration-Join Approach Linear-Time Enumeration Approach 2019/1/18

Pattern Enumeration-Join Approach Consider a query “database software company revenue” — “w1,w2,w3,w4” 2019/1/18

Pattern Enumeration-Join Approach 缺点在于,如果形成的tree pattern是 empty的话,会存在很多不必要的运算 因此最坏的情况下的运行时间对于 subtree的数量以及index size来说是指数 级的 2019/1/18

Linear-Time Enumeration Approach Based on the simple fact that a node in the knowledge graph is the root of some valid subtree if and only if it can reach every keyword at some node。 首先搜索这些node形成candidate nodes 如此一来,从这些candidate node出发 形成的tree pattern就不会空,从而避免 许多不必要的计算 2019/1/18

Linear-Time Enumeration Approach And to generate each valid subtree, the time it needs is linear in its tree size。 2019/1/18

Experiments Datasets. Wiki and IMDB Queries. We randomly selected 500queries from Bing’s log for experiments on Wiki. The numbers of keywords in the queries vary from 1 to 10, and for each we have 50 queries. For IMDB, we randomly constructed 500 queries from IMDB’s vocabulary. Index size and height threshold d. D = 2, 3, and 4 for the Wiki dataset. For IMDB, the knowledge graph contains only paths of length at most three. 2019/1/18

Experiments 2019/1/18

Experiments 2019/1/18

Experiments For queries with larger numbers of valid subtrees (query 1 and query 2), LETopK becomes much (5x-20x) faster than PETopK, while preserving reasonably high precision (above 80%). For the query with a smaller number of valid subtrees (query 3), when LETopK is faster than PETopK, the precision of LETopK is still consistently stable at round 0.95. 2019/1/18

谢谢 2019/1/18