LARS : A Location-Aware Recommender System ICDE ‘12 1.

Slides:



Advertisements
Similar presentations
第八章 轴系零件 § 8-1 键、销及其连接 一、键连接 二、销连接 § 8-2 轴 一、轴的分类和应用 二、轴的结构和轴上零件的固定
Advertisements

第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
基本知识和几何要素的投影 模块一: 字体练习 第一章 制图的基本知识与基本技能 题目提示返回.
第 12 章位运算 C 语言兼具高级语言及低级语言的特性,因此 适合编写系统软件。 C 语言具备低级语言的特性 就在于它能直接对硬件进行操作,即位运算。 所谓位运算是指,按二进制位进行的运算。 例如,将一个存储单元中各二进位左移或右移一 位等。
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
位置相关查询处理 研究背景及意义 移动计算、无线通信以及定位技术的快速发展,使 得位置相关的查询处理及基于位置的信息服务技术 已经成为一个热点研究领域 。 大量的应用领域 ( 如地理信息系统、智能导航、交 通管制、天气预报、军事、移动电子商务等 ) 均迫 切需要有效地查询这些数据对象。
细分曲面 傅孝明 SA 目录 细分曲面的基本思想 两个关键问题 一些基本概念 几种简单的细分曲面算法 细分曲面方法分类.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
主要内容  LR(0) 分析. 0 S→  E # E→  E+T E→  T T→  id T→  ( E ) 1 S→E  # E→E  +T 5 T→id  3 E→E+  T T→  id T→  (E) 4 E→E+T  9 E→T  6 T→(  E) E→
Graphene Double Quantum Dot Transport Property Zhan Su Jan. 12, 2011.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
2.1 结构上的作用 作用及作用效应 作用的分类 荷载分类及荷载代表值.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
1 第二章 误差和分析数据的处理. 2 ● 内容提要 1. 误差及其产生原因 2. 准确度与精密度 3. 有效数字及其计算规则 4. 分析数据的处理.
11-8. 电解质溶液的 活度和活度系数 电解质是有能力形成可以 自由移动的离子的物质. 理想溶液体系 分子间相互作用 实际溶液体系 ( 非电解质 ) 部分电离学说 (1878 年 ) 弱电解质溶液体系 离子间相互作用 (1923 年 ) 强电解质溶液体系.
例9:例9: 第 n-1 行( -1 )倍加到第 n 行上,第( n-2 ) 行( -1 )倍加到第 n-1 行上,以此类推, 直到第 1 行( -1 )倍加到第 2 行上。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第四十八讲 ) 离散数学. 例 设 S 是一个非空集合, ρ ( s )是 S 的幂集合。 不难证明 :(ρ(S),∩, ∪,ˉ, ,S) 是一个布尔代数。 其中: A∩B 表示 A , B 的交集; A ∪ B 表示 A ,
第十一章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
第二章 贝叶斯决策理论 3学时.
非均相物系的分离 沉降速度 球形颗粒的 :一、自由沉降 二、沉降速度的计算 三、直径计算 1. 试差法 2. 摩擦数群法 四、非球形颗粒的自由沉降 1. 当量直径 de :与颗粒体积相等的圆球直径 V P — 颗粒的实际体积 2. 球形度  s : S—— 与颗粒实际体积相等的球形表面积.
化学系 3 班 何萍 物质的分离原理 世世界上任何物质,其存在形式几乎均以混合 物状态存在。分离过程就是将混合物分成两 种或多种性质不同的纯物质的过程。 分分子蒸馏技术是一种特殊的液-液分离技术。
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
Photoshop CS4 标准培训教程 第三章第三章 在 Photoshop CS4 中所谓的不规则选区指的是随意性强,不被局限在几何形状内, 他们可以是鼠标任意创建的也可以是通过计算而得到的单个选区或多个选区。在 Photoshop 中可以用来创建不规则选区的工具被分组放置到套索工具组、魔棒工具组.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
9的乘法口诀 1 .把口诀说完全。 二八( ) 四六( ) 五八( ) 六八( ) 三七( ) 三八( ) 六七( ) 五七( ) 五六( ) 十六 四十八 四十二 二十四 二十一 三十五 四十 二十四 三十 2 .口算, 并说出用的是哪句口诀。 8×8= 4×6= 7×5= 6×8= 5×8=
量子力学教程 ( 第二版 ) 3.4 连 续 谱 本 征 函 数 的 归 一 化 连续谱本征函数是不能归一化的 一维粒子的动量本征值为的本征函数 ( 平面波 ) 为 可以取 中连续变化的一切实数值. 不难看出,只要则 在量子力学中, 坐标和动量的取值是连续变化 的 ; 角动量的取值是离散的.
( 二 ) 局部兴奋及其特点 阈下刺激能引起细胞膜上少量的 Na + 通道开放,少 量的 Na + 内流造成的去极化和电刺激造成的去极化叠加 起来,在受刺激的膜局部出现一个较小的去极化,称为 局部感应或局部兴奋 阈下刺激能引起细胞膜上少量的 Na + 通道开放,少 量的 Na + 内流造成的去极化和电刺激造成的去极化叠加.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
§8-3 电 场 强 度 一、电场 近代物理证明:电场是一种物质。它具有能量、 动量、质量。 电荷 电场 电荷 电场对外的表现 : 1) 电场中的电荷要受到电场力的作用 ; 2) 电场力可移动电荷作功.
 符号表  标识符的作用: 声明部分:定义了各种对象及对应的属性和 使用规则。 程序体:对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token : 新表-符号表(种类、类型等信息):
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
网上预约集港操作指南 一、登录系统 登陆下面图片显示网址:输入堆场用户名、密码和校验码登陆系统.
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
同学们,这些纸做的彩球漂亮吗? 探究与学习 做彩球除了纸以外, 还需要哪些材料和 工具? 上面几个图中, 用了哪些技法? 用一张或几张彩色纸,经 过折、剪、切、卷、粘等 工序,可以做成各种造型 别致、美观大方的彩球 。
单摆实验 秒表 读数 游标卡尺.
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
? 小数乘整数 制作人:吴运粮 复习 1.下面乘积得多少? 8 × 3= 8 × 3用加法表示什么意思? 3个8相加 24.
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
表单自定义 “ 表单自定义 ” 功能是用于制作表单的 工具,用数飞 OA 提供的表单自定义 功能能够快速制作出内容丰富、格 式规范、美观的表单。
7 生产费用在完工产品与在产 品之间分配的核算. 2 第七章 生产费用在完工产品与在产品之 间的分配  知识点 :  理解在产品的概念  掌握生产费用在完工产品与在产品之间的分 配.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
数学广角——优化 沏茶问题.
第三章 基因的本质 第 3 节 DNA 的复制. 特点:遵循碱基 互补配对原则 A-T 、 C-G DNA 平面结构 空间结构.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
感谢您的关注 联系电话: – 677 手机: QQ :
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
第 11 章 旋转电机交流绕组的电势和磁势 内 容 提 要内 容 提 要  旋转磁场是交流电机工作的基础。  在交流电机理论中有两种旋转磁场: (1) 机械旋转磁场(二极机械旋转磁场,四极机械旋转磁场) (2) 电气旋转磁场(二极电气旋转磁场,四极电气旋转磁场)二极机械旋转磁场四极机械旋转磁场二极电气旋转磁场四极电气旋转磁场.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
第二节. 广告牌为什么会被风吹倒? 结构的稳定性: 指结构在负载的作用下 维持其原有平衡状态的能力。 它是结构的重要性质之一。
五星红旗在月球 —— 嫦娥三号软着陆的过程与意义 广东天文学会理事 广州市荔湾区汾水中学 陈欣欣.
高压绕组制造 《微电机制造工艺学》 由 NordriDesign 提供
§9. 恒定电流场 第一章 静电场 恒定电流场. 电流强度  电流:电荷的定向移动  正负电荷反方向运动产生的电磁效应相同 ( 霍尔效应 特例 ) 规定正电荷流动的方向为正方向  电流方向:正方向、反方向  电流强度 ( 电流 ) A 安培 标量 单位时间通过某一截面的电荷.
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

LARS : A Location-Aware Recommender System ICDE ‘12 1

1. Introduction Traditional recommender systems – triple(user, rating, item) – (user id U) + (limit K) return K recommended items to U Locations – destinations check-in(Facebook, Foursquare) – user zip code(MovieLens) 2

1.1 Motivation: A Study of Location-Based Ratings Preference locality 3

1.1 Motivation: A Study of Location-Based Ratings Travel locality 4

1.2 LARS - A Location-Aware Recommender (user, ulocation, rating, item) (user, rating, item, ilocation) (user,ulocation, rating, item, ilocation) 5

1.2 LARS - A Location-Aware Recommender next…… 2. an overview of LARS 3. spatial user ratings for non-spatial items 4. non-spatial user ratings for spatial items 5. spatial user ratings for spatial items 6. experimental analysis 6

2.1 LARS Query Model (user id U) + (limit K) + (location L) ——> return K recommended items to U query : – snapshot (one-time) queries – continuous queries 7

2.2 Item-Based Collaborative Filtering Phase I: Model Building – 计算 item 间的相似度 sim – 对于每个 item 模型只会存储前 n 个相似度最高的 sim 值 n 为 user 个数 Phase II: Recommendation Generation 8

3 Spatial User Ratings For Non-spatial Items (user, ulocation, rating, item) requirements – Locality( 局部性 ) :能对地点感知 – Scalability( 可扩展性 ) :能够对大量的用户进行 运算 – Influence() :用户能够改变感知的区域大小 9

3.1 Data Structure partial pyramid structure— 局部锥形结构 10

3.1 Data Structure Level 3 Level 2 Level 1 Level 0 天朝南广东珠三角粤东粤西粤北广西福建海南北中西四川云南西藏青海 11

3.2 Query Processing query processing steps – 1. 从最底层找起 – 2. 如果没找到 去上一层找 – 3. 直到找到为止 12

3.2 Query Processing Continuous queries – ( 一边移动 & 一边查询 ) – 1. 如果没有离开上一次查询时所在的 grid 还是原来熟悉的结果 – 2. 否则 去上一层找,找到为止 13

3.3 Data Structure Maintenance 当有 new users,ratings,items 时 Trigger: N% ( 才会启动 Maintenance) The maintenance will be amortized( 均摊 ) Step I: Model Rebuild Step II: Merging( 合并 )/Splitting( 分裂 ) Maintenance 14

3.3.1 Cell Merging Impoves scalability – storage less CF models size( 只需储存于高层,底层不储存 ) 主要标准 – computational overhead less maintenance computation 维护次数减少 less continuous query processing computation 次要标准 Hurts locality 15

3.3.1 Cell Merging Two percentage values – locality_loss – scalability_gain A system parameter M ∈ [0,1] Merges if : – M 越小,则越倾向于合并 16

3.3.1 Cell Merging Calculating locality_Loss – Sample – Compare 17

3.3.1 Cell Merging Calculating scalability_gain – ( child cells ) / ( child cells + parent cell ) – st 还是举之前的栗子 – scalability_gain 4 child cells == 2GB parent cell == 2GB scalability_gain=50% 18

3.3.1 Cell Merging locality_loss=25% scalability_gain=50% Assuming M=0.7 but (0.3*50%)<(0.7*25%) will not merge 19

3.3.2 Cell Splitting 其效用与 Cell Merging 相反 – Improves locality – Hurts scalability 计算与 Cell Merging 基本相同 – locality_gain – scalability_loss 20 MergingSplitting locality_losslocality_gain scalability_gainscalability_loss

4 Non-spatial User Ratings For Spatial Items (user, rating, item, ilocation) travel locality travel penalty – – expensive computational overhead – so,employs “early termination” 21

4.1 Query Processing Algorithm – 1. 找出全部 item 中, TravelPenalty 最小的 k 个 item ,将 k 个 item 按照 RecScore 从大到小排序,形成表 R – 2. 设 LowestRecScore 为 R 中最小的 ( 也就是第 K 个 ) RecScore 值 – 3. 找出剩余 item 中 TravelPenalty 最小的 item 4. 设 MaxPossibleScore = MAX_RATING – TravelPenalty 5.IF MaxPossibleScore <= LowestRecScore – 6. 不再找了,直接 return R 7. 算出此 item 的 RecScore 8.IF RecScore > LowestRecScore – RecScore 替换 LowestRecScore 进入 R – 重新找一个 LowestRecScore – 回到 3 22

4.2 Incremental Travel Penalty Computation Incremental KNN – online – Exact – Expensive Penalty Grid – Offline – Less exact – Efficient 23

5 Spatial User Ratings For Spatial Items (user, ulocation, rating, item, ilocation) user partitioning & travel penalty – can be used together – with very little change 24

6 Experiment test recommendation quality – Foursquare : real dataset – MovieLens : real dataset test scalability and query efficiency – Synthetic : synthetically generated dataset 25

6 Experiment CF: item-based collaborative filtering LARS-T: LARS with only travel penalty LARS-U: LARS with only user partitioning LARS: LARS with both techniques default parameter – M == 0.3 – k == 10 – the number of pyramid levels (h) == 8 26

6.1 Recommendation Quality for Varying Pyramid Levels 27 80% 训练, 20% 验证: Measure ( Quality ) – 统计预测的推荐结果 进入真实评分前 k( 默认 k=10) 的次数 层次分太细,每个 grid 中 rating 太少

6.2 Recommendation Quality for Varying Values of k 28

6.3 Storage Vs. Locality 29 Note : M 越小 ,越倾向于合并 M 越大,越倾向于分裂

6.4 Scalability 30 Default : M=0.3 LARS is acceptable.

6.5 Query Processing Performance 31 单次查询: LARS vs LARS-U LARS vs LARS-T 通过对比可以发现 之前两种技术所带来的时间上的优势 连续查询: CF 最快(那当然了 -_-# ) 除此之外, LARS 最快