Graph Data Management Lab, School of Computer Science Put conference information here: The 12-th International Conference.

Slides:



Advertisements
Similar presentations
首 页 首 页 上一页 下一页 本讲内容 投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注 本讲内容 复习: P25~P31 、 P84~P85 作业: P7, P8, P14[2-32(2) A3 (1:1)]
Advertisements

Analysis and Modeling of Social Networks Foudalis Ilias.
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
空间群 space groups 晶轴和直角坐标轴
Da Yan, Zhou Zhao and Wilfred Ng The Hong Kong University of Science and Technology.
位置相关查询处理 研究背景及意义 移动计算、无线通信以及定位技术的快速发展,使 得位置相关的查询处理及基于位置的信息服务技术 已经成为一个热点研究领域 。 大量的应用领域 ( 如地理信息系统、智能导航、交 通管制、天气预报、军事、移动电子商务等 ) 均迫 切需要有效地查询这些数据对象。
1 Complexity of Network Synchronization Raeda Naamnieh.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
第二章 质点组力学 质点组:许多(有限或无限)相 互联系的质点组成的系统 研究方法: 1. 分离体法 2. 从整体考虑 把质点的三个定理推广到质点组.
2.2 结构的抗力 抗力及其不定因素 材料强度的标准值 材料强度的设计值.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
2.1 结构上的作用 作用及作用效应 作用的分类 荷载分类及荷载代表值.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
11-8. 电解质溶液的 活度和活度系数 电解质是有能力形成可以 自由移动的离子的物质. 理想溶液体系 分子间相互作用 实际溶液体系 ( 非电解质 ) 部分电离学说 (1878 年 ) 弱电解质溶液体系 离子间相互作用 (1923 年 ) 强电解质溶液体系.
例9:例9: 第 n-1 行( -1 )倍加到第 n 行上,第( n-2 ) 行( -1 )倍加到第 n-1 行上,以此类推, 直到第 1 行( -1 )倍加到第 2 行上。
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十九讲 ) 离散数学. 例 设 S 是一个集合, ρ ( S )是 S 的幂集合,集合 的交( ∩ ),并(∪)是 ρ ( S )上的两个代数运算, 于是,( ρ ( S ), ∩ ,∪) 是一个格。而由例 知.
第四章 平面 §4-1 平面的表示法 §4-1 平面的表示法 §4-2 各种位置平面的投影特性 §4-2 各种位置平面的投影特性 §4-3 属于平面的点和直线 §4-3 属于平面的点和直线 基本要求 基本要求.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第四十五讲 ) 离散数学 模 格 定义 设( L , ≤ ) 是一个格,对任意 a , b , c ∈ L , 如果 a≤b ,都有 a  ( b×c ) = b× ( a  c ) 则称( L , ≤ )为模格。
流态化 概述 一、固体流态化:颗粒物料与流动的流体接触,使颗粒物料呈类 似于流体的状态。 二、流态化技术的应用:流化催化裂化、吸附、干燥、冷凝等。 三、流态化技术的优点:连续化操作;温度均匀,易调节和维持; 气、固间传质、传热速率高等。 四、本章基本内容: 1. 流态化基本概念 2. 流体力学特性 3.
非均相物系的分离 沉降速度 球形颗粒的 :一、自由沉降 二、沉降速度的计算 三、直径计算 1. 试差法 2. 摩擦数群法 四、非球形颗粒的自由沉降 1. 当量直径 de :与颗粒体积相等的圆球直径 V P — 颗粒的实际体积 2. 球形度  s : S—— 与颗粒实际体积相等的球形表面积.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
东南大学计算中心 网站应用与实践 主讲人 吴俊. 2 东南大学计算中心 网站制作流程  确定主题、风格  规划栏目、收集素材  版面设计、配色  编辑页面  测试发布 FrontPage 要完成的任务.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
1/108 随机信号分析. 2/116 第 2 章 随机信号 3/ 定义与基本特性 2.2 典型信号举例 2.3 一般特性与基本运算 2.4 多维高斯分布与高斯信号 2.5 独立信号 目 录.
量子力学教程 ( 第二版 ) 3.4 连 续 谱 本 征 函 数 的 归 一 化 连续谱本征函数是不能归一化的 一维粒子的动量本征值为的本征函数 ( 平面波 ) 为 可以取 中连续变化的一切实数值. 不难看出,只要则 在量子力学中, 坐标和动量的取值是连续变化 的 ; 角动量的取值是离散的.
( 二 ) 局部兴奋及其特点 阈下刺激能引起细胞膜上少量的 Na + 通道开放,少 量的 Na + 内流造成的去极化和电刺激造成的去极化叠加 起来,在受刺激的膜局部出现一个较小的去极化,称为 局部感应或局部兴奋 阈下刺激能引起细胞膜上少量的 Na + 通道开放,少 量的 Na + 内流造成的去极化和电刺激造成的去极化叠加.
第十章 网络分析方法. 对于许多现实的地理问题,譬如,城镇体系 问题,城市地域结构问题,交通问题,商业网 点布局问题,物流问题,管道运输问题,供电 与通讯线路问题, … ,等等,都可以运用网络 分析方法进行研究。 网络分析,是运筹学的一个重要分支,它主 要运用图论方法研究各类网络的结构及其优化 问题。
平行线的平行公理与判定 九年制义务教育七年级几何 制作者:赵宁睿. 平行线的平行公理与判定 要点回顾 课堂练习 例题解析 课业小结 平行公理 平行判定.
目录 上页 下页 返回 结束 第八章 第八章 一、空间曲线的一般方程 二、空间曲线的参数方程 三、空间曲线在坐标面上的投影 第四节 空间曲线及其方程.
11.5 含源二端口网络 章节内容 (2) 11.6 运算放大器电路 11.7 回转器和负阻抗变换器 11.8 应用.
The Very Small World of the Well-connected. (19 june 2008 ) Lada Adamic School of Information University of Michigan Ann Arbor, MI
§8-3 电 场 强 度 一、电场 近代物理证明:电场是一种物质。它具有能量、 动量、质量。 电荷 电场 电荷 电场对外的表现 : 1) 电场中的电荷要受到电场力的作用 ; 2) 电场力可移动电荷作功.
报告人:黄磊 缓冲溶液的积分缓冲容量. 缓冲指数的概念是 Vanslyke 在 1922 年提出 的,意义是当缓冲溶液改变一个单位时需 加入酸碱物质的量 即 这里的缓冲指数指的是微分缓冲容量,是 加酸碱物质的量随着 pH 值的变化率 1 ,微分缓冲容量.
初中几何第三册 弦切角 授课人: 董清玲. 弦切角 一、引入新课: 什么是圆心角、圆周角、圆周角定理的内容是什么? 顶点在圆心的角叫圆心角。 顶点在圆上,并且两边都和圆相交的角叫做圆周角。 定理:一条弧所对的圆周角等于它所对的圆心角的一半。 A B′ C B O.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
Image Segmentation Seminar III Xiaofeng Fan. Today ’ s Presentation Problem Definition Problem Definition Approach Approach Segmentation Methods Segmentation.
TCP Vegas Kulan Kao 2006/3/25.
A Clustering Algorithm based on Graph Connectivity Balakrishna Thiagarajan Computer Science and Engineering State University of New York at Buffalo.
A Graph-based Friend Recommendation System Using Genetic Algorithm
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
第一节 物质的量. 聚小成大,聚微成宏 想想看: 你如何用托盘天平称出一粒米的质 量(假设每粒大米的质量一样大 )
1/52 Overlapping Community Search Graph Data Management Lab, School of Computer Science
1 Signals and Systems Lecture 26 Properties of Laplace Transform Analysis LTI System using LT System Function.
Hierarchical Affinity Propagation Inmar E. Givoni, Clement Chung, Brendan J. Frey.
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
Power Iteration Clustering Speaker: Xiaofei Di
向日葵的花盘 画一画 用圆规画圆用圆规画圆 用圆规画圆用圆规画圆 用圆规画圆的方法: ( 1 )把圆规的两脚分开,定好两脚间 的距离(定长) ( 2 )把有针尖的一只脚固定在一点上 (定点) ( 3 )把装有铅笔尖的一只脚旋转一周 ,就画出一个圆(旋转)
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
1 第 4 章 速度瞬心及其应用 ● 利用速度瞬心进行机构的速度分析 ● 将低副机构转变为高副机构 ( 瞬心线机 构,共轭曲线机构) ● 用低副机构的分析方法对高副机构进 行结构和运动分析 ( 高副低代 )
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
3D 仿真机房建模 哈尔滨工业大学 指导教师:吴勃英、张达治 蒋灿、杜科材、魏世银 机房尺寸介绍.
Graph Data Management Lab, School of Computer Science Add title here: Large graph processing
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
Is this your pencil? What can you see in our classroom? I can see a/an...
三、灰表面间的辐射换热 1 、有效辐射 J ( Radiosity ) : 黑体表面: 在灰体表面间存在多次吸收、反射现象 — 黑体不反射 灰体表面: — 灰体反射 假设:灰体; ;投射辐射 G 有效辐射 J :单位时间内、由灰体 的单位表面积所射离的总能量 有效辐射 J 为灰体本身的辐射(辐 射力.
寿县一中 常清 简单几何体 鸟巢.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
思考:物质由哪些微粒构成? 思考:物质由哪些微粒构成? 仅仅是只由分子原子构成的吗?有没有其它的 微粒? 仅仅是只由分子原子构成的吗?有没有其它的 微粒? 原子 原子核 ( + ) ( + ) 质子( + ) 中子 核外电子( – ) H 、 C 、 O 、 Na 、 S 这五种元素的原子核外各有.
元 胞 自 动 机. 一. 元胞自动机的定义及构成 元胞自动机 (Cellular Automata ,简称 CA ,也有 人译为细胞自动机、点格自动机、分子自动机 或单元自动机 ) 。 是一时间和空间都离散的动力系统。散布在规 则格网 (Lattice Grid) 中的每一元胞 (Cell) 取有限.
Greedy Algorithm for Community Detection
Binghui Wang, Le Zhang, Neil Zhenqiang Gong
Generating Hierarchical link patterns based on concept lattice for Navigating the Web of Data Liang Zheng.
Presentation transcript:

Graph Data Management Lab, School of Computer Science Put conference information here: The 12-th International Conference of Date Engineering Version 1( ) 张俊骏 A Large-Scale Community Structure Analysis in Facebook

Graph Data Management Lab, School of Computer Science Put conference information here: The 12-th International Conference of Date Engineering OutLine Introduction Data Collection Algorithm (1) BFS sampling(2) Uniform sampling Detection Communities (1) LPA algorithm(2) FNCA algorithm Experimentation (1) Community structure similarity (2) Out-of-scale community

Graph Data Management Lab, School of Computer Science Introduction Large-Scale:There have been over 500 million users registered in Facebook in Community Structure : (1) Relationships are very tight over some areas of the social life, such as family, colleagues,friends. (2) While the outgoing connections not belonging to any of these categories are less likely to happen.

Graph Data Management Lab, School of Computer Science Introduction(2) Large-Scale:There have been over 500 million users registered in Facebook in Community Structure : (1) Relationships are very tight over some areas of the social life, such as family, colleagues,friends. (2) While the outgoing connections not belonging to any of these categories are less likely to happen.

Graph Data Management Lab, School of Computer Science Introduction(3) Community:A sub-structure within the overall graph, in which the density of the relationships in a certain community is much greater than the density among communities. Clustering : Get the communities within the certain graph (overall, or generating subgraph). In mathematic word, find a partition V = (V1 ∪ V2 ∪... ∪ Vn) , in which V1-Vn are vertex sets and for any Vx and Vy, Vx ∩ Vy = Ø

Graph Data Management Lab, School of Computer Science Introduction(4) DataSets:(1) 2 different samples of the graph of relationships among the social network users. (2) Each contains millions entities, and then adopting two fast and efficient community detecting algorithms. (3) Working with no a-priori knowledge.

Graph Data Management Lab, School of Computer Science Data Collection Algorithm BFS Sampling

Graph Data Management Lab, School of Computer Science Data Collection Algorithm (2) BFS Sampling (1) Starting from one node (2) End when reaching the required level or node number. (3) Easy to achieve ; Efficient (4) Depend on the node selected at the start.

Graph Data Management Lab, School of Computer Science Data Collection Algorithm (3) Uniform Sampling

Graph Data Management Lab, School of Computer Science Data Collection Algorithm(4) Uniform Sampling Legal ID number in Facebook: about 2^32 Existed ID number in Facebook: about 500 million (2011) Thus, theoretically, if we want to mine a dataset of 1 million existed IDs, we need to test: S = 1,000,000 / (500,000,000/2^32) = 8,590,000 legal IDs Thus, generate 8,590,000 legal IDs randomly, check whether that ID exist. If so, mine the information of this node ; otherwise, drop it.

Graph Data Management Lab, School of Computer Science Data Collection Algorithm(5) Uniform Sampling Obviously, the advantage of uniform sampling is the fact that the social network of the nodes will not make effect on the result. In the actual experiment, the generating dataset is a little smaller than BFS, because some users hide themselves from the random search.

Graph Data Management Lab, School of Computer Science Data Collection Algorithm(6) DataSet Description 平均集聚系数为所有结点 Vi 的局部集聚系数的均值 结点 Vi 的局部集聚系数 Ci 是它的相邻结点之间的连接数与它们所有可能 存在连接的数量的比值。

Graph Data Management Lab, School of Computer Science Detecting Communities LPA algorithm

Graph Data Management Lab, School of Computer Science Detecting Communities(2) LPA algorithm (1) Under specific conditions, could not converge. In order to avoid deadlocks and to guarantee an efficient network clustering, we suggested to adopt an "asynchronous" update of the labels, thus considering the values of some neighbors at the previous iteration and some at the actual one. (2) About 5 iterations are sufficient to correctly classify 95% of vertices of the network.

Graph Data Management Lab, School of Computer Science Detecting Communities(3) LPA algorithm (3) It could exist a path connecting a pair of vertices in a group passing through vertices belonging to different groups.We devise a final step to split the groups into one or more contiguous communities. (4) Near linear cost (5) Not stable in some cases

Graph Data Management Lab, School of Computer Science Detecting Communities(4) FNCA algorithm(Pre)

Graph Data Management Lab, School of Computer Science Detecting Communities(4) FNCA algorithm(Pre)

Graph Data Management Lab, School of Computer Science Detecting Communities(5) FNCA algorithm Aij=1 当且仅当点 i 和点 j 互相连接。 δ ( u,v ) =1 当且仅当 u=v ki 就是点 i 与所有其他点 j 的 Aij 的总和 ( 即点 i 的总边数 ) m 是所有点的 k 值的总和的一半(即图的总边数) r(i) 即 i 所属的社区

Graph Data Management Lab, School of Computer Science Detecting Communities(6)

Graph Data Management Lab, School of Computer Science Detecting Communities(7) FNCA algorithm (1) Experimental results show that, the clustering solution of FNCA is good enough before iteration number reaches 50 for most networks (even large scale) (2) Generally speaking, the community structure of a network is evident when its Q-value is greater than 0.3 (3) The time complexity of the FNCA algorithm can not be worse than O(T * n * k * c)

Graph Data Management Lab, School of Computer Science Detecting Communities(8) Experimentation Result

Graph Data Management Lab, School of Computer Science Detecting Communities(9) Experimentation Result

Graph Data Management Lab, School of Computer Science Experimentation Community structure similarity

Graph Data Management Lab, School of Computer Science Experimentation(2) Community structure similarity rough method: improved method: M11 代表 v 交 w 之间共享的元素总数, M01 代表 w-v, M10 代表 v-w 当且仅当 v=w 时这个 J 值等于 1

Graph Data Management Lab, School of Computer Science Experimentation(3) Experimantal results

Graph Data Management Lab, School of Computer Science Experimentation(4) Out-of-scale community Maybe the shortage of algorithms, maybe it real exists. Anyway, it will be studied in the future.

Graph Data Management Lab, School of Computer Science Thank you!