ADAPTIVE EVENT DETECTION USING TIME-VARYING POISSON PROCESSES Kdd06 University of California, Irvine.

Slides:



Advertisements
Similar presentations
Chapter 11 Inferences About Population Variances
Advertisements

第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
概率统计( ZYH ) 节目录 2.1 随机变量与分布函数 2.2 离散型随机变量的概率分布 2.3 连续型随机变量的概率分布 第二章 随机变量及其分布.
在近年的高考地理试题中,考查地球上 两点间最短航线的方向问题经常出现,由于 很多学生对这类问题没有从本质上搞清楚, 又缺乏空间想象能力,只是机械地背一些结 论,造成解这类题目时经常出错。 地球上两点间的最短航线方向问题.
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
第八章 多元函数微分法 及其应用 返回 高等数学( XAUAT ) 练习题 解答 练习题 解答 重点难点 基本概念 计算方法 练习题 典型例题 定理结论 习题课结构.
Removing Camera Shake from a Single Photograph 报告人:牟加俊 日期: In ACM SIGGRAPH, 2006.
Anomaly Detection in the WIPER System using A Markov Modulated Poisson Distribution Ping Yan Tim Schoenharl Alec Pawling Greg Madey.
学习方式测量表. 测试方式 对于下列的问题做出 “ 是 ” 或者 “ 否 ” 的回答 填表说明 这是一份学习方式测量表,共 16 个 问题。请你认真完成,然后对照后面 对测验结果做出的解释,检查自己的 学习方式属于什么类型。
细分曲面 傅孝明 SA 目录 细分曲面的基本思想 两个关键问题 一些基本概念 几种简单的细分曲面算法 细分曲面方法分类.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
第二十三讲 7.3 利用频率采样法设计 FIR 滤波器. 回顾窗函数设计法: 得到的启发:能否在频域逼近? 用什么方法逼近? 通过加窗实 现时域逼近.
CS 589 Information Risk Management 6 February 2007.
分析化学与无机化学中溶液 pH 值计算的异同比较 谢永生  分析化学是大学化学系的一门基础课,课 时较少,其内容主要是无机物的化学分析。 分析化学是以无机化学作为基础的,我们 都是在已掌握一定的无机化学知识后才学 习分析化学 。所以在分析 化学的学习中会 重复许多无机化学内容,造成学习没有兴.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
例9:例9: 第 n-1 行( -1 )倍加到第 n 行上,第( n-2 ) 行( -1 )倍加到第 n-1 行上,以此类推, 直到第 1 行( -1 )倍加到第 2 行上。
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
第 4 章 过程与变量的作用范围. 4.1 Visual Basic 的代码模块 Visual Basic 的应用程序是由过程组成的, 过程代码存放在模块中。 Visual Basic 提供了 三类模块,它们是窗体模块、标准模块和类 模块。 窗体模块 窗体模块是大多数 Visual Basic.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
UML 对象设计与编程 主 讲 : 董兰芳 副教授 Dept. of Computer Science,USTC
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
Fitting (special modeling) 董小波 预习 BR2003, Chap. 6.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS ) 三、参数估计的最大或然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
第 3 章 控制流分析 内容概述 – 定义一个函数式编程语言,变量可以指称函数 – 以 dynamic dispatch problem 为例(作为参数的 函数被调用时,究竟执行的是哪个函数) – 规范该控制流分析问题,定义什么是可接受的控 制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
Probabilistic Analysis of a Large-Scale Urban Traffic Sensor Data Set Jon Hutchins, Alexander Ihler, and Padhraic Smyth Department of Computer Science.
周期信号的傅里叶变换. 典型非周期信号 ( 如指数信号, 矩形信号等 ) 都是满足绝对可 积(或绝对可和)条件的能量信号,其傅里叶变换都存在, 但绝对可积(或绝对可和)条件仅是充分条件, 而不是必 要条件。引入了广义函数的概念,在允许傅里叶变换采用 冲激函数的前提下, 使许多并不满足绝对可积条件的功率.
Modeling Count Data over Time Using Dynamic Bayesian Networks Jonathan Hutchins Advisors: Professor Ihler and Professor Smyth.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
Statistical Software An introduction to Statistics Using R Instructed by Jinzhu Jia.
1 1 Slide HJ Copyrights Chapter 5 Discrete Probability Distributions n Random Variables n Discrete Probability Distributions n Expected Value and Variance.
Activity Detection in Videos Riu Baring CIS 8590 Perception of Intelligent System Temple University Fall 2007.
Chapter 4 Linear Models for Classification
Particle Filtering in Network Tomography
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
WSEAS AIKED, Cambridge, Feature Importance in Bayesian Assessment of Newborn Brain Maturity from EEG Livia Jakaite, Vitaly Schetinin and Carsten.
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
Introduction to Automatic Control The Laplace Transform Li Huifeng Tel:
第九章 Monte Carlo 积分. Monte Carlo 法的重要应用领域之一:计算积分和多重积分 适用于求解: 1. 被积函数、积分边界复杂,难以用解析方法或一般的数 值方法求解; 2. 被积函数的具体形式未知,只知道由模拟返回的函数值。 本章内容: 用 Monte Carlo 法求定积分的几种方法:
Computer vision: models, learning and inference Chapter 19 Temporal models.
Monte Carlo 模拟 第四章 Monte Carlo 积分. Monte Carlo 法的重要应用领域之一:计算积分和多重积分 适用于求解: 1. 被积函数、积分边界复杂,难以用解析方法或一般的数 值方法求解; 2. 被积函数的具体形式未知,只知道由模拟返回的函数值。 本章内容: 用 Monte.
Bayesian Network By DengKe Dong. Key Points Today  Intro to Graphical Model  Conditional Independence  Intro to Bayesian Network  Reasoning BN: D-Separation.
Mixture Models, Monte Carlo, Bayesian Updating and Dynamic Models Mike West Computing Science and Statistics, Vol. 24, pp , 1993.
第 7 章说明 经典的单方程计量经济学模型理论与方法,限于常参数、 线性、揭示变量之间因果关系的单方程模型,被解释变量 是连续的随机变量,其抽样是随机和不受限制的,在模型 估计过程中或者只利用时间序列样本,或者只利用截面数 据样本,主要依靠对经济理论和行为规律的理解确定模型 的结构形式。 本章中,将讨论几种扩展模型,主要包括将被解释变量抽.
Libsvm-2.6使用介绍
综合性问题 距离和角度的度量 画法几何及机械制图 精品资源共享课 换面法应用 工程图学教研室. 工程实际抽象出来的几何问题,如距离、角度的度量;点、线、面 的定位等,并不是单纯的平行、相交、垂直问题,而多是较复杂的综 合问题,其突出特点是要受若干条件的限制,求解时往往要同时满足 几个条件。 解决此类问题的方法通常是:分析、确定解题方案及投影图上实.
Learning to Detect Events with Markov-Modulated Poisson Processes Ihler, Hutchins and Smyth (2007)
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
第四章 不定积分. 二、 第二类换元积分法 一、 第一类换元积分法 4.2 换元积分法 第二类换元法 第一类换元法 基本思路 设 可导, 则有.
Paper Reading Dalong Du Nov.27, Papers Leon Gu and Takeo Kanade. A Generative Shape Regularization Model for Robust Face Alignment. ECCV08. Yan.
The generalization of Bayes for continuous densities is that we have some density f(y|  ) where y and  are vectors of data and parameters with  being.
Markov Chain Monte Carlo for LDA C. Andrieu, N. D. Freitas, and A. Doucet, An Introduction to MCMC for Machine Learning, R. M. Neal, Probabilistic.
Bayesian Travel Time Reliability
海军工程大学信息安全系 汇报人:周学广 教授 基于主题情感混合模型 的无监督文本情感分析. 海军工程大学信息安全系 主要内容 一 LDA 模型 二 UTSU 模型 三 实验对比与分析.
Chap 7-1 Chapter 7 Sampling and Sampling Distributions Statistics for Business and Economics.
第五章 特征值与特征向量 —— 幂法 /* Power Method */ 计算矩阵的主特征根及对应的特征向量 Wait a second, what does that dominant eigenvalue mean? That is the eigenvalue with the largest.
Statistical Methods. 2 Concepts and Notations Sample unit – the basic landscape unit at which we wish to establish the presence/absence of the species.
Gibbs Sampling and Hidden Markov Models in the Event Detection Problem By Marc Sobel.
Generation of Chinese Character Based on Human Vision and Prior Knowledge of Calligraphy 报告人: 史操 作者: 史操、肖建国、贾文华、许灿辉 单位: 北京大学计算机科学技术研究所 NLP & CC 2012: 基于人类视觉和书法先验知识的汉字自动生成.
一、弧微分 规定:   单调增函数 如图,   弧微分公式 二、曲率及其计算公式 曲率是描述曲线局部性质(弯曲程度)的量. ) ) 弧段弯曲程度 越大转角越大 转角相同弧段越 短弯曲程度越大 1 、曲率的定义 )
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
1 Chapter 8 Fundamental Sampling Distribution and Data Description  Random Sampling  Some Important Statistics  Sampling Distribution  Sampling Distribution.
Business Statistics Topic 5
Presentation transcript:

ADAPTIVE EVENT DETECTION USING TIME-VARYING POISSON PROCESSES Kdd06 University of California, Irvine

ABSTRACT Time-series of count data  aggregated behavior of individual person  periodic  bursty periods of unusual behavior In this paper  statistical estimation techniques  time-varying Poisson process model  unsupervised learning Two data sets with ground truth  freeway traffic data  building access data  performs better than a non-probabilistic, threshold-based technique

CONTENT Introduction Related work Data set characteristics A baseline model and its limitations Probabilistic modeling Learning and inference Adaptive event detection Estimating event attendance Conclusion

INTRODUCTION

Focus on  time-series data where time is discrete and N(t) is a measurement of the number of individuals or objects recorded over the time-interval [t-1, t].

DEFINITION OF EVENT Events  Sustained (bursty) periods of anomalous behavior  sometimes refer to individual measurements  Here, a large-scale activity that is unusual relative to normal patterns  such as a large meeting in a building, a malicious attack on a Web server, or a traffic accident on a freeway. Chicken and egg problem  requires some knowledge of what constitutes normal behavior  historical data consists of both normal and anomalous (event) data mixed together.

Goal  define a model of uncertainty (how unusual is the measurement?), and additionally incorporate a notion of event persistence.  learn a model that reflects the bimodal nature of such data, namely a combination of the normal traffic patterns to which is occasionally added additional counts caused by aperiodic events.

RELATED WORK

Techniques  Markov model  Likelihood-based method  A combination of Poisson models and Bayesian estimation methods  Infinite automaton Common goal  Detect novel and unusual data points or segments in time-series

DATA SET CHARACTERISTICS

BUILDING DATA

FREEWAY TRAFFIC DATA

Holiday data should be removed before modeling, because they involve relatively different behavior.

A BASELINE MODEL AND ITS LIMITATIONS

Threshold test based on a Poisson model  estimate the Poisson rate λ of a particular time and day by averaging the observed counts on similar days at the same time  The max likelihood estimate  and λ < N

Limitations  Is adequate when events cause a large increase in count data  Fail when facing the chicken and egg problem  Thresholds and the false alarms

PROBABILISTIC MODELING

Model N(t)  Normal behavior: N 0 (t)  Event caused: N e (t) 

MODELING PERIODIC COUNT DATA Poisson distribution  λ (t)  d(t)  Indicates the weekday on which time t falls h(t)  Indicates the interval in which time t falls δ and η 

MODELING PERIODIC COUNT DATA The effect of δ d(t)

MODELING PERIODIC COUNT DATA The effect of η d(t),h(t)

MODELING PERIODIC COUNT DATA

MODELING RARE, PERSISTENT EVENTS Use binary process z(t) to indicate the presence if an event  Transition probability matrix   Length of period between events is with expected value 1 / z 0  Length of each event is with expected value 1 / z 1 z 0 and z 1 priors 

N E (t)  γ (t) is independent at each time t 

Markov-modulated Poisson model

LEARNING AND INFERENCE

MCMC  Markov chain Monte Carlo methods  Monte Carlo 方法的基本思想是 :为 了求解某个 问题, 建立一个恰当的概率模型 或随机 过 程 , 使得其参量 ( 如事件的概率 、 随机 变 量的数学期望等 ) 等于所求 问题 的解 , 然后 对 模型或 过 程 进 行反复多次的随机抽 样试验, 并 对结 果 进 行 统 计 分析 , 最后 计 算所求参量 , 得到 问题 的近似解 。 Hidden variables  {z(t), N 0 (t), N E (t)}

SAMPLING THE HIDDEN VARIABLES GIVEN PARAMETERS Likelihood functions  Sample  If z(t) = 0  N 0 (t) = N(t) If z(t) = 1 

SAMPLING THE PARAMETERS GIVEN THE COMPLETE DATA Integral number of weeks  T = 7 * D * W The complete data likelihood  In this case, only involve λ 0, δ and η  Sufficient statistics of the data

Posterior distributions 

ADAPTIVE EVENT DETECTION

ESTIMATING EVENT ATTENDANCE

CONCLUSION

Described a framework for building a probabilistic model of time- varying counting processes Observe a superposition of both time-varying but regular(periodic) and aperiodic processes Applied this model to two different time series of counts both over several months Described how the parameters of the model may be estimated using MCMC sampling