讲解人 : 崔 振 2010.9.17 Supervised Translation-Invariant Supervised Translation-Invariant Sparse Coding [ Jianchao Yang, Kai Yu, Thomas Huang ]

Slides:



Advertisements
Similar presentations
ProQuest Digital Dissertations PQDD 学位论文全文库. 1 、数据库简介 PQDD 是世界著名的学位论文数据库,收 录有欧美 1 , 000 余所大学文、理、工、农、医 等领域的博士、硕士学位论文,是学术研究中 十分重要的信息资源。 本数据库为 PQDD 文摘 数据库中部分记录的全文。
Advertisements

第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
基本知识和几何要素的投影 模块一: 字体练习 第一章 制图的基本知识与基本技能 题目提示返回.
位置相关查询处理 研究背景及意义 移动计算、无线通信以及定位技术的快速发展,使 得位置相关的查询处理及基于位置的信息服务技术 已经成为一个热点研究领域 。 大量的应用领域 ( 如地理信息系统、智能导航、交 通管制、天气预报、军事、移动电子商务等 ) 均迫 切需要有效地查询这些数据对象。
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
第 4 章 空间数据的转换与处理. 主要内容 投影变换 数据格式转换 数据处理 在 GIS 中,空间数据是一个重要的部分。整个 GIS 都是围绕空间数据的采集、加工、存储、分析和 表现展开的。而原始空间数据本身通常在数据结构、 数据组织、数据表达上和用户自己的信息系统不一致, 就需要对原始数据进行转换与处理,如投影变换,不.
第二十三讲 7.3 利用频率采样法设计 FIR 滤波器. 回顾窗函数设计法: 得到的启发:能否在频域逼近? 用什么方法逼近? 通过加窗实 现时域逼近.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
第 2 章 数据流分析 内容概述 数据流分析推导的是数据沿着程序执行路 径流动的信息 – 过程内的分析:可用表达式分析、到达-定值分 析等 – 过程间分析 –Shape 分析 – 理论基础 – 数据流方程的求解.
5 第五章 二次型 学时: 10 学时。 教学手段:  讲授和讨论相结合,学生课堂练习,演练习题与辅导答疑相结合。 基本内容和教学目的:  基本内容: 二次型的矩阵表示、标准型、唯一性、正定二次型。  教学目的:  1 、了解二次型的概念,二次型的矩阵表示。  2 、会化二次型为标准型,规范性。
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
第十一章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归.
协同工作环境研究中心 协同共享 助力科研. 主要内容  认识协同及协同软件  协同科研软件 duckling 介绍.
实验一: 信号、 系统及系统响应 1 、实验目的 1 熟悉连续信号经理想采样前后的频谱变化关系, 加深对时 域采样定理的理解。 2 熟悉时域离散系统的时域特性。 3 利用卷积方法观察分析系统的时域特性。 4 掌握序列傅里叶变换的计算机实现方法, 利用序列的傅里 叶变换对连续信号、 离散信号及系统响应进行频域分析。
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
6 第一章 线性空间 学时: 16 学时。 教学手段:  讲授和讨论相结合,学生课堂练习,演练习题与辅导答疑相结合。 基本内容和教学目的:  基本内容:集合、映射的概念;线性空间的定义与简单性质、维 数、基与坐标、过渡矩阵的概念;基变换与坐标变换;线性子空 间、子空间的交与和、子空间的直和;线性空间的同构等概念。
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
1 第 7 章 专家控制系统 概述 专家系统的起源与发展 专家系统的一般结构 专家系统的知识表示和获取 专家系统的特点及分类.
信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang
第二章 贝叶斯决策理论 3学时.
流态化 概述 一、固体流态化:颗粒物料与流动的流体接触,使颗粒物料呈类 似于流体的状态。 二、流态化技术的应用:流化催化裂化、吸附、干燥、冷凝等。 三、流态化技术的优点:连续化操作;温度均匀,易调节和维持; 气、固间传质、传热速率高等。 四、本章基本内容: 1. 流态化基本概念 2. 流体力学特性 3.
量子化学 第四章 角动量与自旋 (Angular momentum and spin) 4.1 动量算符 4.2 角动量阶梯算符方法
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS ) 三、参数估计的最大或然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
量子力学教程 ( 第二版 ) 3.4 连 续 谱 本 征 函 数 的 归 一 化 连续谱本征函数是不能归一化的 一维粒子的动量本征值为的本征函数 ( 平面波 ) 为 可以取 中连续变化的一切实数值. 不难看出,只要则 在量子力学中, 坐标和动量的取值是连续变化 的 ; 角动量的取值是离散的.
1 地 理 信 息 系 统 —— 专业必修课程 西南大学地理科学学院 田永中 ,
第 3 章 控制流分析 内容概述 – 定义一个函数式编程语言,变量可以指称函数 – 以 dynamic dispatch problem 为例(作为参数的 函数被调用时,究竟执行的是哪个函数) – 规范该控制流分析问题,定义什么是可接受的控 制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
平行线的平行公理与判定 九年制义务教育七年级几何 制作者:赵宁睿. 平行线的平行公理与判定 要点回顾 课堂练习 例题解析 课业小结 平行公理 平行判定.
第二十四讲 相位延时系统 相位超前系统 全通系统. 一、最小与最大相位延时系统、最小 与最大相位超前系统 LSI 系统的系统函数: 频率响应:
编译原理总结. 基本概念  编译器 、解释器  编译过程 、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.
§8-3 电 场 强 度 一、电场 近代物理证明:电场是一种物质。它具有能量、 动量、质量。 电荷 电场 电荷 电场对外的表现 : 1) 电场中的电荷要受到电场力的作用 ; 2) 电场力可移动电荷作功.
 符号表  标识符的作用: 声明部分:定义了各种对象及对应的属性和 使用规则。 程序体:对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token : 新表-符号表(种类、类型等信息):
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
模式识别 – 成分分析与核函数 第八章 成分分析与核函数. 模式识别 – 成分分析与核函数 8.0 问题的提出 降低特征维数 : Dimension Reduction  提高泛化能力:减少模型的参数数量;  减少计算量: 主要方法: 1. 主成分分析 (PCA): Principle Component.
演化博弈中个体的 惰性对合作行为的 影响 报告人:刘润然 中国科学技术大学 指导老师:汪秉宏教授.
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
1 物体转动惯量的测量 南昌大学理学院
老子大道的逻辑解析 思东创作室 编号: 006. 直接性 — 第 1 章 01— 间接性 直接性 — 第 1 章 02— 间接性.
基于加权词汇衔接的文档级机 器翻译自动评价 贡正仙 李良友 苏州大学计算机科学与技术学院
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
2015 年江苏省美术专业统考考试说明 解读 : 贡加兵 扬州市邗江区公道中学
第三章 正弦交流电路.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
“ 图书馆资源与服务利用 ” 专题讲座 第 9 讲 JSTOR 数据库与 Kluwer Online 数据库的使用.
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
海军工程大学信息安全系 汇报人:周学广 教授 基于主题情感混合模型 的无监督文本情感分析. 海军工程大学信息安全系 主要内容 一 LDA 模型 二 UTSU 模型 三 实验对比与分析.
目标与要求: 让学生了解材料美是布的基本特点,利 用布的特点进行创作,培养学生的创新和实 践能力。
异核编辑谱 生物大分子波谱学原理 吴季辉 一般异核编辑谱由同核 NOESY 或 TOCSY 同 HSQC 或 HMQC 串接成,提供的信息 类似同核谱,但是谱峰在与 1 H 核相关的 13 C 或 15 N 核的化学位移上展开以解决同 核谱重叠的问题。其中异核编辑的 NOESY 谱是最后结构计算所需的.
半年工作小结 报告人:吕小惠 2011 年 8 月 25 日. 报告提纲 一.学习了 Non-negative Matrix Factorization convergence proofs 二.学习了 Sparse Non-negative Matrix Factorization 算法 三.学习了线性代数中有关子空间等基础知.
张勤 人大报刊复印资料 专题全文数据库 简 介简 介 《人大报刊资料全文数据库》是中国人民大 学书报资料中心与北京博利群电子信息有限 公司联合开发研制的大型数据库光盘。它涵 盖面广、信息量大、分类科学、筛选严谨、 结构合理,是国内最具权威的社会科学、人.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
§5.6 利用希尔伯特 (Hilbert) 变换 研究系统的约束特性 希尔伯特变换的引入 可实现系统的网络函数与希尔伯特变换.
Generation of Chinese Character Based on Human Vision and Prior Knowledge of Calligraphy 报告人: 史操 作者: 史操、肖建国、贾文华、许灿辉 单位: 北京大学计算机科学技术研究所 NLP & CC 2012: 基于人类视觉和书法先验知识的汉字自动生成.
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
资源与服务利用专题讲座 第 10 讲 : 汉语国际教育相关资料查找 徐红梅
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
Non-Negative Matrix Factorization ( NMF ) Reportor: MaPeng Paper :D.D.Lee andS.Seung,”Learning the parts of objects by non-negative matrix factorization”
WLBP: Weber local binary pattern for local image description Fan Liu, Zhenmin Tang, Jinhui Tang, 报告人:陈 霞.
SME.USTB Human Factors 人机工程学 By Wei Dong Department of Industry Design, SME, USTB.
Presentation transcript:

讲解人 : 崔 振 Supervised Translation-Invariant Supervised Translation-Invariant Sparse Coding [ Jianchao Yang, Kai Yu, Thomas Huang ]

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

Jianchao Yang Image Formation & Processsing Group (IFP), University of Illinois at Urbana-Champaign (UIUC) Ph.D. Candidate (06-Present, ECE, UIUC) ; Ph.D. Adviser: Prof. Thomas S. Huang B.Eng (02-06, EEIS, USTC) Publication (第一作者)  CVPR : 4 篇, 2 篇 oral  TIP : 2 篇  ECCV10 , 1 篇  ICIP,1 篇 Homepage:

Kai Yu Machine Learning researcher and the Head of Media Analytics Department at NEC Laboratories America. Inc.. Ph.D. Computer Science, University of Munich,Germany, January 2001 – July B.Sc and M.Sc, Nanjing University. Research Interests  Areas: machine learning, data mining, information retrieval, computer vision CVPR(4),ECCV(4+),ICML(8+),NIPS(10+),…

Thomas Huang Beckman Institute Image Formation and Processing and Artificial Intelligence groups. William L. Everitt Distinguished Professor in the U of I Department of Electrical and Computer Engineering and the Coordinated Science Lab (CSL); Sc.D. from MIT in 1963 computer vision, image compression and enhancement, pattern recognition, and multimodal signal processing.

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

文章信息 文章出处  CVPR10 ( oral ) 相关文章  Yang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09.

Abstract In this paper, we propose a novel supervised hierarchical sparse coding model based on local image descriptors for classification tasks. The supervised dictionary training is performed via back-projection, by minimizing the training error of classifying the image level features, which are extracted by max pooling over the sparse codes within a spatial pyramid. Such a max pooling procedure across multiple spatial scales offer the model translation invariant properties, similar to the Convolutional Neural Network (CNN). Experiments show that our supervised dictionary improves the performance of the proposed model significantly over the unsupervised dictionary, leading to state-of-the-art performance on diverse image databases. Further more, our supervised model targets learning linear features, implying its great potential in handling large scale datasets in real applications.

摘要 针对分类任务,提出了一种新颖的基于局部图像描述子的 监督分级稀疏编码模型。 通过 back-projection 方法,以最小化在图像层级特征 (image level features) 的分类误差训练监督词典。其中图 像层级特征是以空间金字塔为结构 max pooling 稀疏编码。 在多种空间尺度下 max pooling 方法具有平移不变的特性, 如同 CNN(Convolutional Neural Network) 一样。 实验证明,与无监督词典相比,监督词典明显地改善了模 型的性能,并且在多个图像数据库拥有最好的表现。 另外,监督模型目标是学习线性特征,它蕴含了一个巨大 潜能 - 实时地处理大规模数据库。

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

拟解决的问题 Image classification  To find a generic feature representation  Interested in linear prediction model

Sparse Coding for Image Classification Sparse CodingUnsupervisedSupervised Sparse coding on holistic image -Linear model assumption -Sensitive to image misalignment -Limited applications D. Bradley et al. ‘08 J. Wright et al. ’09 A. Wagner et al.’09 etc D. Bradley et al. ‘08 J. Marialet al. ’08 Q. Zhang. CVPR10 etc Sparse coding on local descriptors -Break linear model assumption for the image space -Robust to image misalignment -Applicableto generic image classification R. Rainaet al. ’07 J. Yang et al. ’09 J. Yang et al. ’10 etc ?

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

本文的方法 框架 相关知识 本文模型 求解方法

框架 Bag of coordinated Local descriptors High-dimensional sparse codes Image representation It must be a cool Cat! Descriptor extraction nonlinear coding feature pooling classification J. Yang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09. Yang. CVPR09

已有方法 Histogram-based SPM feature  Step 1: local descriptor extraction  Step 2: vector quantization (e.g.k-means)  Step 3: hierarchical average pooling  Step 4: nonlinear SVM The framework of ScSPM ( CVPR09 )  Step 1: local descriptor extraction  Step 2: sparse coding ( 无监督词典 )  Step 3: hierarchical max pooling  Step 4: linear SVM

相关知识 (1) Sparse coding Max pooling X nxm =(X 1,X 2,…,X m ) B nxk :词典 Z kxm :稀疏系数

相关知识 (2) 分级融合 S: 尺度(层次) U: 串接

Model ( 1 ) 多层 max pooling + SVM 目标函数 X k :表示第 k 个图像

监督 Model ( 2 ) - 目标函数 Optimization over B: back propagation!

求解方法( 1 ) Squared hinge loss function Linear prediction model Only cares about the pooled maximum values No analytical link

求解方法( 2 ) Solution: use implicit differentiation D. M. Bradley et al. Differentiable sparse coding. NIPS Setting the gradients at zero coefficients to be zero, a lot of computations can be saved!

Training convergence Initialization is important: B is trained in unsupervised manner. Convergence

Example dictionary Example dictionary: CMU PIE Unsupervised Supervised

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

Experiment Classification tasks  Face recognition: CMU PIE, and CMU Multi-PIE  Handwritten digit recognition: MNIST  Gender Recognition: FRGC 2.0 Image local descriptors: raw image patches Prediction model: one-vs-all linear SVM with squared hinge loss function. Stochastic optimization: typically converges in 10 iterations, gradient descent.

Experiment Parameter settings 学习率:

Experiment –Face Recognition (1) CMU PIE:  images of 68 people, each under 13 poses, 43 different illumination conditions with 4 different expressions.  A subset of five near frontal views are used including all expressions and illuminations.

Experiment –Face Recognition (1) USC: unsupervised sparse coding model. SSC: supervised sparse coding model. Improvements: shows the improvements of SSC over USC. Classification error(%) on CMU PIE

Experiment –Face Recognition (2) CMU Multi-PIE:  contains 337 subjects across simultaneous variations in pose, expression and illumination.  A subset containing near frontal view face images are used as training and testing.

Experiment –Face Recognition (2) [SR] A. Wagner et al. Towards a practical face recognition system: robust registration and illumination by sparse representation. CVPR’09. Face recognition error(%) on Multi-PIE

Experiment – Handwritten Digit Recognition MNIST: consists of 70,000 handwritten digits, aligned to the center. 60,000 of them are modeled as training, and the rest 10,000 as testing.

Experiment – Gender Recognition FRGC 2.0  contains 568 individuals, totally face images under various lighting conditions and backgrounds.  face images of 451 individuals are used as training, and the remaining 3014 images of 114 persons are used as testing.

Experiment – Gender Recognition

提纲 作者信息 文章信息 拟解决的问题 本文的方法 实验 结论

Conclusion A supervised translation-invariant sparse coding model for image classification  A generic image representation.  The max pooling feature is translation-invariant.  Sparse coding on local descriptors is promising compared to sparse coding on holistic image.  Supervised sparse coding improves the performance significantly.  Next steps:  Connections with hierarchical models in deep belief networks should be investigated.  More theoretical analysis for pooling functions are needed.  Deep hierarchical models based on sparse coding should be studied.

参考文献 Jianchao Yang, Kai Yu, Thomas Huang,Supervised Translation- Invariant Sparse Coding. CVPR10. J. Yang et al. Translation-Invariant Sparse Coding. CVPR10(talk). J. Yang et al. Linear spatial pyramid matching using sparse coding for image classification. CVPR’09.