Computer Vision Group University of California Berkeley Visual Grouping and Object Recognition Jitendra Malik * U.C. Berkeley * with S. Belongie, C. Fowlkes,

Slides:

Advertisements

Similar presentations

Shape Matching and Object Recognition using Low Distortion Correspondence Alexander C. Berg, Tamara L. Berg, Jitendra Malik U.C. Berkeley.

Advertisements

Multiclass SVM and Applications in Object Classification

Image classification Given the bag-of-features representations of images from different classes, how do we learn a model for distinguishing them?

Recovering Human Body Configurations: Combining Segmentation and Recognition Greg Mori, Xiaofeng Ren, and Jitentendra Malik (UC Berkeley) Alexei A. Efros.

Classification using intersection kernel SVMs is efficient Joint work with Subhransu Maji and Alex Berg Jitendra Malik UC Berkeley.

- Recovering Human Body Configurations: Combining Segmentation and Recognition (CVPR’04) Greg Mori, Xiaofeng Ren, Alexei A. Efros and Jitendra Malik -

CS4670 / 5670: Computer Vision Bag-of-words models Noah Snavely Object

Computer Vision Group University of California Berkeley Ecological Statistics of Good Continuation: Multi-scale Markov Models for Contours Xiaofeng Ren.

Ghunhui Gu, Joseph J. Lim, Pablo Arbeláez, Jitendra Malik University of California at Berkeley Berkeley, CA

Instructor: Mircea Nicolescu Lecture 13 CS 485 / 685 Computer Vision.

Fast intersection kernel SVMs for Realtime Object Detection

Model: Parts and Structure. History of Idea Fischler & Elschlager 1973 Yuille ‘91 Brunelli & Poggio ‘93 Lades, v.d. Malsburg et al. ‘93 Cootes, Lanitis,

Computer Vision Group University of California Berkeley Estimating Human Body Configurations using Shape Context Matching Greg Mori and Jitendra Malik.

Shape and Dynamics in Human Movement Analysis Ashok Veeraraghavan.

Computer Vision Group University of California Berkeley Shape Matching and Object Recognition using Shape Contexts Jitendra Malik U.C. Berkeley (joint.

The Visual Recognition Machine Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley.

Recognition using Regions CVPR Outline Introduction Overview of the Approach Experimental Results Conclusion.

Robust and large-scale alignment Image from

Computer Vision Group University of California Berkeley Recognizing objects and actions in images and video Jitendra Malik U.C. Berkeley.

A Study of Approaches for Object Recognition

CS335 Principles of Multimedia Systems Content Based Media Retrieval Hao Jiang Computer Science Department Boston College Dec. 4, 2007.

Abstract We present a model of curvilinear grouping using piecewise linear representations of contours and a conditional random field to capture continuity.

Recognizing Objects and Actions in Images Jitendra Malik U.C. Berkeley.

Front-end computations in human vision Jitendra Malik U.C. Berkeley References: DeValois & DeValois,Hubel, Palmer, Spillman &Werner, Wandell Jitendra Malik.

CVR05 University of California Berkeley 1 Familiar Configuration Enables Figure/Ground Assignment in Natural Scenes Xiaofeng Ren, Charless Fowlkes, Jitendra.

Berkeley Vision GroupNIPS Vancouver Learning to Detect Natural Image Boundaries Using Local Brightness,

A Database of Human Segmented Natural Images and Two Applications David Martin, Charless Fowlkes, Doron Tal, Jitendra Malik UC Berkeley

1 The Ecological Statistics of Grouping by Similarity Charless Fowlkes, David Martin, Jitendra Malik Computer Science Division University of California.

Visual Grouping and Recognition David Martin UC Berkeley David Martin UC Berkeley.

Texture Reading: Chapter 9 (skip 9.4) Key issue: How do we represent texture? Topics: –Texture segmentation –Texture-based matching –Texture synthesis.

Computational Vision Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley.

MSRI University of California Berkeley 1 Recovering Human Body Configurations using Pairwise Constraints between Parts Xiaofeng Ren, Alex Berg, Jitendra.

Computer Vision Group University of California Berkeley Matching Shapes Serge Belongie *, Jitendra Malik and Jan Puzicha U.C. Berkeley * Present address:

Computer Vision Group University of California Berkeley Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA Greg Mori and Jitendra Malik.

Perceptual Organization: Segmentation and Optical Flow.

A New Correspondence Algorithm Jitendra Malik Computer Science Division University of California, Berkeley Joint work with Serge Belongie, Jan Puzicha,

Cue Integration in Figure/Ground Labeling Xiaofeng Ren, Charless Fowlkes and Jitendra Malik, U.C. Berkeley We present a model of edge and region grouping.

Heather Dunlop : Advanced Perception January 25, 2006

Computational Vision Jitendra Malik, UC Berkeley.

Object Recognition by Parts Object recognition started with line segments. - Roberts recognized objects from line segments and junctions. - This led to.

PhD Thesis. Biometrics Science studying measurements and statistics of biological data Most relevant application: id. recognition 2.

Efficient Algorithms for Matching Pedro Felzenszwalb Trevor Darrell Yann LeCun Alex Berg.

Multimodal Interaction Dr. Mike Spann

2D Shape Matching (and Object Recognition)

1 Contours and Junctions in Natural Images Jitendra Malik University of California at Berkeley (with Jianbo Shi, Thomas Leung, Serge Belongie, Charless.

Handwritten digit recognition Jitendra Malik. Handwritten digit recognition (MNIST,USPS) LeCun’s Convolutional Neural Networks variations (0.8%, 0.6%

Shape Matching Tuesday, Nov 18 Kristen Grauman UT-Austin.

Visual Grouping and Recognition Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley.

Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley.

Classifying Images with Visual/Textual Cues By Steven Kappes and Yan Cao.

Recognizing Action at a Distance Alexei A. Efros, Alexander C. Berg, Greg Mori, Jitendra Malik Computer Science Division, UC Berkeley Presented by Pundik.

Vision-based human motion analysis: An overview Computer Vision and Image Understanding(2007)

Computer Vision Group University of California Berkeley On Visual Recognition Jitendra Malik UC Berkeley.

Handwritten digit recognition

A feature-based kernel for object classification P. Moreels - J-Y Bouguet Intel.

CSE 185 Introduction to Computer Vision Feature Matching.

Colour and Texture. Extract 3-D information Using Vision Extract 3-D information for performing certain tasks such as manipulation, navigation, and recognition.

776 Computer Vision Jan-Michael Frahm Spring 2012.

Computational Vision Jitendra Malik University of California, Berkeley.

Semantic Alignment Spring 2009 Ben-Gurion University of the Negev.

Finding Clusters within a Class to Improve Classification Accuracy Literature Survey Yong Jae Lee 3/6/08.

Line Fitting James Hayes.

Paper Presentation: Shape and Matching

Object detection as supervised classification

Common Classification Tasks

Shape matching and object recognition using shape contexts

Brief Review of Recognition + Context

Image Registration 박성진.

Grouping/Segmentation

CSE 185 Introduction to Computer Vision

Presentation transcript:

Computer Vision Group University of California Berkeley Visual Grouping and Object Recognition Jitendra Malik * U.C. Berkeley * with S. Belongie, C. Fowlkes, T. Leung, D. Martin, G. Mori, J. Puzicha, J.Shi, X. Ren

Computer Vision Group University of California Berkeley From images/video to objects Labeled sets: tiger, grass etc

Computer Vision Group University of California Berkeley

Computer Vision Group University of California Berkeley

Computer Vision Group University of California Berkeley Consistency A BC A,C are refinements of B A,C are mutual refinements A,B,C represent the same percept Attention accounts for differences Image BGL-birdR-bird grass bush head eye beak far body head eye beak body Perceptual organization forms a tree: Two segmentations are consistent when they can be explained by the same segmentation tree (i.e. they could be derived from a single perceptual organization).

Computer Vision Group University of California Berkeley Outline Finding boundaries Recognizing objects Recognizing actions

Computer Vision Group University of California Berkeley Finding boundaries: Is texture a problem or a solution? imageorientation energy

Computer Vision Group University of California Berkeley Statistically optimal contour detection Use humans to segment a large collection of natural images. Train a classifier for the contour/non-contour classification using orientation energy and texture gradient as features.

Computer Vision Group University of California Berkeley Orientation Energy Gaussian 2nd derivative and its Hilbert pair Can detect combination of bar and edge features [Perona & Malik 90]

Computer Vision Group University of California Berkeley Texture gradient = Chi square distance between texton histograms in half disks across edge i j k Chi-square

Computer Vision Group University of California Berkeley

Computer Vision Group University of California Berkeley

Computer Vision Group University of California Berkeley ROC curve for local boundary detection

Computer Vision Group University of California Berkeley Outline Finding boundaries Recognizing objects Recognizing actions

Computer Vision Group University of California Berkeley Biological Shape D’Arcy Thompson: On Growth and Form, 1917 –studied transformations between shapes of organisms

Computer Vision Group University of California Berkeley Deformable Templates: Related Work Fischler & Elschlager (1973) Grenander et al. (1991) von der Malsburg (1993)

Computer Vision Group University of California Berkeley Matching Framework Find correspondences between points on shape Fast pruning Estimate transformation & measure similarity modeltarget...

Computer Vision Group University of California Berkeley Comparing Pointsets

Computer Vision Group University of California Berkeley Shape Context Count the number of points inside each bin, e.g.: Count = 4 Count = FCompact representation of distribution of points relative to each point

Computer Vision Group University of California Berkeley Shape Context

Computer Vision Group University of California Berkeley Comparing Shape Contexts Compute matching costs using Chi Squared distance: Recover correspondences by solving linear assignment problem with costs C ij [Jonker & Volgenant 1987]

Computer Vision Group University of California Berkeley Matching Framework Find correspondences between points on shape Fast pruning Estimate transformation & measure similarity modeltarget...

Computer Vision Group University of California Berkeley Fast pruning Find best match for the shape context at only a few random points and add up cost

Computer Vision Group University of California Berkeley Matching Framework Find correspondences between points on shape Fast pruning Estimate transformation & measure similarity modeltarget...

Computer Vision Group University of California Berkeley 2D counterpart to cubic spline: Minimizes bending energy: Solve by inverting linear system Can be regularized when data is inexact Thin Plate Spline Model Duchon (1977), Meinguet (1979), Wahba (1991)

Computer Vision Group University of California Berkeley Matching Example modeltarget

Computer Vision Group University of California Berkeley Outlier Test Example

Computer Vision Group University of California Berkeley Object Recognition Experiments Handwritten digits COIL 3D objects (Nayar-Murase) Human body configurations Trademarks

Computer Vision Group University of California Berkeley Terms in Similarity Score Shape Context difference Local Image appearance difference –orientation –gray-level correlation in Gaussian window –… (many more possible) Bending energy

Computer Vision Group University of California Berkeley Handwritten Digit Recognition MNIST : –linear: 12.0% –40 PCA+ quad: 3.3% –1000 RBF +linear: 3.6% –K-NN: 5% –K-NN (deskewed) : 2.4% –K-NN (tangent dist.) : 1.1% –SVM: 1.1% –LeNet 5: 0.95% MNIST (distortions): –LeNet 5: 0.8% –SVM: 0.8% –Boosted LeNet 4: 0.7% MNIST : –K-NN, Shape Context matching: 0.63%

Computer Vision Group University of California Berkeley

Computer Vision Group University of California Berkeley COIL Object Database

Computer Vision Group University of California Berkeley Prototypes Selected for 2 Categories Details in Belongie, Malik & Puzicha (NIPS2000)

Computer Vision Group University of California Berkeley Error vs. Number of Views

Computer Vision Group University of California Berkeley Human body configurations

Computer Vision Group University of California Berkeley Deformable Matching Kinematic chain-based deformation model Use iterations of correspondence and deformation Keypoints on exemplars are deformed to locations on query image

Computer Vision Group University of California Berkeley Results

Computer Vision Group University of California Berkeley Trademark Similarity

Computer Vision Group University of California Berkeley Recognizing objects in scenes

Computer Vision Group University of California Berkeley Outline Finding boundaries Recognizing objects Recognizing actions

Computer Vision Group University of California Berkeley Examples of Actions Movement and posture change –run, walk, crawl, jump, hop, swim, skate, sit, stand, kneel, lie, dance (various), … Object manipulation –pick, carry, hold, lift, throw, catch, push, pull, write, type, touch, hit, press, stroke, shake, stir, turn, eat, drink, cut, stab, kick, point, drive, bike, insert, extract, juggle, play musical instrument (various)… Conversational gesture –point, … Sign Language

Computer Vision Group University of California Berkeley Key cues for action recognition “Morpho-kinesics” of action (shape and movement of the body) Identity of the object/s Activity context

Computer Vision Group University of California Berkeley Image/Video  Stick figure  Action Stick figures can be specified in a variety of ways or at various resolutions (deg of freedom) –2D joint positions –3D joint positions –Joint angles Complete representation Evidence that it is effectively computable

Computer Vision Group University of California Berkeley Tracking by Repeated Finding

Computer Vision Group University of California Berkeley Achievable goals in 3 years Reasonable competence at object recognition at crude category level (~1000) Detection/Tracking of humans as kinematic chains, assuming adequate resolution. Recognition of ~ actions and compositions thereof.