1 Occlusions – the world is flat without them! 16-721: Learning-Based Methods in Vision A. Efros, CMU, Spring 2009.

Slides:

Advertisements

Similar presentations

Shape Matching and Object Recognition using Low Distortion Correspondence Alexander C. Berg, Tamara L. Berg, Jitendra Malik U.C. Berkeley.

Advertisements

Discontinuity Preserving Stereo with Small Baseline Multi-Flash Illumination Rogerio Feris 1, Ramesh Raskar 2, Longbin Chen 1, Karhan Tan 3 and Matthew.

Indoor Segmentation and Support Inference from RGBD Images Nathan Silberman, Derek Hoiem, Pushmeet Kohli, Rob Fergus.

Automatic Photo Pop-up Derek Hoiem Alexei A.Efros Martial Hebert Carnegie Mellon University.

Agenda Introduction Bag-of-words models Visual words with spatial location Part-based models Discriminative methods Segmentation and recognition Recognition-based.

Recovering Human Body Configurations: Combining Segmentation and Recognition Greg Mori, Xiaofeng Ren, and Jitentendra Malik (UC Berkeley) Alexei A. Efros.

Neurodynamics of figure-ground organization Dražen Domijan University of Rijeka, Rijeka, Croatia 8th Alps-Adria Psychology Conference.

- Recovering Human Body Configurations: Combining Segmentation and Recognition (CVPR’04) Greg Mori, Xiaofeng Ren, Alexei A. Efros and Jitendra Malik -

Learning to estimate human pose with data driven belief propagation Gang Hua, Ming-Hsuan Yang, Ying Wu CVPR 05.

Unfolding an Indoor Origami World David Fouhey, Abhinav Gupta, Martial Hebert 1.

Qualifying Exam: Contour Grouping Vida Movahedi Supervisor: James Elder Supervisory Committee: Minas Spetsakis, Jeff Edmonds York University Summer 2009.

Boundary Extraction in Natural Images Using Ultrametric Contour Maps Pablo Arbeláez Université Paris Dauphine Presented by Derek Hoiem.

Computer Vision Group University of California Berkeley Ecological Statistics of Good Continuation: Multi-scale Markov Models for Contours Xiaofeng Ren.

1 Contours and Junctions in Natural Images Jitendra Malik University of California at Berkeley (with Jianbo Shi, Thomas Leung, Serge Belongie, Charless.

Ghunhui Gu, Joseph J. Lim, Pablo Arbeláez, Jitendra Malik University of California at Berkeley Berkeley, CA

Biased Normalized Cuts 1 Subhransu Maji and Jithndra Malik University of California, Berkeley IEEE Conference on Computer Vision and Pattern Recognition.

MESA LAB Depth ordering Guimei Zhang MESA LAB MESA (Mechatronics, Embedded Systems and Automation) LAB School of Engineering, University of California,

Computer Vision Group University of California Berkeley 1 Learning Scale-Invariant Contour Completion Xiaofeng Ren, Charless Fowlkes and Jitendra Malik.

Robust Higher Order Potentials For Enforcing Label Consistency

Learning to Detect Natural Image Boundaries Using Local Brightness, Color, and Texture Cues David R. Martin Charless C. Fowlkes Jitendra Malik.

Abstract We present a model of curvilinear grouping using piecewise linear representations of contours and a conditional random field to capture continuity.

Measuring the Ecological Statistics of Figure-Ground Charless Fowlkes, David Martin, Jitendra Malik.

1 Learning to Detect Natural Image Boundaries David Martin, Charless Fowlkes, Jitendra Malik Computer Science Division University of California at Berkeley.

CVR05 University of California Berkeley 1 Familiar Configuration Enables Figure/Ground Assignment in Natural Scenes Xiaofeng Ren, Charless Fowlkes, Jitendra.

Berkeley Vision GroupNIPS Vancouver Learning to Detect Natural Image Boundaries Using Local Brightness,

CVR05 University of California Berkeley 1 Cue Integration in Figure/Ground Labeling Xiaofeng Ren, Charless Fowlkes, Jitendra Malik.

Measuring the Ecological Statistics of Figure-Ground Charless Fowlkes, David Martin, Jitendra Malik.

1 The Ecological Statistics of Grouping by Similarity Charless Fowlkes, David Martin, Jitendra Malik Computer Science Division University of California.

Computational Theories & Low-level Pixels To Percepts A. Efros, CMU, Spring 2009.

Computer Vision Group University of California Berkeley 1 Scale-Invariant Random Fields for Mid-level Vision Xiaofeng Ren, Charless Fowlkes and Jitendra.

Probabilistic Models for Parsing Images Xiaofeng Ren University of California, Berkeley.

Computational Vision Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley.

MSRI University of California Berkeley 1 Recovering Human Body Configurations using Pairwise Constraints between Parts Xiaofeng Ren, Alex Berg, Jitendra.

On Measuring * the Ecological Validity of Local Figure-Ground Cues Charless Fowlkes, David Martin, Jitendra Malik Computer Science Division University.

© 2006 by Davi GeigerComputer Vision April 2006 L1.1 Binocular Stereo Left Image Right Image.

1 How do ideas from perceptual organization relate to natural scenes?

Automatic Photo Popup Derek Hoiem Alexei A. Efros Martial Hebert Carnegie Mellon University.

The Terrapins Computer Vision Laboratory University of Maryland.

1 Ecological Statistics and Perceptual Organization Charless Fowlkes work with David Martin and Jitendra Malik at University of California at Berkeley.

Computer Vision Group University of California Berkeley 1 Cue Integration in Figure/Ground Labeling Xiaofeng Ren, Charless Fowlkes and Jitendra Malik.

Cue Integration in Figure/Ground Labeling Xiaofeng Ren, Charless Fowlkes and Jitendra Malik, U.C. Berkeley We present a model of edge and region grouping.

3D Scene Models Object recognition and scene understanding Krista Ehinger.

Computer Vision Spring ,-685 Instructor: S. Narasimhan Wean 5403 T-R 3:00pm – 4:20pm Lecture #18.

Graph-based Segmentation

The Three R’s of Vision Jitendra Malik.

A Bayesian Approach For 3D Reconstruction From a Single Image

MRFs and Segmentation with Graph Cuts Computer Vision CS 543 / ECE 549 University of Illinois Derek Hoiem 02/24/10.

Segmentation: MRFs and Graph Cuts Computer Vision CS 143, Brown James Hays 10/07/11 Many slides from Kristin Grauman and Derek Hoiem.

1 Contours and Junctions in Natural Images Jitendra Malik University of California at Berkeley (with Jianbo Shi, Thomas Leung, Serge Belongie, Charless.

Recovering Surface Layout from a Single Image D. Hoiem, A.A. Efros, M. Hebert Robotics Institute, CMU Presenter: Derek Hoiem CS 598, Spring 2009 Jan 29,

Visual Grouping and Recognition Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley.

3D Shape Inference Computer Vision No.2-1. Pinhole Camera Model the camera center Principal axis the image plane.

Category Independent Region Proposals Ian Endres and Derek Hoiem University of Illinois at Urbana-Champaign.

Fundamentals of Sensation and Perception RECOGNIZING VISUAL OBJECTS ERIK CHEVRIER NOVEMBER 23, 2015.

Markov Random Fields & Conditional Random Fields

1Ellen L. Walker 3D Vision Why? The world is 3D Not all useful information is readily available in 2D Why so hard? “Inverse problem”: one image = many.

Object Recognition by Integrating Multiple Image Segmentations Caroline Pantofaru, Cordelia Schmid, Martial Hebert ECCV 2008 E.

Coherent Scene Understanding with 3D Geometric Reasoning Jiyan Pan 12/3/2012.

Computational Vision Jitendra Malik University of California, Berkeley.

Representation in Vision Derek Hoiem CS 598, Spring 2009 Jan 22, 2009.

9/30/ Cognitive Robotics1 Gestalt Perception Cognitive Robotics David S. Touretzky & Ethan Tira-Thompson Carnegie Mellon Spring 2006.

Instructor: S. Narasimhan

Gestalt Perception Cognitive Robotics David S. Touretzky &

Figure Legend: From: Visual detection of symmetry of 3D shapes

Perceiving and Recognizing Objects

Contours and Junctions in Natural Images

Learning to Combine Bottom-Up and Top-Down Segmentation

Analysis of Contour Motions

3D Shape Inference Computer Vision No.2-1.

Occlusion and smoothness probabilities in 3D cluttered scenes

Presentation transcript:

1 Occlusions – the world is flat without them! : Learning-Based Methods in Vision A. Efros, CMU, Spring 2009

2 Our Main Challenge Recovering 3D geometry from single 2D projection Infinite number of possible solutions! Need to know which boundaries are depth discontinuities i.e. occlusions …

Contour ownership  A contour belongs to one of the two (but not both) abutting regions. Figure (face) Ground (shapeless) Figure (Goblet) Ground (Shapeless) Important for the perception of shape

© Stephen E. Palmer, 2002 Properties of figures vs. grounds FigureGround Thing-likeNot thing-like CloserFarther ShapedExtends behind Figure-Ground Organization

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Surroundedness Figure-Ground Organization Surrounded region --> Figure Surrounding region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Size Figure-Ground Organization Smaller region --> Figure Larger region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Orientation Figure-Ground Organization Horizontal/vertical region --> Figure Oblique region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Contrast Figure-Ground Organization Higher contrast region --> Figure Lower contrast region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Symmetry Figure-Ground Organization Symmetrical region --> Figure Asymmetrical region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Convexity Figure-Ground Organization More convex region --> Figure Less convex region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Parallelism Figure-Ground Organization More parallel region --> Figure Less parallel region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Lower region Figure-Ground Organization Lower region --> Figure Upper region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Meaningfulness Figure-Ground Organization More meaningful region --> Figure Less meaningful region --> Ground

© Stephen E. Palmer, 2002 Relation to Depth Factors Figure-Ground Organization Figure-ground organization as edge assignment: To which side does the edge belong? Depth cues can also be figure-ground factors and Figure-ground factors can be depth cues. To the closer side. This fact connects figure-ground organization with depth perception.

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Occlusion Figure-Ground Organization Occluding region --> Figure Occluded region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Cast Shadows Figure-Ground Organization Shadowing region --> Figure Shadowed region --> Ground

© Stephen E. Palmer, 2002 Principles of figure-ground organization: Shading Figure-Ground Organization Shaded region --> Figure Nonshaded region --> Ground

Line Labeling > : contour direction + : convex edge - : concave edge possible junctions (constraints) Constraint Propagation [Clowes 1971, Huffman 1971; Waltz 1972; Malik 1986]

19

Junctions in Real Images

Are Junctions local evidence? J McDermott, 2004

Figure/Ground in Natural Images

Xiaofeng Ren, Charless Fowlkes and Jitendra Malik University of California, Berkeley ECCV 2006 GrazComputer Vision Group Figure/Ground Assignment in Natural Images

Figure/Ground: Groundtruth F G

Figure/Ground Dataset [Martin, Fowlkes & Malik; ECVP 2003]

 Local Cues  Gestalt Principles of Figure/Ground  Global Cues  Label Consistency at T-junctions Cues for Figure/Ground [Kienker, Sejnowski, Hinton & Schumacher 1986] [Heitger & von der Heydt 1993] [Geiger, Kumaran & Parida 1996] [Saund 1999] [Yu, Lee and Kanade 2001] …

Shapemes: Prototypical Local Shapes …… local shapes collect cluster Use Geometric Blur [Berg & Malik 2001]

parallelism convexity straight line corner line ending

Gestalt Principles for Figure/Ground  Convexity  Parallelism  Surroundedness  Symmetry  Lower Region  Common Fate …… F G F G G

Shapemes for F/G Discrimination LR L:93.8% L:49.8% L:89.6% L:11.7% L:66.5% L: 5.0% Which side is Figure? Train a logistic classifier to linearly combine the shapeme cues

Global Consistency F G F F G G common F G F G G F uncommon

Building a CRF Model  What are the features?  edge features:  Shapemes  junction features:  Junction type  How to make inference?  Loopy Belief Propagation  How to learn the parameters?  Gradient Descent on Max. Likelihood  What are the features?  edge features:  Shapemes  junction features:  Junction type  How to make inference?  Loopy Belief Propagation  How to learn the parameters?  Gradient Descent on Max. Likelihood X={X 1,X 2,…,X m } Estimate P(X i |  )

Junction Features One feature for each junction type F G F G { (G,F),(F,G) } F G F G G F { (F,G),(F,G),(F,G) } Junction potentials: { (F,G),(G,F),(F,G) } F G F F G G

Continuity in Figure/Ground If a pair of edges belong to the same foreground, they should have a smooth connection. F G F F G G G F F F G G  

Learning Junction Weights F G F G  = F G G F  = F G F F G G  = F G F G G F  =

Experiments  Using human-marked segmentations  Using edges computed by an edge detector

Results Human-marked Segmentation Edges computed with an edge detector Chance Baseline Size/Convexity Local Shapemes Averaging shapemes on boundaries Shapemes + CRF Dataset Consistency 50% 88%

Baseline: Size/Convexity A B Size(A) < Size(B): A is figure; B is ground Size(A) > Size(B): B is figure; A is ground

Results Human-marked Segmentation Edges computed with an edge detector Chance Baseline Size/Convexity Local Shapemes Averaging shapemes on boundaries Shapemes + CRF Dataset Consistency 50% 88% 55.6% 64.8% 72.0% 78.3% % 66.5% 68.9%

Image GroundtruthLocalGlobal Using human segmentations

Image Edge MapLocalGlobal Using edge maps computed from an edge detector

43 Recovering Occlusion Boundaries from a Single Image Derek Hoiem* Andrew Stein Alexei Efros Martial Hebert Carnegie Mellon University Robotics Institute * Now at University of Illinois

44 Recover Major Occlusions

45 Prior Work: Finding Boundaries NCuts Segmentation NCuts: [Cour et al. 2004] Input ImagePb Boundaries Pb: [Martin et al. 2002]

46 Segmentation into Physical Boundaries

47 Recover Major Occlusions Occlusion Boundaries Inferred Depth

48 Start with Oversegmentation Initial Segmentation Occlusion boundary? R1R1 R2R2

49 2D Cues for Occlusions Region: Color and TextureBoundaries: Strength and Continuity

50 2D Junctions Image 2D Boundary T-Junction 1 2 3

51 3D Surface Clues for Occlusions Support Planar PorousSky Surface Labels Geometric T-Junction Solid

52 3D Depth Cues for Occlusion Surfaces Initial Boundaries Depth Underestimate Depth Overestimate

53 Illustration of Depth Range SKY SUPPORT Image Depth (Max) Depth (Min)

54 Gradual Occlusion Inference Initial SegmentationFinal Boundaries ? Initial Depth (Min) Initial Depth (Max)

55 Gradual Occlusion Inference P(occlusion) Soft Boundary MapStage 1 Result

56 Gradual Occlusion Inference P(occlusion) Soft Boundary MapStage 1 Result

57 Gradual Occlusion Inference P(occlusion) + CRF(continuity, closure) Soft-Max Boundary MapStage 2 Result

58 Gradual Occlusion Inference Stage 3 Result P(occlusion) + CRF(continuity, closure, surfaces) Soft-Max Boundary Map

59 Final Estimate Boundaries, Foreground/Background, Contact Depth (Max) Depth (Min)

60 Evaluation … Training: 50 images Testing: 250 images (50 quantitative)

61 Occlusion vs. Non-Occlusion

62 Foreground/Background Accuracy Edge/Region Cues+ 3D CuesWith CRF Stage 158.7%71.7% Stage 265.4%75.6%77.3% Stage 368.2%77.1%79.9% Ours Shapemes + CRF Pb Boundaries68.9% Human Boundaries78.3% Ren et al. 2006, Corel Images

63 Occlusion Result Boundaries, Foreground/Background, Contact Depth (Max) Depth (Min)

64 Occlusion Result Boundaries, Foreground/Background, Contact Depth (Max) Depth (Min)

65 3D Model with Occlusions 3D Model without Occlusion Reasoning 3D Model with Occlusion Reasoning