Časová segmentácia videa a sumarizácia videa

Slides:



Advertisements
Similar presentations
Ma.
Advertisements

Pseudo-Relevance Feedback For Multimedia Retrieval By Rong Yan, Alexander G. and Rong Jin Mwangi S. Kariuki
Presenter Date presented Movie Maker. By clicking on the “Tasks” button you will be able to view a variety of options for you to begin your project.
Click on each of us to hear our sounds.
Automatic Video Shot Detection from MPEG Bit Stream Jianping Fan Department of Computer Science University of North Carolina at Charlotte Charlotte, NC.
Human-Computer Interaction Human-Computer Interaction Segmentation Hanyang University Jong-Il Park.
A Novel Scheme for Video Similarity Detection Chu-Hong Hoi, Steven March 5, 2003.
ADVISE: Advanced Digital Video Information Segmentation Engine
RIAO video retrieval systems. The Físchlár-News-Stories System: Personalised Access to an Archive of TV News Alan F. Smeaton, Cathal Gurrin, Howon.
Multimedia Information Retrieval
Publikácia o hĺbkovej analýze údajov, teda o data miningu Mgr. Ing. Adriana Horníková, PhD Inovace 2010, Praha
Príznaky Znižovanie dimenzie: viac príznakov => viac informácie, vyššia presnosť viac príznakov => zložitejšia extrakcia viac príznakov => zložitejší tréning.
Fuzzy ES - Fuzzy množiny_ stručný náhľad Približne dva alebo aj trochu viac /matematizácia neurčitosti/ Fuzzy logic is a very powerful technique that enables.
Machine Learning on Images Janez Brank. Introduction  Collections of images (a.k.a. pictorial databases)  Image retrieval  Image classification –How.
MULTIMEDIA TECHNOLOGY SMM 3001 MEDIA - VIDEO. In this chapter How digital video differs from conventional analog video How digital video differs from.
Performance Characterization of Video-Shot-Change Detection Methods U. Gargi, R. Kasturi, S. Strayer Presented by: Isaac Gerg.
Moviemaker 2 Vince DiNoto
Character Identification in Feature-Length Films Using Global Face-Name Matching IEEE TRANSACTIONS ON MULTIMEDIA, VOL. 11, NO. 7, NOVEMBER 2009 Yi-Fan.
Object Query Language (OQL) Marián Kamenišťák MFF – UK Praha
Film Techniques Year 10. Parallel Action Two or more actions that are linked by the film to appear simultaneous. Two or more actions that are linked by.
Film Techniques Year 10.
Image and Video Retrieval INST 734 Doug Oard Module 13.
Pascal Kelm Technische Universität Berlin Communication Systems Group Thursday, 2 April 2009 Video Key Frame Extraction for image-based Applications.
Atomic Force Microscopy
Date of download: 7/8/2016 Copyright © 2016 SPIE. All rights reserved. Consecutive frames from “news” video sequences showing (a) a fade-out; (b) a fade-in;
Lesson 2 – Video & Audio Editing
VOCABULARY POWERPOINT – EDITING TECHNIQUES & CONCEPTS
Visual Information Retrieval
Find a computer Log on Open word and type your name in 48 pt font.
Automatic Video Shot Detection from MPEG Bit Stream
Data Compression.
Analyzing dichotomous dummy variables
Presenter: Ibrahim A. Zedan
Video Titles The Titler is a versatile tool enabling you to create not just titles and credits, but animated graphics and text as well. Titles may.
Movie Maker Presenter Date presented.
Editing and Camera Terms
Dátové štruktúry pre analýzu obrazu
Sme produkty, musíme sa predať
Prehľadávanie (searching) UI. I Markošová Mária
Študijné materiály pre eLearning
An Introduction into Film Aesthetics
Saliency, Scale and Image Description (by T. Kadir and M
Interpretácia obrazových údajov DPZ
Typy informácií a ich prezentácia a spracovanie
KVANTITATÍVNE METÓDY V MARKETINGU
Integritné obmedzenia v SQL
Vlastnosti kvantitatívnych dát
Editing Styles The pattern use of transitions, matches, or duration can id a cinematic style.
Metódy kĺzavých priemerov (MA – moving averages) - Marcel Kocifaj
ROC - Receiver Operating Characteristic
DC Image Extraction and Shot Segmentation
Heuristické optimalizačné procesy
Video Titles The Titler is a versatile tool enabling you to create not just titles and credits, but animated graphics and text as well. Titles may be placed.
Saliency detection Donghun Yeo CV Lab..
Základy počítačovej grafiky a spracovania obrazu
Open Access v H2020 Barbora Kubíková Národný kontaktný bod
Patrik Ort Acount Executive , Stredná Európa
ROVINNÉ (2D) SYMBOLY DWG
Adding 2-Digit Numbers Name: ___________________________
Multimedia Course UART/AEMMI
Ying Dai Faculty of software and information science,
Editing A way change to a clip to make it better or more appealing to an audience.
Ying Dai Faculty of software and information science,
Ying Dai Faculty of software and information science,
Shot transitions Cuts, Fades, & Wipes.
Ying Dai Faculty of software and information science,
Digital Technology Skills Development.
REU: Week 7 TRECVID Sean McMillan.
Iterative Projection and Matching: Finding Structure-preserving Representatives and Its Application to Computer Vision.
Presentation transcript:

Časová segmentácia videa a sumarizácia videa

Hierarchická štruktúra videa Video scéna snímaná kamerami A, B Video sekvencia z kamery A Video sekvencia z kamery B Jednotlivé zábery oddelené strihom

Video záber (shot) Video záber je definovaný ako sekvencia snímok zachytených jednou kamerou v jednej súvislej akcii v čase a priestore [CB98] Obvykle je to skupina snímok, ktoré majú konzistentné vizuálne charakteristiky (farba, textúra, pohyb) Video zábery sú základné štrukturálne stavebne bloky Časová segmentácia videa je dôležitý krok vo veľa aplikáciách spracovania videa (trackovanie – treba znovu inicializovať tracker) [CB98] X.U. Cabedo and S. K. Bhattacharje. Shot detection tools in digital video. In Proceedings of Non-linear Model Based Image Analysis 1998, Springer Verlag, Glasgow, pp. 121-126, July 1998

Typy postupných prechodov Základné 4 kategórie sú: Stmievačka (fade-out) Roztmievačka (fade-in) Prelínačka (dissolve)

Typy postupných prechodov Stieranie (Wipe) je množina techník ako prekrývanie, vysunutie(push), presunutie(slide), a iné (napr. stretch, door, flip, drop, grill, page turn, dither, mosaic, iris) Množstvo špeciálnych efektov používaných vo filme, ktoré využívajú napríklad morfing Veľmi ťažko detekovateľné

Metódy časového spracovania videa Jednoduché algoritmy používajú väčšinou mieru podobnosti a prahovacie metódy, rôzne typy histogramov – nedosahujú dobré výsledky najmä pri postupných prechodoch Zložitejšie algoritmy používajú napríklad HMM, kompenzáciu vektorov pohybu, neurónové siete, klasifikačné metódy – časovo veľmi náročné Ďalšie urýchlenie algoritmov sa často dosahuje hierarchizáciou dát, sofistikovaným štatistickým spracovaním a ad hoc metódami

Mosaic based approach is used to generate a panoramic image from a large number of consecutive frames having some important content. http://play.tojsiab.com/NTlSSmVMbERBeFEz

Key Frame Based Video Summarization a set consists of a collection of salient images extracted from the underlying video source take care 1.Redundancy: frames with minor difference are selected as key frame. 2.When there are various changes in content it is difficult to make clustering. Video Skim Based Video Summarization The original video is segmented into various parts which is a video clip with shorter duration. Each segment is joined by either a cut or a gradual effect. The trailer of movie is the best example for video skimming.

Detekcia strihov a stmievačiek pomocou informačnej teórie Vzájomná informácia (MI) meria množstvo informácie o náhodnej premennej Y, ktoré prenáša náhodná premenná X Združená entropia (JE) dvoch náhodných premenných X a Y The entropy measures the information content or “un-certainty” of X and it is given by:…. Where p(x) is a p.d.f Joint entropy is express as …… , where p(x,y) is joint probability or co-occurrence matrix

Detekcia strihov Pre každý pár po sebe nasledujúcich snímok vypočítame vzájomnú informáciu pre všetky tri komponenty R, G, B a po ich spriemerovaní dostaneme nasledujúci graf Na detekciu strihov použijeme adaptívne lokálne prahovanie cuts

Detekcia stmievačiek/roztmievačiek Analogicky vypočítaním združenej entropie pre každý farebný komponent R, G, B dostaneme po ich spriemerovaní graf Stmievačky/roztmievačky zodpovedajú monotónnym častiam grafu v okolí nulových hodnôt združenej entropie

Vyhodnotenie výsledkov GT: skutočný počet strihov a prechodov (ground truth) Seg: vysegmentované (správne aj nesprávne) strihy pomocou našej metódy Hodnoty určené nasledujúcimi vzťahmi charakterizujú kvalitu dosiahnutých výsledkov Hodnoty týchto mier sú z intervalu [0, 1], pričom optimálna hodnota je 1 Minimálne hodnoty mier dosahované na testovaných videách (TRECVID 2003) sú v prípade strihov 0.96 (recall), 0.94 (precision) v prípade stmievačiek 0.92 (recall), 0.84 (precision) a 0.75 (overlap) a roztmievačiek 0.93 (recall), 0.84 (precision) a 0.74 (overlap)

Metóda využívajúca singulárny rozklad matice (SVD) a štatistické testy Použitím SVD sú šum a triviálne variácie ignorované SVD transformuje podobné snímky blízko k sebe Ku každej snímke fi vytvoríme 3D normalizovaný histogram hi (každý rozmer reprezentuje jednu zložku R, G, B zo 16 triedami); rozmer vektora príznakov je teda M = 163 = 4096 Každý stĺpec ai matice A je M-rozmerný vektor príznakov f1 f2 f3 f4 snímky A a1 a2 ai . . .

Aplikovanie SVD na maticu histogramov A Z možných M singulárnych hodnôt berieme do úvahy iba K najväčších (K << M) Uvažovaná časť reprezentácie histogramu snímky ai po aplikácii SVD je vo vektore Príklady premietnutých vektorov

Spájanie zhlukov na základe štatistických hypotéz Predpoklad: príznakové vektory zodpovedajúce snímkam v jednom zábere tvoria jeden zhluk Ako mieru podobnosti snímok fi a fj sme zvolili kde a sú aproximácie týchto snímok pomocou SVD Rozdelenie do zhlukov na základe predchádzajúcej miery s preddefinovaným prahom δ Testujeme, či sa dva zhluky dajú spojiť - používame K- rozmerné von Mises-Fisher rozdelenie s priemerným smerom μ a koncentračným parametrom κ

Výsledky Nosná časť algoritmu má asymptotickú zložitosť O(NM2)

Spojenie metód využívajúcich vzájomnú informáciu a SVD Pre každú snímku fi 11-rozmerný vektor príznakov - 10 rozmerný vektor získaný z SVD Ii - vzájomná informácia medzi fi a fi+1 Aplikovaná zhlukovacia metóda ako pri SVD metóde

Detekcia prechodov medzi zábermi pomocou segmentácie grafu Počítame MI medzi viacerými dvojicami snímok v časovom úseku zvolenej pevnej dĺžky Kumulatívna miera pre každý časový úsek je daná vzťahom Lokálne minimá kumulatívnej miery určujú prechody medzi zábermi

Príklad kumulatívnej miery

Výber kľúčových snímok Zhlukovanie na základe hodnôt štandardnej odchýlky vzájomnej informácie v zábere Výber potenciálnych kľúčových snímok – na základe maximalizácie vzájomnej informácie v zhluku Test podobnosti potenciálnych kľúčových snímok