jakou zavolat dobrý den
takže pouze černá se mi tě beran
a
já jsem se zeptat kolik neděli si
ale vidím že
se dá odhadnout že se jimi jsou pouze studenti zpytovat server a
to jsou přednášku jsem připravil tak
aby to byl spíš takový průlez tomuhle toho co se dneska
počítačové vidění dělá a na začátku bych
pravá strana motivoval tím že ukážu kde se dneska
ty ho technologie používají kde můžete ve dnešním světě vidět
potom bych karavaně přišel
takového pohledu to letnou postupů jak se s obrazovými halo noviny daty vůbec pracuje
a na konci
víra ve velmi krátké zamyšlení
co asi dál nás může čekat tédle oblasti
takže
když se chceme zeptat co a jak dnes počítače lidi co že náš se přednášky
tak jsem o tom přemýšlel jak to pochopit tak jsem si uvědomil že spíše důležité
setkat
co vlastně chceme aby počítače viděli že se my dobře víme
no většina z vás bych řek že ví že počítače rádi dělají to co my
chceme zatím dělají to co mě naučíme to co mu jak mi je naprogramujeme
takže co umí vidět záleží též na to co my už umíme je naučit
jaké algoritmy počítačového vidění umělé inteligence ostrově učení
vlastně dokážeme použít na obraz
nebo na zpracování obrazu a
přidání případně jaké semantic nějaké znalosti
takže to na nás spočítat že ví
a
iteracema přemýšlet že chceme naučit aby mu to viděli
tak nás to asi povede k otázce proč a třeba vlastně to cítím chceme
tom životě zlepšit proč
je potřebujem aby vlastně viděli
takže tím bych se začal
takový krátký přehled
proč to chcem které se to nezdá použít a
zlíně z nějaké míry už používá
jako první jsem vybral automobilový průmysl
to je takový přehledový obrázek všechny obrázky jsou převzaté neříkal jsem odkud řekla že je
hodnota to bych se zbláznil vidíte že to mám jenom obrázky
takže se omlouvám že jsem vykradl internet
tak vidíme auto které osazeno mnoha senzory
když se říká že počítače co vidí jako tak vás to může mást tom že
si řeknem a tak to je kamera
kamera není jediný senzor který se používá pro to aby
počítač nebo stojí vlastně co vnímal nějakým způsobem měřila interpretoval ten svět kolem
kamery jsou jenom
část ačkoli dneska v ní promluvit asi nejvíc
tak
bohužel tak malinko vysvětlím proč
jsou ještě pořád málo používané v těch
aplikacích protože
pak to no tak se nebudu
předně
takže třeba v automobilech pro mě tam r jsou především jiné senzory
měřáky vzdálenosti
rychlostí
past je to
tyto
senzory copak jakým způsobem ty data jsou zpracovaný to vám ukážu
a vyloženě se aplikaci spíš asi jste nižší to totiž to auto dneska
ještě pořád neděláš nic samo
i když někteří z vás asi znají mluvil colour které se tím pyšný že samo
jezdí
je to vínko
prosím
říkali že to má měření
děkuji
nemusíte si dělat brýle není to stavil je to furt to stejný není toho to
je obraz
dat
pár otázek parkovací systémy
některé automobilky slibuji že přijedete přeparkovat před parkovací no a vystoupit os auta vono už
to samo jsi že audi to ukazuje samo to najde místo zaparkuje to parkovacím domě
to je trošku budou z vás dneska se můžeme potkat s něčím co samo pomocí
měření vzdálenosti ostatní objektu dokáže naplánovat
to vozidlo řízení
a zaparkovat samo
můžeme se dneska push častěji setkat s autem vybaveným které pomocí kamer a nějaký radarová
sonaru
lidé ano
měří objekty před
před vozidlem takže snaží se
predikovat vývoj té situace s toho co vidí na nějaké predikce pohybu
klasifikuje jestli je to cyklista šest je to automobil nebo
člověk chodec
dokáže zastavit přibrzdit
zase dobře asistence nemůžeme autu dneska nechat udělat všechno sama samotný ještě ne důvěřovat nedůvěře
ne tomuto
do nočního vidění domu do nočního provozu
vizualizace
nebo měření
char
silničních
tak tyto systémy vám dokáží brně co volantem nebo vás udržovat pruhu když usnete lžete
blížit pruhu takové se snaží udržet pro budit případ
detekovat nebo zobrazovat na nějakém zobrazovacím zařízení
v živé objekty yumu objekty které
nějaká termokamera nebo na ty kamery s příslibem dokáže detekovat takže chodce zvířata a podobně
takže s tím se můžeme setkat v autech
další hromada aplikaci je
dohledových systémech takzvané sem byl jsem o monitorovací systémy
dneska uškodí u nás na západě u že ta dohoda šířené že máte kamery fakt
všude chtěl veřejných prostorách metrů náměstí rodině tam teďka nevím to číslo bych dal je
to skoro číslo kterýmu se nechce věřit
dneska už nemáme problém s tímto snímat přenášet
máme problém s tím to sledovat
obyčejný metrů vy budete mít kterýma time tři peróny a štyři vstupy do metra tam
může být čtyrycet kamer
tak
by tam mělo být asi čtyřicet lidí kteří to se volá hlídají tohle je
takže se to různě seskupuje
i tak ten člověk nemá šanci ten
operátor
v reálném čase sledovat čtyrycet záznamů možnými výrazy víc
takže zde potřebujeme zase nějaké systémy které sedí na tom video streamů
a nějakým způsobem
se snaží porozumět vidět co se vtom mě děje
neumí tomu porozumět
zcela
takže spíš je to dneska dělá že jsou konkrétní jakoby řešení na konkrétní problémy tady
vidíme zavřenej detekce os o jejich sledování představu že třeba využít k tomu že když
žena na teda nějaká osoba tak se dá potom dohledat jiný záznam je samej pocit
asi prošla
hodně důležitý je detekce odložený zavazadel zejména v těch velkých městech kde hrozí třeba teroristický
útok
takže sou algoritmy na detekci podložený zavazadel tady vidět
to zavazadlo
co se ještě na používá velice těchto systémech je například
analýza a jak výstavu té scéně konfiguraci těch lidí je tam jsou systémy dokáží detekovat
nějaký problém chtěl prostorách tím že se třeba zjistí že dá se zvýšil svou polohy
nebo že se že se stala nějaká
situaci kdy
se lidi půjdou mě běžným způsobem že systém u ní je na účet tak jak
se tam asi lidi pohybujou a najednou začnou dívat jinak pak zase to nějaký alarm
proto operátora aby se tam podíval aby zjistil co se tam děje
nebo se to používá na detekce detekci kdy vypadnou nějaký ty mašiny na vydávání lístku
nebo na to ten průchod learning machine s
voni potřebujou vědět že se něco pokazilo a zjistíte takže najednou se vzniká fronta najednou
vzniká nějaký hluk lidí
takže zase událost která je nezvykla a
systém dokáže tom útoku operátorovi pomoct
na to upozornit
jenom jednou zážitek nich aplikaci které se sejdem dělají jsou sumarizace
vzorový systému máte sami vidíte ze čtyřiceti common kvanta dat hodiny potřebujete tak rychle projet
prohlídnout něco dohledat
může se to sumarizovat čase že vtom jdou to bych ti ráda nechat znamená mi
něco co se děje
ovšem kohy třeba z letiště pátek na otázka neboj tady ty události už byla zima
se každou minutu někdo projde takže taková sumarizace v čase která se používá na jiné
mluví o tom netřeba nejde tak se dělá takzvaná synapse jel synapse
znamená že se analyzují je nejenom že se něco stalo ale ještě kde se to
vtom obraze stalo
a bodem že u sebe se sumarizovat takto nese suma nedělám na v čase
ale prostoru takže my dokážeme do jednoho obrázku
potom nebo pusu videa vložit objekty z různých času vtom no
takže mi ve velice krátkém čase můžeme vidět že tam vůbec někdy dneska někdo byl
a kolik takže víme že na tomhle obrázku vyveze způsobem jako
statistické informace z nějakého vy obrovskou časovou doby nevinné vteřiny máte představu
že tam vůbec někdo byl ad absurdum že to dohledat detaily do školy to bylo
tam nahoře je právě takhle to letiště zaplněny
dole výstup z videa který sumarizuje dělaj dělat uši na při
tam občas projede nějaký letadlo přes pro nějaký auto ale když to pak chceme vidět
rychle
nebo ne rychle
krátkém čase může se použít o to takže ty další aplikace
si napřed
medicínské aplikace
další hromada
no nulu
které používají medici lékaři
kde počítačové kdy poma
nacházet oblasti
v měkkých tkáních
které sou nějakým způsobem rizikové
mikroskopem buňka se to použít používá počítačové vidí pro sleduješ a nějaký pohyb něco se
něco se chce zjistit tak to umí trekovací sledovat ty buňky
tady jsem ukázal modelování
používá se docela probral prvou tak nevím správně se říká no když po nehodě je
nějaká to malej pro problém třeba rozbitá hlava oni potřebujou
vyrobit nějakou náhradní kost nebo něco
takže zas ty systémy
počet show vidění a rekonstrukce dokážou třeba ste půjdou brečet vracela ze koučovat tu druhou
přesně to sesadit do toho místa kde to chyby výsledek je potom opravdu třídy objektově
který tisknutelný takže neshladili zaživa že velice rychle a naprosto přesně vím vytvořit úzkostí která
někde chyby takže to je taky
dost úžasný co neska vtom neseděla
průmyslu sledování kontrola kvality
vybral jsem pár drobnosti sledování flašek sledování skla řešena pořádku
nemůže tam stát člověka poprvé dívat se na flash tímto to by vydržel dvě minuty
že jo
co sem viděl jsou zajímavé věci třeba brambůrky malý strašně rychle pás čip sama tam
jsou nějaké trysky který prudce fouká jdu
před tím že zase sobě kamera pořádková kamera která sleduje něco takovýho jako děti při
a dva dny okno dokáže detekovat
a hned to tam ty trysky milovat soukromý špatný takže o strašně rychlá filtrace špatný
brambůrek nemusíme na tom it lidi tím pádem sou ty brambůrky neska tak levný
stejnak papír to je další ve stehně osobně hrozně zaujala jsem nikdy neviděl jak v
obrovských
jak vypadá vlasy továrna na papír ve finsku to je sto metro váhala vobrovská je
to jeden veliký stroj kam a balíkem papír na přes všechno možný se teda vypisuje
varování brousí všechno je to strašně rychlí to malý
neruda že prostě ty procesy my jsme z nechápu a dostat ta žena ti musí
být zase nějaký systém který sleduje kvalita papíru křoví se na to velice pečlivý ten
papír nesmí mít nikdy žádnou
řekněme víc lidí ruku pilinu vládu takže na tom zase sedí
nějaké senzory kamery které obrovské rychlém čase sport analyzujou ten povrch
a upozorňuji nebo detekuje vás i chyby
asi byste našli spoustu dalších věcí zapomněl jsem sem teď sem si vzpomněl znáte s
automobilek tam jsou ty robotický ramena kteří to svařilo tam jsou taky s množství senzoru
které řídí kontrolují jestli ty ramena do svazu ve správným místě
robotika
dneska čím dál tím více snaží svět řeší problém stárnutí takže se vymýšlí systémy roboti
kteří dokáží
nějakým způsobem
pomáhat
seniorů
a
toto je ukázka
jakožto udělám tím že to je trošku velkej příslib začni
je to spíš taková reklama ne že by to byly plně funkční systémy ale hodně
se zde tvoří kde jsou použity systémy rok robot když je v našem prostředí musí
často že tomu našemu prostředí rozumně takže
rozumím rozeznávat nábytek lokalizovat se v tom prostoru rozeznávat člověka chápat co tečou asi potřebuje
velké výzkum jsou dělaný na druhou sociální tam interakce aby ten článek se cítil dobře
s tím robotem
když tak nějaké zajímavé roboti neska budou takzvaný myslím že odplul
jedenáctý v robotické laboratoři
takže můžete tam na se nahlédnout máme tam jiného robota taky zajímavého s dvouma rokama
s ním se snažíme taky tvoří nějaké věci
té robotice navíc ta se dohledové systémy ale pomocí pro no
přesto se to použila třeba při požárech
ten strom se musí nějakým způsobem sám lokalizovat aby nebyl čistě závislý na operátorovi kdyby
oprava mandle nebo se pokazilo spojení draw musí umět sám přistát bezpečně
ty drogy na sebe umím i kamery termokamery třeba takže že požár nebo když se
sleduje hledá nějaká osoba třeba nějaký zraněný vlezte tak se to používá
ještě tady na ukázka ponorka podvodních robotech
zase složitej ste úlohy kdy je tam špatná viditelnost to špatně se měří
ten povrch země
robot se musí něco nějaký způsob navigovat
operovat případně z více silnice podobnými roboty
opravujou nebo nebudete budou problémy na těch trubkách co je pod mořem já sem ani
nevěděl že pod mořem vedou takže prostitutky
zajímavý
tak dál
naše aplikace rekonstrukce
používá se asi spíš
s těch z
pro zábavu devasistent z zatím že se rekonstruuj u města pomocí těchto technologií se pak
dokážou mobilní zařízení lokalizovat tom městě by věděli kde se nachází
a pomocí technik které se použije vítejte rekonstrukci se dělají dohledávání podobnosti různých snímků jestli
se mnou štůs tam někde viděli a kde
archeology se to používá
jak ty nepřímo nedali čas fotek ale jsou třeba karlovy se používá měření sonarem když
mám nějak mě to hodně pod zemí tak ono co to stačí možná pro měří
to potřeba se dají pomocí těchto technik dělat rekonstruovat ty tvary geometrické tvary
těch objektů
vyhledávání podobných objektů jestli se to už někde viděl databázi se tím třeba hledají policie
to použila na hledání s nějakých předmětů ztracených když mají fotku do co se ztratilo
tak
tedy systémy prohledávají internet a dívej se při někde nikdo nenabízí ten předmět ukradený například
tak ten ukázka jak se to dělá nějaká korespondence mezi různými fotkami i když ty
fotky třeba nemají přímo
jel tech jakou lokalizační značku na sobě tak se dají zase pomoc tě vizuálních věcí
lokalizovat
vyhledávání kopí ve videu jest
když tahleta nejdu video dneska vám to dělá ten audio to detekuje autobusový algoritmy na
to aby se to poměřovat zjistil jestli to není nějakej video třeba taky nory a
podobně takže
tak se to taky používat
chtěl jednu věc
jo to jsem říkal tím kdy že tam byly dneska dokážou
porovnávat
videa jestli to není to stejny i když vidíte že ty videa my jako lidi
to vidíme že jsou podobní je to je že se jedná o stejný plus ale
algoritmicky
je tam spoustu problémů zkreslený hroznej kontrast nějaké další titulky a tak dál a dneska
ty algoritmy se snaží už toto vyřešit
takže dokáže pak detekovat
že ty filmy nebo musí vydat jsou stejné
tak se nám povykládal pár
použití kde se to neska může vidět
zadara vázne vona mi to s logika mohlo vypadat že
jsme
hotový jsme obklopeni vším co funguje
proč už teda dneska
jezdíme flouty bez řidičů všude
nemáme identifikace s common
proč ho pro pudeš někde něco bouchá jak to že se teroristi nedokážou najít
protože ještě nejsme tak dále
na mysli se jsme je do jisté míry obklopeni
vy do učení stroji
záleží trošku na to nebudeme havla to slovo vidoucí chtěl jsem vás trošku navést právě
tím úvodem na to že nejenom kamera
je vstup do počítače který může nějakým způsobem interpretovat ten svět
je totiž jsme obklopeni
vy si vezmete mobil
počítač
to jsou všechna zařízení to jsou stroje které mají spoustu senzoru které měří
něco co se týká našeho reálného světa jsou plnou svou orientaci
trošku vám možná nevidí do kalendáře o do mailu takže se dokážou spojovat souvislosti
takže něco o nařež ty počítače vidí takže sme obklopení počítači které u nás něco
vědí
ale
když se vrátím k těm kamera na k těm
senzoru tereze použili fu výše proč to ještě není úplně všude rozšířené
je to že zejména kamery a systémy založeny na kamera
nízkou spolehlivost pořád
oni dobře fungujou ve vědeckých článcích to sou nádherný čísla tam co se slibuje přesnost
ve čeho
ale to
v reálným světě grosse si držku podnikání že když to pak nasadí do rána aplikace
tak tom není tak dobrý že to s selhává
existuje strašně moc variant toho prostředí asi světelných podmínek jenom faul té když si vezmete
začne sněžit budem na začne pršet odlesky vodešel
nefunguje to potom takže tejden vyjmenovat jeden důvod
složité podmínky
nízká spolehlivost
a dál taky to že
ne všechny aplikace sou
bezpečné tom smyslu
že
dobré příklady toto robotický auto
dneska nejsou roboti chtěl tak prostě proto že když byste sedli do auta a značíte
tlačítko že kam chcete jet a něco se stalo tady pro za to může
můžete za to vím že jste tomu uvěřili nebo za to může výrobce toho auta
nebo výrobce nějaké t technologie se vevnitř
teda možnost vo život a nikdo nemůže převzít odpovědnost
takže u těch složitější nebo nebezpečnější situaci to stále nelze uplně nasadit it rovný neska
nemůžou lítat všude protože
ten pro může mít dvacet kilo v jeho mu spadnul na hlavu tak je také
tak jim jasný konec
a zase
ta bezpečnost je příliš vysoká ztráta nebezpečnost
a
a spolehlivost nízká takže to jeden z důvodů proč pořád do zatím
břevnov linka
když to už daleko si mysim ty ale
a vy není toho moc tak té proč neska ještě asi ne
tak
řek bych se přesunul k trošku
přímo obraz o tak a budu chvilku hovořit o tom jak s těma obraz a
má
pracujeme co z nich získáváme
jak to využívá ne
a potom krát se to zmíním ještě prošlo paroubková data
abyste měli přestavují trošku
o metodách
nebudu hovořit nebudu jmenovitě
doména všechny metody které tady jsou protože
bylo moc a asi dva stavy nebavilo
takže když víme co asi bysme chtěli
tak
teď musíme přemýšlet
jak to těm počítačům
na naučí nebo jaký to umožnit aby to dokázali to vidět
jedna z věcí které se dneska
daří k počítačům
počítače naučit je
no určitě vidět
najít něco co už jsme jednou někde viděli
samozřejmě nechceme
do bude stačí nám jen aby to bylo něco jako fotka ku fotce ta stejná
chceme ne stejnou fotku
chceme najít co jsme viděli ten reálný objekt to s ta fotka vyfotila výrazem a
úplně že najdeme přesně tu fotku je chceme najít to co bylo vyfoceno
tak obsah té fotky proto se tomu říká von ten based search že podle obsahu
se hledá
takže zjednodušené mě představa technologie máme to mám teda to si můžete přestali tak nastupoval
nebo internet potom a
milane fotku a chceme říct
už tady nebyl viděny už to nikdy nevyfotil máme tady něco podobnýho tenhle barák trochu
z jinýho úhlu
jiným třeba tu časovým okamžiku celá podvečera tak a přestat chceme najít podobné
takže
tohle se už dařit
umíme počítač naučit tady vtom plán tě dát našel něco tou sme někde viděli
druhá věc
je
známe struktury
čím se to liší
pro toho předchozího je to že předtím bysme chtěli najít konkrétní dům konkrétního člověka konkrétní
vozidlo konkrétní vozidlo ti myslím stejnej ty stejnou barvu
tady chceme něco jiného
který chceme známou strukturu toho na jakékoliv auto
jakýkoliv obličej
chceme metodu která řekne tady je člověk ne tady je pan inclusion chceme tady je
bruce ne
news
přesně byla škodovka trochu sedmdesát
stejnak s těma klíčema tady jde další volám
proto by se mohlo tomhle se říká detekce objektů
a ještě jedna taková oblast
je
snaha získat obrazu
tady budeme se bavit o sekvenci obrazu více obrazů které snímají
stejnou část scény
zda nějaké prostorové souvislosti
ještě další oblast kterou takhle se zmíním potom jak se dělá
používá se to pro rekonstrukci
případně pro lokalizaci takovém prostoru
ve vnitřní prostor jak se naše senzory které se používají venku nedají použít jeep hezky
a podobně takže to vnitřní prostor se musí používat jiné například
kamery obrazy získává se nějaké
jaký popis a ta kamera se to dokáže lokalizovat
tak jsou tři
takové
oblasti kterým které jsem si dovolil támle zahrnout o který bude mluvit
takže
přiložímeli počítači obraz
počítač o tom nic neví
jsou to pro něho je to pro něho matice nějaký časový hodnot
a nemá prvním blšany
význam ty hodnoty nerozumí tomu
takže my musíme nějakým způsobem ten obraz tomu počítači jinak interpretovat leje způsobem aby sem
se mu lépe pracovalo potom s těmi daty
takže toto je jenom obecný
postup
abys abych vám tady ukázal že máme nějaký obraz nebo kousek obrazu
nějakým způsobem popíšu
charakter toho obrazu
používají se hrany často nebo změny gradientu
proto
protože i člověk vlastně funguje tímhle způsobem
je lidské oko a lidské vnímání je zaměřeno na změny
vidíme hrany objektů a interpretujeme rád protože to mi přijde nějaká změna
přesto nás
ta barva nebo ten jazz zajímáš v druhém kole
takže
jak jsem popíše například i gradienty nebo
nebo barvu tady ukázka popisu barvy jenom jako
barevnost na spektru a jako úhel
úhel tady na tom
barevném spektru
získáme sto tím pádem nějaký příznak nějaký popis jaký vektor který specifika který popisuje část
obrazu nějakým specifickým způsobem
to znamená
potřebujeme převést obraz
z nějaké matice
hodnot
černobílých teda šedotónových ne u barevných do nějakýho jinýho
nějaký ne interpretace
to je obecný postup
první krok
který seděla je nějaká před nějaká filtrace také před zpracování těch dat který jdou přímo
z toho senzoru protože
tyto senzory tyto nebo tato data jsou často zatížený nějaký šum takže jedna z věcí
co se dělá odstraní šum o potlačení šumu
můžeme to už nějaké rozmazání mediánový filtr který zachovává vyšší frekvence
dalším krokem může byt nějak a segmentace tady sem
tak dávám obrázku ten nejzákladnější prahování
zase to může posloužit k porozumění obrazu tím způsobem
že tom obraze velmi nějaké oblasti nějaké oblasti které jsem které se děje
liší od ostatních tím že mají nějakou intenzitu jasu a už to něco znamená kdybych
když se podíváte na svět tahle tím jedním okem hned vidíte že vy byste si
měli prahování jsou tady žlutý židle naše tým pozadí hned by jsme viděli židle a
už tam nějaká informace navíc už nám říká tady sou nějaký fleky pravděpodobně objekty
takže informace kterou potřebujeme získat takže například pomocí prahování nebo pokročilejší algoritmy
řekl jsem že člověk je citlivý nahraný
na změnu jasu v obraze
takže
řek když jsem jedna z nejčastějších jeden z nejčastějších příznaků které se používají k počítačovým
vidění
co příznaky které využívají nějakým způsobem hrany
změny jasu takže máme detektory které zvýrazní obraze
kameru detekují
jakým způsobem hrany
ja které obrazy
z unárního modulů z marzu například
mívají
a kdo řekl
ni hrozně malý kontrast
tu můžeme si představit malý kontrast my bysme se podíváme na distribuci těch jasu v
obraze zejtra neměl moc velkej extrém takže to možná linka dobře vidět ale používá se
na té spektrum
hodnot
takže jsou metody které
zvýrazní
ty struktury v obraze tím že ten histogram
přepočítají nebo to nejde při počítají takže se využívá celé spektrum hodnot takže je to
potom lépe zpracovatelné
no viditelné
tak když se budeš nějakým způsobem s napřed zpracovali obraz
tak to chceme jakým způsobem popsat
a
jedna skupina metod které se které jsou slouží k popisu toho obrazu nějakým způsobem
a o to dělají globálně tudíž nějak
celý obrázek popíší nějakým jedním příznakem kterým říkají
jaké mravy se třeba distribuce barev jaké barvy se tam obrázku vyskytují případně
distribuci těch
gradientu tady na ukázka jak se pracuje s různými barevný model i že známe rgba
pokud si uděláme histogram nějakého obrazu rgba ty barev to často se nám stane
nepoužívá se to právě proto že vtom to prostoru jsou ty barvy těžko o oddělitelné
a nic moc nevypovídají ouvej používají se modely například a zde které dělí barevnou složku
zvlášť port jasových
složek takže potom dokážeme tak takle interpretovaný
obrázku interpretované know distribuci těch jasu
a barev lépe popsat takže když si postavena klepal takovýhle prostor kdy každá tečka znamená
tu jednu hodnotu v tom obraze
to může lépe popsat tím že to děláme co vám
jako urbanizaci toho netřeba třicet šest
chlívku spočítáme kolika těch barev bylo a dostaneme nějaký histogram jako distribuci která říká jak
moc která barvách obrázku byla a toto používáme jako takovou značku tom obraze příznak popis
byste chtěli se ptal tak předpokládám že víte že může do čehokoliv
dobrý barvy teďka tady s ty gradienty úplně stejným způsobem obrázku spočítám gradienty
a
v nějakých malých oblastech například si tam špatně nemalý oblastech
dělané celý obraz
takže
spočítáme gradiente jsem v obraze
a zase se sumarizujte nějakého jedno histogramu který říká kolik je tam hran takový celá
třicet šest takových směru kolik jich tam bylo zase máme nějakou charakteristiku celou obrazu
kolik tam bylo hra
tak
ale představme si
ještě ne
štyrech
pro něj výhodný
když
nebo dole se používá
bysme viděli to úlohu máme strašně moc obrázku snažil moc fotek
miliardu ať můžeme machrovat
tak takže máte fotku a chcete zařídit
tak
viděl jsem už někde
takhle zavolá viděl jsem už to fotku někde
tak pomocí dělat příznaku
můžeme
tak rychle vrátní rychle protože tu miliardu
poté že každá fotka je tak taky popsaná tak nějakým příznakem
a říct
kterej která fotka
pomoci porovnání dvou příznaků těch dvou stejně dlouhý vektoru
s je podobná
které dva vektory když už napořád euklidovskou vzdálenost nebo jinou medikův
jsou systémy podobné
tak
to nemůžete koroze fungovat používá se to proto ji třeba pro indexaci
abysme potom to dohledali jinými metodami lépe
jsem si vybral takovou jednu jako ukázku
všechny tyto obrázky
čtyři rumy tyto dva tyto dva vektory jak radiantů zabere stejně
teda vidíte že to nejsou stejný fotky
to je extrém
jsem si našel abych vás
kdyby vás vybudil ovál efekt
amen
i běžný to by běžných situacích
byste našli fotky které zobrazí něco úplně jiného a přitom mají velmi podobnou distribuci barev
dítě gradientu sobě
takže
nám to prostě nestačí
chceme najít
nějaké lokální popisy chceme fotku popsat jako
sadu nějakých
lokálních struktur zjednodušili svoje říct vidím fotku takže popíšu jako
auto jejichž člověk
les
tak
jak na to
potřebné obrázku najít nějaké
nějaká a nějaké
po to obrázky po části obrázku místa
která rozumnější zajímavé
teze si vybral tu poušť
abych aby ukázal
se pokusil vysvětlit na tom
prože protože to potřeba
kde sme se chtěli lokalizovat najít své místo na obraze na mapě
tak
potřebujeme nějaké záchytné body
budeme já takové nepouštěla těžko někomu řekneme že sme
na východ hotovi věže kostela nebo něčeho pro se tady jsem nezvulkanizuj tady sme furt
jenom na nějaký poradce potřeba nějaký záchytný body
stejnak když děláme tu analýzu obrazu
děláme takovou analýzu do večera někde to funguje tak že se dívá po tom obraze
a dívá se jestli je to poušť nedokáže o sobě nic říct
eště to hrana
role na může lepší sem někde na silnici
vod nekonečna do nekonečna takže už víme jsem aspoň trochu ale ještě nevím
zase na první nebo na štyry sta padesát kilometrů
takže ty metody hledaj taková místa v obraze
která sou opakovatelně nalezena
tu zatáčku dycky najdou být pole nebo té silnici tak tam zatáčka tak tam najdu
a ji příště zatáčka tam zbude neumím říct zatáčce
tak zjednodušeně popsáno jakým způsobem
se hledají obraze klíčové struktury
co na ne metody které se snaží nějakým obrázku najít místa
která
zabývejme se před přestali byly té přírodě chodím po obrázku jako ta metoda
až dojdu do místa jak tedy příští příště nevím no
je to zase ten jak se sbíhá jak potok probíhá cestu nebo je tam úzká
po něco
já vím že nejvyšší prostě přeje znovu tak to nenajdu zase a jsem zase pozdě
tohle místo najít stejnak to byl ty
vy
ty metody že se vracím zpátky tom obrázku
to bylo takže řikaj
tady
to není zajímavá struktura tady voni nevím
tohle příště ne
kdyby mohli klidně no pouze vedle
tady
to taky není zima struktura
že to teda tištěna nevím jestli budu tam nebo tam toto je zajímavá struktura až
uvidím příště jiným obrázku tak v masovém takovou strukturu znova najít
proto složitá detektor zájmových romů
za nových oblastí klíčových oblastí
taková metoda
na najde
ty místa
takže zkazit požitek invariantní vůči translaci
takže pozici nějaké
co mi na nějakém místě
ale to máš ty úplně stačí
protože my potřebujeme aby ta metoda byla schopna
teďka na to místo popsat
žen víme že když ne v nějakým obrázku někde
nestačí to cele říct tady v okolí je ten potok ten šutr něco nějaká struktura
ale my musíme jak je souzen tomu algoritmu nebo
to ne popisovače říct
já
velký okolí může použít
k tomu popisu kilometr
nebo kilometr
co zahrne do toho popisu
stejnak obraze potřeb ta metoda musí vidět si má vzít ale okolní nebo velké okolí
pokud sama umí nějaký algoritmem se říká že nezávislá naměřit že vždycky školeni na hodinku
stejně že
tak dycky ne můstek orloj najde
najde stejně
když už tam máme to místo analýzu toto měřítko tak najdeme
ještě směr je taky potřebujeme abysme viděli jak se natočit
abysme dokázali popisovat
spravuje kámen a vlevo je tu nikam
takže bys ještě musíte najít mají ten směr takže jsou orientační maria
tyhle způsobem dobrá jsou metody které na dokážou najít o
husy obrazu a nějakým způsobem popsán
opakovatelně mezi různými
obrazy
a můžeme to používat dal
dokážu popsat
obrázek jako seznam nějakých míst
tím že se
a mám nějak jestli to nějakou tu značku když obrázek už není popsány jedním
ale seznamem
pro každý bodík hlasů svůj podpis značku
takovýhle obrázek ten má zas další příznaky
tady jsou zobrazeny pouze ty příznaky o ty body které potom byli v obraze
a u s tím můžu si dělat
může vyhledávat
vidím podobný obrázek
vím podobný obrázek
rovná nula na nějaké body
jenom obrázku mám nějakým lidem obrázku a vidět o to stejný
no tak
vezmu jeden přiznat a dívám se na přiznat druhém obrázku
je nějaký podobný a je dělá korespondence to sou ty čáry dělám korespondence to jsou
podobné body
červeně jsou vyznačeny korespondence které jsou špatně
nejsem dycky takže by to zvládl
takže jsou metody tady toto dokáže
otřel pro vás
nalézt tu transformaci mezi těma dvěma obrazy
a říct ano je to stejný s nějakou telefonu
může u robotů se to používá na to na pozice
používá zvedne rekonstrukci
mám budovu
na podzimní toků tyhle metody dokážu najít na téhle fotce sou tyhle body
a té druhé fotce to sou ty stejný body takže dělám korespondence mezi tím tam
a
bohužel o téhle metody ještě navíc že u se jedná o nějakou
chceme získat příde informaci
luk prostorovou
takže ještě se musí to počítala kde byla asi kamera když fotila oddělení fotky
a neumíme pomocí někom exponenciál fotek
dá dohromady
algoritmus tedy moc obecně říkal na dočasné
on to za hňupa
a možná z toho vypadnou kde byly kamery a kde jsou nějaké body
byly prostoru i klíčové
structure formou šest
ne tento dům můžeme migrace sem se vo tom hovořil a dochází čas
ne tak tam jsou oproti tomu to postupy které se snaží nějakým způsobem
generalizovat
já jsem říkal ne konkrétní osobu ale obecně vás
takže můžeme takovému detektoru možná neúčinně nějaký model který bude schopen říct když uvidí kousek
obrázku je to dvanáct nebo ne
tady ukázka jak si věděla
nej běžně používané metody tu máte ve všech foťácích a mobile
je to
pomocí adamus tučňáka
metoda počítačového
inteligence
ta metoda se naučí které
netýkají ty značky použít ta značka zítra
jakým způsobem porovnávat jestli tom obrázku omezit vybere několik
a potom ty nebo
takovou sadu těch porovnávač u použije tomu aby není mi obrázek po už viděli porovnávače
aby všechny něm asi jo to by mohl bych si
tak obecně řeknou ano je to obličej
když je to trénujeme nějakou nějaký algoritmů nějaký model ten moje si musíme taky říká
co nejsou něčeho by věděl
že na tyhle obrázky má hlásí a no a na tyhle má asi ne
pomocnou se to naučí
a potom to funguje tam že když nám vleze nějakou fotku a na závody na
voliče
má nachystaný nějaký ten svůj detektor
dostane výzev obrázku
podívá se na ně a řekne vám tady spíš větší není vo kousek dál do
obou signál tam rostlinu je
a tam kde obličeje tak zahlásí ano tady obličej
sledování znám
hodně používané pro analýzu a detekci pohybující se objekty
sledování osob toto už hovořili
můžeme používat
detekci pohybující se objekt už na nesatinování kameru dokážeme dvě místa v obraze
takže tam pokuď tyto věci kdy kde
kde to mění
no umíme vám říct
že tam jsou nějaké objekty které se jídlo
nebo naopak můžeme
modelové no pozorovat pozadí jak se jí nepoznání
a vůči tomu pozadí že máme nějaký jiný objekty se dívají na a zase vidíte
zelené tečky jsou jaké příznaky
kde
se vůči
většině ostatních příznaků jiným způsobem lze bysme dokázal nějakým způsobem o segmentovat
ten obraz říct toto je toto je objekt který nás zajímá nebo se to používalo
stabilizaci v americe
toto
teď sem nastínil
postupy
nebo
roky nějaké metodě která se snaží obrázku nebo ze sekvence obrázku
získat nějaký
jiný popis našeho pixly
takže nám jasové hodnoty
takže máme různé
příznaky detekované objekty a tak dál
a teďka vy nastoupilo
nějaký strojové učení slouží k a jaké metody statistické
které
tyto
popisy obrázků podle potřeby podle aplikace konkrétního vážně a zpracovat
najít nějaké zvuky podobnýho
podobný příznaků
nezamítáme no a
klíčových technické se používají počítačovým vidění pro detekci klasifikaci rozpoznávání je ta paní bude za
ně hovořit
hluboký
neuronových sítí luční
zítra s
sedět ještě protože tomu hrozně moc rozumí
a
si to na dvě hodiny
kolik
dvě hodiny na to bude asi oni výživný
takže ten manažer něco ví co tě
o těch věcech dál
si blázen ještě je fuzzy paroubkovi na
a často používané v robotice automobilismu
kromě kamer můžeme používat senzory která měří vzdálenost tom obraze
vy nákladnější leda
senzor který vzniká paprsek vyslaný a měří na souboru je stejně
těchto dat a dokáže
tvoří
nějakou mapu toho prostředí
říká se tomu mapa obsazenosti věděl kde nic není a kde něco je a pak
se tam dokáže orientovat
další peníze který
je trošku dražší a lepší
je to že tady na zkopíroval jedna třicet dva krát nebo šedesát čtyři krát
takže se to točí dokola tam šedesát čtyři paprsků
měří ten hluk od profil
a my získáváme taková ta data která reprezentují jsem kolem jak je co dál
tyto senzory bohužel
ne nesou informaci o jasu je stejně jedinou ta žena nebo hodnotu pixlu nemám obraz
on čistě klukovi
na tom neví kam
proto používám holka
tam kde se vulgární orientovat
možná to není tam ukázat jenom tam byl
jezdim tam
co to je tý
jedna vyrobena mapa
příde mapa kompletní jako zub za tě
takže ty města neujezdi
ve městě nebo ne ve měste jezdí jenom tam byly už mluvil byly doma vytvořili
jakou interpretaci do světa na to jenom měří a zjišťuje si můžu tomu modelu dej
té kamery
zase získání odpovídá pomocí dvou povýšených common takže vím jak jsou kamery na sebe
dokáží
odhadnout triangulace
na korespondence dvou pět bodů beru vrátím z jinýho místa odhadů vzdálenost
nějaký bodů ve scéně zase musí stát bloků matku
alokováno a znamená každý pixl
hodnota toho pixlu annotate to ne matici není já s já jsem vám ale potom
jak to bylo
ti ne všichni známe
metoda která je podobná stereo znamená akorát
nepoužívám dva obrazy používá to že místo obrazu pro mít na nějaký
vzor pro scény
a druhá kamera a jednak a nebo s nima
a ten ti dá stejnej
vím kde byl ten projekt od toho vzoru
jinde kamera která lidí
tím že ten záznam jinak vypadá
tak dokážu spočítat jak se
body
nuly podle toho jak blízko byl nějaký objekt se to promítlo zase získává blokovou mapu
toto je úplně stejný jako tady
to šedi akorát že to zobrazení
mračno bodů třemi tady těchto metodách pracujeme značkami bodů
zase jako praze
mami máme svobodu v externě
potřebu nějak interpretovat nějaký sonet nebo psát nestačí měli jenom tady je jak vyvolat tady
nějaká holka anebo jsou dojedli
takže se používá push when normální
aby prošel mám ni nestačí nebo
takže používám na okolí zjistíme jaké asi
pozor
a prosím o nějakou over spočítaný bodu
no na ty položky okolí
s tímto pracuje za moc něco zase filtrovat datech budeme mít spoustu šumu
takže zase
podívám se na hodinku tam se to bylo uplně zjistím pochopíš tady už osaměli vznikl
pravděpodobně šumem takže tebe
s tebou už dál nepočítá zahodíme
že ho sledujeme
můžeme pro segmentaci takového uvedena povídat
ne se tam robotice používá často pro úlohy kdy můžeme předpokládat že robot
sedí na nějaký stůl nebo na zem chceme
najít objekty které na tom
stole nebo na zem jsou
odřízneme umíme najít tu plochu té toho spolku na pryč a pak nasednete objekty
znamená segmentovaném objekty chceme nějakým způsobem
zase popsat nějakým příznakem
nějakou
zajímavou spoustu na tom
lobují na tech se nepoužívají příliš že bysme dali ty struktury jak obraze ty zájmové
tady se to dělá rovnoměrně tady prostě
každej pátej vole se vezme spočítá se nějaká jeho charakteristika kolem používají se zase distribuce
techno na tom okolí jestli je to takový pohrobek hrana takže na nějakou distribucí mám
přiznat
a nebo popíšu
celej kus na svobodu dohromady
takže pak hodinu nepotřebují dní příznakem to předchozí metodou mám jen zde popsány třeba si
přiznat tam
dané se s tím pracuje je velmi podobný a von zase zopakuju korespondence
tom zkoušce neviděli
o tom co uzná ste
senzor pouze na jeden slajd
vybral jsem ty které považuju za
uživatelský
přívětivé
a dostatečně
mocné
operací ani nepoznáte zpracování obrazu
pokud si von tam library pece zpracováním přeboru rolls systém práce soboty a pak tady
chci nějaké knihovny
trénování modelů učení
takže na závěr
je otázka
jak to tedy je
sme pozorování nějakým velkým bratrem
ne jinak image pozice náš dismisses abysme to ještě nejsme
já jsem už naznačoval
pokud jsem zažil kamery jako to oko velkého bratra
tak pozorování ještě nejsme zatím
když blondýnku
to už nelze pozorování sociální hlasitě tenhleten to co se vypíše na různých na internetu
a vem
myslím že
nebude to dlouho to bude to tu
děkuji vám za pozornost