a dobrý den hlas tajný tam u nás na fakultě
já jsem teda tady domácí je to místnosti sem život ještě nepřednášel který je pro
mě to ne
a nevíš bylo řečeno a bude ta je mluvit o konvoluční neuronových sítích těch s
těmi se věnujou poslední tak dva roky a předtím jsem dělal ze další věci nedá
disertaci mám na detekci objektů v obraze pomocí metod které jsou a deset let staré
patnáct
konvoluční sítě sou uplně a nové téma které všechny velké firmy začínaj používat je teda
paka nemyslím prostředi hraje poslední dobou začínáme hrát trochu druhé housle protože nemáme ty miliardy
peněz a obrázků které oni mají
nicméně ten a abysme už šedá ta
tady máme na tom původním slajdu jenom takovou a motivační nebo demo to nebo do
motivační obrázky
celou dobu vám tady bude říkat jak jsou
konvoluční sítě úžasné jak umí všechno možné
ale i když se podíváte
tejdle těch článku ke kterým tady mám obrázky
tak chtěj pokazil že
pro koho konvoluční sítě je velmi jednoduché třebas takového školního autobusu na kterém jsi konvoluční
se o kterém si konečně si myslí že to je stoprocentně školní autobus
malými změnami které čili vůbec nepostřehne sto udělat obrázek o kterým naráz ta sítě přesvědčena
že to třeba tygr
a
že takže
ty tom
ty metody kterých já budu mluvit uměl úžasné věci ale a fí gui
na to že slovo to konvoluční sítě jinak než člověk čovek a takhle mezera člověka
takhle nezblbnete čověk a zas na druhou stranu můžete zblbnul úplně jinými způsoby já to
na ty moc můžeme
tak a proč
proč vlastně
a
sou konvoluční sítě důležité
proč je důležité slovo ke učení a tak
když se podíváte na tom co se děje průmyslu
náš průmysl těmi slintají ty a posledních dvou letech tak najdete spousty článku které mají
titulky a koupil převzal firmou zabývající se stát tam zabývající se hluboký mučením
a akademických které kteří od osmdesátých let pracovali z neuronovými sítěmi naráz prací po pro
vůl pro face book pro yahoo pro bajtů
podstatě všechny velké internetové firmy a hlavně ta vyhledávače ale jiné firmy při dnešní době
vytváří týmy které nedělej nic jiného než že trénují neuronové sítě
no doopravdy zakladatele a
tak a pak s akademické obce na neuronových sítí teď pracuji pro tyto firmy
o čem bude tramvaje přednáška
ne s letos tomhle pořadí ale plus minus kteří vám ukážu jako je jako náznak
toho co konvoluční sítě umí
a
pokusil se vás přesvědčit proče používat
proč vlastně funguje tak jak fungují
já teda nevím jak moc se a máte představu o tom asi takovouhle neuronové sítě
sou co to sou komerční sítě to už možná nevíte vůbec
a tak pak bude část přednášky kde
velmi jednoduše se pokusil vysvětlit základy stará toho co to sou neuronové sítě nebude tam
žádná složitá matika ale tam složitá matika ve skutečnosti vůbec není
ty neuronových sítích
spíš nebudem taky jako co to je jak to pochopit co to umí jak se
to učí
pak se to samozřejmě
a projdu to co s tak ve městě vy můžete dělat střední můžete čekat
na chce můžete mi použít
že můžou fungovat ad se používají
a pak nakonec ale pro vás to může bydlet určitě zajímavá část se podíváme té
existují nástroje pro totiž pro učení neuronových sítí existuje spousta open source free software nástrojů
a které prostě můžete stáhnout z internetu
a přeložit a sáhnout si dokonce ne o existenci neuronové sítě a přímo je třeba
používat velmi jednoduše si třeba udělat webovou stránku která bude rozpoznávat a jaký druh psát
je na obrázku
to té práce tak najednou odpoledne
tak zatim nástrojem konkrétně o kterém budu mluvit je kafe což asi dnešní době takový
největší projekt
a pro
používání neuronových sítí a zároveň je asi vás nejjednodušeji použitelný
tak
a čím takže ne všechno začalo
a to bylo
a využitím konvoluční sítí pro rozpoznávání toho cena fotce
když se podíváme
a samozřejmě když víte co je na fotce
tak pomocí tomu že tady hledal
a já co tady mám otevřený tele a to je normální stránka googlu a fotky
toto je moje kolekce fotografií celá může dělat tuhle chvíli tak já můžu zadat třeba
řekne na co bych se podíval
abych se třeba podíval
jestli je mám by to cenu někde slíbil
takže
zkoušíme
zebra a
dobrý zabývala
aha takže vidět že já mám minimálně dvě fotky zabere se kolekci
to je na tomu kdo přišel
tak není takže by
já u těch fotek zadal na té fotce zeptat
ale oni mají natrénovaný neuronový sítě
které vezmou ten obrázek podívej se co na něm je řeknou je na něm se
prát
pak na někde databázové u těch u těch fotek vlastně mají
a tady ty automatické anotace
id zadám zebra tak se už akorát prohledala a ta textová databáze normálně jako když
se dělá textový vyhledávání
a současnosti
a tyto metody fungují velmi dobře
já když to vyzkoušet dál
kromě
tak samozřejmě když a mě co na objekty rozpoznávat deva celkem jednoduše tady vidíte že
vám vyfocenej nějakej nějaké autobusy
když se podívám co třeba by mohlo být složitější back třeba nějaká činnost
nech
napsal jsem to dobře
to je to ti no samo že se si to vyzkoušeli by to mělo fungovat
tak
lidech tady jde že jsem fotil někde na ně
někde kde se běhalo
a
vyzkoušel místa
dobře a tak tohle je moje kancelář pan kdy jsem pracoval
dokonce
můžeme zkusit něco co vůbec vlastně na obrázku neměl být poznat
třeba jako sranda von
a dokonce mi to nejde obrázky které vypadají že tam ti lidi doopravdy a se
mají dobře veselo
to tohle si můžete vyzkoušet pokud máte no
určitě
máme nazdar
mělo by nevím proč ne
to je to věděl
částečně ano
samozřejmě tohle nefunguje stoprocentně jsou věci
a
něco podobnýho to je vyzkoušeli
třeba store
jako něco
jak se tam vidíte
samozřejmě najdete
a teď metody nejsou stoprocentní ale filtry na devadesát procent já těch lidech tam mám
hodně takže ono to může vybírat
ty který a to neukáže třeba všechny not na velkou přesnost ale nejde to a
všechno
ale
ale většinou to funguje
ad to
tebe jsem fotil já ti badminton
mám fotky badminton
a tohle dopravy
dostání by tam šli musel něco textově zadat cokoli
je zajímavé že jsem zkoušel google nevyhledává podle lidi nevím proč
ale určitě je to měl taky
sral tohleto bleskem
zjistit se na fotce
a vy kdybyste chtěli chtěl něco takovýho
prezentovat člověku tak pravidelně byste
chtěli napsat popis to je fakt
to je poslední době velmi nové téma
a je to vlastně spojení porozumění textu s porozuměním obrazu
a dokonce existuje a teďka letos to byla první soutěž velká kde vyloženě cílem bylo
ty máte fotku vytvořte automatický systém aby vám fotku popsal
a to co ukazuje tady tak to je hra výstup
článku kterej na odkaz máte tam dole pak se není klidně můžete podívat
a se dá to sou skutečné výstupy ste já s nějaké neuronové sítě
jak vidíte tak
a doopravdy ta neuronová síť dokáže poznat že tam sedí člověk hraje na kytaru
a skáče tam nějaké dítě a je tam doopravdy
hráče který spravuje někde silnici
některých případech zase funguje to dobře
to je uprostřed má být kočka
to nevadí a pak se pak jsou případy kdy kterémuž ty fotky jsou nějak zavádějící
nebo
nejsou tak časté je to znamená potom skáče čili za ním je voda tak je
dost pravděpodobné že dá s autem nás auta novej importované na trampolínu před a před
tou vodou a fretku
a s ovladačem asi na internetu našla často nenajdete
pak samozřejmě jsou
případy kde si opravdu řeknete co asi dělá
jako toho
a medvěda
toho koně tam nevidím ten kluk vyloženě má bitovou pálku ale
to je to je
když se podíváte tak
tohlencto je ta úroveň kterou dneska takovýhle systém můžete čekat já někdy to funguje úžasně
někdy to udělá chybu ani věc
si řeknete pane bože co se
ano
tady třeba tady ty systémy jsou to nenatrénovaný asi na při statisících fotka
a na tři sta tisíc i fotka žádném případě není a zachycené všechno co kdy
čech může vyfotit
no na věci které co jako je normální tak na těchto pak funguje většinou dobře
a fotky které jsou divné tak na těch nebo nejsou moc časté na internetové na
ti to moc nefunguje
samozřejmě fit zvuk používá konvoluční sítě třeba na rozpoznávání obličejů
to je takové ty nápovědy kdo je
za tímhle sou konvoluční sítě vezmu vlasy nejlepší rozpoznávač obličejů současnosti na světě
tak nevím jestli jste viděli
o sou letošních prázdninách velký boom na internetu na ready to je spousta vláken a
na takzvané ty trims to není nic jiného než že a vás pro nějaké natrénované
neuronové sítě
a vy můžete chtít aby to neuronová síť změna ten obrázek tak aby se víc
líbil tak aby tam byly věci který ona by nich ráda viděla
a pak na to si můžete stáhnout zdravíčko pipe no
který využívá kafe můžete si lze klidně takovéhle obrázky zkusit doma nebo si nahrát obrázek
někam na nějakou webovou službu
a pak vám ukážu ještě vydá občas dostanete strašně psychedelické a
fotky
s těma to jde udělat zajímavější věci
a třeba toto je existuje tečka článek s letošního roku kde můžou si fotografi
a říct neuronové síti s těmito fotografi aby víc vypadala jako nějaký obrázek
takže
tohle je sem se té za styl
a
bohužel nic moc nevyznám ale můžete si klidně udělat pro své vlastní fotky ve stylu
ne před poznámku bys mu
a
by mohli nějak impresionizmus nebo něco
a podobně
dokonce
tomto případě můžete
zřejmě na vstupu pustit video
a udělat si a alenku kubice testovali kůži šedivo
a nakupovat
to fungovat
a ty
neuronové sítě které starého za vším co se týče ukázal
jsou stejné
no to je plus minus ta samá neuronová síť používaj se ty samé algoritmy na
vy na vytváření těch neuronových sítí
ale výsledek je uplně jinej podle toho jak je nakonec použijete
takže jedna což je jedna velká výhoda kulečník neuronových sítí
a to takže když se jednou naučíte
dokonale najdete si něco
včera jsem a můžete pracovat nějakej tool
tak pak si můžete to dělá strašně moc věci
té jeden nástroj tady mám umožní dělat téměř cokoliv
tak to bylo takový je
abyste se do toho trochu za kousaly
a teďka pudu
a takové základy a myšlenky já nevím co vy ste kdy slyšeli ostrovem učení
takže a projdu high úplný úplně základní myšlenky strojového učení a jak ty metody fungují
nebude to nadlouho
pak se dostanu na ty neuronový sítě
teď mám úplně hlav
základní takovej
a základní úlohu kterou vlastně konvoluční sítě se dostali i do povědomí a akademické obce
těch firem a a veřejnosti a to je úloha kdy máte obrázek jak chcete zjistit
co na něm je
to se a
to si nenaprogramuje to hned nemůžete vytvořit program kterej by a se podíval na fotku
a podle nějakých vám za daných pravidel řekl že tam je strýček na surf
to asi ne předpokládám že jste mě někdo myšlenku jak na to jít
to prostě není nejde tam musí by něco inteligentního a co se
a co se toho člena jen statistovým naučí rozpoznávat
není to definovaný program ale musí tam být něco se to naučí
tak jenom tak to je tom to je taková vsuvka byste měli představu
a čeho se google snaží dosáhnout
a s možná víte jaká je slovní zásoba
a
cože nějakých řekněme po vás otče trochu víc tak dejme tomu aspoň pět tisíc slov
a v ideálním případě při rozpoznávání věci na obrazu bys
bysme aspoň chtěli a vědět co na tom obraze ve smyslu a nás podstatných jmen
přídavných jmen a sloves co se tam děje a to je právě to je ta
slovní zásobu
znamená taková nehoda síti na případě by dokázala
a říct deset tisíc různých věcí o obrázku
navíc teda jo když na obrázku auto
tak on může být na různých místech takže ty chyb informacím dadistova nic
a kromě taji těchle obecně kategorie jaké automobil běhání vražda nebo podobně a světa ještě
horší protože listy
trochu konkrétnější věci typu konkrétní lidi jasný člověk
a vy ste uplně někdo jinej sme podstatě jiné kategorie objektů
a s existují místa chcete když sem a bych beru tak co nejsme na hodině
jak jsou té konkrétní jedeš
na ten tento problém je obrovskej
a my se k němu dostáváme
ale ještě nejsme uplně tam kde by se měl byt
abysme dokázali to sem to co člověk
tak jaksi love učení funguje
že vy máte nějaký program
ktery se dokáže adaptovat
co on
co on ví tak to je že
i když mu dáte nějaký
vstup a pro ni
co ten program má říct
tak on se dokáže změnit stát
aby a doopravdy protestů říkal co má říkat
takže
typicky když budete mít nějakou metodu strojového učení i vytvoříte data set se jsou třeba
tomhle případě americké vlajky a kalašnikovy
řekněte jim kterej obrázek je kterej
těch musí být dostatečně na hlavy
protože
a ten program nikdy nic neviděl žádné obrázky tak tam se musí naučit všechno znovu
dáte mu takové ty data se sichuan třeba hodin o den dva dny
budu počítat
a pak můžete po těch dvou dnech čekat že
a snad
a bude umět rozpoznávat a vlajkou ad kalašnikova
ad to play základ strojového učení a ve skutečnosti
to je to jediné cestou je učení
co vy jako lidé o ušlo tomuhle viděl promluvil
tak když se podíváte tady na ty dva obrázky tak si
porovnáte podoby ten vypadá skoro úplně stejně
co samozřejmě pro počítač
tam žádná podobnost není
počítači lidí ty obrázky
jako maticí pixlu který které mají nějaké numerické hodnoty a
pak a neexistuje žádná lehce rozezná to na podoba mezi těma ano tam a pixlu
vtom novým obrázku a vtom pravý obrázku
a na úrovni toho obrázku ty tady ty default
no a ta malůvka ta fotka vypadají úplně ale úplně jinak
a velká část
počítačového vidění
není o něčem jiným
nešlo tom
jak zajistit aby se dalo poznat že dvě věci vypadají podobně
a my bysme
někdy se měj reprezentaci obrazu
která
prostě pro jednoho člověka
pro tu malůvku vlevo
vytvoří nějaký vektor čísel nebo nějakou jinou reprezentaci která bude velmi podobná tom obrázku vpravo
tak tu chvíli
dokážeme dělat už jenom na podobnosti těchto chtěl reprezentaci bysme dokázali říct že třeba tady
na těch fotkách dvou je ten samý člověk
a je otázka jak to udělat
with brown o tom trochu mluvila utej ukazoval spoustu
a
spoustu deskriptorů my tomu říkáme
to znamená nějaký popis obrázku a tu globální popisy a ty lokální popisy
a to tohle všechno co někdy někdo
napsal ručně
na téma připravit jako jeden
a s kterej se dost často používá právě rozpoznávání toho cena obrázku
a je to založený na těch
který by se metra vidělo to ukazovátko
ještě viděl
tak si dáme pět deset minut přestávku
ne jednat
počítače vidění se používá reprezentace obrázku
které se říká back off borec
táta je založena na tom ženy když vezmete ten celej obrázek tak zjistit že celej
obrázek se podobáte dobrým obrázku tak to je složitý
kazit malej to zajímavý kousek se na obrázku zjistit že se podobá malému zajímavém opravdu
rakousku zde obrázku tak to už jednodušší
minimálně protože
když se a by se nějaký objekt pohne
tak ty malé kousky se pohnou ale pořád vypadají stejně
emise se dívali na co je ten obrázek ty prostě obraze kde čili je vpravo
nahoře vlevo dole tak vypadá jinak ale ty malé kousky vypadaj pořád stejně jste ty
objekty chybou
a se dá udělat vektor obrázek se dá
a dá se
můžete si říct že se budete reprezentovat ne u nějakých mít druhý výřezu pomůžete mi
druh výřezu typu
a ta tady oko
a jsou solí
a se holt kola
ve skutečnosti pak tady tyhle
je na typy výřezu nejsou pojmenované ty jenom
jsou definované tím že vypadaly je že to je skupina výřezu obrázku který prej právě
podobně
ne výpadek jeden velkej obrázek můžete reprezentovat
jako počet takovýchto různých a druhu malých výřezu můžete mít obrázek
se a ten na té ženské můžete mít tak prezentaci
je tam dvakrát oko je tam jednou nás je tam jednou psal
a nikdy tam není šlapka otko
to může být vaše reprezentaci toho obrázku
lze úkol a bude víc těch šlapek těch začínat
tak já taková reprezentace obrazu
vypadá a podstatě vypadá velmi blízko tomu co vám tady ukazuju
tohle teda fotka
kde sou male výřezy
ad výřez jsou přeházet ne
to co fandí ten počítač
a on prostě lidi jako jsi ty malé výřezy plus minus vypadaly
ale už neví kde vtom obraze sou
dokážete například věřit co na tom obraze
ne kteři někteří lidi s tohle jo někteří ne
a
tenhle obrázek je teda jednoduchej to doopravdy from což učitele velmi přesná klasifikace to toho
obrázku
ale člověku se mnohem líp koukal na tom obraze
a nejenom že se tomu
a na to koukali člověku ale
ve skutečnosti tady tom obrázku je
a mnohem víc to je důležité informace které která nám umožní a
pros rozeznat interpretovat ten obrázek a tady vtom ale jak tam je tady geometrie egid
to že to ferrari tak rozpoznáte kvůli tomu pomocí toho že ta červený a jsou
tam kousky který vypadá jako kousky auta
takže teraz
a když se zeptám
tohle teda je doopravdy jako vsuvka která se jako voliči asi těma přímo nesouvisí ano
sou vy si pak a ne o tom no
prosím
tak
ve chvíli když máte tohle obrázek tak určitě
velmi jednoduše
až ve chvíli kdy ho nemáte
by to šlo taky a bylo by to výpočetně náročnější
a jo takhle když obrázek
tak
pixly vedle sebe
mají velkou pravděpodobností stejnou hodnotu
což znamená že byste dostal vedle seznam a rozházených kostiček
tak když se na té hraně zjistíte
a co je na ní na za pixly a najdete si seznam vlastně toho co
by tam mohlo hlasovat pomoci to že si řeknete vedle tom obrázku by měly být
stejné pixly
a pak dáte jako globální optimalizaci kde ty kostičky se budou hýbat tak aby pasovaly
k sobě něj takže začnete spojte ty co nejvíc pasou sobě pak
co posilou trochu míň až dojdete k tomu co po se a nejmíň že sto
je kamoš pak zapadne
máte velkou šanci že to dáte
a to tohle
ta ratejna to na
na tomhle slajdu a jsem chtěl ukázat co dokáže člověk on
vy
a se vtom novým obrázku tam té informace
je úplné minimum tam jenom ta černá bílá a ještě to
tak jako velmi a ne hezky
a vy prahovaný to nejsou tam vidět žádné a kontury vás ve skutečnosti těch hobby
toho objektu který tam je
o já doufám že vy stejně
trochu vidíte na co na tom obrázku je
pozn poznáte někdo cena tom novým obrázku
tak a jakej dokonce
jo je to je to dalmatin tady
tam je tam vyšší sloužit
name a
ucho
levá a pravá a levá přední a zadní na něj
zásad
a nevím jak to vidíte o tom a na to tak vidím krásně
mám to blíž prostě
a jestli čili tohle dokáže rozpoznat to že to dáte dohromady a
jako vy pozor je tam spousta vpodstatě bordelu který vás rozptylové
ale část vypadá jako třeba toho wattově celkem poznat
takže vy nedokážete rozlišit prostě ty kousky
a samy o sobě a pak si to dokážete ještě na celý dohromady
takže check má pak výhodu toho že to dokáže vnímat naráz ten obrázek a všechny
ty souvislosti který tam jsou petra mimo jiné díky tomu že mozek je obrovské a
dokáže to strašně moc počítat
a
tom pravým obrázku jet informace také minimum ale prostě vidět že to nějakej skejbordy stranou
rampě a zrovna jede domů
a dokonce možná podle té barvy si řeknete co při západu slunce
tak hezkej čili dokáže pracovat
se strašně málo informace
na té informace muslim na hlavě se rozhod
s vesele čas
ale pak si představte že budete dělat
rozpoznávači židli
židle řeknete si to vidim každej vždycky to post poznámce židle
ale jí se pak podíváte židle můžou vypadat
tak
a budete docela překvapení tohle všechno sou židle
a není nemají vizuální společně každá para úplně jinak
podstatě židle
tom za chvíli je nemůže když vám řeknu
definujte mi židli tak ne nakreslíte židli
která by obsahovat všechny možné
víte že to
co nejspíš řeknete tak je to něco na čem se dá sedět
a ne není to podle toho jak to vypadá jak je to máte pasťovi to
vyrobený
ale podle toho že strana nic použít
a pak jsem ondřej neff tuhle chvíli
a
kata práci nějakého rozpoznávače který se dívá na fotky je složitá
protože to prostě podle toho slajdu nejde poznat
pokud dyž neviděl nějakou prodloužit ne
a ty zas dobrá věc
když se podíváte
to je na ty malůvky
tak vy dokážete říct
je to sou obličeje
no když vám řeknu že to sou klíče tak aspoň budete souhlasit že to sou
pryč a přitom to se lidského čtyři čáry
a dokonce
podle to
podle toho jak a jaký mají tvar tak možná dokážete říct něco víc o tom
třeba ta vpravo nahoře
jak vypadá že trochu naštvanej a ten dole vypadá že to bude číňan
přitom to sou jenom čtyři čáry
takže
je možný že když si takové automaticky systém
najde ceny důležitý vtom obrázku
není jako to sou ty orientaci očí a pusy
tak tu chvíli
i když na a když tam bude jakákoliv informace tak co bude fungovat
když si najde tom důležité co doopravdy definuje reprezentuje ten obrázek
takže
tohle takovej slajd a zaslání
a tradiční přístup počítačové vidění a spoustě ve spoustě dalších oblastí je takový to
máte ta ten obrázek
s toho bych stahujete nějaké
příznaky co jsou
čísla
která by měla být
podobná pro
podobné objekty takže to židle tak bude mít stejná čísla nehledě na to třeba
jaké nevysvětit se to
a pak je nějaký jednodušší klasifikátor
ktery ušli je teda metoda strojové učení a ten pak říká
tady tahle vektor čísel tyto příznaky to vypadá že by to mohla být židle že
by to moh by člověk
a ta
tom jako tradičně
ty příznakové ty extra který příznaku tak voni by tě brna mluvil
ty navrhuje čím navrhoval člověk
to prostě já tomu říkám tady anglickém slajdu jo držen akademik evolution té dopravy
evoluční algoritmus
kde a stovky pěšky studentů se dějou před počítačem a zkoušijou jít různé typy příznaku
a dívají se jak dobře fungují na jejich problémy
já se teda o taky je to strašná otrava
žere to strašně moc času a hlavně vy vytvořit nějaké příznaky
a
řešíte jak je problém pro ty tvořivé nějaké příznaky a trochu jiný problém
moc nefunguje takže to musíte začíná znova
je to hrozná otrava
no abyste mě představuje
jak toho funguje tak to jsem udělal pro tu bohyni a klasifikátor s těma lok
a s těma back of worlds příznakem
myslím že to představit že a ta fotka ta call fotku může to teda reprezentovat
těma lokálním a část má a já můžu říct třeba že sem tam našel tak
jak plus mínus devět ruku dvě nohy
a
žádný světlo od auta a úplně omylem na tam sice není ale co už
a našlo našla se tam jedno kolo
a tohle může být doma je reprezentace toho obrázku
pak může být jednoduchý lineární klasifikátor což není nic jiného než že
ale včas
je to vidět
není že ne
já to
jak je to vidět trochu nebo
takže bys věděl jsem to je to dobré
když viděl jsem
ja bude simkartu
já to teďka zkusím to jemnější bude pude jednoduše
takže tématu reprezentaci a ten můj klasifikátor takže toho co je navržené člověkem který detektory
těch částí
a to je ten vektor čísel této co se naučí těm určujícím algoritmem a pak
můj klasifikátorům že říkat že
spoustě dozadu
super i to
tak
jsme zachráněni
takže
ten klasifikátor prostě může mít nějakou váhu pro každou tu část
a může fungovat tak že vezme
a protože tady ta bohyně mívá hodně
i když někde najdou se i mají velkou váhu
a nějak indikují že to bude asi ubohý
takže tejden se srazili nula celá sedum
a dohromady dají nějaký šest celých tři jenom jediné tabu mě také míla ale užší
takže definuje jo
tak tady ta váha je menší
a zas dostanu nějaké číslo
a bohyně nevím a
jak sme ne
kola a světla
tak dej mají negativní váhy a za vlády když na tom obrázku bude hodně kola
světel tam pravděpodobně nebude moc
je tak teď výpočty ste hlava násobí dostanu nějaká čísla ty se sečtou
když to je to výsledné číslo je větší než nula tak mu ji a s
klasifikátor může říct na obrázku je bohyně
když ste menší než nula tak to řekne že to není bohyně
tady tahle klasifikátorům může být třeba pokud jste slyšeli vytvořeny pomoci a support vector machine
s nebo klidně jednoduché neuronové sítě
a je tak to jednoduché
tak to jednoduchá je spousta metod počítače a tím
pak
a
co to je hluboké učíme se jste to slyšeli
ale
jakej úžasný pojem skloňuje se všude možně
a za chvilu za to někdo dostane hoblovku
ale není to není to nic úžasného
nějak převrat
úžasné to funguje
takže tomu tradičním systému která tam byla částek srdce příznaku kterou navrhli to je ti
studenti
a ten jednoduchý lineární klasifikátor
v hlubokém určení
se tyhle dvě části dají dohromady
vstupem do učící algoritmu na nás nejsou ty příznaky jako tady
ale ty původní data
a všechna
a všechno to zpracování se nechá na tom učícího autority
on se naučí extrahovat příznaky on se naučí to klasifikovat
samozřejmě tuhle chvíli
ten učí celebrit musím si nějakej složitější větší trvá to dýl a potřebuje víc dát
protože to nemá toho člověka který by tam a chodil nějaký příznaky a využíval svojí
znalost o tom se důležitý na tom obrázku
ale musí se to naučit s těch dat
je to složitější ale zas na druhou stranu vy když
hele vám jedno funguje tak to můžete použít na cokoliv
a
zároveň je
to funguje
takže věta člověk
vím
moc vy moc nevíte co
pro počítače dobré aby je rozpoznávat jestli na obrázku člověk nebo ne
ale ten počet se to nebo ten algoritmus to dokáže naučit sám a
bratra potřebuje víc
to je to jedna definice hlubokého učení
hlubokej čili pak pro tuhle přednášku znamená korun nebo konvoluční neuronové sítě
hluboká a další taková charakteristika těchhle to v hluboké učení tak je že
a
nevytváří ju nějakou grafickou reprezentaci
a světa
ale oni mají
mají třeba detektory v různých částí objektů
prvním nějaké fázi zpracování se naučil že svět se skládá se nám
vlastně chtěl benátek jiříka říkal že
obrázky to je strašně moc velká část je prostě takováhle bílá nic neříkající zeť pak
je nějaká hrana a této zajímavý
takže
ty metody hluboce učení se naučil
to že tam zase se takle vypadá
a první části se třeba naučil nahnal za ty hrany
pak mají další vrstvu zpracování
ve kterém se naučil že ty hrany se dají poskládat do něčeho složitějšího
no třeba do další rána do a
koleček a podobně
a pak zas tohle
se zase vytvoří složitější reprezentace se s detektory složitější věci tom obraze
to znamená už něco co vy dokonce dokážete pojmenovat to vypadá jako plástev
a
tady je tak podobně houšť push to sou je pak na té vysoké úrovni někde
ste neuronové síti jsou to věci které dávají smysl
co s to sem prošel jako ten
pracovat
a ten bude
aha úvod konkrétně do neuronových sítí a zkusím to vzít
tak nějak
a to na vysoké úrovni abstrakce
co to je neuronová síť dejme se sem někde viděli možná se
sem někdy učili a někdo vám oni říkal spoustu zajímavých věcí
pro mě
neuronová síť je to c to je na tom obrázku
a je to a je to nějaká funkce
se tak jak uznáte z matice jak si napíšete na papír
která má nějaké neznámé nějaké parametry které se dají měnit a podle těch parametrů ta
funkce dělá různý věci
a pak se zas takovouhle funkci děláte tady vyplní chcete aby pro nějaký vektor čísel
na vstupu
dala nějakej vektor čísel na výstupu vy máte nějaký požadavky máte nějakou trénovací sadu
kterou řeknete co vlastně ta funkce mám dělat
a pro mě vpodstatě s jakkoliv bude mi to je ta funkce vypadat tak pořád
je to neuronová síť
dává to smysl nějaké dotazy
tohle neuronová síť
určitě velká to přečíst
a
jeden vstup
dva parametry a
a na nějaký místo
a datové asi nejjednodušší neuronová síť strom ukažte myslet samozřejmě
ty reálné neuronové sítě sou dvě krát větší miliónkrát když to pořád je to se
sami je taková jednoduchá funkce kdybyste chtěli můžete si napsat jako rovnici na papír a
krát ten papír bude ouvej
samozřejmě když a definuje to neuronovou síť eště musim
definovat
co s co se má naučit a jak se to má naučit
když i madam
a takovéhle data set
také k
co s nima udělat
jak má změnit svoje parametry aby a doopravdy dělat to co mám
tak proto
proto resistor pak řeší rovnice
to je tady tahle třeba
a to je celá rovnice které která definuje
jak se má neuronová se naučit nic jiného tam není
emisemi podíváme
ega říká že má
matematika není potřeba ten tak aby to vypadalo zajímavě
a říká že
a něco minimalizovat hledat nějaké minimum
může měnit a ne
při hledání tom dva a to sou ty parametry té sítě
pak tady je suma
ta suma je přes
datasets té přes ty malé obrázku
a pak
na každém to na každé té dvojici to prásklo to co mám jít
a se podívala
na si spočítá tu vlastně tu funkci
podívá se jaký je rozdíl
mezi výstupem té neuronové sítě a tím co má být
proč tady je na druhou
takže ten rozdíl zápornej nebo kladnej
to na druhou ženský bude kladné
liga že
a se hledá minimum
pak všechny tady ty rozdíly tahle tady ta optimalizace se snaží co nejvíc menší
jsem to můžete podívat tuhle chvíli
takže třeba tady dělám a
regresi snažím se naučit
a funkci která by mi říká když budu vědět
kolik má člověk a podkožního tuku
a bude skákat svazu metrovej výšky tak jaká je pravděpodobnost že si zlomí nohu
a tady
jak mám nějaké lidi které se teda sněhu metrů shodil
to normálně děláme tady
hlavně se studenta
a
já můžu
a ty samozřejmě já nevím jak oni spolu souvisí
ale když se řeknu že můj model tady tenhle závislosti
bude to je ta jednoduchá lineární funkce
já můžu leda ty parametry a té
a
vydávají teda smějete čáry tady
tady ta minimalizace jenom říká to že tady ty
vzdálenosti
těch bodů co sem naměřil
o té mojí přímky musel být co nejmenší
teď se a to je cele
strojové učení a aspoň
select relevantní pro tohle přednášku
no minimalizace nějakých i na nějaké trénovací sadě
nějaké je jednoduché funkce nebo složitější
samozřejmě
samozřejmě to co já jsem říkala se tak hezký
a
krásně to funguje
a na to
samozřejmě své problém
tohle sem si včera matlabu měl pár pěkných grafiku
že jsem si můžete říct že ty body to sou a ty lidi co sem
shodil
a s těch dvou metrů
a snažím se najít tu závislost mezi vy jako jejich a ty činností a
to pravděpodobnosti zlomení nohy
otázka je
vy vidíte že
tam je nějaká závislost jako to někam vede
a jaká ta závislost je
a ta tom prvním obrázku
qt ta jarní
to sem proložil ty body
se to lina funkcí
ona jako sedí ale jako ne úplně dobře
pak ta závislost může být
a kvadratická to už má dost parametrů tam budou je složitější a lépe sedí těm
datům
alfa už to vypadá to jako dobře já může jít dál můžete model udělat ještě
složitější
tady tohle může
polynom čtvrtého řádu jednak prostě zas ta křivka víc prochází těma horama
tajit můžu ještě tu ten model ze složit edit ze složitě data i když se
podíváte push fakt těsně obíhá kolem těch bodů
ale když se podíváte tady někam
pryč mimo ty byly když vidíte že to někam úplně ulítaná a můžete se začít
dřít takže technice divný a
ten model může ještě se složitě to takže model kterej
doopravdy dat
dokonale prochází těma horama které
která si naměřil
a řekne si že tady ti ležet
tady asi mezi těmahle dvěma podává
kdy ta křivka takhle nahoru lízt já to je taky ne
nemáte pravdu
ale proč by nahoru list neměl
a to je ten důvod podstatě takové že vy předpokládáte že když
a to jsou ty dva body vedle sebe a tady to dáte nějak
pro změnu země pokračuje
takže ten průběh mezi těma bylo mám bude nějaký takový hladký nebude moc složité
a vy předpokládáte že
tohle bot a trhu nebo
má něco společnýho
že by kdy se mezi něma
tak se může se můžete dívat podstatě na tom c praotce vlevo
a ty hodnoty který jste neviděli uprostřed tak ty s těma co sou kolem budou
mi něco společně
to je váš předpoklad
stejný předpoklady je vtip metodách to vyloučení
cz což znamená
že
když máte nějakou
nějak trénovací data
něco na čem určite pro se to říká tomu klasifikátoru co existuje ve světě
tak když
ho na tom na ty na ty naučíte a pak ho dáte něco podobnýho
a to bude dostatečně podobný teda nejspíš bude fungovat
ale když mu dáte
když se modeluje proč strašně složitej typ dat málo a
to znamená ty podobný věci se tam najdou
tak najednou tam začnou fungovat takovýhle věci
což teda můžete se zjednoduší ten model větší problém je
že kdy když vy tady budete mít data tady máte no tady a budete se
pak
to klasifikátoru ptát
co člověk kterej tady
proto je ta pravděpodobnost jaká tom že máte žádný data ten
trénovací se tě nebylo nic podobnýho
tak tu chvíli
dostanete nesmysl
aby ten
prostě ty metody který na mluvím fungují krásně
a ale
přestalo fungovat ve chvíli
dyž a
jim po nich budete chtít něco co ste jim nedali šanci se naučit
ne si nedokážu míšo
takže ve výsledku jedinec se dělají tak
a
dělejte inteligentně
a jediné co dělaj
takže
pokud jsem viděl něco podobného
pak dám podobnou odpověď
se teda ještě trochu naučí jak ty podobnosti poznat
ale když prostě budete dávat někomu a něčemu jenom tři tak se nerozhodne naučí rozpoznávat
kočky
praha neuronové sítě
neuronových sítí existuje spousta
ty funkce který já sem tady definoval kterých pořád mluvím takový ve skutečnosti mají název
dopředné neuronové sítě lan maji nějak i vstup
ta informace nich
pokračuje dopředu a pak si na konci něco vyleze
ne to takhle
dopředu jedním směrem
existuje jo tak pro pořádek říkám že kdy stejný neuronový sítě
já vím stejně budu mluvit a pro mě jsou neuronové sítě teďka tohle
výhoda
co jsem se to nakous o těle neuronových sítí je máte pak
jeden nástroje můžete s ním řešit spoustu problémů můžete si říkat klidně a vás
jaká je pravděpodobnost že si ten člověk zlomí nohy nohu můžete
poté neuronové síti chtít
řekni mi chce na tomhle obrázku za typ objektu jestli to člověk
a pes a auto nebo něco jinýho
a tato výstup v jedné chvíli jsou kategorie objektů druhejch
a to je to tom prvním příkladu sou to a ty pravděpodobnosti můžou klidně lispem
být pozice
může být výstupem tech
na všechno tohle jsou ale existuje neuronové sítě
a my vevnitř fungují stejně
existuje jsou na ně stejné algoritmy na to učení stejné nástroje
a ta
všechno je stejný akorát
smějte malou věc co že to co říká se mají naučit
ale se to naučí
takže strašně univerzální nástroj
hluboké sítě
většinou mívají těch vrstev víc
se máte nějaké vstupem má několik skrytých vrstev a pak na konci z nich něco
vyjde
a
pokuď zase ste někde ve škole neuronové sítě měli tak nejspíš byly zakreslený tak jak
jsou tady
se znamená že tady je nějaký neuronů na se podívá na to
co mají jaké hodnoty mají ty verony před ním
je co spočítá dá to tam
to tohle je sice hezké ale když ten neuronové sítě mají pak
a milión a milion euro miliardu neuronů tak by se to těžko takhle bude kreslit
ovšem to takhle
s těma jednou vrstvu druhou prstu třetím dost tu čtvrtou vrstvu
mezitím nějaký spojení
a já to nejradši kreslím špaget no takhle plus jenom ty vrstvy já kreslím jak
jsou na sebe napojení
tohle způsob jak doporučilo neuronových sítí přemýšlet
a to je hlavně ta jo těch dopředu
co to prostě vrstvy které je
něco počítají
já jen ne jak jednoduchý výpočet packou s tou dat
vy máte ten obrázek na vstup pak se něco udělal dostanete třeba že čísel pak
se sem a něco udělá dostanete něco dalšího
no nepřemýšlejte o těch jednotlivých neurony
ale v těch operacích nějakých vrstva
a ve skutečnosti
pak mám slajd
kdepak i když tady tahle reprezentace vpodstatě odpovídá tomu registr to
programovali nějakým programovacím jazyku
tak co s neurony
neurony jsou
a tyhle jednoduché funkce
je to ta jsou nějaké váhy a neděláte neuronů nedělá nic jo ne že vezme
váhu vynásobí se no tak s tou
a přičte další stopy na vynásobeny v aha
a ještě pouze tam nějaká aktivační funkce
která není lineární
a
jenom
na mění a hodnotu to neuronů svátek má nakreslenou jednu aktivační funkci které se říká
rectify byly miliony
seš zní strašně vznešeně ale není to nic jiného než že se vezme
maximum
a t hodnoty a nuly to znamená když ten neurons počítá něco co je menší
než nula
výsledkem je nula
takže vysočina je sice větší než voláte výsledkem je to co spočítat
tohle jsou neurony které se použili těch hlubokých konvoluční sítí do kterých já tady celou
dobu mluvím
není to nic jiného tohle přesně ten výpočet to neuronů
tady akorát těch vrstvách takovýhle neuronů je teda spousta
a ta síť kdyby se to provalí nějakém programovacím jazyce
vy ste to dělali sami tak doporučuju třeba a python na s nějakou knihovnou jako
nám pane která dokáže nás matice rádi na zimní maticí a vynásobit s vektorem
pak ta rovnice takovéhle neuronové sítě
a nebo ten kotel neuronové sítě by vtom a tom slajdu vypadalo tak je to
tady mám zapsaný
a bylo by to topili byl do dopravy tahle
neuronová síť by
tom programu byla
kteří tři řádky
na jednom řádku by bylo spočítej tu první vrtají tuhle vrstvu cože
matice pán
té vrstvy krát vstupy
a pak udělají maximum s tou nulou
a tady ta operace by se tam opakovalo několikrát
a protože těch vrstev je víc pane vždycky stejná krát prostě má jinou maticí tak
a počítá s těma aktivacím a předtím
a tohle by byl doopravdy
program tady nebo té program kterého jsem si párkrát napsal
a to je to co počítá neuronovou síť
důležité je že tady tyhle věci se musí počítat rychle
se znamená že musíte použít nějakou knihovnu vona ti
něco
třeba kde už někdo zoptimalizovat to matci násobení
a když třeba pro teploučko nebo pro grafickou kartu procento ručkoval tak vidím že teda
matlabu nebo a céčkovou se plus pomocí tmě tak nějak implementace knihovny vás co že
prostě lineární algebra násobení matic
pro grafiku pro grafické karty můžete použít pod podle vás
knihovnu
máte tam sobě má tyhle operace ten program pak vypadá takhle jednoduše
a zároveň je extrémně rychlý
tady a tyhle operace mají výhodu takovou že sou
je na tom hardvéru a dyž na těch grafických kartách nebo nácek loučkách
a který se dneska vyrábí podstatě využití využít veškerých výpočetní výkon a když to budu
počítat do grafické kartě
a tak mě to pojede a efektivně třeba jeden a půl upoutal která fotku
otřeš je skoro to co tak ať to dokáže zvládnout spočítat
a spousta matiky
chcete na chvilu pauzu nebo
jak to vidíte já bych teďka mohl dat
tím otou pauzu
nebo ne
tak kdo chcete pauzu
jeden mi někdo další nenech to samotný no jestli chcete pouze
to tam teďka nebude trenérka strašná vatikán bych před tím se udělat pouze ten
toho
jenom malička
tak jedem dál
já pak budete mydlit čase na oběd na
tak
jak jsem řekl že víte jak vypadá neuronová síť už víte
se definuje to co se má učit že to sou prostě nějaký rovnice
a teďka jak to učit
ano tohle jsem si chtěl udělat krásné grafy které by to ilustroval i jednoduché
bohužel jsem
a optu druhé
se rozhodl že pudu spát
tak a takže tady budou je jenom rovnice budu toho trochu povídat
ten problém to učení je teda minimalizace ňáké funkce
která říká a jakou jak velkou chybu má ta neuronová síť na nějaké trénovací sadě
a když vy chcete najít minimum nějaké funkce
úplně obecné jakékoliv funkce
nejspíš se tam vydali na střední škole
tak pokud zas po mi na té tak
vás učili že můžete vzít derivaci té funkce
a
nebo krát neboj gradient
a když pudete protisměru já to tenkrát jen vám říká ve kterém serveru ta funkce
roste
aby když pudete opačném směru
tak ta funkce klesá to znamená že když pudete dostatečně dlouho tak dojde ten kdo
minima a natrénovali strašnýho rovnou síť
tomto lese přesně dělá krát a srdce znamená že učení neuronových sítí je
o trošku středoškolské matiky
derivace
a pak nějaká velmi jednoduchá optimalizace
tak když kam jednoduchá optimalizace tak pokud jste slyšeli někdy nějakou tu metodu
tak touž je složitá metoda naučí neuronových sítí používaj se jednodušší
používej se ve skutečnosti ty nejjednodušší možné
a té protože ty neuronový sítě jsou velký a cokoliv složitějšího
nejde počítat
takže
to když je když řeknu že se spočítají derivace když na ty možná když vám
napíšu
se jako by se vás zeptám spočítejte mi derivaci z this na třetí tak vy
řeknete že to a jako když budete derivovat podle to x takže to je kolik
televize skoro udělal blbce teďka
šest x na druhou že
to zvládnete té strašně jednoduchá funkce takže nějaká složitější funkce vás máte střední škole nám
asi učili že a de použít takzvané čin já nevím jak je to v češtině
na střední škole se dal pozor ale něco zapomněla jak se ty věci mnou také
či prostě
můžete když máte
a nějakou funkci která se skládá ze potom
mladej třeba bude a
druhá mocnina stínový nebo něco takového takže nejdřív můžete
je to můžete rozložit
lidi si spočítat
třeba tady tahá to je ta druhá mocnina ten si můžete spočítat derivaci té druhé
mocniny
oproti tomu co je vevnitř
a pak si můžete spočítat derivaci telce vevnitř
oproti
tomu co zas vevnitř toho dědečka
a dopravy tak je to tady napsaný
tak já tak se to tak se to dělá tak to dopravy napíšu to znamená
a
tak byla dopravy derivace té druhé mocniny tak jak já jsem tady řekl derivaci a
dvou x na třetí a teď by bylo třeba tady dvacet toho synu
akorát bych se to vynásob o
takovádle složit složená funkce je neuronová síť ta dopředná
vy máte vrstvu když se podíváte na výstup který máte ty vrstvy ta
a každá ta husa používat to co spočítalo nastat předtím
to znamená
jsem to můžete podívat takže ta funkce
která je aplikována ta poslední vrstva je funkce které aplikovaná na funkci té vrstvy předtím
to zas na funkci té vrstvy předtím a takhle to jako máte doška poskládaný do
sebe
na doopravdy když použijete tu to rčení modul kterej se naučil na střední škole
pak dostanete gradienty té neuronové sítě
a z cílem se takže říkám gradienty tak je
tak vy chcete gradiente těch parametrů ten neuronové sítě těch horách
tak tady je celý algoritmus tady toho jak to udělat ve skutečnosti
když máte nějakou nervovou síť tak ty grády rámci těch neuronových sítí aplikaci toho čin
root se říká error backpropagation ale je to název pro to samé
spočítání těch derivaci mach vůči nějaké chybové funkci
a prakticky když nepočítáte tak
a to znamená jenom to že vezmete
vstupní data
spočítáte co počítá první vrstva druhá vrstva třetího stačilo ta vrstva má ta vrstva
spočítáte chyby
a teďka ty chyby které na konci nejdou
tak
propaguje té zpátky
a ta propagace zpátky je podstatě stejná jako ten postup dopředu jo jak to je
chtěl jsem vám ukazoval že při tom dopředu průchodu se vezme tu takže vynásobit nějakou
maticí pak se to vynásobit zas nějakou maticí a zas nějakou maticí
jak jsem zpětný průchod je to samý akorát to násobit transponovaným a matice
no výpočetně to samý
abych vyliž máte tady ty dva průchody
tak tyhle tak sis pokud si zapamatujete ty dopředný hodnoty ty aktivace zpětný
aktivace kterým se v tuto chvíli řídit tuto chvíli říká a derivace těch neuronů
jakpak to jistě levou čísel myslím že to spočítat tak gradient těch horách
a to spočítat ten a přesto vynásobím co
takže cele učení neuronových sítí je podstatě jenom sčítání a násobení
tuhle chvíli
tímto nedostanete gramme gradienty a trvám říkají kterým směrem roste chyba
když ty
grady říci který vlak budete moct vach odečítat
tak budete muset chybu snižovat
a kde tak minimum
a tam skončíte
to sem teďka popsal toto je nás zas ty gradienty sem
ten gradienty sem kradete jasný kdy sem té se s tou takže dete dolů nějaké
ty chybové funkci
a to co doopravdy děláte které nějaký které čítejte radši algoritmus který vezme
část datové sady
třeba když budu mít byl obrázků tak si vezmeme sto obrázku s toho
histograms pro ženy sítí
že neska hádky
spočítá si
s tohodle
ty gradienty září
a ty gradienty odečte otto co má
jak ta si vypadá to
a toto jedna iterace a pak to udělá zase a zase a zase to třeba
dělat dva dny a na konci je sto vyleze krásně na trénovaná neuronová síť
a chcete se na něco zeptat víc
předpokládám že místo učení neuronových sítí nechcete slyšet na to stačí dělat kdybyste chtěli vědět
něco dalšího
klidně se můžete přít zeptat na jí to napsat mail
tento problém
ale jako hezky
obrázek zase
proč to nemusí fungovat
a to se sem tady na trest matce nenakreslil já sem stát kde
přiznám se
a
tak jsem že to představit že máte neuronovou síť která má dva parametry
tohle jeden tohle druhej
tom prostoru těch parametrů ten borec říkala jaká chyba ta neuronová síť bude mít dyž
a nastaví teda ne a paní té sítě tady prostě v tomhle bodě bude mít
takovouhle chybu tomhle bodě budem ta koule chův tomhle bodě budete kouli ta neuronová síť
i když někde začnete tak ten se kastli gradienty se prostě de
takhle
směrem dolů který ne jako co nejrychleji to vede k nejmenší
zamřeme se může stát že vy začnete tadydle kde dotaz tady do tohodle a vy
začnete o kousíček vedle
takže jdete do uplně jinýho minima
tomu se říká se to může zaseknout to učení nějakém lokálním minimu
a vy nikdy to globální nenajdete praxe prakticky to nejde
ale dobrá zpráva
u velkých neuronových sítí
všechny tady ty lokální minima tam můžete dojít jsou vpodstatě stejně dobrý ne úplně jedna
tam najdete
tak
teď začínaj ty zajímavý věci asi tři slajdy na konvoluční sítě jak fungují
když víte co to je neuronová síť
a to těm prostě takže jednoduše
co to sou konvoluční sítě
a jako
konvoluční sítě
proče používat
tak důvod je ten že se hodí na obrázky
nebo se hodí na zvuk
prostě se hodí na něco co má strukturu se i daný signál třeba olej jiným
věcem máte nějakou strukturu
a normální neuronový sítě tak já se malých teďka mobil
tak jak jsem říkal vstupem je vektor nějakých čísel vagóny
nepředpokládají že ten vektor čísel baráku strukturu je ten by ty čísla vtom vektoru můžete
přeházet
a to ta neuronová síť vám bude fungovat úplně stejně co můžeme to musíte přeházet
konzistentně nemůže toto pro každej obrázek třeba přeházet jinak
ale prostě tomu jedno je v jakým pořadí
dáte ty data na s
těch konvolučních síti
a nyní využívají toho že existuje obrázek
a ten obrázek
jste víte že některé pixly jsou vedle sebe některé sou tahala vedle s můžou být
horizontálně vertikálně
a prostě pak to takže to všichni víme a není důvod aby to tam neuronová
síť na to musela přijít sama že pixly jsou vedle sebe
tak
a
trochu do historie
yum o tom že
tady nemluvím o ničem nějak extrémně novin
tak vězte že
první rozumné konvoluční sítě push jsou z roku devatenácet osumdesát
a
japonský zkumní fuk ušima
poprvé navrhl něco co vypadalo jako konvoluční síť učila se to jinak než dnešní konvoluční
sítě
ale ušlo fungovalo prostě měl nějakou nervovou síť která dokázala
ten co s tím dělal
a možná že rozpoznávač čísla jsou systémy
rozhodně to fungovalo
ty současný koaliční sítě s
mají mnoho věcí společně
tak když se podíváte do devadesátých let
tak tam už doopravdy najdete
konvoluční sítě které
fungují a učí se téměř identický s tím a s
svátek budu povídat a povídám
a například já molekul ne
a
ten
těch devadesátých letech propagoval komerční sítě
já jsem tenkrát nevěřil že to může fungovat
ukázalo se že ano
a střebání udělali tak push nějakých devadesát český mu dali strašně dobrý rozpoznávač počet celých
čísel tenkrát udělali asi ještě s částečně wifi týden
a ještě devadesátých letech jako ty komouši si těch trvání vyvinuli pakr rozpoznávali jsem a
části našetřit
a se v americe se používaj šeky
tak já to se tam check načmáral tak ono to jako na to pustit i
komerční sítě
a nestačím se na to někdo díval tak někomu platil podle to nějaký peníze
ad
to když to nepoužít takhle tak to asi fungovala
tak pak dlouho nic a nebo je tam někteří lidi se něco snažili na skončila
síťová použité dělat
ale ve skutečnosti ta situace byla taková
že když někdo napsal článek o krůčcích
sítích
tak ho to nejspíš a nikde nevzali a nás to depresi a
já žádné časopis ta nechtěl
a tak
ale
velká změna roce dva tisíce dvanáct
krize s kým to na pár dalších
porazili všechny možné jiné právě takové ty klasické systém na kterých a založeny na těch
back of world
kterých já jsem vám vysvětlovali fungujou
a jedné velké soutěži
ta soutěž se jmenuje a míč net
a classification čele nič
což víš nedej data set
a tak asi cache na čele nič znamená že každý rok
prostě výzkumníci se snaží vyřešit problém nemají
přes milion obrázků
ty obrázky můžou patří do jedné s tisíce tříd které odpovídají objektům které na tom
obrázku jsou
a cílem je prostě udělat co nejlepší rozpoznávač
co je na obrázku
tady na to na tom této datové sem
vtom roce dva tisíce dvanáct projekty z esky a další
dosáhli asi dvakrát lepších výsledků než cokoliv co na to na téhle poloze se
a podařilo před tím
ad to bylo takový velkých kromě toho se naráz
chytlo spousta lidí
zjistili že ty konečně sítě prakticky do na něco použít
a fungují velmi dobře v některých situacích
začali používat na všechno možný
a zejtra mezi tím
proto roku dva tisíce třináct
konvoluční sítě se začaly používat na všechno možné
a velké firmy začaly nabírat lidi trest pár vteřin rozumí konvoluční s tím vytvořili si
týmy a vůbec být má jen ta face book má a svoje oddělení kteří fakt
nedělají cílem je že tedy komerční síť
proč
proč vlastně ty konvoluční sítě začaly fungovat
tak jeden s těch důvodů je že
když to zjednoduším
a s jakou s tím to že ty sítě vypadají trochu jinak než vypadaly dřív
tak velky velká část
proč se používají teď víc
je že máme rychlejš počítače
ano
to je teď
jako
ne s
vy si můžete sice
na svým domácím počítači a zadem natrénovat síť
takže se dá říct že toto výpočty měl výkon není potřeba šla dvacet tohle před
deseti lety byste měli a jednu místnost superpočítače tak se za mohli spočítat taky
to nebyl problém
akorát s ono to většinou funguje tak že toto spočítáte pětkrát až teprv po šesté
to funguje
tak když musíte ten superpočítač prostě využívat a
nepřetržitě půl roku ani každýho tam nepustíte vás tam a někdo vykopne
a když to můžete udělat na jednom počítači doma na grafické kartě kterou koupíte za
deset tisíc
tak naráz i s tím že teherán ono to eventuálně začne fungovat
ad to tohle jeden důvod proč jako to úspěchu
se teď se tram počítat
můžete si tou počítá se můžete dělat spousta experimentu
jako jednotlivec nepotřebujete k tomu milióny dolarů
a
proto to funguje
a máme teda velký datasety a podobně
takže konvoluční neuronové sítě
to všechno co sem říkal neteď platí pro ně
a pár takových rozdílů docela dost často bývají hluboké to hluboké znamená že mají klidně
vrstev
holek jak já jsem tam měl jako neuronovou síť tram na tři vrstvy tak není
vyjímkou že ty a končí si těch počítačem vidění mají dvacet třicet vrstev za sebou
jak jsem říkal tak ale
a předpokládaj nějakou strukturu těch datech
že to obraz je obrázek
má je sou hodnoty na ty negry du
a pak ty
ty výpočetní vrstvy
trestu lezli jsou konvolučním tak voni
tu strukturu toho obrázku reprezentují
a co znamená že třeba já když nemám kus to áčka
tak tady ten neuron ste další vrstvě
on se dívá jen tak na to lokální kus to ať on se nebude snažit
spojovat
tenhle pixl tady s tímhle jsou moc daleko od sebe to vubec nemá smysl se
na ně dívat jak spolu souvisí se
na to bych potřeboval moc dát nemá to smysl
a zároveň celé celý dělají
tak je že
to je ten
neuronů jenomže sedí válka
ale ten samej neurony je
zpracovávat celej ten obrázek jo ten samej norem je zkopírovat nejsem a dívá se tady
na tenhle kousek na tohle kousek na tamhle kousek
a takže to tam je
několik druhů neuronů to je konvoluční síti
kde každej ten uran se dívá určitým způsobem zpracovává kousek obrázku
zpracovala a zpracovat tak zpracovat zpracuje tak celej ten obraz
a to tomu se říká ty tomu druhu zpracování se říká konvoluce
těch koaličních sítí
místo maticová
jsou konvoluční nad
a pokud jste někdy vám někdo ve škole říkal ste konvoluce
tohle sou ty samý konvoluce
tak co umí konvoluce
viděl bráška řekl ale
neuškodí stvořit znovu
možná jste viděli něco takového tady mám vizualizaci nějakých funkčních jader
je to konvoluční jádra
a když se podíváte teda ne to něco bílýho černýho vedle sebe
se což znamená že umí detekovat hrany
a detekovat hrany určitého směru
takže pak pustíte
a na nějaké třeba obrázek kočky
nějakej ten filtr s ty vole dokáže back detekovat procent
smysly
a na tom obrázku to není úplně jde vidět
ale svatej takhle detektor by detekovat
horizontální hraný ty meta třesu tady
nějaký vertikální hrany jsou tady
představte si to tam
a to tohle se normálně počítačem vidění dělala
a většinou tady tyhle filtry na někdo navrhl ručně
prostě konvolučních sítích takovéhle filtry se trénují na datech automaticky
a zároveň
zároveň je a
to takhle vypadají třeba té první prostě a pak jsou na další vrstvy a pak
sou filtry které sou aplikovali
a takovýhle obrázky
o víš neviděl ten obrázek je už neviděl
myslet nějaké filtrace
a
to je třeba jsou krásně jakých filtru
tady jenom tak abys
líbilo jasně co ta
a
konvoluční rozsahu nějaké neuronové síti počítá
ekonoma teda nějaký jádro který nenatrénovaný a to sou prostě hodnoty nula celá jedna nula
celá dva
a mínus nula celá tři
a testování pochválí tak neuronové sítě
co se dělá tak se vezme pixl toho jádra tak se vynásobí
s pixlama obrázku
takhle se to udělá pro celé jakéhokoli pro celé to jádro
a všechny ty
takhle vynásobeny hodnoty se sečtou a dej se do jednoho pixlu na výstupu
ta konvoluce
to je tam operace
se pak dělá
nejenom na jednom místě ale dá se na celý obrázku
ta sama
ad těch neuronů končí neuronových doslech pak takovýhle konvoluci je
no
a to tady mám jako ukázku actor
jak může vypadat ilustrace takové komerční sítě
to je na vstupu máte obrázek který má nějaký rozměr a tři kanály on je
barevné jo máte mám modrou zónou červenou
řešit co je znamená že i ty jádra
nejsou kupé tak jak jsem ukázal jsou barevný a on má třeba když budu mít
jádro třikrát pixly tak tuhle chvíli bude mít a tři barvy
ho se to spočítat dohromady na těch třeba do
a který s
a tady ty další vrstvy těch koaličních sítích
těch ti
těch kanálů těch konvoluci mají mnoho
no svaté jste síti té první vrstvě je čtyři taji čtyřicetosm druhu neuronů čtyřicet osum
různých kontrolu
každá třeba extrahuj
a
jindy jiných radisto obrázku který jdou jiný směr je tedy vztahu třeba barvu jaká tam
na tomhle místě a podobně
a každá ta konvoluce bitva pixl nějakou jinou informaci
co je pak máte obrázek dave každým kanálů máte nějaký druh takovéhle informace
pak když jsou další vrstvy
takže ty
konvoluční filtru jsou velký
špatně ono vždycky zpracovávaj všechny ty kanály té vrstvy předtím naráz
a to znamená že tady tyhle filtry
té dalším roste už třeba maji rozměr pět krát pět
ale sou přes všechny ty kanály té vrstvy předtím při všech těch čtyřicetosm kanál
a zas pak
takže ušlo zpracovali víc
a
mají
kódují vpodstatě složitější informaci
tak těch kanálů těch hlubších vrstvách té sítě bývá nic
a tady na začátku třeba jsou hrany tech těch
směru hran až tak tolik není
ale když přijdete dál jste sítí
tak
tam jsou reprezentace
třeba konkrétních typu objektu s třeba a
ok a nosu
první adept takových objektů že jsou tisíce
to znamená že těch kanálů těch různých konvoluci tam musí být mnoho prostě se nám
mohli naučit detekovat všechny ty různé věci které tom obraze můžou být
už máte na úrovni abstrakce
to jsi z biologie resistor jako je nějaká taková jako
teoretická otázka
existuje
a mozku někde neurony ktery tomu se říká grant na program modern neurony
stě neuron který by reprezentoval vaší babičku
a
co se týče mozku tak je
taková jako obecně přijímaná teorie že nám funguje podobně jako tady ty neuronové sítě
a to vtom smyslu jak kdyby když něco vnímáte
tak dopravy na začátku
sou
podobné jednoduché filtrech co tady které detekuji hrany
to doopravdy na sítnici
pak jsou a
se celej ten vizuální proces
funguje
dopředně to znamená že tam je třeba to detekce hrana pak je to doopravdy další
vrstva která už těch hran skládá něco složitějšího pak další vrstva další vrstva další vrstva
to se celkem ví a dopravy to odpovídá tomu jak tady ty neuronový sítě fungujou
a
co se nevím jak to je co se děje dál
co se děje už na takové úrovni kde čili přemýšleli o abstraktních věcech typu auto
můj pes babička
sou o mozku
a neurony které se aktivovaly když vidíte vaší babičku
pravděpodobně a na jako ukazuje se jaksi ano se na ukazuje se to samé ten
těch konvoluční sítí tam dopraví když něco trénujete
tak můžete někde najít neuron
kterej odpovídá automobil
a jí se to třeba na detekci automobilu neučil
tak
další věc která těch
kdyby jste někdy něco s tlakovou činnosti a začli dělat tak kromě konvoluci
tam budou ještě půlím vrstvy
což
přes na cizí podstatě otto že vy když
bude to zpracovávat nějaký obrázek
si představte že tam máte nějaký ty hrany i když se díváte na ty hrany
tak je celkem důležitý kde ta hra ne
se tahle
vlevo v obrázku pro obrázku to je docela rozdíl
ten tam potřebujete
velké rozlišení musíte vědět kde ty věci sou
ne ve chvíli když pudete
na ty abstraktní věci už budete zachycovat je tam třeba to auto nebo je tam
člověk takže vám jedné na kterým pixl přesně touto je
důležitý je třeba jestli ten člověk stojí vedle auto vedle auto nebo je přetypován autem
ale co když tam
přesná pozice není důležitá
co se dá v těch očích sítích tak tam postupně když se de hloubi ještě
vrstva jak tam se zmenšil rozlišení toho obrázku
a to zmenšování rozlišení jsem se dá pro právě pomocí půlím vrstvy to fakt není
nic jinýho než že zmenšit to zmenšit
velmi často se používá
tak zajímat půlení
se znamená že
tom obrázku z nějakého lokálního okolí se vezme maximální hodnota
a to se dá na výstup
a ten výstup se zároveň s menší
a ve velmi jednoduchá operace
se berou maximální hodnoty
úkoly a vy když použijete a nevím vím na zmenšený obrázku tak je to skoro
to samé
tak ta parcela je celá nějaká neuronová síť
může vypadat například takové
to je konkrétně tasí z roku dva tisíce dvanáct ty zemské další kteří vyhráli ten
míč net
a ste všechno odstartovali
se podíváte tak tady teda
jako revoluční vrstva matku link tak
je to menší jo to je snadněji padesát krát padesát pět krát padesát pět pixlů
takže půlka dvacet sedum k dvacet sedum
zas zase to zmenší témat spojených že ten obrázek reprezentované no jako třináct krát třináct
jaksi láska třináct tady projde pardon slova další matku linka pak tady jsou vrstvy které
se dívali na celý ten obrázek dohromady
sou
ale zamřeme to vždycky lžíce děláte
třeba tady tohle mám vstupní obrázky který sou rozlišení deset padesát pět krát deset padesát
pět
můžete mi menší pak to bude vypadat jinak
a základní ty pravidla jsou
používat poměrně malé končíme si na pak teda pane ty vektory ukážu
na používat
menší těmi sem ty jádra menší
a
na začátku mi těch a
kanál ní po přijdete hlouběji té síti
těch různých konvoluci těch kanálů krůčcích tam mít víc
a postupně prostě zmenšovat ten obrázek
tohle plochy třeba rozpoznávat jak se na tom obrázku je tak takhle to prostě uděláte
vždycky
ta situace ve skutečnosti jednodušší a já to pak ještě řeknu
když byste sami něco dělali
tak
si nejspíš nebude ten navrhovat tu neuronovou síť
nejlepší cenu
tak je stáhnul si nervously kterou šla trvá někdo přetrvává
já vám ukážu odkud se můžete stáhnout
to si
najít a hledej stáhnout z internetu
a funguje tak dobře jak prostě funguje
a vy to si můžete vzít
a adaptovat ji na váš problém
ad pak to bude dobře fungovat
a v tu chvíli nemusíte řešit
jak tu si tam prostě vezmete tak jak byla
a to je nejčastější postup je s největší šancí že
má to bude fungovat
já to jak tohle poměrně malá si tam má nějakých dva čtyři šest osum devět
vrstev
to je pro těla
tak jaké jsou výhody
a
pak praktické pokud by se ve koule
si čtyři používat wav dopravy a nebudete chtít udělat rozpoznávači jestli je hudba je jedla
nebo jedovatá pro mobilní telefony
aby se vám co nejvíc zákazník otrávil
tak jako výhoda je že
i když si koupíte počítače do kterého strčíte
nějaký dělník je perlička
tak pro dokážete přes na tom jednom počítači třeba zpracovat víc než sto fotek za
vteřinu
dá prostě
na síti takové jako kterých je kterou se tady ukazoval
obrázek
a zeptat se na ten výstup to můžete udělat stokrát za vteřinu na nějakým ke
perlička že budete mít co je poučka tak třeba desetkrát za vteřinu a pořád je
to relativně rychle
problém je
že když se budete snažit vytvořit svůj vlastní c tak by se tomu
je trochu rozumět
protože ve chvíli když vám to gentleman vám to nebude fungovat
a vy nebudete vědět jak to vevnitř funguje sám velmi těžce bude zjišťovat proč to
nefunguje
ale můžete se třicet aby jste chtěli
a druhé druhý problém může být
že
vytvoření testy může trvat
vy pokuď
pokud by se trénovali takový velký sítě jak ten kazil
úplně od začátku tak
tak klidně trvá na měsíc
a na ten na nějaký aha je dvě poučku
ve chvíli ale
jakmile ale když je teda začnete s nějakou sítí která už existuje
tok peněz zvládnete za hodinu
takže to ten problém s tím
že se to dlouho trénuje není až takovej hroznej že by se můžete použít už
existujících
a je na to
a
základ je
pokud nechcete čekat moc dlouho koupit si grafickou kartu
protože přece jenom ne když máte nějaké chcete učil takovýto který koupíte do deseti tisíc
tak jako maximální výkon má nějakej
kolik můžeme ject na dvě stě mega flow pust čtyři sta mega fotku něco takovýho
a taky hafo původu
když si když si koupíte nějakou devět set osumdesát a nikdy tak ta zvládne a
tak to je prostě a desetkrát rychlejší a ta tam a teoreticky něko někde kolem
votrav
ve při trénování tady tyhle síti
vy dokážete ty grafický karty využít úplně naplno
stejně tak jako týce počkat
na prostě když máte dvacet tisíc tak je lepší si koupit grafickou kartu než dct
loučka
tak
nemusíte si nic programovat
ale můžete si stáhnout nějaký
natočený přes ten se open source a podobně ale něco co stáhnete a můžete koho
tam můžete se si dělat se chcete
push existující který je dobře odladěný rychlý
flexibilní
a když se to přeložit a tak můžete rovno vítr ano
těch nástroje nikoli
já například používám velmi často kafe
cože asi největší nástroje a nejvíc používaný
a vtom doopravdy je nemusíte skoro nic udělat
jestli no vytvoříte
data set čeho ty data někde musíte sehnat
napíšete si nějakej konfigurační soubor a pustíte binární binárku tady s těma konfigurační soubory vás
datasetem ano se vám to na terén nemusíte nic programu
stejně tak skoro když pak čtu si děláte aušus a u že chcete neco použít
tak skoro nemusej nic programovatelnou pak ukážu a zdá který to dělá a je to
pět řádků pipe
opak tydlenty další jsem tady napsal ty vázáni krása opilý to jsou teda a frameu
roky pro python
tak je toho spoustu umí ale my se tam musíte něco do programu to není
skript binárka kterou byste prostě pře musíte něco napsat
ale zas sou na druhou stranu
možná flexibilnější můžete dělat pokud chcete dělat něco vtipnýho což já nevím jestli plánujete nebo
budete plánovat
tak se tam dál
na nějaký hraní no pokud byla zajímal chtěl byste zjistit jak to vevnitř funguje tak
to ty vázáni která se open typ sou možná lepší
pokud chcete rámec použít kafe
tak samozřejmě myslím se to roznese se chcete dělat jestli chcete klasifikovat dobrá s kým
chcete zjišťovat kde věci jsou na obrázku
a chcete a se s čela obrázky
to sem si to rozmyslet podle to ta síť musí vypadat
musíte si sehnat data
pokud byste chtěli rozpoznávat třeba
lidi otců tak na to těch dat moc nepotřebujete dělám stačí prostě sto fotek souhlas
to fotek a lidí
pokud použijete ušní přetrénované musí tak vám to nejspíš bude dobře fungovat
pokud ten problém bude složitější
tak samozřejmě těch dat potřebujete být
ale jako rozumný počty jsou tak jako
tisíce desetitisíce fotek na něco rozumnýho
minima
a můžete si stáhnout existuje si neuronovou síť
já jsem to a tady dal link na něco semene model vozu
cože
velký repozitáře sítí které jdou přímo nahrát právě do toho kafe
jsou natrénovaný vtom café
a je můžete rovnou používá většinou ty licence vývoj takže se že můžete používat a
její komerčně cítil ty s titanity sítě to trénuje nějaké výzkumné organizace to znamená každá
na rovinu licenci
ale většinou je můžete používat bez omezení
a těch ty sítě které tam jsou tak třeba uměl rozpoznávat jaksi mi lokalizovat objekty
umyju
a
segmentovat obrázky
a
kde co je taky
to je jich tam hodně
já jsem se dneska díval tak je tam asi dvacet pět třicet různých sítí
se můžete sám
a když se ta koule si teda stáhnete tak vy můžete jí si jako základ
pro vaši síť a trochu to do trénovat na vašich obrázcích
bude to velmi dobře fungovat
tato neříkám že tohle postup jednoduchej
a dopravy pokud máte nějaký malej souboru obrázku tak to je
a nejlepší postu ten postup který vám dá nejlepší slajd
nejenom že se to rychle na trénuje ale bude tady nevím fungovat pokud nezačnete s
nějakou existující neuronových sítí
no a jestli
no
já si
jo
a tomhle případě ta průměr a je plus minus přímá
na čem nic máte
většinou když se jo tohle budu přemýšlet jako
tyhle termínech tak je
kolik potřebuju a obrázků na jednu třídu
a když do duše si řeknu že
chtěl bych aspoň padesát obrázku na třídu tak pak bych si řeknou musim to mi
na každou tři takže když budu mi tisíc tříd je to padesát tisíc aspoň
ale
a u téhle utekla s ligace takhle daří jsou jiných problémů
a
mluv úplně ne
samozřejmě to záleží hodně na tom jak je to problém těžkej
no kolik
a jak je obtížné třeba ty dvě třídy od sebe rozeznat že budu mít to
jednoduše rozeznatelné přidělat sebe
tak ti obrázku potřebují je složitě obtížně ty objekty byl podobný tak tě obraz bude
potřeba víc
ta jedna věc druhá věc je když
akce se možná důležitější
tak je že musíte jste trénovací set zachytit veškerou ose ty variabilitu toho těch vašich
dát já když co bude rozpoznávat dotace to za ty z auta
a budu mít trénovací sebou dobrou fotky nám zepředu tak to bude fungovat jenom zepředu
a nebude to fungovat zezadu
z vrchu
a když budu mít ty židle
tak a prostě detektor šli do potřeboval mnohem víc trénovacích dat protože židle vypadají každá
úplně jiná tvrdit dodělat detektor aut protože auta vždycky mají světlomety mají dveře mají kola
ty prej plus mínus stejně
tady ty že nemůžou každá pro doplnění
a ta tam jako konkrétní odpověd nejde říct a zavřený vždycky když budete mít zdát
tak to bude fungovat líp
a většinou to funguje
takže
když budete mít že a budu mít padesát obrázků
a ve seženu sis to
tak to bude mít tak jako dosáhnu stejného zlepší jako když si myslí že vstal
seženu dvě stě
vy ste těch dvě stě čtyři sta let takhle jako wifi exponenciální žert
a dycky zdvojnásobím velikost ne trénovací sady tak se to o nějaký kousek zlepší
a je pak
když to pak chcete dokonalý tak ty dat tak potřebujete vědět
na
určitě
té pravé ten renovaci algoritmus
a ten vlastně všechny trénovací algoritmy pro ty neuronový sítě fungujou takže dělají graf hlavní
směry
ale prostě maji
teďka nějakou aktuálně natrénováno síť
to trochu změnil a to zas trochu změní a zas trochu změnil
list samozřejmě můžete dělat
když třeba
právě
to umožňuje to hraju přímo to že když máte nějakou existující c teďka v začnete
trénovat trochu něco jinýho
todle když máte nějaký data se řadím prostě jste to někdy na trvá a trvá
síť
nedělám přibyde tisíc další obrázku takže prostě přidáte do té datové sady a do trénujete
dokonce můžete dělat takový věci
takže
a už máte nějako natrvalo síť a máte to někde tužku štyry
jak se dá zjistit když si ten klasifikátor není ste vy můžete mít člověka
tady se podívá
to ste zkontroluje ty
obrázky na kde se ten klasika to není stejný
určitě večeře udělat to i kdybych já byl google
tak on to možná tak dělaj
jak prostě
a příde obrázek paní pustím neuronovou síť
když násilí státech řekl oukej když ne jak se to pošle do indie tam někdo
klikne
ale chvíli když na to někdo klikne jak jsem to přidali trénovací sady
a příště vyšší ta neuronová síť to tohle rozpozná
a toto let a jestli manévrování na s těma kde krásně aut
jo
a
to je částečně to celá sem tady ukazoval někde
ale jenom částečně
tak
za sem ukazoval tady
a to je
když máte malou neuronovou síť tak vono vám dokáže
takhle protože ona nemůže udělat nic jinýho tak ona vám spojky
a ty data který vidíte nějak jednoduše
když máte velkou neuronů si dělá se tam dokáže dělat všechny možný kejkle
takhle se prostě na fitu je přesně na ty data
ale cokoliv jinýho ten anonymní rozpoznat
tomu se říká přetrénovat
a
u těch konvolučních si tím o kterých mluvím já
tak to v podstatě nedochází
nebo aspoň a mnohem méně výrazně nižší kdybyste neměli končí c
protože
tak z několika důvodů
tehdy když máte nějaký ten filtr tak ty filtry sou poměrně malý stihne je málo
parametrů a jsem ti košile na obrázku
se znamená že voni podstatě vijou spoustu dal na to aby se to natrénovali
to jedna věc
a
takže korupční sítě obecně se méně před trénoval jdeš
jako hučí sítě
druhá věc je
že vy když vezmete už nějakou přetrvalo síť která je prostě na trénovaná na
a desítkách miliónů obrázku někým
tak nám se naučí detekovat všechny ty hrany a ty složitější věci a složitější věci
a ona voš podstatě na trénovaná tak dobře dokázalo rozpoznávat věci obrázcích
to je když by to nenapadlo trénovat a na konci tak podstatě
děláte něco takovýho jako že
a jsou jaké kousky mají být na obrázku aby mohl říct že tam pes
a tomu že pak poměrně jednoduchý úkol
a je tam menší prostor pro to aby se ty sítě přetrénovat
samozřejmě se to stane
ale ne
není to nějaký výrazný problém chtěl sítích
samozřejmě použil jsem metody jak tomu zabránit a co má nějaký regularly za cest tyhle
s tím o kterých mluvím já tak tam je tam jsou prostě kterým se říká
drop out
ty přitom trénování náhodně nastavují a neurony na nula
to znamená že ta sídle nemůže jí tu jako spoléhat na to že nějaký neuromancer
nenastaveny musí být robustnější a tak
a jako obecně to funguje relativně dobře samozřejmě čili celá teda s těmi to funguje
nějaký dotaz
tak
a to je rychle projdu
máme z tech pět minut
nebo něco takovýho
co se dá skončím asi těma dělat
můžete
detekovat objekty
a tady tomhle případě jste dělali nevzali
výřezy obrázku vždycky na to pustili neuronovou síť na ten výřez která se to wifi
člověk není tady člověk
a když to neuděláte na dostatečně počtu výřezu obrázku tak dokáže to najít děti
a můžete
ty sítě jsou konvoluční to znamená že vy se tady
jako spočítat všude obrázku
a můžete mít výstup
přímo jak pro každý pixl co na ně mě
takže nejenom
co je na obrázku případně kde ty objekty sou
ale pro každý pixl můžete mít informaci
co to je jakým objektu náleží
můžete dělat
úplně divně jako
věci které já bych řekl že můžou fungovat ale kupodivu fungují
můžete si říct a tenhle obrázek s člověkem
konvoluční sítí a řekni mi kdo má ruce nohy hlavu
můžete mi teda vstup obrázek a výstup klidně pozice no x y pozice kloubů
a
tohle se třeba používáte zarovnání obličejů a vstupem je obrázek obličeje výstupem sou body na
tom obličeji pomocí toho se to pak třeba ten většina pootočit rozeznávat
to sem dal například já
proto tu
tady ty pozice
znamená že výstupem té neuronové sítě sou nějaký
a reálný čísla který říkají pozice těch logů
a
sem dal hrátek
jsem použil to samé akorát jsem si řekl co když výstupem té sítě bude obrázek
hodnoty pixlu toho obrázku
a
co s tím udělat s ta koule sítí tak co třeba
a
když mám ten vstup nějaké rozmazané i ta chtít po síti aby se to rozmazaný
obraz dala skinu práce
takže já mám síť
kde vstup je obrázek výstupem obrázek
a ta síť ho od rozmazává
to funguje krásně vás to někoho zajímalo mám na netu tyhle sítě nahraný někde když
se podíváte na moje stránky
a pak můžete dělat takový že tady mobilem si fotit nějaký text
a ta síla se udělá něco co dokážete přečíst když ten zkuste přečíst životě nedokázali
kdyby se to někdo chtěli koupit dejte vědět
tráva a jak jsem říkal ten zvuk rozpoznává obličeje
placení dělají tak a
na fotce obličej najdou teda ty body
a uměle ten obličej otočil dopředu
a teď trochu složité a tom
můžete se podívat
a pak takhle na obličej které otočili a dopředu abych se díval do kamery tak
na to prostě ukončí neuronovou síť ste neuronové sítě
na konci vezmu nějaký aktivace které reprezentuje ten obličej vypadá
a pak maji takovéhle vektory ty deaktivaci s to ze vše z nějakého ty databáze
pak když přijde nová fotka s akorát podivaj tohleto vektoru databázi chce nejblíž a to
je ten člověk
dokonce můžete trénovat
ne sítě na rozpoznávání nebo na rekonstruovat něčeho
ale klidně můžete trénovat sítě
rovnou na tobě říkali že ten se podobný
jestli takzvané syrské sítě
se s na vstupu sou dvě věci
se pro ženu nějakou
sítí které můžou být by měl být stejně rozdílem na konci jedinou nějaké
vektory čísel
a ta sice dá trénovat tak
aby přímo
se trénoval že
stejný
obrázky holky že na těch obrazů sem třeba stejný člověk
tak aby ty vektory byly stejný a pro různé lidi aby ty vektory ty reprezentaci
byly a co nejrůznější toho se dá třeba vím že když dopravy děláte nějaké vyhledávání
indexaci
a podobně
a máte jako databázi
třeba videí
a budete hledat
nejpodobnějšími den
takhle domu natrénovat ty
fingerprint i ty obrázky patra ty vektory podle kterých viz vy vyhledávat at podobný věci
nejsi dělat
to má
nuly
málo zručný technický problém
tohle když kolik
nejsem trénovat neuronové sítě které dokonce jenomže zpracovávají celý
obrázek ale naučil se kam se na tom obrázku dívat
a tohleto při vidíte ty čtverečky
to dopravy ta síť se naučila že rozpoznávač číslo tak se někam dívej
a pak dokonce tady podle těch síti
toto chcete
a to toho trochu dýl
to co je tady na tomhle obrázku takže
že nejenom že ta síť se naučil rozpoznávat ty číslice ona se nám členy kreslit
no to je to stay vidíte tak to je proces kdy neuronová síť
generuje a
how snad brzd nebo takový ty čísla co na práci
a nedělat
dudy generovat i další věci
úplně úžasný článek ne nečekal bych že o tom
jo tím že čekal že
uvidím někde článek o generování židlí pomocí neuronových sítí a tady ti lidi natrénovali síť
které řekli na generuj mi síť typů pět
s pohledu odtud
a ta síť to wiki vytvořit a jít ale obrázek
spajdrmen
jak ono to vypadá tak trochu podivně a podstatě relativně dobře
mimo jiné co můžou dělat tak vidíte tady takže interpolovat mezi různýma ty považuji
se mají
můžou vygenerovat obrázek židle která je napůl křeslo a napůl kancelářská židle
a není to fotorealistickými ale
takové věci se dají dělat
a samozřejmě
máte náladu tak se můžete podívat na nějaká já vím
a seš
jak jsem říkal
postupech tohle se vytváří takže nějaká trénovaná si teda chtěl bych se vpodstatě můžete sto
internetu s tou malou zůstanou
paní lates na vstup to jestli tě nějak i obrázek
pro ženete to tou sítí
a teďka
si řekne řeknete jestli ti třeba
na
já bych chtěl aby ten obrázek vybral víc jako pes
a to je tohle informací můžete pak spát pro potom o propagovat stejně jako
přitom učení těchhle pomoci backpropagation místo není varech
může to mění ten původní obrázek
a to co vidíte tady
tak to je
a
jak
sem
kontinuální
to vstupního obrázku tak aby
a by se nějaká aktivace té neuronové sítě byla vysoká
a to na začátku to byli
jako abys
byly vysoké aktivacím nějaké prvním místě
a tohle postupně
a jo tam se viděli že tam byly hodně ran
tak jsem někde hlouběji ste síti
oženíte že tam jsou
očí
a vlasy
podstatě psů a podobně už jako takový částí objektů části tuhle chvíli zvířat
tady jsou a je nějaký lidský voči
když pude
a postupy když tady pro ty vím trims použijeme aktivace té hlubší ve slipech tak
začnete vidět větší kusy objektu a tady jsou stě hlavy
a
teda bude něco jinýho než oči
tady jsou nějaký monitory a podobně
ad to vpodstatě ta síť
se říká že na lucinu je
a vymýšlí si vytváří obrázky tak aby je hodně aktivované
je možný že vy když velcí ne tak to funguje podobně
a
doporučuju tady ten ničemu kdy vy můžete se můžete si večer udělat párty
nepouštěj malým dětem spaní
a tady na to zas a pro kafe
existují a jako peníze si můžete si stáhl python skripty které využívají kafe
a dělal
dělají přesně to
běžte nějaký dochází čas takže
existuje nějaké datasety
pokud budete se má končíme si těma chtít začít
tak se podívejte na kafe to teda obrovský projekt moudrosti relativně velký projekt
a je na githubu
nejsem můžete podívat jsem včera tímto z netu a skoro čtyři tisíce forku
a za poslední týden tam je
se merge oval opět tu půl requestu
prostě žije existuje kam to velká komunita
a vtom kafe
doopravdy vy si můžete vytvořit
textový soubor kde dáte jména souboru na obrázku a jejich třídy
vytvořit
konfigurační soubor toho trénování můžete vytvořit soubor který definuje tu síť
a pustit říkáte kterej ne
moji síť
ale se bude trénovat najděte uč kluk
ano
levicové pane nějaký konfigurace
a tady se píše o takový
ty konfiguraci tady prostě takhle
tak konfigurace trénování vypadá takhle
a takhle se to dá používat slajd
no tohle celý to
kde byla načtete nějakou si
a pustíte ji na nějaký obrázek dostanete se
tak já vám děkuju tady tahle tu prezentaci někam tam
určitě
a zajímá zdroje nás něco zajímalo podívejte se na