já podobně jako ram hrou mám přednášku kterou sem trošku recyklovat z minulýho tejdne tech
doufám že nikdo nebyl vpravo se aby se není koukal nebyl
nebyl tak je to řádku nebudu mít je špatný svědomí že vás trochu tím
tam přednáška jeho
stranu učení a ty další fáze si řekneme něco vo deepening přišel nějaký pokročilejší moderní
strojový činí který má dva výsledky
těchdle je tady i když
protože vypilo ta s
já
dobrý to dobře přeskočit
a
zase vlastně řek
první půlka straví učení řekne jaký základní principy řeknou řeknu příklady kdy se i se
tak se používá
learning
a z tou že ste tady na datový tam ference tak vás asi nemusim přesvědčovat
o tom že
strongly učení něco užitečného že to není jenom nějaká krynická věc l nikdo nepoužívá nebo
že se bude používat a šel za deset let používá se už teďka používáte jí
dnes a denně za
různých produktech s
který máte kapse který máte na webů
pak příkladů
v čechách je docela zajímavé je například právě seznam c z
který před mnoha lety
tři čtyři roky zpátky
třebu žvásty futex tak aby fungoval
trošku moderní dcera aby využíval data který mají k dispozici
a lízal přes představou že futex funguje tak že prostě rános nějaký váš kontextů probudí
a řekne si já bych měl trošku upravit šťáva klíčový ho slova titulku apoštol nějaký
čísla futex nebo chovají
takle tou žádné nefunguje všechny tydlety
číslá ty parametry to u textu a to jak spolu vzájemně způsoby jsou naučený nějakým
algoritmem strojový učení případě seznam jsou to rozhodovací strom je moc tam byli naposledy jsem
když mám přerušené ruský napovídala naší konferenci
za vy se podíváte na tom
co dělaj vaše uživatelé data se dá tím přát obrovský databáze co vám vaši brigádníci
za zaměstnanci vo rychtovali vo hodnotili nějaký dotazy a výsledky snad já ty dotazy a
ponaučit algoritmus aby byl schopen
to hodnocení potom provádět strojově neříkal který dokument je relevantní na ten dotaz
strašně promluvě ctila i google nesmim systému tak word
tam tomu úlohu mají v něčem jednodušší protože tam je
po zadání prostě a to vydělávat co nejvíc peněz tak prostě pro každý zobrazení je
kladný pozice maximalizuje
dolary který s toho úplně na
ta každým kliknutím na reklamu úhlu vy učíte nějaký stroj aby poznal který reklamy sou
dobrý na který klíčové slovo
a
následně servírovat reklamy dalším zužovat
zase co používáte dnes a denně nějakej mail na který máte sem tam ty
je tradičně fungujou rozpočeto naivního y se proto tady říkala veronika ty přednášce globalistických sítích
je zmínila ty dva jsou stejné techniky science těch nejjednodušších algoritmus to ví učení
a zase v nějakých z
znacích s tohle u pozná jestli ten mejl je legitimní nebo jestli je to spam
další příklad je h jevů
kde taky před mnoha lety udělali velkou změnu že nějakou upeč která byla do tý
doby statická nachladili kopeček která je generována pro každýho uživatele
zvlášť na míru
podle toho jaký je geografie na co polykal minulosti jaký má prohlížeč
jaký úhlavní třeba odhaduju u toho u toho uživatele
a to je věc se kterou zmínili takle svědka před pěti let zpátky
pokud vím taky seznam se ze ty každá experiment že tam poslední odkaz na novinky
l push zkoušel pak zanalyzovat já to
další věc která tady zbyla neska změna se vůbec jako my když
džiny jaký systémy který nám doporučuju
jaký přelo zboží si koupit nebo může dvojky případně jaký virtuální zboží jako sou
filmy hudba
cokoliv kde ten obchod na poště v obrovskou databázi
produktů
a maják informace o tom jak se lidi chovali to mých systém
to si koupili přál ohvězdičkovali jak hodnotili kterej který ten film a na základě toho
můžou
doporučovala posledním uživatelů
věci který by se mohly a základ podobnosti
s tou co se ten systém naučil minulosti
zvláště dyž jedna zmínka k tomu reflexu matrix před mnoha lety hlásal tak zvaný vertex
právě jistě že ta
na tu dobu velmi pokroková soutěž kde dali milionů týmu které jim ty lepšíte nechal
bude kouzlo o deset procent
a to se zúčastnit stovky tím z různejch různých univerzity jsou pro
když už modřínu webů a pudu do při pádu
z reálného světa nebo z nějaký tak zatím oblasti
tak zase skoro každej máme
kapse nějak i
mobil tady
hlasových vyhledávání rozpoznávání řeči časy v odpovídání
na otázky
což je velmi složitej sestra všech těch součástí který musej fungovat
dobře je hodně moc rozpoznat tu řeč
pochopit co ta věta jet věta znamená najít nějaký strukturovaný databázi tu odpověď a tu
odpověď prezentovat
co prostě tři čtyři na sebe navazujících kolja kašli z nich je const velmi složité
a už to funguje
se ve všech ti fázích je tam nějaký strom učení
jak říkal jsou třeba auta
teďka
už více firem se pokouší udělat já ti o to který by se samo řídilo
tadleta vobrázek konkrétně volt wesley která o bude mít za pár měsíců proudy
nebude umět samo se řídí úplně všude jako u běžných ú ulicích je mezi
křižovatka macho cena takle na dálnici
upravovat rozmáčkl tlačítko to pojede samo l se zařazovat a doufejme že za
a poslední příklad vtom na co v úvodu je
string q nebo vůbec jako by
systémy kterým jako rozpoznávají číslice testy dvě zrovna
aby nestih složitější případu rozpoznávat šeky je číslic že tam nebyly těch druhů jsem
strašně moc
a zase jak jistě jak jezděj ty auta sting you tak
a sbírají obrovský množství obrazových dat
a potom když tam rozpozná nějaký číslice
sem to docela hodí i k tomu že můžou ty mapy dal zpřesňovat
že když prostě viděj že
že auto zaznamenalo barák číslo šedesát sedum nějaký místě
ale mapových podkladech který hodně koná koupili ten bravo padesát metrů vedle
asi někde chyba andoře ty data spárovat a změnit a opravit
teďka už daleko skromnější případy věci děláme třeba mi je za projektory bikiny
s a todlecto je roli kdy
máme jako technology
která si přečte webovou stránku ú a získá z nich strukturovaných dat
například si přečte
recenzi nějak codebooku
a řekne si
todle notebook na úhlopříčku displeje takovou vyrábí ho firma lomeno vo na ty vlastnosti f
potom na ten procesor na základě toho že se přečte běžném f tak sto vypadat
jako by databázový zase
standovi dvojtečka novější je
s oblasti rozpoznávání obrazu
tím že tady mutujeme tak n nemůže můžeme třeba počítat kolikrát lidi title něco seš
tagem na takový jak jsme viděli před chvilkou nebudem se koukat i na tu v
obrazovou informaci pokud tam někdo vyfotil fotku
a třeba se můžem dívat na to jestli na ty v obrázcích byly nějaký loga
hlodavci r čtyři prostě vyfotil
flaškou je napsaný s akvarel tak vlastně firma se baru by mohla by ráda že
i někdy flaška vietnamu v mým obeznamme zajímat statistiky toho kde ty flašky jsou vidět
jak moc často ta
a to se právě taky na dá řešit algoritmicky
tak další projekty adresou čtyři
teďka všeobecně k principu ostrovního učení posla si během dne dneška push pochopili ležet vezmou
trošku rychlejc
musíte mít data
a vy data musej bejt
značkování té jako velmi důležitý slovo state pro slajdu kolečkové mít na to znamená že
vy víte co na nich je
znamená když děláte předáky systém tady
rozpoznaná
třeba auta
tak musíte vědět podle auto tile náklaďák todlencto je o oblast toho je probíjející kočka
prostě musíte mít nějakej základní databázi
kde na ty informace
který s toho potřebujete nějakým člověkem označkovat
přesvědč omdlívá daří
l t jako by největší jako trabl
se spoustou problémů že chyby dělat data a je těžký a drahý je
podobně jako jak to veronika mluvil vo tom zdravotnictví kde prostě ty data x s
tou sou prostě zapsat vím nějakých jako záznamy identických stih chtěj vyšetření a jsou prostě
rozsekaný pružný databází sou psaní různejma jazyka vás možnejma zkratka má nestrukturovaně
někdo to prostě že takle nepíše ale
a dráty na ty data do jednotky a formátu tak to je strašná práce
když jsou proč a jak by tisíce oznamuje ty přednášce zaznělo tak prostě tam se
nějaký člověka celkem předpisem vytahuje s těch nebo
takže ten r
rozsahu je zase
docela velká množina problémů kde tyhlety data vznikají samovolně jako nějakej vedlejší produkt toho co
třeba ten nebo y projekt nedělá sám sobě
prostě mi vidíme na co lidi pykaly na tom vebu cosi co si kupovali co
celé jako do komentářů
to znamená je i velká
velký množství dat který už máme označkování jaksi
jaksi mimochodem
a z běžní ho provozu tohle
a když máme ty data
tak si na uděláme to že naučíme model
neodvyknu moc do detailů co tento ten model znamená tam rabuje těch modeluje před tisícem
z nechal nějaké jaké modely vytvářet
základní princip f to
když máme
ronaku dál
a
je každýmu
prvku fí hromádce víme tak známí výsledek
tak můžeme naučit
tím algoritmem ten prostředek žemle učit nějakou černou krabičku abys těch dat predikovala ten sled
protože máme vobědy části napravo apod chraptivý je prostředek a ten algoritmem
získal ta učí
tak lomeno n
předhodím
a když dostaneme nový data
přijde novej člověk neví šlo r je nový vyhledávání do futex tou
tak si dáme ty nový data do toho modelu který máme natrénovaný a vypadne na
nová předpověď
ve vlastně to co děláme abysme pro novýho zákazníka dali lisknu správně doporučení
nebo pro novej vobrázek poznali jsme tam ten náklaďák nebo osobu
je tu se dostanu do tý druhý půlky
tam kojence tady learning
se vrátíme
chvilku do sedumdesát rychle
podle amerika
tak na to údajně vypadalo tady
a teďka nepamatuju že já jsem ještě nebo na světě ale todle sem s ten
našel internetu
tak proč sem se tam vrátil
takže funkce sedumdesátejch let
byl vynalezeny algoritmus
zpětný propagace neuronových sítí heuristiky byly užší známý před tím
ale to na co algoritmus je
jako by nakopnou a
to umožňuje efektivně učitelky době to nebylo moc ušní
tak neuronovou síť vám tady buše kreslil igora ukazoval vám tu animaci jak se jak
se naučila rosu poznávat ty červený tečky vokolo těch modrých
takže bylo vlastně strašně rychle nahoru nacpete nějaký data
pak je tam nějaká
skrytá vrstva která dělá poměrně jednoduchý matematický výpočty v podstatě to nějak i
vážený součet těch vstupů který tam shora padaj a pro že pro y nějakou sigmoida
outelová taky ignorovat popisoval můžete nějaká kladná křivka
a dole vypadnou výsledky
to se na konkrétním
příkladu nahoře můžete na třeba pixely sto obrázků a dole tady mít prostě je to
pes je to počkaj tobě tokům jako náklady
a nebo
cokoliv můžete tam dal nějaký vlastnosti složitý
a dole může vypadnout operovaná pravděpodobnost že se to zákazník koupí
případně byste do toho klidně mohl lidstva kudly výsledky data vlastnosti dokumentů vlastnosti dotazu a
doleva vypadne relevance
si neuronových sítě jsou poměrně univerzální
takže když do toho dáme nějaký
složitější data
co se třeba ty zobrazení
na nacpeme anglicky pro těmi vobrázky a chceme aby nám to neuronová síť tam dole
řekla
jestli je to letadlo autor nebo ta
tak už zjistíme že vono to na ty
na ty samotný pixely nějak jako u je vlastně strašně mizerně
a
neuronová síť kterou sem kras to na tom odkazem slajdu
jako třeba něco složitější
r by věc co se dělá teďka posledních s ledních na tech
g perník slyšíte tam to sou hodí
přišla hluboka
celá ta neuronová síť nemajou jednu skrytou vrstvu
ale má jich mnoho tady jejich asi
šest jako by těch skety dostat nakreslené
kde tam jako by nalevo byl ten obrázek je stejný napravuje tady něco stalo obrázku
predikuje
a mezi tu
těch sítí
každá každej tady ten čtvereček jako chtěl
sto krát sto neuronů
ty současný neuronový sítě sou hluboký pavel je tam
mraky těch spojů je tam taky nebo a sou naskládaný do veliký hloubky
a to že je teďka sme schopni takle naučit a sedmdesátých letech jsme toho schopni
nebyly je daný jednak tím že
máme mnohem
větší výpočetní výkon
jak na procesorech takle grafických kartách na ten se v metrech se to většinou pouštím
tak je to i daný tím že sme se naučil nějaký triky jak ty neuronový
sítě líp učit aby mohli by vůbec úvod ten samotný výpočetní výkon velikými nám nestačil
je potřeba udělat ještě trošku chytře víc než je se to dělalo
sedumdesátejch cache se
druhá věc
ten obrázek vypadá vždy první a ne předchozí
a všimněte si tam jednu věc se m s to byl
move pod
vrstvu ve stejný barvě
což není úplně a bude
já tady tu danou c dolní nacpu zvraty na jako před
ale dole si nedám
ty výstupní dat tam si nedám to jestli je to pes nebo kočka nebo náklaďák
na se tam zase zopakujte vstupní data
a proč jakou na jako blbost dělám proč jako by nutím neuronovou síť aby pro
nějaký data mi vodpověděla těma samej má data na čelte nesmysl bit data můžu zkopírovat
kontrol c konzolové a jako by mám to jsem to trhat nějakou jako složitou věc
je to proto že ta
prostřední vrstva
je nějakým způsobem
limitována
například tady vobrázky limitovaná tím že jsou tam dva neumím byste vidět čtyř
a tady jeden ze způsobů jak donutit tu neuronů sumu
aby sis těch dat vybral to co je důležitý
příliš neuronů síti řeknete les náš se tydlety vstupní na tady ty čtyři milióny na
dva do dvou neuron
a k prosince musí po něco pokusy musí se s pokusy teda to c na
tak zkomprimovat
musí si najít všechny důležitý
a jenom ty jakoby dvě důležitý čísla z nich jednička
já to tam
aby se aby se zpětně byla schopna
predikovat ten
ten původní
tyhlety dvě věci dohromady
se můžeme ne podívat na tu na tom obrázku
lets to je
první vrstva takovýdle to sem tady ukazoval směr auto enkodér
zde první vrstva která vznikne
zavedení návnad paměti obrázky a řekli sme ale ne o ten kodér
naučí se co je tam jako by důležitý
a vidíte že vám to tady našlo nějaký různý
vliv na obrázku jsou který jsou potom různejma volaná
a taky se to naučil hospoda však voba dva vydloubat
a teďka provedeme totéž ještě nula se mu řekneme s tady ty obrázků se naučí
něco zajímavýho
zajímavýho v tom smyslu že to predikuje ten původní vstup a tady jako lidi asi
poznáte že ten původní vstup asi to nějaký obličeje
za já sem tadleta algoritmu zůstal
dostal obrázkem obličejů
a říkal si naučil se z jednoduchý věci access naučil starat složitější věci
a pak se z nich neúčast na ještě složitější věc
a na to aby je to dvacet dělal já jsem i na ten je potřeba
mít označkován
prostě do já jsem do to algoritmů
no a milionů obrázku a řek
ale uč se
naučil z nich něco důležitý algoritmus i si vytvořil tohlect
a to je jako by novinka teďka poslední
šest sedum let řekla to nedělá
takže
další věc touškov ven tak je tak rychle protože my stejně dochází čas
je že
jsme se naučili nějaký triky jak je neuronový sítě eště lee
trénoval aby byly
aby byly
kvalitnější
a taky rychlejší
řekl vlastně důkladně jenom jeden z nich
je takové že u tý neuronový sítě která vypadá úplně
plně normálně
i třeba půlku těch vstupů
představte si postiženém ten druhej a ten štvrtej vstup jí úplně vynuluje prostě push pošlem
nepošle mít i data který má nízký databázi a pošli tam nuly
a tohle znam opakovaně prostě o čem to nám milionů iterací love polovině případů u
funkcí sítí nuly
místo dvě místa dyž správný na
dnes jsem se říká pro a
a dělám to proto
abych prosím naučil by robustnější
aby se vona nespoléhala na to
že nějaký konkrétní neuronů prostě má konkrétní hodnoty a s tou se na něco počítat
tím zatímní nutila by si měla poradila i tehdy když ty data nemám
jo je tam pořád první přirovnání kinetika napadlo jsi zaklepej do jednoho o a jako
projdete se tady
tak prostě stejně nenarazíte nebo prostě dáte si pozorně a jako zvládnete
tak to place jakoby způsob jak ty typy neuronových sítí
ti říct nějak si poraď i když nemáš všechny data to že je to strašně
jako typicky
že člověk nemá všechny data nebo ty data jsou chybou těch předchozí přednáška jste slyšeli
dvacet procent dat
ty byznysem to že s projektech je prostě špatně
tak ve stejném způsob jak je to c donutit aby se na ty špatný výsledky
nenahrazovat přesto odpovídá správně
jak není planinky doby todle sezona strašně těžký úkol nějakýho rozpoznávání
obrázku kategorií obrázku
a zatímco ještě před třemi lety ty výsledky byly
asi
kolem devíti procent jakoby správnost toho rozpoznání
tak teďka o moc nějakých learning k sítí
je tak lepší
druhá věc je rozpoznávání řeči sme tady měli hezkou přednášku před
před nějakou dobou
ty tradiční metody jestli se to stý přednášky pamatujete to sou ty tam s úzkými
chci model jestli zkreslil a takovejma modelem a
tak ty měly na tadydlecto na tom do co na to set nějakou chybovost
dvacet sedum procent
a zase teďka prostě
a to let padla to t
termy začne používat levných metody které jsou opět
téměř vo polovinu lepší že jako strašnej velky posud že do tý doby si je
patnáct let
když někdo zlepšil ten algoritmus vo nula celá na si procenta hnedka o tom napsal
research paper a všichni ho všichni a fall jaké je skalární
a se paušálně posouvala o tom aby to bylo čím dál tím lepší tak teďka
prostě během posledních tří čtyř ale eště ve stanfordu f torontu vymysleli algoritmy které jsou
mnohem lepší
konkrétně
řádů byl a name němuž to používají k provozu
pro nikdy tenhleten červené s oznámil že sice honit zatím použity tradiční metody ale že
už to taky přepínají na ty tady hluboký nenulový sítě
další příklad rozpoznání čísel
no to už docela dobrý teď je to ještě lepší
todle se podívejte to máme před přednáška bude na slajd šeru spousta opensource knihoven tu
stejnou nějaký výčet těch který
který mám ráda nějak použil
je to poměrně jednoduchý začít sestro vyučení ty pěkně nejsou kvalitní jsou slušně zdokumentování jsou
rychlí příjemně se v nich pracuje
push jsou s už jsem skoro na konci dovolený si jednu takovou vsuvku pokud by
brzy vámi byl někdo kdo vlastně chce pracovat s daty
má nějak i vlastní na a nějaký projekt vydal němuž vzdělanej nebo
jedna je méně práce
a chybí mu na to na to peníze a asi čas a soustředění
tak bych doporučovala přihlašte se do startup yardů protože ten na
deadline přihlášek zanedlouho
patnáctýho prosince
takže začne běžet tříměsíční program že tam skvělým tvořil jsou lidi legis praxe litru šéfové
firem musí zůstat se listi
který vám s tím můžu
pomoct
je tam i následné jiné modely pro investory
a jako jsou poměrně dobrý
třiceti c
euro za deset procent ve firmě
a osm nějaký ještě hračky jako volnej který to n nejsou tak ste jsou to
porovnej služeb software úplné ten že a tak dál
vlastně na konci
jedna jaká výzva nakonec
nejsme hodně mluvili vo tom že je dobrý ní data
a
panovník data nestačí
vezmete na ten data pro měli dáte sestro krásný grafy jako dobrý té eště ste
jako v oku znalost jako by nadprůměrně dobrý víš dokážete udal barevný graf ste jako
lepší než jako většina ještě
firem
a nevystačí pro
sto že uděláte brémy graf tak tím písmeny zákazníkům a uživatelů vlastně eště nepomůže
můžete tehdy když naději dat na tech uděláte nějaký rozhodnout nějakou změnu
a když to děláte lidskou silou tak se schopni udělat x změn za tejden
ale když toto zapojíte strom ničení který třeba každýmu konkrétnímu uživateli dá ňáky jinej výsledek
nějaký jiný tak zvaný doporučení nějaký kvalitnější a kvalitnější data
pak
jako tehdy slastně začne garantovat ta
tady investice kterou člověk dělá do toho že ty data nějak spravuje a
analyzuje
strongly účinně dobrých to že si poradí z velkým množstvím dál najde se tam
společný vlastnosti najde je schopni predikovat to co
oni nich chcete predikovat
tu slajdu jsem zapomněl jo to je vlastně je tady většina jestli studenti
co se dovolte vypsat nějaký čtyři možnosti co vlastně můžete dělat pokud vás
stojí učení zapomněl
existuje o takový soutěžní veby kde sou volně datasety ke stažení můžete se s nima
hra můžete soutěžit voproti ostatní týmů toho jak se s těma data dokáže akorát poradit
radistickým dokonce i vydělal peníze pokud ste se hodně dobrý
můžete propracovala vlastní projekt
buďto sami nebo se přihlásit do akcelerátorů
na dobrých universitách se taky jestli vyučení používá s neslyšeli zvěsti přednášky vo tom o
tom jak se používá tady
a
duše čeká je pak firem který ste učení nějak tak si
používá
ne všechno jako
delete nelze věří přednášku registry dohlídneme line tak modrásku kdy zjistíte že nestane tedy b
kdy sydney dráte řeknu kamarádili atributy ze garáží s výhledem
tak říct vodou že téhož teďka to za hlasový ovládaní víceméně vyřešený je duše tohoto
modulu nebo takovou
vyhledávání na mapě taky už neřešená vlastnost
a
to z to co chybí je teďka šeky se ukrajiny auta nebo teplot esli můžete
koupit vlastně teďka do doručí vám ho
počátkem roku v lednu forever já se to trošku pozdějc
pro vás po veřejnou po dálnici
ty
a u toho úhlu ty oni se vlastně pohybovat pět běžným provozu
ale ty ještě nejsou konečně k dispozici a vlastně ani mukl neřek žádnej termín ve
kterém by byl
znaj abych toho nadal tak za pět let
který děkuju ne nad nikde nějakou zakázku ne michael
nelze
ne
máme tomu víc třásně osm na akciovej zaprvé
takže sme měli to jak se chovaj ceny akcií měř k tomu ještě triky vo
ty konkrétní firmě
a vo jich pro data jsme ty data nějak dohromady
a učili sme nad tím
u jako musí použil sme open kodéry na to aby predikovali to
dopadlo to takže ty výsledky sou
jako statisticky signifikantní vtom že to dokáže no ten s něco se co se to
děje
a je s tou nějakej hlouběji zisk a poté co se bude čtu poplatky který
jsou vlastně came d ale stejně sou jako nemluví tak poštou šedou c mínus za
nemuseli bysme to ještě vylepšit na to aby to bylo
r mě použitelný
je možné nevaříme řízení by zajímalo když oblastech vidíte
největší potenciál a být na jedný budoucnosti m tomu vyřidí
já jsem že skoro všude kde máte velký data potřebujete nad nima něco předpovědět to
znamená
obraz a zvuk tam se použila už teďka lingvistika tam vlastně začíná používat
teď ale myslím si že to ještě nedospěl plně jako do praktického použití levicové vyspělý
skvělý akademickým výsledky
na ty reklamy dnešní se zatím moc hluboký sítě nepoužívají a to zejména protože tam
fungujou dobře i daleko jednodušší modely
nicméně i tam to vidím sledně tím nebude růst výkon současných počítačů tak bude možný
do toho dávat složitější modely a
tak jejich přidána prostě začne vykládce
když si nějaké
poslední jedné letenské
co způsobilo teďka rychlejší narůst do úspěšnosti těch
těch problém
podle mě jsou to ty tři věci k sem říkal na vyšší výpočetní výkon
možnost využívat i nebo značkování data kterých je prostě fůra mu to za nejsme limitovaný
tím že by nějaký člověk musel značková ty data
a třetí věc a
matematicky algoritmických triků který vylepšili ty neuronový sítě byly předtím tak teďka fully a rychle
nic
jak je ve moc děkuju nevěřím že to je oblast které s ve které bereme
hodně zdržujete kdysi budete dánsky sjedeme michelle