já podobně jako ram hrou mám přednášku kterou sem trošku recyklovat z minulýho tejdne tech

doufám že nikdo nebyl vpravo se aby se není koukal nebyl

nebyl tak je to řádku nebudu mít je špatný svědomí že vás trochu tím

tam přednáška jeho

stranu učení a ty další fáze si řekneme něco vo deepening přišel nějaký pokročilejší moderní

strojový činí který má dva výsledky

těchdle je tady i když

protože vypilo ta s

dobrý to dobře přeskočit

a

zase vlastně řek

první půlka straví učení řekne jaký základní principy řeknou řeknu příklady kdy se i se

tak se používá

learning

a z tou že ste tady na datový tam ference tak vás asi nemusim přesvědčovat

o tom že

strongly učení něco užitečného že to není jenom nějaká krynická věc l nikdo nepoužívá nebo

že se bude používat a šel za deset let používá se už teďka používáte jí

dnes a denně za

různých produktech s

který máte kapse který máte na webů

pak příkladů

v čechách je docela zajímavé je například právě seznam c z

který před mnoha lety

tři čtyři roky zpátky

třebu žvásty futex tak aby fungoval

trošku moderní dcera aby využíval data který mají k dispozici

a lízal přes představou že futex funguje tak že prostě rános nějaký váš kontextů probudí

a řekne si já bych měl trošku upravit šťáva klíčový ho slova titulku apoštol nějaký

čísla futex nebo chovají

takle tou žádné nefunguje všechny tydlety

číslá ty parametry to u textu a to jak spolu vzájemně způsoby jsou naučený nějakým

algoritmem strojový učení případě seznam jsou to rozhodovací strom je moc tam byli naposledy jsem

když mám přerušené ruský napovídala naší konferenci

za vy se podíváte na tom

co dělaj vaše uživatelé data se dá tím přát obrovský databáze co vám vaši brigádníci

za zaměstnanci vo rychtovali vo hodnotili nějaký dotazy a výsledky snad já ty dotazy a

ponaučit algoritmus aby byl schopen

to hodnocení potom provádět strojově neříkal který dokument je relevantní na ten dotaz

strašně promluvě ctila i google nesmim systému tak word

tam tomu úlohu mají v něčem jednodušší protože tam je

po zadání prostě a to vydělávat co nejvíc peněz tak prostě pro každý zobrazení je

kladný pozice maximalizuje

dolary který s toho úplně na

ta každým kliknutím na reklamu úhlu vy učíte nějaký stroj aby poznal který reklamy sou

dobrý na který klíčové slovo

a

následně servírovat reklamy dalším zužovat

zase co používáte dnes a denně nějakej mail na který máte sem tam ty

je tradičně fungujou rozpočeto naivního y se proto tady říkala veronika ty přednášce globalistických sítích

je zmínila ty dva jsou stejné techniky science těch nejjednodušších algoritmus to ví učení

a zase v nějakých z

znacích s tohle u pozná jestli ten mejl je legitimní nebo jestli je to spam

další příklad je h jevů

kde taky před mnoha lety udělali velkou změnu že nějakou upeč která byla do tý

doby statická nachladili kopeček která je generována pro každýho uživatele

zvlášť na míru

podle toho jaký je geografie na co polykal minulosti jaký má prohlížeč

jaký úhlavní třeba odhaduju u toho u toho uživatele

a to je věc se kterou zmínili takle svědka před pěti let zpátky

pokud vím taky seznam se ze ty každá experiment že tam poslední odkaz na novinky

l push zkoušel pak zanalyzovat já to

další věc která tady zbyla neska změna se vůbec jako my když

džiny jaký systémy který nám doporučuju

jaký přelo zboží si koupit nebo může dvojky případně jaký virtuální zboží jako sou

filmy hudba

cokoliv kde ten obchod na poště v obrovskou databázi

produktů

a maják informace o tom jak se lidi chovali to mých systém

to si koupili přál ohvězdičkovali jak hodnotili kterej který ten film a na základě toho

můžou

doporučovala posledním uživatelů

věci který by se mohly a základ podobnosti

s tou co se ten systém naučil minulosti

zvláště dyž jedna zmínka k tomu reflexu matrix před mnoha lety hlásal tak zvaný vertex

právě jistě že ta

na tu dobu velmi pokroková soutěž kde dali milionů týmu které jim ty lepšíte nechal

bude kouzlo o deset procent

a to se zúčastnit stovky tím z různejch různých univerzity jsou pro

když už modřínu webů a pudu do při pádu

z reálného světa nebo z nějaký tak zatím oblasti

tak zase skoro každej máme

kapse nějak i

mobil tady

hlasových vyhledávání rozpoznávání řeči časy v odpovídání

na otázky

což je velmi složitej sestra všech těch součástí který musej fungovat

dobře je hodně moc rozpoznat tu řeč

pochopit co ta věta jet věta znamená najít nějaký strukturovaný databázi tu odpověď a tu

odpověď prezentovat

co prostě tři čtyři na sebe navazujících kolja kašli z nich je const velmi složité

a už to funguje

se ve všech ti fázích je tam nějaký strom učení

jak říkal jsou třeba auta

teďka

už více firem se pokouší udělat já ti o to který by se samo řídilo

tadleta vobrázek konkrétně volt wesley která o bude mít za pár měsíců proudy

nebude umět samo se řídí úplně všude jako u běžných ú ulicích je mezi

křižovatka macho cena takle na dálnici

upravovat rozmáčkl tlačítko to pojede samo l se zařazovat a doufejme že za

a poslední příklad vtom na co v úvodu je

string q nebo vůbec jako by

systémy kterým jako rozpoznávají číslice testy dvě zrovna

aby nestih složitější případu rozpoznávat šeky je číslic že tam nebyly těch druhů jsem

strašně moc

a zase jak jistě jak jezděj ty auta sting you tak

a sbírají obrovský množství obrazových dat

a potom když tam rozpozná nějaký číslice

sem to docela hodí i k tomu že můžou ty mapy dal zpřesňovat

že když prostě viděj že

že auto zaznamenalo barák číslo šedesát sedum nějaký místě

ale mapových podkladech který hodně koná koupili ten bravo padesát metrů vedle

asi někde chyba andoře ty data spárovat a změnit a opravit

teďka už daleko skromnější případy věci děláme třeba mi je za projektory bikiny

s a todlecto je roli kdy

máme jako technology

která si přečte webovou stránku ú a získá z nich strukturovaných dat

například si přečte

recenzi nějak codebooku

a řekne si

todle notebook na úhlopříčku displeje takovou vyrábí ho firma lomeno vo na ty vlastnosti f

potom na ten procesor na základě toho že se přečte běžném f tak sto vypadat

jako by databázový zase

standovi dvojtečka novější je

s oblasti rozpoznávání obrazu

tím že tady mutujeme tak n nemůže můžeme třeba počítat kolikrát lidi title něco seš

tagem na takový jak jsme viděli před chvilkou nebudem se koukat i na tu v

obrazovou informaci pokud tam někdo vyfotil fotku

a třeba se můžem dívat na to jestli na ty v obrázcích byly nějaký loga

hlodavci r čtyři prostě vyfotil

flaškou je napsaný s akvarel tak vlastně firma se baru by mohla by ráda že

i někdy flaška vietnamu v mým obeznamme zajímat statistiky toho kde ty flašky jsou vidět

jak moc často ta

a to se právě taky na dá řešit algoritmicky

tak další projekty adresou čtyři

teďka všeobecně k principu ostrovního učení posla si během dne dneška push pochopili ležet vezmou

trošku rychlejc

musíte mít data

a vy data musej bejt

značkování té jako velmi důležitý slovo state pro slajdu kolečkové mít na to znamená že

vy víte co na nich je

znamená když děláte předáky systém tady

rozpoznaná

třeba auta

tak musíte vědět podle auto tile náklaďák todlencto je o oblast toho je probíjející kočka

prostě musíte mít nějakej základní databázi

kde na ty informace

který s toho potřebujete nějakým člověkem označkovat

přesvědč omdlívá daří

l t jako by největší jako trabl

se spoustou problémů že chyby dělat data a je těžký a drahý je

podobně jako jak to veronika mluvil vo tom zdravotnictví kde prostě ty data x s

tou sou prostě zapsat vím nějakých jako záznamy identických stih chtěj vyšetření a jsou prostě

rozsekaný pružný databází sou psaní různejma jazyka vás možnejma zkratka má nestrukturovaně

někdo to prostě že takle nepíše ale

a dráty na ty data do jednotky a formátu tak to je strašná práce

když jsou proč a jak by tisíce oznamuje ty přednášce zaznělo tak prostě tam se

nějaký člověka celkem předpisem vytahuje s těch nebo

takže ten r

rozsahu je zase

docela velká množina problémů kde tyhlety data vznikají samovolně jako nějakej vedlejší produkt toho co

třeba ten nebo y projekt nedělá sám sobě

prostě mi vidíme na co lidi pykaly na tom vebu cosi co si kupovali co

celé jako do komentářů

to znamená je i velká

velký množství dat který už máme označkování jaksi

jaksi mimochodem

a z běžní ho provozu tohle

a když máme ty data

tak si na uděláme to že naučíme model

neodvyknu moc do detailů co tento ten model znamená tam rabuje těch modeluje před tisícem

z nechal nějaké jaké modely vytvářet

základní princip f to

když máme

ronaku dál

a

je každýmu

prvku fí hromádce víme tak známí výsledek

tak můžeme naučit

tím algoritmem ten prostředek žemle učit nějakou černou krabičku abys těch dat predikovala ten sled

protože máme vobědy části napravo apod chraptivý je prostředek a ten algoritmem

získal ta učí

tak lomeno n

předhodím

a když dostaneme nový data

přijde novej člověk neví šlo r je nový vyhledávání do futex tou

tak si dáme ty nový data do toho modelu který máme natrénovaný a vypadne na

nová předpověď

ve vlastně to co děláme abysme pro novýho zákazníka dali lisknu správně doporučení

nebo pro novej vobrázek poznali jsme tam ten náklaďák nebo osobu

je tu se dostanu do tý druhý půlky

tam kojence tady learning

se vrátíme

chvilku do sedumdesát rychle

podle amerika

tak na to údajně vypadalo tady

a teďka nepamatuju že já jsem ještě nebo na světě ale todle sem s ten

našel internetu

tak proč sem se tam vrátil

takže funkce sedumdesátejch let

byl vynalezeny algoritmus

zpětný propagace neuronových sítí heuristiky byly užší známý před tím

ale to na co algoritmus je

jako by nakopnou a

to umožňuje efektivně učitelky době to nebylo moc ušní

tak neuronovou síť vám tady buše kreslil igora ukazoval vám tu animaci jak se jak

se naučila rosu poznávat ty červený tečky vokolo těch modrých

takže bylo vlastně strašně rychle nahoru nacpete nějaký data

pak je tam nějaká

skrytá vrstva která dělá poměrně jednoduchý matematický výpočty v podstatě to nějak i

vážený součet těch vstupů který tam shora padaj a pro že pro y nějakou sigmoida

outelová taky ignorovat popisoval můžete nějaká kladná křivka

a dole vypadnou výsledky

to se na konkrétním

příkladu nahoře můžete na třeba pixely sto obrázků a dole tady mít prostě je to

pes je to počkaj tobě tokům jako náklady

a nebo

cokoliv můžete tam dal nějaký vlastnosti složitý

a dole může vypadnout operovaná pravděpodobnost že se to zákazník koupí

případně byste do toho klidně mohl lidstva kudly výsledky data vlastnosti dokumentů vlastnosti dotazu a

doleva vypadne relevance

si neuronových sítě jsou poměrně univerzální

takže když do toho dáme nějaký

složitější data

co se třeba ty zobrazení

na nacpeme anglicky pro těmi vobrázky a chceme aby nám to neuronová síť tam dole

řekla

jestli je to letadlo autor nebo ta

tak už zjistíme že vono to na ty

na ty samotný pixely nějak jako u je vlastně strašně mizerně

a

neuronová síť kterou sem kras to na tom odkazem slajdu

jako třeba něco složitější

r by věc co se dělá teďka posledních s ledních na tech

g perník slyšíte tam to sou hodí

přišla hluboka

celá ta neuronová síť nemajou jednu skrytou vrstvu

ale má jich mnoho tady jejich asi

šest jako by těch skety dostat nakreslené

kde tam jako by nalevo byl ten obrázek je stejný napravuje tady něco stalo obrázku

predikuje

a mezi tu

těch sítí

každá každej tady ten čtvereček jako chtěl

sto krát sto neuronů

ty současný neuronový sítě sou hluboký pavel je tam

mraky těch spojů je tam taky nebo a sou naskládaný do veliký hloubky

a to že je teďka sme schopni takle naučit a sedmdesátých letech jsme toho schopni

nebyly je daný jednak tím že

máme mnohem

větší výpočetní výkon

jak na procesorech takle grafických kartách na ten se v metrech se to většinou pouštím

tak je to i daný tím že sme se naučil nějaký triky jak ty neuronový

sítě líp učit aby mohli by vůbec úvod ten samotný výpočetní výkon velikými nám nestačil

je potřeba udělat ještě trošku chytře víc než je se to dělalo

sedumdesátejch cache se

druhá věc

ten obrázek vypadá vždy první a ne předchozí

a všimněte si tam jednu věc se m s to byl

move pod

vrstvu ve stejný barvě

což není úplně a bude

já tady tu danou c dolní nacpu zvraty na jako před

ale dole si nedám

ty výstupní dat tam si nedám to jestli je to pes nebo kočka nebo náklaďák

na se tam zase zopakujte vstupní data

a proč jakou na jako blbost dělám proč jako by nutím neuronovou síť aby pro

nějaký data mi vodpověděla těma samej má data na čelte nesmysl bit data můžu zkopírovat

kontrol c konzolové a jako by mám to jsem to trhat nějakou jako složitou věc

je to proto že ta

prostřední vrstva

je nějakým způsobem

limitována

například tady vobrázky limitovaná tím že jsou tam dva neumím byste vidět čtyř

a tady jeden ze způsobů jak donutit tu neuronů sumu

aby sis těch dat vybral to co je důležitý

příliš neuronů síti řeknete les náš se tydlety vstupní na tady ty čtyři milióny na

dva do dvou neuron

a k prosince musí po něco pokusy musí se s pokusy teda to c na

tak zkomprimovat

musí si najít všechny důležitý

a jenom ty jakoby dvě důležitý čísla z nich jednička

já to tam

aby se aby se zpětně byla schopna

predikovat ten

ten původní

tyhlety dvě věci dohromady

se můžeme ne podívat na tu na tom obrázku

lets to je

první vrstva takovýdle to sem tady ukazoval směr auto enkodér

zde první vrstva která vznikne

zavedení návnad paměti obrázky a řekli sme ale ne o ten kodér

naučí se co je tam jako by důležitý

a vidíte že vám to tady našlo nějaký různý

vliv na obrázku jsou který jsou potom různejma volaná

a taky se to naučil hospoda však voba dva vydloubat

a teďka provedeme totéž ještě nula se mu řekneme s tady ty obrázků se naučí

něco zajímavýho

zajímavýho v tom smyslu že to predikuje ten původní vstup a tady jako lidi asi

poznáte že ten původní vstup asi to nějaký obličeje

za já sem tadleta algoritmu zůstal

dostal obrázkem obličejů

a říkal si naučil se z jednoduchý věci access naučil starat složitější věci

a pak se z nich neúčast na ještě složitější věc

a na to aby je to dvacet dělal já jsem i na ten je potřeba

mít označkován

prostě do já jsem do to algoritmů

no a milionů obrázku a řek

ale uč se

naučil z nich něco důležitý algoritmus i si vytvořil tohlect

a to je jako by novinka teďka poslední

šest sedum let řekla to nedělá

takže

další věc touškov ven tak je tak rychle protože my stejně dochází čas

je že

jsme se naučili nějaký triky jak je neuronový sítě eště lee

trénoval aby byly

aby byly

kvalitnější

a taky rychlejší

řekl vlastně důkladně jenom jeden z nich

je takové že u tý neuronový sítě která vypadá úplně

plně normálně

i třeba půlku těch vstupů

představte si postiženém ten druhej a ten štvrtej vstup jí úplně vynuluje prostě push pošlem

nepošle mít i data který má nízký databázi a pošli tam nuly

a tohle znam opakovaně prostě o čem to nám milionů iterací love polovině případů u

funkcí sítí nuly

místo dvě místa dyž správný na

dnes jsem se říká pro a

a dělám to proto

abych prosím naučil by robustnější

aby se vona nespoléhala na to

že nějaký konkrétní neuronů prostě má konkrétní hodnoty a s tou se na něco počítat

tím zatímní nutila by si měla poradila i tehdy když ty data nemám

jo je tam pořád první přirovnání kinetika napadlo jsi zaklepej do jednoho o a jako

projdete se tady

tak prostě stejně nenarazíte nebo prostě dáte si pozorně a jako zvládnete

tak to place jakoby způsob jak ty typy neuronových sítí

ti říct nějak si poraď i když nemáš všechny data to že je to strašně

jako typicky

že člověk nemá všechny data nebo ty data jsou chybou těch předchozí přednáška jste slyšeli

dvacet procent dat

ty byznysem to že s projektech je prostě špatně

tak ve stejném způsob jak je to c donutit aby se na ty špatný výsledky

nenahrazovat přesto odpovídá správně

jak není planinky doby todle sezona strašně těžký úkol nějakýho rozpoznávání

obrázku kategorií obrázku

a zatímco ještě před třemi lety ty výsledky byly

asi

kolem devíti procent jakoby správnost toho rozpoznání

tak teďka o moc nějakých learning k sítí

je tak lepší

druhá věc je rozpoznávání řeči sme tady měli hezkou přednášku před

před nějakou dobou

ty tradiční metody jestli se to stý přednášky pamatujete to sou ty tam s úzkými

chci model jestli zkreslil a takovejma modelem a

tak ty měly na tadydlecto na tom do co na to set nějakou chybovost

dvacet sedum procent

a zase teďka prostě

a to let padla to t

termy začne používat levných metody které jsou opět

téměř vo polovinu lepší že jako strašnej velky posud že do tý doby si je

patnáct let

když někdo zlepšil ten algoritmus vo nula celá na si procenta hnedka o tom napsal

research paper a všichni ho všichni a fall jaké je skalární

a se paušálně posouvala o tom aby to bylo čím dál tím lepší tak teďka

prostě během posledních tří čtyř ale eště ve stanfordu f torontu vymysleli algoritmy které jsou

mnohem lepší

konkrétně

řádů byl a name němuž to používají k provozu

pro nikdy tenhleten červené s oznámil že sice honit zatím použity tradiční metody ale že

už to taky přepínají na ty tady hluboký nenulový sítě

další příklad rozpoznání čísel

no to už docela dobrý teď je to ještě lepší

todle se podívejte to máme před přednáška bude na slajd šeru spousta opensource knihoven tu

stejnou nějaký výčet těch který

který mám ráda nějak použil

je to poměrně jednoduchý začít sestro vyučení ty pěkně nejsou kvalitní jsou slušně zdokumentování jsou

rychlí příjemně se v nich pracuje

push jsou s už jsem skoro na konci dovolený si jednu takovou vsuvku pokud by

brzy vámi byl někdo kdo vlastně chce pracovat s daty

má nějak i vlastní na a nějaký projekt vydal němuž vzdělanej nebo

jedna je méně práce

a chybí mu na to na to peníze a asi čas a soustředění

tak bych doporučovala přihlašte se do startup yardů protože ten na

deadline přihlášek zanedlouho

patnáctýho prosince

takže začne běžet tříměsíční program že tam skvělým tvořil jsou lidi legis praxe litru šéfové

firem musí zůstat se listi

který vám s tím můžu

pomoct

je tam i následné jiné modely pro investory

a jako jsou poměrně dobrý

třiceti c

euro za deset procent ve firmě

a osm nějaký ještě hračky jako volnej který to n nejsou tak ste jsou to

porovnej služeb software úplné ten že a tak dál

vlastně na konci

jedna jaká výzva nakonec

nejsme hodně mluvili vo tom že je dobrý ní data

a

panovník data nestačí

vezmete na ten data pro měli dáte sestro krásný grafy jako dobrý té eště ste

jako v oku znalost jako by nadprůměrně dobrý víš dokážete udal barevný graf ste jako

lepší než jako většina ještě

firem

a nevystačí pro

sto že uděláte brémy graf tak tím písmeny zákazníkům a uživatelů vlastně eště nepomůže

můžete tehdy když naději dat na tech uděláte nějaký rozhodnout nějakou změnu

a když to děláte lidskou silou tak se schopni udělat x změn za tejden

ale když toto zapojíte strom ničení který třeba každýmu konkrétnímu uživateli dá ňáky jinej výsledek

nějaký jiný tak zvaný doporučení nějaký kvalitnější a kvalitnější data

pak

jako tehdy slastně začne garantovat ta

tady investice kterou člověk dělá do toho že ty data nějak spravuje a

analyzuje

strongly účinně dobrých to že si poradí z velkým množstvím dál najde se tam

společný vlastnosti najde je schopni predikovat to co

oni nich chcete predikovat

tu slajdu jsem zapomněl jo to je vlastně je tady většina jestli studenti

co se dovolte vypsat nějaký čtyři možnosti co vlastně můžete dělat pokud vás

stojí učení zapomněl

existuje o takový soutěžní veby kde sou volně datasety ke stažení můžete se s nima

hra můžete soutěžit voproti ostatní týmů toho jak se s těma data dokáže akorát poradit

radistickým dokonce i vydělal peníze pokud ste se hodně dobrý

můžete propracovala vlastní projekt

buďto sami nebo se přihlásit do akcelerátorů

na dobrých universitách se taky jestli vyučení používá s neslyšeli zvěsti přednášky vo tom o

tom jak se používá tady

a

duše čeká je pak firem který ste učení nějak tak si

používá

ne všechno jako

delete nelze věří přednášku registry dohlídneme line tak modrásku kdy zjistíte že nestane tedy b

kdy sydney dráte řeknu kamarádili atributy ze garáží s výhledem

tak říct vodou že téhož teďka to za hlasový ovládaní víceméně vyřešený je duše tohoto

modulu nebo takovou

vyhledávání na mapě taky už neřešená vlastnost

a

to z to co chybí je teďka šeky se ukrajiny auta nebo teplot esli můžete

koupit vlastně teďka do doručí vám ho

počátkem roku v lednu forever já se to trošku pozdějc

pro vás po veřejnou po dálnici

ty

a u toho úhlu ty oni se vlastně pohybovat pět běžným provozu

ale ty ještě nejsou konečně k dispozici a vlastně ani mukl neřek žádnej termín ve

kterém by byl

znaj abych toho nadal tak za pět let

který děkuju ne nad nikde nějakou zakázku ne michael

nelze

ne

máme tomu víc třásně osm na akciovej zaprvé

takže sme měli to jak se chovaj ceny akcií měř k tomu ještě triky vo

ty konkrétní firmě

a vo jich pro data jsme ty data nějak dohromady

a učili sme nad tím

u jako musí použil sme open kodéry na to aby predikovali to

dopadlo to takže ty výsledky sou

jako statisticky signifikantní vtom že to dokáže no ten s něco se co se to

děje

a je s tou nějakej hlouběji zisk a poté co se bude čtu poplatky který

jsou vlastně came d ale stejně sou jako nemluví tak poštou šedou c mínus za

nemuseli bysme to ještě vylepšit na to aby to bylo

r mě použitelný

je možné nevaříme řízení by zajímalo když oblastech vidíte

největší potenciál a být na jedný budoucnosti m tomu vyřidí

já jsem že skoro všude kde máte velký data potřebujete nad nima něco předpovědět to

znamená

obraz a zvuk tam se použila už teďka lingvistika tam vlastně začíná používat

teď ale myslím si že to ještě nedospěl plně jako do praktického použití levicové vyspělý

skvělý akademickým výsledky

na ty reklamy dnešní se zatím moc hluboký sítě nepoužívají a to zejména protože tam

fungujou dobře i daleko jednodušší modely

nicméně i tam to vidím sledně tím nebude růst výkon současných počítačů tak bude možný

do toho dávat složitější modely a

tak jejich přidána prostě začne vykládce

když si nějaké

poslední jedné letenské

co způsobilo teďka rychlejší narůst do úspěšnosti těch

těch problém

podle mě jsou to ty tři věci k sem říkal na vyšší výpočetní výkon

možnost využívat i nebo značkování data kterých je prostě fůra mu to za nejsme limitovaný

tím že by nějaký člověk musel značková ty data

a třetí věc a

matematicky algoritmických triků který vylepšili ty neuronový sítě byly předtím tak teďka fully a rychle

nic

jak je ve moc děkuju nevěřím že to je oblast které s ve které bereme

hodně zdržujete kdysi budete dánsky sjedeme michelle