0:00:07těch _e
0:00:09to těch věcí
0:00:11o které jsem chtěl povídat napřed _e s _e rozpoznávání opakování dete dvojvé a pak
0:00:17se vrhneme do takové pěkné grafické prezentace _e skrytých markovových modelů kterou dělám lukáš budu
0:00:23bit burget mi vážený kolega
0:00:26a _e příště si to dám eště jednou _e se všemi možnými rovnicemi ale dneska
0:00:31to bude takové populárnější abyste si zatím dokázal něco představit tak _e poďme ještě jednou
0:00:38_e rozpoznávání řeči
0:00:41rozpoznávání řeči když to vezmu úplně jednoduchou se tak máte k dispozici dvě babky
0:00:48_e u té jedné řekneme že trénovací
0:00:51a o té druhé řekneme že testovací
0:00:59a máte říct _e jestli to testovací vacka odpovídáte trénovacího to znamená tady třeba ste
0:01:05ve trénování řekli slovo ano
0:01:08a _e testování je také slovo ano akorát že vyřčené nějakým _e třeba jiným člověkem
0:01:14a má to jiný časování a ten člověk může
0:01:17mluvit přes nějaký jiný mikrofon a vy máte říct _e jestli
0:01:22_e tady tahleta stovka odpovídáte trénovací nebo neodpovídá
0:01:27tak první věc kterou vtom _e rozpoznávání vždycky uděláme je že si udělal může si
0:01:33každou babičku rozdělíme na rámce
0:01:36probíhalo tady diskuze vo tom jak mají být dram se dlouhé a jak se mají
0:01:39překrývat tak takový typický rámcování je po _e dvaceti až dvaceti pěti milisekundách
0:01:48se překryvem ptát
0:01:50aby nám _e aby nám vyšla kladen se
0:01:54těch rámců každých deset milisekund takže teďka podle položíme složitou otázku
0:02:00když budou rámce když bude nový rámec každých deset milisekund kolik bude za sekundu
0:02:10to
0:02:11ahoj jako jo takže počítáme s tím že máme
0:02:15_e každou promluvu reprezentovanou maticí parametrů
0:02:20a
0:02:21teďka
0:02:22každý vektor tam máme
0:02:25po deseti
0:02:27_e minim po deseti milisekunda
0:02:30teďka mě zkuste říct co tak těch vektorek asi mohlo být
0:02:37jo tady ten žebříček který chceme teďka _e vybarvil
0:02:41tak to je vektor koeficientů zkuste mě říct jako kolibřík tak mohlo být a jaké
0:02:46asi jaké jsou takové prostě typické
0:02:49koeficienty
0:02:51který se používají rozpoznávání řeči
0:03:00tak
0:03:02mělo by nějak zachycovat spektrum toho daného rámce
0:03:07takže to bude asi něco postaveného na fourierově transformaci neměli by zajisté obsahovat žádný informace
0:03:13o fázi protože nechceme aby nám dělalo problémy když ten rámeček bude o jednu nebo
0:03:18dvě milisekundy posunutý a
0:03:20dyž prostě _e tu danou úvazku nakous nebo s tady nebo tady to jako nechceme
0:03:26aby se lišilo
0:03:27takže tam bude muset být _e nějaký _e brání absolutní hodnoty a nebo a nebo
0:03:33v absolutní hodnotě na druhou a ještě budeme možná C T aby to _m bral
0:03:38of úvahu nějaké poznatky o lidském slyšení
0:03:43eště budeme chtít spár dalších věcí kterým se dostane
0:03:46to co jsem teďka říkalo tak slyšeli nebo nějakých parametrech který by to je toho
0:03:50měli
0:03:51to znamená postaveny na frekvenční analýze
0:03:54brát v úvahu jenom _e
0:03:56jenom _e
0:03:58amplitudy a nebo výkony tedy amplitudy na druhou
0:04:03a ještě nějak integrovat to jak naše ouška slyší
0:04:07kepstrum by bylo asi docela dobrým funding kandidátem a těch různých variant kepstra to bude
0:04:13asi to mel frekvenční kepstrum
0:04:15co Š jsou vlastně opravdu
0:04:19notoricky znamená stále používané koeficienty rozpoznávání řeči jo takže maso co C
0:04:26jsou mel frekvenční cepstrální koeficienty
0:04:31jenom _e pro připomenutí vstupuje do nich _e
0:04:35rámec řeči pak se z něho vezme fourierova transformace s té fourierovy transformace se udělá
0:04:43_e absolutní hodnota na druhou potom to prochází nějakou je nelineární bankou filtrů takovými pro
0:04:51hraničky
0:04:53_e
0:04:54zase budu vám tam psat typické hodnoty jo takže fourierova transformace typicky na dvě stě
0:04:58padesáti šesti bodech
0:05:00samozřejmě je symetrická takže měření zajímá jenom jedna polovina
0:05:05takže sto dvacet osum bodu tady to má pořád ještě sto dvacet osum bodů těch
0:05:10trojúhelníkových filtrů tam typicky bývá _e dvacet tři takže tady prostě dostanete _e na konci
0:05:17dvacet tři hodnot každá hodnota je posbírána jedním tím trojúhelníkovým filtrem
0:05:22když si _e tady ty hodnoty na výstupu filtrů vyplo tneme tak to ještě pořád
0:05:26vypadá jako spektrum akorát takové hodně hrubé
0:05:31_e nižší frekvencích je _e reprezentativnější ve vyšších frekvencích je to prostě horší ze selektivitou
0:05:39protože se tam ty filtry ty trojúhelníky postupně do zřeďují
0:05:43potom se to nacpe do logaritmu
0:05:47_e tady tohle ze pořád ještě dvacet tři koeficientu a pak se aplikuje _e vlastně
0:05:53inverzní fourierova transformace
0:05:57která se protože to jednodušší implementuje pomocí tak zvané diskrétní kosinové transformace
0:06:03a výsledkem je tři na
0:06:05mel frekvenčních cepstrálních koeficientů
0:06:08teď si _e vám položím takovou otázku za pekli tou proč je tam ta inverzní
0:06:14fourierova transformace respektive deset _e
0:06:18proč už nejsem happy _e
0:06:21s tím s tím výstupem na výstupu
0:06:23na výstupu logaritmu zory když to vlastně splňuje všechno co sem řekl že by to
0:06:27mělo splňovat takže
0:06:29fourierka tam je fázi sme zahodili poznatky o lidském slyšení sem nějak využil protože tam
0:06:36ještě ta poslední transformace aby se s tím byly opravovat studenti nebo
0:06:41_e dobře míň hodnot tak proč třeba jako ne zkrouhnout těch třiadvacet a nevezmu z
0:06:46nich prvních třeba
0:06:51S T se to je blbá votázka máte pravdu je to tam jednak abych neumí
0:06:55hodnot ale eště tam ta inverzní fourierova transformacema jednu docela důležitou úlohu
0:07:02_e
0:07:03dozvíme se později skrytých markovových modelů
0:07:07že jim se hrozně líbí když _e tady těch třináct hodnot
0:07:11navzájem
0:07:13je nekorelovaných
0:07:14co to znamená
0:07:16jako _e lidským jazykem že ty hodnoty jsou nekorelované
0:07:23čtrnáct tak na vás takhle blafne nějaký matematik
0:07:27_e že bych chtěl aby tady těch třináct hodnot bylo nekorelovaných co tím kteří
0:07:34je jedna by neměla záviset na druhého když se když se podíváte tady na tuhle
0:07:39tak pokud sou nekorelované tak nemáte ani ponětí vo tom jaká bude
0:07:44jaká bude
0:07:46ta stavu dva _e odvaž opičky vedle
0:07:49no a když si představíte to logaritmické spektrum které pořád ještě vypadá jako normální spektrum
0:07:55takže nějak
0:07:57nějak takhle a tam se kouknete na dvě nebo tři hodnoty vedle sebe tak jsou
0:08:01tam korelované nebo nekorelované
0:08:04docela těžce korelované jo protože sedí vedle sebe ve spektru to znamená velice _e říká
0:08:10se setkáte s tím že by ty hodnoty lítali nějak úplně nezávisle na sobě
0:08:15jo takže ta _e poslední transformace
0:08:18a inverzní fourierka neboli
0:08:20diskrétní kosinova
0:08:22je tam _e jednak proto abych šel dimenzionalita u dolů ale taky pro to aby
0:08:27se ty jednotlivý
0:08:29aby se ty jednotlivý koeficienty _e de korelovaly
0:08:33doby to _e by se tím chtěl zabývat trošku
0:08:37hlouběji
0:08:38tak _e tak řekněte já vám _e pošlu třeba nějakou tabulku nebo grafiky s bázemi
0:08:45tady té diskrétní kosinové transformace
0:08:49vidíte že to není žádná strašná věda protože vlastně to třiadvaceti bodový spektrum se napřed
0:08:55pro mít a
0:08:57tady do takovédle báze
0:08:59co to je
0:09:00takovejhle signálových nakreslím nebo takle
0:09:03stejnosměrná složka přesně tak potom
0:09:07i tam byla nějaká takováhle _m
0:09:09co to je
0:09:12_e pozor základní frekvence ne protože teďka sem ve spektru mám třiadvacet bodu ve spektru
0:09:17a snažím se je promítat do nějakej
0:09:20do nějakejch útvaru tajnou pak tvaru
0:09:24tady todleto jestli mě s zrak neklame tak je půlka periody kosinusovky
0:09:29jo proto se ta transformace taky jmenuje diskrétní
0:09:33kosinova další _e další ten signál vypadá takhle to vlastně celá perioda kosinusovky pak mám
0:09:40pocit že sou tam na
0:09:42_e že tam jeden a půl a takhle to postupně roste a roste a vlastně
0:09:46přidáváte _e se kosinusovce na frekvenci
0:09:50_e
0:09:51když se vezme na ty jednotlivý báze podíváte
0:09:55tak _e
0:09:56tak dejme tomu u té u té první a druhé
0:10:00co byste voni dokázali říct jako z matematicky jo
0:10:03z hlediska
0:10:05prošli stejného ortogonality je
0:10:09já vím že po ortogonalitou si člověk představí doma když jako se nalepí nějakou políčku
0:10:14a teďka vona jako
0:10:16D ze zdí pod pravým úhlem tak to je ta z dobrá lidská hordu ortogonalita
0:10:20to znamená ortogonalita _e matematicky
0:10:26_e podobnost ne právě že vůbec ne
0:10:29kolmost no jasně
0:10:30pro opravu vlasta jak byste tu pravou los třeba _e třeba počítali u dvou vektorů
0:10:36byste měli takhle jeden vektor a takhle druhej vektor ten bude mít souřadnice X jedna
0:10:41Y jedna tady ten nebude mít X dva Y dva
0:10:47skalární součin super a teďka sem vám tady nenamaloval _e vektory ale dvě funkce
0:10:54že to že na nich ještě pořád pude udělat skalární součin
0:10:57bude v pohodě
0:10:59každým bodě takhlek
0:11:00takhle bysme to asi dokázali numericky a dokonce my sme to dokázali aera a její
0:11:05analyticky takže vlastně si ty funkce pronásobíme s každičkým bodě a pak to zintegrujeme taky
0:11:09to bude skalární součin
0:11:11a když si představíte skalární součin tady těhletěch dvou funkcí tak tady tahleta je furt
0:11:16say na tahle tede s kladné části záporné části
0:11:21takže jejich _e skalární součin bude nula a kdybyste si podobný myšlenkový cvičení nebo když
0:11:26by nestačil mozek tak si to můžete udělat matlabu vyzkoušeli pro jakékoliv další pár _e
0:11:31baví tak zjistíte že sou vždycky _e vždycky na sebe kolmý přes ortogonální
0:11:38jo a pokud člověk něco promítne do ortogonálních bází
0:11:42tak má docela velkou šanci že _e ten výsledek bude mění korelovanej nečteš to do
0:11:48co do toho budete strkat
0:11:50takže to jenom to bylo jenom pár slov výběru tady těch parametrů a proč je
0:11:54tam za poslední krabička
0:11:59všechny navzájem
0:12:01když mimochodem když si vyzkoušejte totéž fourierovu transformaci
0:12:05se kteroukoliv variantou radost do B S T
0:12:09F Ř do sopel jakýkoli se to
0:12:12tak _e vám ta ortogonalita vždycky
0:12:16vždycky vyjde čtyři to vyzkoušet prostě vopravdu matlabu nebo na papíře
0:12:21zkoušet jo vy vychází tady s těma komplexníma exponenciálama
0:12:26tak
0:12:27takže tím sem zdlouhavě chtěl říct
0:12:31že v těchto vektorech mám nějakou sadu čísel
0:12:35kterými budu každých deset milisekund reprezentovat svůj vlastní takže
0:12:40zkusím tady ten zmatek po mazat
0:12:50_e
0:12:52tady budeme mít jednu maticí parametrů
0:12:59tady budu mít druhou maticí parametrů zase abychom si udělali představu vo nějakejch reálných číslech
0:13:05tak _e počet těch koeficientů
0:13:08základní přiblížení je třináct tak se mám teďka maloval
0:13:13s tom krásným muset co schemátku
0:13:16hodně často řekněme ještě přibírají tak zvaný _e delta parametry a delta parametry to myslíte
0:13:22že to bude
0:13:23čím
0:13:25čím each co se značí deltou takhle jako
0:13:28jo
0:13:30_e chyba nebo nebudeš něco jinýho rozdíl jsem tady zaslechl
0:13:34jo dokonce jako se s _e se _e s tím potkáte v reálným světě
0:13:39když budete dělat na nějakým projektu
0:13:42tak _e váš blíž S
0:13:44máme na schůzce týdnu té řekne tak jaká je delta moc týdne od minulýho týdne
0:13:50ale teďka jako musíte nastoupit potáhnou si to kravatu jako říct tak jako udělal jsem
0:13:54to toto jo takže delta se používá jako _e synonymum rozdílu nebo
0:14:00_e dobře a _e rozdíl děleny časem
0:14:04je co
0:14:09když sedím autě
0:14:11a v čase T sem tady
0:14:14a za vteřinu sem tady
0:14:17tak rozdíl těchdle dvou drah
0:14:20je rozdíl drah a děleno časem je takovéto co
0:14:24takže to rychlost jo takže prosím vás těm delta parametrům
0:14:28se taky někdy říká rychlostní
0:14:37a pak sou delta parametry
0:14:40a tím se říká jak
0:14:42akcelerační jasně víte výztuž to umíte
0:14:46tak
0:14:47jo angle anglicky vytékalo bylo asi bylo si ty
0:14:50_e tady toho vektoru jsem to si piš úplně stejně skoro taktika mně ještě řekněte
0:14:55když máme _e takovýhle
0:14:58takovýhle vektor tam je třináct koeficientů
0:15:02jak byste k tomu ty rychlostní parametry spočítali
0:15:14jo vlastně otázka je
0:15:18jaká je rychlost změny
0:15:20každýho jednotlivýho parametrů dobře podle to zjednodušit nebudovat i ochromovat vektorem třinácti parametrů
0:15:27ale každej deset milisekund něpřijde jedno čísílko jeden parametr
0:15:33a aby chtěl vědět
0:15:36jaká je rychlost jeho změny
0:15:41jak byste to dali dohromady
0:15:46je sebe co
0:15:50třeba změnou hodnotou že jo tak byste si vzal minulou hodnotu
0:15:54a ty dvě byste navzájem odečetli
0:15:56a buď se to může podělit nějakou hodnotou časovou nebo nemusí vone to úplně jedno
0:16:02a dostanete pojem o rychlosti a rozpoznávání řeči se dělá úplně to samý akorát se
0:16:08těch hodnot bere _e bere trošičku víc
0:16:11většinou se bere okno který má _e kterýma
0:16:15pět hodnot
0:16:17to znamená pro ten pro ten současnej pro tu současnou hodnotu kterou bysme označili té
0:16:24tak _e se tam bere nějaká funkce která má tuším tady koeficient nulu
0:16:30tady má jeden a půl tady má jedna tady má mínus jeden a půl
0:16:35tady mám mínus jedna a vlastně takovýmhle okýnkem se ty _e jednotlivý _e jednotlivý hodnoty
0:16:42pro násobí
0:16:44pak se to všecko sečte
0:16:46a dostanete pojem o rychlosti
0:16:49tak teďka se vás nebudu ptát
0:16:52dál
0:16:53_e kdybyste si tady tohleto představili jako číslicový filtr
0:16:58jo protože to je skutečně číslicový filtr který má takovouhle
0:17:02_e takovouhle impulsní odezvu
0:17:06jo
0:17:08tak _e co by to bylo za filtr jako by měl kmitočtovou charakteristiku
0:17:16tak jako takhle se občas nakláněla nějaká fáze jo na přednáškách něco se na fázi
0:17:20zapomeňte tady tohle
0:17:21tohle sou hodnoty _e
0:17:24hodnoty koeficientů toho filtru
0:17:34a nebo si vezměte ten váš minulej ten sobě no moc ode odečítal dvě sousední
0:17:39hodnoty od sebe ten by měl jako kmitočtovou charakteristiku
0:17:44jak a
0:17:46no proto
0:17:47ano horní proč horní
0:17:54protože zesiluje změny a kilo je jakýkoliv pomalý
0:17:59pomalý pohyby stejnosměrnou složku věc spolehlivě kilo jo když byste měli vedle sebe dvě stejný
0:18:04hodnoty tak stejná mínus stejná je nula prostě tam nezbyde nic když to změny bude
0:18:09_e změny bude posilovat
0:18:11ano prosím vás se pokusím světla řada jedna
0:18:18a
0:18:22a tady toto sou zeslabit protože
0:18:25usuš je to dobrý dyž usušen atomy vidět no změnilo se vůbec něco
0:18:30aha
0:18:37rešerše taky žaluzie dolů a nahoru se jan indexu
0:18:41no nic tak
0:18:42to snad s na to půjde
0:18:45tak _e dobře takže víme jak udělat _e jim jak udělat rychlostní koeficienty tím že
0:18:50každou každý vlastně časový průběh koeficientu pro filtru takovýmhle jednoduchým _e filtříčky mac bysme to
0:18:57udělali ty akcelerační
0:19:01těch rychlostní to udělám ještě jednou že jo a je to
0:19:05jo takže prosím vás jenom vás chci _e na vést k tomu že taková typická
0:19:09velikost vektoru
0:19:11kterým reprezentuju jeden rámec řeči
0:19:15by byla třicet devět
0:19:18ten magický číslo pro rozpoznávání řeči
0:19:21třináct kepstrálních koeficientů třináct délce
0:19:25a tři na vojtech del
0:19:29takže třicet devět
0:19:31float u
0:19:32velikost jednoho vektoru
0:19:34teďka mě řekněte když mám třeba vteřinovou promluvu
0:19:38jednadvacet nebo létající prase nebo něco takového inteligentního kolik těch vektoru bude
0:19:43do to ještě nezapomněl
0:19:47to
0:19:48jo tak
0:19:49uvědomte si že pracuju prostě
0:19:51zhruba cestovkou vektor nebo ne zhruba přesně cestovkou vektoru za sekundu
0:19:56tak
0:19:57a teď se konečně dostávám k tomu _e rozpoznávání
0:20:02kdy vlastně tady mám takovouhle krásou matici s parametry tady mám taky takovou krásnou matici
0:20:08s parametry vám tady tyhle dvě navzájem srovnat
0:20:11tak zkuste měří s C pokud byste tady tohle
0:20:16srovnali dejme tomu zmenšováním řetězců jo máte řetězec _e znaků metající prase
0:20:25a pak máte druhý řetězec znaků
0:20:27a chcete zjistit jestli bylo řečeno létající pro se nebo ne
0:20:30a teďka tady máme takový matice _e řečových rámců tak mě zkuste popovídat taky tam
0:20:35budou rozdíly
0:20:41no pro první rozdíl bude ten že dva _e dvě písmenka můžete match note přesně
0:20:46nebo ne prostě lo
0:20:48jo a není to nic jinýho jo
0:20:51jedno do
0:20:53dva řečové rámce nemůžete match know přesně protože ani ten samej člověk ani přesně stejných
0:20:59podmínkách to nikdy nedá tak aby těch devětatřicet čísel těch float u bylo uplně přesnej
0:21:07že budeme muset _e se uchýlit
0:21:10buď k měření nějakej vzdálenosti a to ste viděli _e
0:21:14s budete véčka zaliju a ještě to tady _e ještě to problém jednou a nebo
0:21:19se budeme muset uchýlit k nějakýmu modelování statistickým u
0:21:23když si třeba řekneme uděláme model teďka vlastně pots ten modelu vložím jaksi ty _e
0:21:29ty naměřené parametry a podívám se jak moc ten model bude pálit jo a tady
0:21:34toto pro mě bude míra _e míra podobnosti
0:21:37takže
0:21:38tohle bude jeden problém jo modelování nějakejch rozložení nebo měření vzdálenosti
0:21:44druhej problém bude
0:21:45co
0:21:51ne to může být česku jinak dlouhý jo prostě _e napsané slovo ahoj má pořád
0:21:57čtyři písmenka a když je to jinak tak to je špatně
0:22:01_e řečené slovo ahoj může mít čtvrt vteřiny
0:22:05když to říká
0:22:07ostrava takové ahoj
0:22:08tak to bude mít šestnáctinu vteřiny a když to ve říkat želva tak to bude
0:22:12z dlouhé dvě vteřiny a pořád to bude to samé slovo to znamená že se
0:22:16rozpoznávání řeči se nevyhneme nějakému časovému srovnání časové normalizaci
0:22:23jo a teďka ještě aby to bylo složitější
0:22:26tak _e
0:22:28souhlásky
0:22:29který _e dvou natáhnout
0:22:32a souhlásky který nejdou natáhnout _e když budete po někom chtít
0:22:36aby _e kdy řeklo slovo prase _e
0:22:40dlouze tak že si řekne práce
0:22:45jo a no můžete si vyzkoušet klidně _e tetě si jistě všimnete že _e na
0:22:51_e na samohláska toto natažení dokázali udělat
0:22:55ale třeba na plus vývě to
0:22:57prostě žádný natažení nebude
0:23:00jo to znamená pokud by někdo měl výborný nápad ten
0:23:04že mezi těmito dvěma sekvencemi udělá lineární srovnání časové to znamená že
0:23:09_e si řekne tady tohleto je délka nul
0:23:13a tady tohle je délka měl
0:23:16a teďka si udělám nějaký přepočítala tý koeficient který bude funěl lomeno L
0:23:21a změnám sobě na _e tato tady jako pojedu nějakým indexem ten indexy vynásobím kontaktu
0:23:28měl lomeno D a pak to zaokrouhlíme dolů na celý rámce abych mohl indexovat tady
0:23:34tak je to předem odsouzeno
0:23:36neúspěchu jo protože to _e protože to takhle funguje
0:23:40takže budeme potřebovat nějaký nějakou techniku
0:23:44která
0:23:45si vlastně to indexování dvou sekvencí bude řídit úplně sama
0:23:50a bude sama vyhledávat ty místa který spolu co nejlépe sedí jo
0:23:58no a teďka už se dostáváme postupně _e kde se dvojí véčku
0:24:04_e zase budu muset podívat do nějaké přednášky abych
0:24:08abych _e měl správnou
0:24:12správnou notaci
0:24:16_e jo délka
0:24:18délka referenční promluvě R vilka testovací promluvě to
0:24:24změny zase musel vědět
0:24:27jo takže tady tohle by bylo reference a tam a R frameu
0:24:32a ten test má
0:24:34to frameu
0:24:36a teď těch _e si udělám to že já si _e zařídím
0:24:43dvě
0:24:46_e neřekl bych nezávislý ale dvě indexovací funkce
0:24:51první se budeme nula jmenovat erko
0:24:54a druhá se bude jmenovat řekl
0:24:57a rok to vlastně bude poloha indexu ste referenční sekvenci takže semka někde bude ukazovat
0:25:04řekl
0:25:06a sem to bude ukazovat řekl
0:25:10a budu si muset ty dvě indexovací sekvence řídit tak aby byly vždycky nejlepší
0:25:16_e
0:25:18asi jehož tušíte
0:25:21že budeme muset
0:25:24mít
0:25:25nějakým způsobem zajištěný když _e tady bude mít prostě na indexoval i
0:25:29v referenci jeden vektor
0:25:32zrovna tady tenhleten
0:25:36a testu budu mít na indexovány taky nějaké vektor
0:25:39tak my musíme mít nějakou možnost S rovnat co byste doporučovali na srovnání dvou dlouhej
0:25:45devět a třiceti prvkových vektorů
0:25:52dobrý tak vidím že to je složitá otázka
0:25:55když máme dvě čísla Á a B
0:25:59tak byste je srovnali jestli sou podobný nebo nejsou
0:26:05si
0:26:07rozdíl bezva
0:26:09rozdíl může být kladné nebo záporné kde se mně nelíbí a nechci aby šlapanic do
0:26:14brna byla záporná vzdálenost
0:26:16tak nemohli takhle třeba ne
0:26:18a vy se to dobře počítali bysme to mohli dat jako na druhou ne
0:26:23a řekněte mě tady tohleto
0:26:26počítá
0:26:30tam se můžu zbavit že jo to je _e
0:26:37ne moment lomeno nekecám
0:26:42prostě absolutní
0:26:44hodnota no já bych
0:26:46nedokázal spočítat jako taky druhou odmocninu
0:26:50N
0:26:51a mínus B na druhou
0:26:53tak proč myslíte jsem to dělat takhle hrozně složitě
0:26:58ne
0:26:59ale jo
0:27:01tak _e teďka budu mít dvouprvkový vektory budou mít _e vektor Á jedna dvě
0:27:07který mě bude určovat _e
0:27:09zetové souřadnice jedna souřadnice dvě tohleto je
0:27:13vektor Á jedna a dvě
0:27:17_e budu mít _e vektor E B jedna B dvě
0:27:26a já budu chtít vědět jak tady vzdáleno
0:27:30jak na to
0:27:33perfektní tak toto tady uši nadefinuju nějakej pojem jako de tlustý _e jako že vektor
0:27:40tlustý B jako že vektor
0:27:42_e bude druhá odmocnina
0:27:45_e
0:27:47B dva mínus B ježíš maria
0:27:54B dva mínus a dva
0:27:57na druhou
0:27:59plus
0:28:00B jedna mínus A jedna na druhou
0:28:03super tak takhle bychom to asi dokázali jo na když budeme mít teďka devětatřicet ti
0:28:07nebo obecně nějaký P rozměrný vektory takto budeme dělat úplně stejně to znamená de
0:28:14a
0:28:15tlustý bude zase druhá odmocnina a teďka to tam budu asi muset uzavřít do nějaké
0:28:20sumy protože bych psal
0:28:22zase mimochodem jednou viděl v nějaké písemce
0:28:26_e sem dal nějaký prostě jako
0:28:28výpočet který vedl na
0:28:30_e na geometrickou sekvenci a očekávám takhle kratičký jako vzorec a
0:28:35budete tam rozepsal a když popsal tři řádky tak tam napsal a to už bych
0:28:39se psal
0:28:41tak ale mně to dobře dostupný počet bodů
0:28:44_e takže bychom měli _e dimenze těch vektorů beka mínus tak a
0:28:50a káčko bylo vod jedničky do P kde P je velikost vektoru a tady tohle
0:28:56by bylo
0:28:57na druhou jo takže euklidova vzdálenost prosím vás se počítá úplně stejně ve dvourozměrným jako
0:29:03v deviza třiceti rozměrným prostoru akorát že to byly do třiceti rozměrným se to dá
0:29:07trošku hůř _e
0:29:09Ú S
0:29:11_e pochopit a představit
0:29:15tak
0:29:19_e dobře
0:29:22co sem tím chtěl říci
0:29:26chtěl jsem ti říci to
0:29:29že
0:29:30když si ten referenční
0:29:33vektor
0:29:35nebo referenční sekvenci
0:29:38referenční promluvu
0:29:39teďka se zase musím pardon podívat i jestli u maluju vodorovně nebo
0:29:44jo referenci jsem maloval svisle tak dobrý
0:29:49tak
0:29:52zase si že tady tohleto je referenční promluva
0:29:58jo K každej ten vektor obsahuje devětatřicet čísel
0:30:02tohleto je testovací promlouval
0:30:11a teď _e si budu schopný spočítat takovouhle matici
0:30:16která se bude jmenovat matice lokálních vzdáleností a to nebude nic jinýho než prostě
0:30:23vzdálenost
0:30:24šest vektoru každý s každým jo prostě tady když vezmete ten vektor druhé vektor tady
0:30:31na tomhle puntíků matici najedete vzdálenost _e nebo ne najdete spočítáte si pomocí vobyčejná _e
0:30:38euklidovy vzdálenosti vzdálenost tady těhletěch dvou vektor
0:30:42jo takže máme dej dejme tomu li tady tato promluva _e jednu sekundu a tady
0:30:47tato _e promlouvám Á nula celá sedmdesát pět
0:30:51sekund tak mám sedmdesát pět krát to
0:30:54_e takovýhle lokálních vzdálenosti to je hrozně hezký ale bych potřeboval jenom jednu jedinou která
0:31:01mě bude kvantifikovat jak moc je ta testovací promluva blízko referenční
0:31:08a eště sem říkal by bylo dobrý _e kdyby ta _e kdyby tam vzdálenost nějak
0:31:14zohledňovala optimální na skládání těch _e referenčních a testovacích vektorů na sebe
0:31:23tak
0:31:23teďka bych od vás chtěl
0:31:25nějaký rady protože my _e tu jednu vzdálenost
0:31:29asi nebude ochotně počítá jako třeba sumu tady těch čísel toto byl nesmysl že jo
0:31:34co by bylo potřeba udělat
0:31:36teďka je _e téhleté velké tabulce si nadefinovat nějakou srovnávací cestu
0:31:44jo
0:31:50tak
0:31:51která bude říkat který vektory se spolu budou _e srovnávat
0:31:57a po téhleté cestě se bude počítat a finální vzdálenost takto se vám tam nelíbí
0:32:01a testy
0:32:03ta smyčka že jo
0:32:05_e
0:32:06dobrý ten ani blbě proč to tam proč jako zrovna ne
0:32:12_e _m můžou _e
0:32:17ale _e dal srovnávací cesta by měla respektovat to že řeč plyne
0:32:22prostě jako v odleva nebo od minulosti
0:32:25do budoucnosti a nemůže se mění jo to znamená zase stavím _e obou těch směrech
0:32:31měla být
0:32:32tak to řekne matematicky
0:32:34_e
0:32:35no funkce může být celkem cokoliv ale ne class neklesající menu
0:32:41pole může být může být konstantní
0:32:44jo
0:32:45ta funkce může být konstantní proč protože _e právě jedna _e jedna promlouvání kratší druhá
0:32:51je delší a vy můžete chtít aby se jednomu _e testovacímu frameu na rovnalo tady
0:32:57třeba deset jo deset frameu _e referenčních pokud
0:33:02se to vašemu algoritmu vedle líbí jo takže jako konstanty tam být mohou
0:33:06ale nemělo by to rozhodně klesat nemělo by sto dvacet
0:33:10to byste ještě u té cesty
0:33:13_e očekávali takový
0:33:16inteligentní
0:33:18_e
0:33:21to vlastnosti který by to cesta měla mít
0:33:26říká se budov tato úplně plně houpej oleg dobyta cesta měla začínat
0:33:32na začátku že by měla končit
0:33:35na konci jo takže jako bylo by fajn kdyby ta cesta začínala tady
0:33:40a končila tady
0:33:43_e to by eště bylo fajn
0:33:46kdy bylo to kdyby ta cestám byla
0:33:51_e nějakým způsobem regulovaná co se týče si ho maximálního _e maximálního skoku
0:33:58nebo kroku
0:34:00jo a ten krok si většinou řídíme takže tato _e velice konzervativně takže ta cesta
0:34:05prostě může udělat
0:34:06_e jeden posunu s testu
0:34:09a žádnej v referenci
0:34:11nebo může udělat jeden posun v referenci a žádnej testu
0:34:15a nebo může udělat _e jeden krok v referenci I testu tímhle zajištěny se nám
0:34:22to press cesta taky vez buben vezme všecky vektory a nebude _e že nějak nesmyslně
0:34:30nebude nějak nesmyslně přeskakovat
0:34:32jo a pokud už jednou máme takovouhle testu cestu _e nadefinovanou
0:34:38tak _e my si můžeme nějak označit se a teďka nevím jak jsem to měl
0:34:43přednášce
0:34:46_e tady sme co
0:34:52protože tadle zase to sem nebudu jmenovat co
0:34:56a teď si můžeme definovat podle tady této cesty dvě _e ta cesta bude popsaná
0:35:02nějakým
0:35:03svým krokem
0:35:07jakým prostě počítadle _m počitadlem K normální hodnota která valí vod jedničky až do až
0:35:13do délky té _e cesty
0:35:16a _e budeme mít dvě indexovací sekvence první bude rok _e
0:35:22a ta bude indexovat referenci a druhá bude to K
0:35:27a to bude indexovat _e test a obě dvě tady tyhlety funkce závislý na _e
0:35:33nezávislým parametru K budou dávat dohromady cestu jo
0:35:39tak _e teďka mě zkuste říct _e
0:35:42pokud teda mám takovýhle _e takovýhle omezení pohybu té cesty to znamená
0:35:49kdybysme to napsali tak budič
0:35:52_e buď červ K
0:35:54_e
0:35:56plus jedna
0:35:58rovná se
0:35:59rok _e
0:36:01plus jedna a
0:36:04_e
0:36:05a to K plus jedna
0:36:07rovná se to K
0:36:10nebo
0:36:11jo tímhle vlastně zapisuju teďka podmínky nebo rok N plus jedna
0:36:17a toto napíšu jednoduše jo se nehýbe
0:36:21a _e
0:36:23a to je to plus jedna rovná se
0:36:26tak _e plus jedna
0:36:29nebo
0:36:30nebo obojí
0:36:32tady to je teda matematicky zápis jako blázen ale na ten přesnej se podíváte do
0:36:36slajdů
0:36:37takže pokud mám ty podmínky takto definovány tak mně řekněte jaká může být maximální délka
0:36:42cesty
0:36:45přesně tak jo tady když _e
0:36:47to reference má délku R a test má délku velký T tak maximální délka cesty
0:36:53bude _e bude R plus to
0:36:57tak
0:36:58R růstu
0:36:59jo protože nejhorším za _e možná alternativa že tam dostanu takhle
0:37:05a nebo takhle
0:37:07a všechny vostatní sou kratší
0:37:10tak _e
0:37:13tetě _e
0:37:16bychom si mohli jiří
0:37:20jak
0:37:21bude
0:37:23_e jak se bude počítat _e váha nebo vhodnost
0:37:27každé té cesty
0:37:30koncovým co byste mě poradili jak rozlišit jestli nějaká cesta dobrá nebo špatná
0:37:40dobrý a teďka jako by to asi chtělo nějakou formu ku jak to spočítat
0:37:46takže dobro cesty
0:37:49_e
0:37:50to budeme značit asi D kordisté řekl nějaká vzdálenost
0:37:54bude vlastně
0:37:55počítat prokl se rovná jedna
0:37:59_e
0:38:00teďka nemám žádný písmenko na _e na počet
0:38:05roku té cesty
0:38:06tak dejme tomu velký K jako C
0:38:10a tam bude ta lokální vzdálenost a teďka čeho
0:38:16dvou vektorů
0:38:18v referenci na ten vektor ukazuje
0:38:21tady tahleta indexovací sekvence
0:38:24a s testu a ty vektory ukazuje tady tahleta sekvence a teďka nevím zase jak
0:38:28se _e značili ty jednotlivý vektory aha testovací s označil o a referenční R a
0:38:34protože sou to vektory tak musí být tlustý
0:38:37takže o
0:38:40tak jo
0:38:44a R
0:38:47jako
0:38:51_e
0:38:52tak a teďka _e prosím vás
0:38:55mě tam ještě něco
0:38:57chybí
0:39:03na určení dobu dosti každé cesty
0:39:08_e vzdálenosti nebo čím přesně
0:39:12R podporu poďme postupně
0:39:15když _e vlastně udělám takovýhle
0:39:19_e když udělám takhle počítání té jedné
0:39:22to je jedné _e lokální vzdálenosti dvou vektorků
0:39:27tak _e já musím nějak zohlednit jak jsem se tady do téhle tvoje dvojice vektorku
0:39:32dostal to buď může být vlastně tady
0:39:35nebo může být tady no můžu by tady
0:39:37a teďka přichází na řadu nějaká penalizace
0:39:42jo nebo _e
0:39:44znevýhodnění té které cesty
0:39:47a já to udělám fikaně a řeknu tak když jsem se pohnul jenom v jednom
0:39:51směru
0:39:53tak bude váha tady téhleté _e lokální vzdálenosti jedna
0:39:58jsem se pohnul tady
0:40:00jiným směru ale zase jenom v jednom tak bude váha dvě a teďka pozor tak
0:40:06to bylo jako za komunistů jo to znamená jako ten kdo pracoval mosazí base rychleji
0:40:10tak jako ještě
0:40:12ještě si ho podali tak
0:40:13to je úplně dete ve je úplně stejný to znamená pokud se pohnou příliš rychle
0:40:18obou směrech
0:40:20tak _e to povolím
0:40:22ale dám tomu váhu dvě
0:40:24to znamená tady toto vlastně bude zatíženo takovýdle pohyb větší vahou jo takže tady přidáme
0:40:29nějaký _e nějaký koeficient
0:40:32který bude
0:40:34_e který bude záležet na mým pohybu cestě a pravé sme si řekli jakou váhu
0:40:39že když se pohnu takhle tak to bude jednička když takhle tak jednička
0:40:44když takhle na šikmo tak
0:40:46tak dvojka
0:40:48_e
0:40:51který udělám jakou velkou čáru
0:40:54a
0:40:55tuto spočítanou mu na kumulovanou vzdálenost budu něčím potom chtít podělit po normovat
0:41:03čím byste asi ten řekli
0:41:06prosím
0:41:09bacha délkou cesty ne pozor a dycky když máte nějaký vzoreček
0:41:13tam je suma nějakých hodnot které jsou násobený určitými vahami
0:41:17jo protože ty dvojice krásová
0:41:19a pak vám řeknu bude se normovat tak a jsou tam vlády
0:41:24bacha maximální délka temene vzorečku jsou váhy _e
0:41:28sumovat přesně tak jo vždycky když nic neuvidíte něco takovýho a je tam dole normalizace
0:41:34tak je tam prostě suma vach
0:41:36jo
0:41:38takže tady bude suma všech dva
0:41:43tak
0:41:44kolika suma vach asi tak je
0:41:55to zkuste popřemýšlet kolik ta smlouva asi tak bude klidně si nakreslete na čtverečkované papír
0:41:59nějakých pár obrázku
0:42:02stanic kolik to asi to bude
0:42:07no ste R plus T vlastně byl kate referenční promluvy
0:42:12plus délka testovací promluvil
0:42:15tady tenhleten setup nebo _e tohleto nastavení vás má tu výhodu
0:42:20že opravdu ten normalizační faktor
0:42:22pokaždý bude úplně stejnej
0:42:25bude to R mluvte
0:42:27cože hrozně fajn
0:42:29protože _e nám to velice zjednoduší věci
0:42:34výborně
0:42:35mám krásný velký vzoreček
0:42:39pro _e výpočet srovnávací
0:42:42_e nebo pro výpočet vzdálenosti těch dvou sekvencí po jedné cestě
0:42:48takže teďka _e nic nebrání tomu abych si tam na tahal všechny možný cesty
0:42:53že jo
0:42:55pro každou spočítal tady tuto hodnotu
0:42:58a pak si vybral jenom jednu jedinou která bude reprezentovat srovnání tady těch mých dvou
0:43:04_e promluv která to bude
0:43:13jak a
0:43:14nejmenší před přesně tak nejmenší vahou protože tam si vlastně budu jistej že se k
0:43:18sobě narovnali vektory kterých _e nejlíp sedí který každá dvojice budou mít nebo ne každá
0:43:24bude mít minimální vzdálenost ale sumě
0:43:27dosáhnu minimální vzdálenosti
0:43:30jo takže ještě jednou mohl bych
0:43:32pro zkoušet teďka všechny možný cesty
0:43:35ukažte vyhodnotit tady tu do C
0:43:38pasivních vybrat co nejmenší asi jo P mám jednu hodnotu dete ve vzdálenost
0:43:44a tahle bude _e výsledek
0:43:47mýho srovnání
0:43:49akorát že by to asi dalo trochu práce že jo
0:43:52tak _e poďme zkusit zapřemýšlet
0:43:55jestli _e
0:43:57jestli by se to nedalo nějak
0:43:59obejít
0:44:01zjednodušit
0:44:13tak _e
0:44:14já vám ukážu takovej
0:44:16takový obrázek
0:44:20_e a tom obrázku C definujeme _e druhou matici to bude tak zvaná matice částečných
0:44:25kumulovaných vzdáleností
0:44:28asi si ho budu chtít namalovat tady
0:44:31vedle této to tady trošku promarnil
0:44:40tak
0:44:42tady toto byla matice lokálních vzdáleností prostě každý s každým
0:44:51a tady toto bude
0:44:52matice
0:44:55částečných
0:44:59kumulovaných
0:45:02vzdáleností
0:45:09a na matice částečně kumulovaných vzdáleností
0:45:13každičkým svým bodě
0:45:16obsahuje _e nejlepší _e
0:45:19obsahuje
0:45:21nenormalizovanou
0:45:24_e vzdálenost
0:45:27jo to znamená beztoho to faktorů
0:45:29po nejlepší cestě
0:45:31která vede zpočátku tady do tohodle
0:45:35no tohohle bodu jo
0:45:37to jak tam zajistíme tu nejlepší vo tom si právě teďka budeme povídat jo to
0:45:41znamená ta _e vzdálenost vedou
0:45:46my budeme značit
0:45:48zase musím
0:45:50_e jo G
0:45:56_e
0:45:59tady je prostě nějakej bot
0:46:01E G
0:46:05G P je
0:46:08tak ta obsahuje
0:46:09vlastně pro tento vzoreček
0:46:14který vychází počátku ale končí právě ne nejde a že až do konce promluv a
0:46:20dokončit tady tomhle bodě
0:46:22tak a teďka prosím vás _e bych
0:46:26chtěl
0:46:28abyste si představili tady tuto _e
0:46:32toto záležitost jako tabulku
0:46:36drama jaký sloupce nějaký řádky
0:46:41_e já tu tabulku
0:46:43plním vodspoda nahoru
0:46:46tady můžu mám
0:46:48tady můžu mám všude vyplněnou
0:46:51jo to když to je dobrý tady to taky dobrý
0:46:53a proto tady na tomhle bodě
0:46:56si vyrobit tady tento bot B je
0:47:01odkud jsem se do tohodle bodu tak si mohu dostat
0:47:06zespoda zleva a nebo zespoda zleva jo
0:47:10tak nebo tak
0:47:13a je docela dobrý že tady v těchto bodech účty vzdálenosti mám hotový tam to
0:47:17může mám spočítaný
0:47:19jo tady máme nějaký _e de
0:47:23_e já teďka nevím co je pro mě vodorovná to svislá nasekané prostě tipnuté Í
0:47:28mínus jedna je
0:47:30tady mám
0:47:31hobby houby pardon tady to sou všecko géčka jo
0:47:35tady mám G T mínus jedna je
0:47:38tady mám víte co
0:47:40to je to byl hroznej matek _e mám udělám zoom tady na toto
0:47:44tak
0:47:46chci počítat tenhleten chlíveček
0:47:49kde hodnota k D R jo
0:47:52a tam jsem se mohl dostat tohodle bodu kde mám G E mínus jedna L
0:47:59a nebo s tohodle bodu kde mám K V
0:48:03mínus
0:48:06_e
0:48:13G E B mínus jedna je mínus jedna
0:48:17a nebo tady vodsaď
0:48:19kde mám dvě D
0:48:22je mínus jedna
0:48:24odněkud inu jsem se tam dostanem o
0:48:27a sem si jistej _e nebo vím že tady tyto hodnoty mám spočítaný abych teď
0:48:32chtěl abyste měli mě dali předpis pro výpočet tady této hodnoty kterou neznám
0:48:47a pozor budeme konstruovat vlastně jako lokálně optimální cestu tady někde počátku které je tady
0:48:54někde pryč
0:48:56do tohoto
0:48:58do tohoto bodu
0:49:01s tím že už mám hotový cesty sem
0:49:04sem a sem
0:49:06tak mně řekněte prosím
0:49:09_e kterou těch se mám do tohoto bodu G P je protáhnout
0:49:21no
0:49:22asi tu která mi tady tomto bodě dá nejlepší tedy minimální výsledek že jo
0:49:28a _e ně vlastně stačí
0:49:32udělat to mně stačí vzít si lokální vzdálenost těch dvou vektorů kterou si vyberu tady
0:49:36se
0:49:37_e tady k té levé tabulky jo to je to tady tu modrou vzdálenost troufám
0:49:41přepočítanou samozřejmě to D je
0:49:46a já ji zkusím připočíst
0:49:49tady k tomuto bodu
0:49:51s koeficientem jedna
0:49:56zkusím ji připočíst tady k tomuhle vodu
0:49:59bacha koeficientem dva protože penalize jo ten hodně rychlý pohyb po úhlopříčce
0:50:05dva krát D je
0:50:08a zkusím ji vzít _e připočíst _e tady to mohl bodu jedna krát D je
0:50:16a s těmi co udělal s těmi třemi hodnotami
0:50:21vyberou by bylo nejmenší jo tak mě třeba jako nejmenší v jinde tady tato
0:50:26tak to je výborné protože já a naplním ten bod běží je tady touto hodnotou
0:50:34tím pádem dostanu čísílko a eště by mohlo udělat to
0:50:41co když budeme někdy chtít _e když budeme někdy chtít zjistit jak to optimální cesta
0:50:46vypadá
0:50:47co by jste doporučovali
0:50:53bylo by dobrý si zapamatovat
0:50:55odkud sem tady do tohodle vodu přišel znamená mít _e mít nějakou _e paměti
0:51:02jeden integer nebo pointer nebo cokoli tam si uložím že sem do tohodle bodů přišel
0:51:08tady zespoda
0:51:10tak a teď tě _e si zkusme _e
0:51:15teď si zkusme jako trošku
0:51:17zkusme zapřemýšlet
0:51:20pokud tady ta cesta
0:51:22potom s tohoto bodu půjde
0:51:24nějakým jiným směrem kamkoli cache až do konce
0:51:28tak může tady tenhleten zbytek ještě ovlivnit
0:51:33tento výběr můj který jsem právě udělal
0:51:38jo kdy když potom na té cestě budu mít ještě dalších deset hodnota budu se
0:51:42rozhodovat deset doprava nebo doleva
0:51:44tak _e má některý tady s těchto jako budoucích
0:51:49puntíku šanci ovlivnit nebo nějak změnit tady tenhleten o můj výběr
0:51:54nemá
0:51:55jo tohleto je prosím vás hrozně důležitý C u algoritmu dete dvojvé
0:52:01že vlastně já můžu udělat lokálně
0:52:05nejlepší rozhodnutí
0:52:07a tady to lokálně nejlepší rozhodnutí už potom nebude dál dalšíma výpočtem a změněno
0:52:13toto to je prosím vás jako hrozná _e rovná bomba a prakticky základ celýho dete
0:52:18dvojice
0:52:19a v mírné varianty potom i skrytých markovových modelů jo protože já vlastně
0:52:24postupuju v té tabulce
0:52:26_e normálně zleva doprava zespodu nahoru
0:52:31prvními s každým bodě si udělám prostě nějaký rozhodnutí a to rozhodnutí potom bude platit
0:52:39tak _e teďka mě prosím vás řekněte dvě věci jak tady ten _e jak tady
0:52:43ten algoritmus ukončit co když
0:52:46tedy dojde do tady do toho posledního chlívku
0:52:53dobře pokud to potřebuju pokud mně stačí jenom numerická hodnota srovnání těch dvou sekvencí
0:53:00tak se na nějaký vykresování můžu celkem _e
0:53:03celkem vykašlat a prostě si vezmu tu hodnotu udělám jednu operaci pozor jakou
0:53:09musím to znormalizovat jo protože tady ta tabulka mě s udává nenormalizované kumulované vzdálenosti
0:53:16a prostě mám srovnání těch dvou sekvencí končím šmitec
0:53:20jo
0:53:21když budu chtít _e samozřejmě zjistit jak vypadali průběhy těch dvou sekvencí _e teka a
0:53:28R K znamená jak vypadala cesta
0:53:31tak si tady v tom poslední bodě řeknu odkud sem tam přišel o co
0:53:36odkud sem přišel sem a odsud odkud jsem přišel sem _e osum roků jsem slyšel
0:53:41jsem a tak dále a může se takhle době které jsou what cache
0:53:45action a počátek a zjistit jak to optimální cesta skutečně vypadá
0:53:50tak ještě sme si nefunguje pověděli _e jak to bude tady s tím prvním
0:53:56jak to bude s tím prvním řádkem a s tím prvním sloupcem prosím
0:54:01jo tam to není tak úplně jasný jak ten algoritmus nahodíme vlastně jako inicializujeme
0:54:07co byste tady
0:54:08co byste tady doporučili
0:54:13jo vyplnění prvního řádku a prvního sloupce
0:54:17_e musíš more to ne
0:54:24jo prosím vás tak dostanu čísílka
0:54:27sem
0:54:29a sem
0:54:36nebo
0:54:38jak vlastně dostanu čísílko sem
0:54:40no úplně prvního chlívků který má index jedna
0:54:44prosím
0:54:49jenom
0:54:51bacha já vlastně ten algoritmus nahrazuju
0:54:55a tím nahození udělám takhle šikmý pohyb
0:54:58takže ano je to tam déčka ale vahou dvě
0:55:02bacha jo to je to je jako taková nepříjemná věc
0:55:05že tady tento chlíveček je spočítaný vlastně jako de jedna
0:55:09krát dvě
0:55:10že tam je penalizace
0:55:12a jak potom vyplním ty další chlívky
0:55:19no je tam jenom jediná možnost jo prostě jako jedu takovým způsobem
0:55:25že vždycky té předcházející hodnotě přidávám patřičnou hodnotu těch ste matice _e lokální vzdálenosti
0:55:33kdybyste to prosím vás chtěli vyjádřit matematicky jako jak tam teda zkonstruovat tu podmínku tak
0:55:39můžete říct tady tohleto je vlastně úplně klasicky dete véčko
0:55:43akorát _e tady udělám
0:55:46tu záležitost že hodnot že se tam přidám nějaký extra řádek a přidám si tam
0:55:51extra sloupec
0:55:52a tím extra řádku extra sloupcům dám hodnoty nekonečno
0:55:56jo takže kdybyste se tam teda jako chtěli pohnout vodněkud minut
0:56:01tak to pude ale hodnota to je
0:56:04tyčky bude nekonečno plus jeden krát lokální vzdálenost takže hrozně velký tak si ji stěrači
0:56:10vyberte tu druhou
0:56:13no a tady toto je
0:56:15toto je princip _e nette dvojvé
0:56:18možná že bysme si ještě na to rezervuje ve mohli tak nějaký
0:56:22nějaký rychlo příklad
0:56:25ale příklady uvidíme ještě na poslední přednášce mám na numerickém cvičení
0:56:30takže jenom _e tady to zdlouhavější opakování uzavřu tím
0:56:35jak pomocí determu jde udělat a rozpoznávač prosím vás
0:56:43jo zatím sme se tady bavili o srovnání dvou sekvencí vektoru referenční testovat
0:56:49teďka chci aby to je to rozpoznával aby se tím třeba dali říká že telefonní
0:56:53čísla nebo volit jestli chcete šunkovou nebo sýrovou nebo obou pizzu
0:57:00a nebo mimochodem moh zavěšení mobilu máte rozpoznávač zaměřené na dete véčku tak máčknete tlačítko
0:57:06ke smete do toho kočička chcete aby to dalo
0:57:10telefonní číslo vaší mile
0:57:13přitom tam máte té konkrétní milé máte tam vložených deset telefonních čísel různých milých a
0:57:20jak to teda teďka uděláme prosím vás jo zatím sme se bavili o srovnání dvou
0:57:24sekvencí tečky rozpoznávat
0:57:30tak
0:57:31to bude docela
0:57:34straight forever že jo budu mít nějaký slovník
0:57:41k tomu slovníku
0:57:43budu mít různý
0:57:44referenční sekvence vektorů
0:57:47jo tady toho bude třeba nějaká
0:57:50R jedna
0:57:51_e toho bude na ta kratší dobude dejme tomu R dvě
0:57:55a to D
0:57:58proč nějaké R
0:58:00R
0:58:01měl
0:58:05každá ta sekvence vektorů prosím vás má M S C tečkama tam prostě pěkně vyskládané
0:58:10každých deset milisekund
0:58:12pak příde test testovací nějaká promluva
0:58:17velký tlustý o
0:58:20tak _e co uděláme
0:58:28si rozpoznat která si referenčních sekvenci
0:58:32to byla
0:58:33a tam máte nějak něco pěknýho tak tady třeba
0:58:36toto je _e
0:58:39čunkova
0:58:41nic
0:58:43sírová
0:58:46_e
0:58:47a Y
0:58:54tak jak rozpoznáte kterou ten člověk chtěl pizzu
0:59:00máme dete ve máme mocný nástroj který dnes teďka právě vyrobili
0:59:09no tak jacka spočítáme dete ve vzdálenosti
0:59:15vstupní sekvence
0:59:17ze všema reference _m a
0:59:19jo
0:59:20pro každou referenční musíme spočítat
0:59:24maticí lokální vzdálenosti potom tam poštvat ten _e ten algoritmus
0:59:29na stavění matice částečně kumulovaných vzdálenosti a dostaneme sadu
0:59:36do té vzdálenosti
0:59:38R jedničkou
0:59:40de o
0:59:42R dvojkou měněna až de
0:59:46slov tvýho
0:59:47S R
0:59:49měl
0:59:51co s nima
0:59:53vyberu nejmenší a je to
0:59:57minima vyberu minimum
1:00:00a je to třeba tady tahle takže chci pizzu a Y
1:00:05jo uvědomte si prosím vás že _e právě pro výběr
1:00:09může možná že nám nebylo jasný
1:00:12když sme tady došli nakonec se _e na konec té matice tady jako semka
1:00:19proč tam ještě bylo potřeba nějaká normalizace jo protože já sem říkal že tady si
1:00:22vlastně vememe poslední hodnotu
1:00:25_e to byla _e to bylo vlastně ta částečná kumulovaná vzdálenost dvě C R
1:00:33a teďka ju eště musím znormalizovat
1:00:36_e
1:00:37těmi dvěma
1:00:39_e těmi dvěma délkami
1:00:41tak tady toto nám nebylo jasný proč jsme to dělali
1:00:44jo _e
1:00:46uvědomte si že pokud máme ve slovníku
1:00:50_e když máme ve slovníku
1:00:53dvanáct vypit
1:00:55jedna
1:00:56jeden názvy třeba nic
1:00:58a druhá je sírová artyčoky a
1:01:02ostrým dresink M
1:01:04a jedno slovo má _e dejme tomu a nevím sto milisekund a druhým a čtyři
1:01:09sekundy
1:01:11tak ty dvě hodnoty _e
1:01:15částečných kumulovaných vzdálenosti budou mít úplně jinou dynamiku
1:01:20jo to znamená kdybyste _e kdybyste tady tyto dvě hodnoty
1:01:24srovnávali
1:01:26tak klidně můžete říct slovo blaf
1:01:29a pak můžete říct _e slovo _e
1:01:33jo sem teďka zapomněl
1:01:35kruhová syrová s výborným dresink M já můžete to říct úplně přesně a to slovo
1:01:40blaf i když bude když naprosto nebude odpovídat co voni
1:01:45tak bez normalizace i když tam budete mít totálně štilácký _e lokální vzdálenosti tady bude
1:01:51tak málo
1:01:52že prostě sumě vám dají lepší hodnotu než když budete rozpoznávat nějaké dlouhatánský heslo
1:01:59jo pokud budeme normalizovat C
1:02:02_e délka s testovací sekvence plus délka referenční sekvence tak máme šanci že ty hodnoty
1:02:08budou numericky
1:02:09srovnatelné
1:02:12jo tak to bylo jenom poznámka ho
1:02:15o normalizaci a proč
1:02:18kdy tam budem potřebovat
1:02:20no a tady takhle si můžete klidně vyrobit _e rozpoznávač izolovaných slov nějakým malým slovníkem
1:02:27a já si teďka neuvědomuju jedna z labiny jedete dvojvé nebo ne nebo není
1:02:37jedna z laboratoří
1:02:39našeho předmětu
1:02:43no
1:02:57je tam
1:02:58jo tak už o tom nebudu povídat protože do uvidíte v laboratořích a jako s
1:03:01těch z těch aktuálních nebo s těch _e umí to sou
1:03:05aktuální výborně
1:03:08tak _e dobrý
1:03:11takže toto bylo devíti dublinu
1:03:14teďka se poďme podívat o kousek dál
1:03:18a jsou skryté markovovy modely kde vlastně
1:03:21vidíme velmi podobné věci
1:03:27aha
1:03:31tak a teďka teda _m chviličku technická pauza protože
1:03:37_e
1:03:38tohle vám budu muset ukazovat ze svýho notebooku
1:03:42možná malovat na tabuli
1:03:44lukáš totiž používá nějaké krásného takové udělátko kterým se do power pointu dají psát
1:03:50rovnice macechu
1:03:54akorát že to
1:03:55potřebuje nějakých pár fontů
1:03:59které se samozřejmě nedají nainstalovat na školní
1:04:03mašiny
1:04:35ho
1:04:37modrá obrazovka sem nebral
1:05:05no tak zmizneš než nabootujeme
1:05:07tak to jim mám protože na těch prvních několika s rovnice zrovna nejsou
1:05:12tak _e
1:05:14_e
1:05:16extrakci
1:05:18příznaku sme tady povídali
1:05:21jo to znamená
1:05:22každý kde sedmi sekund dostaneme nějakou _e nějakou hodnotu
1:05:28a teď prosím vás lukáš to tady má ukázané na _e jednorozměrné příkladu
1:05:33a takový kulkách do plotu kdy vlastně řekneme že každý řečový rámec máme k dispozici
1:05:39pouze jednu jedinou hodnotu _e nějakýho parametr
1:05:44jo a teď prosím vás _e rozdíl od toho jak to vypadalo
1:05:49jak to vypadalo před chvilkou
1:05:51před chvilkou _e sme to měli takže existovala ve slovníku
1:05:57rozpoznávače
1:05:58konci měli systém restartnout
1:06:01vidíme to zkusím ještě jednou bude další modrá obrazovka
1:06:04tak _e měli sme ve slovníku rozpoznávače
1:06:08_e nějakou jinou
1:06:10promluvu
1:06:12která měla taktéž své hodnoty
1:06:14a tady tyto hodnoty
1:06:16sme spolu navzájem srovnávali napřed sme si udělali nějakou tu velkou matici lokálních záloh ty
1:06:21pro tam hledali nějaké cestičky
1:06:24a tak a tak dál
1:06:25a teď to bude trochu jinak
1:06:28my ve slovníku rozpoznávače nebudu mít nebudeme mít žádnou jako _e referenční promluvu
1:06:35ale budeme tam mít nějaký model
1:06:40a ten model
1:06:42bude
1:06:44jako kdyby
1:06:45generovat je tyto hodnoty
1:06:48a u každé té hodnoty
1:06:50budeme schopni říct
1:06:52jaká je pravděpodobnost toho že by ten model zrovna tady tuto hodnotu vygenerovat
1:06:58já _e říká se ten mohanem kam generativní modely a to je to ne _e
1:07:04ten pojem _e vobčas jako nemá moc krát protože on je ve skutečnosti nic ne
1:07:09generujou
1:07:11prostě my potřebujeme jenom ty pravděpodobnosti jednotlivých hodnot tady v tomhle případě
1:07:16skaláru normálním ne zase modrá obrazovka sorry
1:07:21normálním případě vektoru
1:07:24_e takže já mám _e já někdy říkáme že budeme počítat pravděpodobnosti s jakými ty
1:07:31vektore ty modely jednotlivé vektory žerou
1:07:34takže prostě moje modely budou spíš hrát nějaké hodnoty
1:07:45tak zapomeňte naše společenství pracovat
1:07:56to je to pouze stává se vám něco podobného sedum N když set připojíte na
1:08:00tom jedu row _m na bezdrátovu síť a poslední odpojíte
1:08:05a _e
1:08:07nebo chcete znovu
1:08:09máte počítačové spací módu předtím struny připojení na sedum a pak přijdete do nějaké místnosti
1:08:14kde drum není tak stala se vám že vám
1:08:17padá počítač na ústa
1:08:21docela zajímavá věc
1:08:23toto líbezná mohli vyřešit protože to bylo docela pravidelně
1:08:29modré obrazovky jsou
1:08:32su modré
1:10:46obvykle s tím že já tady ty fonty nemám
1:10:50jo je to tam na prase já jsem směna výborně
1:10:54tak poďme na to
1:10:56takže
1:10:56nebo fischl jak sme si něco říkali minule o tom že budeme modelovat _e taky
1:11:01poďme se podívat na úplně nejjednodušší příklad _e
1:11:04kdybychom chtěli vzít jeden rámec řeči
1:11:08a chtěli bychom říct jestli je tady zahráme C tři patří do jedné nebo do
1:11:12druhé třídy jo tady
1:11:14_e je takový jednoduchý přiblížení
1:11:17že toto je dejme tomu spočítaná krátkodobá energie
1:11:21ale bysme chtěli říct _e jestli je ten zvuk _e znělý
1:11:27a nebo neznělý jo takže když bude zněly nebude mít prostě velkou energii a když
1:11:31bude neznělý tak bude mít malou energii
1:11:34_e texture
1:11:36na ose X
1:11:38jsou naznačeny vlastně nějaké funkce přesně by se řeklo funkce hustoty rozdělení pravděpodobnosti ale teďka
1:11:46prostě si dvě představte jenom jako nějaké kopečky
1:11:49a po tyhle kopečky budou posílat jednotlivé hodnoty
1:11:55a ten kopeček který pro danou hodnotu bude víš tak to vyhraje
1:12:00jo takhle jednoduchoučký to je takže představte si že tady budu mít jednu hodnotu kterou
1:12:05budu chtít vo klasifikovat
1:12:07note pošlu sem
1:12:09zjistím že modrý kopeček _e svítí tolik a červený kopeček svítí hrozně málo tak _e
1:12:15řeknu že tady toto hodnota prostě bulva byla _e byla nezněl a protože měl a
1:12:20malou energií
1:12:22tak
1:12:24_e
1:12:27když _e bychom to chtěli zapsat matematicky
1:12:32tak _e tady budou mít dvě nějaké hodnoty
1:12:36dračím nebudeme říkat pravděpodobnosti ale budeme jim říkat prostě třeba skóre nebo
1:12:42nebo věrohodnosti nebo
1:12:45my tomu říkáme likelihoody I česky protože likelihoody česky věrohodnost ale jako T takový
1:12:52to je takový podivný slovo
1:12:54a za tou je za tou čárkou
1:12:58je vždycky to co známe
1:13:01a před tou svislou čárkou je to co chceme určit
1:13:05jo takže likelihoody
1:13:06když známe vstupní hodnotou X
1:13:09té _e té _e
1:13:13_m té třídy unvoiced
1:13:16právě jsme změřili že bude takováhle likelihood s té třídy _e pardon
1:13:23co
1:13:25ne nezměřím že likelihoodu T třídy a nebo jestli bude tady toto
1:13:30likelihoodu T třídy ano vole bude
1:13:34tahleta takže když se zeptáme tady tuto otázku zdali vo jestli většina šanuje sem tak
1:13:40si řekneme prostě že ne
1:13:42a _e a určíme
1:13:45že ta hodnota patřila tady toto ruce modré cizího takže tady klasifikační úloha prostě dvě
1:13:51třídy
1:13:53jedna vstupní hodnota dvě funkce hustoty rozdělení pravděpodobnosti který mě vyplivnou dvě čísla já si
1:14:00položím tady tuhletu otázku a _e a hnedka na ní
1:14:06zkamení zjistím odpověď
1:14:09_e
1:14:11co
1:14:13je trošku problém
1:14:15je ten že já vlastně tady s toho _e těch grafiku
1:14:19nedostáváme _e nebo toto co bych chtěl
1:14:23tak jsou pravděpodobnosti prostě když přijde hodnota i jaká je pravděpodobnost
1:14:28znělé třídy
1:14:30a jaká je pravděpodobnost neznělé třídy
1:14:35době _e na těchto funkcích vlastně to že _e já dostávám hodnotu opačnou jo to
1:14:44modrá mě _e určuje
1:14:46když by tady tato hodnota byla přída unvoiced kolik by to bylo a když by
1:14:52tady tato hodnota byla třída voiced
1:14:54kolik by to byl to pro vás cvika není žádný velký rozdíl
1:14:58ale matematicky to celkem lstivé a naštěstí existuje chytrý vzoreček
1:15:04tak zvaný based u
1:15:05který nám to _e který nám to umožňuje
1:15:09možně přepsat viděli jste někdy B jsou
1:15:12nejsou vzoreček
1:15:17jo ten vlastně _e
1:15:21ten vlastně říká _e tady ještě pořád něco kam se data
1:15:25tam se dá psát
1:15:32no
1:15:36jejda no
1:15:38nám říká že _e pokud je
1:15:42pokud je nějaká pravděpodobnost
1:15:45jeho
1:15:47_e
1:15:48podle dám pravděpodobnost jevu B podmíněného
1:15:52jeden a
1:15:54tak _e to můžu zjistit jako
1:15:57pravděpodobnost
1:15:59inu _e
1:16:00podmíněného
1:16:02jeden B
1:16:04a teďka abych to totálně nedo vrtal
1:16:08_e
1:16:10měl bych to
1:16:12normovat pravděpodobností i u _e a tady bych měl
1:16:17_e dát takzvanou apriorní pravděpodobnost
1:16:22je vůbe jo a tady tohleto _e
1:16:25tohleto a vlastně ten vstupní hodnota nebo tady toto jsou pro nás data
1:16:33tak _e
1:16:37pro sem řekl
1:16:38že ta hodnota té B je apriorní pravděpodobnost
1:16:42co to znamená apriorní
1:16:50to znamená když
1:16:51někomu řeknete něco apriori víte
1:17:02jako
1:17:03tímhletím vzorečkem vlastně vy říkáte
1:17:06že _e
1:17:09máte nějaké jevy byl
1:17:12třeba že _e přijde váš _e
1:17:15spolubydlící nemůže přijde vaše přítelkyně ze kterou ste se rozešli
1:17:20a _e ta data sou ta
1:17:25že vidíte prostě nějaký obličej ve dveřích jo
1:17:30že to je B jako apriorní pravděpodobnost tak ještě vůbec nikdo nemusel sít že žádných
1:17:35si ve dveřích nevidíte
1:17:37a přitom už můžete nějak kvantifikovat jaká je pravděpodobnost tady těhletěch dvou B či
1:17:43jo spolubydlící za váma chodí každou chvilkou že si musíme pučit kytaru nebo já nevím
1:17:47cokoliv dalšího
1:17:48a přítelkyně ste se rozešli takže zhruba tak jedno procentní aby že apriorní pravděpodobnost
1:17:54že přijde zpátky jo to znamená tady se ještě neviděli data ale už máte o
1:17:59tom výsledku
1:18:01nějaké ponětí
1:18:04_e tohleto
1:18:07je
1:18:09pravděpodobnost
1:18:12toho že ví když vidíte nějakej obličej
1:18:20že
1:18:21je to buď že
1:18:23spolubydlící
1:18:25no přítelkyně
1:18:26samozřejmě vy tady tu pravděpodobnost poznáte jak byste to _e k byste to udělali nějakým
1:18:32_e strojově tak byste určili tady tuhletu pro pravděpodobnost nebo spíš likelihoodu
1:18:37je to spolubydlící no přítelkyně
1:18:47asi byste si museli udělat nějaký model že jo jako udělali byste si model přítelkyně
1:18:52podle fotky
1:18:54model spolubydlícího taky podle fotky potom prostě by ten příští k se objevil a vy
1:18:59byste spočítali likelihood že to buď ten a nebo ten tak jak je to tady
1:19:04s tím jak je to tady s tím spodky jak je to _e jaká je
1:19:07vlastně
1:19:08pravděpodobnost přístup
1:19:15todle _e todle jako těžší oříšek
1:19:19protože
1:19:21jen tak jako _e jen takto určit nejde říci prostě pravděpodobnost to psychiku je tolik
1:19:26a tolik
1:19:27tak byste to mohli udělat se tím že bysme vlastně zjistili _e jaký sou všechny
1:19:34možný hodnoty čitatele
1:19:36to znamená _e
1:19:39_e daly bysme tady sumu
1:19:42_e P
1:19:44_e
1:19:45přes _e
1:19:47přes všechny možný hodnoty véčka jo
1:19:52a prostě možné jako prostudovali tady tyhlety možnosti že to je _e že když je
1:19:58to přítel
1:19:59ta která tady tuhletu hodnotu a jeho apriorní pravděpodobnost byla taková že když je to
1:20:04přítelkyně tak jsou to zase nějaký hodnoty ale naštěstí prosím vás je tady tohleto pro
1:20:10nás nutný pro rozpoznávání když jsou jenom říct která si při to byla
1:20:15ten jmenovatel
1:20:17naštěstí to nutný není protože pořád stejnej jo to znamená většina těch našich rozpoznávat X
1:20:23algoritmu
1:20:24se tady dnes tohoto docela dobře obejde a pracuje jenom _e pracuje jenom S
1:20:31_e čitatele
1:20:33teďka já sem vám tady říkal jakou jako _e
1:20:37takové srandovní přiblížení jako přítelkyně _e a _e spolubydlící
1:20:45kdybyste nevěděli nic moc vo tom jak sou ty _e jak sou ty třídy apriorně
1:20:51rozložené to znamená kterou máte očekávat
1:20:54co byste asi co zbylo asi dobrý tady ta zatopte B
1:20:57apriorní pravděpodobnost nějaké tří
1:21:02úloh
1:21:03a když byste tam dali půlky
1:21:05a ty třídy měli dvě takž tady na toto můžete zapomenout úplně že jo takže
1:21:11že v tom vlastně nejednodušším pojetí
1:21:15my budeme pracovat jenom s likelihood jenom tady s těmito hodnotami
1:21:19a podle nich budeme rozhodovat
1:21:21jestli to byla jedna třída nebo druhá jo ale někde zpaměti byste měli mít
1:21:27_e povědomí o tom že existují také nějaké apriorní pravděpodobnosti
1:21:31a že nedejbože existují i ty jmenovatele který občas můžeme _e který občas můžeme potřebovat
1:21:38tak
1:21:39_e
1:21:41teď těch _e
1:21:43když budeme zkoušet _e
1:21:47_e když budeme zkoušet _e klasifikaci
1:21:50do více tříd
1:21:52jo když ty třídy nebudou jenom dvě
1:21:54ale bude jich víc
1:21:57tak _e se nám tady tahleta do té rovnice která tam byla před chvilkou
1:22:03_e změní nebudeme se jenom ptát prostě větší než menší než ale budu hledat maximum
1:22:10jo takže maximum
1:22:11_e
1:22:13toho nebo maximálně pravděpodobný když nějaký data jsou dané třídy
1:22:20bude tehdy když _e součin
1:22:23likelihoodu
1:22:24třída když sem viděl data krát _e apriorní pravděpodobnost té dané třídy pro danou třídu
1:22:31omega když prostě bude _e bude největší
1:22:35tak
1:22:36a
1:22:38jak _e jak to teďka ale dát dohromady
1:22:41protože tady ty křivky
1:22:43pro jednotlivý třídy nám samozřejmě nikdo nedá _e služby nenajdete matematickofyzikální
1:22:49tabulka
1:22:50takže _e zkuste mi říct
1:22:52jak bychom tady tyhle
1:22:55tyhle čáry ty funkce dali dohromady
1:23:00kde de víc aby to začalo klasifikovat rozpoznal
1:23:12tak zkuste si vzpomenout _e před chvilkou sem tady povídalo dete dvojí ve
1:23:16jo kde sme kde sme vzali ty slova
1:23:20který
1:23:21který se budou rozpoznávat
1:23:24nějaká databáze že jo někde musel nahrát a někdo k ní musím dát nějaký zdroj
1:23:28byly jako že tohleto je slovo jedná todleto je slovo a Y todleto je slovo
1:23:33nic a tak dál
1:23:34dyž budu dělat _e takovýhle _e teď třídění jenom vobyčejnej vektoru
1:23:40a budu sítí natrénovat tady ty
1:23:43křivky tak to musí být úplně stejně budu musí mít data
1:23:46a budu muset mít nějaké _e nějaké značky dejme tomu určený
1:23:53tady je _e to je prostě wavka
1:24:01a wavka se převede
1:24:04na
1:24:06sekvenci
1:24:08vektoru
1:24:09hodnota má
1:24:11a já budu mít časový značky který mě řeknou tady je to vo list
1:24:17jedno třeba značka hláska a tady bude unvoiced
1:24:23a tady bude sádlem s tady bude prostě
1:24:26tady bude ticho
1:24:27jo budete mít spoustu takovejhle vektoru
1:24:30takhle
1:24:31označen A
1:24:33a _e
1:24:36na těch vektory
1:24:38tady si to můžeme představit protože sme v tom v jednoduchým _e skalárním případu tak
1:24:43prostě budeme mít takovýhle
1:24:45tyčky naměřený který budou s jednotlivým značkama
1:24:49a na těch tečka prostě vybuduju
1:24:52tyto funk
1:24:57tak _e když samozřejmě budu mít těch _e bodu
1:25:01určitý
1:25:04množství
1:25:05tak ty funkce nebudou moci bit
1:25:08o složitý
1:25:11uprostřed budu muset pracovat s jednoduchým a funkce má taková dobrá
1:25:15funkce která reprezentuje data v reálným světě taky gaussovka
1:25:20zkuste měří taková gaussovka
1:25:22jaký má parametry že taková letech na jednorozměrné
1:25:32zkuste český čest česky
1:25:37normálně vona má nějakej prostředek že jo ten prostředek sem najat
1:25:42řekni hodnota super a pak je nějak pak jinak plus ta a to je
1:25:46to je určený buď rozptylem anebo směrodatnou odchylkou
1:25:50jedna na druhou se dá vpohodě přepočítat protože rozptyl je směrodatná odchylka na druhou jo
1:25:55takže todle je prostě jedna _e by čínská gaussovka
1:25:59_e
1:26:00tetě když _e budu počítat
1:26:05parametry takovýhle gaussovek
1:26:08tak mi to někdy půjde jednoduše
1:26:11a někdy to půjde trošku hůř _e v případě že mám tadyhle zelený data
1:26:17a zelenejch dat budu chtít _e spočítat parametry zelené gaussovky tak víte že existují jednoduchý
1:26:24analytický vzorečky
1:26:26střední hodnota to toastu štosy viděli že jo když prostě _e
1:26:32zelený data bych označíme jako by byl
1:26:35tak _e střední hodnota zelena bude prostě _e suma
1:26:40zadaří a tady v
1:26:42to bude
1:26:44jednu jedna N prostě _e
1:26:47jejich počet
1:26:49kdyby chtěl směrodatnou odchylku
1:26:52zelenou tak to bude asi něco jako jedna lomeno N
1:26:56odmocnina _e ze sumy
1:27:00_e z vedení
1:27:02mínus tu spočítat není Z
1:27:05a druhou jo takže prostě
1:27:07střední hodnotu směrodatnou odchylku všici dokážeme spočítat
1:27:11je to hrozně jednoduchý
1:27:14_e když budu mít nějaký složitější určování parametru
1:27:18tak už to takhle jednoduchý být nemusí
1:27:21a _e
1:27:24budu na to muset jít
1:27:26pomocí
1:27:27_e nebo budu si muset napsat
1:27:30co vlastně chci _e co vlastně o tom algoritmu chci takhle když sem určoval tady
1:27:35ty parametry střední hodnotu a senátu chvilku
1:27:39jak si myslíte vlastně com co mě o co mě šlo tady u té gaussovky
1:27:43jak se mi chtěl posadit
1:27:45na ty data
1:27:51co myslíte že byla jako funkce kterou sem chtěl
1:27:56maximalizovat
1:27:59tak jednu můj cíl
1:28:06zkusím
1:28:10musím přepnu zase
1:28:11král
1:28:21pardon asi udělám tak to je tak ohromnou změnu
1:28:25_e
1:28:26z toho důvodu že tady se tady srazí malovat
1:28:34no
1:28:37K
1:28:41tak _e můj cíl vlastně ten
1:28:45aby ta gaussovka
1:28:47dával co největší hodnoty
1:28:51pro
1:28:53pro _e ty body
1:28:56který má reprezentovat jo když udělám sumu
1:29:00hodnot tady těchto bodů
1:29:03tak já jsem snažím tady tuto sumu
1:29:06nastavit na maximum a pokusí uděláte _e takovýhle výpočet
1:29:12_e tak vopravdu na několika řádcích dokážete
1:29:15odvodit
1:29:17výpočet parametru
1:29:19gaussovky or dokonce sem se to jednou zkusil skutečně to D forma jako člověk dobrej
1:29:24pocit
1:29:24že si maximalizací tady téhleté hodnoty dokázal odvodit vzorečky pro _e pro výpočet parametrů gaussovky
1:29:34tomuhle procesu
1:29:36se říká
1:29:39při
1:29:40tomuhle procesu
1:29:42prosím vás
1:29:44se říká _e a musí maximum likelihoodů
1:29:48neboli maxima sem maximalizace
1:29:51věrohodnosti
1:29:53a de vlastně o to že když mám nějaký data
1:29:56a teďka mám parametry si ho modelu
1:30:00tak já mám
1:30:02_e likelihoody který mně ten model
1:30:05vysypává
1:30:08pro všechny data který mám k dispozici tak tady tyhlety likelihoody vynásobím
1:30:12a snažím se nastaví parametry toho modelu tak aby tady tahleta hodnota nanejvýš nejvyšší
1:30:20a tady tomuto u tomuto se říká _e tomu se říká maximalizace
1:30:24věrohodnosti nebo maximum likelihoodu T stihneš
1:30:29a některých případech to de pohodě
1:30:32analyticky odvodíte si vzoreček a rovnou to spočítáte a v některých případech to nejde analyticky
1:30:39a musíme prostě
1:30:40_e procházet starat a iterativně to uvidíme právě případě těch skrytých _e markovových modelů
1:30:48tak _e
1:30:49uvidíme tady toto
1:30:51v případě jednoduché gaussovky případě modelu se směsí gaussových rozložení a potom případě toho C
1:30:59svítilna com
1:31:01_e tetě _e budeme řešit tři věci
1:31:06budeme _e chtít vědět jak tady tuhletu likelihood vůbec spočítat
1:31:12potom jak tady tyhlety
1:31:15parametry
1:31:17natrénovat
1:31:19a pak taky v některých případech uvidíme že tam jsou vlastně nějaké skryté parametry toho
1:31:24modelu
1:31:25takže _e
1:31:27typicky vlastně když bysme chtěli tady tu hodnotu tak bysme je měli vyzkoušet pro všechny
1:31:32možné hodnoty skrytých parametru
1:31:34což je nesmysl stejně jako budete véčku jestli si pamatujete sem říkal že nesmysl procházet
1:31:39všechny možné _e srovnávací cesty takže budeme chtít znát nějaký rychlý algoritmy kterýma se těma
1:31:45skrytým _e
1:31:47parametrama rychle prokouše ne aby jsme dokázali vlastně dostat jedno jediný číslo
1:31:52kdy jedním modelem budeme chtít ohodnotit nějakou vstupní _e stupni sekvenci vektorů
1:31:58tak
1:32:00_e jak je to _e jak je to gaussovka má
1:32:04jednorozměrná gaussovka vypadá takhle prostě ten datový bots mínus střední hodnota
1:32:11tady je dvakrát směrodatná odchylka na druhou že jo to směrodatná odchylka se objevuje E
1:32:16V ve jmenovateli
1:32:18a když budeme _e dělat _e maximum likelihood odhad
1:32:22těhletěch parametru tak
1:32:25přijdeme na ty dva
1:32:27známy vzorečky
1:32:29a když euro zeptat po nějakých skrytých proměnných tak je to v pohodě protože tam
1:32:34žádný nejsou jo prostě jedna zásuvka nasypu do toho data vybod
1:32:38kdy byla sme to na mě jednu hodnotu
1:32:41nic _e nic tam není neznámýho nebo skrytých
1:32:45tak
1:32:46_e když půjdu trošku složitěji
1:32:49tak _e několikarozměrná gaussovka
1:32:54_e bude mít zase dva parametry ale tentokrát to bude vektor a bude to nějaká
1:32:58matice jo když mám zásuvku několika rozměrným prostoru
1:33:03tak ta střední hodnota je vektorová
1:33:05to znamená tady by mě ukazovala
1:33:08do bodu asi jedna
1:33:10jedna
1:33:13a to jak je ta gaussovka roztažena v různých směrech
1:33:18to mě udává tak zvaná kovarianční matice
1:33:22_e
1:33:25přemýšlím jestli se tady dostávat se do _e
1:33:28nějakých detailů jak ta kovarianční matice
1:33:31a nebo nemá vypadat ale na že bysme mohli
1:33:35_e
1:33:41viděli jste někdy několika rozměrný o stovky v nějakým předmětu
1:33:47matice no ne
1:33:49nevadí
1:33:51musíme udělat základní nalejvárnu
1:33:55je
1:33:56dvourozměrný prostor
1:33:58tady je parametry X jedna tady je parametry dva
1:34:03přední hodnota má jenom dva prvky určený vlastně střez kdy bude ten můj
1:34:09kopeček
1:34:10a teďka tavnou slůvko
1:34:13můžete si ho představit jako klobou tedy
1:34:16který vypadá nějak takhle
1:34:19no a _e tady vy ste
1:34:21kovarianční matice
1:34:24teda
1:34:26_e základním přiblížení
1:34:31má prvky jenom na diagonále sme tadyma nulu nemá nulu
1:34:37a tady má směrodatnou odchylku prvním směru na druhou a tady má směrodatnou odchylku ve
1:34:43druhým směru na druhou
1:34:44jo takže když budete
1:34:46prosím vás _e zvětšovat
1:34:49tady
1:34:50tady tenhleten bot
1:34:52_e které tady tuto hodnotu tak ta nouzovka bude
1:34:55co bude takhle to byl jakostní stěhovat
1:34:59a vtom druhým směru bude pořád stejná
1:35:03a když budete šahat se na tuto hodnotu tak se ta gaussovka bude smršťovat
1:35:08nebo ztenčování tady v tomto směru podle toho jak to nastavíte prostě bude tadle tlustá
1:35:13nebo tenká jo
1:35:16ústně reguluje té šířku toho kopečku v jednom a ve druhém směru
1:35:20tak a teďka mě zkuste říct
1:35:23_e jí když bysme se na to dvoustovku podívali takhle svrchu
1:35:27jo
1:35:28tady ste roviny
1:35:30a nakreslili si tam souřadnice
1:35:35X dva X jedna
1:35:39taky jaký gaussovky jaký kopečky jsme schopni s tou diagonální _e kovarianční maticí namodelovat
1:35:47jak budou vypadat při pohledu svrchu
1:35:58kdybyste si představili mapu jo kde ten kopec na kreslenej jak ten kopec bude vypadat
1:36:07jo eště jinak řečeno jak bude orientovany
1:36:12tak já vám napovím když je ta kovarianční matice diagonální
1:36:17tak gaussovka může vypadat jako kopeček jako vzít jo které kulatej
1:36:23nebo může vypadat
1:36:25takže půjde
1:36:27nápadu na východ
1:36:29jo nebo že bude klidně jako jinak plus ta západu na východ
1:36:33nebo že půjde ze severu nají
1:36:37nebo že bude eště jinde silnej a s každým případě bude vlastně orientovaná nebo _e
1:36:43bude dycky symetrická kolem nějaké _e kromě jaké osy
1:36:48jo takhle se schopní _e
1:36:51vyrobit dvourozměrnou gaussovku diagonální kovarianční maticí
1:36:56eště mě zkuste říct _e
1:36:59jak by se tady ta dvourozměrná gaussovka která vypadala takhle
1:37:04dala taky namodelovat
1:37:07na vypočítat
1:37:09jestli jako vám přijde tam ta
1:37:12rovnice složitá tak
1:37:13a s váma souhlasím nebo taky nemám hrát
1:37:16počítání nějaké inverze determinantu nic pěkný
1:37:21vy byste udělali takovouhle dvourozměrnou zase
1:37:25jste to chtěli udělat jednodušší
1:37:32tak já mám nápad
1:37:34dělejte mohli bysme udělat
1:37:37v jednom směru
1:37:39jednorozměrnou gaussovku
1:37:42ve druhým směru tak jednorozměrnou za stovku
1:37:46jo
1:37:48a teďka s každým bodě roviny tady tyhlety dvě spolu vynásobit
1:37:53a dokážete takhle dostat
1:37:56kopeček který je moc kulatý nebo obrácený severojižní anebo nebo vichr západně jo
1:38:02opravdu _e gaussovka Z diagonální kovarianční maticí
1:38:07D reprezentovat a taky jako
1:38:11to hrozně moc využíváme
1:38:13jako součin dvou jednorozměrné gaussovek
1:38:16tak a teďka pozor
1:38:18když _e
1:38:20tady ty nuly zrušíte když tam dáte nějaký hodnoty
1:38:25tak
1:38:25dokážete udělat takovýhle gaussovky šikmý
1:38:29jo prostě různých směrech
1:38:33ale ty už nedokážete udělat jako součiny jednorozměrných gaussovek jo tady už vopravdu potřebujete
1:38:40tuto složitou rovnici abyste _e takovouhle gaussovku
1:38:44dokázali vyrobit
1:38:46pozor prosím vás takovýmto stovkám s plnou kovarianční maticí my se budeme vyhýbat jako čert
1:38:51kříži zaprvé to složitý
1:38:54a za druhé to ne trošku proti _e proti tomu co jsme očekávali o vstupních
1:38:59dat
1:39:01jo teďka zkuste udělat rychly myšlenkový skok na začátek téhle přednášky
1:39:05když sem vám tady vykládal vo M S T tečka co sem říkal že bysme
1:39:09chtěli o stupni koeficientu do rozpoznávání
1:39:15aby jednotliví
1:39:17jejich prvky
1:39:19nebyly navzájem
1:39:23korelovaný žejo aby _m navzájem nezávislými
1:39:27no a teďka když si představíte něco když uděláte takovouhle šikmou gaussovku
1:39:33no tak to zachycuje právě korelaci
1:39:35jo protože když mám takovoudle šikmou gaussovku tak já řeknu
1:39:39já vím no a ne
1:39:44ne
1:39:46ne
1:39:49u A
1:39:50kdy to medvídek půjčky
1:39:52tak _e
1:39:54vy víte že když se v těch datech posunete v jednom koeficientu takovýmhle směrem
1:39:59tak se prostě sem druhým koeficientu posunete druhým směrem jo znamená _e
1:40:05taková našich menádou stovka
1:40:08naší že data sou korelovaný
1:40:10to nechcem a ještě zase mít jednodušší takže my prostě tady budeme vnutit tvrdě nuly
1:40:17a budeme buď buďto zařídíme a nebo aspoň budeme doufat že naše data sumy korelovaná
1:40:23a budeme pracovat pouze generálním kovarianční matice
1:40:27poslední věc prosím látek může _e taky _e tahleta funkce vypadat
1:40:32může vypadat jako směs gaussovek
1:40:34jo máme _e několik různejch
1:40:37gaussovek
1:40:39tedy jsou označeny nějakým index víčkem chce každá má svoji střední hodnotu pravda má svoji
1:40:46_e směrodatnou odchylku tady teda bych spíš řekl že by měla být jako sou že
1:40:51ho její kovarianční matice
1:40:53a máte nějaké váhy pece
1:40:56a bylo by dobrý jako jak u slušných lidí je zvykem aby se ty váhy
1:41:01sumu valy _e sumu valit do jedničky
1:41:04a takový mohl _e modelu se říká vlož mixture máru
1:41:08nebo taky G M
1:41:10a toto sou prosím vás velmi zásadní modely pro rozpoznávání řeči
1:41:15protože uvidíte úplně všude tady si budeme hrát rozpoznáváním řeči ale dělá se s tím
1:41:20taky rozpoznávání
1:41:22řečníka dete chceš klíčových slov rozpoznávání jazyka
1:41:26já nevím ještě co
1:41:27_e co dalšího
1:41:31tak
1:41:32a více o tom _e plošných se modelu o tom jak se potom dá generalizovat
1:41:37na arménka
1:41:39tři povíme příště tak děkuju za pozornost notes