0:00:07 | těch _e |
---|
0:00:09 | to těch věcí |
---|
0:00:11 | o které jsem chtěl povídat napřed _e s _e rozpoznávání opakování dete dvojvé a pak |
---|
0:00:17 | se vrhneme do takové pěkné grafické prezentace _e skrytých markovových modelů kterou dělám lukáš budu |
---|
0:00:23 | bit burget mi vážený kolega |
---|
0:00:26 | a _e příště si to dám eště jednou _e se všemi možnými rovnicemi ale dneska |
---|
0:00:31 | to bude takové populárnější abyste si zatím dokázal něco představit tak _e poďme ještě jednou |
---|
0:00:38 | _e rozpoznávání řeči |
---|
0:00:41 | rozpoznávání řeči když to vezmu úplně jednoduchou se tak máte k dispozici dvě babky |
---|
0:00:48 | _e u té jedné řekneme že trénovací |
---|
0:00:51 | a o té druhé řekneme že testovací |
---|
0:00:59 | a máte říct _e jestli to testovací vacka odpovídáte trénovacího to znamená tady třeba ste |
---|
0:01:05 | ve trénování řekli slovo ano |
---|
0:01:08 | a _e testování je také slovo ano akorát že vyřčené nějakým _e třeba jiným člověkem |
---|
0:01:14 | a má to jiný časování a ten člověk může |
---|
0:01:17 | mluvit přes nějaký jiný mikrofon a vy máte říct _e jestli |
---|
0:01:22 | _e tady tahleta stovka odpovídáte trénovací nebo neodpovídá |
---|
0:01:27 | tak první věc kterou vtom _e rozpoznávání vždycky uděláme je že si udělal může si |
---|
0:01:33 | každou babičku rozdělíme na rámce |
---|
0:01:36 | probíhalo tady diskuze vo tom jak mají být dram se dlouhé a jak se mají |
---|
0:01:39 | překrývat tak takový typický rámcování je po _e dvaceti až dvaceti pěti milisekundách |
---|
0:01:48 | se překryvem ptát |
---|
0:01:50 | aby nám _e aby nám vyšla kladen se |
---|
0:01:54 | těch rámců každých deset milisekund takže teďka podle položíme složitou otázku |
---|
0:02:00 | když budou rámce když bude nový rámec každých deset milisekund kolik bude za sekundu |
---|
0:02:10 | to |
---|
0:02:11 | ahoj jako jo takže počítáme s tím že máme |
---|
0:02:15 | _e každou promluvu reprezentovanou maticí parametrů |
---|
0:02:20 | a |
---|
0:02:21 | teďka |
---|
0:02:22 | každý vektor tam máme |
---|
0:02:25 | po deseti |
---|
0:02:27 | _e minim po deseti milisekunda |
---|
0:02:30 | teďka mě zkuste říct co tak těch vektorek asi mohlo být |
---|
0:02:37 | jo tady ten žebříček který chceme teďka _e vybarvil |
---|
0:02:41 | tak to je vektor koeficientů zkuste mě říct jako kolibřík tak mohlo být a jaké |
---|
0:02:46 | asi jaké jsou takové prostě typické |
---|
0:02:49 | koeficienty |
---|
0:02:51 | který se používají rozpoznávání řeči |
---|
0:03:00 | tak |
---|
0:03:02 | mělo by nějak zachycovat spektrum toho daného rámce |
---|
0:03:07 | takže to bude asi něco postaveného na fourierově transformaci neměli by zajisté obsahovat žádný informace |
---|
0:03:13 | o fázi protože nechceme aby nám dělalo problémy když ten rámeček bude o jednu nebo |
---|
0:03:18 | dvě milisekundy posunutý a |
---|
0:03:20 | dyž prostě _e tu danou úvazku nakous nebo s tady nebo tady to jako nechceme |
---|
0:03:26 | aby se lišilo |
---|
0:03:27 | takže tam bude muset být _e nějaký _e brání absolutní hodnoty a nebo a nebo |
---|
0:03:33 | v absolutní hodnotě na druhou a ještě budeme možná C T aby to _m bral |
---|
0:03:38 | of úvahu nějaké poznatky o lidském slyšení |
---|
0:03:43 | eště budeme chtít spár dalších věcí kterým se dostane |
---|
0:03:46 | to co jsem teďka říkalo tak slyšeli nebo nějakých parametrech který by to je toho |
---|
0:03:50 | měli |
---|
0:03:51 | to znamená postaveny na frekvenční analýze |
---|
0:03:54 | brát v úvahu jenom _e |
---|
0:03:56 | jenom _e |
---|
0:03:58 | amplitudy a nebo výkony tedy amplitudy na druhou |
---|
0:04:03 | a ještě nějak integrovat to jak naše ouška slyší |
---|
0:04:07 | kepstrum by bylo asi docela dobrým funding kandidátem a těch různých variant kepstra to bude |
---|
0:04:13 | asi to mel frekvenční kepstrum |
---|
0:04:15 | co Š jsou vlastně opravdu |
---|
0:04:19 | notoricky znamená stále používané koeficienty rozpoznávání řeči jo takže maso co C |
---|
0:04:26 | jsou mel frekvenční cepstrální koeficienty |
---|
0:04:31 | jenom _e pro připomenutí vstupuje do nich _e |
---|
0:04:35 | rámec řeči pak se z něho vezme fourierova transformace s té fourierovy transformace se udělá |
---|
0:04:43 | _e absolutní hodnota na druhou potom to prochází nějakou je nelineární bankou filtrů takovými pro |
---|
0:04:51 | hraničky |
---|
0:04:53 | _e |
---|
0:04:54 | zase budu vám tam psat typické hodnoty jo takže fourierova transformace typicky na dvě stě |
---|
0:04:58 | padesáti šesti bodech |
---|
0:05:00 | samozřejmě je symetrická takže měření zajímá jenom jedna polovina |
---|
0:05:05 | takže sto dvacet osum bodu tady to má pořád ještě sto dvacet osum bodů těch |
---|
0:05:10 | trojúhelníkových filtrů tam typicky bývá _e dvacet tři takže tady prostě dostanete _e na konci |
---|
0:05:17 | dvacet tři hodnot každá hodnota je posbírána jedním tím trojúhelníkovým filtrem |
---|
0:05:22 | když si _e tady ty hodnoty na výstupu filtrů vyplo tneme tak to ještě pořád |
---|
0:05:26 | vypadá jako spektrum akorát takové hodně hrubé |
---|
0:05:31 | _e nižší frekvencích je _e reprezentativnější ve vyšších frekvencích je to prostě horší ze selektivitou |
---|
0:05:39 | protože se tam ty filtry ty trojúhelníky postupně do zřeďují |
---|
0:05:43 | potom se to nacpe do logaritmu |
---|
0:05:47 | _e tady tohle ze pořád ještě dvacet tři koeficientu a pak se aplikuje _e vlastně |
---|
0:05:53 | inverzní fourierova transformace |
---|
0:05:57 | která se protože to jednodušší implementuje pomocí tak zvané diskrétní kosinové transformace |
---|
0:06:03 | a výsledkem je tři na |
---|
0:06:05 | mel frekvenčních cepstrálních koeficientů |
---|
0:06:08 | teď si _e vám položím takovou otázku za pekli tou proč je tam ta inverzní |
---|
0:06:14 | fourierova transformace respektive deset _e |
---|
0:06:18 | proč už nejsem happy _e |
---|
0:06:21 | s tím s tím výstupem na výstupu |
---|
0:06:23 | na výstupu logaritmu zory když to vlastně splňuje všechno co sem řekl že by to |
---|
0:06:27 | mělo splňovat takže |
---|
0:06:29 | fourierka tam je fázi sme zahodili poznatky o lidském slyšení sem nějak využil protože tam |
---|
0:06:36 | ještě ta poslední transformace aby se s tím byly opravovat studenti nebo |
---|
0:06:41 | _e dobře míň hodnot tak proč třeba jako ne zkrouhnout těch třiadvacet a nevezmu z |
---|
0:06:46 | nich prvních třeba |
---|
0:06:51 | S T se to je blbá votázka máte pravdu je to tam jednak abych neumí |
---|
0:06:55 | hodnot ale eště tam ta inverzní fourierova transformacema jednu docela důležitou úlohu |
---|
0:07:02 | _e |
---|
0:07:03 | dozvíme se později skrytých markovových modelů |
---|
0:07:07 | že jim se hrozně líbí když _e tady těch třináct hodnot |
---|
0:07:11 | navzájem |
---|
0:07:13 | je nekorelovaných |
---|
0:07:14 | co to znamená |
---|
0:07:16 | jako _e lidským jazykem že ty hodnoty jsou nekorelované |
---|
0:07:23 | čtrnáct tak na vás takhle blafne nějaký matematik |
---|
0:07:27 | _e že bych chtěl aby tady těch třináct hodnot bylo nekorelovaných co tím kteří |
---|
0:07:34 | je jedna by neměla záviset na druhého když se když se podíváte tady na tuhle |
---|
0:07:39 | tak pokud sou nekorelované tak nemáte ani ponětí vo tom jaká bude |
---|
0:07:44 | jaká bude |
---|
0:07:46 | ta stavu dva _e odvaž opičky vedle |
---|
0:07:49 | no a když si představíte to logaritmické spektrum které pořád ještě vypadá jako normální spektrum |
---|
0:07:55 | takže nějak |
---|
0:07:57 | nějak takhle a tam se kouknete na dvě nebo tři hodnoty vedle sebe tak jsou |
---|
0:08:01 | tam korelované nebo nekorelované |
---|
0:08:04 | docela těžce korelované jo protože sedí vedle sebe ve spektru to znamená velice _e říká |
---|
0:08:10 | se setkáte s tím že by ty hodnoty lítali nějak úplně nezávisle na sobě |
---|
0:08:15 | jo takže ta _e poslední transformace |
---|
0:08:18 | a inverzní fourierka neboli |
---|
0:08:20 | diskrétní kosinova |
---|
0:08:22 | je tam _e jednak proto abych šel dimenzionalita u dolů ale taky pro to aby |
---|
0:08:27 | se ty jednotlivý |
---|
0:08:29 | aby se ty jednotlivý koeficienty _e de korelovaly |
---|
0:08:33 | doby to _e by se tím chtěl zabývat trošku |
---|
0:08:37 | hlouběji |
---|
0:08:38 | tak _e tak řekněte já vám _e pošlu třeba nějakou tabulku nebo grafiky s bázemi |
---|
0:08:45 | tady té diskrétní kosinové transformace |
---|
0:08:49 | vidíte že to není žádná strašná věda protože vlastně to třiadvaceti bodový spektrum se napřed |
---|
0:08:55 | pro mít a |
---|
0:08:57 | tady do takovédle báze |
---|
0:08:59 | co to je |
---|
0:09:00 | takovejhle signálových nakreslím nebo takle |
---|
0:09:03 | stejnosměrná složka přesně tak potom |
---|
0:09:07 | i tam byla nějaká takováhle _m |
---|
0:09:09 | co to je |
---|
0:09:12 | _e pozor základní frekvence ne protože teďka sem ve spektru mám třiadvacet bodu ve spektru |
---|
0:09:17 | a snažím se je promítat do nějakej |
---|
0:09:20 | do nějakejch útvaru tajnou pak tvaru |
---|
0:09:24 | tady todleto jestli mě s zrak neklame tak je půlka periody kosinusovky |
---|
0:09:29 | jo proto se ta transformace taky jmenuje diskrétní |
---|
0:09:33 | kosinova další _e další ten signál vypadá takhle to vlastně celá perioda kosinusovky pak mám |
---|
0:09:40 | pocit že sou tam na |
---|
0:09:42 | _e že tam jeden a půl a takhle to postupně roste a roste a vlastně |
---|
0:09:46 | přidáváte _e se kosinusovce na frekvenci |
---|
0:09:50 | _e |
---|
0:09:51 | když se vezme na ty jednotlivý báze podíváte |
---|
0:09:55 | tak _e |
---|
0:09:56 | tak dejme tomu u té u té první a druhé |
---|
0:10:00 | co byste voni dokázali říct jako z matematicky jo |
---|
0:10:03 | z hlediska |
---|
0:10:05 | prošli stejného ortogonality je |
---|
0:10:09 | já vím že po ortogonalitou si člověk představí doma když jako se nalepí nějakou políčku |
---|
0:10:14 | a teďka vona jako |
---|
0:10:16 | D ze zdí pod pravým úhlem tak to je ta z dobrá lidská hordu ortogonalita |
---|
0:10:20 | to znamená ortogonalita _e matematicky |
---|
0:10:26 | _e podobnost ne právě že vůbec ne |
---|
0:10:29 | kolmost no jasně |
---|
0:10:30 | pro opravu vlasta jak byste tu pravou los třeba _e třeba počítali u dvou vektorů |
---|
0:10:36 | byste měli takhle jeden vektor a takhle druhej vektor ten bude mít souřadnice X jedna |
---|
0:10:41 | Y jedna tady ten nebude mít X dva Y dva |
---|
0:10:47 | skalární součin super a teďka sem vám tady nenamaloval _e vektory ale dvě funkce |
---|
0:10:54 | že to že na nich ještě pořád pude udělat skalární součin |
---|
0:10:57 | bude v pohodě |
---|
0:10:59 | každým bodě takhlek |
---|
0:11:00 | takhle bysme to asi dokázali numericky a dokonce my sme to dokázali aera a její |
---|
0:11:05 | analyticky takže vlastně si ty funkce pronásobíme s každičkým bodě a pak to zintegrujeme taky |
---|
0:11:09 | to bude skalární součin |
---|
0:11:11 | a když si představíte skalární součin tady těhletěch dvou funkcí tak tady tahleta je furt |
---|
0:11:16 | say na tahle tede s kladné části záporné části |
---|
0:11:21 | takže jejich _e skalární součin bude nula a kdybyste si podobný myšlenkový cvičení nebo když |
---|
0:11:26 | by nestačil mozek tak si to můžete udělat matlabu vyzkoušeli pro jakékoliv další pár _e |
---|
0:11:31 | baví tak zjistíte že sou vždycky _e vždycky na sebe kolmý přes ortogonální |
---|
0:11:38 | jo a pokud člověk něco promítne do ortogonálních bází |
---|
0:11:42 | tak má docela velkou šanci že _e ten výsledek bude mění korelovanej nečteš to do |
---|
0:11:48 | co do toho budete strkat |
---|
0:11:50 | takže to jenom to bylo jenom pár slov výběru tady těch parametrů a proč je |
---|
0:11:54 | tam za poslední krabička |
---|
0:11:59 | všechny navzájem |
---|
0:12:01 | když mimochodem když si vyzkoušejte totéž fourierovu transformaci |
---|
0:12:05 | se kteroukoliv variantou radost do B S T |
---|
0:12:09 | F Ř do sopel jakýkoli se to |
---|
0:12:12 | tak _e vám ta ortogonalita vždycky |
---|
0:12:16 | vždycky vyjde čtyři to vyzkoušet prostě vopravdu matlabu nebo na papíře |
---|
0:12:21 | zkoušet jo vy vychází tady s těma komplexníma exponenciálama |
---|
0:12:26 | tak |
---|
0:12:27 | takže tím sem zdlouhavě chtěl říct |
---|
0:12:31 | že v těchto vektorech mám nějakou sadu čísel |
---|
0:12:35 | kterými budu každých deset milisekund reprezentovat svůj vlastní takže |
---|
0:12:40 | zkusím tady ten zmatek po mazat |
---|
0:12:50 | _e |
---|
0:12:52 | tady budeme mít jednu maticí parametrů |
---|
0:12:59 | tady budu mít druhou maticí parametrů zase abychom si udělali představu vo nějakejch reálných číslech |
---|
0:13:05 | tak _e počet těch koeficientů |
---|
0:13:08 | základní přiblížení je třináct tak se mám teďka maloval |
---|
0:13:13 | s tom krásným muset co schemátku |
---|
0:13:16 | hodně často řekněme ještě přibírají tak zvaný _e delta parametry a delta parametry to myslíte |
---|
0:13:22 | že to bude |
---|
0:13:23 | čím |
---|
0:13:25 | čím each co se značí deltou takhle jako |
---|
0:13:28 | jo |
---|
0:13:30 | _e chyba nebo nebudeš něco jinýho rozdíl jsem tady zaslechl |
---|
0:13:34 | jo dokonce jako se s _e se _e s tím potkáte v reálným světě |
---|
0:13:39 | když budete dělat na nějakým projektu |
---|
0:13:42 | tak _e váš blíž S |
---|
0:13:44 | máme na schůzce týdnu té řekne tak jaká je delta moc týdne od minulýho týdne |
---|
0:13:50 | ale teďka jako musíte nastoupit potáhnou si to kravatu jako říct tak jako udělal jsem |
---|
0:13:54 | to toto jo takže delta se používá jako _e synonymum rozdílu nebo |
---|
0:14:00 | _e dobře a _e rozdíl děleny časem |
---|
0:14:04 | je co |
---|
0:14:09 | když sedím autě |
---|
0:14:11 | a v čase T sem tady |
---|
0:14:14 | a za vteřinu sem tady |
---|
0:14:17 | tak rozdíl těchdle dvou drah |
---|
0:14:20 | je rozdíl drah a děleno časem je takovéto co |
---|
0:14:24 | takže to rychlost jo takže prosím vás těm delta parametrům |
---|
0:14:28 | se taky někdy říká rychlostní |
---|
0:14:37 | a pak sou delta parametry |
---|
0:14:40 | a tím se říká jak |
---|
0:14:42 | akcelerační jasně víte výztuž to umíte |
---|
0:14:46 | tak |
---|
0:14:47 | jo angle anglicky vytékalo bylo asi bylo si ty |
---|
0:14:50 | _e tady toho vektoru jsem to si piš úplně stejně skoro taktika mně ještě řekněte |
---|
0:14:55 | když máme _e takovýhle |
---|
0:14:58 | takovýhle vektor tam je třináct koeficientů |
---|
0:15:02 | jak byste k tomu ty rychlostní parametry spočítali |
---|
0:15:14 | jo vlastně otázka je |
---|
0:15:18 | jaká je rychlost změny |
---|
0:15:20 | každýho jednotlivýho parametrů dobře podle to zjednodušit nebudovat i ochromovat vektorem třinácti parametrů |
---|
0:15:27 | ale každej deset milisekund něpřijde jedno čísílko jeden parametr |
---|
0:15:33 | a aby chtěl vědět |
---|
0:15:36 | jaká je rychlost jeho změny |
---|
0:15:41 | jak byste to dali dohromady |
---|
0:15:46 | je sebe co |
---|
0:15:50 | třeba změnou hodnotou že jo tak byste si vzal minulou hodnotu |
---|
0:15:54 | a ty dvě byste navzájem odečetli |
---|
0:15:56 | a buď se to může podělit nějakou hodnotou časovou nebo nemusí vone to úplně jedno |
---|
0:16:02 | a dostanete pojem o rychlosti a rozpoznávání řeči se dělá úplně to samý akorát se |
---|
0:16:08 | těch hodnot bere _e bere trošičku víc |
---|
0:16:11 | většinou se bere okno který má _e kterýma |
---|
0:16:15 | pět hodnot |
---|
0:16:17 | to znamená pro ten pro ten současnej pro tu současnou hodnotu kterou bysme označili té |
---|
0:16:24 | tak _e se tam bere nějaká funkce která má tuším tady koeficient nulu |
---|
0:16:30 | tady má jeden a půl tady má jedna tady má mínus jeden a půl |
---|
0:16:35 | tady mám mínus jedna a vlastně takovýmhle okýnkem se ty _e jednotlivý _e jednotlivý hodnoty |
---|
0:16:42 | pro násobí |
---|
0:16:44 | pak se to všecko sečte |
---|
0:16:46 | a dostanete pojem o rychlosti |
---|
0:16:49 | tak teďka se vás nebudu ptát |
---|
0:16:52 | dál |
---|
0:16:53 | _e kdybyste si tady tohleto představili jako číslicový filtr |
---|
0:16:58 | jo protože to je skutečně číslicový filtr který má takovouhle |
---|
0:17:02 | _e takovouhle impulsní odezvu |
---|
0:17:06 | jo |
---|
0:17:08 | tak _e co by to bylo za filtr jako by měl kmitočtovou charakteristiku |
---|
0:17:16 | tak jako takhle se občas nakláněla nějaká fáze jo na přednáškách něco se na fázi |
---|
0:17:20 | zapomeňte tady tohle |
---|
0:17:21 | tohle sou hodnoty _e |
---|
0:17:24 | hodnoty koeficientů toho filtru |
---|
0:17:34 | a nebo si vezměte ten váš minulej ten sobě no moc ode odečítal dvě sousední |
---|
0:17:39 | hodnoty od sebe ten by měl jako kmitočtovou charakteristiku |
---|
0:17:44 | jak a |
---|
0:17:46 | no proto |
---|
0:17:47 | ano horní proč horní |
---|
0:17:54 | protože zesiluje změny a kilo je jakýkoliv pomalý |
---|
0:17:59 | pomalý pohyby stejnosměrnou složku věc spolehlivě kilo jo když byste měli vedle sebe dvě stejný |
---|
0:18:04 | hodnoty tak stejná mínus stejná je nula prostě tam nezbyde nic když to změny bude |
---|
0:18:09 | _e změny bude posilovat |
---|
0:18:11 | ano prosím vás se pokusím světla řada jedna |
---|
0:18:18 | a |
---|
0:18:22 | a tady toto sou zeslabit protože |
---|
0:18:25 | usuš je to dobrý dyž usušen atomy vidět no změnilo se vůbec něco |
---|
0:18:30 | aha |
---|
0:18:37 | rešerše taky žaluzie dolů a nahoru se jan indexu |
---|
0:18:41 | no nic tak |
---|
0:18:42 | to snad s na to půjde |
---|
0:18:45 | tak _e dobře takže víme jak udělat _e jim jak udělat rychlostní koeficienty tím že |
---|
0:18:50 | každou každý vlastně časový průběh koeficientu pro filtru takovýmhle jednoduchým _e filtříčky mac bysme to |
---|
0:18:57 | udělali ty akcelerační |
---|
0:19:01 | těch rychlostní to udělám ještě jednou že jo a je to |
---|
0:19:05 | jo takže prosím vás jenom vás chci _e na vést k tomu že taková typická |
---|
0:19:09 | velikost vektoru |
---|
0:19:11 | kterým reprezentuju jeden rámec řeči |
---|
0:19:15 | by byla třicet devět |
---|
0:19:18 | ten magický číslo pro rozpoznávání řeči |
---|
0:19:21 | třináct kepstrálních koeficientů třináct délce |
---|
0:19:25 | a tři na vojtech del |
---|
0:19:29 | takže třicet devět |
---|
0:19:31 | float u |
---|
0:19:32 | velikost jednoho vektoru |
---|
0:19:34 | teďka mě řekněte když mám třeba vteřinovou promluvu |
---|
0:19:38 | jednadvacet nebo létající prase nebo něco takového inteligentního kolik těch vektoru bude |
---|
0:19:43 | do to ještě nezapomněl |
---|
0:19:47 | to |
---|
0:19:48 | jo tak |
---|
0:19:49 | uvědomte si že pracuju prostě |
---|
0:19:51 | zhruba cestovkou vektor nebo ne zhruba přesně cestovkou vektoru za sekundu |
---|
0:19:56 | tak |
---|
0:19:57 | a teď se konečně dostávám k tomu _e rozpoznávání |
---|
0:20:02 | kdy vlastně tady mám takovouhle krásou matici s parametry tady mám taky takovou krásnou matici |
---|
0:20:08 | s parametry vám tady tyhle dvě navzájem srovnat |
---|
0:20:11 | tak zkuste měří s C pokud byste tady tohle |
---|
0:20:16 | srovnali dejme tomu zmenšováním řetězců jo máte řetězec _e znaků metající prase |
---|
0:20:25 | a pak máte druhý řetězec znaků |
---|
0:20:27 | a chcete zjistit jestli bylo řečeno létající pro se nebo ne |
---|
0:20:30 | a teďka tady máme takový matice _e řečových rámců tak mě zkuste popovídat taky tam |
---|
0:20:35 | budou rozdíly |
---|
0:20:41 | no pro první rozdíl bude ten že dva _e dvě písmenka můžete match note přesně |
---|
0:20:46 | nebo ne prostě lo |
---|
0:20:48 | jo a není to nic jinýho jo |
---|
0:20:51 | jedno do |
---|
0:20:53 | dva řečové rámce nemůžete match know přesně protože ani ten samej člověk ani přesně stejných |
---|
0:20:59 | podmínkách to nikdy nedá tak aby těch devětatřicet čísel těch float u bylo uplně přesnej |
---|
0:21:07 | že budeme muset _e se uchýlit |
---|
0:21:10 | buď k měření nějakej vzdálenosti a to ste viděli _e |
---|
0:21:14 | s budete véčka zaliju a ještě to tady _e ještě to problém jednou a nebo |
---|
0:21:19 | se budeme muset uchýlit k nějakýmu modelování statistickým u |
---|
0:21:23 | když si třeba řekneme uděláme model teďka vlastně pots ten modelu vložím jaksi ty _e |
---|
0:21:29 | ty naměřené parametry a podívám se jak moc ten model bude pálit jo a tady |
---|
0:21:34 | toto pro mě bude míra _e míra podobnosti |
---|
0:21:37 | takže |
---|
0:21:38 | tohle bude jeden problém jo modelování nějakejch rozložení nebo měření vzdálenosti |
---|
0:21:44 | druhej problém bude |
---|
0:21:45 | co |
---|
0:21:51 | ne to může být česku jinak dlouhý jo prostě _e napsané slovo ahoj má pořád |
---|
0:21:57 | čtyři písmenka a když je to jinak tak to je špatně |
---|
0:22:01 | _e řečené slovo ahoj může mít čtvrt vteřiny |
---|
0:22:05 | když to říká |
---|
0:22:07 | ostrava takové ahoj |
---|
0:22:08 | tak to bude mít šestnáctinu vteřiny a když to ve říkat želva tak to bude |
---|
0:22:12 | z dlouhé dvě vteřiny a pořád to bude to samé slovo to znamená že se |
---|
0:22:16 | rozpoznávání řeči se nevyhneme nějakému časovému srovnání časové normalizaci |
---|
0:22:23 | jo a teďka ještě aby to bylo složitější |
---|
0:22:26 | tak _e |
---|
0:22:28 | souhlásky |
---|
0:22:29 | který _e dvou natáhnout |
---|
0:22:32 | a souhlásky který nejdou natáhnout _e když budete po někom chtít |
---|
0:22:36 | aby _e kdy řeklo slovo prase _e |
---|
0:22:40 | dlouze tak že si řekne práce |
---|
0:22:45 | jo a no můžete si vyzkoušet klidně _e tetě si jistě všimnete že _e na |
---|
0:22:51 | _e na samohláska toto natažení dokázali udělat |
---|
0:22:55 | ale třeba na plus vývě to |
---|
0:22:57 | prostě žádný natažení nebude |
---|
0:23:00 | jo to znamená pokud by někdo měl výborný nápad ten |
---|
0:23:04 | že mezi těmito dvěma sekvencemi udělá lineární srovnání časové to znamená že |
---|
0:23:09 | _e si řekne tady tohleto je délka nul |
---|
0:23:13 | a tady tohle je délka měl |
---|
0:23:16 | a teďka si udělám nějaký přepočítala tý koeficient který bude funěl lomeno L |
---|
0:23:21 | a změnám sobě na _e tato tady jako pojedu nějakým indexem ten indexy vynásobím kontaktu |
---|
0:23:28 | měl lomeno D a pak to zaokrouhlíme dolů na celý rámce abych mohl indexovat tady |
---|
0:23:34 | tak je to předem odsouzeno |
---|
0:23:36 | neúspěchu jo protože to _e protože to takhle funguje |
---|
0:23:40 | takže budeme potřebovat nějaký nějakou techniku |
---|
0:23:44 | která |
---|
0:23:45 | si vlastně to indexování dvou sekvencí bude řídit úplně sama |
---|
0:23:50 | a bude sama vyhledávat ty místa který spolu co nejlépe sedí jo |
---|
0:23:58 | no a teďka už se dostáváme postupně _e kde se dvojí véčku |
---|
0:24:04 | _e zase budu muset podívat do nějaké přednášky abych |
---|
0:24:08 | abych _e měl správnou |
---|
0:24:12 | správnou notaci |
---|
0:24:16 | _e jo délka |
---|
0:24:18 | délka referenční promluvě R vilka testovací promluvě to |
---|
0:24:24 | změny zase musel vědět |
---|
0:24:27 | jo takže tady tohle by bylo reference a tam a R frameu |
---|
0:24:32 | a ten test má |
---|
0:24:34 | to frameu |
---|
0:24:36 | a teď těch _e si udělám to že já si _e zařídím |
---|
0:24:43 | dvě |
---|
0:24:46 | _e neřekl bych nezávislý ale dvě indexovací funkce |
---|
0:24:51 | první se budeme nula jmenovat erko |
---|
0:24:54 | a druhá se bude jmenovat řekl |
---|
0:24:57 | a rok to vlastně bude poloha indexu ste referenční sekvenci takže semka někde bude ukazovat |
---|
0:25:04 | řekl |
---|
0:25:06 | a sem to bude ukazovat řekl |
---|
0:25:10 | a budu si muset ty dvě indexovací sekvence řídit tak aby byly vždycky nejlepší |
---|
0:25:16 | _e |
---|
0:25:18 | asi jehož tušíte |
---|
0:25:21 | že budeme muset |
---|
0:25:24 | mít |
---|
0:25:25 | nějakým způsobem zajištěný když _e tady bude mít prostě na indexoval i |
---|
0:25:29 | v referenci jeden vektor |
---|
0:25:32 | zrovna tady tenhleten |
---|
0:25:36 | a testu budu mít na indexovány taky nějaké vektor |
---|
0:25:39 | tak my musíme mít nějakou možnost S rovnat co byste doporučovali na srovnání dvou dlouhej |
---|
0:25:45 | devět a třiceti prvkových vektorů |
---|
0:25:52 | dobrý tak vidím že to je složitá otázka |
---|
0:25:55 | když máme dvě čísla Á a B |
---|
0:25:59 | tak byste je srovnali jestli sou podobný nebo nejsou |
---|
0:26:05 | si |
---|
0:26:07 | rozdíl bezva |
---|
0:26:09 | rozdíl může být kladné nebo záporné kde se mně nelíbí a nechci aby šlapanic do |
---|
0:26:14 | brna byla záporná vzdálenost |
---|
0:26:16 | tak nemohli takhle třeba ne |
---|
0:26:18 | a vy se to dobře počítali bysme to mohli dat jako na druhou ne |
---|
0:26:23 | a řekněte mě tady tohleto |
---|
0:26:26 | počítá |
---|
0:26:30 | tam se můžu zbavit že jo to je _e |
---|
0:26:37 | ne moment lomeno nekecám |
---|
0:26:42 | prostě absolutní |
---|
0:26:44 | hodnota no já bych |
---|
0:26:46 | nedokázal spočítat jako taky druhou odmocninu |
---|
0:26:50 | N |
---|
0:26:51 | a mínus B na druhou |
---|
0:26:53 | tak proč myslíte jsem to dělat takhle hrozně složitě |
---|
0:26:58 | ne |
---|
0:26:59 | ale jo |
---|
0:27:01 | tak _e teďka budu mít dvouprvkový vektory budou mít _e vektor Á jedna dvě |
---|
0:27:07 | který mě bude určovat _e |
---|
0:27:09 | zetové souřadnice jedna souřadnice dvě tohleto je |
---|
0:27:13 | vektor Á jedna a dvě |
---|
0:27:17 | _e budu mít _e vektor E B jedna B dvě |
---|
0:27:26 | a já budu chtít vědět jak tady vzdáleno |
---|
0:27:30 | jak na to |
---|
0:27:33 | perfektní tak toto tady uši nadefinuju nějakej pojem jako de tlustý _e jako že vektor |
---|
0:27:40 | tlustý B jako že vektor |
---|
0:27:42 | _e bude druhá odmocnina |
---|
0:27:45 | _e |
---|
0:27:47 | B dva mínus B ježíš maria |
---|
0:27:54 | B dva mínus a dva |
---|
0:27:57 | na druhou |
---|
0:27:59 | plus |
---|
0:28:00 | B jedna mínus A jedna na druhou |
---|
0:28:03 | super tak takhle bychom to asi dokázali jo na když budeme mít teďka devětatřicet ti |
---|
0:28:07 | nebo obecně nějaký P rozměrný vektory takto budeme dělat úplně stejně to znamená de |
---|
0:28:14 | a |
---|
0:28:15 | tlustý bude zase druhá odmocnina a teďka to tam budu asi muset uzavřít do nějaké |
---|
0:28:20 | sumy protože bych psal |
---|
0:28:22 | zase mimochodem jednou viděl v nějaké písemce |
---|
0:28:26 | _e sem dal nějaký prostě jako |
---|
0:28:28 | výpočet který vedl na |
---|
0:28:30 | _e na geometrickou sekvenci a očekávám takhle kratičký jako vzorec a |
---|
0:28:35 | budete tam rozepsal a když popsal tři řádky tak tam napsal a to už bych |
---|
0:28:39 | se psal |
---|
0:28:41 | tak ale mně to dobře dostupný počet bodů |
---|
0:28:44 | _e takže bychom měli _e dimenze těch vektorů beka mínus tak a |
---|
0:28:50 | a káčko bylo vod jedničky do P kde P je velikost vektoru a tady tohle |
---|
0:28:56 | by bylo |
---|
0:28:57 | na druhou jo takže euklidova vzdálenost prosím vás se počítá úplně stejně ve dvourozměrným jako |
---|
0:29:03 | v deviza třiceti rozměrným prostoru akorát že to byly do třiceti rozměrným se to dá |
---|
0:29:07 | trošku hůř _e |
---|
0:29:09 | Ú S |
---|
0:29:11 | _e pochopit a představit |
---|
0:29:15 | tak |
---|
0:29:19 | _e dobře |
---|
0:29:22 | co sem tím chtěl říci |
---|
0:29:26 | chtěl jsem ti říci to |
---|
0:29:29 | že |
---|
0:29:30 | když si ten referenční |
---|
0:29:33 | vektor |
---|
0:29:35 | nebo referenční sekvenci |
---|
0:29:38 | referenční promluvu |
---|
0:29:39 | teďka se zase musím pardon podívat i jestli u maluju vodorovně nebo |
---|
0:29:44 | jo referenci jsem maloval svisle tak dobrý |
---|
0:29:49 | tak |
---|
0:29:52 | zase si že tady tohleto je referenční promluva |
---|
0:29:58 | jo K každej ten vektor obsahuje devětatřicet čísel |
---|
0:30:02 | tohleto je testovací promlouval |
---|
0:30:11 | a teď _e si budu schopný spočítat takovouhle matici |
---|
0:30:16 | která se bude jmenovat matice lokálních vzdáleností a to nebude nic jinýho než prostě |
---|
0:30:23 | vzdálenost |
---|
0:30:24 | šest vektoru každý s každým jo prostě tady když vezmete ten vektor druhé vektor tady |
---|
0:30:31 | na tomhle puntíků matici najedete vzdálenost _e nebo ne najdete spočítáte si pomocí vobyčejná _e |
---|
0:30:38 | euklidovy vzdálenosti vzdálenost tady těhletěch dvou vektor |
---|
0:30:42 | jo takže máme dej dejme tomu li tady tato promluva _e jednu sekundu a tady |
---|
0:30:47 | tato _e promlouvám Á nula celá sedmdesát pět |
---|
0:30:51 | sekund tak mám sedmdesát pět krát to |
---|
0:30:54 | _e takovýhle lokálních vzdálenosti to je hrozně hezký ale bych potřeboval jenom jednu jedinou která |
---|
0:31:01 | mě bude kvantifikovat jak moc je ta testovací promluva blízko referenční |
---|
0:31:08 | a eště sem říkal by bylo dobrý _e kdyby ta _e kdyby tam vzdálenost nějak |
---|
0:31:14 | zohledňovala optimální na skládání těch _e referenčních a testovacích vektorů na sebe |
---|
0:31:23 | tak |
---|
0:31:23 | teďka bych od vás chtěl |
---|
0:31:25 | nějaký rady protože my _e tu jednu vzdálenost |
---|
0:31:29 | asi nebude ochotně počítá jako třeba sumu tady těch čísel toto byl nesmysl že jo |
---|
0:31:34 | co by bylo potřeba udělat |
---|
0:31:36 | teďka je _e téhleté velké tabulce si nadefinovat nějakou srovnávací cestu |
---|
0:31:44 | jo |
---|
0:31:50 | tak |
---|
0:31:51 | která bude říkat který vektory se spolu budou _e srovnávat |
---|
0:31:57 | a po téhleté cestě se bude počítat a finální vzdálenost takto se vám tam nelíbí |
---|
0:32:01 | a testy |
---|
0:32:03 | ta smyčka že jo |
---|
0:32:05 | _e |
---|
0:32:06 | dobrý ten ani blbě proč to tam proč jako zrovna ne |
---|
0:32:12 | _e _m můžou _e |
---|
0:32:17 | ale _e dal srovnávací cesta by měla respektovat to že řeč plyne |
---|
0:32:22 | prostě jako v odleva nebo od minulosti |
---|
0:32:25 | do budoucnosti a nemůže se mění jo to znamená zase stavím _e obou těch směrech |
---|
0:32:31 | měla být |
---|
0:32:32 | tak to řekne matematicky |
---|
0:32:34 | _e |
---|
0:32:35 | no funkce může být celkem cokoliv ale ne class neklesající menu |
---|
0:32:41 | pole může být může být konstantní |
---|
0:32:44 | jo |
---|
0:32:45 | ta funkce může být konstantní proč protože _e právě jedna _e jedna promlouvání kratší druhá |
---|
0:32:51 | je delší a vy můžete chtít aby se jednomu _e testovacímu frameu na rovnalo tady |
---|
0:32:57 | třeba deset jo deset frameu _e referenčních pokud |
---|
0:33:02 | se to vašemu algoritmu vedle líbí jo takže jako konstanty tam být mohou |
---|
0:33:06 | ale nemělo by to rozhodně klesat nemělo by sto dvacet |
---|
0:33:10 | to byste ještě u té cesty |
---|
0:33:13 | _e očekávali takový |
---|
0:33:16 | inteligentní |
---|
0:33:18 | _e |
---|
0:33:21 | to vlastnosti který by to cesta měla mít |
---|
0:33:26 | říká se budov tato úplně plně houpej oleg dobyta cesta měla začínat |
---|
0:33:32 | na začátku že by měla končit |
---|
0:33:35 | na konci jo takže jako bylo by fajn kdyby ta cesta začínala tady |
---|
0:33:40 | a končila tady |
---|
0:33:43 | _e to by eště bylo fajn |
---|
0:33:46 | kdy bylo to kdyby ta cestám byla |
---|
0:33:51 | _e nějakým způsobem regulovaná co se týče si ho maximálního _e maximálního skoku |
---|
0:33:58 | nebo kroku |
---|
0:34:00 | jo a ten krok si většinou řídíme takže tato _e velice konzervativně takže ta cesta |
---|
0:34:05 | prostě může udělat |
---|
0:34:06 | _e jeden posunu s testu |
---|
0:34:09 | a žádnej v referenci |
---|
0:34:11 | nebo může udělat jeden posun v referenci a žádnej testu |
---|
0:34:15 | a nebo může udělat _e jeden krok v referenci I testu tímhle zajištěny se nám |
---|
0:34:22 | to press cesta taky vez buben vezme všecky vektory a nebude _e že nějak nesmyslně |
---|
0:34:30 | nebude nějak nesmyslně přeskakovat |
---|
0:34:32 | jo a pokud už jednou máme takovouhle testu cestu _e nadefinovanou |
---|
0:34:38 | tak _e my si můžeme nějak označit se a teďka nevím jak jsem to měl |
---|
0:34:43 | přednášce |
---|
0:34:46 | _e tady sme co |
---|
0:34:52 | protože tadle zase to sem nebudu jmenovat co |
---|
0:34:56 | a teď si můžeme definovat podle tady této cesty dvě _e ta cesta bude popsaná |
---|
0:35:02 | nějakým |
---|
0:35:03 | svým krokem |
---|
0:35:07 | jakým prostě počítadle _m počitadlem K normální hodnota která valí vod jedničky až do až |
---|
0:35:13 | do délky té _e cesty |
---|
0:35:16 | a _e budeme mít dvě indexovací sekvence první bude rok _e |
---|
0:35:22 | a ta bude indexovat referenci a druhá bude to K |
---|
0:35:27 | a to bude indexovat _e test a obě dvě tady tyhlety funkce závislý na _e |
---|
0:35:33 | nezávislým parametru K budou dávat dohromady cestu jo |
---|
0:35:39 | tak _e teďka mě zkuste říct _e |
---|
0:35:42 | pokud teda mám takovýhle _e takovýhle omezení pohybu té cesty to znamená |
---|
0:35:49 | kdybysme to napsali tak budič |
---|
0:35:52 | _e buď červ K |
---|
0:35:54 | _e |
---|
0:35:56 | plus jedna |
---|
0:35:58 | rovná se |
---|
0:35:59 | rok _e |
---|
0:36:01 | plus jedna a |
---|
0:36:04 | _e |
---|
0:36:05 | a to K plus jedna |
---|
0:36:07 | rovná se to K |
---|
0:36:10 | nebo |
---|
0:36:11 | jo tímhle vlastně zapisuju teďka podmínky nebo rok N plus jedna |
---|
0:36:17 | a toto napíšu jednoduše jo se nehýbe |
---|
0:36:21 | a _e |
---|
0:36:23 | a to je to plus jedna rovná se |
---|
0:36:26 | tak _e plus jedna |
---|
0:36:29 | nebo |
---|
0:36:30 | nebo obojí |
---|
0:36:32 | tady to je teda matematicky zápis jako blázen ale na ten přesnej se podíváte do |
---|
0:36:36 | slajdů |
---|
0:36:37 | takže pokud mám ty podmínky takto definovány tak mně řekněte jaká může být maximální délka |
---|
0:36:42 | cesty |
---|
0:36:45 | přesně tak jo tady když _e |
---|
0:36:47 | to reference má délku R a test má délku velký T tak maximální délka cesty |
---|
0:36:53 | bude _e bude R plus to |
---|
0:36:57 | tak |
---|
0:36:58 | R růstu |
---|
0:36:59 | jo protože nejhorším za _e možná alternativa že tam dostanu takhle |
---|
0:37:05 | a nebo takhle |
---|
0:37:07 | a všechny vostatní sou kratší |
---|
0:37:10 | tak _e |
---|
0:37:13 | tetě _e |
---|
0:37:16 | bychom si mohli jiří |
---|
0:37:20 | jak |
---|
0:37:21 | bude |
---|
0:37:23 | _e jak se bude počítat _e váha nebo vhodnost |
---|
0:37:27 | každé té cesty |
---|
0:37:30 | koncovým co byste mě poradili jak rozlišit jestli nějaká cesta dobrá nebo špatná |
---|
0:37:40 | dobrý a teďka jako by to asi chtělo nějakou formu ku jak to spočítat |
---|
0:37:46 | takže dobro cesty |
---|
0:37:49 | _e |
---|
0:37:50 | to budeme značit asi D kordisté řekl nějaká vzdálenost |
---|
0:37:54 | bude vlastně |
---|
0:37:55 | počítat prokl se rovná jedna |
---|
0:37:59 | _e |
---|
0:38:00 | teďka nemám žádný písmenko na _e na počet |
---|
0:38:05 | roku té cesty |
---|
0:38:06 | tak dejme tomu velký K jako C |
---|
0:38:10 | a tam bude ta lokální vzdálenost a teďka čeho |
---|
0:38:16 | dvou vektorů |
---|
0:38:18 | v referenci na ten vektor ukazuje |
---|
0:38:21 | tady tahleta indexovací sekvence |
---|
0:38:24 | a s testu a ty vektory ukazuje tady tahleta sekvence a teďka nevím zase jak |
---|
0:38:28 | se _e značili ty jednotlivý vektory aha testovací s označil o a referenční R a |
---|
0:38:34 | protože sou to vektory tak musí být tlustý |
---|
0:38:37 | takže o |
---|
0:38:40 | tak jo |
---|
0:38:44 | a R |
---|
0:38:47 | jako |
---|
0:38:51 | _e |
---|
0:38:52 | tak a teďka _e prosím vás |
---|
0:38:55 | mě tam ještě něco |
---|
0:38:57 | chybí |
---|
0:39:03 | na určení dobu dosti každé cesty |
---|
0:39:08 | _e vzdálenosti nebo čím přesně |
---|
0:39:12 | R podporu poďme postupně |
---|
0:39:15 | když _e vlastně udělám takovýhle |
---|
0:39:19 | _e když udělám takhle počítání té jedné |
---|
0:39:22 | to je jedné _e lokální vzdálenosti dvou vektorků |
---|
0:39:27 | tak _e já musím nějak zohlednit jak jsem se tady do téhle tvoje dvojice vektorku |
---|
0:39:32 | dostal to buď může být vlastně tady |
---|
0:39:35 | nebo může být tady no můžu by tady |
---|
0:39:37 | a teďka přichází na řadu nějaká penalizace |
---|
0:39:42 | jo nebo _e |
---|
0:39:44 | znevýhodnění té které cesty |
---|
0:39:47 | a já to udělám fikaně a řeknu tak když jsem se pohnul jenom v jednom |
---|
0:39:51 | směru |
---|
0:39:53 | tak bude váha tady téhleté _e lokální vzdálenosti jedna |
---|
0:39:58 | jsem se pohnul tady |
---|
0:40:00 | jiným směru ale zase jenom v jednom tak bude váha dvě a teďka pozor tak |
---|
0:40:06 | to bylo jako za komunistů jo to znamená jako ten kdo pracoval mosazí base rychleji |
---|
0:40:10 | tak jako ještě |
---|
0:40:12 | ještě si ho podali tak |
---|
0:40:13 | to je úplně dete ve je úplně stejný to znamená pokud se pohnou příliš rychle |
---|
0:40:18 | obou směrech |
---|
0:40:20 | tak _e to povolím |
---|
0:40:22 | ale dám tomu váhu dvě |
---|
0:40:24 | to znamená tady toto vlastně bude zatíženo takovýdle pohyb větší vahou jo takže tady přidáme |
---|
0:40:29 | nějaký _e nějaký koeficient |
---|
0:40:32 | který bude |
---|
0:40:34 | _e který bude záležet na mým pohybu cestě a pravé sme si řekli jakou váhu |
---|
0:40:39 | že když se pohnu takhle tak to bude jednička když takhle tak jednička |
---|
0:40:44 | když takhle na šikmo tak |
---|
0:40:46 | tak dvojka |
---|
0:40:48 | _e |
---|
0:40:51 | který udělám jakou velkou čáru |
---|
0:40:54 | a |
---|
0:40:55 | tuto spočítanou mu na kumulovanou vzdálenost budu něčím potom chtít podělit po normovat |
---|
0:41:03 | čím byste asi ten řekli |
---|
0:41:06 | prosím |
---|
0:41:09 | bacha délkou cesty ne pozor a dycky když máte nějaký vzoreček |
---|
0:41:13 | tam je suma nějakých hodnot které jsou násobený určitými vahami |
---|
0:41:17 | jo protože ty dvojice krásová |
---|
0:41:19 | a pak vám řeknu bude se normovat tak a jsou tam vlády |
---|
0:41:24 | bacha maximální délka temene vzorečku jsou váhy _e |
---|
0:41:28 | sumovat přesně tak jo vždycky když nic neuvidíte něco takovýho a je tam dole normalizace |
---|
0:41:34 | tak je tam prostě suma vach |
---|
0:41:36 | jo |
---|
0:41:38 | takže tady bude suma všech dva |
---|
0:41:43 | tak |
---|
0:41:44 | kolika suma vach asi tak je |
---|
0:41:55 | to zkuste popřemýšlet kolik ta smlouva asi tak bude klidně si nakreslete na čtverečkované papír |
---|
0:41:59 | nějakých pár obrázku |
---|
0:42:02 | stanic kolik to asi to bude |
---|
0:42:07 | no ste R plus T vlastně byl kate referenční promluvy |
---|
0:42:12 | plus délka testovací promluvil |
---|
0:42:15 | tady tenhleten setup nebo _e tohleto nastavení vás má tu výhodu |
---|
0:42:20 | že opravdu ten normalizační faktor |
---|
0:42:22 | pokaždý bude úplně stejnej |
---|
0:42:25 | bude to R mluvte |
---|
0:42:27 | cože hrozně fajn |
---|
0:42:29 | protože _e nám to velice zjednoduší věci |
---|
0:42:34 | výborně |
---|
0:42:35 | mám krásný velký vzoreček |
---|
0:42:39 | pro _e výpočet srovnávací |
---|
0:42:42 | _e nebo pro výpočet vzdálenosti těch dvou sekvencí po jedné cestě |
---|
0:42:48 | takže teďka _e nic nebrání tomu abych si tam na tahal všechny možný cesty |
---|
0:42:53 | že jo |
---|
0:42:55 | pro každou spočítal tady tuto hodnotu |
---|
0:42:58 | a pak si vybral jenom jednu jedinou která bude reprezentovat srovnání tady těch mých dvou |
---|
0:43:04 | _e promluv která to bude |
---|
0:43:13 | jak a |
---|
0:43:14 | nejmenší před přesně tak nejmenší vahou protože tam si vlastně budu jistej že se k |
---|
0:43:18 | sobě narovnali vektory kterých _e nejlíp sedí který každá dvojice budou mít nebo ne každá |
---|
0:43:24 | bude mít minimální vzdálenost ale sumě |
---|
0:43:27 | dosáhnu minimální vzdálenosti |
---|
0:43:30 | jo takže ještě jednou mohl bych |
---|
0:43:32 | pro zkoušet teďka všechny možný cesty |
---|
0:43:35 | ukažte vyhodnotit tady tu do C |
---|
0:43:38 | pasivních vybrat co nejmenší asi jo P mám jednu hodnotu dete ve vzdálenost |
---|
0:43:44 | a tahle bude _e výsledek |
---|
0:43:47 | mýho srovnání |
---|
0:43:49 | akorát že by to asi dalo trochu práce že jo |
---|
0:43:52 | tak _e poďme zkusit zapřemýšlet |
---|
0:43:55 | jestli _e |
---|
0:43:57 | jestli by se to nedalo nějak |
---|
0:43:59 | obejít |
---|
0:44:01 | zjednodušit |
---|
0:44:13 | tak _e |
---|
0:44:14 | já vám ukážu takovej |
---|
0:44:16 | takový obrázek |
---|
0:44:20 | _e a tom obrázku C definujeme _e druhou matici to bude tak zvaná matice částečných |
---|
0:44:25 | kumulovaných vzdáleností |
---|
0:44:28 | asi si ho budu chtít namalovat tady |
---|
0:44:31 | vedle této to tady trošku promarnil |
---|
0:44:40 | tak |
---|
0:44:42 | tady toto byla matice lokálních vzdáleností prostě každý s každým |
---|
0:44:51 | a tady toto bude |
---|
0:44:52 | matice |
---|
0:44:55 | částečných |
---|
0:44:59 | kumulovaných |
---|
0:45:02 | vzdáleností |
---|
0:45:09 | a na matice částečně kumulovaných vzdáleností |
---|
0:45:13 | každičkým svým bodě |
---|
0:45:16 | obsahuje _e nejlepší _e |
---|
0:45:19 | obsahuje |
---|
0:45:21 | nenormalizovanou |
---|
0:45:24 | _e vzdálenost |
---|
0:45:27 | jo to znamená beztoho to faktorů |
---|
0:45:29 | po nejlepší cestě |
---|
0:45:31 | která vede zpočátku tady do tohodle |
---|
0:45:35 | no tohohle bodu jo |
---|
0:45:37 | to jak tam zajistíme tu nejlepší vo tom si právě teďka budeme povídat jo to |
---|
0:45:41 | znamená ta _e vzdálenost vedou |
---|
0:45:46 | my budeme značit |
---|
0:45:48 | zase musím |
---|
0:45:50 | _e jo G |
---|
0:45:56 | _e |
---|
0:45:59 | tady je prostě nějakej bot |
---|
0:46:01 | E G |
---|
0:46:05 | G P je |
---|
0:46:08 | tak ta obsahuje |
---|
0:46:09 | vlastně pro tento vzoreček |
---|
0:46:14 | který vychází počátku ale končí právě ne nejde a že až do konce promluv a |
---|
0:46:20 | dokončit tady tomhle bodě |
---|
0:46:22 | tak a teďka prosím vás _e bych |
---|
0:46:26 | chtěl |
---|
0:46:28 | abyste si představili tady tuto _e |
---|
0:46:32 | toto záležitost jako tabulku |
---|
0:46:36 | drama jaký sloupce nějaký řádky |
---|
0:46:41 | _e já tu tabulku |
---|
0:46:43 | plním vodspoda nahoru |
---|
0:46:46 | tady můžu mám |
---|
0:46:48 | tady můžu mám všude vyplněnou |
---|
0:46:51 | jo to když to je dobrý tady to taky dobrý |
---|
0:46:53 | a proto tady na tomhle bodě |
---|
0:46:56 | si vyrobit tady tento bot B je |
---|
0:47:01 | odkud jsem se do tohodle bodu tak si mohu dostat |
---|
0:47:06 | zespoda zleva a nebo zespoda zleva jo |
---|
0:47:10 | tak nebo tak |
---|
0:47:13 | a je docela dobrý že tady v těchto bodech účty vzdálenosti mám hotový tam to |
---|
0:47:17 | může mám spočítaný |
---|
0:47:19 | jo tady máme nějaký _e de |
---|
0:47:23 | _e já teďka nevím co je pro mě vodorovná to svislá nasekané prostě tipnuté Í |
---|
0:47:28 | mínus jedna je |
---|
0:47:30 | tady mám |
---|
0:47:31 | hobby houby pardon tady to sou všecko géčka jo |
---|
0:47:35 | tady mám G T mínus jedna je |
---|
0:47:38 | tady mám víte co |
---|
0:47:40 | to je to byl hroznej matek _e mám udělám zoom tady na toto |
---|
0:47:44 | tak |
---|
0:47:46 | chci počítat tenhleten chlíveček |
---|
0:47:49 | kde hodnota k D R jo |
---|
0:47:52 | a tam jsem se mohl dostat tohodle bodu kde mám G E mínus jedna L |
---|
0:47:59 | a nebo s tohodle bodu kde mám K V |
---|
0:48:03 | mínus |
---|
0:48:06 | _e |
---|
0:48:13 | G E B mínus jedna je mínus jedna |
---|
0:48:17 | a nebo tady vodsaď |
---|
0:48:19 | kde mám dvě D |
---|
0:48:22 | je mínus jedna |
---|
0:48:24 | odněkud inu jsem se tam dostanem o |
---|
0:48:27 | a sem si jistej _e nebo vím že tady tyto hodnoty mám spočítaný abych teď |
---|
0:48:32 | chtěl abyste měli mě dali předpis pro výpočet tady této hodnoty kterou neznám |
---|
0:48:47 | a pozor budeme konstruovat vlastně jako lokálně optimální cestu tady někde počátku které je tady |
---|
0:48:54 | někde pryč |
---|
0:48:56 | do tohoto |
---|
0:48:58 | do tohoto bodu |
---|
0:49:01 | s tím že už mám hotový cesty sem |
---|
0:49:04 | sem a sem |
---|
0:49:06 | tak mně řekněte prosím |
---|
0:49:09 | _e kterou těch se mám do tohoto bodu G P je protáhnout |
---|
0:49:21 | no |
---|
0:49:22 | asi tu která mi tady tomto bodě dá nejlepší tedy minimální výsledek že jo |
---|
0:49:28 | a _e ně vlastně stačí |
---|
0:49:32 | udělat to mně stačí vzít si lokální vzdálenost těch dvou vektorů kterou si vyberu tady |
---|
0:49:36 | se |
---|
0:49:37 | _e tady k té levé tabulky jo to je to tady tu modrou vzdálenost troufám |
---|
0:49:41 | přepočítanou samozřejmě to D je |
---|
0:49:46 | a já ji zkusím připočíst |
---|
0:49:49 | tady k tomuto bodu |
---|
0:49:51 | s koeficientem jedna |
---|
0:49:56 | zkusím ji připočíst tady k tomuhle vodu |
---|
0:49:59 | bacha koeficientem dva protože penalize jo ten hodně rychlý pohyb po úhlopříčce |
---|
0:50:05 | dva krát D je |
---|
0:50:08 | a zkusím ji vzít _e připočíst _e tady to mohl bodu jedna krát D je |
---|
0:50:16 | a s těmi co udělal s těmi třemi hodnotami |
---|
0:50:21 | vyberou by bylo nejmenší jo tak mě třeba jako nejmenší v jinde tady tato |
---|
0:50:26 | tak to je výborné protože já a naplním ten bod běží je tady touto hodnotou |
---|
0:50:34 | tím pádem dostanu čísílko a eště by mohlo udělat to |
---|
0:50:41 | co když budeme někdy chtít _e když budeme někdy chtít zjistit jak to optimální cesta |
---|
0:50:46 | vypadá |
---|
0:50:47 | co by jste doporučovali |
---|
0:50:53 | bylo by dobrý si zapamatovat |
---|
0:50:55 | odkud sem tady do tohodle vodu přišel znamená mít _e mít nějakou _e paměti |
---|
0:51:02 | jeden integer nebo pointer nebo cokoli tam si uložím že sem do tohodle bodů přišel |
---|
0:51:08 | tady zespoda |
---|
0:51:10 | tak a teď tě _e si zkusme _e |
---|
0:51:15 | teď si zkusme jako trošku |
---|
0:51:17 | zkusme zapřemýšlet |
---|
0:51:20 | pokud tady ta cesta |
---|
0:51:22 | potom s tohoto bodu půjde |
---|
0:51:24 | nějakým jiným směrem kamkoli cache až do konce |
---|
0:51:28 | tak může tady tenhleten zbytek ještě ovlivnit |
---|
0:51:33 | tento výběr můj který jsem právě udělal |
---|
0:51:38 | jo kdy když potom na té cestě budu mít ještě dalších deset hodnota budu se |
---|
0:51:42 | rozhodovat deset doprava nebo doleva |
---|
0:51:44 | tak _e má některý tady s těchto jako budoucích |
---|
0:51:49 | puntíku šanci ovlivnit nebo nějak změnit tady tenhleten o můj výběr |
---|
0:51:54 | nemá |
---|
0:51:55 | jo tohleto je prosím vás hrozně důležitý C u algoritmu dete dvojvé |
---|
0:52:01 | že vlastně já můžu udělat lokálně |
---|
0:52:05 | nejlepší rozhodnutí |
---|
0:52:07 | a tady to lokálně nejlepší rozhodnutí už potom nebude dál dalšíma výpočtem a změněno |
---|
0:52:13 | toto to je prosím vás jako hrozná _e rovná bomba a prakticky základ celýho dete |
---|
0:52:18 | dvojice |
---|
0:52:19 | a v mírné varianty potom i skrytých markovových modelů jo protože já vlastně |
---|
0:52:24 | postupuju v té tabulce |
---|
0:52:26 | _e normálně zleva doprava zespodu nahoru |
---|
0:52:31 | prvními s každým bodě si udělám prostě nějaký rozhodnutí a to rozhodnutí potom bude platit |
---|
0:52:39 | tak _e teďka mě prosím vás řekněte dvě věci jak tady ten _e jak tady |
---|
0:52:43 | ten algoritmus ukončit co když |
---|
0:52:46 | tedy dojde do tady do toho posledního chlívku |
---|
0:52:53 | dobře pokud to potřebuju pokud mně stačí jenom numerická hodnota srovnání těch dvou sekvencí |
---|
0:53:00 | tak se na nějaký vykresování můžu celkem _e |
---|
0:53:03 | celkem vykašlat a prostě si vezmu tu hodnotu udělám jednu operaci pozor jakou |
---|
0:53:09 | musím to znormalizovat jo protože tady ta tabulka mě s udává nenormalizované kumulované vzdálenosti |
---|
0:53:16 | a prostě mám srovnání těch dvou sekvencí končím šmitec |
---|
0:53:20 | jo |
---|
0:53:21 | když budu chtít _e samozřejmě zjistit jak vypadali průběhy těch dvou sekvencí _e teka a |
---|
0:53:28 | R K znamená jak vypadala cesta |
---|
0:53:31 | tak si tady v tom poslední bodě řeknu odkud sem tam přišel o co |
---|
0:53:36 | odkud sem přišel sem a odsud odkud jsem přišel sem _e osum roků jsem slyšel |
---|
0:53:41 | jsem a tak dále a může se takhle době které jsou what cache |
---|
0:53:45 | action a počátek a zjistit jak to optimální cesta skutečně vypadá |
---|
0:53:50 | tak ještě sme si nefunguje pověděli _e jak to bude tady s tím prvním |
---|
0:53:56 | jak to bude s tím prvním řádkem a s tím prvním sloupcem prosím |
---|
0:54:01 | jo tam to není tak úplně jasný jak ten algoritmus nahodíme vlastně jako inicializujeme |
---|
0:54:07 | co byste tady |
---|
0:54:08 | co byste tady doporučili |
---|
0:54:13 | jo vyplnění prvního řádku a prvního sloupce |
---|
0:54:17 | _e musíš more to ne |
---|
0:54:24 | jo prosím vás tak dostanu čísílka |
---|
0:54:27 | sem |
---|
0:54:29 | a sem |
---|
0:54:36 | nebo |
---|
0:54:38 | jak vlastně dostanu čísílko sem |
---|
0:54:40 | no úplně prvního chlívků který má index jedna |
---|
0:54:44 | prosím |
---|
0:54:49 | jenom |
---|
0:54:51 | bacha já vlastně ten algoritmus nahrazuju |
---|
0:54:55 | a tím nahození udělám takhle šikmý pohyb |
---|
0:54:58 | takže ano je to tam déčka ale vahou dvě |
---|
0:55:02 | bacha jo to je to je jako taková nepříjemná věc |
---|
0:55:05 | že tady tento chlíveček je spočítaný vlastně jako de jedna |
---|
0:55:09 | krát dvě |
---|
0:55:10 | že tam je penalizace |
---|
0:55:12 | a jak potom vyplním ty další chlívky |
---|
0:55:19 | no je tam jenom jediná možnost jo prostě jako jedu takovým způsobem |
---|
0:55:25 | že vždycky té předcházející hodnotě přidávám patřičnou hodnotu těch ste matice _e lokální vzdálenosti |
---|
0:55:33 | kdybyste to prosím vás chtěli vyjádřit matematicky jako jak tam teda zkonstruovat tu podmínku tak |
---|
0:55:39 | můžete říct tady tohleto je vlastně úplně klasicky dete véčko |
---|
0:55:43 | akorát _e tady udělám |
---|
0:55:46 | tu záležitost že hodnot že se tam přidám nějaký extra řádek a přidám si tam |
---|
0:55:51 | extra sloupec |
---|
0:55:52 | a tím extra řádku extra sloupcům dám hodnoty nekonečno |
---|
0:55:56 | jo takže kdybyste se tam teda jako chtěli pohnout vodněkud minut |
---|
0:56:01 | tak to pude ale hodnota to je |
---|
0:56:04 | tyčky bude nekonečno plus jeden krát lokální vzdálenost takže hrozně velký tak si ji stěrači |
---|
0:56:10 | vyberte tu druhou |
---|
0:56:13 | no a tady toto je |
---|
0:56:15 | toto je princip _e nette dvojvé |
---|
0:56:18 | možná že bysme si ještě na to rezervuje ve mohli tak nějaký |
---|
0:56:22 | nějaký rychlo příklad |
---|
0:56:25 | ale příklady uvidíme ještě na poslední přednášce mám na numerickém cvičení |
---|
0:56:30 | takže jenom _e tady to zdlouhavější opakování uzavřu tím |
---|
0:56:35 | jak pomocí determu jde udělat a rozpoznávač prosím vás |
---|
0:56:43 | jo zatím sme se tady bavili o srovnání dvou sekvencí vektoru referenční testovat |
---|
0:56:49 | teďka chci aby to je to rozpoznával aby se tím třeba dali říká že telefonní |
---|
0:56:53 | čísla nebo volit jestli chcete šunkovou nebo sýrovou nebo obou pizzu |
---|
0:57:00 | a nebo mimochodem moh zavěšení mobilu máte rozpoznávač zaměřené na dete véčku tak máčknete tlačítko |
---|
0:57:06 | ke smete do toho kočička chcete aby to dalo |
---|
0:57:10 | telefonní číslo vaší mile |
---|
0:57:13 | přitom tam máte té konkrétní milé máte tam vložených deset telefonních čísel různých milých a |
---|
0:57:20 | jak to teda teďka uděláme prosím vás jo zatím sme se bavili o srovnání dvou |
---|
0:57:24 | sekvencí tečky rozpoznávat |
---|
0:57:30 | tak |
---|
0:57:31 | to bude docela |
---|
0:57:34 | straight forever že jo budu mít nějaký slovník |
---|
0:57:41 | k tomu slovníku |
---|
0:57:43 | budu mít různý |
---|
0:57:44 | referenční sekvence vektorů |
---|
0:57:47 | jo tady toho bude třeba nějaká |
---|
0:57:50 | R jedna |
---|
0:57:51 | _e toho bude na ta kratší dobude dejme tomu R dvě |
---|
0:57:55 | a to D |
---|
0:57:58 | proč nějaké R |
---|
0:58:00 | R |
---|
0:58:01 | měl |
---|
0:58:05 | každá ta sekvence vektorů prosím vás má M S C tečkama tam prostě pěkně vyskládané |
---|
0:58:10 | každých deset milisekund |
---|
0:58:12 | pak příde test testovací nějaká promluva |
---|
0:58:17 | velký tlustý o |
---|
0:58:20 | tak _e co uděláme |
---|
0:58:28 | si rozpoznat která si referenčních sekvenci |
---|
0:58:32 | to byla |
---|
0:58:33 | a tam máte nějak něco pěknýho tak tady třeba |
---|
0:58:36 | toto je _e |
---|
0:58:39 | čunkova |
---|
0:58:41 | nic |
---|
0:58:43 | sírová |
---|
0:58:46 | _e |
---|
0:58:47 | a Y |
---|
0:58:54 | tak jak rozpoznáte kterou ten člověk chtěl pizzu |
---|
0:59:00 | máme dete ve máme mocný nástroj který dnes teďka právě vyrobili |
---|
0:59:09 | no tak jacka spočítáme dete ve vzdálenosti |
---|
0:59:15 | vstupní sekvence |
---|
0:59:17 | ze všema reference _m a |
---|
0:59:19 | jo |
---|
0:59:20 | pro každou referenční musíme spočítat |
---|
0:59:24 | maticí lokální vzdálenosti potom tam poštvat ten _e ten algoritmus |
---|
0:59:29 | na stavění matice částečně kumulovaných vzdálenosti a dostaneme sadu |
---|
0:59:36 | do té vzdálenosti |
---|
0:59:38 | R jedničkou |
---|
0:59:40 | de o |
---|
0:59:42 | R dvojkou měněna až de |
---|
0:59:46 | slov tvýho |
---|
0:59:47 | S R |
---|
0:59:49 | měl |
---|
0:59:51 | co s nima |
---|
0:59:53 | vyberu nejmenší a je to |
---|
0:59:57 | minima vyberu minimum |
---|
1:00:00 | a je to třeba tady tahle takže chci pizzu a Y |
---|
1:00:05 | jo uvědomte si prosím vás že _e právě pro výběr |
---|
1:00:09 | může možná že nám nebylo jasný |
---|
1:00:12 | když sme tady došli nakonec se _e na konec té matice tady jako semka |
---|
1:00:19 | proč tam ještě bylo potřeba nějaká normalizace jo protože já sem říkal že tady si |
---|
1:00:22 | vlastně vememe poslední hodnotu |
---|
1:00:25 | _e to byla _e to bylo vlastně ta částečná kumulovaná vzdálenost dvě C R |
---|
1:00:33 | a teďka ju eště musím znormalizovat |
---|
1:00:36 | _e |
---|
1:00:37 | těmi dvěma |
---|
1:00:39 | _e těmi dvěma délkami |
---|
1:00:41 | tak tady toto nám nebylo jasný proč jsme to dělali |
---|
1:00:44 | jo _e |
---|
1:00:46 | uvědomte si že pokud máme ve slovníku |
---|
1:00:50 | _e když máme ve slovníku |
---|
1:00:53 | dvanáct vypit |
---|
1:00:55 | jedna |
---|
1:00:56 | jeden názvy třeba nic |
---|
1:00:58 | a druhá je sírová artyčoky a |
---|
1:01:02 | ostrým dresink M |
---|
1:01:04 | a jedno slovo má _e dejme tomu a nevím sto milisekund a druhým a čtyři |
---|
1:01:09 | sekundy |
---|
1:01:11 | tak ty dvě hodnoty _e |
---|
1:01:15 | částečných kumulovaných vzdálenosti budou mít úplně jinou dynamiku |
---|
1:01:20 | jo to znamená kdybyste _e kdybyste tady tyto dvě hodnoty |
---|
1:01:24 | srovnávali |
---|
1:01:26 | tak klidně můžete říct slovo blaf |
---|
1:01:29 | a pak můžete říct _e slovo _e |
---|
1:01:33 | jo sem teďka zapomněl |
---|
1:01:35 | kruhová syrová s výborným dresink M já můžete to říct úplně přesně a to slovo |
---|
1:01:40 | blaf i když bude když naprosto nebude odpovídat co voni |
---|
1:01:45 | tak bez normalizace i když tam budete mít totálně štilácký _e lokální vzdálenosti tady bude |
---|
1:01:51 | tak málo |
---|
1:01:52 | že prostě sumě vám dají lepší hodnotu než když budete rozpoznávat nějaké dlouhatánský heslo |
---|
1:01:59 | jo pokud budeme normalizovat C |
---|
1:02:02 | _e délka s testovací sekvence plus délka referenční sekvence tak máme šanci že ty hodnoty |
---|
1:02:08 | budou numericky |
---|
1:02:09 | srovnatelné |
---|
1:02:12 | jo tak to bylo jenom poznámka ho |
---|
1:02:15 | o normalizaci a proč |
---|
1:02:18 | kdy tam budem potřebovat |
---|
1:02:20 | no a tady takhle si můžete klidně vyrobit _e rozpoznávač izolovaných slov nějakým malým slovníkem |
---|
1:02:27 | a já si teďka neuvědomuju jedna z labiny jedete dvojvé nebo ne nebo není |
---|
1:02:37 | jedna z laboratoří |
---|
1:02:39 | našeho předmětu |
---|
1:02:43 | no |
---|
1:02:57 | je tam |
---|
1:02:58 | jo tak už o tom nebudu povídat protože do uvidíte v laboratořích a jako s |
---|
1:03:01 | těch z těch aktuálních nebo s těch _e umí to sou |
---|
1:03:05 | aktuální výborně |
---|
1:03:08 | tak _e dobrý |
---|
1:03:11 | takže toto bylo devíti dublinu |
---|
1:03:14 | teďka se poďme podívat o kousek dál |
---|
1:03:18 | a jsou skryté markovovy modely kde vlastně |
---|
1:03:21 | vidíme velmi podobné věci |
---|
1:03:27 | aha |
---|
1:03:31 | tak a teďka teda _m chviličku technická pauza protože |
---|
1:03:37 | _e |
---|
1:03:38 | tohle vám budu muset ukazovat ze svýho notebooku |
---|
1:03:42 | možná malovat na tabuli |
---|
1:03:44 | lukáš totiž používá nějaké krásného takové udělátko kterým se do power pointu dají psát |
---|
1:03:50 | rovnice macechu |
---|
1:03:54 | akorát že to |
---|
1:03:55 | potřebuje nějakých pár fontů |
---|
1:03:59 | které se samozřejmě nedají nainstalovat na školní |
---|
1:04:03 | mašiny |
---|
1:04:35 | ho |
---|
1:04:37 | modrá obrazovka sem nebral |
---|
1:05:05 | no tak zmizneš než nabootujeme |
---|
1:05:07 | tak to jim mám protože na těch prvních několika s rovnice zrovna nejsou |
---|
1:05:12 | tak _e |
---|
1:05:14 | _e |
---|
1:05:16 | extrakci |
---|
1:05:18 | příznaku sme tady povídali |
---|
1:05:21 | jo to znamená |
---|
1:05:22 | každý kde sedmi sekund dostaneme nějakou _e nějakou hodnotu |
---|
1:05:28 | a teď prosím vás lukáš to tady má ukázané na _e jednorozměrné příkladu |
---|
1:05:33 | a takový kulkách do plotu kdy vlastně řekneme že každý řečový rámec máme k dispozici |
---|
1:05:39 | pouze jednu jedinou hodnotu _e nějakýho parametr |
---|
1:05:44 | jo a teď prosím vás _e rozdíl od toho jak to vypadalo |
---|
1:05:49 | jak to vypadalo před chvilkou |
---|
1:05:51 | před chvilkou _e sme to měli takže existovala ve slovníku |
---|
1:05:57 | rozpoznávače |
---|
1:05:58 | konci měli systém restartnout |
---|
1:06:01 | vidíme to zkusím ještě jednou bude další modrá obrazovka |
---|
1:06:04 | tak _e měli sme ve slovníku rozpoznávače |
---|
1:06:08 | _e nějakou jinou |
---|
1:06:10 | promluvu |
---|
1:06:12 | která měla taktéž své hodnoty |
---|
1:06:14 | a tady tyto hodnoty |
---|
1:06:16 | sme spolu navzájem srovnávali napřed sme si udělali nějakou tu velkou matici lokálních záloh ty |
---|
1:06:21 | pro tam hledali nějaké cestičky |
---|
1:06:24 | a tak a tak dál |
---|
1:06:25 | a teď to bude trochu jinak |
---|
1:06:28 | my ve slovníku rozpoznávače nebudu mít nebudeme mít žádnou jako _e referenční promluvu |
---|
1:06:35 | ale budeme tam mít nějaký model |
---|
1:06:40 | a ten model |
---|
1:06:42 | bude |
---|
1:06:44 | jako kdyby |
---|
1:06:45 | generovat je tyto hodnoty |
---|
1:06:48 | a u každé té hodnoty |
---|
1:06:50 | budeme schopni říct |
---|
1:06:52 | jaká je pravděpodobnost toho že by ten model zrovna tady tuto hodnotu vygenerovat |
---|
1:06:58 | já _e říká se ten mohanem kam generativní modely a to je to ne _e |
---|
1:07:04 | ten pojem _e vobčas jako nemá moc krát protože on je ve skutečnosti nic ne |
---|
1:07:09 | generujou |
---|
1:07:11 | prostě my potřebujeme jenom ty pravděpodobnosti jednotlivých hodnot tady v tomhle případě |
---|
1:07:16 | skaláru normálním ne zase modrá obrazovka sorry |
---|
1:07:21 | normálním případě vektoru |
---|
1:07:24 | _e takže já mám _e já někdy říkáme že budeme počítat pravděpodobnosti s jakými ty |
---|
1:07:31 | vektore ty modely jednotlivé vektory žerou |
---|
1:07:34 | takže prostě moje modely budou spíš hrát nějaké hodnoty |
---|
1:07:45 | tak zapomeňte naše společenství pracovat |
---|
1:07:56 | to je to pouze stává se vám něco podobného sedum N když set připojíte na |
---|
1:08:00 | tom jedu row _m na bezdrátovu síť a poslední odpojíte |
---|
1:08:05 | a _e |
---|
1:08:07 | nebo chcete znovu |
---|
1:08:09 | máte počítačové spací módu předtím struny připojení na sedum a pak přijdete do nějaké místnosti |
---|
1:08:14 | kde drum není tak stala se vám že vám |
---|
1:08:17 | padá počítač na ústa |
---|
1:08:21 | docela zajímavá věc |
---|
1:08:23 | toto líbezná mohli vyřešit protože to bylo docela pravidelně |
---|
1:08:29 | modré obrazovky jsou |
---|
1:08:32 | su modré |
---|
1:10:46 | obvykle s tím že já tady ty fonty nemám |
---|
1:10:50 | jo je to tam na prase já jsem směna výborně |
---|
1:10:54 | tak poďme na to |
---|
1:10:56 | takže |
---|
1:10:56 | nebo fischl jak sme si něco říkali minule o tom že budeme modelovat _e taky |
---|
1:11:01 | poďme se podívat na úplně nejjednodušší příklad _e |
---|
1:11:04 | kdybychom chtěli vzít jeden rámec řeči |
---|
1:11:08 | a chtěli bychom říct jestli je tady zahráme C tři patří do jedné nebo do |
---|
1:11:12 | druhé třídy jo tady |
---|
1:11:14 | _e je takový jednoduchý přiblížení |
---|
1:11:17 | že toto je dejme tomu spočítaná krátkodobá energie |
---|
1:11:21 | ale bysme chtěli říct _e jestli je ten zvuk _e znělý |
---|
1:11:27 | a nebo neznělý jo takže když bude zněly nebude mít prostě velkou energii a když |
---|
1:11:31 | bude neznělý tak bude mít malou energii |
---|
1:11:34 | _e texture |
---|
1:11:36 | na ose X |
---|
1:11:38 | jsou naznačeny vlastně nějaké funkce přesně by se řeklo funkce hustoty rozdělení pravděpodobnosti ale teďka |
---|
1:11:46 | prostě si dvě představte jenom jako nějaké kopečky |
---|
1:11:49 | a po tyhle kopečky budou posílat jednotlivé hodnoty |
---|
1:11:55 | a ten kopeček který pro danou hodnotu bude víš tak to vyhraje |
---|
1:12:00 | jo takhle jednoduchoučký to je takže představte si že tady budu mít jednu hodnotu kterou |
---|
1:12:05 | budu chtít vo klasifikovat |
---|
1:12:07 | note pošlu sem |
---|
1:12:09 | zjistím že modrý kopeček _e svítí tolik a červený kopeček svítí hrozně málo tak _e |
---|
1:12:15 | řeknu že tady toto hodnota prostě bulva byla _e byla nezněl a protože měl a |
---|
1:12:20 | malou energií |
---|
1:12:22 | tak |
---|
1:12:24 | _e |
---|
1:12:27 | když _e bychom to chtěli zapsat matematicky |
---|
1:12:32 | tak _e tady budou mít dvě nějaké hodnoty |
---|
1:12:36 | dračím nebudeme říkat pravděpodobnosti ale budeme jim říkat prostě třeba skóre nebo |
---|
1:12:42 | nebo věrohodnosti nebo |
---|
1:12:45 | my tomu říkáme likelihoody I česky protože likelihoody česky věrohodnost ale jako T takový |
---|
1:12:52 | to je takový podivný slovo |
---|
1:12:54 | a za tou je za tou čárkou |
---|
1:12:58 | je vždycky to co známe |
---|
1:13:01 | a před tou svislou čárkou je to co chceme určit |
---|
1:13:05 | jo takže likelihoody |
---|
1:13:06 | když známe vstupní hodnotou X |
---|
1:13:09 | té _e té _e |
---|
1:13:13 | _m té třídy unvoiced |
---|
1:13:16 | právě jsme změřili že bude takováhle likelihood s té třídy _e pardon |
---|
1:13:23 | co |
---|
1:13:25 | ne nezměřím že likelihoodu T třídy a nebo jestli bude tady toto |
---|
1:13:30 | likelihoodu T třídy ano vole bude |
---|
1:13:34 | tahleta takže když se zeptáme tady tuto otázku zdali vo jestli většina šanuje sem tak |
---|
1:13:40 | si řekneme prostě že ne |
---|
1:13:42 | a _e a určíme |
---|
1:13:45 | že ta hodnota patřila tady toto ruce modré cizího takže tady klasifikační úloha prostě dvě |
---|
1:13:51 | třídy |
---|
1:13:53 | jedna vstupní hodnota dvě funkce hustoty rozdělení pravděpodobnosti který mě vyplivnou dvě čísla já si |
---|
1:14:00 | položím tady tuhletu otázku a _e a hnedka na ní |
---|
1:14:06 | zkamení zjistím odpověď |
---|
1:14:09 | _e |
---|
1:14:11 | co |
---|
1:14:13 | je trošku problém |
---|
1:14:15 | je ten že já vlastně tady s toho _e těch grafiku |
---|
1:14:19 | nedostáváme _e nebo toto co bych chtěl |
---|
1:14:23 | tak jsou pravděpodobnosti prostě když přijde hodnota i jaká je pravděpodobnost |
---|
1:14:28 | znělé třídy |
---|
1:14:30 | a jaká je pravděpodobnost neznělé třídy |
---|
1:14:35 | době _e na těchto funkcích vlastně to že _e já dostávám hodnotu opačnou jo to |
---|
1:14:44 | modrá mě _e určuje |
---|
1:14:46 | když by tady tato hodnota byla přída unvoiced kolik by to bylo a když by |
---|
1:14:52 | tady tato hodnota byla třída voiced |
---|
1:14:54 | kolik by to byl to pro vás cvika není žádný velký rozdíl |
---|
1:14:58 | ale matematicky to celkem lstivé a naštěstí existuje chytrý vzoreček |
---|
1:15:04 | tak zvaný based u |
---|
1:15:05 | který nám to _e který nám to umožňuje |
---|
1:15:09 | možně přepsat viděli jste někdy B jsou |
---|
1:15:12 | nejsou vzoreček |
---|
1:15:17 | jo ten vlastně _e |
---|
1:15:21 | ten vlastně říká _e tady ještě pořád něco kam se data |
---|
1:15:25 | tam se dá psát |
---|
1:15:32 | no |
---|
1:15:36 | jejda no |
---|
1:15:38 | nám říká že _e pokud je |
---|
1:15:42 | pokud je nějaká pravděpodobnost |
---|
1:15:45 | jeho |
---|
1:15:47 | _e |
---|
1:15:48 | podle dám pravděpodobnost jevu B podmíněného |
---|
1:15:52 | jeden a |
---|
1:15:54 | tak _e to můžu zjistit jako |
---|
1:15:57 | pravděpodobnost |
---|
1:15:59 | inu _e |
---|
1:16:00 | podmíněného |
---|
1:16:02 | jeden B |
---|
1:16:04 | a teďka abych to totálně nedo vrtal |
---|
1:16:08 | _e |
---|
1:16:10 | měl bych to |
---|
1:16:12 | normovat pravděpodobností i u _e a tady bych měl |
---|
1:16:17 | _e dát takzvanou apriorní pravděpodobnost |
---|
1:16:22 | je vůbe jo a tady tohleto _e |
---|
1:16:25 | tohleto a vlastně ten vstupní hodnota nebo tady toto jsou pro nás data |
---|
1:16:33 | tak _e |
---|
1:16:37 | pro sem řekl |
---|
1:16:38 | že ta hodnota té B je apriorní pravděpodobnost |
---|
1:16:42 | co to znamená apriorní |
---|
1:16:50 | to znamená když |
---|
1:16:51 | někomu řeknete něco apriori víte |
---|
1:17:02 | jako |
---|
1:17:03 | tímhletím vzorečkem vlastně vy říkáte |
---|
1:17:06 | že _e |
---|
1:17:09 | máte nějaké jevy byl |
---|
1:17:12 | třeba že _e přijde váš _e |
---|
1:17:15 | spolubydlící nemůže přijde vaše přítelkyně ze kterou ste se rozešli |
---|
1:17:20 | a _e ta data sou ta |
---|
1:17:25 | že vidíte prostě nějaký obličej ve dveřích jo |
---|
1:17:30 | že to je B jako apriorní pravděpodobnost tak ještě vůbec nikdo nemusel sít že žádných |
---|
1:17:35 | si ve dveřích nevidíte |
---|
1:17:37 | a přitom už můžete nějak kvantifikovat jaká je pravděpodobnost tady těhletěch dvou B či |
---|
1:17:43 | jo spolubydlící za váma chodí každou chvilkou že si musíme pučit kytaru nebo já nevím |
---|
1:17:47 | cokoliv dalšího |
---|
1:17:48 | a přítelkyně ste se rozešli takže zhruba tak jedno procentní aby že apriorní pravděpodobnost |
---|
1:17:54 | že přijde zpátky jo to znamená tady se ještě neviděli data ale už máte o |
---|
1:17:59 | tom výsledku |
---|
1:18:01 | nějaké ponětí |
---|
1:18:04 | _e tohleto |
---|
1:18:07 | je |
---|
1:18:09 | pravděpodobnost |
---|
1:18:12 | toho že ví když vidíte nějakej obličej |
---|
1:18:20 | že |
---|
1:18:21 | je to buď že |
---|
1:18:23 | spolubydlící |
---|
1:18:25 | no přítelkyně |
---|
1:18:26 | samozřejmě vy tady tu pravděpodobnost poznáte jak byste to _e k byste to udělali nějakým |
---|
1:18:32 | _e strojově tak byste určili tady tuhletu pro pravděpodobnost nebo spíš likelihoodu |
---|
1:18:37 | je to spolubydlící no přítelkyně |
---|
1:18:47 | asi byste si museli udělat nějaký model že jo jako udělali byste si model přítelkyně |
---|
1:18:52 | podle fotky |
---|
1:18:54 | model spolubydlícího taky podle fotky potom prostě by ten příští k se objevil a vy |
---|
1:18:59 | byste spočítali likelihood že to buď ten a nebo ten tak jak je to tady |
---|
1:19:04 | s tím jak je to tady s tím spodky jak je to _e jaká je |
---|
1:19:07 | vlastně |
---|
1:19:08 | pravděpodobnost přístup |
---|
1:19:15 | todle _e todle jako těžší oříšek |
---|
1:19:19 | protože |
---|
1:19:21 | jen tak jako _e jen takto určit nejde říci prostě pravděpodobnost to psychiku je tolik |
---|
1:19:26 | a tolik |
---|
1:19:27 | tak byste to mohli udělat se tím že bysme vlastně zjistili _e jaký sou všechny |
---|
1:19:34 | možný hodnoty čitatele |
---|
1:19:36 | to znamená _e |
---|
1:19:39 | _e daly bysme tady sumu |
---|
1:19:42 | _e P |
---|
1:19:44 | _e |
---|
1:19:45 | přes _e |
---|
1:19:47 | přes všechny možný hodnoty véčka jo |
---|
1:19:52 | a prostě možné jako prostudovali tady tyhlety možnosti že to je _e že když je |
---|
1:19:58 | to přítel |
---|
1:19:59 | ta která tady tuhletu hodnotu a jeho apriorní pravděpodobnost byla taková že když je to |
---|
1:20:04 | přítelkyně tak jsou to zase nějaký hodnoty ale naštěstí prosím vás je tady tohleto pro |
---|
1:20:10 | nás nutný pro rozpoznávání když jsou jenom říct která si při to byla |
---|
1:20:15 | ten jmenovatel |
---|
1:20:17 | naštěstí to nutný není protože pořád stejnej jo to znamená většina těch našich rozpoznávat X |
---|
1:20:23 | algoritmu |
---|
1:20:24 | se tady dnes tohoto docela dobře obejde a pracuje jenom _e pracuje jenom S |
---|
1:20:31 | _e čitatele |
---|
1:20:33 | teďka já sem vám tady říkal jakou jako _e |
---|
1:20:37 | takové srandovní přiblížení jako přítelkyně _e a _e spolubydlící |
---|
1:20:45 | kdybyste nevěděli nic moc vo tom jak sou ty _e jak sou ty třídy apriorně |
---|
1:20:51 | rozložené to znamená kterou máte očekávat |
---|
1:20:54 | co byste asi co zbylo asi dobrý tady ta zatopte B |
---|
1:20:57 | apriorní pravděpodobnost nějaké tří |
---|
1:21:02 | úloh |
---|
1:21:03 | a když byste tam dali půlky |
---|
1:21:05 | a ty třídy měli dvě takž tady na toto můžete zapomenout úplně že jo takže |
---|
1:21:11 | že v tom vlastně nejednodušším pojetí |
---|
1:21:15 | my budeme pracovat jenom s likelihood jenom tady s těmito hodnotami |
---|
1:21:19 | a podle nich budeme rozhodovat |
---|
1:21:21 | jestli to byla jedna třída nebo druhá jo ale někde zpaměti byste měli mít |
---|
1:21:27 | _e povědomí o tom že existují také nějaké apriorní pravděpodobnosti |
---|
1:21:31 | a že nedejbože existují i ty jmenovatele který občas můžeme _e který občas můžeme potřebovat |
---|
1:21:38 | tak |
---|
1:21:39 | _e |
---|
1:21:41 | teď těch _e |
---|
1:21:43 | když budeme zkoušet _e |
---|
1:21:47 | _e když budeme zkoušet _e klasifikaci |
---|
1:21:50 | do více tříd |
---|
1:21:52 | jo když ty třídy nebudou jenom dvě |
---|
1:21:54 | ale bude jich víc |
---|
1:21:57 | tak _e se nám tady tahleta do té rovnice která tam byla před chvilkou |
---|
1:22:03 | _e změní nebudeme se jenom ptát prostě větší než menší než ale budu hledat maximum |
---|
1:22:10 | jo takže maximum |
---|
1:22:11 | _e |
---|
1:22:13 | toho nebo maximálně pravděpodobný když nějaký data jsou dané třídy |
---|
1:22:20 | bude tehdy když _e součin |
---|
1:22:23 | likelihoodu |
---|
1:22:24 | třída když sem viděl data krát _e apriorní pravděpodobnost té dané třídy pro danou třídu |
---|
1:22:31 | omega když prostě bude _e bude největší |
---|
1:22:35 | tak |
---|
1:22:36 | a |
---|
1:22:38 | jak _e jak to teďka ale dát dohromady |
---|
1:22:41 | protože tady ty křivky |
---|
1:22:43 | pro jednotlivý třídy nám samozřejmě nikdo nedá _e služby nenajdete matematickofyzikální |
---|
1:22:49 | tabulka |
---|
1:22:50 | takže _e zkuste mi říct |
---|
1:22:52 | jak bychom tady tyhle |
---|
1:22:55 | tyhle čáry ty funkce dali dohromady |
---|
1:23:00 | kde de víc aby to začalo klasifikovat rozpoznal |
---|
1:23:12 | tak zkuste si vzpomenout _e před chvilkou sem tady povídalo dete dvojí ve |
---|
1:23:16 | jo kde sme kde sme vzali ty slova |
---|
1:23:20 | který |
---|
1:23:21 | který se budou rozpoznávat |
---|
1:23:24 | nějaká databáze že jo někde musel nahrát a někdo k ní musím dát nějaký zdroj |
---|
1:23:28 | byly jako že tohleto je slovo jedná todleto je slovo a Y todleto je slovo |
---|
1:23:33 | nic a tak dál |
---|
1:23:34 | dyž budu dělat _e takovýhle _e teď třídění jenom vobyčejnej vektoru |
---|
1:23:40 | a budu sítí natrénovat tady ty |
---|
1:23:43 | křivky tak to musí být úplně stejně budu musí mít data |
---|
1:23:46 | a budu muset mít nějaké _e nějaké značky dejme tomu určený |
---|
1:23:53 | tady je _e to je prostě wavka |
---|
1:24:01 | a wavka se převede |
---|
1:24:04 | na |
---|
1:24:06 | sekvenci |
---|
1:24:08 | vektoru |
---|
1:24:09 | hodnota má |
---|
1:24:11 | a já budu mít časový značky který mě řeknou tady je to vo list |
---|
1:24:17 | jedno třeba značka hláska a tady bude unvoiced |
---|
1:24:23 | a tady bude sádlem s tady bude prostě |
---|
1:24:26 | tady bude ticho |
---|
1:24:27 | jo budete mít spoustu takovejhle vektoru |
---|
1:24:30 | takhle |
---|
1:24:31 | označen A |
---|
1:24:33 | a _e |
---|
1:24:36 | na těch vektory |
---|
1:24:38 | tady si to můžeme představit protože sme v tom v jednoduchým _e skalárním případu tak |
---|
1:24:43 | prostě budeme mít takovýhle |
---|
1:24:45 | tyčky naměřený který budou s jednotlivým značkama |
---|
1:24:49 | a na těch tečka prostě vybuduju |
---|
1:24:52 | tyto funk |
---|
1:24:57 | tak _e když samozřejmě budu mít těch _e bodu |
---|
1:25:01 | určitý |
---|
1:25:04 | množství |
---|
1:25:05 | tak ty funkce nebudou moci bit |
---|
1:25:08 | o složitý |
---|
1:25:11 | uprostřed budu muset pracovat s jednoduchým a funkce má taková dobrá |
---|
1:25:15 | funkce která reprezentuje data v reálným světě taky gaussovka |
---|
1:25:20 | zkuste měří taková gaussovka |
---|
1:25:22 | jaký má parametry že taková letech na jednorozměrné |
---|
1:25:32 | zkuste český čest česky |
---|
1:25:37 | normálně vona má nějakej prostředek že jo ten prostředek sem najat |
---|
1:25:42 | řekni hodnota super a pak je nějak pak jinak plus ta a to je |
---|
1:25:46 | to je určený buď rozptylem anebo směrodatnou odchylkou |
---|
1:25:50 | jedna na druhou se dá vpohodě přepočítat protože rozptyl je směrodatná odchylka na druhou jo |
---|
1:25:55 | takže todle je prostě jedna _e by čínská gaussovka |
---|
1:25:59 | _e |
---|
1:26:00 | tetě když _e budu počítat |
---|
1:26:05 | parametry takovýhle gaussovek |
---|
1:26:08 | tak mi to někdy půjde jednoduše |
---|
1:26:11 | a někdy to půjde trošku hůř _e v případě že mám tadyhle zelený data |
---|
1:26:17 | a zelenejch dat budu chtít _e spočítat parametry zelené gaussovky tak víte že existují jednoduchý |
---|
1:26:24 | analytický vzorečky |
---|
1:26:26 | střední hodnota to toastu štosy viděli že jo když prostě _e |
---|
1:26:32 | zelený data bych označíme jako by byl |
---|
1:26:35 | tak _e střední hodnota zelena bude prostě _e suma |
---|
1:26:40 | zadaří a tady v |
---|
1:26:42 | to bude |
---|
1:26:44 | jednu jedna N prostě _e |
---|
1:26:47 | jejich počet |
---|
1:26:49 | kdyby chtěl směrodatnou odchylku |
---|
1:26:52 | zelenou tak to bude asi něco jako jedna lomeno N |
---|
1:26:56 | odmocnina _e ze sumy |
---|
1:27:00 | _e z vedení |
---|
1:27:02 | mínus tu spočítat není Z |
---|
1:27:05 | a druhou jo takže prostě |
---|
1:27:07 | střední hodnotu směrodatnou odchylku všici dokážeme spočítat |
---|
1:27:11 | je to hrozně jednoduchý |
---|
1:27:14 | _e když budu mít nějaký složitější určování parametru |
---|
1:27:18 | tak už to takhle jednoduchý být nemusí |
---|
1:27:21 | a _e |
---|
1:27:24 | budu na to muset jít |
---|
1:27:26 | pomocí |
---|
1:27:27 | _e nebo budu si muset napsat |
---|
1:27:30 | co vlastně chci _e co vlastně o tom algoritmu chci takhle když sem určoval tady |
---|
1:27:35 | ty parametry střední hodnotu a senátu chvilku |
---|
1:27:39 | jak si myslíte vlastně com co mě o co mě šlo tady u té gaussovky |
---|
1:27:43 | jak se mi chtěl posadit |
---|
1:27:45 | na ty data |
---|
1:27:51 | co myslíte že byla jako funkce kterou sem chtěl |
---|
1:27:56 | maximalizovat |
---|
1:27:59 | tak jednu můj cíl |
---|
1:28:06 | zkusím |
---|
1:28:10 | musím přepnu zase |
---|
1:28:11 | král |
---|
1:28:21 | pardon asi udělám tak to je tak ohromnou změnu |
---|
1:28:25 | _e |
---|
1:28:26 | z toho důvodu že tady se tady srazí malovat |
---|
1:28:34 | no |
---|
1:28:37 | K |
---|
1:28:41 | tak _e můj cíl vlastně ten |
---|
1:28:45 | aby ta gaussovka |
---|
1:28:47 | dával co největší hodnoty |
---|
1:28:51 | pro |
---|
1:28:53 | pro _e ty body |
---|
1:28:56 | který má reprezentovat jo když udělám sumu |
---|
1:29:00 | hodnot tady těchto bodů |
---|
1:29:03 | tak já jsem snažím tady tuto sumu |
---|
1:29:06 | nastavit na maximum a pokusí uděláte _e takovýhle výpočet |
---|
1:29:12 | _e tak vopravdu na několika řádcích dokážete |
---|
1:29:15 | odvodit |
---|
1:29:17 | výpočet parametru |
---|
1:29:19 | gaussovky or dokonce sem se to jednou zkusil skutečně to D forma jako člověk dobrej |
---|
1:29:24 | pocit |
---|
1:29:24 | že si maximalizací tady téhleté hodnoty dokázal odvodit vzorečky pro _e pro výpočet parametrů gaussovky |
---|
1:29:34 | tomuhle procesu |
---|
1:29:36 | se říká |
---|
1:29:39 | při |
---|
1:29:40 | tomuhle procesu |
---|
1:29:42 | prosím vás |
---|
1:29:44 | se říká _e a musí maximum likelihoodů |
---|
1:29:48 | neboli maxima sem maximalizace |
---|
1:29:51 | věrohodnosti |
---|
1:29:53 | a de vlastně o to že když mám nějaký data |
---|
1:29:56 | a teďka mám parametry si ho modelu |
---|
1:30:00 | tak já mám |
---|
1:30:02 | _e likelihoody který mně ten model |
---|
1:30:05 | vysypává |
---|
1:30:08 | pro všechny data který mám k dispozici tak tady tyhlety likelihoody vynásobím |
---|
1:30:12 | a snažím se nastaví parametry toho modelu tak aby tady tahleta hodnota nanejvýš nejvyšší |
---|
1:30:20 | a tady tomuto u tomuto se říká _e tomu se říká maximalizace |
---|
1:30:24 | věrohodnosti nebo maximum likelihoodu T stihneš |
---|
1:30:29 | a některých případech to de pohodě |
---|
1:30:32 | analyticky odvodíte si vzoreček a rovnou to spočítáte a v některých případech to nejde analyticky |
---|
1:30:39 | a musíme prostě |
---|
1:30:40 | _e procházet starat a iterativně to uvidíme právě případě těch skrytých _e markovových modelů |
---|
1:30:48 | tak _e |
---|
1:30:49 | uvidíme tady toto |
---|
1:30:51 | v případě jednoduché gaussovky případě modelu se směsí gaussových rozložení a potom případě toho C |
---|
1:30:59 | svítilna com |
---|
1:31:01 | _e tetě _e budeme řešit tři věci |
---|
1:31:06 | budeme _e chtít vědět jak tady tuhletu likelihood vůbec spočítat |
---|
1:31:12 | potom jak tady tyhlety |
---|
1:31:15 | parametry |
---|
1:31:17 | natrénovat |
---|
1:31:19 | a pak taky v některých případech uvidíme že tam jsou vlastně nějaké skryté parametry toho |
---|
1:31:24 | modelu |
---|
1:31:25 | takže _e |
---|
1:31:27 | typicky vlastně když bysme chtěli tady tu hodnotu tak bysme je měli vyzkoušet pro všechny |
---|
1:31:32 | možné hodnoty skrytých parametru |
---|
1:31:34 | což je nesmysl stejně jako budete véčku jestli si pamatujete sem říkal že nesmysl procházet |
---|
1:31:39 | všechny možné _e srovnávací cesty takže budeme chtít znát nějaký rychlý algoritmy kterýma se těma |
---|
1:31:45 | skrytým _e |
---|
1:31:47 | parametrama rychle prokouše ne aby jsme dokázali vlastně dostat jedno jediný číslo |
---|
1:31:52 | kdy jedním modelem budeme chtít ohodnotit nějakou vstupní _e stupni sekvenci vektorů |
---|
1:31:58 | tak |
---|
1:32:00 | _e jak je to _e jak je to gaussovka má |
---|
1:32:04 | jednorozměrná gaussovka vypadá takhle prostě ten datový bots mínus střední hodnota |
---|
1:32:11 | tady je dvakrát směrodatná odchylka na druhou že jo to směrodatná odchylka se objevuje E |
---|
1:32:16 | V ve jmenovateli |
---|
1:32:18 | a když budeme _e dělat _e maximum likelihood odhad |
---|
1:32:22 | těhletěch parametru tak |
---|
1:32:25 | přijdeme na ty dva |
---|
1:32:27 | známy vzorečky |
---|
1:32:29 | a když euro zeptat po nějakých skrytých proměnných tak je to v pohodě protože tam |
---|
1:32:34 | žádný nejsou jo prostě jedna zásuvka nasypu do toho data vybod |
---|
1:32:38 | kdy byla sme to na mě jednu hodnotu |
---|
1:32:41 | nic _e nic tam není neznámýho nebo skrytých |
---|
1:32:45 | tak |
---|
1:32:46 | _e když půjdu trošku složitěji |
---|
1:32:49 | tak _e několikarozměrná gaussovka |
---|
1:32:54 | _e bude mít zase dva parametry ale tentokrát to bude vektor a bude to nějaká |
---|
1:32:58 | matice jo když mám zásuvku několika rozměrným prostoru |
---|
1:33:03 | tak ta střední hodnota je vektorová |
---|
1:33:05 | to znamená tady by mě ukazovala |
---|
1:33:08 | do bodu asi jedna |
---|
1:33:10 | jedna |
---|
1:33:13 | a to jak je ta gaussovka roztažena v různých směrech |
---|
1:33:18 | to mě udává tak zvaná kovarianční matice |
---|
1:33:22 | _e |
---|
1:33:25 | přemýšlím jestli se tady dostávat se do _e |
---|
1:33:28 | nějakých detailů jak ta kovarianční matice |
---|
1:33:31 | a nebo nemá vypadat ale na že bysme mohli |
---|
1:33:35 | _e |
---|
1:33:41 | viděli jste někdy několika rozměrný o stovky v nějakým předmětu |
---|
1:33:47 | matice no ne |
---|
1:33:49 | nevadí |
---|
1:33:51 | musíme udělat základní nalejvárnu |
---|
1:33:55 | je |
---|
1:33:56 | dvourozměrný prostor |
---|
1:33:58 | tady je parametry X jedna tady je parametry dva |
---|
1:34:03 | přední hodnota má jenom dva prvky určený vlastně střez kdy bude ten můj |
---|
1:34:09 | kopeček |
---|
1:34:10 | a teďka tavnou slůvko |
---|
1:34:13 | můžete si ho představit jako klobou tedy |
---|
1:34:16 | který vypadá nějak takhle |
---|
1:34:19 | no a _e tady vy ste |
---|
1:34:21 | kovarianční matice |
---|
1:34:24 | teda |
---|
1:34:26 | _e základním přiblížení |
---|
1:34:31 | má prvky jenom na diagonále sme tadyma nulu nemá nulu |
---|
1:34:37 | a tady má směrodatnou odchylku prvním směru na druhou a tady má směrodatnou odchylku ve |
---|
1:34:43 | druhým směru na druhou |
---|
1:34:44 | jo takže když budete |
---|
1:34:46 | prosím vás _e zvětšovat |
---|
1:34:49 | tady |
---|
1:34:50 | tady tenhleten bot |
---|
1:34:52 | _e které tady tuto hodnotu tak ta nouzovka bude |
---|
1:34:55 | co bude takhle to byl jakostní stěhovat |
---|
1:34:59 | a vtom druhým směru bude pořád stejná |
---|
1:35:03 | a když budete šahat se na tuto hodnotu tak se ta gaussovka bude smršťovat |
---|
1:35:08 | nebo ztenčování tady v tomto směru podle toho jak to nastavíte prostě bude tadle tlustá |
---|
1:35:13 | nebo tenká jo |
---|
1:35:16 | ústně reguluje té šířku toho kopečku v jednom a ve druhém směru |
---|
1:35:20 | tak a teďka mě zkuste říct |
---|
1:35:23 | _e jí když bysme se na to dvoustovku podívali takhle svrchu |
---|
1:35:27 | jo |
---|
1:35:28 | tady ste roviny |
---|
1:35:30 | a nakreslili si tam souřadnice |
---|
1:35:35 | X dva X jedna |
---|
1:35:39 | taky jaký gaussovky jaký kopečky jsme schopni s tou diagonální _e kovarianční maticí namodelovat |
---|
1:35:47 | jak budou vypadat při pohledu svrchu |
---|
1:35:58 | kdybyste si představili mapu jo kde ten kopec na kreslenej jak ten kopec bude vypadat |
---|
1:36:07 | jo eště jinak řečeno jak bude orientovany |
---|
1:36:12 | tak já vám napovím když je ta kovarianční matice diagonální |
---|
1:36:17 | tak gaussovka může vypadat jako kopeček jako vzít jo které kulatej |
---|
1:36:23 | nebo může vypadat |
---|
1:36:25 | takže půjde |
---|
1:36:27 | nápadu na východ |
---|
1:36:29 | jo nebo že bude klidně jako jinak plus ta západu na východ |
---|
1:36:33 | nebo že půjde ze severu nají |
---|
1:36:37 | nebo že bude eště jinde silnej a s každým případě bude vlastně orientovaná nebo _e |
---|
1:36:43 | bude dycky symetrická kolem nějaké _e kromě jaké osy |
---|
1:36:48 | jo takhle se schopní _e |
---|
1:36:51 | vyrobit dvourozměrnou gaussovku diagonální kovarianční maticí |
---|
1:36:56 | eště mě zkuste říct _e |
---|
1:36:59 | jak by se tady ta dvourozměrná gaussovka která vypadala takhle |
---|
1:37:04 | dala taky namodelovat |
---|
1:37:07 | na vypočítat |
---|
1:37:09 | jestli jako vám přijde tam ta |
---|
1:37:12 | rovnice složitá tak |
---|
1:37:13 | a s váma souhlasím nebo taky nemám hrát |
---|
1:37:16 | počítání nějaké inverze determinantu nic pěkný |
---|
1:37:21 | vy byste udělali takovouhle dvourozměrnou zase |
---|
1:37:25 | jste to chtěli udělat jednodušší |
---|
1:37:32 | tak já mám nápad |
---|
1:37:34 | dělejte mohli bysme udělat |
---|
1:37:37 | v jednom směru |
---|
1:37:39 | jednorozměrnou gaussovku |
---|
1:37:42 | ve druhým směru tak jednorozměrnou za stovku |
---|
1:37:46 | jo |
---|
1:37:48 | a teďka s každým bodě roviny tady tyhlety dvě spolu vynásobit |
---|
1:37:53 | a dokážete takhle dostat |
---|
1:37:56 | kopeček který je moc kulatý nebo obrácený severojižní anebo nebo vichr západně jo |
---|
1:38:02 | opravdu _e gaussovka Z diagonální kovarianční maticí |
---|
1:38:07 | D reprezentovat a taky jako |
---|
1:38:11 | to hrozně moc využíváme |
---|
1:38:13 | jako součin dvou jednorozměrné gaussovek |
---|
1:38:16 | tak a teďka pozor |
---|
1:38:18 | když _e |
---|
1:38:20 | tady ty nuly zrušíte když tam dáte nějaký hodnoty |
---|
1:38:25 | tak |
---|
1:38:25 | dokážete udělat takovýhle gaussovky šikmý |
---|
1:38:29 | jo prostě různých směrech |
---|
1:38:33 | ale ty už nedokážete udělat jako součiny jednorozměrných gaussovek jo tady už vopravdu potřebujete |
---|
1:38:40 | tuto složitou rovnici abyste _e takovouhle gaussovku |
---|
1:38:44 | dokázali vyrobit |
---|
1:38:46 | pozor prosím vás takovýmto stovkám s plnou kovarianční maticí my se budeme vyhýbat jako čert |
---|
1:38:51 | kříži zaprvé to složitý |
---|
1:38:54 | a za druhé to ne trošku proti _e proti tomu co jsme očekávali o vstupních |
---|
1:38:59 | dat |
---|
1:39:01 | jo teďka zkuste udělat rychly myšlenkový skok na začátek téhle přednášky |
---|
1:39:05 | když sem vám tady vykládal vo M S T tečka co sem říkal že bysme |
---|
1:39:09 | chtěli o stupni koeficientu do rozpoznávání |
---|
1:39:15 | aby jednotliví |
---|
1:39:17 | jejich prvky |
---|
1:39:19 | nebyly navzájem |
---|
1:39:23 | korelovaný žejo aby _m navzájem nezávislými |
---|
1:39:27 | no a teďka když si představíte něco když uděláte takovouhle šikmou gaussovku |
---|
1:39:33 | no tak to zachycuje právě korelaci |
---|
1:39:35 | jo protože když mám takovoudle šikmou gaussovku tak já řeknu |
---|
1:39:39 | já vím no a ne |
---|
1:39:44 | ne |
---|
1:39:46 | ne |
---|
1:39:49 | u A |
---|
1:39:50 | kdy to medvídek půjčky |
---|
1:39:52 | tak _e |
---|
1:39:54 | vy víte že když se v těch datech posunete v jednom koeficientu takovýmhle směrem |
---|
1:39:59 | tak se prostě sem druhým koeficientu posunete druhým směrem jo znamená _e |
---|
1:40:05 | taková našich menádou stovka |
---|
1:40:08 | naší že data sou korelovaný |
---|
1:40:10 | to nechcem a ještě zase mít jednodušší takže my prostě tady budeme vnutit tvrdě nuly |
---|
1:40:17 | a budeme buď buďto zařídíme a nebo aspoň budeme doufat že naše data sumy korelovaná |
---|
1:40:23 | a budeme pracovat pouze generálním kovarianční matice |
---|
1:40:27 | poslední věc prosím látek může _e taky _e tahleta funkce vypadat |
---|
1:40:32 | může vypadat jako směs gaussovek |
---|
1:40:34 | jo máme _e několik různejch |
---|
1:40:37 | gaussovek |
---|
1:40:39 | tedy jsou označeny nějakým index víčkem chce každá má svoji střední hodnotu pravda má svoji |
---|
1:40:46 | _e směrodatnou odchylku tady teda bych spíš řekl že by měla být jako sou že |
---|
1:40:51 | ho její kovarianční matice |
---|
1:40:53 | a máte nějaké váhy pece |
---|
1:40:56 | a bylo by dobrý jako jak u slušných lidí je zvykem aby se ty váhy |
---|
1:41:01 | sumu valy _e sumu valit do jedničky |
---|
1:41:04 | a takový mohl _e modelu se říká vlož mixture máru |
---|
1:41:08 | nebo taky G M |
---|
1:41:10 | a toto sou prosím vás velmi zásadní modely pro rozpoznávání řeči |
---|
1:41:15 | protože uvidíte úplně všude tady si budeme hrát rozpoznáváním řeči ale dělá se s tím |
---|
1:41:20 | taky rozpoznávání |
---|
1:41:22 | řečníka dete chceš klíčových slov rozpoznávání jazyka |
---|
1:41:26 | já nevím ještě co |
---|
1:41:27 | _e co dalšího |
---|
1:41:31 | tak |
---|
1:41:32 | a více o tom _e plošných se modelu o tom jak se potom dá generalizovat |
---|
1:41:37 | na arménka |
---|
1:41:39 | tři povíme příště tak děkuju za pozornost notes |
---|