0:00:07no a se bavili o kódování že jo pokud se nemýlím
0:00:10a když ste skončili a se na ten na tom slajdu že
0:00:14se probrali to a tak pro chování se
0:00:18a teďka vlastně a no tady nazývá jenom jeden slajd _e o to se nebavili
0:00:23že
0:00:26jo takže fajn a nazývá jenom říct _e jaké jsou varianty toho vektoru a kvantování
0:00:32jo my když vlastně máme a _e třeba nějaké N dimenzionální data
0:00:38a chceme _m pro ty dát _e vlastně najít ty naše nějaké centroidy
0:00:43vektory na které budeme kvantovat data ležící blízko ni
0:00:48tak _e to může být docela neefektivní z hlediska
0:00:53počtu jich operaci jo
0:00:55takže ní buď můžeme třeba ten velký vektor rozdělit na tři části a ty tři
0:01:00části zakódovat zvláště tomate napsaná v tom bodě jedna
0:01:04vzbuď _e nebo z vymyslet jako kdyby nějakou mřížku
0:01:10nějakém
0:01:12a transformován prostoru jo ale ta _e ta mřížka potulný vlastně nám vyjde
0:01:20jakém sem jako nějakým tom prostoru
0:01:24bude mít
0:01:26jednu strukturu o tom v našem původně prostoru druhou strukturu ale v podstatě díme kde
0:01:31se ty bude nacházej
0:01:33jo takže potom když vlastně bude na porovnávat
0:01:36_e jednotlivé vektory jak blízko leží nějakých nějakým centroidu _m tak v podstatě nemusím napočítat
0:01:43pro každý vektor Á pro každý kontroly zvlášť jo
0:01:47_e ten náhodný codebook to vlastně funguje tak že mi když máme
0:01:53strašně moc data potom ty data se chovají jaku náhodná dat jo potom ty zvuky
0:02:00
0:02:01nejsou tak dobře třeba vidět a když vybereme ty a
0:02:06centroidem šum nemůže říkat sestrojeny ale ten ty kvantová vektory kvantování
0:02:12tak potom v podstatě úplně jedno jaké zvolíme jo
0:02:19a další úvod toho je když my vlastně děláme to rozdělování prostoru
0:02:26pomoc algoritmu L P G
0:02:29tak a jestli si pamatujete my sme měli
0:02:34nějaké třeba dva zvuky dát
0:02:37jo a potom na inicializujeme
0:02:41jeden ten zdroj jo podíváme se a
0:02:47vlastně jak sou u _e jak jsou rozmístěna ve kterých prostoru
0:02:52a potom ten centrum _e vzhledem k nějakému určitým největším směrům chtěl datech me rozdělíme
0:02:58na dvě části
0:03:00jo a potom začneme posouvat jeden směrem sem a druhým směrem
0:03:05tam jo když takové zvuku máme více a máme už je z těch centroidu tak
0:03:09my uděláme
0:03:11jako kdyby ty a centroidy když rozdělujeme
0:03:16tak uděláme takovej stromeček
0:03:20jo stromeček všichni znáte
0:03:23a už potom a míříme když vlastně tady už budeme dělat další rozdělování tak my
0:03:30víme že pro tady tydlety data
0:03:34jenom uděláme počet _e tady tydlety data vlastně služ oni na odpovídá jako kdy B
0:03:39a A
0:03:41rodičů těch dalších centroidy jo takže tam už nemůžeme zase nemusíme nic spočítáte a
0:03:48uděláme míň operaci
0:03:51no a kdy sme zakódování vlastně udělali tu kvantování a dost kvalitní tak
0:03:58i uděláme kvantování na dvou úrovně všeho budeme kvantovací tu chybu kterou potom přičtem a
0:04:04silné
0:04:06máte k tomu nějaké otázky
0:04:12je to jasné fajn
0:04:24tak teďka se budeme vlastně bavit o do další časy
0:04:27budeme se teďka bavit o tom
0:04:30jak se top
0:04:31kódování
0:04:34používá práci
0:04:47jste se zatím bavili a obchodování z hlediska
0:04:51a operace pokud se nemýlím jo takže vy ste
0:04:55vlastně a
0:04:56do těch koeficientů nějak zakódování
0:05:00impulsní odezvu Ú artikulačního traktu
0:05:03jo
0:05:05ale moc ste se nebavili o tom já budete přenášet anebo co budete dělat a
0:05:12z buzením že jo
0:05:14užijte jak sada
0:05:16vlastně spočítat
0:05:20základní no perioda základního tou může jo takže buď můžete
0:05:25přenést na druhou stranu jenom toto číslo a potom nějaký ten dějin a vygenerovat toho
0:05:30sekvence impulsů mění ta sekvence impulsů bude
0:05:36prostě taková nějaká eska
0:05:40ale vy víte že
0:05:42_e my když mluvíme tak me skoro nikdy negenerujeme tak pěknou sekvence impulsů lené že
0:05:49prostě profesionální zpěváci jo
0:05:52ale většinou tam je teda vždycky tam je Í nějaký šum jo
0:05:57takže by teoreticky to mělo vypadat mě a prostě
0:06:02takhle jo
0:06:07když tam přidáme šum tak bude to vlastně hezčí
0:06:11jako kdyby
0:06:12no a dneska se bude mám pálit
0:06:15trochu tatí o tom
0:06:18jak může má efektivně zakódovat takovej signál jo totiž na jedné straně rozdělíme řeč
0:06:25nabuzení a odezvu a potom na druhé straně budeme dělat v podstatě sem té
0:06:33vy ste se už setkání s dlouhodobým prediktorem jestli se nemýlím že jo ušité se
0:06:39o tom na nějaké přednášky snad
0:06:42na nějaké přednášce s nadvlády ten krátkodobě prediktor funguje tak že mi když chceme určit
0:06:48tady tenhleten vzoreček nepoužijeme většinou deset
0:06:52předchozí vzor
0:06:53jo
0:06:54my vtom hledáme nějaké krátkodobé závislosti
0:07:01tečkami ten dlouhodobý prediktor budem a aplikovat na nářečí ale budeme aplikovat nabuzení jo
0:07:09budeme se snažit vlastně
0:07:11odhadnout
0:07:13tenhleten vzoreček
0:07:16toho tomto
0:07:18jo odpovídá je sou vzorku vzdálenost
0:07:22vlastně zpožděno ho o jeden lock
0:07:25jo
0:07:28_e
0:07:31když mít teďká postavíme ten
0:07:35dlouhodobý prediktor
0:07:37a budeme
0:07:39tenleten signál
0:07:42a _e
0:07:43s tím šuman teda to co mi generuje mahler dle hlasy zklamán
0:07:47tak mí se budeme snažit ho s ilustrovat tímhletím signálem co si myslíte že poleze
0:07:53na výstup i teďka se snažíme odfiltrovat dlouhodobou závislost a ta dlouhodobé závislost osum zrovna
0:08:00tady tydlety impulzy
0:08:02jo to je
0:08:03to je závislost mezi vzorky vzdálené my o jeden nula
0:08:08takže když
0:08:09budeme todleto filtrovat zase nám na výstup chvíle za nějak a šíp váš osetí chyba
0:08:14druhého řádu protože je love té analýze a se otec a my sme tady tenhleten
0:08:19signál považováni za chybový signál jo
0:08:23pamatujete se to
0:08:25jak to fungovalo my sme se snažili posta je takový filtr
0:08:29kterýmu když dáme na vstup nějakou řeč
0:08:34tak potom dělené něco takovýho
0:08:36jo
0:08:37na tenhleten signál mi zase budeme aplikovat dlouhodobý prediktor
0:08:42který se bude zná je dbali
0:08:44dlouhodobě závislosti
0:08:46takže to bude běžících papíry cizího ten jo co to znamená N V licenční zde
0:08:53zruš
0:08:54třeba tušíte
0:08:59ročně jakých filtr se možná může nazývat P říci
0:09:04tak to co leze
0:09:06to co daná výstupy by mělo být něco bílé o to že jo
0:09:11a my sme z řekne že to bude nějaké šum jo to bude chyba nějaký
0:09:15šum a bude to bílý šum bílý šum je takový šum který má
0:09:20rovnoměrné spektrum
0:09:22jo když se podíváte na jeho spektrum tak by to mělo vypadat takhle nějak
0:09:27všechny frekvence sou zastoupené
0:09:30vlastně _e
0:09:32stejně
0:09:33jo
0:09:38potom se bude nabalit chvilku o analýze syntézou
0:09:43to znamená že a me
0:09:46na tu
0:09:49a pak řeší routerů budeme se snažit
0:09:54dát s nějaký signál který by měl vypadat jako
0:09:58sekvence impulsů jo a jestli výsledná řeči je hezká tak
0:10:03sme to našli
0:10:05jo takže budeme se snažit vlastně
0:10:07syntetizovat řeč
0:10:10a pokud se nám podaří najít
0:10:13nějaký takový
0:10:15hezky signál tak
0:10:17to je ono
0:10:19perceptuální C filtr
0:10:22_e možná ste se už setkat setkali třeba v grafice nebo
0:10:27eště možná někde _e maskováním
0:10:31jo nebo měli se nějaký multimédia asi že jo předmětu už měli
0:10:36teďka máte _e nebavili se tam třeba o maskování
0:10:41jo to maskování může být vizuálně anebo jako že
0:10:45toto slyším v podstatě když
0:10:48hraje něco
0:10:50na nějaké určité frekvence hlasitě jo tak ono potomstvo toku jim a bude když bysme
0:10:56třeba měli
0:11:01teďka se namalujeme nějaké spektrum
0:11:03a tady bude L hrát
0:11:06na nějaké určité frekvence velmi hlasy ty
0:11:10zvuk
0:11:11jo
0:11:12ani když tam přidáme
0:11:15eště něco takovýho tak mi to prostě neuslyšíme
0:11:19tam existuje nějaký vzoreček já nevím co
0:11:23a ono to vypadá vlastně takže ste tom trojúhelníčku potom
0:11:27jo všechno co je menší než ten trojúhelník tak to prostě neslyším
0:11:33takhle třeba funguje i ta M P trojka že jo prostě my se snažíme tam
0:11:37zakódovat my se snažíme zachovat jenom tu informaci kterou my je dokážeme třeba jo když
0:11:44to neslyšíme tak nemám
0:11:46cenu to přenášet
0:11:48to some money budeme dělat
0:11:50vlastně s chybou
0:11:52jo
0:11:54když se podíváme na spektrum
0:11:58řeči
0:11:59tak tam si pamatuje tam máme takové
0:12:03ty kopečky že o ty formanty
0:12:06jo
0:12:07a když my vlastně teďka tam taky namalujeme spektrum nějaké té chyby
0:12:16třeba
0:12:18pak byla to červené class takto naše že by to bude ten bílý šum
0:12:23jo tak
0:12:24a prosím vás zkuste měřit co umí uslyšíme co nám bude vadit a to nám
0:12:29vadit nebude
0:12:31když pro takové konkrétní
0:12:34_e rámeček
0:12:35řeči
0:12:37i portály má krátkodobý prediktor dlouhodobý prediktor a dostaneme nějakou chybu co že ta červená
0:12:43čára
0:12:44jo tak byste měli být schopni teďka
0:12:48vtom vidět že ta práva čas
0:12:52todleto tu chybu mitaf podstatě neuslyším
0:12:56jo
0:12:56ale tady nám začne vadit na těch vysoký frekvence protože
0:13:00_e je amplituda vlastně
0:13:04na tady těhletěch frekvence chytřejší jo
0:13:08ta ono
0:13:09potom se podíváme na nějaké konkrétní a
0:13:14konkrétním úplné
0:13:17filtry anebo enkou nejspíš
0:13:21podíváme se na schemas osumnáct jsem to pochopit
0:13:33mínus todleto sme si
0:13:38sme si řekli
0:13:47todleto sme si řekli tady _e taky ale zkusme to za pakovat opakovat todleto je
0:13:52vlastně naše řeč
0:13:58jo todleto je naše řeč a ten _e
0:14:01a u pece todleto je rámeček řeči a auta C vlastně
0:14:06se snaží odstranit tady tyhlety vzorky jo
0:14:11to víte a potom vlastně se budeme snažit odstraníte tady todleto necháme v podstatě jenom
0:14:16tady tenhleten
0:14:18šum to ztracen šestnácti řekli
0:14:23a teďka schéma
0:14:26ano našeho inkou druhá nebo ten náš postup už bude vypadat zase pak takle známý
0:14:32dvě krabičky vždycky _e Z a potom bude následovat od vezena až potom budeme dělat
0:14:38kvantování chyby
0:14:40no
0:14:41a kvantování
0:14:45_e zatím jenom tady
0:14:47zůstaneme
0:14:53poďme se podívat na a na adresu
0:14:56syntézou
0:15:01takže jak to jak to funguje byste mění chápat tady tam net tady todleto schéma
0:15:06s matkou my máme nějakou
0:15:18jo měla na tady nějakou řeč
0:15:20jo
0:15:22potom todleto bude ten náš perceptuální filtr to na to se zatím nebudeme se zaměřovala
0:15:29my budeme se podívat sem
0:15:32kdyby rené nějak _e nějak nějaké to buzení a pokusíme se vygenerovat zase řeč jo
0:15:39pokud
0:15:40ta chyba
0:15:42je malá tak to je ono jo co sme chtěli
0:15:47takže mě když třeba tady
0:15:49podíváme se tady bude na nic
0:15:52třeba
0:15:53sto možnosti jo X nějak těch možnosti tak podstatě tedy ten cyklus musela zopakovat
0:16:00oni krát jo i brát to nejlepší co
0:16:04a buď to nejlepší co tam je a nebo to co nám prostě vyhovuje zatím
0:16:08měl založit záleží na
0:16:11nějaké to objektivní funkci
0:16:14fajn _e co se má moc nelíbí je zrovna tady tenhleten perceptuální filtr
0:16:22jo který bude jaksi maskovat tu naši sít naše naší chybu
0:16:30a mít ten filtr budeme chtít nejspíš
0:16:35prostě přesunout sem
0:16:38_e nějak ho zkombinovat jisté tímhletím filt říkám potom jo abysme ten filtr vlastně nepoužívá
0:16:45je sto krát tak vlastně tady se použije jedno no a tady těch prostě stokrát
0:16:50ale už tam bude zakomponovány toho áčka takže
0:16:54takže to je po vodě
0:17:23_e takže vlastně co my budeme chtít já s tím perceptuálním filtrem když se podíváme
0:17:30na tu z řeči zase tady máme řeči a šípu
0:17:33jeho řeči to modré
0:17:36až chyba vlastně ta zelená
0:17:38takže nám vy vůbec nevadilo teoretický kdyby ta chyba prostí vypadá ale třeba
0:17:44kdyby zopakovat úvěr
0:17:48té řeči
0:17:49jo kdybysme měli takovou chybu tak
0:17:52tak to je prostě lepšího no
0:17:54jo
0:17:57tohleto je zatím ten náš perceptuální filtr tři k
0:18:02co když
0:18:03vypadá jako
0:18:07inverzní filtr které řeči
0:18:09jo teda ne inverzní filtr ale prostě má to
0:18:13spektrum které inverzní spektru řeči
0:18:17ani tečkách vlastně budeme chtít a B a _e
0:18:22spektrum té naší chybí
0:18:24vypadalo tadle
0:18:26akorát aby to mělo menší amplitudy
0:18:29jo
0:18:30aby to prostě _m nebylo přesně
0:18:33úplně po spektrum řeči
0:18:49nikam perceptuální si okřik tečka nadefinujeme
0:18:55nijak takle
0:18:59kde vpodstatě zdůvodníme tomu káma
0:19:03_e dost
0:19:05jako teda nedost nízké ale prostě nižší jedničku
0:19:09což znamená že vlastně
0:19:14kuli toho áčka o ní se jako kdyby
0:19:18stáhnou
0:19:19tak si pamatujete ty jednocyklová jednotkovou kružnici a souvisí utrum
0:19:24jo
0:19:25jak se to počítá tak
0:19:27mně to mám na obrázku mistrům za chvilku
0:19:31_e za chvilku řečeno řekne moc o tom co to je takže v podstatě tadleta
0:19:35mstil tři k nám zatím abysme věděli
0:19:37bude definovat
0:19:39něco co vypadá
0:19:43co bude nic spektrum velmi podobné spektrum řeči abysme doklady velmi hezky udělat to maskování
0:19:57tak _e
0:20:12jo takže tady vlastně máme jenom znázorněna toto sem napsal i na tom předchozím slajdu
0:20:17zase máme a
0:20:21to ve V Z hezky tady a tady ta zelené čára zase nám říká svoje
0:20:28a nám udává frekvenční charakteristiku toho filtru o jedna děleno
0:20:34A Z _e děleno
0:20:36gama
0:20:40a zatímco ještě tady můžu vám říct o osuš
0:20:52tady máme to jednotkovou kružnici
0:20:55jo mně když se podíváme na půli toho filtru jedna děleno A Z
0:21:01tak to sou tady tydlety co jsou blízko
0:21:06že ta kružnice
0:21:08a potom když ještě vynásobíme zetko tou dámou tak ono vlastně se nám posune
0:21:13posune do středu to znamená že vlastně ty kopečky
0:21:18potom u té frekvenční charakteristiky vlastně nebo tak vysoká
0:21:22_e pamatujete si
0:21:25jak vlastně jak když máte takovou kružnici
0:21:30přibližně nakreslit
0:21:32a frekvenční charakteristiku filtru
0:21:35když tak
0:21:37takže vám tady todleto nic neříká fajn to je velmi jednoduché jo vlastně ta frekvence
0:21:42je určena
0:21:44pohybem po tady tadleta kružnice že jo takže se namalujeme
0:21:49tady todleto
0:21:50teďka pro nějakou určitou frekvenci tady budeme chtít spočítat hodnotu
0:21:56jo takže budeme hezky po tady té kružnice najdeme to vod ono to tady
0:22:02jo potom se spočítáme
0:22:05vzdálenosti kempu
0:22:07že
0:22:09jo
0:22:11prostě je spočítáme
0:22:14přečteme si je
0:22:17no a potom záznam a jedničku a tím
0:22:20bysme měli
0:22:22to asi podělit ale když je to menší než
0:22:29ne vlastně gilotin tím my sme to měli podělit jo
0:22:33takže potom tady najdeme nějakou hodnotu no a pokračujeme dále a vlastně takovým způsobem
0:22:41_e _m bude nám vlastně dělit o jedničku sumu vzdálenosti po otci nějaké určité frekvence
0:22:48kdyby jsme měli tam eště nuly tak potom těma nohama ještě musíme to vynásobit jo
0:22:53víte to
0:22:54dobře
0:23:02no a proč teda vlastně
0:23:04když pro _e ty
0:23:07modré křížky
0:23:09teda který odpovídá je tomu filtru jedna dělo na _e Z ni když máme ty
0:23:14kopce takhle nejsou Q
0:23:17proč pro ten filtr druhý mě máme ty kopce nižší vlastně
0:23:24jo proč když vlastně pole jestli tomu rozumíte jo tomu postupu velkých chtěli
0:23:29proč když ty póly posuneme vlastně a
0:23:34když k té nule
0:23:36tomu středu kružnice dat proč potom ty kopečky
0:23:41vlastně spádům
0:23:43pochopili se co sem říkal X to počítá jo
0:23:46protože ta vzdálenost přece jen prostě sezdáni čili
0:23:49fajn to
0:23:57je teďka vám vůbec nemůžu říct pro oč
0:24:01ale toto byste se měli zeptat docent řádky a spíš ale
0:24:06vlastně to kódování buzení me dělám F kráči schránce námětu vůbec nedělám takže
0:24:11takže proto za nejím a ono se to dělá s kratších rámcích jo
0:24:16takže _e běžně cvičný používáme rámce
0:24:20dvacet milisekund seš odpovídá sto šedesáti vzorku pinů pro těch osum tisíc hertz
0:24:26jo tak to buzení budeme i dělat vlastně s kratších rámci
0:24:35jak tomu teda moc nerozumím protože i pro mě osobně je to takový trošku divný
0:24:41protože vy když se
0:24:43bavili o
0:24:45odhadu ten
0:24:47a základní frekvence nějaké
0:24:51tak tam se říkalo že je třeba
0:24:56když někdo má
0:24:59nízkou frekvence ji měl zejména muži
0:25:03tak vlastně
0:25:04on ten vás může někdy V těch sto šedesát vzorku že
0:25:10pamatujete se to
0:25:12takže i když se nějak nadefinovány že
0:25:15ty frekvence sou tak nějak úvod padesáti a čtyři tak her jo což znamená že
0:25:21potom ten svátky a asi takto šedesát a šel nevím kolik
0:25:26lace
0:25:27dvacet vzorků pro o tady tudletu konkrétní vzorkovací frekvence že jo
0:25:34a teďka my budeme chtít
0:25:36no jasně ono to a se to kódování bod _e těch krátkých ale to ten
0:25:40odhad se celistvý děláme tím dlouhý a nechci vás má stále rodiče se zeptejte potom
0:25:45pán sent černocký
0:25:47nejsou nezeptá při jsem neviděl
0:25:53a teďka tadle bude vypadat
0:25:57ten kodér
0:25:58jo
0:26:02jak vidíte
0:26:04tady bude a na nic
0:26:07stup tady bude řeč
0:26:10jo
0:26:11a tady potom polezou nějaké typu asistenti fiktivní chceme počítat ten ty procesy něco si
0:26:17myslíte že by to mohlo být když co nám vleze vlastně
0:26:21když to nahráváme jo může přes telefon uděláme nějaký ten tři procesy tak to je
0:26:26velmi jednoduché to jenom nerozdělíme ten signál na rámce
0:26:31jo to abyste věděli
0:26:40teďka prosím vás si nepleťte takové věci jak u _e ze a jedno děleno a
0:26:46se
0:26:47jo
0:26:48protože tady
0:26:53tady a my děláme analýzu
0:26:57což znamená dní po stáním _e
0:27:02filtry inverzní tlumů auta tečou to že jo abys mají jenom
0:27:08si už
0:27:09byli jistě že ten filtr funguje dobře abysme dokázali spočítat kouřit centy filtru správně
0:27:16jo
0:27:17takže uděláme analýzu uděláme filtrování
0:27:20fajn
0:27:22tady vlastně dostaneme ty _e
0:27:26a vůbec M
0:27:29pozice entit
0:27:31_e deme dalo
0:27:36co bysme mohli dostat vlastně tady
0:27:40prosím vás jako výstup
0:27:42tohoto filtru
0:27:55když to je inverzní filtr tomu L T C filtru a pece filtr hledá koeficienty
0:28:01proto řeče
0:28:03takže tady by měl vylézt nějaký ten chybový signál že jo
0:28:08a ten chybový signál prosím vás tady setrvávali o dvou chybových se k nám jo
0:28:12takže tenleten chybový signál je co
0:28:18jak bude vypadat
0:28:27tak jsem zatímco udělání krátkodobou analýzu odstranili jsme krátkodobé závislosti jo takže nám zbyly dlouhodobé
0:28:36no takže tadyto vylezem
0:28:39něco jako tohle že
0:28:42jo
0:28:43fajn no a teďka na to budeme
0:28:46chtít aplikovat
0:28:49ten dlouhodobý prediktor
0:28:51jo
0:28:52takže my vlastně najdeme parametry toho filtru což by mohlo být to
0:29:01za prvé potřeba vědět co je ten vlak a za druhé nějaký koeficient který bude
0:29:05násobit
0:29:06vlastně zpožděny vzorek že
0:29:08no a uděláme zase filtraci začátku analýzu potom filtraci
0:29:14a tady vlastně by nám mění alou šíle jestli se nemýlím
0:29:21nějaký ten
0:29:22bílý šum
0:29:30fajn
0:29:36tady jí bysme měli mít kvantová celý chybový signál
0:29:41a tady bysme mění dostat
0:29:45asi
0:29:48lock
0:29:49si myslím
0:29:56fajn _e je to jasné teďka
0:29:59dobře
0:30:27tak co tady máme tady jenom jednu scene tu K kódování buzení
0:30:34a to tak že vlastně a _e míse zakódujeme první vzoreček
0:30:40a potom jenom uděláme tu adaptivním pulzní kódovou modulaci jestli se nemýlím takhle se tomu
0:30:47říká že
0:30:49_e pamatujete si co bylo princip zapnete adaptivní pulsní podle modulaci
0:30:56tam jestli se nemýlím se pudu jo síly přímo
0:30:59že jo
0:31:01já tam se kódovala vlastně chyba
0:31:04nějaká
0:31:05jo vy se zakóduje tak první vzorek a potom jenom ne to byla reziduálního
0:31:11že se
0:31:11v tom
0:31:14ne si myslím že to by mohlo být
0:31:17ono
0:31:26no a dekodéru užší vypadá zase jednoduše o něco
0:31:30že v podstatě vezmeme to nám přišlo a sto všeho vygenerujeme
0:31:35řeč
0:31:36jo to je
0:31:38to je docela jasné ta žil uděláme filtry který sou
0:31:43inverzní
0:31:44těm který jsme aplikování F částí N code jo
0:31:51ten postprocessingu tady by mohlo být
0:31:56zaprvé
0:31:57spojování jednotlivě chrám jsou
0:32:01a za druhé eště jel může by tam nějaké vyhlazení jo protože
0:32:07přece jen nějaký rozdíl mezi dvěma _e rámci bude
0:32:11a když tam nebylo nějaké takovéto trhání nebo vloupání k tomu říkat
0:32:16tak _e
0:32:17tak se to prostě když mládí
0:32:37no něco takovýho si myslím že sme push
0:32:41užší viděli
0:32:53akorát s jedním rozdílem tak dívám že
0:32:59_e
0:33:00jak sadismem úměrný
0:33:06nějaké
0:33:07kódování
0:33:09která _e
0:33:13toho buzení a ale teďka nebudem ani
0:33:18zase
0:33:21nějaký
0:33:23koutků k ale _m
0:33:30ale to jsme se už všechno asi
0:33:32řeknu
0:33:34jako dat nechápu proč to mám
0:33:39nadvakrát
0:33:56_e
0:34:00co nás bude teďka zajímat my vlastně a když _e ten perceptuální filtr
0:34:10mýho přehodíme sem _e taky sem
0:34:14tak potom se to bude zapisovat
0:34:18trošku jinak místo toho áčka teďka máma a hvězdička
0:34:25a teďka už to nebude a po něm
0:34:29přesně _e
0:34:31ten a o pece jak sme sáního zvykli že ten si pamatuje vlastně jenom předchozích
0:34:36deset vzorků
0:34:38jo
0:34:38ale tendleten filtr bude mít
0:34:42delší impulsní ode
0:34:45ani se budeme chtít podívat na nějaké
0:34:50vzorečky
0:34:53trošičku je to takové _m
0:34:55zmatené kromě aspoň
0:35:02my se to budeme snažit oddělit
0:35:05my se budeme
0:35:06teďka snažit vlastně tu impulsní odezvu hatí rozdělit na dvě části
0:35:13která odpovídá a k tomu
0:35:17čeho my počítáme současný vzorek
0:35:20a něco co se tam objevilo dětí tomu perceptuální filtrů
0:35:34poněvadž starší ba by měla být vlastně teďka
0:35:42nějaká bývá tak _e
0:35:46tadleta část se dá spočítat
0:35:50jenom jednou
0:35:52a potom budeme pracovat
0:35:54nadále uvažovat jenom tuhletu část
0:36:01a co eště tady
0:36:17já se obávám sionistům asi neřeknu
0:36:22protože
0:36:24jsem to nikdy samo nedělá
0:36:34a já si myslím že já nejspíše radši poprosím pana docenta černockého aby vám to
0:36:40vysvětlil
0:36:42když tak on
0:36:44jo že se to poznamenám
0:36:49ale slovní teďka můžeme dělá smí teďka se ještě radši podíváme na
0:36:56rozpoznávání řeči
0:36:58jo
0:37:05sestav ponesete že
0:37:07no sem
0:37:29takže po rozpoznávání řeči jste se bavili teďká jenom takhle hodně omezeně těch nějakých příkladech
0:37:36něco mám pan docent černocký řekl zmínil se
0:37:39a teďka budeme se chtít podívat na jednom etudu
0:37:43ten _e se v podstatě nepoužívá jo protože _e mít teďka používáme metody které jsou
0:37:49komplexnější jo ale je to velmi dobrý základ o pochopit abyste si uvědomili vlastně ste
0:37:56své hladině
0:37:58_e jak byste to dělají sami jo abyste se
0:38:02pro pěti vlastně
0:38:03jo cítili sem to do té úlohy
0:38:09takže jel
0:38:11úplně na té první přednášce jste si říkali že
0:38:15rozpoznávání řeči se může
0:38:20rozdělit na tři nějakého
0:38:24úlohy
0:38:25jo
0:38:25za prvé se můžou rozpoznávat izolovaná slova že
0:38:30to je prostě třeba _e animistů dřevo a tak dále jo prostě slovo máme pauzu
0:38:37slovo ptal na
0:38:39potom a se můžou rozpoznávat
0:38:45u jedné slova
0:38:47kde ní máme
0:38:49jako kdyby omezeny nějaký slovník ale ty slova můžou být za sebou třeba
0:38:55nějaké
0:38:56číslice číslovky
0:39:00čísla
0:39:00jo
0:39:01prostě řeknete jedna dva tři když třeba
0:39:04se snažit no se snažit _e zadá to číslo tím hlasem jeho do telefonu tak
0:39:10to je ono
0:39:12to první toho sou vlastně ty s marchal se s některé jo a nebo prostě
0:39:16třeba nějakých počítačových hrách se to může obdivovat já nevím jestli to se objevuje a
0:39:22nebo je to jenom
0:39:24X Y imaginární a
0:39:27záležitost
0:39:29a potom nejtěžší co se může
0:39:34udělá tak to je rozpoznávání řeči spojené řeči s velkým slovníkem
0:39:40jo
0:39:41teďka ni můžeme si říct že a ta řeč bude odpovídat nějaké určitě určité doméně
0:39:49třeba já nevím to asi to asi je zveřejněn _e že tady tydlety přednášky si
0:39:54myslím že s ním můžete vyhledávacího na internetu
0:39:57nějaký ten přednáškový
0:39:59vyhledávač takže tam vlastně se použije třeba slovník který je hodně omezený jo
0:40:06a tady tyhle ten přednáška se trošku
0:40:08bavíme o matematice je něco o řeči furt dokola to tam
0:40:13jo nebavíme se odpojíte C nebo
0:40:16nebo něco takovýho
0:40:19a nebo vlastně ten slovník může být
0:40:21jako kdyby neomezený úplně
0:40:24jo
0:40:25_e pan docent černocký vám už asi říkal jak takový rozpoznávač ten největší nejsložitější jak
0:40:33moc dobře funguje si se to pamatujete
0:40:38jak moc dobře
0:40:40to dokáže tu řeč skutečně rozpozná tak aby sme měli třeba
0:40:45a řekneme
0:40:47prostě podslovo je
0:40:49správné úplně anebo úplně nesprávné když to budeme klasifikovat takhle
0:40:54tak každé páté slovo teoreticky by bylo špatně
0:40:58jo
0:40:59task takže prosím děláme myslím
0:41:04_e proč je to tak složité pamatujete si na nějaké faktory který to
0:41:12prostě _e
0:41:13který nám nedokážou
0:41:15vlastně nedovolí
0:41:17to rozpozná dobře proč to co je co je tady tak špatně děláme to prostě
0:41:22máme třeba programy který dělají chybí anebo tam
0:41:27problém je na jedné straně někde co si myslíte co je špatně proč to rozpoznávání
0:41:32řeči nefunguje tak dobře
0:41:39jenom co vás napadá
0:41:44tak zaprvé každý můžeme jinak že
0:41:48za druhé tam může být nějaký šum
0:41:51jo
0:41:52takže musíte vždycky prostě když se vás někdo zapsána něco takovýho musite hned prostě aspoň
0:41:57něco vymyslet
0:42:00a když to chce tady řešit tak musíte vědět co řešit
0:42:03jo
0:42:04takže vlastně nejvíc nám bude pádit
0:42:08ta variabilita jo že mě i vlastně když
0:42:12jednoho člověka konkrétního poprosím a aby nahrál stejné slovo desetkrát a pokaždé to řekne jinak
0:42:18trochu ale jinak
0:42:20jo
0:42:20a když my budeme třeba ani
0:42:23_e v databázi vhodně mluvčích
0:42:27každé pohlaví potom já nevím
0:42:30každý jako různé a přízvuky jiná řeči a tak dále a potom přijde někdo kdo
0:42:37má třeba vadu řeči tak zase to nedokážu moc dobře
0:42:41rozpoznat jo
0:42:44a navíc _e
0:42:47třeba když se podíváte na tu výslovnost čistě výslovnost tak
0:42:52máte třeba spisovnou češtinu a prostě jak samově tady jak se mu je prázdné a
0:42:57tak dále a tak dál jo
0:42:59a někdy třeba odvažte angličtině tak
0:43:04ta brick ambici na nebo ten snad mladých lidí prostě
0:43:10tak to slovo změní že prostě bude zní potom jako něco úplně jiného co existuje
0:43:15ale není to ono jo
0:43:18a tak dál
0:43:27to schéma tady by mohlo vypadat nějak taková
0:43:32samozřejmě ono to je ono komplikovanější jo
0:43:36není to jenom není jenom tak jednoduše ale míse teďka zaměříme jenom na tohle
0:43:42takže sám a support
0:43:44takže _e vezmeme nějakou řeč
0:43:48jo
0:43:50teďka si asi myslíš kdy sme měli nadefinovat nějaký nejjednodušší unk u teďka budeme chtít
0:43:56třeba rok po rozpoznává
0:43:59_e jestli slovo které sme na dostali v nějaké nahrávce odpovídá tomu slovo které je
0:44:05snaha se kterou když mám jo máme dvě nahrávky
0:44:08a chceme zjistit zdali chtěl dvou nahrávka máme stejné slovo a nebo ne
0:44:14jo
0:44:16vezmeme ta slovo každé z nich každou nahrávku ve zná rozsekán rámečky
0:44:21a potom budeme chtít se podívat
0:44:25jak voni sou si akustický podobný
0:44:29jo
0:44:30mohli bysme samozřejmě udělat nějaké to spektrum a podívat se jak to vypadá ve spektru
0:44:36ale ta bude to dělat nebudeme
0:44:43a budeme dělat jenom zatím tohleto
0:44:47to dekódování tady to je prosím vás pozor něco úplně jiného než to o čem
0:44:51sme se bavili vpřípadě
0:44:54_e kódování pro telefony třeba jo
0:44:58tady to je něco jiného
0:45:00protože to slovo vlastně nemůže mám buď rizik celé
0:45:05jo třeba ahoj může mezi celé slovo
0:45:08ani nebo
0:45:10namodelovat když bude na používat nějaké modely a nebo můžeme do slovo rozsekat
0:45:16na úsilí na takzvané ty slabiky
0:45:19jo
0:45:21a nebo třeba i na nějaké konkrétní fonémy
0:45:26kde se s panem
0:45:28to je von _e
0:45:36honem není písmeno
0:45:38jo ale jaký je tam rozdíl mezi písmenama foném
0:45:45řekli sme no to je to vypíšeme že
0:45:48a má to prostě nějaký název
0:45:52a tak ale foném to je
0:45:55podstatě nejmenší čase řeči
0:45:58která mění význam jo to je ten zvuk
0:46:01jo třeba všichni častokrát
0:46:03písmenko a foném oni se odpovídá já sem vám když jeho francouzští je taktu škube
0:46:08jo
0:46:09no to se nepleťte
0:46:11takže my můžeme buď třeba to slovo rozdělit na nějaké ty slabiky a pro každou
0:46:15sladit natrénovat zvláštní model
0:46:18jo a to dekódování to je potom jako kdyby sled chování
0:46:22jo
0:46:23toho dohromady
0:46:25podle toho co je tam pravděpodobné takže my nerozpoznáme celé slovo ale části toho slova
0:46:30potom to tak nějak ještě na letíme dohromady
0:46:33ale to se používá když máme prostě velký slovník jo máme hodně slov a tak
0:46:38dál to jedno slovo se to bude po už
0:46:45teďka a se zaparkovat vlastně
0:46:48to _e se dělá jako parametrizace teďka máme rámečky řeči
0:46:54a budeme chtít
0:46:56dát parametrizace tak co to je to zaprvé
0:46:59vy vlastně a ste řeči chceme
0:47:03dostát jenom to co my potřebujeme
0:47:05jo protože vidíte že řeči je velmi redundantní proč
0:47:10pamatujete se to
0:47:15co
0:47:18noc protože tam není jenom to co my vlastně chce mezi
0:47:22ale je to jak to chce mezi Q šunky to mají úplně
0:47:26zvrhle rizika jedno ale myslím si že
0:47:30_e
0:47:31prostě _e o nějaká ta nálada a tak dále a tak dále že
0:47:39když nám někdo řekne
0:47:41ne ale myslím že jo tak
0:47:43bůhvíco
0:47:45no a
0:47:46potom a nejvíce používá ne parametry to sou ty
0:47:52buď L P cca anebo M S C
0:47:58pamatujete si jak se to dělá nebo mám vám to trošku zopakovat co byly ty
0:48:03M S C třeba
0:48:06a na to jestli se to
0:48:07no vlastně to sou V se s tím cat kterém že
0:48:12my sme
0:48:14se _m o co se tam snažíme
0:48:17vlastněni těch M S C se necháme třináct prvních
0:48:22jo třináct nebo dvacet většinou
0:48:25tak se to
0:48:26buď třináct a nebo dvacet
0:48:29jo někdo používá třeba patnáct ale to je takový že
0:48:32prostě třeba když nějaká laboratoř používá třináct tak budou používat třináct
0:48:37až třeba zapadlé zkusit dvacet a pro _m říct že dvacet je lepší
0:48:41jo na některých úloha prostě je lepší používat oněch na některých projektech o je lepší
0:48:46používat
0:48:48jiné číslo protože
0:48:50tom modelování tě zda
0:48:53a obecně tu rozpoznávání tam _e
0:48:57se používá _e úplně různé metody a ty metody se potom soustředí
0:49:02na I
0:49:04jinou informaci která je v podstatě včer dáte jo takže proto
0:49:10_e máme řiť
0:49:13dívejte se
0:49:15máme prostě nějakou tu řeč jo
0:49:18děláme s toho spektrum
0:49:21to spektrum bude vypadat takle
0:49:27proč to spektrum vypadá takhle protože tady ní máme
0:49:32in pózy a máme
0:49:35jakou _e impulsní odezvu ta impulsní odezvu rezonanční frekvence nástupce jo
0:49:41tým pouze to co dělá dělali naši hlasivky
0:49:45_e
0:49:46takže to je ono
0:49:48tady je operace fondů C
0:49:50že
0:49:51pamatujete se to jo
0:49:54to je svá
0:49:56čase
0:49:58to je čas
0:49:59když se budeme podívám do frekvence
0:50:04tak _e to co odpovědná tomuhle
0:50:07tak to bude ta naše obálka my říkáme to
0:50:11jo
0:50:12ta on
0:50:15_e kopečky to sou ty naše formanty
0:50:17jo
0:50:18a potom tají chle kterých lomnice se složka tu a je _e
0:50:25to jsou harmonické základní frekvence jo my když uděláme teďka
0:50:32sekvenčně analýzu těch impulzů tak bysme teoreticky
0:50:36někdy to stát s něco jako
0:50:41tohle
0:50:42jo
0:50:44ani ty a když poněvadž děláme tady
0:50:48konvoluci která mi to nedělá no slída ano
0:50:52takže je ve spektru umí uděláme násobení
0:50:56tohohle a té modré čaj tady
0:50:59jo
0:51:00a potom dostaneme to černé to je vlastně spektrum řeči
0:51:05ní teďka co budeme chtít udělat
0:51:08tak to ji a _e _m
0:51:11dosah toho jenom tu obal
0:51:15a teoreticky buďto můžeme prostě tíhla nic nějak
0:51:19jo
0:51:20udělat třeba
0:51:22já nevím
0:51:23_e
0:51:26jako interpolace nebo něco ale nebude to vůbec ono
0:51:30jo takže takhle to nemůže udělat
0:51:32my to uděláme
0:51:34i teďka vezmeme a _e druhou mocninu toho černého
0:51:40jo
0:51:42o tom vezmeme logaritmus to
0:51:45proč pro děláme tam
0:51:47proč tam aplikovaná logaritmus
0:51:54protože je
0:51:56když tohle je spektrum impulzu
0:51:59a tohle je spektrum potom
0:52:04impulsní odezvy jo tak mi je násobíme
0:52:08jo
0:52:10a když na to celé
0:52:12aplikujeme logaritmus tak to je prostě třeba
0:52:18blok C bude vlastně
0:52:22log _e tu
0:52:24blok
0:52:26ve že jo to si pamatujete
0:52:28jo takže vlastně aplikujeme _e
0:52:32ten logaritmus a inverzní
0:52:34fourierovu transformaci
0:52:37jo a tím pádem i potom dostaneme
0:52:41se bude takle čára
0:52:42a tady něco jako
0:52:45tohle malé koeficientíky ni řekneme že prvních třicet
0:52:52to sou nízké frekvence vtom spektrum jo takže my teďka vlastně
0:52:58tenleten obrázek
0:52:59nám říká jaké sou frekvence ve spektru
0:53:03ale jako ne ve spektru jako že tady
0:53:06jo a ve spektru prostě co obsahuje tak černé čára
0:53:11jo
0:53:13ta modrá ona vlastně odpovědná těm prvním při třetí a osy centrum centrální
0:53:20a ten zbytek to už budou potom tužky mělo být todleto jo
0:53:26že právě proto mi ve nám to ní třináct nebo dvacet abysme
0:53:30zakódování jenom to obal
0:53:32fajn
0:53:34_e ty M S C co tam prostě je to M S chcete tom melfrekvenční
0:53:40to je
0:53:41toho že je lidi slyší na
0:53:44že jo
0:53:46lidi mají lepší rozlišení pro nízké frekvence
0:53:50jo a to samé že
0:53:52lidi mají lepší rozlišení pro _e
0:53:57jo pro nízké frekvence
0:53:58dobře
0:54:00_e
0:54:03že tam se asi po ještě taková ta banka trojúhelníkových intrech nepamatujete dobře fajn
0:54:08super
0:54:12_m
0:54:17no a ty L T C to si pamatujete že vlastně tam se to kepstrum
0:54:21dělalo s toho L pece a nesolí rovky jo
0:54:26dobře
0:54:30co je tohle
0:54:36to vlastně jak vypadají parametry jenom
0:54:39je sice není _m
0:54:42která barva odpovídá vlastně světla a nebo
0:54:47jo ta světlá to je jako že hodně
0:54:50vysoká amplituda apod máme nejspíš nízká amplituda jeho rozdělíme neřeš to rámečku
0:54:57a ukážeme si některé parametry takhle
0:55:01_e
0:55:13ty čekám
0:55:16budeme
0:55:19budeme
0:55:23se chtít zaměřit na dvě metody dneska budeme dělat o měření vzdálenosti
0:55:29a příště tím snad budete dělat statistická modelování jo tome dolování jeho mnoho těžší mise
0:55:37dneska zaměříme jenom na to ptal na tu zdálo
0:55:44_e takže ono to bude vypadat
0:55:46intel
0:55:48nějak takhle
0:55:49dívejte se
0:55:51my máme třeba
0:55:53nějaké tří a _e
0:55:57třídy
0:55:58jo
0:56:01prostě třída jedna
0:56:04přidat je přidat či no a přijde testovat se vektor
0:56:08a samozřejmě ten by měl patřit třídě která je
0:56:13nám blíž jo samozřejmě ono to práce není úplně takhle protože
0:56:18tam sou nějaké ty variability stejně
0:56:22těch parametr která je potom
0:56:25když odstraníme tak můžeme zjistit že vlastně tenleten vektor opatři se
0:56:30jo ale o tom se budete balit cache
0:56:32až někdy jindy
0:56:36je tam obrázek vám jasný
0:56:39jo vlastnění máme teďka momentálně z nějakého rámce
0:56:45dvě čísla
0:56:46jo parametrů takto parametrů prostě dvou dimenzi
0:56:50to je jedna dimenze toho parametru to je prostě druhá dimenze tou parametrů jo
0:56:57a to je prostor naščítat
0:57:00fajn
0:57:07to bylo jednoduché měření vzdálenosti
0:57:11a teďka o tady tomletom se bude ta bavit
0:57:15eště někdy jindy
0:57:16představte si že mít teďka zase máme tří _e třídy
0:57:22jo
0:57:24ale ty třídy nejsou určené jenom jedním bodem nějakým centrem
0:57:30ten bod bude někde tady na kopečka
0:57:34jo
0:57:37ale tam je ještě je nějaká pravděpodobnost kolem tu o
0:57:43že data
0:57:45tam patři
0:57:46jo
0:57:48_e když se podíváte ty kopečky oni se překrývá oni jsou nekonečně široké jo tadle
0:57:55prostě se pláty úplně všude
0:57:58ale tady máte namalováno je
0:58:01namalován jenom
0:58:04prostě ten kopeček terry víš jo právě proto je to tak hezky spojujete ale vidíte
0:58:08že tady sou nějaké
0:58:10_e hranice tam jo
0:58:13ale přece jen ono zandá pokračuje jenže prostě tady vidíte trochu
0:58:18jo
0:58:21teďka
0:58:22vlastně jen
0:58:24my se budeme dívat
0:58:27a tu červenou tečkou náš testovat se vektor
0:58:32_e
0:58:36jak moc vysoko on se vlastně nachází protože to je ta pravděpodobnost jo jak moc
0:58:41vysoko to vlastně nám určuje to teda to není pravděpodobnost ale to nám určuje pravděpodobnost
0:58:47ono se to může stát že třeba cache já namaluju
0:58:53něco o to je
0:58:54to sou dvoudimenzionálně gaussovky prosím vás i když prostě jděte přijde
0:58:59jo parametry těch gaussovek vlastně s tou
0:59:04někde tady
0:59:05jo
0:59:07_e to jak je to vysokou otouš spojené pravděpodobnost prosím neplést to je dvoudimenzionální kauzu
0:59:14jedné dimenze to by mohlo vypadat prostě
0:59:19takhle že máme jednu
0:59:22a máme druhou
0:59:23jo
0:59:24přijde nám testovat se vektor někde prostě
0:59:29todleto
0:59:31je čára na které sou parametry jo parametry nejsou někde tady teďka vůbec
0:59:39parametry máme
0:59:41tady takže nám přijde nějaký
0:59:45dá to
0:59:46jo
0:59:47ani spočítám M
0:59:49pravděpodobnost prvním gaussovky
0:59:52a pravděpodobnost druhá gaussovky
0:59:55ani hraje tady druhá
0:59:58dobře
0:59:59to jenom abyste
1:00:00abyste se to zopakování když tak
1:00:03teďka to my máme tady sou naší data
1:00:07jo
1:00:09a jestli já jsem jiným tak ono to vypadá
1:00:12že _e
1:00:13každé s těch nahrávek nemáme úplně stejné slova
1:00:17takže vidíte
1:00:20zaprvé
1:00:21tam jsou trochu jinak frekvence jo pár vlastně se mění
1:00:26trochu jo
1:00:28a za druhé oni ono tohle různě natažené
1:00:34tak i když třeba se nám podaří nějak velmi hezky
1:00:38spočítat parametry třeba ty M S C
1:00:42tak mi dokáže to a dostaneme
1:00:44různý počet rámců
1:00:48a teďka budeme dělat od _e té dvojice ze
1:00:51které
1:00:53nám
1:00:54pomůže
1:00:55najít
1:00:58jako kdyby cestu
1:01:00jak sou sekyra _e rámce vlastně jak jaksi odpovídají
1:01:05jo
1:01:07prostě rozsekáme to na rámečky
1:01:13takhle nějak mi že
1:01:16no a teďka vlastnění vidíme že to co je tady ono si to patří
1:01:22tady taky
1:01:24jo a tady tenhleten druhý ste první bude patřit asi třetí
1:01:28za druhé
1:01:30jo a todleto se budeme chtít teďka mnou či
1:01:50_mhm
1:01:57tady zase máme nějaký moc hezký obrázek
1:02:01a ten obrázek _e
1:02:04je to no to není nic jiného nejš
1:02:08tady
1:02:09ste tady tenhleten
1:02:11dimenze jí
1:02:13my máme
1:02:16_e
1:02:17vektory třeba ve který parametrů s nějaké referenční nahrávky jo
1:02:23a tady máme testovat si
1:02:26a teďka každý s každým porovnáváme jak jsou si podobné
1:02:31jo
1:02:34takže ní vidíme že vlastně ta podobnost bude někde
1:02:40na tý _e diagonále
1:02:45trochu
1:02:51a toto co to jako znamená V teďka vlastně když budeme počítat a ty podobnosti
1:02:58jednotlivých rámců svou nahrávek
1:03:02jdeme tatí a _e chtít počítat
1:03:06nějakou pravděpodobnost
1:03:09to že a _e
1:03:12odpovídají obě stejnému slovo nějakém
1:03:16jo
1:03:17takže to je to jo ono
1:03:26o tomhletom se bude ta baryt až nějaké ty další přednášce
1:03:30co vám akorát můžu říct že ty skrytém hákuje modelujícím epos model
1:03:37ono to je velmi podobné konečném automatu jeho takže ji když
1:03:42je to úplně to sám akorát to má jednu věc navíc jo
1:03:46takže když se to třeba moc nepamatujete tak zkuste se to za pokud opakovat i
1:03:50konečné automaty jaký vám to příště ulehčilo práva
1:03:54co se tady děje ní budeme chtít
1:03:57postavit nějaký ten model jo a todleto se vo skutečnosti teďka už děla
1:04:03jo
1:04:04ni vezmeme prostě jel
1:04:06nějaký unk o
1:04:08vezmeme nějaké slovo
1:04:10a budeme chtít to slovo namodelovat
1:04:13jo
1:04:17i tady vidíte
1:04:19v nějakém
1:04:20kroužky
1:04:22to soustavy samozřejmě to si pamatujete
1:04:26jo prostě todle to sou všechno stáli tohleto je konečný stav i když prostě o
1:04:31těch konečné automaty asi pamatuje takže to sou
1:04:34dva proužky jo
1:04:36aneb dva kroužky nemáme
1:04:38na nic a oni vlastně tady tyhlety první a ten poslední stav oni sou jako
1:04:44kdy B redundantní
1:04:47jenom aby se ty modely hezky spojování jo aby měli začátek a konec
1:04:53ale jinak oni ty stavy jsou prostě ptá zóně nic nedělaj
1:04:56to nás zajímá nás zajímají ty áčka
1:05:01to budou nějaké přechodové pravděpodobnosti
1:05:05jo
1:05:06představte si že jasný teďka máme nějaké slovo
1:05:13máme matic i
1:05:17parametrů
1:05:18jo
1:05:22a my budeme chtít a D tenleten model který má čtyři aktivně stavy adieu _m
1:05:29jako kdyby generoval tohleto slovo
1:05:32jo s nějakou určitou pravděpodobnost
1:05:37on se musel natrénovat tak a D prostě
1:05:42nějakému tomu stavů
1:05:44odpovídání nějaké konkrétní
1:05:48vektory a samozřejmě prostě jako sekvence to musí fungovat
1:05:52jo řekneme
1:05:54ježíš
1:05:58řekneme že prostě
1:06:00takhle
1:06:02takle a tak dále jo
1:06:06ty přechodové pravděpodobnosti pozor prosím vás
1:06:09oni jsou trošku takové po zákeřnym protože a
1:06:13tady je to jasné tady bude prostě jednička
1:06:16jo když začínáme víme do prvního stavu fajn super
1:06:20potom sme tom prvním stavu a postupně jako kdyby načítáme jednotlivém textury
1:06:26říkáme
1:06:27s jakou pravděpodobností jo to sou vlastně ty
1:06:32myslím toho věřící to já nevím jak se řekne česky
1:06:37takovou pravděpodobností
1:06:40a ten konkrétní vektor odpovídá tomu stavu
1:06:44jo
1:06:45a fronty áčka vlastně nám říká ji že mi když přičteme další vektor
1:06:51tak
1:06:53tohleto pravděpodobností musem a zůstat tady
1:06:57a nebojím zase dál
1:06:59jo
1:07:01a ono se tom
1:07:03ono se to takle musím naučili a když to už bude umět tak mi tomu
1:07:08záznam _e zase nějaké jiné slovo
1:07:11jo a ono ten model dvě na měl otestovat
1:07:17ono to určitě projde
1:07:19jo ono to určitě projde až do konce
1:07:22tam se to dostane libovolné slovo
1:07:25jenže potom nijak sem ne němeček spočítáte
1:07:29pravděpodobnost že to je ono jo to je to slovo které patří k tomu a
1:07:34to model
1:07:37ale o tom budete se bavit hodně dlouho a je to moc zajímá
1:07:49tady eště pár slov
1:07:52o dekódování jeho tam sme viděli na začátku
1:07:56nějakou tu krabičku je se nám říkala že
1:07:58když máme ty izolovaná slova což mi dneska předpokládáme
1:08:03tak to je velmi jednoduché jo protože to slovo prostě buď je nebo není
1:08:09ale u toho _e
1:08:12a vy se S R to že
1:08:15tu rozpoznání spojitý slov s velkým slovníkem
1:08:20je to o něco složitější protože
1:08:23tam nás zajímá tak zvany lan klíč model já nevím jestli se třeba něco takovýho
1:08:28už slyšeli řešený nebo neslyšeli todle
1:08:35_e to je to je velmi jednoduchá záležitost protože každý jazyk má
1:08:40nějakou
1:08:42určitou strukturu že jo _e
1:08:46když i třeba _e řeknete ahoj tak je velmi pravděpodobné že byl řeknete jak se
1:08:51máš třeba
1:08:52jo
1:08:53v češtině
1:08:54jo
1:08:56takže
1:08:57on nám určuje že jo jaká je pravděpodobnost
1:09:01když řeknu nějaké konkrétní slovo
1:09:04že řeknu
1:09:05další nějaké konkrétní svou
1:09:07jo
1:09:08jako kdyby takový strom
1:09:13takže dívejte se když teďka rozpoznáme
1:09:19jedno slovo
1:09:20slovo číslo jedna jo
1:09:23a potom toto míříme prostě devadesát procent že to je ono jo hezký prostě jsme
1:09:29si jisti
1:09:30potom další slovo a toto mi rozpoznáme třeba nějakou větu teď
1:09:34jo nějak ocelově to budeme chtít rozpoznávat
1:09:37potom nám přijde slovo dvě
1:09:41pravděpodobností prostě čtyřicet pět toho modelu zájmem nám to vyleze jo
1:09:47a přijde slovo
1:09:50při s pravděpodobností padesát pět procent
1:09:53jo
1:09:54to eště nám nedává vůbec
1:09:57_e právo říct že todle jako na té druhé pozici musela mít slovo tři
1:10:04my se teďka musím podívat do vám which modelem
1:10:07musíme se podívat s jakou pravděpodobností v tomletom konkrétním jazyků
1:10:12jo
1:10:13zatím slovem
1:10:15teda jo před tímhle tím slovem prostě je tohleto jo
1:10:19a s jakou pravděpodobností před tímhletím slova mně tohleto taky
1:10:24a může prostě říct že tady máme devadesát procent a nemáme zde no a co
1:10:28máme dělat
1:10:29tak třeba můžeme vybrat tohle
1:10:35potom tam výslovnostní slovník eště máme
1:10:40a tu je třeba zejména velmi důležité pro angličtinu protože jak mi píšeme a jasný
1:10:45sumujeme něco je zase něco jiného jo
1:10:48my rozpoznáme ty fonémy ale potom tomu sem ještě před
1:10:52a na najít prostě když von pracovat s angličtinou tam mluví každý úplně jiná že
1:10:57protože tam
1:10:58obou hodně lidí mluví anglicky a vždycky tam častokrát je tam nějaký přízvuk
1:11:05a von ten člověk může vyslovit něco
1:11:08prostě ne tak jak by měl jeho třeba mít samý jo a tak dále takže
1:11:14_e
1:11:15potom jsem a ještě zase na
1:11:19spoléhat na nějaké pravděpodobnosti s jakou pravděpodobností lontu vůbec místo
1:11:26a tam budete mít ještě hodně různé z těch algoritmu to bude to bude fakta
1:11:30vo ale nejde toto jedno není to moc jednoduché zábavné
1:11:37no a omezení prohledávacího prostoru to je to co sem vám říkala push
1:11:44že a
1:11:48my se prostě
1:11:51nám se třeba něco rozpozná jo
1:11:54ale ono to něco třeba vůbec není moc pravděpodobné že L s tomletom const kontextu
1:12:00by mohlo být
1:12:02takže mi to zavedeme jako jo budeme vyhledávat vlastně
1:12:08a nějakého konkrétního subsections
1:12:27teďka když budeme chtít rozpozná ty izolována slova
1:12:31za prvé ono to může být tak nahráme že to je izolován jo
1:12:36a za druhé prostě když to tak není máme větu a chceme toho vystřihnout slova
1:12:42je
1:12:43jo
1:12:44nás nezajímá sto jaké jsou bylo před tím i teďka nebudeme se zaměřovat na rozpoznání
1:12:49tetelení je ty a na nějaký konkrétní slova
1:12:52jo takže nepotřebu normálního neboť modální takovýho
1:12:57ty slovani střihne má a toušice jak se dělá prostě detekce řečové aktivity
1:13:03on je častokrát založeny na energii jo to je nejjednodušší když máme prostě vysokou energií
1:13:10T řeč když nízká energie to je šum
1:13:13jo ticho jo
1:13:17samozřejmě a _e tom a svoje háčky protože třeba takové
1:13:22o náznaky prostě jako šum třeba je jo může prostě
1:13:26ten detektor nemuset fungovat úplně
1:13:29plně nejlíp ale jenom
1:13:31jan tak abyste věděli anodou právě se používá je podstatně složitější
1:13:42tak máme další obrázek takže ve slovníku máme
1:13:47měl
1:13:48slov
1:13:50přijde nějaká řečany chceme prostě rozpoznat
1:13:54která těhletěch slov bílá vyslovena
1:13:58jo
1:13:59to je ono
1:14:15takže
1:14:17teďka už _e
1:14:19kde mám
1:14:20D M na to více méně
1:14:28todleto sme si zase už říkali
1:14:34že M
1:14:37my budeme chtít
1:14:40rozpoznat vlastně
1:14:42slova která obsahují víc než jenom jeden takt or parametrů takže
1:14:48todleto konkrétně ní použít
1:14:51nemůžeme
1:14:55protože a _e
1:14:59a vlastně vybrán používat
1:15:00něco skoro úplně to samé ale tady se to říká že
1:15:05vlastně abyste nebyli moc zmatení že
1:15:09tenhleten vzoreček je jenom pro jeden konkrétní nějakým takto
1:15:13jo
1:15:15kde vlastně typ _e
1:15:17to sou dimenze toho vektoru
1:15:21jo
1:15:24že těch slov máme
1:15:26nějak
1:15:27a tady
1:15:29vybereme
1:15:32vlastně ten vektor jeden parametru
1:15:36proč máme dva
1:15:38máme jenom konkrétní tak rád
1:15:45a na jeden konkrétní vektor
1:15:48jo a druhý konkrétní vektor vidí prostě celé slovo
1:15:53dílo reprezentován _e vektorem tak bysme porovnání vlastně
1:15:59jaksi
1:16:01a jsou si podobné
1:16:03ty vektory jednotlivé menze napočítali jedno číslo jo
1:16:08to je
1:16:09to znáte to je ta euklidova vzdálenost
1:16:13ne
1:16:13nás
1:16:15dobře
1:16:21teďka ale náš u té
1:16:25porovnávat
1:16:27matice
1:16:30tedy sekvence vektor jo
1:16:33dostaneme u té reference vlastně nějakou sekvence kde
1:16:38to R má ale jedna a šerm ale
1:16:41jak velká
1:16:43jsou vektory
1:16:45a tady mít taky máme prostě vektory jo je sekvence vektor má
1:16:50a teďka budeme chtít udělat
1:16:52alanine nějaký
1:16:55a tak dále jak to bude vypadat tak první nechceš bude match vlastním první a
1:17:00poslední a tím posledním ale co to je uprostřed tak mi to moc nedím
1:17:04samozřejmě nemůže já seskakovat to nefunguje jo
1:17:09_e
1:17:11takže tím je omezené nějak prostor toho
1:17:14hledání ale pořád to je to co
1:17:17složité
1:17:19no
1:17:27takže kdy nějak mně to udělat nemůžeme to sme souši říkali
1:17:32navíc tady třeba máte příklad kde se udělala ta chyba a
1:17:38detekce řeči jo že tendleten šum vidíte a uměl docela vysokou amplitudu takže prostě
1:17:47se to k té řeči nějak připojeno ale přitom to je prostě šum nějaký jo
1:17:51vůbec to není žádné řeč
1:17:54ale nic takovou nahrávku máme
1:17:56a musíme s ní pracovat proč ni musela pracovat proč tudletu nahrávku není hodíme
1:18:02si myslíte došlo furt tak řešena ten šum a tak dál
1:18:08proč tu nahrávku nemůžeme vyhodit
1:18:11že by takových nahrávek mám na hodně a děláme prostě to automaticky já nemůžeme poslechnout
1:18:17o nevím sto tisíc
1:18:19třeba hodin řeči jo
1:18:21proto
1:18:22proto vlastně
1:18:24my se snažíme mít co nejvíc vždycky dat
1:18:27jo čili s těmi vždycky
1:18:30ale ty data se snažíme nějak zpracovat
1:18:34ale však máme nějaké takový chybně a musíme nějak potom ty metody vždycky
1:18:40na to naučit aby se s tím nějak
1:18:43_e
1:18:44aby se s tím nějak uspořádány fajn dobře
1:19:01a konečně myslím dostává do té metody které se nepoužívá
1:19:07_e tadleta dynamické borcení času a to je nějaké _e jakýsi vyměním dynamické programování a
1:19:14hned se podíváme jak to vypadá
1:19:16jo takže i teďka už sme se to řekli hodněkrát teďka tneska
1:19:23ale
1:19:24máme tady _e
1:19:29vždycky
1:19:30je dán
1:19:32vektor
1:19:33jo
1:19:35parametrů
1:19:36takže vlastně ta jednička dvojka toto sou čísla rámců jo to nejsou jenom jednotky jako
1:19:41můžou být o jednotlivé čísla ale my pracujeme s vektory takže sto nepleťte
1:19:46a tady máme sekvence taktu která odpovídá ten naše testovat se nahrávka ani budeme chtít
1:19:53se podívat
1:19:55jestli je _e
1:19:57za prvé i budeme chtít
1:19:59najít i nějakou cestu
1:20:01jo jak vlastně ty rámce jsou si podobné a za druhé spočítat nějakou pravděpodobnost
1:20:08že to je ten náš že to je to naše slovo
1:20:12jo
1:20:14takže když se podíváme že vždycky budeme začínat
1:20:18někdy a někde jedničce
1:20:22jo
1:20:23vždycky prostě první odpovědná prvnímu
1:20:26jo když předpokládáme že předtím nic neni a poslední bude odpovídat tak je posledním
1:20:34tady vidíme že jo druhý odpojena dlužím u třetího tlumena druhýmu a tak dále a
1:20:39tak dále
1:20:40jak to budem a počítat to bude mám počítat velmi
1:20:47velmi jednoduše jako pod a teďka nevím proč
1:20:51tam vlastně je popis nějaký úplně
1:20:57úplně jasný
1:21:08nevím
1:21:19takže _e jak to budeme dělat ní vezmeme
1:21:22zase
1:21:25jak to reference vezmeme vektor Á
1:21:30_e testovat se nahrávky podíváme se
1:21:33jestli jsou blízko jo spočítám a to vzdálenost taky tady potom todle
1:21:40to o nějaká
1:21:42jo to je nějaká ještě další váhová ty
1:21:46funkce
1:21:49ale k té se dostane na ty po
1:21:52do of kliky většinou končíte tuto přesná
1:22:01ve tři čtvrtě jo
1:22:05_e
1:22:19takže tak teďka bude takhle že odpovídá to takhle budeme chtít spočítat
1:22:26nějak a ty naše vzdálenosti přičemž
1:22:31tohleto budeme se snažit těch pokud možno nějak
1:22:35minimalizovat zaprvé my si musíme nadefinovat nějaké ty stahovat si
1:22:40_e nějakou tuba hlupáci funkci a eště nějaký krok a nebo spíš _e
1:22:47něco jako
1:22:52nějakou třeba
1:22:54cestu k a kterou my může mají johny třeba můžeme se podívat
1:22:59že samozřejmě je nejpravděpodobnější že když začínáme někde tady
1:23:05jo a končíme tady
1:23:07obzvlášť když sou ty nahrávky prostě veršů a
1:23:12tady na délky tak ta cesta by měla být někde na té diagonále jo
1:23:17takže právě proto my musíme ještě nadefinovat
1:23:22váhy kroků
1:23:23jo kam pudem a
1:23:27to a dneska díky
1:23:33a ten algoritmus
1:23:34bude velmi
1:23:38docela jednoduchý by řekla
1:23:44jo to motorku
1:23:48trochu z názvy
1:23:54počáteční koncové body se nadefinujeme a potom nějaké lokální souvislosti
1:24:02jo potom i se nadefinujeme jak moc můžeme jít nahoru jak moc můžeme jdou strany
1:24:08to je
1:24:11to je jednoduché no a jak jsem říkala přeskakovat taky se nesmí takže každý vektor
1:24:17musíme použít aspoň
1:24:20jednou
1:24:23a ale ten vektor se může _e opakovat jo jak může se opakovat nette ste
1:24:29cestě o referenční nahrávky je taky se může opakovat i
1:24:33u té
1:24:34testovací
1:24:37_e jasné
1:24:42jo a nějak a _e máme srazí omezení podle nějaký konkrétní vzorečku to je
1:24:49co všechno záleží na nějaké ty aplikace nebo konkrétním slov
1:24:54neživý si nadefinujeme nějaké čáry a potom ty čáry nám
1:24:58řeknou že jo někde tady vtom žlutým
1:25:01i ta cesta mohla být
1:25:04a co to znamená to znamená že ní vlastně budeme teďka dělat skutečně za dynamické
1:25:09programování jo ji nebudeme porovnávat každý s každým
1:25:14ale budeme
1:25:15porovnává tím ty _e
1:25:18pravděpodobné podstatě se jo bude mají vyhledávat
1:25:23jak se ta cesta někde tady prostě mu ta
1:25:33ty váhové funkce můžou být zase
1:25:37mně koně kádrů Ú
1:25:40ono sou to většinou určuje tak že ví třeba budete chtít najít zavazovat nějakou aplikaci
1:25:48budete mít _e trénovací data a nějaké evaluační data jo
1:25:57na implementujete potom _e tohoto zkuste té různé váhy
1:26:01a proto to funguje lépe tak to použijete protože ní většinou taky předpokládáme že ty
1:26:08evaluační data
1:26:09té ty nějaké verifikační data
1:26:12oni a _e
1:26:15sou
1:26:16nějak tak podobné tomu našem to bude se potom
1:26:20_e testovat jo čím to budete provozovat
1:26:24takže tady máme ty testy co to znamená to asi chápete že
1:26:29že vy vlastně když
1:26:32ne
1:26:34u toho bodu
1:26:36ono to je trošičku jako kdyby naopa
1:26:39že deme sem nahoru tak dáme prostě dvojku váha bude dvě jo že bude splněny
1:26:46takhle to tomu ten stejně od konce říct že
1:26:49když jsme tady
1:26:51tak sem sme přišli s největší pravděpodobností odsud
1:26:55jo
1:26:58a potom na základě tady těhletěch v a on se ten algoritmus jaksi
1:27:03se přizpůsobí
1:27:10samozřejmě když vidíte že máme tady nějaké váží je hodí jednička dvojka dokonce tady dole
1:27:16máme i nulu
1:27:18to znamená že vlastně
1:27:20_e
1:27:23sem dole jako kdyby nemůžeme přejít jo že ten konkrétní
1:27:31nějaký _e vektor se může použít fakt
1:27:35jenom jedno jo nemůže se jako první zůstat na jedné
1:27:40na jedné poloze
1:27:41a musíme která když máme nějaké ty váží definovat i normalizační faktorizace
1:27:47no a ten normalizační faktor de co na denotační faktor
1:27:55tu to bude suma všech použitých na zase
1:27:59jo to je docela
1:28:01logické
1:28:10ono to jiná a zase takovém
1:28:16takové trochu
1:28:18nebezpečné používat
1:28:21ten normalizační faktor
1:28:24jako a váhy
1:28:27odpovědná jestli té cestě protože oni když
1:28:30já sem vám říkala zaprvé potřebujeme najít cestu a na druhé musíme odhadnout nějakou tu
1:28:35pravděpodobnost potom spočítat jo
1:28:38podle cestě
1:28:40takže mě když dostaneme nějakou referenční teda ne refe nějak otestovat se nahrávku a máme
1:28:47ve referenční a chceme zjistit
1:28:49které z nich
1:28:51vlastně ten vektor patří jo ten vstupní ten testovacími
1:28:56tak potom tomto normalizační faktor bude zase
1:29:03jiný
1:29:04ale to tady ne vládí
1:29:07ono to budem paní
1:29:10zadám té cestě jo takže sem řekla bobo
1:29:39potom zase tady máte říkám _e nějaké tabulky
1:29:45tabulky s omezením
1:29:48co když
1:29:51se mě nechce moc
1:29:53nějaký dva
1:29:55protože sme se to řekne push
1:29:57dnes tak
1:30:00a já bych se chtěla dostat píchni K
1:30:10někam asi
1:30:14jsem
1:30:17teďka nás bude zajímat jasný vytvoří má tu referenční
1:30:23nějaký referenční a nějakou referenční sekvenci
1:30:27E vektoru
1:30:29takže vypuč můžeme použít jedno nějaká konkrétní smlouvalo že jo
1:30:36jo logické když tam _e
1:30:39když máme jenom jedno slovo tak nic nemůže na použít když my máme kdy a
1:30:44nahrávek odpovídá je se ten mu slovu
1:30:47tak buď můžeme použít každé zvlášť že jo
1:30:51jo a potom třeba udělat
1:30:55průměrně jak jejich pravděpodobností a nebo
1:30:59vlastně jenom tohle
1:31:01a nebo může má _e vytvořit nějaký průměrný
1:31:06vzor
1:31:09zase když použijeme ta to jedině jarní průměrování tak to je docela P po že
1:31:16no protože jedna bude dlouhá druhá prostě družinou bude
1:31:21krátký a tak dále
1:31:23a nebo můžeme _e
1:31:26zase udělat
1:31:28dynamické
1:31:31průměrování a to zase může na použít
1:31:35a toho dete V na to
1:31:38jo nějak prostě je řekněme
1:31:40dohromady a tu bude naše
1:31:44reference
1:32:07no a titulky já nevím jestli ste už měli
1:32:11já si myslím že nespíš učte todleto s taky ste měli že jo i když
1:32:15jste se bavili třeba o tom vektory _m kvantování tak
1:32:19učte zvuky akože zvuková ní ten princip už _e mě asi tak nějak povědomý že
1:32:25jo
1:32:26jo
1:32:31ono to vlastně
1:32:34a to zvuková nic zase může být
1:32:37třeba užitečné je
1:32:40s takových případech když máte pro nějakou třídu třeba
1:32:45máte a _e
1:32:48omezený počet dát jo vy třeba můžete si představit že máte
1:32:52X tři každé přidá má hodně dat a potom máte třeba nějakou tři doktorama
1:32:58málo dat
1:32:59jo takže ta třída které je reprezentována malým počtem dát ona je
1:33:06nejvíc náchylná k těm chybám nebo nějakým špatným rozpoznáváním protože
1:33:12no tam je málo dát a vlastně když budete dělat to shlukování tak teoretický můžete
1:33:17použitá ta která patří jiné třídě
1:33:21jo
1:33:24můžete prostě a vlastně to jako kdyby na syntetizovat
1:33:30teda samozřejmě když
1:33:33ono to je to podobné
1:33:48tak se si myslím že to by mohlo být asi tak
1:33:52všechno sme strany akorát
1:34:02jo to asi všechno máte nějaké otázky
1:34:10fajn tak jak sme se že už je známo že teda skončit jo
1:34:14tím