0:00:07vítejte
0:00:09začne bezdězu zpomalili přesunem toto je přednáška odvrhne
0:00:14mám pocit že říká R _e vaši kolegové klasika řeknete přesouvaly jsem úplně jiná možnost
0:00:20to nakonec zacyklí takhle
0:00:22ta
0:00:31bez občas
0:00:35jo
0:00:36my
0:00:38utíká
0:00:40zda
0:00:41
0:00:46budeme dominika straně učitelem i na jihovýchod napřed řeše tak do a ten a krucinál
0:00:55_e a ku
0:00:57_e technika i
0:01:02ale nevím
0:01:03možná že by se podívat na nějaký
0:01:06bude mít ten ale prosím vás
0:01:09říká
0:01:11vyšel takový
0:01:13já jsem ráda
0:01:15tak vystihnout tak
0:01:27jo takže že
0:01:29M
0:01:30a _e ještě než se dáme do vlastně přednášky tak nějaké administrativním složky
0:01:36_e natáčet prvního projektu
0:01:39protože když _e skoro všechno co potřebujete tak víte a zbytek se tam dozvíte dneska
0:01:44první prvek _e že vlastně rovina _e
0:01:49určitě udělali anebo tento týden uděláte komplexní kodek od _e P T znamená určení parametru
0:01:57_m filtru který modeluje naše hlasové ústrojí určení základního tónu
0:02:02_e nějaké tak na kvantování parametrů a potom naopak
0:02:06je mezi parametrů zase postavení toho filtru a nagenerování nějakého budícího signálu a daní řeči
0:02:13dohromady
0:02:14a jako one budu v rámci toho prvního projektu chtít abyste _e ten dekodér
0:02:20napsali čemkoli jiném než matlabu takže si můžete vybrat měl jsem prostě různé
0:02:25časově pá jednu se C plus C plus
0:02:31víš art _e že možném skutečně nikdo nedokázal
0:02:35_e možná šikanovat
0:02:37_e bod je to je to všechno na webu popsané
0:02:40vrutici krát budete mít pozici nějaký testovací signál referenční výstupem
0:02:45takže po vás budu chtít prostě abyste si ten testovací signál skórovali neposlechli
0:02:52_e já potom na to toho bodu pouštět nějaký svůj testovací signál pod ohodnotit kvalitu
0:02:56výstupu jednak si budu dělat tak má logaritmickou spektrální vzdálenost zpracování možná trochu _e dozvíme
0:03:03to je nějaké
0:03:04jako v uvozovkách objektivní hodnocení kvality dekódované řeči podle toho si to sortu pár nejlepší
0:03:11si poslechnu a ta úplně nejlepší dostane ještě frašku červeného vína
0:03:15takže _e toho přesně zase dostáváte body máte nastane někdy na konci toho pdfka jako
0:03:22de teda pustit produkuje poslouchat plnou tečna feťáky distribuci řeknu jinak linuxu
0:03:29_e je k dispozici nějaká minimální dokumentace všech neformálně pořádku odevzdáte termínu toku toto je
0:03:37širokej dostanete patnáct bodů když je něco s toho nebude oukej tak tady máte _e
0:03:42napsány různé penalizace
0:03:44a pokud všechno bude oukej eště budete mít nejlepší kvalitu výstupů tak trošku dobré víme
0:03:50a i důležitá informace tento projekt jako na _e skupinka swot jednoho do tří studentů
0:03:57zapisování normálně ve wisu udělám tam dneska večír nějaký takovýto zapisovat o podobně se hlásili
0:04:05na laboratoře jo není tam žádný časový press a
0:04:10odevzdání toho projektu musím ještě vymyslet
0:04:14loni se vodevzdával
0:04:17se to bylo na webu
0:04:20_e
0:04:21buněk někdy to dám na polovinu dubna
0:04:26ještě přesně nevím tam
0:04:28_e další administrativní informace půlsemestrální zkouška se mnou testovala na hory
0:04:34nární prázdniny a vzhledem k tomu že sem hodil mu sjezdovka dvě až tři děti
0:04:39tak pacem večer měl maximálně tak je to civilnosti aktivovali tak to znova se
0:04:45nesrali složka ještě není opravena
0:04:49tak _e začínáme přednášku
0:04:52zase na zdroje pane kolego jedenáctka R tak se mi dejte
0:04:57jihovýchodním směrem
0:05:00ano
0:05:03a
0:05:04jo
0:05:06zase dělat známe všichni na to samé a prostě odepři
0:05:10si napsaný z dekodér _e něčem jiném matlabu
0:05:14a pak si prostě dekodéru nějaký signál E
0:05:17rovná vám
0:05:18poslouchám
0:05:22jo je samozřejmě na vás jako je vzít ovocného nového těchto to dodělali už mírou
0:05:27že jo jako u textu není nejmenšího odporu
0:05:31_e doufám že hosti výsledek jako dentista napíšu sem není to těžký prostě naučíte se
0:05:36na tom pár věcí
0:05:37který řeči _e
0:05:39co
0:05:40že se
0:05:41zná jinde
0:05:43jo Š poďme na kódování řeči
0:05:51promiňte si že taková malá kalibrační vsuvka
0:06:14tak to je to
0:06:15video zamezte to znamená
0:06:25jako kde to někdy psal a tak topasu objevovalo oku centimetrů vedle
0:06:31takže potom co rovnou
0:06:35takže černovic do blázince takže kódování řeči jedna
0:06:39o čem to bude nějaké obecné povídání o dělení kodérů jak se vyhodnocuje kvalita kódování
0:06:44objektivně subjektivně potom začneme s těma vlastníma bude doma
0:06:48a přes _e to bude vo tak zvaným bejt von code i
0:06:52předtištěné to hrozně krásně doslovně překládá jako kódování tvaru vlny
0:06:56jo opravdu
0:06:58_e dva a je to vlastně _e o tom že pracujete vzorek po vzorku aniž
0:07:02by se brali nějak moc úvahu že máme _e že máme nějaké řečové ústrojí které
0:07:08se skládá z buzení a modifikačního _e nebo z artikulačního traktu
0:07:12o tom se podíváme na vokodéry kde už tady tohleto platí to znamená tam předpokládáte
0:07:17že zpracováváte řeč která se dá nějak rozdělit
0:07:21_e mrknem na vektorové kvantování že takovým základním kamenem
0:07:26mnoha kodéru řeči ale i další
0:07:30věcí
0:07:31_m o _m mimochodem měli se někde no viděli se někde vektorové kvantování nebo klastrování
0:07:36nebo z luku automatické shlukování
0:07:39vrzali někde v nějakém kurzu
0:07:41jo vy máte prostě jako mraky dat
0:07:44nějaký vektoru v nějakém N rozměrném prostoru a také potřebujete _e rozdělit třeba do dvaceti
0:07:50tříd automaticky
0:07:53no něco takového
0:07:55oba tyto viděli o tak
0:07:57to tady eště jednou projedu
0:08:00možná že by to bylo moc jako pomalu přičte a
0:08:03by měla něco zajímavějšího o tom ještě přednáška kódování dva kde už beru trochu detailně
0:08:10L kodéry nejsou dnešních mobile
0:08:14takže možná že se X to je dvojice dneska
0:08:17trochu dostaneme pokusilo sem taky sem
0:08:19tak vosumnáct kódování de
0:08:23ne no name bitů aby to přestalo co nejlépe sužovalo zřejmý když budete mít totálně
0:08:30archivovány přenosový kanál tak aby to pořád krásný mluvilo aby to bylo co nejméně výpočetně
0:08:36náročné
0:08:37sem vám tuším říkal že
0:08:39na napřed první přednášce že tady tato kritéria jsou _e
0:08:44v rozporu
0:08:46že třeba kdybyste chtěli opravdu jako co nejmenší počet bitů
0:08:51úplně ideální _e kodér by byl ten
0:08:55který by _e vlastně nahrál naprosto všechno se
0:08:59toho daného člověka US narození
0:09:01musí o indexoval a potom tak ještě kolik řeknete tak se to pravděpodobně někdy řekli
0:09:06tak to jenom jako šáhl o té konvexní a poslalo to taky třeba čtyryceti bitový
0:09:11index
0:09:12tak to by bylo bezvadný akorát by to asi docela dlouho trvalo
0:09:15takže by to
0:09:18hodně spočívalo a kdybyste
0:09:20ten index změnily o jeden jediný bit
0:09:23a místo nějakého slova řeklo třeba nějakou sprosťárna tak _e prostě asi
0:09:28i ta posloupností stránky nebyla
0:09:31pokud _e na
0:09:32takže
0:09:33typicky prostě tak jako v jiných oborech lidské činnosti
0:09:36jako chci dělat něco humanitárního ale stanovit hrozně málo peněz a nebo udělat nepříjemnou věcech
0:09:43rovnicí nesouhlasím ale budu balíku prostě
0:09:46to stejné vidíte tady požadavku na kódová
0:09:49_e eště takhle druhá poznámka
0:09:52když pojedete na nějakou konferenci tak _e ty kódovací sekce seznam jako popelky ani tam
0:09:58jako nechodí moc lidí a jako všichni do u teda na to rozpoznávání protože to
0:10:02je prostě jiná se _e velká věda
0:10:06_e když se podíváte na _e komerci a na čísla kolik jednotlivé aplikace vydělávejte kdo
0:10:12právě naopak uvědomte si že nějaký vokodérech
0:10:15máte asi dnešních kapse a všichni ho denně používáte když to nějaký rozpoznávat řeči jako
0:10:21tak někdy možná takovou vedra teda zásobu této někdy použili přednášky do com
0:10:27si vlastně hráli výsledky rozpoznávače jo
0:10:31dyž je to zatím taková hračka když to kodér rozvoji všichni to znamená firmy
0:10:37jako půl com
0:10:39_e
0:10:40jako
0:10:41tak se jmenuji
0:10:43_e
0:10:44naši
0:10:44přátele
0:10:46_e jak možná spoluvinu které dělají kodéry řeknu vám prostě vydělávaj úměrný masivní peníze
0:10:52tak _e
0:10:54poďme se teďka podívat na další větve standardizace
0:10:57zatímco ve světě rozpoznávání řeči syntézy řeči forma ano jako celkem velká demokracie anarchie
0:11:06vždy dělal jak se to se
0:11:09tak kódování samozřejmě všechno musí standardizována protože
0:11:13vás mobil nokia teda měl domluvy s tím samsung na druhé straně nebo
0:11:19a _e tohleto pane od nepaměti který času existoval organizace se sejdete
0:11:26kromě řekli krásný francouzský název
0:11:30toho se vlastně rozděl organizaci tu _e T S
0:11:34která dávala doporučení pro _e telefonování u pevných
0:11:40linka
0:11:42občas se některých těch doporučení _e používají
0:11:45i třeba T C P telefony jako nějaký celkem kodéry docela masivně se do tohoto
0:11:51druhý pánové vojáci takže třeba první standarty který vlastně byly vokodérech
0:11:58pocházeli T americký vytipovat metody se
0:12:01a tady máme evropě docela mocnou realizační organizaci která sme si
0:12:07a to má vlastně protože com
0:12:10u mobilních GSM telefon je vlastně francouzsky finále
0:12:14tak _e tam _e vlastně sme sem portfoliu všechny možný normy na kódování mobilních sítí
0:12:21pak máte ještě nějaký další inmarsat jsou takový ty satiry satelitní _e
0:12:27telefony
0:12:28pro lodě teroristy a další
0:12:31_e ionizace a eště byste možná napočítali ve čtyry pět další organizací
0:12:37tak _e
0:12:39kde nějaké principiální dělení kodérů to první bude tak zvané tvaru vlny
0:12:44jeden vzorek po vzorku
0:12:46hraje to krásně ale je to za cenu velkého bitového toku
0:12:51_e může se s tím zakódovat celkem cokoliv bude fungovat uspokojivě pro řeč pro _e
0:12:57drogu jediná vlastně _e věc kterou tady o těch vy forma nebo o těch signálu
0:13:04pro vy von kodéry budeme očekávat je
0:13:07že jednotlivý vzorky na sobě aspoň trošku závisí
0:13:11což platí pro všechny rozumí signály kromě bílýho sumu
0:13:15a bílý šum jako
0:13:17do toho takový přístroj budete
0:13:19pouštět do s
0:13:22tak za druhé sou vokodéry
0:13:24které tvoří tady tím že si řeší a cache víme že se prostě nějaké jako
0:13:30dá namodelovat pomocí _e pomocí _e
0:13:35buzení pomocí artikulačního mustr
0:13:38jo takže stejně tak tady nebo kodek najdete vlastně dva typy sítí bloky a to
0:13:43bude probuzení a blok modifikace a tím se samozřejmě musí nějak updatovat parametry a musí
0:13:48se nějak odhadovat a přenášet a C
0:13:52zasahuje se přední cache nízkých rychlostí
0:13:55spokojil jenom řeč zkuste si někdy jako přehrát přes mobil hudbu bude to sice přes
0:14:00ale nebo řazení pěkné
0:14:03_e to je _e hybridní přístupy
0:14:06takhle vlastně se nazývají _e
0:14:10ty kodéry který současně obraz nejvíc používáme protože ty vlastně kombinují _e to co bylo
0:14:17v obchode takže třeba je tam úplně to samé zakódování artikulačního buzení jako _e vokodérech
0:14:25tedy nějaký filtr jedna lomeno A Z
0:14:27A modeluje naše artikulační ústrojí
0:14:30ale _e je tam složitější modelování buzení
0:14:34very zase přispívá jako přirozenosti hlasu a srozumitelnosti a to _e se nejčastěji i když
0:14:42někoho bity kompaktně _e kóduje vzorek po vzorku že vlastně tady tyhlety dva dohromady
0:14:48by vám dali hybridní kodéry a těleso hrozně důležitý protože to jsou všecky
0:14:54že C je ten kodek
0:14:56a pak sou takový _e
0:14:59že experimentální vědecký fonetické vokodéry
0:15:04_e pracují na tom principu že když se tlačit ten bitový tok ještě níž
0:15:08tak už vám nestačí ani vzorky ani dáte asi they do nějakých dalších jednotek
0:15:13kerý máte uloženy ve slovníku máte ty nějak _e popsaný jakými indexy takže tady budete
0:15:20mít typicky kodéru rozpoznávač řeči
0:15:24budou se přenášet jenom nějaký prostě pár bitový informace na druhé straně bude syntezátor
0:15:29je to hrozně _e fajn jistý pan černocký vo tom sepsal vegetační práci mnoho let
0:15:36no vole tomu na za
0:15:38ale zatím žádný takový kodér neviděl _e standardizaci nový tím že se prostě jako zlevněné
0:15:45_e
0:15:47zlevněný přenosové rychlosti takže vono to už není moc není potřeba
0:15:53tak _e
0:15:57pro sme se podívat na dělení podle bitového toku
0:16:00to sou zase taková
0:16:02jo
0:16:03klasická čísla ale když prostě někde tesla uvidíte
0:16:07že nějaký kodér má I tak je to více mneš cesta kilobitů a bitů jo
0:16:12nebo into kilobitů za sekundu
0:16:14nic je musel úvod osmi do šestnácti lo vo dvě celé čtyř do osmi a
0:16:19zelenou o tím
0:16:21a mimochodem ten
0:16:24plně první pokud _e sejdu normalizován právě americkou armádou
0:16:28někdy uštvat sedmdesátých no osumdesátých letech
0:16:32tak byl právě jako vlastně na spodní hranicí mouricu
0:16:36ten standard deset patnáct
0:16:39a ten pracoval na úterý čtyři
0:16:41kilo byte
0:16:43takže
0:16:44ještě je potřeba se podívat na to co ta bitová rychlost vlastně znamená normálně klasický
0:16:49_e
0:16:51klasický sítích prostě
0:16:53pevná linka nebo
0:16:55no pro banka
0:16:58_e
0:17:00_e tady měl nějaké počítačové nebo telefonní sítě říkat tomu komutované spojení
0:17:06když máte prostě bod a pevně
0:17:09drátem propojeny
0:17:11budem de
0:17:13jo
0:17:15jak je
0:17:17_e obvykle se to ještě nějak říkal který ste si
0:17:20_e zažili
0:17:23no _e příště prostě tam kde máme zaručeno vytahuj o
0:17:28tak si můžeme dovolit _e vlastně fixní bitový to
0:17:32_e tam kde to nemáme to znamená máme _e máme paketové sítě
0:17:37tak _e se spíš hraje na
0:17:40na proměnnou bitovou rychlo
0:17:42a _e občas vlastně víte že jsou kodérech třeba
0:17:46a M R N ven má tyhle spektra velký
0:17:50které si to _e bitovou rychlost sami V podle toho prostě k jaké
0:17:56US jaké pásma kolik bitů mají k dispozici
0:18:00_e ještě prosím vás jedna poznámka
0:18:03_e ne když se tady budeme bavit vo nějakým kódování
0:18:08tak to bude zásadně tak zvané source code i to znamená kolik bitů spotřebuju na
0:18:12kódování řeči
0:18:14a teďka a pak ještě tak druha druhá část které se říká channel coding
0:18:19a tam vlastně přidáváte bity pomocí různých opravných kódů
0:18:24abyste _e abyste jako
0:18:27to řeč zabezpečili
0:18:29proti _e proti výpadkům
0:18:33na přenosové cestě
0:18:34vono to jako čase hraje trošku
0:18:38dohromady dezinformace protože pokud posíláte počítačový soubor nějaký tak tam záleží na každém bitu úplně
0:18:44stejně to znamená tam musíte ten černookou name aplikovat naprosto bez rozdílu
0:18:50se provede
0:18:52tak to je trochu liberálnější a můžete si vlastně vybrat ty bity a který vám
0:18:57V záleží
0:18:58_mhm
0:18:59_e zakódovat králově pomocí nějakých opravných kódů
0:19:03a zasažena si ostatní se můžete vykašlat pokud nic dojde k chybě tak _e řetězci
0:19:09sestřenku ztratíme kvality ale pořád bude srozumitelná
0:19:13jo takže _m
0:19:14stejně je všechno ztrátové a podobně ztrátovém mnou vlastně _e to kanálové kódová
0:19:22tak _e
0:19:26a _e existuje teprve dělení podle kvality
0:19:31tak a standardní kvalita pevné telefonní linky
0:19:37ze se říká nesme anebo to
0:19:40znamená normální _e
0:19:43normálně analogový nebo dneska už teda většině případů digitální
0:19:47_e telefon a ten nevím se má tedy kvalitu C lepší to znamená nelze přirovnat
0:19:53třeba rozhlasovém vysílání normálně sem rádiu
0:19:56vy ste se říká brouska
0:19:58tak to je _e poctím
0:20:01takže
0:20:03mobil _e možná sou někde tady mezi
0:20:08záleží to na počtu chyb _e kanále tak to je prostě poctím také communication
0:20:15to znamená rozumíte zachovává charakter mluvčího ale
0:20:19řeč nezní _e nezní přirozeně
0:20:22a to ještě více po tím
0:20:25tak _e ze se říká syntetik
0:20:29technická kvalita proteiny s někým mluvili pomocí takového toho
0:20:33_e wall kyselky nebo ne z radiového pojítka
0:20:39bavíte to _e
0:20:42teď je to sou samozřejmě takto jako kategorie který by se mohli lidé a lada
0:20:47to znamená docela důležité vyhodnocování kvality _e jednotlivých modelů
0:20:52a ta ty metodiky vyhodnocování kvality jsou dvojí jedna firma objektivní
0:20:58a jednak subjektivní
0:21:00a jako je člověk prostě tady na této fakultě informatiky myslbek když máme
0:21:06máme objektivní tak to je bezvadný nelze jako nám dá nějaké _e nějaké platné číslo
0:21:11které hodnotícímu kodér dobrý nebo špatný
0:21:15akorát že v tom kódování řeči je to právě naopak
0:21:18tady vlastně objektivní měřítka kvality se dají
0:21:22počítat je to jenom nějaké přiblížení _e tomu jak
0:21:28_e člověk a když budete chtít nějaký mobil nějaký kodér prodat
0:21:33tak pro vás bude nejdůležitější tady to subjektivní kritérium a se to prostě tak jak
0:21:38se smísí lidí protože i vám to nakonec _e
0:21:42dají nebo nedají peníze
0:21:44že byste trochu detailně s tím objektivním a subjektivním hodnocením
0:21:49_e když se podíváme objektivních metrik
0:21:53tak úplně za nejjednodušší je poměr signál osum
0:21:57vzpomínáte ještě chema
0:21:59poměrem signálu co musíme někdy druháku _e
0:22:03je stezku
0:22:08na komín nevadí
0:22:10máme
0:22:11signál na vstupu
0:22:14který vypadá takhle
0:22:16zírala výstupu
0:22:18který vypadá
0:22:19takhle
0:22:26mezi těmito dvěma signály samozřejmě rozdíl
0:22:29když jedné rozdíl spočítáme
0:22:33prostě spočteme _e signál který je v odečtením těch dvou
0:22:37teď která nevím jestli to nezvládnu nakreslit na něco
0:22:41něco takového podobně pěkného
0:22:44a teď vlastně jasný že čím větší jeden chybový signál oproti tomu původnímu těmito horší
0:22:50že jo
0:22:51takže my si tady tohoto signálu spočítáme energii
0:22:54ale to je tady ten _e
0:22:57to je tady ten jmenovatel
0:22:59to znamená na nějakém vzorku jedu _e spočítám
0:23:07spočítám každý vzorek na druhou všecko sečtu mám energii to chybového signálu
0:23:15a _e s toho původního signálu si spočítám taky energii čitatel
0:23:20kdy normálně vezmu prostě hodnoty všech vzorků na druhou dáme do sumy to znamená tady
0:23:26tohleto je energie dobra
0:23:30to je dole bude energie špatná
0:23:34jo to je to signál tu no je anglicky a tady tyhlety dvě energie podělím
0:23:40a protože lidi jsou zvyklý na logaritmické měřítko takto pro táhnete _e protáhne terorismem základem
0:23:47zase
0:23:48vynásobíte desítkou máte signál _e poměr signálu k šumu
0:23:53decibel
0:23:55tak _e
0:23:56tady je
0:23:58zkuste říct jak ovčem bude mít tady ten
0:24:01poměr signálu k šumu problém
0:24:04připomínám se nám jde o to aby jsme poznali jestli nějaký kodér kóduje dobře obvodový
0:24:10slovy
0:24:11se
0:24:13jako
0:24:22tak když jeden signál
0:24:25_e
0:24:26bude míse
0:24:28velmi půl hodiny
0:24:30_e půl hodiny to bude úplně perfektně _e
0:24:34horova
0:24:36ale na dvě minuty to úplně vyhnout
0:24:39nebude tam vůbec nic
0:24:42tak to asi nebude moc fajn a _e tomhletom případě ale něco ty sumy vlastně
0:24:48přehrání
0:24:49zná půl hodiny ta _e ty budou nuly
0:24:53a bude tam obrovská chyba tak se to prostě i průměru jestli
0:24:57znamená problém toho poměru signál může jenže hodně globálních jako bere jeden se leží na
0:25:04druhej souvisí dna
0:25:05a nějak jako _e se nekouká na _e na chyby jednotlivých úsecích
0:25:11_m problému vám za chvilku ukážu zkuste
0:25:14se přemýšlet ještě bude jinej problém
0:25:19co když třeba _e jeden z těch signálu o milisekundu posunu
0:25:24když vám bude mluvit mobil a druhé mobil budem mluvit úplně stejně ale milisekundu osum
0:25:30zavazovat
0:25:33a nebude vadit vám bude úplně jedno co nikdo nepozná ale při počítání poměru signálu
0:25:38k šumu
0:25:39když si představíte že tady tenhleten druhý signál je takle posunutej
0:25:44tak najednou byste se do počítali obrovské kiwi protože bude vo té odečítat záporný hodnoty
0:25:50vodklad nechat rodnýho zákony
0:25:52takže tam vlastně veliká citlivost na _e a časovým
0:25:57časovým osum
0:25:59to musí potom něco řeknu ty logaritmické
0:26:02nechrání vzdálenosti
0:26:04tak _e
0:26:09tohleto je _e taková ukázka
0:26:12poměru signálu k šumu
0:26:15pro kódování slabiky a
0:26:18_e
0:26:19je to nalistovanou prosím vás není to vždycky
0:26:22_e pomocí čtyř bitů
0:26:25kdy vlastně tady demonstrujeme
0:26:28to nepěkný globální chování
0:26:31když se podíváme na _e řádku a
0:26:34a na její dekódovanou variantu pomocí čtyř bitů jakýsi vidíte že to dekorovaná wavka je
0:26:42zubatá ale jako zásadě
0:26:44není žádnej problém a když to poslechnete to bude znít docela pěkně
0:26:49na druhé straně pokud se podíváte na hlásku E
0:26:52a pak se podíváte na to jak vypadá nekódovaně tak je zle protože
0:26:57máte k dispozici možná jeden bit možná jeden a půl bitu
0:27:01jo tady ti
0:27:02i dva chudáci záporných duhovky
0:27:06to znamená tam vidíte že to je jako skoro stoprocentní chyba
0:27:11no a teďka když počítáte S N a
0:27:13tak všechno tady toto se bere _e dohromady prostě s tohodle chybový o signálu se
0:27:20spočítá suma jeho vzorků na druhou
0:27:25tohodle užitečný a signál sekyr počítá suma
0:27:29jo vzorků na druhou udělí se a toho
0:27:32takže
0:27:33není to moc dobrý
0:27:35když _e bychom si spočítali
0:27:39global globální poměr signálu k šumu
0:27:42tak nám to na tom signálu za čtrnáct pro patnáct decibelu patnáct decibelu je výbornej
0:27:48poměr signál osum prostě
0:27:51čemu perfektně rozumně
0:27:54_e tam slyšíte ale nějak vás neruší
0:27:57tak _e ale ten problém řeší
0:28:00tak zvanej segmentální poměr signálu k šumu nebo aspoň částečně řeší
0:28:06já jsem tady ještě to mladistvým nadšením kdysi napsal jako obrovskou rovnici
0:28:12která řekne každej ochromí
0:28:14ale prosím vás
0:28:16nejde vo nic jinýho než že máte
0:28:19_e ten
0:28:21originální signál
0:28:25proto máme ten chybový signál
0:28:31a na místo toho aby se ty sumy dělali globálně přes celý závit
0:28:36tak si to prostě na začátku rozdělíme na nějaké úseky
0:28:40remunu mistryně stejné parametry jako dá se o kterých jsme tady povídali jo třeba délku
0:28:45já nevím dvacet nebo pět a dvacet milisekund
0:28:47každýho toho úseku se spočítá samostatný poměr signálu k šumu
0:28:53že to byl tady bude sonaru jedna
0:28:56sem R dva a cedr a tede a tede
0:28:59a teprve na konci až budou ty logaritmický tu poměry signálu k šumu spočítaný
0:29:05tak se mi průměrového u
0:29:08a já sem vám tady to demonstraci udělal
0:29:11_e pro tu slabiku a
0:29:14která je tomhle případě rozhozená na
0:29:17na šest úseku vidíte že na začátku
0:29:22na začátku kdy jako ten signál _e byl silný
0:29:28tak dostáváme krásný hodnoty poměru signálu k šumu dvacet B devatenáct D umístěna
0:29:34ale potom bysme na konci tak je to podstatně horší je tady dokonce dostáváme zápornej
0:29:39poměr signálu com
0:29:41co znamená zápornej poměrnou sumu
0:29:47_e
0:29:48no
0:29:49je vhodné
0:29:51jo
0:29:52_e
0:29:53čitatel tady dobrej signál je větší než nula _e
0:29:58zavěšené jednička
0:30:00algoritmu _e co leží ne sítích _e nula ano pak
0:30:05jo ono mu to znamená tady ten poslední rámec byl úplně vedle a pokud tady
0:30:11tyto s průměru je se dostane se _e čísílko devět celých šedesát šest
0:30:17decibelu že teda podstatně horší ale je to reálnější hodnota
0:30:23pomocí toho globálního S N a
0:30:27tak _e tohle by prasek sem R
0:30:30no a teď mně to _e se nám bude řešit _e
0:30:34tu _e
0:30:36co nám bude řešit _e vlastně ty časové
0:30:39posuny
0:30:41my bysme si mohli říct že _e
0:30:44nebo _e eště dám pryč
0:30:47jak byste udělali _e
0:30:49dělali
0:30:50_e míru
0:30:53podobnosti mezi dvěma signály
0:30:55která vymezila a sláva
0:30:58na drobných víme řekněme komise
0:31:02ne
0:31:21a
0:31:22jo
0:31:23na _e
0:31:26a
0:31:31tu
0:31:32jo
0:31:34u zásobníku
0:31:38_e
0:31:39no
0:31:40jo
0:31:41zarovná
0:31:42_e
0:31:45po
0:31:46a V
0:31:48_e
0:31:49je
0:31:50_e
0:31:51_e
0:31:56jo
0:32:01_e
0:32:09ne
0:32:10A
0:32:14a bysme si udělali
0:32:17_e
0:32:19signálu
0:32:21_e jeho spektrum
0:32:25pomoci
0:32:26to je
0:32:28do gigový signálu
0:32:31bychom si udělali
0:32:33_e
0:32:34toho
0:32:35_e
0:32:37sedum
0:32:41ale teďka aby to nebylo citlivý na _e na právě ty časové posuvy
0:32:46s tím spektrem se dělá
0:32:53dobrý vás abyste se to by sme se dostali do to vlastně toho časového zarovnání
0:32:57sekvencí mzdu násobili nebo komplexní exponenciálu
0:33:01tak sme vlastně jako s tím spektrem trochu posouvaly nebo respektive zářily bysme na něho
0:33:06časový posun těch to udělali jednoduše abysme se na to úplně vykašlali na ty
0:33:11na ty časový posuvy
0:33:13co ve spektru vlastně nese informaci vo
0:33:16_e o poloze toho signálu čas
0:33:21amplituda fáze
0:33:23a jo jak se zbavit fáze
0:33:29vytáhli C E
0:33:31_e teda design střední hodnotu
0:33:35tady taky vzali absolutní hodnotu a tady tyhle dvě sekce to může pohodě srovnávat a
0:33:41a čase
0:33:43s můžou být narovnali je
0:33:45jak chtějí jo takže tady tohleto je podstatou
0:33:48se _e
0:33:51_e
0:33:53_e logaritmické spektrální vzdálenosti
0:33:57kdy vlastně zmrazena se možná šťastně pomocí integrálu vlastně v normovaných frekvencích integrujeme vod mínus
0:34:06jedné poloviny do plus jedné poloviny
0:34:08_e
0:34:10nějakou funkci V F
0:34:13absolutní hodnotě na druhou
0:34:15a teďka tato S může být definovaná jako _e jako deset logaritmu
0:34:23odhad spektrální hustoty výkonu toho původního signálu mínus odhad spektrální hustoty výkonu toho dekódovaným signál
0:34:30no a teď prosím vás jenom aby mám tam doplnil tu důležitou
0:34:34informaci
0:34:35tady
0:34:37_e
0:34:39ta
0:34:40spektrální hustota výkonu
0:34:42se
0:34:44je něco jako
0:34:46jako
0:34:48_e
0:34:49výstup fourierovy transformace každý vzorek na druhou
0:34:53děleno
0:34:54_e děleno počtem vzorků
0:34:57já pokud si ty počty vzorků sestavíte jsou algoritmech
0:35:01prostě tady je
0:35:02_e tady je něco děleno počtem vzorků a tady je taky něco děleno počtem vzorků
0:35:08tak se na ně můžete vykašlat protože by se vám ty počty vzorku
0:35:12navzájem _e nevře vynulovali
0:35:16jenom prosím vás _e vypadá hrozně složitě ale když budete dělat se budete dělat projekt
0:35:23tak _e
0:35:27tak tam takovouhle funkci na výpočet logaritmické spektrální vzdálenosti máte
0:35:33naimplementovanou
0:35:35running kde tady
0:35:50a to prosím vás nějakou inteligentní metodu jak teďka to otevřít textovým editoru
0:35:58prosím
0:36:01no
0:36:04tady kopíruje news
0:36:09jako pilot blox tehdy no
0:36:16_e
0:36:17tak prostě jako nemám
0:36:19příkazu A nemám říkal obrázku jenom sem případně jak je windows commander takže zle
0:36:28no
0:36:29super
0:36:32tak _e
0:36:35inovaci
0:36:36_hm
0:36:37no
0:36:38_e
0:36:39jo vám si ukázat že výpočet _e logaritmické se krát vzdálenosti core není žádná _e
0:36:45žádná složitá tragédie nemáte
0:36:48jsou
0:36:49jednoduchou
0:36:50unk tyčku
0:36:52_e tady to dokonce I dělením na rámce
0:36:56takže _e vám ukázat vnitřek
0:37:01_e
0:37:05že bez vyberu si vždycky jeden rámec toho původního signálu
0:37:09počítám s jeho
0:37:11F téčko tady vidíte převod T toho access tečka na spektrální hustotu výkonu prostě vobyčejná
0:37:18absolutní hodnota na druhou děleno _e děleno počtem vzorků a převede si to do logaritmického
0:37:25vlastnil moc deset
0:37:27jasně logaritmická spektrální se tedy
0:37:31teďka tady to samý udělám i _e i
0:37:35pro druhou
0:37:36zase převodu logaritmické oblasti
0:37:39teďka vlastně mám nachystanou _e
0:37:42když to mám nachystaný tady tyhlety dva členy
0:37:48_e
0:37:52tech mám pocit že sem tam musel řešit nějaké _e
0:37:56nějaké problémy s nekonečnými vzorky které vobčas
0:38:01jo přes nastávají
0:38:03tady
0:38:05tohleto řádkem
0:38:08_m prostě jako
0:38:09když je něco špatně
0:38:11ale _e zase něco potřebuju udělat tak je suma
0:38:16tady těhletěch
0:38:18rozdílu dvou spektrálním ste výkonu všecko na druhou
0:38:22děleno dvě stě padesáti šesti a ten jako kdo pozorně se dívala poslouchal
0:38:28se asi tuší ze ta suma
0:38:31my bude implementovat právě
0:38:34tenleten integrál
0:38:35jo prostě normálně numericky spočítaná suma
0:38:38není tam nic _e nic ani tvoříte
0:38:42no a potom přes toho udělám
0:38:44logaritmickou spektrální _e vzdálenost pro je ráme
0:38:49a tady mám někde přidávání do jakéhosi akumulátoru abych to _e abych spočítal _e celý
0:38:55řečový signál
0:38:57a to je vše
0:38:58takže _e
0:39:00takhle krásně
0:39:02počítám o rámcích
0:39:04spektrální hustotu výkonu pro celý _e celý signál
0:39:10také teď dobrý podívat na ta _e podruhé měření kvality a to sou to subjektivní
0:39:17tohleto vyžaduje abyste měli bandu posluchačů
0:39:20který samozřejmě musíte vytrénovat který musíte zaplatit
0:39:24a oni vám potom budou posuzovat jak ty kodéry ní financí sluchátka budou to porovnávat
0:39:31s nějakými jinými
0:39:34_e zřejmě bude dobrý ještě jednotlivý vzorky mají nějakým způsobem randomizovaného
0:39:40aby _e
0:39:42si neřekli no tak já budu dycky dávat čárku tomu prvnímu a jako
0:39:47tak dostanete
0:39:48první kodér který bude nejlepší
0:39:50a _e
0:39:52ty metodiky jsou tři
0:39:55první semene DIP
0:39:57když se prostě měřil měří srozumitelnost pomocí nějakých _e párů podobných slov
0:40:03který sem mé který se liší pouze v jednom jedno von enku zapsaný jít jo
0:40:09to je speciální
0:40:10tak dále
0:40:12_e pomocí D M
0:40:16se hodnotí komplexně kvalita
0:40:20pomocí několika metod přiznám se že tady tu ne technologie D M pořádně neznám a
0:40:26to je taková nejdůležitější technika se kterou se setkáte a když prostě budete mít nějaký
0:40:30pode popsaný tak tam určitě budou dávat kvalitu na stupnici mu
0:40:36tak je ze líný noty nýrsko
0:40:39máte prostě do dvanácti do čtyryašedesátic
0:40:42posluchačů
0:40:44přes tím naše budou poslouchat tak je uzel skákali budujete signály aby věděli který známky
0:40:50_e mají dál čemu
0:40:52a potom i budete přehrávat vaše testovaný kodéry a oni to budou tomu rozdávat známky
0:40:58ruské škole jo to znamená jednička
0:41:02budete nejhorší a teďka bude
0:41:04bude
0:41:08tak _e teďka samozřejmě _e by ní techniky
0:41:14jsou
0:41:15ty
0:41:16jako ty nejlepší no ale týmech chcete použít když dělat nějaký kodér ale když my
0:41:21se vyvíjeli
0:41:23a měli prostě padesát kodéru nebo padesát různých konfiguraci vyvinuli každej den tak vlastně nepříjemný
0:41:29pořádný nedržel zavřenou skupinu čtyryašedesátin posluchačů a
0:41:33_e jako platí zadávací mýdlo a tak dále
0:41:37takže byste potřebovali nějaký je automatické techniky které
0:41:41které tu subjektivní kvalitu aspoň trochu odhadnou
0:41:45tak tady tyhlety kvalit techniky taky existují
0:41:49jedná se věnuje je s cílem
0:41:52_e de vo to
0:41:54že tady tyto techniky vlastně
0:41:57se tím
0:41:59ne ty signály tečnou srovnávat
0:42:03aplikují prostě nějaké perceptuální modely které modelují naše _e naše slyšení
0:42:09jo a se nebudeme tady do detailů pokud chcete něco přečíst
0:42:14tak je to v nějakém _e volně dostupné _m
0:42:17registru a dostane se s tím míru kvality která nějak zhruba odpovídá tomu S
0:42:25tohle další systém je stylem
0:42:28teďka vlastně _e
0:42:31u mého
0:42:33mobilních sítí a P telefony a tak dále tak bylo potřeba se vyrovnat jednou věcí
0:42:39a to sou výpadky paketů a to že prostě občas dostanete tu řeč _e
0:42:43různě
0:42:44vně po posouvanou oproti _e ostrostí _e
0:42:49originálu
0:42:50takže když se
0:42:51podíváme vlastně tady sem
0:42:54sem není žádnej blok který by dokázal pracovat třeba příplatkem kanálu a
0:43:00a s výpadkem paketu a s tím že najednou prostě půl sekundy řeči není
0:43:06_e tady tohle řešíte technika T S Q
0:43:09která _e která tam přidává nějakou v identifikaci spatny intervalu a časový rovnání anglicky struska
0:43:19enlightenment nebo
0:43:21time vylíhla jmen
0:43:23tedy vlastně nám jako na sebe narovná ty části řečí který si mají _e odpovídat
0:43:29a na s tímhle na těmato čas na řeči
0:43:32se potom použít _e se potom aplikuje ten
0:43:35ten chybový model
0:43:38tak _e
0:43:40fajn nouzový sou
0:43:42umožní částí
0:43:44a teďka se poďme podívat do té první skupiny kodéru sborovny kodér warovými
0:43:49waveform klade
0:43:55tak tam úplně první technikám _e takový krásný turisti názorné pulzní kódová modulace
0:44:01zná teďka si podstatu jako někam do šedesát X N takovýdle
0:44:05kdy existoval amplitudová modulace vrstvám vlastně možná trochu nějaká fázová a teďka nějakých N šílenci
0:44:12přišli s tím že se data budu jako audio data budou přenášet digitálně
0:44:17_e museli dat nálepku S taky bude nějaká modulace
0:44:21pulzní kódová zase že se nejedná o nic jinýho než na o vzorkování a kvantování
0:44:27jo je tyhlety dvě etapy mají takový krásný historicky nám
0:44:31tak o co de
0:44:34vstupní analogový signál výstupní
0:44:37_e digitální
0:44:40když _e se
0:44:43když se
0:44:44kvantuje zase opáčko někdy z druháku
0:44:48tak vám prostě
0:44:51jako kdyby
0:44:52přímku nebo úsečku s nějakými hodnotami
0:44:56přijde tady vstupní signál N a ten _e prostě zaokrouhlen na nejvyšší kvantovací hladinu
0:45:03_e
0:45:05a
0:45:06je reprezentován signálem S N
0:45:08_e ze stříškou
0:45:11tetě těch kvantovacích hladin
0:45:15máme nějaký počestný z mého myslím že stezku
0:45:19značí jako velkýho
0:45:20a je docela inteligentní si dát tady tenhleten počet jako nějakou mocninou dvojky
0:45:27protože pokud mám potom dispozici byl bitů
0:45:30mám dvě na B tou takových _e kvantovacích hladin
0:45:34tak a
0:45:36když si _e spočítáme poměr signálu k šumu
0:45:41který tady tyhle kvantovací který tady základní kvantování obsahuje
0:45:46tak zase po nějakým odvození který sme který fires udělali zjistíme že to vlastně lineárně
0:45:52závislý na _e na _e počtu bitů že tam taková magická šestka znamená pokuď si
0:45:58dáte výsek přidat ještě decibelu _e poměru signálu k šumu
0:46:02a pak je tam ještě nějaká konstant
0:46:04jo to znamená pokud někde vidíme kvantování na
0:46:08že se na ní se seznámil s že jo nezapomene že signálu
0:46:13sumu krásný devadesát šest decibel
0:46:17tak _e
0:46:20tam který _e
0:46:22budeme si to telefonu
0:46:25znamená šestnáct bitů budu jistá na osum
0:46:31to bude dělat
0:46:37že se ta
0:46:39A
0:46:40a C
0:46:43že
0:46:45ano
0:46:47sám
0:46:48_e
0:46:50jo
0:46:50jo a
0:46:57můžete mi na _e
0:47:01bude to dobrý
0:47:04_e S
0:47:06nebo to sem
0:47:12jo tady teďka udělám novou úsečku
0:47:16tam budou chtít rozházet dvě stě padesát šest hladin
0:47:20a vy mě zkuste říct
0:47:21jak to udělat
0:47:29takže se tam _e
0:47:32kde si myslíte že se tady ten signál S N ten vstupní
0:47:36bude nejvíce pohybovat
0:47:39kdo uvidíme nejčastěji na té úsečce
0:47:43pokud _e přesně tak jo když bysme syn nakreslili nějaké statistické rozložení
0:47:51_e od napsal vstupního signálu tak to bude vypadat nějak takhle
0:47:56takže kam vrhneme nejvyšší počet hladina tím že bitů
0:48:01ok _e nuly jo přesně to znamená my uděláme tady velmi místě rose
0:48:05_e mínus T hladiny a potom to budeme dejme chytrém postupně se dělat
0:48:10a toto jestli potom proběhlo jisté záporné části tomu se nebudu umělecky
0:48:15měl C teďka jako
0:48:18zesilovat
0:48:19_e tady tohoto je jedna
0:48:22jedna motivace jo znamená řeč obsahuje mnoho malých vzorku z roku
0:48:27to konces drát odsimulovat nějakým laplaceovým
0:48:31rozložením se že něco prvku podobného _e gaussovce
0:48:35tady ten si
0:48:37_e
0:48:39tady sem si to vyzkoušel pro
0:48:42opravdické hodnoty vzorku na nějaké české větě
0:48:46na úplně mně to
0:48:48úplně mě to nevyšlo
0:48:49nevím pořádně proč možná že
0:48:52možná že sem tu černou červenou křivku ránu nějak
0:48:55takže jedna věc je že skutečně
0:48:58ty hodnoty vzorků jsou rozvrstveny více okolo nuly takže tam vadí
0:49:04za druhé
0:49:06_e že ucho má
0:49:09neslyším binárně
0:49:11ale jules verne
0:49:13je _e
0:49:17a
0:49:18o javě
0:49:20_e
0:49:21_e
0:49:24ucho slyší nějak takto
0:49:28abyste někde tady
0:49:30znamená u vám prostě ta _e tak kochá se úplně celá třese
0:49:36a eště to
0:49:38zvýšíte vinárně dvakrát
0:49:40u škoda
0:49:41jenom takový ve malý přírůstek _e ste hlasitosti co slyšíte
0:49:46to znamená že _e
0:49:48my raději budeme
0:49:51rozmisťovat hodnoty lineárně tady na této se
0:49:55eště nám potom projeví byl
0:49:57jejich nelineární rozmístění
0:50:01na se lineárního se
0:50:03jo my mimochodem M tady tohle tyhlety hrátky z logaritmickou a z binárního sou
0:50:09vidíme teďka u kódování a šest a v tomhle kurzu vidíme jednou vaše budeme bavit
0:50:13vo nějakých parametrech rozpoznávání řeči _e tam mám pocit že už sem vám něco povídali
0:50:19na té první přednášce
0:50:21i slavné mel frekvenční cepstrální _e koeficienty této nebo na první nás sme měli někdy
0:50:27předminule že
0:50:29M S C jo tak tam se používá úplně stejná finta vlastně ho nakreslili jsme
0:50:33si nějakou jiná se _e logaritmickou křivku tehdy to byla závislost _e
0:50:41frekvence
0:50:42_m
0:50:43a dostali jsme jako modifikovanou frekvenci
0:50:46tentokrát to nebudou žádný frekvence
0:50:49ale bude to vlastně amplituda
0:50:51a nějaká modifikovaná amplituda
0:50:55tak _e
0:50:57to znamená závěs toho je ten
0:50:59že budu sítí
0:51:01udělat logaritmický kvantování
0:51:04a může to před realizovat takovýmhle schématem kdy vlastně budu mít vstupní signál na
0:51:10a budu mít nějakou kompresní funkci
0:51:15rámy bude produkovat nějaký prostě zkomprimovaný signál nelineárně _m
0:51:21ten pro ženu
0:51:22mlynářům vopichy
0:51:27no
0:51:29u
0:51:31u
0:51:32a
0:51:35sám
0:51:35jo
0:51:36prostoru výsledek
0:51:38na todleto jako teoreticky
0:51:41teďka mě zkuste říct jak _e
0:51:44nebo ne eště něco ne zkuste říct jestli vám K _e dva systémy které se
0:51:49které se používají
0:51:51v evropě se používá takzvané nejelo nebo
0:51:54a _e
0:51:56tak on
0:51:57a _e ve státech minulo
0:52:01annie bacha veličinu říkají míru
0:52:05E s linku
0:52:07_e které vlastně
0:52:09tam je tam jenom nějaký drobný rozdíl jestli se logaritmu je celá závorka čitateli nebo
0:52:14jenom kus závorky v čitateli
0:52:17a když se podíváte na dvě křivky které odpovídají jelo a miloval takhle jsou skoro
0:52:24stejné
0:52:25jenom když uděláte zoom někde okolo nuly který těch nejmenších hodnot
0:52:30je ta míru křivka trošku strmější
0:52:34_e na její loje trošku plošina bych řek že
0:52:39_e prostě klasický konkurenční boj mezi evropou ameriko projevuje
0:52:44mealy jo
0:52:46dalo nech
0:52:48s litrech podobných jednotkách
0:52:50mimochodem _e
0:52:52v jiném posunutí
0:52:54letního času
0:52:55ve státech majoritní často šímův neděle
0:52:58a vona cache někdy taky ne nebo zrna za dva takže teďka jestli třeba _e
0:53:03domluvit nějaký telekonference kolegama ve státech úplně výborný
0:53:09jako jsou oba dva na stejný čas explicitně zvykli pak že posun mezi českém a
0:53:15jakým je takový a kalifornie makový a teďka to jinak
0:53:21tak _e jenom prostě abyste věděli jak nám to zhruba pomáha
0:53:27pokud _e uděláme na osmi bitech
0:53:32tady takovýhle nelineární kvantování
0:53:36a měli bychom tu kvalitu jako S N R na opravdický řečový signálech
0:53:42tak _e
0:53:44tak _e se dostaneme
0:53:47někde na _e někde na dvanáct bitů
0:53:51nebo na podobnou kvalitu jako měli D jako by
0:53:58měl přenos na třináctý bitech vinárně
0:54:05teď sem vlastním toho jsem se basilika
0:54:08_e
0:54:09se tady
0:54:10ty komprese a expanze
0:54:12dělají pokud potřebujete reálně kódovat
0:54:17je
0:54:17přichází signál to no
0:54:20tady je normálně na šestnácti bitech vinárně a vy máte
0:54:25logaritmický zakódovat na
0:54:28na osum bitů
0:54:34schválně
0:54:35slyšíte se to dělá
0:54:40kdo si myslí
0:54:43že
0:54:44se tam provádí taková komplexní funkce
0:54:47a potom lineární kvantování
0:54:51jo
0:54:55do si myslí že se tam aplikuje ten vzorek
0:54:59rád všichni takže se nedělám jednání shellech zranila
0:55:07tak _e uvědomme si že _e
0:55:11indexování pamětí
0:55:13je mnohem levnější operace
0:55:16počítání nějaký
0:55:17v logaritmu
0:55:18to znamená zase to skutečně dělá věku flintou
0:55:22že nám přijde
0:55:24informace na šestnácti byte
0:55:28jo teďka tady někde znaménko
0:55:31dva bity se toho rovnou odstřihnou
0:55:35znaménko ze toho taky rozstřihne
0:55:38a zůstane nám _e dvanáct bitů
0:55:40takže se udělá normálně čtyřky rovná lookup table
0:55:45jo
0:55:47čtyřkolová tabulka
0:55:52a těch _e dvanáct bliknu nám poslouží jako adresa tady téhleté tabulce
0:55:57pak se toho prostě vezme hodnota přidá se k ní znaménko
0:56:04a
0:56:05máme se osum bitů který posíláme dál jo takže prostě jeden
0:56:10_e nebo nějaký dvě bitový operace
0:56:13a jeden pohled
0:56:14do tabulky
0:56:16a když pro score dáváme
0:56:19máte máme těch osum bytí ku _e se znamínkem
0:56:23tak to znamínko zase v odstřihneme této ještě jednodušší protože se podíváme do sto dvaceti
0:56:27sedmi
0:56:29_e
0:56:30nebo sto dvaceti osmi
0:56:33_e políčko ve tabulky
0:56:36na indexem nám to hodnotu
0:56:39přidáme znamínko a hotovo ven vyjíždí šestnáct bitů
0:56:43já jenom když se budete dva za schématu nějakýho opravdický ho kodéru
0:56:48a uvidíte tam nějaký hlavičkový soubor tečka _e a tam bude v jedné tabulce čtyry
0:56:53tisíce devadesát šest čísel a ve druhé tabulce sto dvacet osum čísel
0:56:57tak se není se ze prostě trans kódování mezi binární a _e z i binárním
0:57:03a logaritmický
0:57:05protože vy si mezi kodéru
0:57:07potřebuje vzdělaná tak prověrka zahrádky _e
0:57:11vlastně
0:57:12logaritmické to nová
0:57:16tak
0:57:17to bylo ten úplný základ
0:57:20tech _e
0:57:22_m druhá taková technika
0:57:24které se říkala T C N
0:57:27adaptivní pulsní kódová modulace
0:57:30_e jde vlastně o to že bychom se to chtěli dostat se do větší dynamiky
0:57:35nebo mít lepší rozlišení ne šestimístnými pánvi díky
0:57:39a zároveň bychom nechtěli
0:57:41_e nechtěli prostě příliš zvětšovat
0:57:45bitový to
0:57:46to znamená
0:57:48u ze a
0:57:50S T M
0:57:51bychom chtěli nějak dívat dynamickou co má jako
0:57:55pro slabou řeč
0:57:57rozhodně si nějaké malé byzantského rozsahu prosím nouze si rozhodně
0:58:02_e za velkého dynamického rozsahu
0:58:05ale i tady tohle když si dělat něco stojí jo takže _e tu informaci o
0:58:10dynamice
0:58:12musím nějakým způsobem přidat můžete tam přidat dvěma způsoby unk takzvaně C forme kdy řeknu
0:58:19tady prostě kódu nějakou řeč
0:58:24rozdělím si třeba na nějakém taky
0:58:29a
0:58:31tady dejme tomu jako přídavnou informaci
0:58:35bych _e přenášel
0:58:37maximální výchylku
0:58:40kterou bych tak nepovalil do _e do dekodéru
0:58:44a ten kodér by si potom nastavoval se kvantovací hladiny třeba o
0:58:49plus do mínus
0:58:51téhleté maximální výchylky
0:58:53jo
0:58:54takže takle byste to mohli udělat
0:58:56pokud tu přídavnou informaci pošlete jako extra tak se to menuje takzvaně C format ale
0:59:02samozřejmě vám to potom zabírá nějaké bity musíte tu informaci do dekodéru dostat
0:59:09_e nebo
0:59:11můžete udělat je jinak
0:59:13můžeme počítat
0:59:16tu _e informaci o dynamice
0:59:20z minulých vzorku
0:59:22jo můžeme to dělat tak že když _e
0:59:27že mi to udělat tak že když prostě kvantujeme
0:59:32tady takový signál
0:59:34který má pořád velké hodnoty
0:59:37jsme někde tady
0:59:38tak prostě tu dynamiku nebudeme
0:59:41mění protože dosahujeme pořád nějakých vysokých
0:59:45vysokých hodnot
0:59:46a pak najednou se dostanete tady do této oblasti
0:59:49kdy vlastně _e tam budou pořád velmi malé hodnoty kvantovány
0:59:55takže můžete na základě informace z minulých pár vzorků říct
0:59:59ne nemá cenu abych tady používal pořád jenom jako _e dvě nebo tři hodnoty asi
1:00:05prostě stanu dynamiku
1:00:07a budu to _e a budu na tento interval používat všechny
1:00:13všechny bity které má k dispozici
1:00:16jo v tomhle případě se mluvilo takzvaném feedback
1:00:20a _e ten dekodér vlastně si tu informaci o dynamice nebo ginu počítá úplně těch
1:00:27samých vzorku které má k dispozici kodek
1:00:30tak
1:00:31to je taková technika která základní samostatní ve více
1:00:35ale občas _e trestní setkáme jako komponentem nějakých složitějších kódovací schéma třeba že forejt _e
1:00:42je sem
1:00:44tedy _m
1:00:45možná zjistíme se stínů promluvit
1:00:48tak tam je to vlastně jako jedna technik
1:00:51pro kódování buzení
1:00:54takže todle a prosím
1:00:56a nativních mít _e
1:00:59tak teďka tady bude
1:01:00další varianta sem _e to je dobře ten
1:01:07když si uvědomíte sedělo s těmi
1:01:10těch minulých vo technika
1:01:12tak tam vlastně ty jednotlivé vzorky se opravdu zpracovávali naprosto samostatně
1:01:18tohle běžných signálek který budete poslouchat neplatí tam prostě _e nebo nevlastní samozřejmě mě funguje
1:01:25ale můžeme to udělat trošku chytřeji
1:01:28protože _e
1:01:31běžný signálech tohoto světa jsou mezi vzorky vždycky závislost
1:01:37a ty závislostní můžeme namodelovat nějakým predikčním filtrem optimistou spoustu víte že jo
1:01:43přednášku o
1:01:44vo P se
1:01:46který bude několika minulých vzorků
1:01:50předpovídat hodnotu toho současného vzorku
1:01:54a kódování vy si můžete i tak fajn
1:01:58já nebudu posílat
1:02:00to sou absolutní hodnotu nějakého vzorku a pošlu jenom
1:02:04to chybu
1:02:06kterou _e vlastně
1:02:09reklamy něco předpověděl říkám opravdickou hodnot současně
1:02:12u tak jakous poslu jenom tady ten kousíček
1:02:16kterými chybí _e výrobě o dnešního
1:02:19a tady to je podstata dete sem
1:02:22se podívat jak se to
1:02:24_e jak bychom to udělali technicky
1:02:27měli bysme zase nějaký _e prediktor nebo odhadovat
1:02:33které _e ze kterých by
1:02:35neměl
1:02:37_e neměl by vlastně pozici pro
1:02:41nultej
1:02:43nebo pro současný vzorek
1:02:45a je vždy jenom vo
1:02:46o jedna zpožděného vzorku a
1:02:49poté zpožděného vzorku
1:02:51tady ten filtr _e bez vám bude _e odhadovat ten současný vzorek
1:02:57jo teďka se současný vzorek prostě
1:03:01skutečně dostaneme přijde tam
1:03:03mezitím skutečným současným a odhadnutým současným se udělá chyba
1:03:09a jenom tady tahleta chyba se pošle dál do toho _e
1:03:14přenosový rovná
1:03:18tak _e jako pojem zavést _e
1:03:21že
1:03:22pokud ten vektor bude fungovat slušně
1:03:25tak tady ten chybový signál bude mít _e podstatně menší hodnoty ještě marginální a budu
1:03:32není
1:03:33potřebovat nyní bitů
1:03:37a _e jestli třeba podívat trošku detailněji
1:03:41na to jak to funguje
1:03:46když se potom budu chtít udělat dekodér
1:03:50tak já vlastně budu mít ten chybový signál
1:03:54který bude jako jediný přicházet do dekodéru
1:03:59tady je ten chybový signál se bude přidávat odhadnuté mu
1:04:05současnému vzorku
1:04:08a s toho bude
1:04:10ucházet
1:04:12ten _e výstupní řečový signál
1:04:15a samozřejmě jako jak teda dostaneme ten odhadnout Í no roztaveného takže se tady napíchneme
1:04:21na výstupní řečový signál tady prostě bude _e
1:04:26když i tady
1:04:28toto schéma
1:04:29prosklené rozkreslím _e definuje zpoždění vo jeden vzorek
1:04:33o druhej vzorek a tak dále
1:04:35a tak dále
1:04:36a tady se prostě
1:04:38pomocí filtru
1:04:40prediktoru
1:04:41budou normálně
1:04:43_e normálně odhadovat
1:04:47N _e ten současný vzorek
1:04:50přídavky protože vlastně ta si korekce pro nás
1:04:53počítá se výstup o to
1:04:56tak
1:04:57S je _e jakým _e tady tohoto schéma
1:05:03je tím a tady toto schéma problém
1:05:06prosím
1:05:08se podívám jenom na schemátku
1:05:10ho nette sem kodéru
1:05:13a detekce
1:05:15dekodéru
1:05:20tam chybí jedna B správě
1:05:23bych to udělal jenom takhle
1:05:30_e
1:05:33on nějak já
1:05:35jo
1:05:41že a je
1:05:43_e napočítal
1:05:48_e na hlavě a tak tomu
1:05:51jako
1:05:56_e jde o to že _e no _e nakreslil
1:06:01tak _e
1:06:02vlastně
1:06:04tomto schemátku
1:06:06pořád
1:06:07musí vám
1:06:09na stejný na stejné bitové šířce druhý signál
1:06:14tady vo přijímám a vůbec vlastně sem jako nějak ne omezil bitový tok nic jsem
1:06:19neudělal na umření bitové rychlosti
1:06:22takže co já budu muset udělat je
1:06:25úpravy
1:06:26procesy k tomu
1:06:28_e chybovému signálu nějaký další
1:06:31řekněme kvantizéru řekněme tomu omezovač počtu bitů jak chcete
1:06:35je prostě zařídí to sem _e ten kodér dělá to znamená omezené počet bitů oproti
1:06:40originálu oproti té _e toto mně vlastně šlo
1:06:44jo tady máme dejme tomu tenleten signál na osmi bitech
1:06:47a já bych chtěl aby tady tento signál tady
1:06:51_e valil na on čtyřech bitech
1:06:54no a teďka mě
1:06:56že mě řekněte když
1:06:58toto schémátko takhle pěkně vyrobím
1:07:02si tam někde nějaký
1:07:04problém
1:07:08a ten problém se prosím kde jste
1:07:12dekodér
1:07:30pro problém je
1:07:34_e myslím že vím kam míříte problém je vtom že _e takovémto idealistickém schemátku které
1:07:40jsem tady měl před tím
1:07:43sem prostě ten _e signál
1:07:49odhadoval přesně ze vstupní vzorku
1:07:52jo
1:07:54teďka sem tam neměl nikde žádnou ztrátu kvality
1:07:57toho výstupu level naprosto přesně stejný signál jako se měl na vstupu
1:08:02takže i tady tento signál ten odhadnout Í ten _e jedničkou N do úplně přesný
1:08:08jako nejsem přesně stejně to nejsem
1:08:12tom schématu kdy už začínám kvantovat
1:08:15u že zlezl _e masíčko protože _e ty signály se kterými pracuju
1:08:20tady
1:08:22a tady
1:08:24nejsou přesně stejné sem říkal že jako někde uprostřed budu chtít omezit informaci dejme tomu
1:08:29s osmi bitů a čtyři
1:08:32a
1:08:33to že _e budu mít tady ten chybový signál trošku jiný
1:08:37to by mě eště ani tak moc nebo nevadilo
1:08:40ale já budu mít prosím vás tady tento signál který se nebude rovna
1:08:45tomu vstupnímu
1:08:47to znamená že ani odhadnutých signál
1:08:50ani tady tendle
1:08:52se nebude rovna tom odhadnuté mu
1:08:55tedy se měl kodér a to už může být docela problém protože já vlastně pomocí
1:09:00nějaké ještě jako trošku _e na kvantované a vznešené chyby
1:09:06opravuji nějaký signál vo kterým si nejsem vůbec jistý že to je ten samý který
1:09:10sem viděl kodér
1:09:12tak
1:09:14zkuste poradit
1:09:16_e s tím
1:09:20_m
1:09:22možná že jo vyvazuju
1:09:24složitý a sáhovi tomu bitů
1:09:31zaměřte se tady na ten na tenhleten odhad na
1:09:34ten je dělaný prostě _e ze vstupních
1:09:37čistých perfektní vzor
1:09:41přesně tak já tomu říkám odborný je v praxi
1:09:44prostě _e
1:09:46tady je potřeba to odpojit odstupu
1:09:50a použít k odhadu
1:09:52tohoto
1:09:54_e signálu
1:09:57to co dostanu dekodéru jo to znamená to co mi projede tady touhletou jako sekvencí
1:10:03_e kvanty ze
1:10:04kde kvanty ze tak tady odtud s tohoto vzorku musím vyrábět _e musím vyrábět ten
1:10:11odhadovali signál to znamená jinými slovy zachycují stenografku musím říct ale klade
1:10:17vestavěného do
1:10:19ne myslím výsledek ode vestavěného do kodéru
1:10:24a teprve výstupu
1:10:26jo dekodéru
1:10:29dělat jakýkoliv odhad abych si byl úplně jistý
1:10:33že ten odhad bude stejný do ronerovi řekne tak představám tyto zahlazen obrázku ten
1:10:40nazveme mnohem E jasnější jo
1:10:43tak _e dívejte
1:10:46_e vlastně
1:10:47který schémátko kde sem vám říkal že sem ten _e sem ten odhadovat odpojil tady
1:10:53o vstup
1:10:55_e zatím prostě předpokládejme že tady je nějaký odhad jo zatím nebudeme povídat vo tom
1:11:01jak se ten odhad vyrábí
1:11:03a _m tady vstupní vzorek odhad
1:11:06to je udělanej chybový signál jo teďka ten chybový signál protože no want jezerem
1:11:13de kvantizéru M
1:11:15jen tak mimochodem tady tento výstup _e vezmu a pošlu valil přenosový ho kanálu
1:11:22a pořád sem ještě kodéru
1:11:25když já vlastně toho chybovým signálu
1:11:28si
1:11:29poskládám
1:11:32pátky
1:11:34ten jako kdyby výstupní
1:11:36signál
1:11:37jo takže tady
1:11:39po červený kolečko to je vlastně výstupní signál který uslyším na výstupu dekodéru ale a
1:11:45ho kdy jako kdyby v uvozovkách slyším teďka u Š kodéru
1:11:51a tohodle
1:11:53ví úplně ale ty make výstupního signálu
1:11:57při udělám teprve odhad
1:12:00to současnýho vzorku jo takže ve výsledku děsnou na to si kdy tady prostě S
1:12:05z _e ty vedou a eště stříškou
1:12:09jedna znamená odhad a stříška znamená jako _e
1:12:12dekodéru
1:12:15jo a
1:12:17toto je pro mě ona současnýho velkou a teprve ten zavedu tady do té odčítačky
1:12:23abych z něho dostal chybový signál
1:12:26tak a teďka prosím vás když se na toto schéma _e
1:12:30podíváte
1:12:32tak jak by se to dalo zjednoduší
1:12:35a vám tady schválně forma žlutej
1:12:37to je ten zmatek
1:12:41_e to ale jako
1:12:44je tam dvakrát že jo
1:12:45že zdroje to stejný signál
1:12:47a je to úplně stejný to znamená tomletom bodě
1:12:51a v tomhle tom bodě
1:12:53dostávám naprosto ty samý signál by bylo jednodušší prostě to ale udělat jenom jednou a
1:12:58prostě tam rozvoj teda kterej vede sázet že jo
1:13:02takže _e když tady toto operaci uděláte
1:13:05tak vypadá takhle
1:13:07co šije kodér trade běžně implementuje
1:13:11ale já právě prosperující důvodu sít vopravdu
1:13:15krok za krokem protože když se podíváte na ten dekodér tak prostě
1:13:19já se přiznám jako _e se nevyznám konstantě že to prostě moc kompaktní
1:13:25je to optimalizovány ale já tam nevidím ty jednotlivý operace když si uvědomíte exode krok
1:13:31za krokem
1:13:32tak se v tom dokážete vyznat a pak si tady tohoto silnou můžete překreslit
1:13:37do toho tragickýho který se V F S M skutečně
1:13:44takže tady tohle se _e opravdický jde potom a kodér
1:13:48a _e taková kombinace tady tyhlety dvou metod je
1:13:52_e norma
1:13:54_e D S T M adaptivní diferenční pulsní kódová modulace
1:14:01_e podle té staříč ke normy G sedum set dvacet jedna a nebo je potom
1:14:07chtějí varianta která sme
1:14:09je sedum set dvacet šest
1:14:11za sedum set dvacet jednička má _e vlastně ze šedesáti čtyř
1:14:16_e kilobitů nám to stahuje pouze na třicet dva
1:14:22_e G sedum set dvacet šest
1:14:24máte s ním čtyři bitový rychlosti
1:14:27třicet dva dvacet čtyři
1:14:31šestnáct a potom
1:14:33eště nějakou nižší spirále musím nějak moc S moc nedá poslu
1:14:39_e to _m a detektorem kodéru důležitý je
1:14:43že tam máme vlastně _e z výčet _e do části
1:14:48je diferenční
1:14:49podobných schéma jak sme tady viděli na tom školním
1:14:53příkladu to znamená kodér obsahuje kvantizéru i bych matice
1:14:58tudy dál _e není tam jenom jeden filtr a jsou tam dva
1:15:03detaily nebudu povídat a pak je tam ještě _e bylo
1:15:07který vlastně nám _e řídí kvantizační krok _e na základě
1:15:13základě současnýho a minulých
1:15:16z roku
1:15:17jo to znamená tady ta norma _e a detekce
1:15:21pracuje tím systémem feedback
1:15:23to znamená nepouští tam žádnou přídavnou informaci ale počítá cizinců počítá si nastavení toho kvantizačního
1:15:30kroku
1:15:31současnýho a z minulých vzor
1:15:35mimochodem tady ty normy kde sem se dvacet jedna je sedm set dvacet šest
1:15:39_e jsou vlastně ty který
1:15:42nám přináší řeč po pevných linka
1:15:46tak
1:15:47to sou nějaký
1:15:49k informace
1:15:51suma odpověď
1:15:53tak _e
1:15:55teď sme hotoví sladováním tvaru vlny
1:15:58poďme se podívat vokodérech
1:16:04tak _e jsem povídal vlastně využívá informace o tom
1:16:08že člověk budí
1:16:10a potom
1:16:11modifikuje
1:16:13takže podobný schéma buzení filtr uvidíme
1:16:16_e víme i zde pokud E
1:16:19_e proč voko de
1:16:21co myslíte to znamená slovo samozřejmě to jako de
1:16:25sanitního bloku
1:16:33něco takovýho boj code vlastně hlasu hlasový
1:16:37to de jo
1:16:39tak _e
1:16:41my se podívat na obchode který je založený na minimálně si nyní modelu
1:16:47na L P se
1:16:49já a variace mám tady vlastním povídali o tom
1:16:53že _e
1:16:55řeč dokážeme namodelovat tak
1:16:57co uděláme nějaký budící signál nějaký _e N
1:17:02ten pošleme no
1:17:04filtru jedna lomeno A Z
1:17:09a s toho filtru papoušku jde něco
1:17:12tady se podobnýho řeči
1:17:16a eště by bylo dobrý fungujícímu signál jsem prostě přidat knoflík volume
1:17:23_e který říká
1:17:25jak to celý bude silný a
1:17:27_m knoflík volume můžete dat buď na vstup toho predikčního filtru
1:17:31nebo na výstup této je celkem jedno jedna se prostě o násobení konstant
1:17:37jenom prosím vás uvědomte
1:17:39a účtu taky ste dělali nebo budete dělat v laboratoři a budete z dělat na
1:17:43projekt
1:17:45že _e parametry
1:17:47tady toho filtru se budu muset měnit
1:17:51těch typických kodérech je to padesát krát za vteřinu jo na dvaceti milisekundový tam C
1:17:58_e
1:18:00jak to schéma takovýho vokodérů základního vypadá
1:18:05mám prostě vstupní signál
1:18:07musím z něho vydolovat pár informací
1:18:11musím z něho vydolovat informace o tom jak budou vypadat koeficienty tady toho
1:18:15dnešního _e filtru
1:18:18o tom tady byla celá přednáška prostě _e počítat autokorelační koeficienty
1:18:24pak se vyřeší nějaká soustava rovnic buď
1:18:27buď hrubou silou a nebo pomocí nevyzná darina
1:18:31_e jako
1:18:34další produkt vám tady to počítání dá gain
1:18:40další co potřebujete určit tak je _e také z něho
1:18:45a potřebujete eště _e informaci o
1:18:50periodě anebo kmitočtu základní tón
1:18:53a ve stejné zdroje ty čtyři věci potřebujete
1:18:56také nějakým způsobem můžete
1:18:58za kvantovat jak to de udělat funkce
1:19:02brzo dostaneme
1:19:04předesílám se to bude pomocí vektorové kvantizace
1:19:07tady tyhlety prostě projedou
1:19:10přenosovým kanálem
1:19:12na konci rozparsujete
1:19:14a teď co s nimi dál
1:19:18_e
1:19:20to jestli se jedná o smělou řeč
1:19:24vám bude ovládat takový krásný přepínač
1:19:28a ten bude přepínat mezi _e generátorem periodických impulzu
1:19:34todle bude případě znělý o buzení
1:19:37a nebo generátorem šum
1:19:40o tom
1:19:41budeme mít gain
1:19:43což bude tady ten
1:19:45trojúhelník volume prostě násobení konstantou
1:19:49a konečně _e koeficientama filtru a Í musíte nakrmit
1:19:54ten _e
1:19:56sníme syntetizační
1:19:58filtr
1:19:59a pokud všechno uděláte dobře tak na konci bude relativně srozumitelná řeč
1:20:08tak _e
1:20:10tady tohle implementuje ten známý
1:20:14americký je vypláchnutí ten standard S xpath na
1:20:20schválně
1:20:21teďka nebudu dívat a zkuste se podívat kdy to bylo normovaná myslím mluví tak ke
1:20:25konci sedmdesátých let
1:20:27filtr potřebuje os na
1:20:30se bitů za sekundu buzení přes N bitů za sekundu celkem nejsme na dvou celých
1:20:35čtyřech
1:20:36a _e hlavním problémem
1:20:40je tohodle vo kodéru bylo modelování buzení
1:20:44které vedlo k nepřirozené řeči
1:20:48stejně se podíváte na schéma list nebo proč izolování není tak špatný vektoru
1:20:55aby tam nulový na
1:21:03_e
1:21:04jak pro
1:21:06_e
1:21:07to display
1:21:09jsou vlastně jaksi na jo
1:21:12když _e
1:21:13když _e
1:21:16mluvíme a třeba _e F
1:21:20ze téma mohlo fungovat doprava osum
1:21:24použití do toho
1:21:26vlastního
1:21:27ale
1:21:31vlastně obcích některé ty buzení
1:21:35vaše _e
1:21:37_e
1:21:38to je poplachové dvě
1:21:40_e rozhraní na S T
1:21:43_e asi C když prvkových R T
1:21:47stěhovat _e kdo pořád
1:21:49jo odhaleno prostě takový server
1:21:53okay počítačům
1:21:55že
1:21:56i marka mávnutí
1:21:57pustíme vznikají turbulence
1:22:00tohle jenou jinou ignoruje znamená na _e rovnou Y
1:22:05jasně
1:22:06osum
1:22:07někde
1:22:09_e prvku namítat
1:22:11tady tohle právě jako seděla
1:22:13a to docela sofistikovaně
1:22:16i moderní
1:22:18nebo moderní s v uvozovkách úterky v osmdesátých let
1:22:25tím
1:22:26_e
1:22:28_e
1:22:29kodérech pro mobilní telefon
1:22:32tak je
1:22:34poďme ještě de facto dostaneme si popovídat po technice _e real viděl se netradiční
1:22:43_e
1:22:44tady se nám vlastně jedná o to
1:22:47že sem
1:22:49úplně _e úplně zjednodušil modelování buzení jo řekl jsem bude tady jenom informace o znělosti
1:22:58jenom informace o základním tónu
1:23:00a ten budící signál který _e který uvidím někde tady
1:23:05_e stě buď bude vypadat takhle
1:23:09a nebo bude vypadat jako bílý šum
1:23:13nic nevidím
1:23:15může a tady taky z druhé strany může si říct no tak _e
1:23:19počkej jako
1:23:21když si dělal
1:23:22tady to rotace analýzu
1:23:25tak by se překonalo udělat to co sme si tady předváděli
1:23:28přednášce vo _e o L pece to znamená vzít vstupní řeč
1:23:35S N
1:23:36pro hnací filtrem
1:23:38_e ze jo
1:23:40dostat _e
1:23:42ten chybový signál E N
1:23:45teďka tady tenhle vyslovil klidně třený
1:23:49o toho dekodéru pro ženeš
1:23:52_e filtrem jedna lomeno A Z
1:23:56a tady na konci dostaneš úplně perfektní
1:23:59úplně perfektní _e dekódovanou řeč
1:24:02jo tak tady tohleto je možný akorát millikanem uspořil i ani bytí k protože potřebujeme
1:24:08přednášet chybový signál potřebujeme přenášet parametry filtru a
1:24:14navíc sme si ještě možná
1:24:16nějaký bity přidali
1:24:19takže toto nebylo kodér který by spořil bity ale přidával
1:24:24nebylo dobrý
1:24:26tak poďme se na to podívat ještě trochu užší trochu detailně
1:24:30na _e na tenhleten R L
1:24:35a
1:24:37_e intel tady nemám
1:24:39ne takto k tomu se dostaneme ještě dál
1:24:42tak prakticky to co sem chtěl říct tady na ten na tom na tom skleníku
1:24:45sem vám to vykládal jo prostě problém
1:24:49že byl ten aby ty koeficienty filtru ani chybový signál nebyly nějak dál zpracovávány kvantovány
1:24:56tak byste si přidali bit
1:24:58takže teďka poďme si chvilku povídat o tom
1:25:01jak se bude dál _e dál zpracovávat nebo kontrolu
1:25:06vektorově
1:25:09jo
1:25:10_e protože
1:25:13my vlastně
1:25:15dostaneme i nějaký balík informace třeba deset koeficientů predikčního filtru
1:25:21a teď samozřejmě jako bychom se na to mohli dívat jako po jednotlivých čísílka
1:25:25ale tak bychom vždycky dostali jako sup optimální výsledek kdyby buď kvalita bylo horší ano
1:25:32počet withdraw
1:25:34znamená _e my si tady povíme něco o vektorovém
1:25:38kvantování
1:25:40jak to vektorové kvantování funguje opravdu mi říkejte pokud bych jako tomu natahoval
1:25:47místo někde slyšeli máme tady prostě prostor nějakých dat
1:25:52jo to budu ukazovat ve dvou dimenzích
1:25:55no tady tohleto je parametry X jedna tohleto je parametr X dva
1:26:00a teďka když ty _e jednotlivé dimenze konturu nezávisle
1:26:05tak prostě _e a na každé dimenzi mám když k dispozici určitý počet bitů v
1:26:10tomhle případě třeba dva
1:26:12tak prostě tady si určím čtyři možný hodnoty
1:26:16tady si určím taky čtyři možný hodnoty
1:26:19a tetě
1:26:20vlastně _e hodnoty
1:26:23těch parametrů
1:26:25nebo těch vektoru který jsem schopen pomocí těchto kombinací dostat
1:26:29jsou prostě tady voznačený těma _e ty má černýma unk sítama
1:26:34protože když mám takový nějaký zrůda
1:26:37vypadá takhle tak vidíte že
1:26:40prostě jsou tam hodnoty
1:26:41to jsou tam úplně na houby
1:26:43tedy prakticky nikdy
1:26:45ty kvantování žádné hodnoty nepoužiju
1:26:49takže to by bylo asi _e lepší
1:26:53to udělat trošku inteligentními a říct vlastně nechat ty data
1:26:57kasta data se
1:26:59ať i _e aby si ty typické hodnoty
1:27:04vymyslela sama
1:27:06a pomocí tady tyhlety natrénovaných hodnot potom kvantovat
1:27:11vidíte že když _e
1:27:12jsem se o to pokusil
1:27:15se mi ty takzvané kódové vektory
1:27:18vhodili úplně jinak než na pravidelné mřížce _e čtyři krát čtyři a už se nám
1:27:23jako pohledu zjistíte že ta data prostě vyskytujou _e
1:27:27
1:27:29takže tady todleto je
1:27:30vy si tam vektorově kvantizace je to
1:27:33že vlastně se nedívám nezávisle na dva nebo N různých komponentu toho vektoru
1:27:40a že ten vektor beru jako jednu hodnotu která se zcela
1:27:44_e nezávisle
1:27:47ones je
1:27:48tak _e poďme nějakou terminologii
1:27:52když mám teda jako ten prostor parametrů
1:27:55tak _e
1:27:57tam mám nějaké regiony
1:28:00které se budu věnovat voronoiovy
1:28:04_e ty regiony jsou reprezentovány
1:28:08musím předem v říkat ten zdroj
1:28:11a každý ten _e region taky musí mít vlastní jednu výstupní hodnotu kterou potom při
1:28:16dekódování S ano takový to server _e
1:28:22hodně časovej ta výstupní hodnota
1:28:24ten tak zvaný kódový vektor je právě položený ve prostředku toho region to znamená tom
1:28:31jeho _e centroidu
1:28:35tak je teďka
1:28:37něco trénování
1:28:41_e rim začínáme to matematikou takže si
1:28:46_e řekneme vlastně co máme k dispozici
1:28:49máme k dispozici
1:28:51budu vám to že sou kreslit ve dvourozměrném prostoru
1:28:55tohleto je složka X jedna s dneska X dva
1:28:59a já mám k dispozici prostě mráz dat
1:29:02každá tečka
1:29:04reprezentuje jeden trénovací vektor
1:29:08_e
1:29:10mám k dispozici natrénovat
1:29:12kódovou knihu
1:29:14o velikosti o velikosti call
1:29:17pro mě třeba to K budou čtyři
1:29:21první věc je jak souborovou nainicializovat to jako je
1:29:25celkem věda
1:29:26za chvilku si potom popovídáme vít teďka předpokládejme že se mi to povinné nějak takhle
1:29:33tady toto jsou čtyři kódové vektory
1:29:36když sempra vizitka nainicializovat
1:29:39a teď že _e
1:29:43první fází
1:29:45toho trénování
1:29:47je vlastně za kvantovat nebo příznaky
1:29:51jednotlivé trénovací vektory
1:29:53nemyslím kódovými
1:29:56na to jako zní hrozně jednoduše
1:29:58protože bych prostě jako řekl no tak to je přece jasný nette nikoho udělám
1:30:04takhle čáru takhle Č takhle čáru
1:30:07tyto _e tyto všechny budou patřit sem si to budou patřit sem a tak dále
1:30:12a tak dále
1:30:13ale _e já bych teďka chtěl aby se mi řekli jak to jak to spočítat
1:30:18kdybyste tohleto algoritmizovat
1:30:21takže to člověk dokáže udělat prokazuje
1:30:28_m no dobře ale tučně říkat jako highlevel se to je jasný jak rasterizačního _e
1:30:33to tak D ale jak to bude probíhat
1:30:35jo představte si že prostě jedu po jednotlivých datových vektor T
1:30:39a teďka sem tady téhleté modré tečky
1:30:42a vám říct
1:30:43a se rozhodnout ke kterýmu kódovým o vektoru ta modrá tečka bude ta
1:30:50přesně tak jo musím prostě spočítat vzdálenosti je všem čtyřem kódovým vektorům op
1:30:57no
1:30:58jo
1:30:59vy první co nejmenší což by byla _e tady je houby vidět ale asi
1:31:04asi tady tato
1:31:06a řekl by
1:31:07ano tady tato modrá tečka bude patřit tomuto
1:31:12kódovém
1:31:13vektoru jo to tady mám zapsaný taktu
1:31:16takovou složitou funkcí jako že kvantovaná hodnota _e vektoru _e vektorový
1:31:24bude
1:31:26příslušný
1:31:27kódový vektor pokud platí že vzdáleností k sou k tomuto kódovaném _e k tomuto vzorovému
1:31:33vektoru je menší než vše vzdálenost X u ke všem ostatním torovi vektoru
1:31:40teďka samozřejmě si tady můžeme půl hodiny a toto jako jakou vzdálenost _e použijeme
1:31:47to bude ve dvě de ještě docela pochopitelný ze vlastně normálně vymazáno
1:31:53pokusme v nějakém
1:31:55více rozměrnějším prostoru
1:31:57tak se pořád pohody používá euklidova vzdálenost
1:32:00znamená bereme rozdíly jednotlivých složek vektoru na druhou
1:32:06suma toho všeho strčíme no změny
1:32:10tak
1:32:11a když dokončíme vlastně tady tour odhazovací etapu nebo
1:32:16kvantovací
1:32:19tak
1:32:20děláme co
1:32:23jeden další krok
1:32:26a tak se tady protože tak jak sem teďka jako namačkaný tady někde uprostřed
1:32:33tak se nám to moc nelíbí že jo tady to prostě ta data moc _e
1:32:36moc dobře nereprezentuje
1:32:38takže já bych to asi chtěl jako intuitivně vidíme že i správný hodnoty byly někde
1:32:43tady ne
1:32:44ale ty správný hodnoty spočítat
1:32:48průměrná poloha
1:32:49průměrná šesti _e vstupní nebo trénovací vektory který padly tomu dalšímu _e organismu kódovým vektoru
1:33:00eště předtím
1:33:03můžu udělat jednu věc
1:33:05když si tak pěkně _e za kvantová vám ty trénovací vektory
1:33:09tak je docela dobrý si někam _e ukládat fitkitu optimální vzdáleno
1:33:14a S a při čítací třeba nějaký v akumulátoru protože potom vlastně když tady toto
1:33:21provedu pro všechny trénovací vektory
1:33:23a podělím to jejich počtem tak dostanu jakousi
1:33:28musí jako totální vzdálenost
1:33:31nebo můžeme tomu taky říká kreslení
1:33:34který vlastně způsobuje kvantování vektoru tou touhletou na novou generací
1:33:39kódové _e zní
1:33:43a můžu udělat tak je to že když ušel si myslím že ovšem sem hotovej
1:33:47že _e se mi to vo té minulé generace moc nezlepšuje takto trénování prostě zastavím
1:33:54a prohlásím ten výsledek za hotovej
1:33:57jo
1:33:58tady je dobrý prostě si pamatovat _e
1:34:02pamatovat tu minerálu celkovou vzdálenost
1:34:04teďka máme spočítanou novou vzdáleno
1:34:07můžeme si vlastně spočítat relativní _e relativní zlepšení
1:34:12a nastavíme si nějakej práh třeba pokud tady tohleto celý
1:34:16je menší než
1:34:18nula celá pět procent tedy binární moc Á nula mapě
1:34:23tak sto
1:34:25protože
1:34:27protože už sem spokojenej jo to prostě jako dál
1:34:30dále
1:34:33no silnic
1:34:35pokud ale nejsem spokojenej
1:34:37pokud ještě tady
1:34:39no tak mi nějaké zlepšení
1:34:41tak prostě spočítáme nové polohy
1:34:44trénovacích vektorů
1:34:47a je to zase máme sme na
1:34:48hrozně složitě napsaný jako
1:34:51centroidy té buňky se Í ale vlastně se jedná o to že zprůměruji všecky _e
1:34:57všecky trénovací vektory
1:34:59který mi tam padly
1:35:02a může se vrátíme začal
1:35:04jo takže když _e to zkrátíme vykoupena rovnice
1:35:08tak vektorový kvantování jo
1:35:11mně
1:35:12_e
1:35:14ráno
1:35:15ono
1:35:19dále on
1:35:23a za
1:35:24A a odnese zima
1:35:28jo
1:35:28a nebo
1:35:30_e
1:35:31o
1:35:34nula jedna
1:35:36_e
1:35:37vektorové kvanty
1:35:41tak
1:35:42co to u toho výkyvu je trošku problém
1:35:46je _e je inicializace
1:35:50první orvek
1:35:52jo
1:35:55_e
1:35:57na _e
1:35:59povede
1:36:00ale
1:36:02nemusí V
1:36:04třeba
1:36:06já mu
1:36:08_e
1:36:11u
1:36:13vy sám _e přes korun
1:36:17u
1:36:18jo
1:36:23kterého
1:36:24u
1:36:25udělat formu o
1:36:27_e
1:36:28a vy
1:36:35no _e
1:36:39a
1:36:41_e jo
1:36:42_e že se vám potom ta
1:36:44o jedna nepříjemná v je
1:36:48a to že jedno nějakýmu horový mu vektoru ne přiřadíte ani jeden vstupní vektor
1:36:56jo
1:36:57když tě tam jako vesele trénujeme
1:37:01_e ve někde
1:37:02je zkusím ukázat představte si
1:37:04že _e že ten
1:37:07že tady dáte
1:37:08že máte jenom dva kódový vektor i tady dáte jeden
1:37:11a tady já to druhej protože se nějak úplně o
1:37:15minete
1:37:16tady tenhleten kódový vektor stáhne sobě úplně všechny trénovací data
1:37:22a na tento
1:37:24a tento nezbyde nic
1:37:27a v tomhle případě máte celkem problém protože _e vlastně nová hodnota toho logovacího toho
1:37:34kódového vektoru
1:37:36přepočítala
1:37:38jako průměr těch _e trénovacích který k nim upadli
1:37:42a tady najednou jako byste měli nulu
1:37:45jedna lomeno nulou krát nula a jako
1:37:48je to je to
1:37:57_e dobře tak vám dám
1:37:59fajn
1:38:00jiný protipříklad představte si že tady
1:38:03_e že máte tady tenhleten mrak trénovacích dat
1:38:09a teďka tady jako si určíte raz dva tři čtyři trénovací vektory dáte sem
1:38:16ne
1:38:17ne tak respektive takle to sem prostice
1:38:21jsem chtěl nějak
1:38:23za nějak jinak
1:38:25ne účtová
1:38:28čtou mám
1:38:31_e
1:38:38dejme tomu že máte tři
1:38:40budete mít tady
1:38:42náhodou se vám podaří tady toto
1:38:47při inicializaci
1:38:49jo
1:38:50potom máte pro celou velkou šanci že tady ten prostřední
1:38:55vám stane všechny data a tady tuto zůstane s jedním vektorem a tady tohle taky
1:39:00řením vektorem
1:39:02takže jako sice
1:39:05o tyto dva budou korektně natrénovaný ale _e celej balík dalších důležitých dat budete mít
1:39:12kvantovaný jenom jedním jediným vektorky
1:39:15no tohlencto vám echoed
1:39:17teď toto se opravdu školní příklady ve dvě D ale když se v nějakém deseti
1:39:21rozměrném prostoru tak se vám tady tohle
1:39:23naprosto krásně může stát jo takže prostě se _e toto prvotní
1:39:29roztleskávání všech vektorů je docela
1:39:31vy
1:39:32proto se právě dělat nejsou jako posuvný štípání
1:39:36_e korektní říká sem taky _e ví kdy vlastně řekneme ne
1:39:42my to uděláme postupně
1:39:44první zaprvé vezmeme jenom jeden kódový vektor
1:39:48na trénuje
1:39:49ten se nám samozřejmě dva ne
1:39:52do centroidu všechna
1:39:54ottawě za chviličku
1:39:56ten
1:39:58rozřežeme a někam posuneme
1:40:01natrhneme korun knihu o velikosti dvě
1:40:05potom vezmeme tady tyhlety kódový vektory
1:40:09rozřežeme se trénujeme paretovy opraveno prosím vás ta první kódovacího se nám samozřejmě
1:40:16tak přímo doprostřed
1:40:18tady sem
1:40:20tady sem _e
1:40:23posunulo
1:40:25nebo rozřezal kousíček musíme posunulo
1:40:28před trénoval
1:40:30zase každej rozřezal kousíček pro C posunu pře trénoval
1:40:34čtyři někde nakonec mám krásnou kódu knihu o velikosti osum
1:40:40tak _e
1:40:43si myslím že se tady někde mám popsáno
1:40:47matematicky nemám to zkusme vymyslet
1:40:49jak byste realizovali
1:40:52rozřezání a posunutí nějakého kódového
1:41:00_e
1:41:01jo takže by se to že by se to posunuli k tomu trénovat nejvyššímu trénovacího
1:41:05vektoru jo
1:41:07ano
1:41:08to mě napadlo ze
1:41:09_e samotný ta koncový uzel se používá
1:41:13tak když vlastně máme nějaký kódový vektor nějaký Y T
1:41:18tak pokud chceme rozřezat na dva
1:41:21tak _e tak se používá Y T
1:41:25plus nějaký delta
1:41:28samozřejmě
1:41:31a to druhý bude
1:41:34mínus delta znamená jako kdybyste ty vektory
1:41:37od sebe odtáhli
1:41:39do
1:41:41_e opačný směru _e tom prostoru ale myslím že ta technika jako prostě vymyslel že
1:41:46bych jako to přeřadil dvěma nejnižším vektoru že by
1:41:50ty fungoval
1:41:51teďka kterého těch jak _e kdybyste byste určili ten směr
1:41:55kam se mají různou
1:41:57historicky pro
1:42:02_e
1:42:03gradientu
1:42:10nejvyšším své pravděpodobně tam kde ste
1:42:13dvěma
1:42:15nemáte ten původní
1:42:16kódové je to
1:42:20F teďka u té _e ani nemám vyzkoušený ale _e máte dvě možnosti buď si
1:42:27tu deltu nějak prostě
1:42:30vymyslet jo jako tato
1:42:32nula celá nula jedna
1:42:35nula jedna a tak dále _e všech
1:42:37směru a mínus nula celá nula jedna N
1:42:41no akčního
1:42:43a pokud se čili na to jít trošku chytřeji
1:42:47tak víte _e jak jakým směrem
1:42:50nebo videotechnikou zjistit
1:42:52kde máte vlastně směr největší proměnnosti nebo variability dat
1:42:58určitého
1:42:59C R T
1:43:00jestli pro komponent
1:43:02ten
1:43:04jako docela fajn technika
1:43:07zapamatujte no si to můžete najít na wikipedii mimochodem mi wikipedia úplně super pro vysvětlování
1:43:12matematiky o tom úplně všude všecko
1:43:15tak PCI vlastně nám _e určuje
1:43:28_e když máme takovýhle blok dat
1:43:31tak PCI nám určí
1:43:35dva na sebe kolmých měli
1:43:37a ten první bude směr největší variability a ten druhej
1:43:42bude ten bude ten druhej
1:43:44jo protože sme jenom ve dvě de
1:43:46my sme měli prostě P rozměrný prostor tak _e tak _e vám to vyhledat té
1:43:53směru
1:43:55a ještě tady takovým těmto vektorům se říká takzvaný ať vektor s
1:44:05a _e eště existují a tím value
1:44:10a ty
1:44:11ať hodnoty nám vlastně udávají kolik je variability k tomu kterým směru
1:44:16jo takže my bychom klidně mohly tady tu deltu
1:44:20jako její směr nebo _e
1:44:23_e jo prostě
1:44:26mně toho vektoru určit pomocí
1:44:29to prvního a tím vektoru
1:44:32a klidně ještě bysme mohli _e velikost tady té délky
1:44:37jakým způsobem řídit pomocí největší Y value
1:44:41a teďka jako bychom mohli ty a jim vektory a jim velí u spočítat globálně
1:44:46se celý data
1:44:47a kdybyste chtěli B Z vopravdu suprový tak byste si a tím velibech tesla a
1:44:52jim velí
1:44:55mohli spočítat ještě třeba
1:44:56převzata který disipaci sou týmu
1:45:00který ta
1:45:01to by bylo úplně
1:45:03nebylo úplně perfektní
1:45:04takže _e
1:45:07dost bolo
1:45:09vektorového kvantování
1:45:11_e jenom ještě k němu existují nebo _e používá se jedna pro kódování koeficientů filtru
1:45:18ale taky pro kódování buzení
1:45:21aute výkyvu existuje do varian který vám tady _e někdo povídat sítí de
1:45:30tam někdo já musím dostat vole u výživnou skluzy
1:45:35takže příště se uvízli rovinného sbalil nebo nějakého dalšího
1:45:39kaskadér
1:45:41tak
1:45:42děkuju vám za pozornost pěkný večer