než začneme dáme nějakou zase dvou tří minut prvku akademickou tak prosím vás to jak

tady svítí ty upoutávky na A chcete také vám řeknu svůj vztah k A chcete

a když to začlo asi před nějakými šesti sedmi deseti lety

tak jsem to považoval za jeden z dalších opravdu kteří se na vymyslel je naši

představení

ale pak sem _e poprvé šel do komise na tom A chcete a změním sem

názor protože tam jako lidí opravdu chodí

_e se svou prací snaží se jako dobře sepsat články snaží si dobře prezentovat samozřejmě

de vo to aby tam něco vyhráli dodali se tam vyhrát mobily a tak dále

ale _e důležitý je že prostě se tam naučíte nebo pocvičíte se s prezentaci podíváte

se jak se na to ostatní komisi tam sedí jednak akademického taky průmyslu nic je

takže když náhodou potřebujete zehnat místo tak je docela dobrá

tygr tam nebývá

to docela dobrá platforma na to abych T S se někde tím průmyslníků _m představili

a naprostá nádherná zvláštnost A C T je nejrychleji sežraný route ve střední evropě

takže _e

já bych vám doporučil mám pocit že deadline bude teďka někdy za _e za chvíli

abyste zapracovali

pokuste třeba dělali o něčem bakalářku nebo máte už rozdělanou diplomku nebo máte nějakou práci

která je úplně mimo jako školu ale trochu se týká i T tak to zkuste

sepsat zkuste někomu říct až vám to přečte

pak to samých něco je a rozhodně se tam přihlašte takto nebo _e jí chcete

druhá veledůležitá správa zpracování řeči je že

brně na plynu je let

a kdo tam ještě nebyl bruslit tak to vřele doporučuju protože tenleten úplně nádherný a

eště tak tři dny a roztaje ale teď teďka sem úplně fantasy

ták a teďka o Š správa týkající se tohodle kurzu

příští týden budeme mít _e toužebně očekávanou

akci a to je půlsemestrálka

bude trvat jednou hodinou bude to první hodině přednášky napíšu vám o tom ještě nějaký

_e s tím líbezným _e jo

_e co tam konkrétně bude rozdělím neska na konci přednášky bude tam asi nějaký kousek

R T C uvidím říkám dneska dojedu a to je prosím vás důležitý je _e

povoleno

psací náčiní

pravítko kružítko

a jedno stránkový jedna a čtverka tak zvané holčičí tu

čičí těm prosím vás _e příprava tam si můžete napsat úplně všechno

musíte to psát rukou

vlastní rukou nebo dobrá žádné prostě jako vytištěné kopírované verze dobu nemilosrdně ničit

můžete tam mít _e velikost písma jakou chcete počet prostořeký chcete znamená pokud někdo to

napíše jako takovými malinký blechami a dá přes sebe

čtyři layer se jako černou zelenou modrou červenou tak ze všeho jenom bych chtěl aby

se to psali vy

aby to bylo váš osobní čičí ne nahoru na něj se _e

nepodepíšete a každý bude mít vlastní _e ne že tady prostě jako bude nějaký jeden

komíny cvičit šít kolovat to bych opravdu nechce rámce ještě napíšu mailem

ale _e

toto je prostě důležitá věc

jinak bude všechno zakázán

tak a teď touž _e k tématu dnešní přednášky bych mohl vypnout tady ty

vypnout

tady ty prezentace

tak _e dneska si povíme o hlasovém ústrojí člověka modelu

dojedeme vlastně tu základní parametrizaci _e tak X min a kousli na minulé přednášce

a potom se budu asi tak got půlky věnovat _e takzvanému lineárně prediktivním modelu tvorby

řeči

lineární predikce už by se vám jako mohlo pomaličku učte

nějakém věku pokročilém že učte slyšeli že když to bude lineární

jak to bude asi lineární kombinace něčeho prostě nějaké koeficienty krát nějaké vstupy tak _e

u lineární predikce to vlastně bude _e budou koeficienty vynásobené minule vzorky

a když je to predikce tak to bude to se to predikce česky

se

předpověď jo takže my vlastně _e se budeme tvářit no budeme dělat jako že předpovídáme

současný vzorek minulých vzorků

ten _e současný vzorek jako nebudeme znát

_e jak bysme potom vyhodnotili světa predikce dobrá nebo špatná

tak zjistíte že ste předpovídali dobřeno blbě

to porovnáte výsledkem o se skutečností že jo takže my vlastně před povíme současný vzorek

těch několika minulých dostane nějakou hodnotu pak známe skutečnou hodnotu toho o právnického současného no

a zjistíme že jako měřítko kvality predikce bude vlastně

pro nějakých X vzorků vždycky tady ta chyba toho předpovězeného mínus skutečného

a aby _e nám to nedělalo na plechova aby se ne odečítaly kladný a záporný

věci takto vezme vždycky na druhou to znamená že to můžeme interpretovat jako energii chyby

predikce jo a uvidíme že tady ta energie chyby predikce

aby _e ten prediktor vyšel co nejlepší tak bude potřeba ji _e minimalizovat

no tak dokonce si tady povíme něco jak se to minimalizace dělá matematicky

vypadá to různě ale není ty těžké

tak _e poďme k tomu začátku

hlasové ústrojí člověka jako model tady tohle maso _e které máme všichni s oběd

to znamená pokud bysme si takhle jako vzali silný lejzr přeřízli se tak _e vidíme

že vlastně hnacím motorem naše řečové ústrojí jsou plíce

pak je tady trubka

která sme hrtan hlasivky takové dva male válečky si vlastně funguje to generátor to za

chvilku vidíme a toto můžeme přirovnat k napájení

nebo ke zdroji energie

ten _e hrtan hlasivkami můžeme přirovnat buzení vlastně _e uvidíme jakého je charakteru když ty

_e hlasivky

kmitají

tak prostě dávají periodické buzení když nekmitají tak dávají šumové protože štěrbina kterou jenom valy

vzduch

_e pak tady máme nejdůležitější část a tomu se říká artikulační ústrojí nebo hlasové ústrojí

takže vlastně všechno na tým

úplným vlastně základem to artikulačního ústrojí je jazyk

který mne zařizujeme to že vlastně dokážu mluvit

a druhou nejdůležitější částí sou zuby karty a tak jak vlastně jako synchronizovaně nebo když

se opijeme řekne synchronizovaně hýbeme jazykem a zuby _e a rty tak _e prostě mluvíme

občas nám je rozumně

tak _e

když my sme to přirovnali reálnému světu ty hlasivky to jsou dva s válečky proti

sobě k jakému hudebním nástroji byste to třeba přirovnali

dva takový nějaký

válečky kterých takle osu neplácej

tady je tvá jenom s na té hraně uzdravil vzoru okolnosti ten má hlasivky jenom

jednu

máte vnoučata plácat

pak caretaker _e zmazat

větší

avoj no oboje nebo fagot nebo

anglicky pro jo

tak _e

oboje má prosím vás ty _e ty jazýčky dva jo

říkat tomu strojek atoms uskutečněné Q dva které platy placením sebe také poďme se podívat

se jak to maso namodelujeme číslicově

_e když budeme dělat číslicové zpracování signálů takže plíce jako zdroj energie neboli baterka nějak

na to kašlem nepotřebujem

_e hrtan

kdy budeme vlastně budit to hlasové ústrojí

tak si uděláme v tom nejjednodušším přiblížení dvěma způsoby

buď když sou hlasivky otevřené tak budeme budičů mém a když budou hlasivky kmitat _e

tak budem budit nějakým periodickým signálem

zkuste měřit nějakou _e nějakej příklad hlásky

kde se budí šumem kde ty

a všechny nic nedělají

šest

_e bacha šel

dyž

jo

a ten se a toto _e

které řeknete když řeknete Š

a když si dáte takhle ruku na krk tak je úplně zřejmě že když řeknete

šel

tak to tam zákmit ne

tady typoložce ruku tady na ohryzek řekněte šel

ty slyšíte kvanta vibruje že jo této to

vektor _e to už není součástí se tomu se říká neutrální hláska

a vlastně potřebujete ji pokud chcete nějakou samohlásku _e nějakou sou vás to vyslovit protože

samo o sobě to nejde jo

účelně se tady ten neutrální znáte říkáš v a

kdybyste chodili do kurzu fonetiky tak von s o tom budu vykládat celou hodinu možná

tak _e nějaký základní parametry když ty hlasivky kmitají to znamená v _e samohláskách _e

neznělý souhláska

tak tady tohle sou zhruba parametry a kmitají rychle může mají základní tón tak

devadesát a sto dvacet herců děleno mají zhruba dva krát víš a dětičky zhruba

eště vo něco víc

a _e tohle opravdu velmi hrubé přiblížení protože my vlastně nemůžeme jako to buzení rozdělit

buď periodické anebo šumové

on _e to takže ty hlasivky prostě jsou vždycky ta štěrbina i když kmitají

takže ta šumová složka se tam vyskytuje prostě v reálu pořád

a _e mimochodem na tomhle s byly založit budou založeny vlastně hodně velký skok s

kvalitě kódování

si vezmete nějaké staříč ke řečové kodéry s osmdesátých let tak je tomu rozumět ale

tak když mluví taková ta plechová oba jo když to když si vezmete že sem

k o

které je to asi do na denně používáte tak to řeči docela příjemná a je

to právě vo tom že se tam to buzení nedě labutí jenom šumové anebo jenom

periodického že to vždycky nějak dávat dohromady

znamená sice je periodické ale přidává se k tomu ta nepravidelná šumová složka

prostě aby to dobře hrál

tak _e tetě

to co máme na tým ten hlasový artikulační trakt

skládá se z nějakých _e nějaký součástí jako hltan měkké patro jazyka C D a

T

ale jak my se na to budeme dívat _e

my se na to budeme dívat jako na filtr znamená mám buzení které zajišťují hlasivky

a pak mám

docela vobyčejný číslicový filtr

který bude modifikovat to co s toho modelu hlasivek leze

poďme se podívat na takové schémátko jak to teda namodelovat

thomase sou tady plíce

_e jsou buď kmitající hlasivky anebo otevřené hlasivky a tady artikulační ústrojí

no a teďka vtom signálové modelu

bude zdroj stejnosměrného proudu který jak sme říkali tak jako pro

pro _e číslicový zpracování nebudem potřebovat

pak tam bude buď generátor impulsů nebo generátor sumu

a pak tam budu mít normálně lineární

přenosový systém

ročně nadneseně řečeno filtr číslicový

a na výstupu poleze řeč

tak teďka možná

tomuhle tomu lineárnímu systém

_e když jsem vás mučil je stezku a nám

předminule no minulé přednášce tak sme říkali že ty číslicový systémy pro nás budou L

C D lineární časově invariantní

co s toho nebude platit

takže by to bylo kdyby byly časově invariantní dřív prostě to trošku mohl musel dat

do jedné polohy

tam i přišrouboval ta nechali tak

a jenom něco dělat buzením to by bylo hrozně vtipný Z se něco takového _e

a takle bych tady s vámi komunikovat bylo hrozně hezky

jo takže _e my musíme zrušit časovou invariantnost

protože jinak byste se _e jinak byste si moc nepopovídali

vlastně to že člověk mluví

je dáno tím že dokáže mění charakteristiky artikulačního traktu a to docela rychle

řádu prostě desítek milisekund

a tím pádem C koeficienty nebo charakter toho lineárního přenosový do systému se bude muset

čase měnit

tak

poďme ještě o kousek dál

tady je to _e zase nakreslený pohledu zpracování signálu

_e jak to vypadá V

části signálové

jak to vypadá ve spektru

tak a

schválně jaká je tady nakreslen _e hláska měla nebo neměla

nebo samohláska nebo souhláska

že to signál periodický když tam mám nějaký periodický průběh

bude asi bude měla že jo hlasivky

posune musí placatá _e musí produkovat něco periodického

takže _e když se podíváme na to jak vypadá buzení

tak je to takový nějaký prostě sled

krátkých ostrých impulzu

který mají mezi sebou periodu

to je nula

a když jisté periody uděláte převrácenou hodnotu

tak dostanete prostě základní

_e frekvenci základního tónu co vše prostě

můžu normálně vokolo sta herců

_e když _e

bychom si udělali

ještě jednodušší signál

kde by byly jenom takovédle špičky prosím vás

signál je vybila jenom špice a

pizza

skica a tak dále a tak dále kdyby tady tohleto mělo spektru

jo kdyby byly kdybychom byli v analogu tak

je to bude třeba

ty nenáviděl _e diracovy impulsy které sou neskutečně krátké neskutečně vysoké

taky spektrum _e sled

nekonečně krátký nekonečně vysokých impulz

takže ty kritika waves _e začnu mučit když je to periodický signál

tak jeho spektrum musí mít jaké

diskrétní správně musí být čáry

a kde ty čáry budou

spektru sou čáry alexově kde

o

na násobcích základní frekvence jo prostě ty čáry čase sou vo sebe vzdáleny o periodu

vy si uděláte jedna lomeno perioda to vám dá základní frekvenci

a takhle sobotka stanete čáry ve _e ve spektru

když bity _e impulsy byly nekonečněkrát ke a nekonečně vysoké

tak bych _e ty čáry ve spektru

dostal všechny stejně dlouhý nebo stejně vysoký a šli by

výběr do nekonečna jo se samozřejmě _e čistá pustá teorie takže

pokud ty čáry jsou jak konečně

nějak konečně _e

úzké no mají nějaký tvar

teď to už se dostáváme do reálné řeči

tak _e nám velikost těch čar postupně

frekvencí sjíždí

a to asi tak jako vo dvanáct decibelů _e za dvojnásobek primuse říká zvednu oktávu

jo takže tady tohleto je charakter toho budícího

signálu

čase

ano

čas

a tady toto je spektru

tak _e teďka jak je to s tím ne _e jak je to s tím

unifikačním nebo s tím artikulační ústrojí

_e to můžeme čase

říkali jsme že sto bude chovat nebo že to budeme modelovat jako číslicový filtr

co když do filtru pošlu jednotkový impulz že vodpoví

žádnou ping

tak

impulzů impulsní odezvou jo přesně tak když mu tam pošlete jim jednotkový impulz

odpoví impulsní odezvou a impulsní odezva hlasového ústrojí vypadá zhruba takže sto párkrát kmit ne

a pak pro do nuly

když si uděláte fourierovu transformaci takovej impulsní odezvy

tak _e

zjistíte že sou není nějaká maxima

a ta maxima _e se budou jmenovat formanty o toho nejnižší ho

dál se značí F jedna F dva F tři za chvilku si o nich _e

nebo později možná tomhle semestru si o něco řekneme

a eště mě zkuste říct _e čím sou asi tak polohy těch formantů to znamená

to znamená _e polohy těch rezonanční frekvenci čím sou asi tak určeny

pošlite někdy účet na záchodě

já jsem se přiznat že já docela často jo když máte vy červík aplikovaný záchod

a tam prostě zkusíte udělat _m

_m hradlo vlastně jako si uděláte suite

všechny frekvencemi které dokážete zazpívat nebo zamručel

tak ten záchod a koho to máte štěstí se na jedné frekvenci úplně výborně rozkmit

a

a když ještě jako přidáte na intenzitě tak máte tak pocit že spadne to jako

zvlášť pokud člověk jako někde

je v hospodě a pak se necvičila takhle výborná hrací vřele doporučuju

tak _e tedy chtěl vědět čím je tady ta rezonanční frekvence dána

vzdálenosti hosti nelze ani tak ne řekněte se zkusit to přitom při tom úkonu tak

jako třeba po piva strachovat

zjistíte že žádný velký rozdíl nebude

ve frekvenci určuje a já si asi prostě jako zkouším koukáte postupně zvyšovat frekvenci a

na jedné frekvenci to prostě začne vibrovat

čím to je daný

no materiálem taky ale hlavně čím

tvarem a tím megre záchod velkej samozřejmě jo takže úplně stejně se chovají _e formanty

jedna emile při které jsou daný vlastně hlavní má rezonanční má _e hlavním a rezonančním

a

_e prostorám a našeho hlasového traktu ženou to tak

že ten co máte hnedka tam klasická má také tak je taky větší

potom je tam tak zvané místo artikulace to znamená _e místo kde jazyk

je co nejblíže hornímu patru vám tam jako přiděluje ten rezonátor a pak je tam

druhej které prostě tady někde střední části u si jo a kde se bere ten

třetí formátován piston hlavy neřek

jo a tím že vlastně člověk _e člověk různě otevírá posuvů bez mění její objem

a mění tam polohu jazyka tak si prostě hraje tady speech s těmito dvěma s

těmito dvěmi roznáším sekvencemi a mění F jedničkové tvůj

tak a teď tě _e mistra pověděli jo houkání na záchodě a _e jak to

dáme dohromady

časové oblasti jako musíme udělat operaci když ty tady todleto vstup a tohleto impulsní odezva

konvoluci jasně a věděli byste jak se dělá konvoluce když máme na vstupu takovej příjemny

signál který vypadá jako infuzi inertní

tom případě konvoluce docela vpohodě protože konvoluce funguje jako kopírka jo to znamená kdekoliv se

objeví takovej impulz

tak prostě op kreslím ten druhý signál

a mám to jo takže tady si všimněte že prostě sem vokopíroval dvakrát impulsní odezvu

a von zdroj udělal ještě mockrát

a dostávám ten signál čase

tak a jak se tady ta konvoluce projevuje _e ve spektru co se děje

násobí jo takže když si představíte jak vypadá vobyčejný ski násobení tady těhletěch _e dvou

křivek

tak zjistíte že ty _e že ty jednotlivé spektrální čáry

jejich výška už nebude určena _e

přímkou která sjíždí

která C s kopce ale bude určena

touhletou frekvenční charakteristikou našeho filtru takže tohleto je výsledné spektrum řeči

kde tady tu čáru by měl teda nakreslit nějak čárkovaně protože to je vlastně normy

to asi obálka

a hrubý tvar

apod tím sou uschovány

velikosti

jednotlivých spektrálních čar

jo takže prosím vás tady ten obrázek je poměrně důležitý

protože v jednom řečovým spektru

máme vlastně vždycky dvě různé informace

to jak vypadá tady ta jemná struktura tady ty jednotlivý čárky

a jak jsou o sebe daleko ty jednotlivý čárky hovoří o čem

co charakterizuje

poloha tady těch jednotlivých čárek

takhle si čeho

bacha rezonanční ne jo

nosní taky ne

hlasovala cisco jo ty ta poloha jednotlivých čar

udává na jaké frekvenci kmitají hlasivky a potom na každém dalším násobku si kmitání hlasivek

máminu takovoudle čáru typicky ve normální mouž mluvit standardním hlasem tak ty čáry tam budou

odkázany zhruba posto hercích

jo já

mám standardním

základní frekvenci svoji zhruba sto herců jsem naštvanej tak začínám kvičet _e aby to víš

jo

tak _e a tady ta hrubá struktura to znamená jejich

výšky těch jednotlivých čárky jsou dané čím

jsou dané artikulační mu strojím jo to znamená to

co _e co děláte s jazykem

s pusou

a _e nejdůležitější vlastně sou dvě rezonanční frekvence

tady tahle první semene první formant takhle druhá semene druhý formát

tak

_e dodat

a to mnou sme si pověděli takže to že se konvoluuje sme si pověděli taky

a

že ve spektru se jedná o násobení se vám taky

tak a teďka je docela

zajímavý a ne moc _e lehký úkol

tak zvaná dekonvoluce

kdy vlastně já na výstupu hlasového ústrojí mám jenom ten konvolvovaný signál na prostě jako

nemůžu nechce rozdělit o buzení

os charakteristiky artikulačního ústrojí to bych toho člověka musel rozřezat se mu navrtat díru do

krakorec nějaký mikrofon těsně nad hlasivky jo to by se to vyprodával

tak _e že _e my budeme přesto hodně algoritmech zpracování řeči chtít to mít rozhozen

_e

především s kódování jo protože takový vobyčejný ski kodéry který máte každý v mobilu tak

_e počítají s tím že si vlastně spočítají charakteristiky buzení a spočítají si charakteristiky toho

_e artikulačního ústrojí takže my budeme muset nějak kde konvolvovat

a rozseknout _e

to co je co patří hlasivkami co patří tomu na

poďme se podívat

jak na to pudem

eště předtím než se budeme tady zabývat nějakým aby konvolučním a technikám a tak si

ale popovídejme o spektrogramu

_e spektrogramy první laboratoří že

řeči

ví viděli jste pohráli ste si jo

tak

pan sme někteří

_e

dobře co to ten spektrogram je

je to vlastně znázornění průběhu spektra řeči

nebo když to teda vezme přesněji tak spektrální hustoty výkonu protože se nekoukáme žádný fáze

ale koukám se vlastně na absolutní hodnoty _e spektra na druhou čase a ve frekvenci

zároveň jo takže

teďka teda jako budu jenom opakovat osu

jste viděli

tady je čas

to je sekvence

a

s každém nám řečové v rámci v nějakém úseku odhadnu

spektrum dám ho na druhou budu tvrdit že to je odhad spektrální hustoty výkonu

a pak to pomocí budič stupňů šedi a nebo nějaké barevné škály

výplod

tak _e

to že _m

vodorovně čas mysle frekvence a stupně šedino barvičky udávají energii

to je asi jasný tak _e tetě _e se podívejme na dvě věci

podle délky rámce

budeme ty spektrogramy dělit na tak zvaný dlouhodobý neboli long ten

a krátkodobých šel tenhleten schválně ještě nebudu dávat další obrázky

protože to napřed zkusíme tipnou takhle jako z hlavy tak _e ten long ten spektrogram

_e mě pojme

dejme tomu

dvě sta milisekund

kecám dvacet milisekund pět a dvacet nebo třicet milisekund řeči

to znamená při takových těch běžných frekvencích _e základního tónu tam budou mít tak dvě

tři čtyři pět period základního to

i chtěl bych od vás teďka vědět

_e jaké bude frekvenční rozlišení takového dle spektrogram jestli pak tam uvidíme ty jemný částečky

který _e odpovídají jednotlivým frekvencím

jednotlivým násobkům frekvence základního to

a dlouhodobym spektrogram

asi jo že jo jako

informace tam je to znamená pokud si vymyslím frekvenční osu dostatečně mnou

tak tomu vidím takže frekvenční rozlišení dobrý

teďka mě řekněte jak to bude časovým rozlišením když třeba budu chtít přesně zjistit

kde začíná hláska to

ram a takovej zajímavej charakter že ten hlasový trakt i zavřený a pak je tam

náhodou najednou

prostě hrana

zjistit zjistíte to přesně pomocí toho dlouhodobýho spektrogramu

asi ne právě proto že berete v úvahu těch pětadvacet třicet milisekund

a během téhle té doby vlastně s chroustá to je všechno

k dispozici to znamená že když se ten charakter změní během pěti milisekund tak nemáte

šanci přesně poznat je to vlastně bylo

jo tak teďka krátkodobý

tam ne bude mít ten rámec dejme tomu deset milisekund

znamená toto by se tam asi měli pozná se tam chytnete

ale řekněte mi _e jestli tam budou vidět sty

ty násobky

základního tónu

krátkodobý ho spektrogram

proč tam nebudou vidět

_e se informaci se dobra

tesla konstantního projeď ale exeter profesní

chcete uvědomit prostě jako

co ten spektrogram bude hrát za signálem to schválně nepromítám jste zkusili

v hlavě

představit

těch deseti milisekundách _e máte šanci že se ta perioda základního tónu ani jednou nezopakuje

rozhlas pokud budem mluvit arnold schwarzenegger který třeba jako obal frekvenci pod sto osum

tím pádem bude mít periodu dvacet milisekund

základní a vy budete mít teďka deseti mise kovy deseti milisekundový okno

tak tam budete mít jako půlperiody force negra _e vůbec ne celou tím pádem ten

spektrogram nemá šanci

zjistit

_e na nějakejch frekvencích bude ten schwarzenegger Ú základní to nelžete a tím pádem prostě

vám ho spočítat jo naopak časový rozlišení bude perfektní

takže

tady jsou nějaký

ukázky tohle ten dlouhodobý

vidíte že ty vodorovný proužky

skutečně udávají

polo jednotlivých násobkům základního tónu

krátkodobý

jo _m čase je to úplně super

tady třeba _e to je ten můj oblíbený signál létající prase

P je ploutví v a

jo to je prostě povíme hláska kde najít nejdřív to úplně zavřete

tak uděláte je tam rána

takže tady ta rána _e na tom dlouhodobém spektrogramu moc není dobře vidět nevíte kde

to vlastně

_e kde sem to ráno udělal

jo ale vidíte krásně násobky základního to

tady to naopak ráno vidíte úplně krásně čase přesně ohraničena

ale základní to nevidět

co tam vidíte že je jenom ta hrubá struktura

a zopakujeme si ten hrubá struktura je daná čím

jo když bysme si udělali přes tímhle _e spektrogramem

po frekvenčního se to znamená v tomhle případě bych dostal něco takovýho

no

no

čím je daná tady tahleta hrubá struktura

no

tím jak mám postavený artikulační ústrojí pusu

jazyk

jo ale ne buzení

tak tohle byly spektrogramy

a teďka se poďme podívat jakou hříčku které se říká kepstrum

_e to myslíte že bude kepstrum

zpracovatele řeči se vtipálci když spektrum

tak když se zkusíme vrátit

pátky vlastně do časové oblasti ale

uděláme mezitím nějaké transformace to k čemu se vrátíme ta nebude signál ale budeme s

časem tak se prostě jako přehodí spektra kepstra _e a jestli to kepstrum

uslyšíme že bude a J liftrování kvefrence

a tak dál

tak že jak se říká sranda musí být _e kdyby na chleba nebo také poďme

se podívat na před

na to

když budeme chtít E

rozdělit

buzení a modifikaci

jo eště jednou prosím vás ve spektru se mi buzení schovává tady do té jemné

struktury

a to co je hrubá struktura

tech teda

tak je modifikace

artikulační ústrojí a já bych to vykašleme rozdělit

tak _e návrh číslo jedna

je

že _e

ten základní tón to buzení odstraním nějakou dolní propusti

prostě vezmu

dolní propust na čtyřech stech hertze

vím že základní tony prostě sou ten robert čtyry sta herců tak řeknu tak tady

to vy gumu jo

a zbytek

mně bude reprezentovat buzení

a push tady jako zkraje vidíte že to sto nebo tak úplně fungovat

protože my vlastně sice máme základní frekvenci

padesát a štyřista herců

ale díky tomu že to je periodický signál tak jsou násobky toho buzení rozesety úplně

všude ve spektru takže nějakou dolní propusti

do moc nepude

za druhé

_e když bychom

to udělali trošku moc

v ostře

a vzali si nějaké masky systém vám řeknu za výkresů posune tuším _e

tak _e bychom si mohli odříznou první forman

a

tím bysme ztratili docela cenou informaci

_e další takový _e další takový argument proti tomu proč nepoužívat vobyčejný ckou dolní propust

je

že když si poslechnete normálně telefonní signál

tak

ta základní spektrální čára která odpovídá základní frekvenci vona tam stejně není

jo třeba když já třeba nebudu mluvit po telefonu

já vám základní frekvenci zhruba těch sto herců telefonní pásmo přenáší zhruba ostří set do

tři tisíc čtyřicet

tak stejně to základní čára tam nebude a přesto slyšíte velice dobře

zhruba na jaké frekvenci slaví mluvíme si sem klidný nebo

jo vám sice udělat

takže takle to nepude

tím pádem půjdeme k ničemu složitějšímu a to složitější se bude

jmenovat právě kepstrum

tak poďme

si to vzít eště jednou _e

matematicky

jak to vlastně bude

_e s výsledným spektrem řeči

a tady mám nějaký géčko jak to je buzení

tak tady mám háčko to je _e impulsní odezva

toho filtru nad hlasy scrum a

časové oblasti tam konvoluce spektrální oblasti je tam sou či jo

a teď prostě ani v jedné tady z těchto oblastí ani ste konvoluční ani té

součinové to nelze docela dobře

od sebe oddělit protože je to všechno

smíchá no

takže my budeme přemýšlet _e jak vymyslet takové operace aby nám toho dělič lo

tím řešením bude

nelinearita

která nám _e

součinu se ty komponenty neodděluje u snadno

udělá součet

zkuste poradit

co dokáže součin udělat součet

logaritmu

právě takže zase uvidíme

logaritmus který nasadíme nepřímo tady na tu rovnici lena podobnou a ten nám opravdu ty

dvě záležitosti rozsekáme

tak poďme na

tak _e teďka ještě jak se teda bude

definovat kepstrum

kepstrum je

dáno takovou

podivuhodnou

definicí

že mám vlastně logaritmus spektrální hustoty výkonu

a to je dáno taktu se jakási suma C N C N budou právě ty

kepstrální koeficienty

krát _e na mínus J dvě pí F M

tady tuhletu operaci možná už sme někde zahlídli

ne to je neviděli

to bude jeden fourierovu že jo

to je vlastně fourierova transformace s diskrétním časem

_e

normálního číslicový ho

signálu

a my tím pádem říkáme že taková fourierova transformace s diskrétním čase prostě nějaké sady

koeficientů

bude logaritmus kepstra

a je docela příjemný že ta _e že tady tahleta funkce spektrální hustota výkonu je

jednak reálná

jednak je kladná jednak je

symetrická

a když to bude takhle tak ty koeficienty _e který _e kterým

musím fourierovy o transformovat aby tady to hledali

tak budou _e tak budou reálný

antisymetrický

to znamená já se nebudu muset zabývat nějakým a

koeficientama se záporným znamínkem

a bude mně docela dobře stačit _e prostě jedna

řada

kepstrálních koeficientů

tak teďka jak na to

když teda vlastně mám logaritmus

té spektrální hustoty výkonu

která je který je nějaká fourierova transformace

těch _e cepstrální

hycintů

no tak prostě abych dostal ty kepstrální koeficienty tak udělám inverzní fourierovu transformaci té levé

strany

a budeme to mít budeme tolik vyřízeny

jo

a tohle vopravdu základní přístup _e K výpočtu kepstra

kdy

_e trochu si zopakujeme jak se dostane tady také psů spektrální hustota výkonu

spektrální hustota výkonu není vlastně nic jinýho

než že vezmete fourierovu transformaci toho základního signálu

já ty u do absolutní hodnoty dáte to celý na druhou

a máte odhad spektrální hustoty výkonu

jo a my jenom když počítáme spektrum

která pardon kepstrum

tak tady toho musíme zlogaritmovat

pak to musíme prohnat

zpětnou

fourierovu transformaci

a dostanu kepstrum

jo takže prosím vás všimněte si že to je trošku něco jinýho dneš jako _e

kdybych tady měl

kdybych udělal tady tuhletu operaci kdy udělal zpětnou fourierovu transformaci

přímé fourierovy transformace

toho signálu

co bych dostal teďka

pátky signál jo úplně ten stejnej _e čase

není to u kepstra tak protože jednak

berou pouze modul

eště na druhou a ještě ho vlastně zkomprimovaly logaritmem

to znamená v časové oblasti pak dostanu něco co se trošku podobá tomu _e základnímu

signálu

ale není to ten základní signál uvidíme za chvilku to bude

tak a teďka prosím vás jenom _e slovíčkaření

_e ze spektra sme tady touhletou operací přešly do kepstra

tady je vlastně proměnná frekvence tak aby to bylo za velmi tak tady bude kvefrence

když budu tady _e nebo na tom základním signálu něco filtrovat

tak _e B cepstrální oblasti li studovat a tak dále no tak byste si ještě

vymysleli nějaký další

straničky

tak _e teďka si ale pojďme ukázat jestli to řeší náš problém

já zopakuju že náš problém je ten

že máme vlastně nějaký signál řečový

série konvolucí buzení

a impulsní odezvy ale prostě nevíme

jak _e jak rozetnout sem odsoudila se jsou konvoluci se pojďme podívat na to jestli

to kepstrum nám ten problém vyřeší nebo ne

tak _e když tady tohle

rovnici převedu do spektra tak tam bude vobyčejný ski násobení

to znamená spektrum signálu rovná se

spektrum

uzení krát spektrum _e modifikačního ústrojí

že mu spektrální hustotu výkonu

tedy spektrum v absolutní hodnotě na druhou

tak tam bude zase

tady tohleto násobení

no a teďka _e se poďme podívat

co s tím _e vyrobí spektrum

musíme si uvědomit dvě věci

za prvé že

fourierova transformace přímá I zpět na

je lineární to znamená že pokud _e do

to je fourierovy transformace strčíte

součet

tak to můžete úplně stejně napřed jako fourierova transformace toho prvního operandu plus fourierova transformace

toho druhý operand

todleto je jedna věc

druhá věc je tá že když máme _e logaritmus

součinu

tak to můžu napsat

ekolog a plus

globe tak a teďka se poďme všechno zkusím dát dohromady

napíšu si _e jak bude vypadat kepstrum

tady tohohle _e tohle součinu

to znamená udělám s toho logaritmus pak to všechno

pro ženu zpětnou fourierovou transformací

první věc kterou můžeme _e

udělat je že si tady ten logaritmus součinu

zapíšu pomocí součtu logaritmu

a potom řeknu no jo já tady mám součet tak poďme to separovat prostě napřed

udělám zpětnou fourierovu transformaci tohodle

a pak udělá zpětnou fourierovu transformaci to je to

a najednou zjistíte že vám s toho vypadávají vlastně dva

členy

dvě různé sady kepstrálních koeficientů

z nichž že

tady

ta první odpovídá buzení

a ta druhá bude odpovídat

artikulační ústrojí

jo a samozřejmě jako voni na té _e kvefrenční ose

se sečtou

takže teďka je otázka jestli budu mít štěstí je sňatek referenční o se tady tyhlety

dvě sady koeficientů jako dokážu oddělit

nebo nedokážou plný dálnic bylo kdy jedny prostě byly někde velký a pak byly nuly

že jo

a ty druhý koeficienty vy byste

druhé části nenulový a zase ste první části byly nuly bych tam prostě v důkazu

udělat hranici

kde jako kdyby fungujou jedny a kde fungujou druhý

no a naštěstí tady todleto udělat de

docela to docela to vychází

poďme se podívat

my se podívat na výsledek

tak se jsem pro vás připravil nějaké obrázky tohleto je signál to je nějaký áčko

nebo téčko _e řečovým signálu

tohle je potom spektrální hustota výkonu to znamená modul spektra na druhou

všimněte si jakou to má velkou dynamiku jo _e jsem vám tady říkal myslím minule

když uděláte spektrum a na to v absolutní hodnotě na druhou tak to jsem o

sobě není moc ke koukání protože to druhá mocnina prostě vám to dynamiku roztáhne tak

že velký čáry jsou opravdu velký

a ty malinký potom vůbec nevidíte

ten další obrázek i když tady

_m tohle věc pro ženete logaritmem

co se vše docela příjemný že jo protože _e

tam

pěkně všechno vidíme

a poslední obrázek je kepstrum

když tohoto

všeho

uděláme zpětnou _e fourierovu transformaci

tak a teďka na tom obrázku to není moc vidět

proto sem tady pro vás připravil takový pěkný dům

_e

tohleto

vodorovné bude kvefrenční osa

v hráčem

se měřit všem bude kvefrenční os

časová osa u diskrétního signálu je normálně ve vzorcích neboli v ničem

kvefrenční

taky

no ničem prostě ty koeficienty C N

tady to enko to nemá žádné rozměr to je normálně počítadlo vzorků jo takže na

kvefrenční ose

bude vobyčejný ski počítadlo vzorků

no a _e teď se podívejte

ten nultý

cepstrální koeficienty taková kapitola sama pro sebe

protože ten vlastně odpovídá logaritmické energii toho signálu

potom tam mám za pár koeficientík u

který odpovídají to modifikační ústrojí kdy filtru

potom něco co můžeme pokládat za nuly s trochou představivosti

a pak tam budou mít takový vlastně bestie nebo

s bloky koeficientů

který budou odpovídat buzení

a uvidíme tam několikrát tom cepstru a to je protože _e tady vlastně

budu mít

_e s hluk

který odpovídá

prvnímu násobku

a teďka čeho

buzení

periody nebo frekvence schválně

chce se tady tadleta vzdálenost

to je

sorry za černa

no bacha základní frekvence to není jo sme už zase zpátky v časové oblasti

takže co to asi bude

až ortonormální vlastně perioda

perioda toho našeho zvuku

ve vzorcích

jo prostě to co jsme před chvilkou viděli _e u signálu

akorát že to bylo vlastně všechno do míchané dohromady

buzení tak tady tahle ta perioda

se nám bude promítat _e

do vzdálenosti

vzdálenosti tady tohohle hluku od nuly znamená tady toto je perioda potom už vidíme další

z luk _e těch vzorku na další periodě a tede a tede

co je prosím vás hrozně důležitý je že opravdu té tím že tady ty skupiny

_e skupiny kepstrálních koeficientů se dají oddělit můžete si tady prostě udělat hranici

a říct _e obvod tady této hranice doleva to brak to patří filtru

a o té hranice doprava to patří buzení

a najednou máte dekonvoluci hotovou protože tady tyhlety koeficienty dejme tomu C nula

se dvacet devět

určují charakter

filtru

tady ty co sou vpravo tak hoši charakteru buzení

tak

koncem to jinak N chystal nějaké

jaké obrázky kde vopravdu

_e zkouším co to uděla

když se ta druhá část

_e kepstra vynuluje

tak tady jsem si zkusil udělat _e takovou fintu kde vlastně beru kepstrum

a teďka pozor aby nám ty fourierovy transformace s vycházeli

tak to musím vzít eště s tou

_e otočenou

otočenou částí

a zkusil jsem vynulovat

těch pár vzorku

který patří _e právě artikulační ústrojí

já teďka sem že úplně naopak

_e jako když nepočítali

kepstrum to znamená že

to znamená že sem _e

že jsem udělal

fourierovu transformaci s kepstra S kepstrálních koeficientů

pak jsem to vod logaritmu val

pak se muselo udělat několik špinavých triku protože tady je absolutní hodnota

na druhou kde ztrácíte informace o fázi a já sem se chtěl za generovat signály

takže jsem do tohoto fázi nějak potřeba dostat zpátky nebudu teďka rozvádět jak ale jestli

chcete na tyto špinavě triky podívat

tak se mrkněte na webovou stránku stréčka kde mám přiloženy ty matlabové kódy

a pak sem udělal _e zpětnou fourierovu transformaci abych dostal signál poďme se teďka podívat

jak to vyšlo

ták

tohleto jak jsem říkal tak je spektrum s vynulovanou

_e rozvinulo mazným a část mám který patří buzení

tady bude logaritmus spektra

od logaritmován o

a

získaný signál kdy jak sem říkal jsem usoudil nějaké špinavé triky abych _e abych dostal

_e

abych dostal správný fáze

když se tady na tohle podíváte tak tady toto skutečně odpovídá signálu který máme někde

na dva cívka má

sou to vlastně krátke úzké impulzy které pocházejí s tou plácání hlasivek

a všimněte si

že tady na tomhle signálu nejsou viditelné takové ty zákmity

jo který většinou vidíme řečovým signálu

tady ty zákmity vlastně ta dlouhodobá _e nebo _e

který sto za vlnění ty jsou tam vopravdu proto že máme nějaké rezonance

které potom obrábění signál hlasivek a když se dostanete třeba pomocí právě cepstrální analýzy

k tomu signál hlasivek

tak prostě tam nic takového není to sou jenom tak leč

řekli díky

R _e které odpovídají

základním tónu

tak poďme teďka zkusit s tu opačnou operaci

dyž sem vlastně vzal

zase kepstrum a vynuloval jsem všecko co nepatří

_e co patří buzení a k o nepatří tom unifikačním ústrojí

tak tady tohleto je

logaritmus získaného

spektra

tady je vod logaritmován o

_e tady jsem zase převedl

a signál

a tady toto je zase

jakýsi tvar

teďka mě zkuste říct čeho

řezy dneska jednou viděli akorát že jsem to měl namalovaný vod ruky a tady je

to

spočítat nejsou pro blízkejch dat

mojí řeči

to co tady vidíme na tom posledním obrázku jak je to červenou obsaženo

že

impulsní odezva filtru přesně tak kdybych prostě byl sadista a tady si

_e operoval nějaký impulzní generátor a pak tam opravdu

pouštěli to přesně špičky

tak by mě pusy vlezlo

tady tohle

že bych opravdu nechtěl se to rači spočítám

radši strávím půlhodinky matlabem jo prosím vás

jo takže _e viděli jsme že pomocí cepstrální _e analýzy

dokážou opravdu rozetnout dva komponenty

řeči buzení filtr

tak teďka se vo tech _e keeps track poďme pobavit eště

eště trošku více

protože

to jak sme to kepstrum _e vygenerovaly

já vám schválně napíšu jak to bylo

_e kepstrální koeficienty jsou zpětná fourierova transformace

Z logaritmu

přímé fourierovy transformace toho

signálů

a to přímá fourierova transformace tam byla s absolutní hodnotě

na druhou jo tak takhle sme vyrobili spektrum _e teda kepstrum

teď mně řekněte ty

tohleto

_e

_m _e nebo z ohledně nějaký charakteristiky lidskýmu slyšení

a nebo jestli je to jenom čistá matematika

kterou jsme si mysleli aby se do lode konvolvovat

tak dobrýho logaritmus beru že tam je _e že _e že je tam je tam

zakomponovány a slyšení logaritmické znamená intenzity neslyšíme lineárně ale slyším logaritmicky dobře to tam je

tak to zde letech teďka týče zpracování jednotlivých sekvencí

tak tam jako nějaký něco podobného uchu máme nebo ne

zaměřte se na tu první operaci kterou signálem uděláme

a to je fourierova transformace vobyčejný D F téčko

do kterýho narvete N vzorků vono vám vyplivne zase N vzorků a těch N vzorků

je takhle prostě rozesety jich

o T od nuly až skoro

do vzorkovací frekvence

tak tam nic lidského není

jo protože ta fourierova transformace má naprosto přesné frekvenční rozlišení na všech frekvencích

se kterýma se kterýma děláte access ušima

slyšíme dobře

a úplně stejně na do nich sekvencích jako na horních nebudete nějaký na

takže řeknu správně a o toho jak se moc hráli by kdy v mládí a

vaří vypracovat se to

_e vykládal

_e ale je to tak že vlastně už na nízkých frekvencích slyšíme líp dokážeme ty

frekvence líp rozlišovat si vemte si že když hrajete na klavíru

také kladky tady vlevo nebo proti sobě tak slyšíte přesně co tyto neznamenají a dokážete

tam odhadnout jednotlivé intervaly hudební a tak dále a když jedete na tom klavíru vpravo

tak už nevíte jako je to blbě naladěný nebo slyším to blbě prostě

oktávu nebo kvintu nepozná

takže _e na nízkých frekvencích vaše ouško

lepší rozlišení

na vyšší horší

takže my to zkusíme nějak _e nějak _e emulovat

a bude to tak

že namísto _e namísto obyčejných k _e fourierovy transformace

při tom spektru na taháme nějaké filtry

které budou mít

zhruba takovéhle tvary tady budou ústě budou úzké

a postupně k vyšším frekvencím

se budou zřetězovat rozšiřovat

a to kepstrum budu počítat z výstupu tady těhletěch filtru

jo

k tomuto se budou chovat jako k jakési hrubé reprezentaci spektral která u zohledňuje to

co se mně je zkoušku

a potom ty další operace jako logaritmus a zpětná fourierova transformace tak zůstanu skoro stejný

tak _e

poďme se podívat do se na to jak se to implementuje

_e to rozmístění filtru ve frekvenci se řeší pomocí tak zvané milost skéro melové škály

troše nějaká prostě nelineární funkce

která mě vlastně nelineárně upravuje frekvence _e takové pěkné české slovo word po je jo

takže tady prostě nelineárně war po ju frekvenční osu

_e tetě _e když na té milost k _e škále

rovnoměrně rozmístíte nějaké filtry nebo si tam uděláte prostě značky

a ty značky promítnete zpátky

do té původní _e na té původní

frekvence

tak zjistíte že se vám to

takhle

pěkně

nelineárně

rozrostly jo

tak já mám velké výtvarné nadání to už víte že _e prostě dostáváme na sekvenčního

se nelineární rozmístění bodu

a potom už stačí abych jenom kolem těch bodu

na tahal takovéhle filtry

řekli si že třeba střed toho _e

filtru bude určen daným budíkem a podvo toho minulého bodíků k tomu dalšímu

not a tak dál a tak dále jo laškuješ tady bych dostal kuželkářské filtr

a dostaneme _e takzvanou mel ovskou banku filtrů

tak _e

tech _e

než půjdeme dál tak mě zkuste říct

jak takovou banku filtrů naimplementovat

jo potřebuju prostě posbírat energie

z nějakejch filtru cifrou trojúhelníky s se budou jako postupně rozšiřovat

tak bych chtěl nějaký rady jak to udělat

bude takle počítat spekter

tak

jedna možnost by byla vo opravdu takový filtry navrhnout

jo nějakou návrhu metodou prostě

udělám si

opravdickou sadu filtru to znamená tady budu mít _e

vstupní řečový signál

ten zavedu

no prvního filtru tu tady tohleto bude třeba

_e

jedna tady tohoto budeme dva a tak dále takže jedna

tady bychom měli druhej sintr a teda to do

hele ty filtry by

_e vypudili nějakej výstup

jo takže tady vydali třeba

Y jedna na

Y dva na

a tak dále a tak dále ale bychom potom na určitým rámci řeči třeba sto

šedesát i _e vzorcích

o sčítali druhý mocniny vzorků na druhou a dostal bych energii která leze z toho

daného filtru

to by nebylo moc příjemný

tak

chtěl bych ještě nějaký jiný návrhy

jak

abych _e věděli jak ale nevíme

tak _e zkusme použit dycky jako

když máte to kladivo a teďka máte jako vedle

tu elektronikou tak

že čte nástroj máme neděsme toho mohli zkusit jako uříznout nejsou i do té elektroniky

tak zkusme použito co máme

co máme k dispozici

z mínus počítání vo vobyčejný skývu kepstra

dneska jako první operaci

fourierovu transformaci jo starou dobrou

fourierova transformace co nám dá ono nám dá spektrální čáry takhle pěkně

_e ve všech

mnoha frekvenčních bodech

který jsou rozmístěny vod nuly ač někde

_e

těsně před vzorkovací frekvenci

to znamená že takovy

běžný přístup výpočtu mel frekvenční cepstrální koeficientu je takový

že prostě z těch spektrálních čar

který nám udělá fourierova transformace

uděláte

_e absolutní hodnoty

vezmete na druhou

a potom se vezmou takovýhle

charakteristiky

jednotlivých filtru

a ty se použijí jako váhy pro jednotlivý koeficienty _e samozřejmě absolutní hodnotě na druhou

fourierovy transformace

a normálně vlastně pro násobíte

ty koeficienty danými filtry to znamená kdybych vám to ukázal třeba tady

například u tohoto

_e teď budu který budu prostě kecat _e tady bude dejme tomu

raz dva tři čtyři pět šest sedum

osum _e

osum čar fourierovy transformace

a my bychom si to mohli rozpočítat takže dejme tomu podle této křivky tenhle sebou

násobit nula celá jedničko celá tři

nula celá čtyři nula celá já nevím osum jedna

a podobně tady tyhle prostě takhle si navazujeme normálně koeficienty vobyčejný vské fourierovy transformace

po sčítáme a máme výstupy jednotlivých filtrů jo a s těma pak můžeme dál pracovat

takže to todle sou že namalované _e jednotlivé filtry

tady máme vlastně _e zopakováno co si mám teďka říkal

_e děláme to vopravdu takže uděláme D F téčko umocníme vynásobíme trojúhelníkovým oknem

a sečteme a tak dostanu výstup jednotlivých filtru

a tetě nás čeká logaritmus

a potom zpětná fourierova transformace

jo a teďka ještě u té zpětné fourierovy transformace se tam používá jedna finta kterou

tady nebudem brát detailně ale má takové docela pěkné odvození tak by vlastně koho zajímalo

takto vyhrabu a

_e můžem si to tady udělat kdy vlastně ta zpětná fourierova transformace je nahrazena

tak zvanou kosinovou transformací

která je příjemná tom že neobsahuje žádný _e žádný komplexní čísla

jo ta kosinová transformace se dá použít

tom případě že to spektrum je symetrické že je celé reálné

že jo

a _e že víme že ten výsledek musí být taky reálný když tady tyhlety podmínky

platí přes všechno Ú kepstra platí

tak si můžem dovolit tu zpětnou fourierovku _e nahradit

tak zvanou diskrétní kosinovou transformací

celé se nám to pěkně zjednoduší jo takže tady ten vzoreček se nemusíte určitě nazpaměť

ale vězte že na základě výstupů jednotlivých filtrů

jejich logaritmu

je potom možné pomocí dete tečka

dojít

k mel frekvenční cepstrální klasicky

tak teďka tady mám ještě takovou pěknou grafickou ilustraci

abyste si dokázali představit jednotlivé informace které tam které tam pouze nebo jednotlivé operace které

tam fungují

krátkodobá nebo

prostě obyčejných K _e diskrétní fourierova transformace

tak krátkodobá znamená že funguje na jednom rámci řeší tedy na nějakých těch dvaceti milisekunda

což odpovídá prostě třeba sto šedesáti nebo dvěma stům vzorkům

všecky

všecky _e jej výsledky vezmu v absolutní hodnoty

tak bych to je doplněn že na druhou

pro ženu to

tou maskou banku filtrů

logaritmem

a uděláte diskrétní kosinovou transformaci kterou se dostanete

K ke kýžený _m melfrekvenční _m

která lním

koeficientu stresu

M F

to co

teďka ještě abyste si dokázali představit výsledky těch jednotlivých operací

tak _e tady tohleto je _e jeden rámec řeči že nějaký

tady bychom měli ten samý rámec řeči

po

preemfázi to znamená vyrovnání se kmitočtové charakteristiky s

vytažení vyšších frekvencí a oknová ní

jo to okno vání

dobíháme tím hamming hammingovým oknem který vypadá takhle

_e

jenom pro připomenutí

čím se dělá ta preemfáze

toto vůbec znamená jsem řekl vyrovnání kmitočtové charakteristiky

zvýšení podílu vyšších frekvencí

že se to teda bude dělat

tak byste s tohodle signálu dostali to je ten zprávu

horní propust správně jo a _e eště vás budu dusit dál kdybyste tu horní propustili

_e udělat _e

co nejjednodušší jenom pomocí fire filtru který bude mít jenom jednu jediný zpoždění a jeden

jedinej koeficient

K by to bylo

dobrý aby by to bylo vy byste to chtěli ještě brutálně jinak byste k klidně

mohly sejí beztoho koeficientu obejít říkat

vezmu současnej vzorek mínus minule vzorek

a prostě tvrdý ode čítač

_e čas něho

nebo minulýho o T současnýho a

to by potom _e vlastně vůbec nepropouští ho stejnosměrnou složku a to by nám vůbec

nevadí

tak _e jo _e tohle byly operace o kterých jsme tady povídali minule

takže jenom jak _e zvýšit podílu vyšších frekvencí v řeči

teď prosím vás _e tlustou černou čarou

tady máte nakreslené _e vobyčejný s ke spektrum získané pomocí D S péčka

a pomocí těch _e otečkovaných čáre czech jsou tady opravdický

_e opravdický mel filtry

kterých by mělo být

dvacet tři

se takový magický číslo který se používá schválně

ano

no _e já se jo i kalhoty tři no to je krása

takže _e poté co vlastně

po sbíráme takhle

_e pomocí těch trojúhelníkových filtrů

energie v jednotlivých

pásem norských tak dostanu

třiadvaceti bodový spektrum jo to znamená to je ta hrubá reprezentace spektra která nějak odpovídá

tomu našemu _e roušku

vidíte že tam ještě poměrně to veliká dynamika kterou srazíme

logaritmem

a

toto je poslední výkřik

a to je _e a to je diskrétní kosinová transformace

toho _e toho milánský ho

to znamená skills pek

tak u té diskrétní kosinové transformace _e je to tak že si většinou jako lidi

nedokážou přesně představit co to _e toto děla

tak _e ta kosinova transformace podobně jako všechny transformace sou vlastně jako promítání nebo určování

podobnosti

tady tohle průběhu jakejma kouska má kosínů

jo tak schválně si poďme _e pod nezkusili sto ty jednotlivý kousky kosínů jsou

_e

ten první koeficient nebo nultý koeficient se počítá takže

vezmu

vezmu stejnosměrný průběh

a jenom to vlastně všecko posčítám mám pocit že ten _e nultý

tady možná ani není ukázaný a nebo je to tady tenhle to teďka přesně neví

ten druhý koeficient

se počítá ta

že vezmeme

půlku kosínů

a zjistíme jestli se tomu ten náš průběh

jak podoba

a zjistíme že se tomu podobá docela ale naopak že jo

jo prostě tady _m _e dolů a tady toto D nahoru

a pokud sedum podobá takle opačně

tak _e poté co si vlastně pro násobíte

vzorky

toho černýho průběhu s tou

tak zvanou bázovou funkcí ze kterou prostě jako násobíte všechno počítáte

tak dostanete záporný číslo

takže jsme někde tady

_e schválně jak bude vypadat a další bázová funkce

tam bude jedna celá perioda kosinu sto dobře pamatuju

todle

a teď teda jako _m bych se musel trošku bodu máte ale

_e pokud

tento průběh

pronásobíme

s tím černým průběhem

tak ono to vypadá docela podobně

jo

dostáváme složky

kladné záporné kladné o kdyby se nám navzájem věnujou

amen a dostanu tady ten sme si ten pak už to nebudu dál malovat

protože byste nesvedl ale _e prostě často jako by řekne ježišmarja transformace toto je to

představit transformace většinou opravdu není nic jinýho

než že máte nějaký průběh signálu nebo spektra tady v tomhle případě

a teďka ta transformace má nějaké své

tak zvané bázové funkce

do kterých ten signál nebo to

_e základní spektrum promítá se a teďka ježišmarja toto je to co to znamená promítat

promítat

znamená říkat si jak je to moc podobný

a je jaksi říkat jak je to podobný

no prostě takže ty vzorky které jsou

nad sebou tak vynásobíte a všecko to sečtete

jo to je celá podstata _e

zcela podstata transformace

tak

tohle je ho v _e K má frekvenčním kepstrálním koeficientům

ke spektru obecně

teďka nevím vašeho přestávku jenom půl minutový oddech

a

jsem se podívat

do L T tečka

tak další oblíbené zima zvětšuje L P se

lineárněprediktivní koeficienty nebo lineárněprediktivní kódování

a nebo jenom

lineární predikce

tak to sou tady pude

zopakujeme si rozřezané ho pepíka a

signálový model toho

co se pepikovi dětma se

pak možná něco o tom proč lineární predikce a pak si něco řekne mu odhadů

koeficientů toho filtru který vlastně reprezentuje naše artikulační ústrojí

_e pak tam budou nějaké další detaily těm se zase dostane máš příště

takže _e rozžhaveného pána se dneska viděli

_e

tohleto

tady se vlastně snažím

namodelovat nějak signál obě

tu část která je nad hlasivkami jo to znamená

tenleten plus trubky

se budu teďka snažit nějak _e namodelovat pomocí

číslicového filtru

a teď

tímto proběhnou poměrně rychle protože to trubku vlastně může namodelovat jako jakýsi filtr mají ty

hlasivky se taky chovají částečně jako filtr

kterým R hlasivky potom model hlasového traktu znamená od hlasivek aspoň pusu

a konečně model vyzařování _e zvuku

který mi říká jak se bude měnit

nebo jak bude vypadat frekvenční zastoupení

odpust si dál když to půjde ven

a tady bude jako spousta rovnic jakýchsi koeficientů ale důležitý bude výsledek

jak bude vypadat struktura filtru kterým to na modulu všecko dohromady protože když to potom

budete _e implementovat mobilu

tak vám bude srdečně jedno jestli jsou tam nějaké koeficienty které modulují vyzařování zvuku nebo

nějakou dutinu někde budete chtít aby to mluvilo

takže

jenom

poďme _e poďme po kouskách

_e

u těch hlasivek

to dokážeme dát dohromady pomocí jakési dolní propusti

která bude druhého řádu to znamená

bude to filtr IIR

ve jmenovateli bude jedna

_e mínus něco krát Z na mínus prvou

plus něco krát Z na mínus druhou jo tady těch konstanta za chviličku

potom budeme mít _e

hlasový trakt

auto hlasového traktu řekneme že _e tam budu mít prostě za sebou kaskádu nějakých rezonátoru

my sme si řekli že _e tam budou nejmíň dva jo prostě velká dutina malá

dutina ale můžu si tam natahat víc

aby to spektrum bylo _e

přesněji zachycené a každý takových rezonátoru uděláme zase namodelujeme filtrem IIR druhou _e druhého řádu

to znamená že

ve jmenovateli bude _e jedna mínus

něco krát Z mínus

prvou plus něco krát Z na mínus druhou

jo teďka prosím vás tady mám nějaké parametry

_e alfa Í beta Í které nám určují polohu a šířku těch rezonanční frekvencí

ale na to teďka prosím vás zapomeňte prostě je to vobyčejný _e příček

jeden takový sestřiček modeluje jeden

rezonátor

a když těch rezonátoru budete chtít dat spoustu do série

tak prostě takových příčku uděláte za sebou

_e několik a jejich _e

jejich přenosové funkce se navzájem budou násobit jo to znamená tak bysme měli

jedna

jedna lomeno nějaký jmenovatel krát jedna lomeno nějaký jmenovatel krát jedna lomeno nějaký jmenovatel a

dokážeme to napsat takže vlastně všecky ty jmenovatele zapíšem pomocí nějakých koeficientů a před těmi

přeměnám jako je P

velké

což znamená násobení

jo takže tohle je vlastně ta hlavní část ten hlasový trakt

a pak tam budu mít eště model vyzařování zvuku

tady tenhle filtru sme někdy viděli ne

toto je

to známe

to horní propust dolní propust

nic

to byl za která

tak bych se možná mohlo čas podívat se tam mám napsané

nebo používat nějaký

jakou lapačky lůzy _e bych to zakryl no jo no tak to je horní propust

a mimochodem jsme viděli u preemfáze něco velmi podobného jo

viděli jsme jedna mínus nula celá devět

Z na mínus prvou

což byla taky horní propusti no a teďka když to všechno dáme dohromady

hlasivky hlasový ústrojí vyzařování zvuku

co musím udělat

že chci tady tyto tři přenosové funkce

spoj

jak na to budu

když chci jenom jednu jedinou přenosu

no tak mu nejsou kaskádě že jo to je prostě sériové zapojení hlasivky trubka

pusa to znamená že navzájem vynásobím

tak a teďka je tady taková vošklivá veliká rovnice

ale naštěstí _e se tady tou rovnicí dá něco dělat

a my totiž můžeme říct že _e nějaké konstanty tady jdou v nule

to znamená tady

dostávám cosi jako

co si jako

E na mínus prvou

_e pardon

z na mínus prvou

na druhou a když se podíváte

co s toho z toho vychází

tak vlastně čitateli dostaneme jedna mínus na mínus prvou tady jedna mínus na mínus prvou

na druhou

tak se s toho můžeme velice elegantně bavit

a máme _e čitateli

obě čínskou jedničku

že hrozně příjemné protože jak vypadá filtr který má čitateli jedničku

když tři

když budu síť vrátím se

do takového

pro přednášky vo zpracování signálu a teďka tady někde mám

schéma obecného filtru

tak mně řekněte k vypadá filtr kterýma čitateli jedničku

ta levá část moment co

ne nejen ta levá část in ta pravá část jo prosím vás

to se v čitateli tak odpovídá té vstupní části tam kde se zpožďujou vstupní vzorky

násobí se nějakejma koeficientem a

a to tady prosím vás vůbec nebude

proč karet

vstupní vzorek poleze přímo do sčítačky

a jmenovatel odpovídá výstupní části

to znamená tam se zpožďuje výstup

násobí se koeficientama zase se zase se přičítá jo

takže já to bude mít usnadněn _e tím

že tam žádná vstupní část nebude

a

tyhlety koeficienty

_e samozřejmě mají nějaké hodnoty ale to mně teďka vůbec nebude zajímat nebude zajímat pořád

takového filtru

jo k těm koeficientům totiž _e za chvilku dojdeme jinou cestou

zásady toho filtru bude _e bude jaký tady mám nejvyšší hodnotu Z na mínus druhou

_e

tady mám nějaké K řekněme že bych takhle chtěl namodelovat pět rezonátorů pět prostě různých

rezonanční frekvencí

tak mně řekněte

jaké nejvyšší mocnině se tady to zetko nebo nejnižší mocnině

bude _e bude objevovat

že tam nějaký výraz sami Z na mínus druhou

a teďka já takových výrazů mám

pět závorkách vedle sebe a všecky ty závorky pro násobit

mínus řeka jo dobrý takže když to káčko bude pětka ten tam bude Z na

mínus desátou

jo

pak tam budu mít eště jedno

z na mínus prvou

který víde tady téhleté _e z této závorky

to znamená že bych měl vlastně mít _e

nejnižší dát toho zetka nějaký Z na mínus jedenáctou

no a to je tady někde spočítáno prosím vás

_e já se na to velice často vykašlu a volím si něco rozumného nějaký sudých

dát takže taková rozumná hodnota

řádu

toho číslicového filtru který toto všecko

_e vezme do uvaří který toto všecko na modeluje

tak bude prostě _e deset

nebo když budu mít

vyšší vzorkovací frekvenci než telefonní

tak třeba šestnáct

jo to znamená jenom prosím vás M a vystrašil jakýmsi skládáním _e přenosových funkcí

důležitý je to co s toho víde vyjde s toho obličej nízký

IIR filtr

tedy

a to triviálním čitatele jenom jedničku to znamená leze do něho jenom vstup

a má jmenovatele

který má krát prostě deset nebo šestnáct podle toho _e

podle toho co si zvolíme

jo takže eště jednou abychom si to opravdu zopakovali tenhleten filtr

u

na ten filtr bude mít

přímo vstup

N

tohle tam nebude

a _e tady budeme mít

deset

zpožďovače k

a budeme tady mít

deset koeficientů

a jedna

až _e deset

tak teďka měli sme nějakou klasifikaci filtru měli sme si R

čistý IIR a obecný Í R tam byste ho zasadili takový filtr

čistý IIR jo Í R je nekonečná impulsní odezva protože opravdu ten filtr kterej požírá

si vlastní výstupní vzorky

tak si jako vystačí some a bude si pořádně co generovat

a _e je čistý protože nemá tu vstupní

nemá to vstupní část

tak

tak sme si pěkně řekli _e

ku

jo

pěkně sme si řekli jak teda budeme _e

modelovat _e to artikulační ústrojí

že to bude vobyčejný scheme IIR filtrem

_e tetě _e jako je krásný že vím teda kterej filtr to bude ale ještě

bych potřeboval znát jeho koeficienty

a to nebude

zcela triviální o tom si teďka budeme povídat

takže _e nejprve o tom

jak to teda probíhá když do takového filtru pustím

nějaké buzení tady vám prostě generátor buzení

který produkuje nějaký budící signál jo tady mám značený jako Ú N

tady je prostě knoflík volume

jo

géčko který udává jak ten výstupní signál bude velký

a tady je

ten číslicový filtr _e jedna lomeno A Z

který je čistý IIR

a ten bude produkovat výstupní řeč

no a _e já bych si mohl

zkusit napsat _e tu rovnici která popisuje chování filtru

když mu přivedu nějaký vstup jaký bude výstup taktika dva zase trochu po zkouším jak

se ta rovnice menuje u číslicových filtrů

tři možnosti buď semene diferenciální diferenční nebo a milion ať

tak ta druhá bys diferenčního disk bacha diferenciální je ta C u spojitých systémů s

tou to si radši nezačínej _m

takže _e diferenční rovnice takového filtru zase si ukažme to jeho schémátko

když mu na vstup no

mu nastup _e

přivedu signál G krát Ú N

tak tady ten výstup

bude tvořen vstupem

rovná se G

u no

já se omlouvám že jednou mám ty závorky kulaty podruhý hranatý o to _e nemocnice

mínus A jedna

Y N mínus jedna

mínus _e dvě

Y

N mínus dvě

a máš jak se ti a

Y _e teda pardon

a P

Y N

mínus T

jo

diferenční rovnice

tetě když to budu chtít zjednodušit abych se neupřel roku

tak _e napíšu mínus suma

a tady něco špatně

pardon já jsem já sem to trošku zvrtal protože já jsem to výstupní řeči označil

teskem

_e tam sem navazovaly D Y i takže ne prosím vás výstup toho filtru je

S jo omlouvám C protože to prostě tak

tak _e teď teda jako _e perfektní vím jak tu rovnici napsat

ke čím bych to vybudil ale mám problém s těmi koeficienty A Í

o kterých netuším

jak mají být velký

takže

poďme

zkusit sepne zkusit spočítat

budete počítat jako zvláštní metodou

když si vlastně řekneme tady _e toto je člověk

a u toho člověka

při představuju že má prostě sobě nějaké buzení

že má sobě nějaký filtr jedna lomeno A Z

a toto je vlastně hranice kdy když toho člověka nechci kuchař skalpelem

dokáže se dostat k datům to znamená tady

tady je signál S N

a ten dostanu

jo hrozně rád bych se mu napíchl sem

a nebo přímo viděl koeficienty toho filtru ale mám smůlu protože to je prostě schované

nevíme uvnitř tomu pánovi

a řezat emil nechce takže tohle sou jediná viditelná data

takže _e já na to pro takovou flintou

já řeknu _e asi udělám filtr který bude vlastně inverzní k tomu co má ten

člověk zabudovaných sobě

ten filtr bude _e Z

který bude mít naopak jenom čitatele

zase zeptám jakýho charakteru bude tady ten filtr ten bude firem IIR čistý nebo year

špinavý

to bude čistej fire že jo

a na konci tady tohoto filtru budou odebírat

nějaký chybový signál

a tetě prosím vás je docela zajímavé a dá se ukázat že když _e budu

tak dlouho nastavovat koeficienty tady toho filtru a z hvězdičkou Z

až bude energie tady toho ví _e signálu na výstupu minimální

tak jsem právě našel

optimální koeficienty

toho filtru a hvězdičkou

které budou perfektně sedět nebo match o what tady ty koeficienty které sou schované vevnitř

_e člověka

jo tady prosím vás téhleté větě kroutíme parametry filtru tak dlouho

dokud není energie signálu na výstupu minimální se také říká identifikace parametrů nějakého skrytého systému

který je

tedy je tady prostě na levé straně vo té _e o té nepřekonatelné bariéry jo

takže když někde jako uvidíte identifikace parametrů

tak _e to je právě to co se tady snažíme dělat

takže poďme _e si to zkusit nějak

popsat

ale předtím eště neště to bude popisovat tak si řeknem prostě tady tomu celému

proč se to je hradce

říká lineární predikce

_e

ta lineární predikce eště prosím vás to tady trochu zjednodušíme a tady mám nějaký rozděleny

koeficienty filtru člověkovi který budou a V

tady budou a hvězdičkou Z _e ty koeficienty ze kterým a budu _e dekterema budu

hejbat

a já prostě předpokládám že sem tak hrozně chytrej že se mně to vyšlo a

že už sem identifikoval takže se tady na to hvězdičkový kašlu a budu to všechno

značí ten omáčka má

enom proces tu jedničku nikdy neuvidíte

tak _e

my se _e mise zkusíme zaměřit na to

proč takovej filtr

který _e který bude

zapsán pomocí polynomu A Z to znamená bude tam jedna plus A jedna

Z na mínus prvou

_e

pardon tam byly

vlastně mínus A jedna Z na mínus prvou

ne momentových to úplně nezhojí ti omlouvám se

jo prostě bude to polynom ADT facto tomu k tomu jeho změní dostanu za chvilku

tak proč tomu říkáme lineární predikce jo protože na něho vlastně vstupuje obyčejní signál

vystupuje nějaký éčko a teďka proč proboha lineární predikce tak si to zkusme trošku rozepsat

_e teče _e takové do taková otázka když se máte podrbat ze levým uchem tak

to uděláte kterou ruku

a to udělám normálně levou jo lineární predikce předpokládá že se založení uchem drbete pravorukou

protože začneme takovým docela

_e šíleným rozepsáním polynomu A Z

který je jedna mínus jedna mínus A Z

jo to je prosím vás jako kdybyste chtěli říct mám stokorunu a řekli to formou

máme jedna mínus hranaté závorce jedna mínus sto korun

jako je to je to dobře ale to divně ale dobře tak a my tady

toto skutečně budeme dělat poďme se teďka podívat

co sme vyrobili

_e tímto zápisem

takové jednodu se nejednoduché schémátko

do kterého leze signál S N vylézá signál N a je tam prostě filtr _e

zend

sme přepsali nebo pře kreslili _e takovoudle družičku

kdy máme signál S N který nám vlastně leze přímo

to je tady

tato jednička jo

potom tam mám filtr jedna mínus A Z

který zpracovává ten samý signál

a tenhleten signály od toho původního odečten

tady znamínko mínus

a já dostávám ze se zase zpátky

_e

signál E N jo když si představíte jak tady toto schéma to funguje tak je

to opravdu naprosto ekvivalentní tomu vlevo

teď pro sem tady toto strašné harakiri _e dělal

já se tam sem to z jednoho důvodu

a to proto že vlastně tady ten spodní filtr

se dá teďka vyložit nebo interpretovat jako prediktor jako předpovídá ač toho s současného vzorku

protože to takhle dá dělat

je to proto

že _e

dyž máme

tady

tenleten výstup

R N

tak je to vlastně

pokud _e pokud ten náš polynom A Z

je jedna plus A jedna Z na mínus prvou a šlus chroch rok pro

a P

Z na mínus T

tak ten signál N je _e

N

plus

a jedna

S N mínus jedna plus

a šlus _e P S

N mínus P jo

vobě čenský prostě zápis výstupního signálu _e

teďka proto se podívat jak je dám tady tenhleten _e signál S

styl do Ú N

ten je dán jako

_e

polynom jedna mínus a ve kterými jsem to je ten vstupní signál

a jedna mínus A Z

si jednoduše zapíšu jako jedna mínus to nahoře to znamená jednička se mi tam vyruší

to bude tam mínus A jedna Z na mínus prvou mínus pro chroch pro až

mínus a P

Z na mínus této

to znamená že ten signál S jedničkou N bude

_e mínus

a jedna

S

N mínus jedna

mínus

až mínus a P

S

N

mínus T

jo všimněte si prosím vás jedné důležité věci

ten _e vzorek S T ledničkou N

odhaduju pomocí minulýho před minulýho před minulýho až vzorku vzdálený ho vlastně minulosti vo P

takže běžně vo deset vzorku ale nikoliv ze současnýho

to znamená já opravdu si můžu říct no jo takovéto vlastně nějaký odhad současnýho vzorku

těch minulých kde tady té spodní větví prostě ta současný vzorek neznám

a

jaká je tedy vlastně potom interpretace toho

toho éčka

co voni můžu říct

tady odhad

tady je

správná hodnota skutečná cédéčko

prosím

_e nulu no nula když to je správně ale jako my plně

většinou správně nedáte

vy to musíte udělat jako to jako když se člověk prostě

blíží ideálu

list výrobek

taky prostě byste chtěli ideální ale jako se slovy někdy opěrného řekne to sprostě tak

se mi daleko přesně nedáte ale snažíme se k němu blížit

_e můžete ho popsat nějakou kriteriální funkci jako že třeba o pití dva trestný vody

jedno sprostý slova čtyři prsty a tak dále

takže by se snažíte samozřejmě jako takové škaredé chování minimalizovat

a tady se snaží minimalizovat to éčko

co to éčko je tak bysme tomu řekli

_e vlastně to špatný to éčko jo a je to chyba predikce je to vlastně

ten správnej signál ten opravdicky

mínus

ten predikovány

jo to a my sme před chvilkou říkali že _e to téčko budu chtít _e

nasadit tak aby bylo co nejmenší

a v tom případě že bude co nejmenší tak vlastně ten prediktor bude fungovat

co nejlépe protože prostě bude produkovat takový hodnoty který se budou se nejlíp

blížit vstupu aby éčko bylo aby véčko bylo co nejmenší

jo takže toto je prosím vás _e jako taková mentální klička

aby si člověk uvědomil proč se tady tomu celýmu zmatku říká _e říka lineární predikce

my to za chvilku budeme _e za chvilku nevyužívat

jo takže prosím vás jenom _e

kompaktní popis toho predikovanýma signálu S N

je tady je to prostě jako mínus nějaká suma

koeficienty krát

minulý vzorky

tak _e tady je zapsána chyba predikce

to znamená to ten skutečnej signál mínus ten předpovězené ji

to jenom nahrání s tím jak sem si ten chybový _e nebo ten předpovězený signál

zapsal _e na _e minulým slajdu

a když se podíváte semka tak je to vlastně

zase zpátky

_e ten výsledek který jsme tam měli nakresleny před chvilkou znamená S N

plus

a jedna

S N mínus jedna plus bla a s plus a P

S N mínus T jo takže dostáváme zase to ste jenom sem to říkal pro

vysvětlení

o co se jedna

_e

tetě _e

když budeme

získávat ty parametry

tady touhletou metodou

to znamená budeme minimalizovat chybu predikce

tak _e to má tu fajn výhodu že vlastně _e získáme ty koeficienty

které _e jako kdyby má člověk sobě

které nevidíme

teďka mě prosím vás řekněte jednu věc když _e

ten člověk má sobě prostě nějaký ten

nějaký buzení nějaký G krát Ú N

a teďka prostě ten človíček má sobě filtr _e Z

jedna lomeno A Z jo tady je tady je to nepřekonatelná hranice

a teďka my uplně perfektně namodelujeme

filtr _e Z

tak by mě zajímalo co tady dostaneme na výstupu

buzení jo zase vlastně _e tohle se nám navzájem vyruší jo vykrátí že jo

a dostaneme se k buzení to znamená budeme mít k dispozici budící signál

jak má člověk na dva si skala přítelem _e nebudeme muset kuchár

a druhá jako příjemná věc _e tady u té metody je že ty koeficienty do

u docela snadno určit pomocí normální soustavy lineárních _e rovnic

tak poďme se podívat na to jak to

jak to udělat

první věc je že si musíme nějak vyjádřit tu chybu

_e nebo energii chyby lineární tedy

_e kdy

chyby uděláme úplně jednoduchou se takže prostě vezmeme nějaký _e nějaký úsek signálu

zatím nebudu říkat detail nějaký úsek signálu protože pak tom budou nějaký ještě čachry

támle vezmeme chybu lineární predikce

všecky vzorky dáme na druhou

a všecky sečteme

jo a tady toto

teď pro nás bude cílová funkce robot kriteriální tomu někdy říkáme

kterou budeme chtít _e minimalizovat

tak a teďka prosím vás kdo z vás

_e kdo z vás poslouchal dobře v matematice

mýmu úkolem je tady tohleto éčko udělat co nejnižší

a přitom hledám

koeficienty filtru

_e tady mám _e je

hledám koeficienty filtru a je

iont eště zamaluju ne není nedívejte sets a tabulu teďka

se musím to musím udělat

abych ty koeficienty ale _e a je našel

ste sklopit zraky pracovat je tady do očí

když hledám prostě ve mám nějakou funkci velký éčko

která je funkcím koeficientů a je jo protože já sme může jako různě kroutit mydlit

a teďka to téčko se podle toho bude _e podle ní bude zvyšovat nebo snižovat

a teďka za úkol najít takovou sedu sadu koeficientů _e je aby to éčko bylo

co nejmenší

jak na to budem

matematicích

no dobrý instalujte další metodou byste mohli zkusit pokud by to nešlo vypočítat analyticky ale

vono tady tohle kupodivu de

takže když to sem úplně přesně

tak jak

máme úplně vobyčejný s ke jednorozměrný případ jo máte prostě nějakou funkci

teďka ta funkce mají _e je funkcí jedné proměnné a vy máte najít její minimum

protože vo to vám de jo vy chcete vy chcete to éčko co nejmenší

takže derivace že jo a to z derivaci

derivaci nad rovnou nule

a pokud _e bouda tak nám z toho vypadne nějaký výraz pro hodnotu _e X

jo takže to zkusme tady

_e poďme si

poďme si udělat _e opravdu

_e derivování tady tohoto výrazu

podle jednotlivých koeficientu

jako tady ty rovnice vypadají krutě ale _e zjistíme že to není

tady není jako až tak s až tak hrozné

mám tady vlastně vyjádření té

mám tady vyjádření té chyby predikce kterou sme _e kterou jsme ukuchtili

na předchozím E na předchozím slajdu jo

to znamená

_e bude tady ten skutečný signál

krát tohle celé a aby z toho byla energie

tak musím všechny tyhle hodnoty dát na druhou a sečíst je přes nějakých N vzorků

signálu kde těch N je to zatím _e to sem vám zatím zamlčel

a tetě si vy jej dat jsem to udělal pro _m

teď si vyberu _e jeden koeficient a je

a podle něho budu derivovat

jo a připravme se prosím vás na to že těch koeficientů je deset

to znamená budu derivovat potom podle nějakýho jinýho je _e je a ještě podle jinýho

a dostanu deset takových rovnic

který mě dají soustavu v tomhle případě deseti rovnic o deseti neznámých

rumy každý com to dokáže pohody vyřešit jo takže poďme se podívat jak _e jak

probíhá _e ta jedna derivace

protože on je to docela zajímavé

tak _e mám tady prostě koeficient a je podle kterýho nervuju

_e a mám tady nějakou funkci

kterou máme zderivovat

_e když je ta funkce

sumu vaná přes _e nějaký N vzorků tak se s tím nemusím babrat prostě tosu

můžu opsat

jo takže vidíte že _e že ta suma prostě že se s ní nic neděje

a mám funkci kde hranatá závorka nějakej vnitřek pravá hranatá závorka na druhou zase pamatuju

si pamatuje jak se derivuje mocnina na druhou

jako dvakrát ta funkce že jo

tak si všimněte že to tady je zopakovaný dva S N plus

tady ta sumička

uzavřená hranatá závorka už tento dům jsem to na druhou není

ale teďka bacha

když zderivuj u takovou složenou a složitější věc tak tam musí eště být tak vona

derivace vnitřní funkce že

a u té derivace vnitřní funkce bych chtěl abyste se chvilku zamysleli

a řekli si jak se vlastně ta vnitřní funkce derivuje

tak

závisí prosím vás hodnota S N na koeficientu a je

ne takže tam kde derivace nula vpohodě jo

tak se musíme zaměřit tady na tu sumu

a poďme si to sumu rozepsat jo protože jako suma

lidé znalí už to dokážou z hlavy ale lidé neznalí ne ta suma se dá

zapsat takhle jako a jedna

S N mínus jedna plus

chroch rok pro potom je tam někde a je krát S N mínus je

plus měněna až plus _e T S N mínus P

a teďka mě prosím vás tady tenhleten víra zderivujete podle a je

jo českou ostatních toho vypadne

todle repríz todle ne pryč a zbyde tam jediná věc která sedí vedle a je

a to je mínus je

to znamená že já dostáváme se tady tenhleten výraz jako derivace vnitřní funkce

_e teďka užití musím udělat jenom nějaký nějakou reorganizaci

_e ta dvojka kterou jsem dostal

tak _e ji můžu klidně hodit na druhou stranu a utopit i v nule to

znamená to stanic nebude

_e dostávám tady suma S N krát

S N mínus je

přes _e

přes všechny vzorky

a tady si můžu dovolit takovou fintu která se menuje otočení pořadí suma

to znamená já si napřed dám sumu přes _e ty koeficienty

_e Í

a potom si dám sumu

přeze všechny hnedka

která bude obsahovat S N mínus T S N mínus je

tak _e

teďka aniž bych vám ukázal pokračování tady té pohádky

tak by mě zajímalo jestli vám _e něco říkají výrazy typu sumace přes všechny vzorky

S N S N mínus je

_e

konvoluce

pozor jo prosím vás konvoluci

se běželo přes nějakou pomocnou proměnnou

a jeden z těch signálů musel být otočený

a výstupem té konvoluce

byla zase řada vzorků čase

tady nic votočený ho není a běžím přes normální časovou proměnnou

a už sme to tady dneska měli jako kdyby mě tady tahleta _e tahleta

suma určovala jak moc je podobnej signál S N si hospodinu variantou S N mínus

je

a ta podobnost

to _e se říká jak

když se tedy účinně

_e

průběh mého vrávorá ní je podobný množství

škopku který si dám večer hospůdce

co to je působit prostě zajímavě

tak řekněte prostě jako

moje výkyvy jsou korelované tím kolik toho vypiju jo tak znamená tato teko relace

a tady ty výrazy budou korelační koeficienty

a to jaký to budou korelační koeficienty to si povíme příště

takže _e prosím a

_e na půlsemestrální zkoušce to bude tady do tohodle vodu

co s toho dokáže vy derivovat to ještě nevím ale si tady do tohoto černýho

puntíku

příští

příště zkouším

děkuju vám za pozornost a

pěkný týden