než začneme dáme nějakou zase dvou tří minut prvku akademickou tak prosím vás to jak
tady svítí ty upoutávky na A chcete také vám řeknu svůj vztah k A chcete
a když to začlo asi před nějakými šesti sedmi deseti lety
tak jsem to považoval za jeden z dalších opravdu kteří se na vymyslel je naši
představení
ale pak sem _e poprvé šel do komise na tom A chcete a změním sem
názor protože tam jako lidí opravdu chodí
_e se svou prací snaží se jako dobře sepsat články snaží si dobře prezentovat samozřejmě
de vo to aby tam něco vyhráli dodali se tam vyhrát mobily a tak dále
ale _e důležitý je že prostě se tam naučíte nebo pocvičíte se s prezentaci podíváte
se jak se na to ostatní komisi tam sedí jednak akademického taky průmyslu nic je
takže když náhodou potřebujete zehnat místo tak je docela dobrá
tygr tam nebývá
to docela dobrá platforma na to abych T S se někde tím průmyslníků _m představili
a naprostá nádherná zvláštnost A C T je nejrychleji sežraný route ve střední evropě
takže _e
já bych vám doporučil mám pocit že deadline bude teďka někdy za _e za chvíli
abyste zapracovali
pokuste třeba dělali o něčem bakalářku nebo máte už rozdělanou diplomku nebo máte nějakou práci
která je úplně mimo jako školu ale trochu se týká i T tak to zkuste
sepsat zkuste někomu říct až vám to přečte
pak to samých něco je a rozhodně se tam přihlašte takto nebo _e jí chcete
druhá veledůležitá správa zpracování řeči je že
brně na plynu je let
a kdo tam ještě nebyl bruslit tak to vřele doporučuju protože tenleten úplně nádherný a
eště tak tři dny a roztaje ale teď teďka sem úplně fantasy
ták a teďka o Š správa týkající se tohodle kurzu
příští týden budeme mít _e toužebně očekávanou
akci a to je půlsemestrálka
bude trvat jednou hodinou bude to první hodině přednášky napíšu vám o tom ještě nějaký
_e s tím líbezným _e jo
_e co tam konkrétně bude rozdělím neska na konci přednášky bude tam asi nějaký kousek
R T C uvidím říkám dneska dojedu a to je prosím vás důležitý je _e
povoleno
psací náčiní
pravítko kružítko
a jedno stránkový jedna a čtverka tak zvané holčičí tu
čičí těm prosím vás _e příprava tam si můžete napsat úplně všechno
musíte to psát rukou
vlastní rukou nebo dobrá žádné prostě jako vytištěné kopírované verze dobu nemilosrdně ničit
můžete tam mít _e velikost písma jakou chcete počet prostořeký chcete znamená pokud někdo to
napíše jako takovými malinký blechami a dá přes sebe
čtyři layer se jako černou zelenou modrou červenou tak ze všeho jenom bych chtěl aby
se to psali vy
aby to bylo váš osobní čičí ne nahoru na něj se _e
nepodepíšete a každý bude mít vlastní _e ne že tady prostě jako bude nějaký jeden
komíny cvičit šít kolovat to bych opravdu nechce rámce ještě napíšu mailem
ale _e
toto je prostě důležitá věc
jinak bude všechno zakázán
tak a teď touž _e k tématu dnešní přednášky bych mohl vypnout tady ty
vypnout
tady ty prezentace
tak _e dneska si povíme o hlasovém ústrojí člověka modelu
dojedeme vlastně tu základní parametrizaci _e tak X min a kousli na minulé přednášce
a potom se budu asi tak got půlky věnovat _e takzvanému lineárně prediktivním modelu tvorby
řeči
lineární predikce už by se vám jako mohlo pomaličku učte
nějakém věku pokročilém že učte slyšeli že když to bude lineární
jak to bude asi lineární kombinace něčeho prostě nějaké koeficienty krát nějaké vstupy tak _e
u lineární predikce to vlastně bude _e budou koeficienty vynásobené minule vzorky
a když je to predikce tak to bude to se to predikce česky
se
předpověď jo takže my vlastně _e se budeme tvářit no budeme dělat jako že předpovídáme
současný vzorek minulých vzorků
ten _e současný vzorek jako nebudeme znát
_e jak bysme potom vyhodnotili světa predikce dobrá nebo špatná
tak zjistíte že ste předpovídali dobřeno blbě
to porovnáte výsledkem o se skutečností že jo takže my vlastně před povíme současný vzorek
těch několika minulých dostane nějakou hodnotu pak známe skutečnou hodnotu toho o právnického současného no
a zjistíme že jako měřítko kvality predikce bude vlastně
pro nějakých X vzorků vždycky tady ta chyba toho předpovězeného mínus skutečného
a aby _e nám to nedělalo na plechova aby se ne odečítaly kladný a záporný
věci takto vezme vždycky na druhou to znamená že to můžeme interpretovat jako energii chyby
predikce jo a uvidíme že tady ta energie chyby predikce
aby _e ten prediktor vyšel co nejlepší tak bude potřeba ji _e minimalizovat
no tak dokonce si tady povíme něco jak se to minimalizace dělá matematicky
vypadá to různě ale není ty těžké
tak _e poďme k tomu začátku
hlasové ústrojí člověka jako model tady tohle maso _e které máme všichni s oběd
to znamená pokud bysme si takhle jako vzali silný lejzr přeřízli se tak _e vidíme
že vlastně hnacím motorem naše řečové ústrojí jsou plíce
pak je tady trubka
která sme hrtan hlasivky takové dva male válečky si vlastně funguje to generátor to za
chvilku vidíme a toto můžeme přirovnat k napájení
nebo ke zdroji energie
ten _e hrtan hlasivkami můžeme přirovnat buzení vlastně _e uvidíme jakého je charakteru když ty
_e hlasivky
kmitají
tak prostě dávají periodické buzení když nekmitají tak dávají šumové protože štěrbina kterou jenom valy
vzduch
_e pak tady máme nejdůležitější část a tomu se říká artikulační ústrojí nebo hlasové ústrojí
takže vlastně všechno na tým
úplným vlastně základem to artikulačního ústrojí je jazyk
který mne zařizujeme to že vlastně dokážu mluvit
a druhou nejdůležitější částí sou zuby karty a tak jak vlastně jako synchronizovaně nebo když
se opijeme řekne synchronizovaně hýbeme jazykem a zuby _e a rty tak _e prostě mluvíme
občas nám je rozumně
tak _e
když my sme to přirovnali reálnému světu ty hlasivky to jsou dva s válečky proti
sobě k jakému hudebním nástroji byste to třeba přirovnali
dva takový nějaký
válečky kterých takle osu neplácej
tady je tvá jenom s na té hraně uzdravil vzoru okolnosti ten má hlasivky jenom
jednu
máte vnoučata plácat
pak caretaker _e zmazat
větší
avoj no oboje nebo fagot nebo
anglicky pro jo
tak _e
oboje má prosím vás ty _e ty jazýčky dva jo
říkat tomu strojek atoms uskutečněné Q dva které platy placením sebe také poďme se podívat
se jak to maso namodelujeme číslicově
_e když budeme dělat číslicové zpracování signálů takže plíce jako zdroj energie neboli baterka nějak
na to kašlem nepotřebujem
_e hrtan
kdy budeme vlastně budit to hlasové ústrojí
tak si uděláme v tom nejjednodušším přiblížení dvěma způsoby
buď když sou hlasivky otevřené tak budeme budičů mém a když budou hlasivky kmitat _e
tak budem budit nějakým periodickým signálem
zkuste měřit nějakou _e nějakej příklad hlásky
kde se budí šumem kde ty
a všechny nic nedělají
šest
_e bacha šel
dyž
jo
a ten se a toto _e
které řeknete když řeknete Š
a když si dáte takhle ruku na krk tak je úplně zřejmě že když řeknete
šel
tak to tam zákmit ne
tady typoložce ruku tady na ohryzek řekněte šel
ty slyšíte kvanta vibruje že jo této to
vektor _e to už není součástí se tomu se říká neutrální hláska
a vlastně potřebujete ji pokud chcete nějakou samohlásku _e nějakou sou vás to vyslovit protože
samo o sobě to nejde jo
účelně se tady ten neutrální znáte říkáš v a
kdybyste chodili do kurzu fonetiky tak von s o tom budu vykládat celou hodinu možná
tak _e nějaký základní parametry když ty hlasivky kmitají to znamená v _e samohláskách _e
neznělý souhláska
tak tady tohle sou zhruba parametry a kmitají rychle může mají základní tón tak
devadesát a sto dvacet herců děleno mají zhruba dva krát víš a dětičky zhruba
eště vo něco víc
a _e tohle opravdu velmi hrubé přiblížení protože my vlastně nemůžeme jako to buzení rozdělit
buď periodické anebo šumové
on _e to takže ty hlasivky prostě jsou vždycky ta štěrbina i když kmitají
takže ta šumová složka se tam vyskytuje prostě v reálu pořád
a _e mimochodem na tomhle s byly založit budou založeny vlastně hodně velký skok s
kvalitě kódování
si vezmete nějaké staříč ke řečové kodéry s osmdesátých let tak je tomu rozumět ale
tak když mluví taková ta plechová oba jo když to když si vezmete že sem
k o
které je to asi do na denně používáte tak to řeči docela příjemná a je
to právě vo tom že se tam to buzení nedě labutí jenom šumové anebo jenom
periodického že to vždycky nějak dávat dohromady
znamená sice je periodické ale přidává se k tomu ta nepravidelná šumová složka
prostě aby to dobře hrál
tak _e tetě
to co máme na tým ten hlasový artikulační trakt
skládá se z nějakých _e nějaký součástí jako hltan měkké patro jazyka C D a
T
ale jak my se na to budeme dívat _e
my se na to budeme dívat jako na filtr znamená mám buzení které zajišťují hlasivky
a pak mám
docela vobyčejný číslicový filtr
který bude modifikovat to co s toho modelu hlasivek leze
poďme se podívat na takové schémátko jak to teda namodelovat
thomase sou tady plíce
_e jsou buď kmitající hlasivky anebo otevřené hlasivky a tady artikulační ústrojí
no a teďka vtom signálové modelu
bude zdroj stejnosměrného proudu který jak sme říkali tak jako pro
pro _e číslicový zpracování nebudem potřebovat
pak tam bude buď generátor impulsů nebo generátor sumu
a pak tam budu mít normálně lineární
přenosový systém
ročně nadneseně řečeno filtr číslicový
a na výstupu poleze řeč
tak teďka možná
tomuhle tomu lineárnímu systém
_e když jsem vás mučil je stezku a nám
předminule no minulé přednášce tak sme říkali že ty číslicový systémy pro nás budou L
C D lineární časově invariantní
co s toho nebude platit
takže by to bylo kdyby byly časově invariantní dřív prostě to trošku mohl musel dat
do jedné polohy
tam i přišrouboval ta nechali tak
a jenom něco dělat buzením to by bylo hrozně vtipný Z se něco takového _e
a takle bych tady s vámi komunikovat bylo hrozně hezky
jo takže _e my musíme zrušit časovou invariantnost
protože jinak byste se _e jinak byste si moc nepopovídali
vlastně to že člověk mluví
je dáno tím že dokáže mění charakteristiky artikulačního traktu a to docela rychle
řádu prostě desítek milisekund
a tím pádem C koeficienty nebo charakter toho lineárního přenosový do systému se bude muset
čase měnit
tak
poďme ještě o kousek dál
tady je to _e zase nakreslený pohledu zpracování signálu
_e jak to vypadá V
části signálové
jak to vypadá ve spektru
tak a
schválně jaká je tady nakreslen _e hláska měla nebo neměla
nebo samohláska nebo souhláska
že to signál periodický když tam mám nějaký periodický průběh
bude asi bude měla že jo hlasivky
posune musí placatá _e musí produkovat něco periodického
takže _e když se podíváme na to jak vypadá buzení
tak je to takový nějaký prostě sled
krátkých ostrých impulzu
který mají mezi sebou periodu
to je nula
a když jisté periody uděláte převrácenou hodnotu
tak dostanete prostě základní
_e frekvenci základního tónu co vše prostě
můžu normálně vokolo sta herců
_e když _e
bychom si udělali
ještě jednodušší signál
kde by byly jenom takovédle špičky prosím vás
signál je vybila jenom špice a
pizza
skica a tak dále a tak dále kdyby tady tohleto mělo spektru
jo kdyby byly kdybychom byli v analogu tak
je to bude třeba
ty nenáviděl _e diracovy impulsy které sou neskutečně krátké neskutečně vysoké
taky spektrum _e sled
nekonečně krátký nekonečně vysokých impulz
takže ty kritika waves _e začnu mučit když je to periodický signál
tak jeho spektrum musí mít jaké
diskrétní správně musí být čáry
a kde ty čáry budou
spektru sou čáry alexově kde
o
na násobcích základní frekvence jo prostě ty čáry čase sou vo sebe vzdáleny o periodu
vy si uděláte jedna lomeno perioda to vám dá základní frekvenci
a takhle sobotka stanete čáry ve _e ve spektru
když bity _e impulsy byly nekonečněkrát ke a nekonečně vysoké
tak bych _e ty čáry ve spektru
dostal všechny stejně dlouhý nebo stejně vysoký a šli by
výběr do nekonečna jo se samozřejmě _e čistá pustá teorie takže
pokud ty čáry jsou jak konečně
nějak konečně _e
úzké no mají nějaký tvar
teď to už se dostáváme do reálné řeči
tak _e nám velikost těch čar postupně
frekvencí sjíždí
a to asi tak jako vo dvanáct decibelů _e za dvojnásobek primuse říká zvednu oktávu
jo takže tady tohleto je charakter toho budícího
signálu
čase
ano
čas
a tady toto je spektru
tak _e teďka jak je to s tím ne _e jak je to s tím
unifikačním nebo s tím artikulační ústrojí
_e to můžeme čase
říkali jsme že sto bude chovat nebo že to budeme modelovat jako číslicový filtr
co když do filtru pošlu jednotkový impulz že vodpoví
žádnou ping
tak
impulzů impulsní odezvou jo přesně tak když mu tam pošlete jim jednotkový impulz
odpoví impulsní odezvou a impulsní odezva hlasového ústrojí vypadá zhruba takže sto párkrát kmit ne
a pak pro do nuly
když si uděláte fourierovu transformaci takovej impulsní odezvy
tak _e
zjistíte že sou není nějaká maxima
a ta maxima _e se budou jmenovat formanty o toho nejnižší ho
dál se značí F jedna F dva F tři za chvilku si o nich _e
nebo později možná tomhle semestru si o něco řekneme
a eště mě zkuste říct _e čím sou asi tak polohy těch formantů to znamená
to znamená _e polohy těch rezonanční frekvenci čím sou asi tak určeny
pošlite někdy účet na záchodě
já jsem se přiznat že já docela často jo když máte vy červík aplikovaný záchod
a tam prostě zkusíte udělat _m
_m hradlo vlastně jako si uděláte suite
všechny frekvencemi které dokážete zazpívat nebo zamručel
tak ten záchod a koho to máte štěstí se na jedné frekvenci úplně výborně rozkmit
a
a když ještě jako přidáte na intenzitě tak máte tak pocit že spadne to jako
zvlášť pokud člověk jako někde
je v hospodě a pak se necvičila takhle výborná hrací vřele doporučuju
tak _e tedy chtěl vědět čím je tady ta rezonanční frekvence dána
vzdálenosti hosti nelze ani tak ne řekněte se zkusit to přitom při tom úkonu tak
jako třeba po piva strachovat
zjistíte že žádný velký rozdíl nebude
ve frekvenci určuje a já si asi prostě jako zkouším koukáte postupně zvyšovat frekvenci a
na jedné frekvenci to prostě začne vibrovat
čím to je daný
no materiálem taky ale hlavně čím
tvarem a tím megre záchod velkej samozřejmě jo takže úplně stejně se chovají _e formanty
jedna emile při které jsou daný vlastně hlavní má rezonanční má _e hlavním a rezonančním
a
_e prostorám a našeho hlasového traktu ženou to tak
že ten co máte hnedka tam klasická má také tak je taky větší
potom je tam tak zvané místo artikulace to znamená _e místo kde jazyk
je co nejblíže hornímu patru vám tam jako přiděluje ten rezonátor a pak je tam
druhej které prostě tady někde střední části u si jo a kde se bere ten
třetí formátován piston hlavy neřek
jo a tím že vlastně člověk _e člověk různě otevírá posuvů bez mění její objem
a mění tam polohu jazyka tak si prostě hraje tady speech s těmito dvěma s
těmito dvěmi roznáším sekvencemi a mění F jedničkové tvůj
tak a teď tě _e mistra pověděli jo houkání na záchodě a _e jak to
dáme dohromady
časové oblasti jako musíme udělat operaci když ty tady todleto vstup a tohleto impulsní odezva
konvoluci jasně a věděli byste jak se dělá konvoluce když máme na vstupu takovej příjemny
signál který vypadá jako infuzi inertní
tom případě konvoluce docela vpohodě protože konvoluce funguje jako kopírka jo to znamená kdekoliv se
objeví takovej impulz
tak prostě op kreslím ten druhý signál
a mám to jo takže tady si všimněte že prostě sem vokopíroval dvakrát impulsní odezvu
a von zdroj udělal ještě mockrát
a dostávám ten signál čase
tak a jak se tady ta konvoluce projevuje _e ve spektru co se děje
násobí jo takže když si představíte jak vypadá vobyčejný ski násobení tady těhletěch _e dvou
křivek
tak zjistíte že ty _e že ty jednotlivé spektrální čáry
jejich výška už nebude určena _e
přímkou která sjíždí
která C s kopce ale bude určena
touhletou frekvenční charakteristikou našeho filtru takže tohleto je výsledné spektrum řeči
kde tady tu čáru by měl teda nakreslit nějak čárkovaně protože to je vlastně normy
to asi obálka
a hrubý tvar
apod tím sou uschovány
velikosti
jednotlivých spektrálních čar
jo takže prosím vás tady ten obrázek je poměrně důležitý
protože v jednom řečovým spektru
máme vlastně vždycky dvě různé informace
to jak vypadá tady ta jemná struktura tady ty jednotlivý čárky
a jak jsou o sebe daleko ty jednotlivý čárky hovoří o čem
co charakterizuje
poloha tady těch jednotlivých čárek
takhle si čeho
bacha rezonanční ne jo
nosní taky ne
hlasovala cisco jo ty ta poloha jednotlivých čar
udává na jaké frekvenci kmitají hlasivky a potom na každém dalším násobku si kmitání hlasivek
máminu takovoudle čáru typicky ve normální mouž mluvit standardním hlasem tak ty čáry tam budou
odkázany zhruba posto hercích
jo já
mám standardním
základní frekvenci svoji zhruba sto herců jsem naštvanej tak začínám kvičet _e aby to víš
jo
tak _e a tady ta hrubá struktura to znamená jejich
výšky těch jednotlivých čárky jsou dané čím
jsou dané artikulační mu strojím jo to znamená to
co _e co děláte s jazykem
s pusou
a _e nejdůležitější vlastně sou dvě rezonanční frekvence
tady tahle první semene první formant takhle druhá semene druhý formát
tak
_e dodat
a to mnou sme si pověděli takže to že se konvoluuje sme si pověděli taky
a
že ve spektru se jedná o násobení se vám taky
tak a teďka je docela
zajímavý a ne moc _e lehký úkol
tak zvaná dekonvoluce
kdy vlastně já na výstupu hlasového ústrojí mám jenom ten konvolvovaný signál na prostě jako
nemůžu nechce rozdělit o buzení
os charakteristiky artikulačního ústrojí to bych toho člověka musel rozřezat se mu navrtat díru do
krakorec nějaký mikrofon těsně nad hlasivky jo to by se to vyprodával
tak _e že _e my budeme přesto hodně algoritmech zpracování řeči chtít to mít rozhozen
_e
především s kódování jo protože takový vobyčejný ski kodéry který máte každý v mobilu tak
_e počítají s tím že si vlastně spočítají charakteristiky buzení a spočítají si charakteristiky toho
_e artikulačního ústrojí takže my budeme muset nějak kde konvolvovat
a rozseknout _e
to co je co patří hlasivkami co patří tomu na
poďme se podívat
jak na to pudem
eště předtím než se budeme tady zabývat nějakým aby konvolučním a technikám a tak si
ale popovídejme o spektrogramu
_e spektrogramy první laboratoří že
řeči
ví viděli jste pohráli ste si jo
tak
pan sme někteří
_e
dobře co to ten spektrogram je
je to vlastně znázornění průběhu spektra řeči
nebo když to teda vezme přesněji tak spektrální hustoty výkonu protože se nekoukáme žádný fáze
ale koukám se vlastně na absolutní hodnoty _e spektra na druhou čase a ve frekvenci
zároveň jo takže
teďka teda jako budu jenom opakovat osu
jste viděli
tady je čas
to je sekvence
a
s každém nám řečové v rámci v nějakém úseku odhadnu
spektrum dám ho na druhou budu tvrdit že to je odhad spektrální hustoty výkonu
a pak to pomocí budič stupňů šedi a nebo nějaké barevné škály
výplod
tak _e
to že _m
vodorovně čas mysle frekvence a stupně šedino barvičky udávají energii
to je asi jasný tak _e tetě _e se podívejme na dvě věci
podle délky rámce
budeme ty spektrogramy dělit na tak zvaný dlouhodobý neboli long ten
a krátkodobých šel tenhleten schválně ještě nebudu dávat další obrázky
protože to napřed zkusíme tipnou takhle jako z hlavy tak _e ten long ten spektrogram
_e mě pojme
dejme tomu
dvě sta milisekund
kecám dvacet milisekund pět a dvacet nebo třicet milisekund řeči
to znamená při takových těch běžných frekvencích _e základního tónu tam budou mít tak dvě
tři čtyři pět period základního to
i chtěl bych od vás teďka vědět
_e jaké bude frekvenční rozlišení takového dle spektrogram jestli pak tam uvidíme ty jemný částečky
který _e odpovídají jednotlivým frekvencím
jednotlivým násobkům frekvence základního to
a dlouhodobym spektrogram
asi jo že jo jako
informace tam je to znamená pokud si vymyslím frekvenční osu dostatečně mnou
tak tomu vidím takže frekvenční rozlišení dobrý
teďka mě řekněte jak to bude časovým rozlišením když třeba budu chtít přesně zjistit
kde začíná hláska to
ram a takovej zajímavej charakter že ten hlasový trakt i zavřený a pak je tam
náhodou najednou
prostě hrana
zjistit zjistíte to přesně pomocí toho dlouhodobýho spektrogramu
asi ne právě proto že berete v úvahu těch pětadvacet třicet milisekund
a během téhle té doby vlastně s chroustá to je všechno
k dispozici to znamená že když se ten charakter změní během pěti milisekund tak nemáte
šanci přesně poznat je to vlastně bylo
jo tak teďka krátkodobý
tam ne bude mít ten rámec dejme tomu deset milisekund
znamená toto by se tam asi měli pozná se tam chytnete
ale řekněte mi _e jestli tam budou vidět sty
ty násobky
základního tónu
krátkodobý ho spektrogram
proč tam nebudou vidět
_e se informaci se dobra
tesla konstantního projeď ale exeter profesní
chcete uvědomit prostě jako
co ten spektrogram bude hrát za signálem to schválně nepromítám jste zkusili
v hlavě
představit
těch deseti milisekundách _e máte šanci že se ta perioda základního tónu ani jednou nezopakuje
rozhlas pokud budem mluvit arnold schwarzenegger který třeba jako obal frekvenci pod sto osum
tím pádem bude mít periodu dvacet milisekund
základní a vy budete mít teďka deseti mise kovy deseti milisekundový okno
tak tam budete mít jako půlperiody force negra _e vůbec ne celou tím pádem ten
spektrogram nemá šanci
zjistit
_e na nějakejch frekvencích bude ten schwarzenegger Ú základní to nelžete a tím pádem prostě
vám ho spočítat jo naopak časový rozlišení bude perfektní
takže
tady jsou nějaký
ukázky tohle ten dlouhodobý
vidíte že ty vodorovný proužky
skutečně udávají
polo jednotlivých násobkům základního tónu
krátkodobý
jo _m čase je to úplně super
tady třeba _e to je ten můj oblíbený signál létající prase
P je ploutví v a
jo to je prostě povíme hláska kde najít nejdřív to úplně zavřete
tak uděláte je tam rána
takže tady ta rána _e na tom dlouhodobém spektrogramu moc není dobře vidět nevíte kde
to vlastně
_e kde sem to ráno udělal
jo ale vidíte krásně násobky základního to
tady to naopak ráno vidíte úplně krásně čase přesně ohraničena
ale základní to nevidět
co tam vidíte že je jenom ta hrubá struktura
a zopakujeme si ten hrubá struktura je daná čím
jo když bysme si udělali přes tímhle _e spektrogramem
po frekvenčního se to znamená v tomhle případě bych dostal něco takovýho
no
no
čím je daná tady tahleta hrubá struktura
no
tím jak mám postavený artikulační ústrojí pusu
jazyk
jo ale ne buzení
tak tohle byly spektrogramy
a teďka se poďme podívat jakou hříčku které se říká kepstrum
_e to myslíte že bude kepstrum
zpracovatele řeči se vtipálci když spektrum
tak když se zkusíme vrátit
pátky vlastně do časové oblasti ale
uděláme mezitím nějaké transformace to k čemu se vrátíme ta nebude signál ale budeme s
časem tak se prostě jako přehodí spektra kepstra _e a jestli to kepstrum
uslyšíme že bude a J liftrování kvefrence
a tak dál
tak že jak se říká sranda musí být _e kdyby na chleba nebo také poďme
se podívat na před
na to
když budeme chtít E
rozdělit
buzení a modifikaci
jo eště jednou prosím vás ve spektru se mi buzení schovává tady do té jemné
struktury
a to co je hrubá struktura
tech teda
tak je modifikace
artikulační ústrojí a já bych to vykašleme rozdělit
tak _e návrh číslo jedna
je
že _e
ten základní tón to buzení odstraním nějakou dolní propusti
prostě vezmu
dolní propust na čtyřech stech hertze
vím že základní tony prostě sou ten robert čtyry sta herců tak řeknu tak tady
to vy gumu jo
a zbytek
mně bude reprezentovat buzení
a push tady jako zkraje vidíte že to sto nebo tak úplně fungovat
protože my vlastně sice máme základní frekvenci
padesát a štyřista herců
ale díky tomu že to je periodický signál tak jsou násobky toho buzení rozesety úplně
všude ve spektru takže nějakou dolní propusti
do moc nepude
za druhé
_e když bychom
to udělali trošku moc
v ostře
a vzali si nějaké masky systém vám řeknu za výkresů posune tuším _e
tak _e bychom si mohli odříznou první forman
a
tím bysme ztratili docela cenou informaci
_e další takový _e další takový argument proti tomu proč nepoužívat vobyčejný ckou dolní propust
je
že když si poslechnete normálně telefonní signál
tak
ta základní spektrální čára která odpovídá základní frekvenci vona tam stejně není
jo třeba když já třeba nebudu mluvit po telefonu
já vám základní frekvenci zhruba těch sto herců telefonní pásmo přenáší zhruba ostří set do
tři tisíc čtyřicet
tak stejně to základní čára tam nebude a přesto slyšíte velice dobře
zhruba na jaké frekvenci slaví mluvíme si sem klidný nebo
jo vám sice udělat
takže takle to nepude
tím pádem půjdeme k ničemu složitějšímu a to složitější se bude
jmenovat právě kepstrum
tak poďme
si to vzít eště jednou _e
matematicky
jak to vlastně bude
_e s výsledným spektrem řeči
a tady mám nějaký géčko jak to je buzení
tak tady mám háčko to je _e impulsní odezva
toho filtru nad hlasy scrum a
časové oblasti tam konvoluce spektrální oblasti je tam sou či jo
a teď prostě ani v jedné tady z těchto oblastí ani ste konvoluční ani té
součinové to nelze docela dobře
od sebe oddělit protože je to všechno
smíchá no
takže my budeme přemýšlet _e jak vymyslet takové operace aby nám toho dělič lo
tím řešením bude
nelinearita
která nám _e
součinu se ty komponenty neodděluje u snadno
udělá součet
zkuste poradit
co dokáže součin udělat součet
logaritmu
právě takže zase uvidíme
logaritmus který nasadíme nepřímo tady na tu rovnici lena podobnou a ten nám opravdu ty
dvě záležitosti rozsekáme
tak poďme na
tak _e teďka ještě jak se teda bude
definovat kepstrum
kepstrum je
dáno takovou
podivuhodnou
definicí
že mám vlastně logaritmus spektrální hustoty výkonu
a to je dáno taktu se jakási suma C N C N budou právě ty
kepstrální koeficienty
krát _e na mínus J dvě pí F M
tady tuhletu operaci možná už sme někde zahlídli
ne to je neviděli
to bude jeden fourierovu že jo
to je vlastně fourierova transformace s diskrétním časem
_e
normálního číslicový ho
signálu
a my tím pádem říkáme že taková fourierova transformace s diskrétním čase prostě nějaké sady
koeficientů
bude logaritmus kepstra
a je docela příjemný že ta _e že tady tahleta funkce spektrální hustota výkonu je
jednak reálná
jednak je kladná jednak je
symetrická
a když to bude takhle tak ty koeficienty _e který _e kterým
musím fourierovy o transformovat aby tady to hledali
tak budou _e tak budou reálný
antisymetrický
to znamená já se nebudu muset zabývat nějakým a
koeficientama se záporným znamínkem
a bude mně docela dobře stačit _e prostě jedna
řada
kepstrálních koeficientů
tak teďka jak na to
když teda vlastně mám logaritmus
té spektrální hustoty výkonu
která je který je nějaká fourierova transformace
těch _e cepstrální
hycintů
no tak prostě abych dostal ty kepstrální koeficienty tak udělám inverzní fourierovu transformaci té levé
strany
a budeme to mít budeme tolik vyřízeny
jo
a tohle vopravdu základní přístup _e K výpočtu kepstra
kdy
_e trochu si zopakujeme jak se dostane tady také psů spektrální hustota výkonu
spektrální hustota výkonu není vlastně nic jinýho
než že vezmete fourierovu transformaci toho základního signálu
já ty u do absolutní hodnoty dáte to celý na druhou
a máte odhad spektrální hustoty výkonu
jo a my jenom když počítáme spektrum
která pardon kepstrum
tak tady toho musíme zlogaritmovat
pak to musíme prohnat
zpětnou
fourierovu transformaci
a dostanu kepstrum
jo takže prosím vás všimněte si že to je trošku něco jinýho dneš jako _e
kdybych tady měl
kdybych udělal tady tuhletu operaci kdy udělal zpětnou fourierovu transformaci
přímé fourierovy transformace
toho signálu
co bych dostal teďka
pátky signál jo úplně ten stejnej _e čase
není to u kepstra tak protože jednak
berou pouze modul
eště na druhou a ještě ho vlastně zkomprimovaly logaritmem
to znamená v časové oblasti pak dostanu něco co se trošku podobá tomu _e základnímu
signálu
ale není to ten základní signál uvidíme za chvilku to bude
tak a teďka prosím vás jenom _e slovíčkaření
_e ze spektra sme tady touhletou operací přešly do kepstra
tady je vlastně proměnná frekvence tak aby to bylo za velmi tak tady bude kvefrence
když budu tady _e nebo na tom základním signálu něco filtrovat
tak _e B cepstrální oblasti li studovat a tak dále no tak byste si ještě
vymysleli nějaký další
straničky
tak _e teďka si ale pojďme ukázat jestli to řeší náš problém
já zopakuju že náš problém je ten
že máme vlastně nějaký signál řečový
série konvolucí buzení
a impulsní odezvy ale prostě nevíme
jak _e jak rozetnout sem odsoudila se jsou konvoluci se pojďme podívat na to jestli
to kepstrum nám ten problém vyřeší nebo ne
tak _e když tady tohle
rovnici převedu do spektra tak tam bude vobyčejný ski násobení
to znamená spektrum signálu rovná se
spektrum
uzení krát spektrum _e modifikačního ústrojí
že mu spektrální hustotu výkonu
tedy spektrum v absolutní hodnotě na druhou
tak tam bude zase
tady tohleto násobení
no a teďka _e se poďme podívat
co s tím _e vyrobí spektrum
musíme si uvědomit dvě věci
za prvé že
fourierova transformace přímá I zpět na
je lineární to znamená že pokud _e do
to je fourierovy transformace strčíte
součet
tak to můžete úplně stejně napřed jako fourierova transformace toho prvního operandu plus fourierova transformace
toho druhý operand
todleto je jedna věc
druhá věc je tá že když máme _e logaritmus
součinu
tak to můžu napsat
ekolog a plus
globe tak a teďka se poďme všechno zkusím dát dohromady
napíšu si _e jak bude vypadat kepstrum
tady tohohle _e tohle součinu
to znamená udělám s toho logaritmus pak to všechno
pro ženu zpětnou fourierovou transformací
první věc kterou můžeme _e
udělat je že si tady ten logaritmus součinu
zapíšu pomocí součtu logaritmu
a potom řeknu no jo já tady mám součet tak poďme to separovat prostě napřed
udělám zpětnou fourierovu transformaci tohodle
a pak udělá zpětnou fourierovu transformaci to je to
a najednou zjistíte že vám s toho vypadávají vlastně dva
členy
dvě různé sady kepstrálních koeficientů
z nichž že
tady
ta první odpovídá buzení
a ta druhá bude odpovídat
artikulační ústrojí
jo a samozřejmě jako voni na té _e kvefrenční ose
se sečtou
takže teďka je otázka jestli budu mít štěstí je sňatek referenční o se tady tyhlety
dvě sady koeficientů jako dokážu oddělit
nebo nedokážou plný dálnic bylo kdy jedny prostě byly někde velký a pak byly nuly
že jo
a ty druhý koeficienty vy byste
druhé části nenulový a zase ste první části byly nuly bych tam prostě v důkazu
udělat hranici
kde jako kdyby fungujou jedny a kde fungujou druhý
no a naštěstí tady todleto udělat de
docela to docela to vychází
poďme se podívat
my se podívat na výsledek
tak se jsem pro vás připravil nějaké obrázky tohleto je signál to je nějaký áčko
nebo téčko _e řečovým signálu
tohle je potom spektrální hustota výkonu to znamená modul spektra na druhou
všimněte si jakou to má velkou dynamiku jo _e jsem vám tady říkal myslím minule
když uděláte spektrum a na to v absolutní hodnotě na druhou tak to jsem o
sobě není moc ke koukání protože to druhá mocnina prostě vám to dynamiku roztáhne tak
že velký čáry jsou opravdu velký
a ty malinký potom vůbec nevidíte
ten další obrázek i když tady
_m tohle věc pro ženete logaritmem
co se vše docela příjemný že jo protože _e
tam
pěkně všechno vidíme
a poslední obrázek je kepstrum
když tohoto
všeho
uděláme zpětnou _e fourierovu transformaci
tak a teďka na tom obrázku to není moc vidět
proto sem tady pro vás připravil takový pěkný dům
_e
tohleto
vodorovné bude kvefrenční osa
v hráčem
se měřit všem bude kvefrenční os
časová osa u diskrétního signálu je normálně ve vzorcích neboli v ničem
kvefrenční
taky
no ničem prostě ty koeficienty C N
tady to enko to nemá žádné rozměr to je normálně počítadlo vzorků jo takže na
kvefrenční ose
bude vobyčejný ski počítadlo vzorků
no a _e teď se podívejte
ten nultý
cepstrální koeficienty taková kapitola sama pro sebe
protože ten vlastně odpovídá logaritmické energii toho signálu
potom tam mám za pár koeficientík u
který odpovídají to modifikační ústrojí kdy filtru
potom něco co můžeme pokládat za nuly s trochou představivosti
a pak tam budou mít takový vlastně bestie nebo
s bloky koeficientů
který budou odpovídat buzení
a uvidíme tam několikrát tom cepstru a to je protože _e tady vlastně
budu mít
_e s hluk
který odpovídá
prvnímu násobku
a teďka čeho
buzení
periody nebo frekvence schválně
chce se tady tadleta vzdálenost
to je
sorry za černa
no bacha základní frekvence to není jo sme už zase zpátky v časové oblasti
takže co to asi bude
až ortonormální vlastně perioda
perioda toho našeho zvuku
ve vzorcích
jo prostě to co jsme před chvilkou viděli _e u signálu
akorát že to bylo vlastně všechno do míchané dohromady
buzení tak tady tahle ta perioda
se nám bude promítat _e
do vzdálenosti
vzdálenosti tady tohohle hluku od nuly znamená tady toto je perioda potom už vidíme další
z luk _e těch vzorku na další periodě a tede a tede
co je prosím vás hrozně důležitý je že opravdu té tím že tady ty skupiny
_e skupiny kepstrálních koeficientů se dají oddělit můžete si tady prostě udělat hranici
a říct _e obvod tady této hranice doleva to brak to patří filtru
a o té hranice doprava to patří buzení
a najednou máte dekonvoluci hotovou protože tady tyhlety koeficienty dejme tomu C nula
se dvacet devět
určují charakter
filtru
tady ty co sou vpravo tak hoši charakteru buzení
tak
koncem to jinak N chystal nějaké
jaké obrázky kde vopravdu
_e zkouším co to uděla
když se ta druhá část
_e kepstra vynuluje
tak tady jsem si zkusil udělat _e takovou fintu kde vlastně beru kepstrum
a teďka pozor aby nám ty fourierovy transformace s vycházeli
tak to musím vzít eště s tou
_e otočenou
otočenou částí
a zkusil jsem vynulovat
těch pár vzorku
který patří _e právě artikulační ústrojí
já teďka sem že úplně naopak
_e jako když nepočítali
kepstrum to znamená že
to znamená že sem _e
že jsem udělal
fourierovu transformaci s kepstra S kepstrálních koeficientů
pak jsem to vod logaritmu val
pak se muselo udělat několik špinavých triku protože tady je absolutní hodnota
na druhou kde ztrácíte informace o fázi a já sem se chtěl za generovat signály
takže jsem do tohoto fázi nějak potřeba dostat zpátky nebudu teďka rozvádět jak ale jestli
chcete na tyto špinavě triky podívat
tak se mrkněte na webovou stránku stréčka kde mám přiloženy ty matlabové kódy
a pak sem udělal _e zpětnou fourierovu transformaci abych dostal signál poďme se teďka podívat
jak to vyšlo
ták
tohleto jak jsem říkal tak je spektrum s vynulovanou
_e rozvinulo mazným a část mám který patří buzení
tady bude logaritmus spektra
od logaritmován o
a
získaný signál kdy jak sem říkal jsem usoudil nějaké špinavé triky abych _e abych dostal
_e
abych dostal správný fáze
když se tady na tohle podíváte tak tady toto skutečně odpovídá signálu který máme někde
na dva cívka má
sou to vlastně krátke úzké impulzy které pocházejí s tou plácání hlasivek
a všimněte si
že tady na tomhle signálu nejsou viditelné takové ty zákmity
jo který většinou vidíme řečovým signálu
tady ty zákmity vlastně ta dlouhodobá _e nebo _e
který sto za vlnění ty jsou tam vopravdu proto že máme nějaké rezonance
které potom obrábění signál hlasivek a když se dostanete třeba pomocí právě cepstrální analýzy
k tomu signál hlasivek
tak prostě tam nic takového není to sou jenom tak leč
řekli díky
R _e které odpovídají
základním tónu
tak poďme teďka zkusit s tu opačnou operaci
dyž sem vlastně vzal
zase kepstrum a vynuloval jsem všecko co nepatří
_e co patří buzení a k o nepatří tom unifikačním ústrojí
tak tady tohleto je
logaritmus získaného
spektra
tady je vod logaritmován o
_e tady jsem zase převedl
a signál
a tady toto je zase
jakýsi tvar
teďka mě zkuste říct čeho
řezy dneska jednou viděli akorát že jsem to měl namalovaný vod ruky a tady je
to
spočítat nejsou pro blízkejch dat
mojí řeči
to co tady vidíme na tom posledním obrázku jak je to červenou obsaženo
že
impulsní odezva filtru přesně tak kdybych prostě byl sadista a tady si
_e operoval nějaký impulzní generátor a pak tam opravdu
pouštěli to přesně špičky
tak by mě pusy vlezlo
tady tohle
že bych opravdu nechtěl se to rači spočítám
radši strávím půlhodinky matlabem jo prosím vás
jo takže _e viděli jsme že pomocí cepstrální _e analýzy
dokážou opravdu rozetnout dva komponenty
řeči buzení filtr
tak teďka se vo tech _e keeps track poďme pobavit eště
eště trošku více
protože
to jak sme to kepstrum _e vygenerovaly
já vám schválně napíšu jak to bylo
_e kepstrální koeficienty jsou zpětná fourierova transformace
Z logaritmu
přímé fourierovy transformace toho
signálů
a to přímá fourierova transformace tam byla s absolutní hodnotě
na druhou jo tak takhle sme vyrobili spektrum _e teda kepstrum
teď mně řekněte ty
tohleto
_e
_m _e nebo z ohledně nějaký charakteristiky lidskýmu slyšení
a nebo jestli je to jenom čistá matematika
kterou jsme si mysleli aby se do lode konvolvovat
tak dobrýho logaritmus beru že tam je _e že _e že je tam je tam
zakomponovány a slyšení logaritmické znamená intenzity neslyšíme lineárně ale slyším logaritmicky dobře to tam je
tak to zde letech teďka týče zpracování jednotlivých sekvencí
tak tam jako nějaký něco podobného uchu máme nebo ne
zaměřte se na tu první operaci kterou signálem uděláme
a to je fourierova transformace vobyčejný D F téčko
do kterýho narvete N vzorků vono vám vyplivne zase N vzorků a těch N vzorků
je takhle prostě rozesety jich
o T od nuly až skoro
do vzorkovací frekvence
tak tam nic lidského není
jo protože ta fourierova transformace má naprosto přesné frekvenční rozlišení na všech frekvencích
se kterýma se kterýma děláte access ušima
slyšíme dobře
a úplně stejně na do nich sekvencích jako na horních nebudete nějaký na
takže řeknu správně a o toho jak se moc hráli by kdy v mládí a
vaří vypracovat se to
_e vykládal
_e ale je to tak že vlastně už na nízkých frekvencích slyšíme líp dokážeme ty
frekvence líp rozlišovat si vemte si že když hrajete na klavíru
také kladky tady vlevo nebo proti sobě tak slyšíte přesně co tyto neznamenají a dokážete
tam odhadnout jednotlivé intervaly hudební a tak dále a když jedete na tom klavíru vpravo
tak už nevíte jako je to blbě naladěný nebo slyším to blbě prostě
oktávu nebo kvintu nepozná
takže _e na nízkých frekvencích vaše ouško
lepší rozlišení
na vyšší horší
takže my to zkusíme nějak _e nějak _e emulovat
a bude to tak
že namísto _e namísto obyčejných k _e fourierovy transformace
při tom spektru na taháme nějaké filtry
které budou mít
zhruba takovéhle tvary tady budou ústě budou úzké
a postupně k vyšším frekvencím
se budou zřetězovat rozšiřovat
a to kepstrum budu počítat z výstupu tady těhletěch filtru
jo
k tomuto se budou chovat jako k jakési hrubé reprezentaci spektral která u zohledňuje to
co se mně je zkoušku
a potom ty další operace jako logaritmus a zpětná fourierova transformace tak zůstanu skoro stejný
tak _e
poďme se podívat do se na to jak se to implementuje
_e to rozmístění filtru ve frekvenci se řeší pomocí tak zvané milost skéro melové škály
troše nějaká prostě nelineární funkce
která mě vlastně nelineárně upravuje frekvence _e takové pěkné české slovo word po je jo
takže tady prostě nelineárně war po ju frekvenční osu
_e tetě _e když na té milost k _e škále
rovnoměrně rozmístíte nějaké filtry nebo si tam uděláte prostě značky
a ty značky promítnete zpátky
do té původní _e na té původní
frekvence
tak zjistíte že se vám to
takhle
pěkně
nelineárně
rozrostly jo
tak já mám velké výtvarné nadání to už víte že _e prostě dostáváme na sekvenčního
se nelineární rozmístění bodu
a potom už stačí abych jenom kolem těch bodu
na tahal takovéhle filtry
řekli si že třeba střed toho _e
filtru bude určen daným budíkem a podvo toho minulého bodíků k tomu dalšímu
not a tak dál a tak dále jo laškuješ tady bych dostal kuželkářské filtr
a dostaneme _e takzvanou mel ovskou banku filtrů
tak _e
tech _e
než půjdeme dál tak mě zkuste říct
jak takovou banku filtrů naimplementovat
jo potřebuju prostě posbírat energie
z nějakejch filtru cifrou trojúhelníky s se budou jako postupně rozšiřovat
tak bych chtěl nějaký rady jak to udělat
bude takle počítat spekter
tak
jedna možnost by byla vo opravdu takový filtry navrhnout
jo nějakou návrhu metodou prostě
udělám si
opravdickou sadu filtru to znamená tady budu mít _e
vstupní řečový signál
ten zavedu
no prvního filtru tu tady tohleto bude třeba
_e
jedna tady tohoto budeme dva a tak dále takže jedna
tady bychom měli druhej sintr a teda to do
hele ty filtry by
_e vypudili nějakej výstup
jo takže tady vydali třeba
Y jedna na
Y dva na
a tak dále a tak dále ale bychom potom na určitým rámci řeči třeba sto
šedesát i _e vzorcích
o sčítali druhý mocniny vzorků na druhou a dostal bych energii která leze z toho
daného filtru
to by nebylo moc příjemný
tak
chtěl bych ještě nějaký jiný návrhy
jak
abych _e věděli jak ale nevíme
tak _e zkusme použit dycky jako
když máte to kladivo a teďka máte jako vedle
tu elektronikou tak
že čte nástroj máme neděsme toho mohli zkusit jako uříznout nejsou i do té elektroniky
tak zkusme použito co máme
co máme k dispozici
z mínus počítání vo vobyčejný skývu kepstra
dneska jako první operaci
fourierovu transformaci jo starou dobrou
fourierova transformace co nám dá ono nám dá spektrální čáry takhle pěkně
_e ve všech
mnoha frekvenčních bodech
který jsou rozmístěny vod nuly ač někde
_e
těsně před vzorkovací frekvenci
to znamená že takovy
běžný přístup výpočtu mel frekvenční cepstrální koeficientu je takový
že prostě z těch spektrálních čar
který nám udělá fourierova transformace
uděláte
_e absolutní hodnoty
vezmete na druhou
a potom se vezmou takovýhle
charakteristiky
jednotlivých filtru
a ty se použijí jako váhy pro jednotlivý koeficienty _e samozřejmě absolutní hodnotě na druhou
fourierovy transformace
a normálně vlastně pro násobíte
ty koeficienty danými filtry to znamená kdybych vám to ukázal třeba tady
například u tohoto
_e teď budu který budu prostě kecat _e tady bude dejme tomu
raz dva tři čtyři pět šest sedum
osum _e
osum čar fourierovy transformace
a my bychom si to mohli rozpočítat takže dejme tomu podle této křivky tenhle sebou
násobit nula celá jedničko celá tři
nula celá čtyři nula celá já nevím osum jedna
a podobně tady tyhle prostě takhle si navazujeme normálně koeficienty vobyčejný vské fourierovy transformace
po sčítáme a máme výstupy jednotlivých filtrů jo a s těma pak můžeme dál pracovat
takže to todle sou že namalované _e jednotlivé filtry
tady máme vlastně _e zopakováno co si mám teďka říkal
_e děláme to vopravdu takže uděláme D F téčko umocníme vynásobíme trojúhelníkovým oknem
a sečteme a tak dostanu výstup jednotlivých filtru
a tetě nás čeká logaritmus
a potom zpětná fourierova transformace
jo a teďka ještě u té zpětné fourierovy transformace se tam používá jedna finta kterou
tady nebudem brát detailně ale má takové docela pěkné odvození tak by vlastně koho zajímalo
takto vyhrabu a
_e můžem si to tady udělat kdy vlastně ta zpětná fourierova transformace je nahrazena
tak zvanou kosinovou transformací
která je příjemná tom že neobsahuje žádný _e žádný komplexní čísla
jo ta kosinová transformace se dá použít
tom případě že to spektrum je symetrické že je celé reálné
že jo
a _e že víme že ten výsledek musí být taky reálný když tady tyhlety podmínky
platí přes všechno Ú kepstra platí
tak si můžem dovolit tu zpětnou fourierovku _e nahradit
tak zvanou diskrétní kosinovou transformací
celé se nám to pěkně zjednoduší jo takže tady ten vzoreček se nemusíte určitě nazpaměť
ale vězte že na základě výstupů jednotlivých filtrů
jejich logaritmu
je potom možné pomocí dete tečka
dojít
k mel frekvenční cepstrální klasicky
tak teďka tady mám ještě takovou pěknou grafickou ilustraci
abyste si dokázali představit jednotlivé informace které tam které tam pouze nebo jednotlivé operace které
tam fungují
krátkodobá nebo
prostě obyčejných K _e diskrétní fourierova transformace
tak krátkodobá znamená že funguje na jednom rámci řeší tedy na nějakých těch dvaceti milisekunda
což odpovídá prostě třeba sto šedesáti nebo dvěma stům vzorkům
všecky
všecky _e jej výsledky vezmu v absolutní hodnoty
tak bych to je doplněn že na druhou
pro ženu to
tou maskou banku filtrů
logaritmem
a uděláte diskrétní kosinovou transformaci kterou se dostanete
K ke kýžený _m melfrekvenční _m
která lním
koeficientu stresu
M F
to co
teďka ještě abyste si dokázali představit výsledky těch jednotlivých operací
tak _e tady tohleto je _e jeden rámec řeči že nějaký
tady bychom měli ten samý rámec řeči
po
preemfázi to znamená vyrovnání se kmitočtové charakteristiky s
vytažení vyšších frekvencí a oknová ní
jo to okno vání
dobíháme tím hamming hammingovým oknem který vypadá takhle
_e
jenom pro připomenutí
čím se dělá ta preemfáze
toto vůbec znamená jsem řekl vyrovnání kmitočtové charakteristiky
zvýšení podílu vyšších frekvencí
že se to teda bude dělat
tak byste s tohodle signálu dostali to je ten zprávu
horní propust správně jo a _e eště vás budu dusit dál kdybyste tu horní propustili
_e udělat _e
co nejjednodušší jenom pomocí fire filtru který bude mít jenom jednu jediný zpoždění a jeden
jedinej koeficient
K by to bylo
dobrý aby by to bylo vy byste to chtěli ještě brutálně jinak byste k klidně
mohly sejí beztoho koeficientu obejít říkat
vezmu současnej vzorek mínus minule vzorek
a prostě tvrdý ode čítač
_e čas něho
nebo minulýho o T současnýho a
to by potom _e vlastně vůbec nepropouští ho stejnosměrnou složku a to by nám vůbec
nevadí
tak _e jo _e tohle byly operace o kterých jsme tady povídali minule
takže jenom jak _e zvýšit podílu vyšších frekvencí v řeči
teď prosím vás _e tlustou černou čarou
tady máte nakreslené _e vobyčejný s ke spektrum získané pomocí D S péčka
a pomocí těch _e otečkovaných čáre czech jsou tady opravdický
_e opravdický mel filtry
kterých by mělo být
dvacet tři
se takový magický číslo který se používá schválně
ano
no _e já se jo i kalhoty tři no to je krása
takže _e poté co vlastně
po sbíráme takhle
_e pomocí těch trojúhelníkových filtrů
energie v jednotlivých
pásem norských tak dostanu
třiadvaceti bodový spektrum jo to znamená to je ta hrubá reprezentace spektra která nějak odpovídá
tomu našemu _e roušku
vidíte že tam ještě poměrně to veliká dynamika kterou srazíme
logaritmem
a
toto je poslední výkřik
a to je _e a to je diskrétní kosinová transformace
toho _e toho milánský ho
to znamená skills pek
tak u té diskrétní kosinové transformace _e je to tak že si většinou jako lidi
nedokážou přesně představit co to _e toto děla
tak _e ta kosinova transformace podobně jako všechny transformace sou vlastně jako promítání nebo určování
podobnosti
tady tohle průběhu jakejma kouska má kosínů
jo tak schválně si poďme _e pod nezkusili sto ty jednotlivý kousky kosínů jsou
_e
ten první koeficient nebo nultý koeficient se počítá takže
vezmu
vezmu stejnosměrný průběh
a jenom to vlastně všecko posčítám mám pocit že ten _e nultý
tady možná ani není ukázaný a nebo je to tady tenhle to teďka přesně neví
ten druhý koeficient
se počítá ta
že vezmeme
půlku kosínů
a zjistíme jestli se tomu ten náš průběh
jak podoba
a zjistíme že se tomu podobá docela ale naopak že jo
jo prostě tady _m _e dolů a tady toto D nahoru
a pokud sedum podobá takle opačně
tak _e poté co si vlastně pro násobíte
vzorky
toho černýho průběhu s tou
tak zvanou bázovou funkcí ze kterou prostě jako násobíte všechno počítáte
tak dostanete záporný číslo
takže jsme někde tady
_e schválně jak bude vypadat a další bázová funkce
tam bude jedna celá perioda kosinu sto dobře pamatuju
todle
a teď teda jako _m bych se musel trošku bodu máte ale
_e pokud
tento průběh
pronásobíme
s tím černým průběhem
tak ono to vypadá docela podobně
jo
dostáváme složky
kladné záporné kladné o kdyby se nám navzájem věnujou
amen a dostanu tady ten sme si ten pak už to nebudu dál malovat
protože byste nesvedl ale _e prostě často jako by řekne ježišmarja transformace toto je to
představit transformace většinou opravdu není nic jinýho
než že máte nějaký průběh signálu nebo spektra tady v tomhle případě
a teďka ta transformace má nějaké své
tak zvané bázové funkce
do kterých ten signál nebo to
_e základní spektrum promítá se a teďka ježišmarja toto je to co to znamená promítat
promítat
znamená říkat si jak je to moc podobný
a je jaksi říkat jak je to podobný
no prostě takže ty vzorky které jsou
nad sebou tak vynásobíte a všecko to sečtete
jo to je celá podstata _e
zcela podstata transformace
tak
tohle je ho v _e K má frekvenčním kepstrálním koeficientům
ke spektru obecně
teďka nevím vašeho přestávku jenom půl minutový oddech
a
jsem se podívat
do L T tečka
tak další oblíbené zima zvětšuje L P se
lineárněprediktivní koeficienty nebo lineárněprediktivní kódování
a nebo jenom
lineární predikce
tak to sou tady pude
zopakujeme si rozřezané ho pepíka a
signálový model toho
co se pepikovi dětma se
pak možná něco o tom proč lineární predikce a pak si něco řekne mu odhadů
koeficientů toho filtru který vlastně reprezentuje naše artikulační ústrojí
_e pak tam budou nějaké další detaily těm se zase dostane máš příště
takže _e rozžhaveného pána se dneska viděli
_e
tohleto
tady se vlastně snažím
namodelovat nějak signál obě
tu část která je nad hlasivkami jo to znamená
tenleten plus trubky
se budu teďka snažit nějak _e namodelovat pomocí
číslicového filtru
a teď
tímto proběhnou poměrně rychle protože to trubku vlastně může namodelovat jako jakýsi filtr mají ty
hlasivky se taky chovají částečně jako filtr
kterým R hlasivky potom model hlasového traktu znamená od hlasivek aspoň pusu
a konečně model vyzařování _e zvuku
který mi říká jak se bude měnit
nebo jak bude vypadat frekvenční zastoupení
odpust si dál když to půjde ven
a tady bude jako spousta rovnic jakýchsi koeficientů ale důležitý bude výsledek
jak bude vypadat struktura filtru kterým to na modulu všecko dohromady protože když to potom
budete _e implementovat mobilu
tak vám bude srdečně jedno jestli jsou tam nějaké koeficienty které modulují vyzařování zvuku nebo
nějakou dutinu někde budete chtít aby to mluvilo
takže
jenom
poďme _e poďme po kouskách
_e
u těch hlasivek
to dokážeme dát dohromady pomocí jakési dolní propusti
která bude druhého řádu to znamená
bude to filtr IIR
ve jmenovateli bude jedna
_e mínus něco krát Z na mínus prvou
plus něco krát Z na mínus druhou jo tady těch konstanta za chviličku
potom budeme mít _e
hlasový trakt
auto hlasového traktu řekneme že _e tam budu mít prostě za sebou kaskádu nějakých rezonátoru
my sme si řekli že _e tam budou nejmíň dva jo prostě velká dutina malá
dutina ale můžu si tam natahat víc
aby to spektrum bylo _e
přesněji zachycené a každý takových rezonátoru uděláme zase namodelujeme filtrem IIR druhou _e druhého řádu
to znamená že
ve jmenovateli bude _e jedna mínus
něco krát Z mínus
prvou plus něco krát Z na mínus druhou
jo teďka prosím vás tady mám nějaké parametry
_e alfa Í beta Í které nám určují polohu a šířku těch rezonanční frekvencí
ale na to teďka prosím vás zapomeňte prostě je to vobyčejný _e příček
jeden takový sestřiček modeluje jeden
rezonátor
a když těch rezonátoru budete chtít dat spoustu do série
tak prostě takových příčku uděláte za sebou
_e několik a jejich _e
jejich přenosové funkce se navzájem budou násobit jo to znamená tak bysme měli
jedna
jedna lomeno nějaký jmenovatel krát jedna lomeno nějaký jmenovatel krát jedna lomeno nějaký jmenovatel a
dokážeme to napsat takže vlastně všecky ty jmenovatele zapíšem pomocí nějakých koeficientů a před těmi
přeměnám jako je P
velké
což znamená násobení
jo takže tohle je vlastně ta hlavní část ten hlasový trakt
a pak tam budu mít eště model vyzařování zvuku
tady tenhle filtru sme někdy viděli ne
toto je
to známe
to horní propust dolní propust
nic
to byl za která
tak bych se možná mohlo čas podívat se tam mám napsané
nebo používat nějaký
jakou lapačky lůzy _e bych to zakryl no jo no tak to je horní propust
a mimochodem jsme viděli u preemfáze něco velmi podobného jo
viděli jsme jedna mínus nula celá devět
Z na mínus prvou
což byla taky horní propusti no a teďka když to všechno dáme dohromady
hlasivky hlasový ústrojí vyzařování zvuku
co musím udělat
že chci tady tyto tři přenosové funkce
spoj
jak na to budu
když chci jenom jednu jedinou přenosu
no tak mu nejsou kaskádě že jo to je prostě sériové zapojení hlasivky trubka
pusa to znamená že navzájem vynásobím
tak a teďka je tady taková vošklivá veliká rovnice
ale naštěstí _e se tady tou rovnicí dá něco dělat
a my totiž můžeme říct že _e nějaké konstanty tady jdou v nule
to znamená tady
dostávám cosi jako
co si jako
E na mínus prvou
_e pardon
z na mínus prvou
na druhou a když se podíváte
co s toho z toho vychází
tak vlastně čitateli dostaneme jedna mínus na mínus prvou tady jedna mínus na mínus prvou
na druhou
tak se s toho můžeme velice elegantně bavit
a máme _e čitateli
obě čínskou jedničku
že hrozně příjemné protože jak vypadá filtr který má čitateli jedničku
když tři
když budu síť vrátím se
do takového
pro přednášky vo zpracování signálu a teďka tady někde mám
schéma obecného filtru
tak mně řekněte k vypadá filtr kterýma čitateli jedničku
ta levá část moment co
ne nejen ta levá část in ta pravá část jo prosím vás
to se v čitateli tak odpovídá té vstupní části tam kde se zpožďujou vstupní vzorky
násobí se nějakejma koeficientem a
a to tady prosím vás vůbec nebude
proč karet
vstupní vzorek poleze přímo do sčítačky
a jmenovatel odpovídá výstupní části
to znamená tam se zpožďuje výstup
násobí se koeficientama zase se zase se přičítá jo
takže já to bude mít usnadněn _e tím
že tam žádná vstupní část nebude
a
tyhlety koeficienty
_e samozřejmě mají nějaké hodnoty ale to mně teďka vůbec nebude zajímat nebude zajímat pořád
takového filtru
jo k těm koeficientům totiž _e za chvilku dojdeme jinou cestou
zásady toho filtru bude _e bude jaký tady mám nejvyšší hodnotu Z na mínus druhou
_e
tady mám nějaké K řekněme že bych takhle chtěl namodelovat pět rezonátorů pět prostě různých
rezonanční frekvencí
tak mně řekněte
jaké nejvyšší mocnině se tady to zetko nebo nejnižší mocnině
bude _e bude objevovat
že tam nějaký výraz sami Z na mínus druhou
a teďka já takových výrazů mám
pět závorkách vedle sebe a všecky ty závorky pro násobit
mínus řeka jo dobrý takže když to káčko bude pětka ten tam bude Z na
mínus desátou
jo
pak tam budu mít eště jedno
z na mínus prvou
který víde tady téhleté _e z této závorky
to znamená že bych měl vlastně mít _e
nejnižší dát toho zetka nějaký Z na mínus jedenáctou
no a to je tady někde spočítáno prosím vás
_e já se na to velice často vykašlu a volím si něco rozumného nějaký sudých
dát takže taková rozumná hodnota
řádu
toho číslicového filtru který toto všecko
_e vezme do uvaří který toto všecko na modeluje
tak bude prostě _e deset
nebo když budu mít
vyšší vzorkovací frekvenci než telefonní
tak třeba šestnáct
jo to znamená jenom prosím vás M a vystrašil jakýmsi skládáním _e přenosových funkcí
důležitý je to co s toho víde vyjde s toho obličej nízký
IIR filtr
tedy
a to triviálním čitatele jenom jedničku to znamená leze do něho jenom vstup
a má jmenovatele
který má krát prostě deset nebo šestnáct podle toho _e
podle toho co si zvolíme
jo takže eště jednou abychom si to opravdu zopakovali tenhleten filtr
u
na ten filtr bude mít
přímo vstup
N
tohle tam nebude
a _e tady budeme mít
deset
zpožďovače k
a budeme tady mít
deset koeficientů
a jedna
až _e deset
tak teďka měli sme nějakou klasifikaci filtru měli sme si R
čistý IIR a obecný Í R tam byste ho zasadili takový filtr
čistý IIR jo Í R je nekonečná impulsní odezva protože opravdu ten filtr kterej požírá
si vlastní výstupní vzorky
tak si jako vystačí some a bude si pořádně co generovat
a _e je čistý protože nemá tu vstupní
nemá to vstupní část
tak
tak sme si pěkně řekli _e
ku
jo
pěkně sme si řekli jak teda budeme _e
modelovat _e to artikulační ústrojí
že to bude vobyčejný scheme IIR filtrem
_e tetě _e jako je krásný že vím teda kterej filtr to bude ale ještě
bych potřeboval znát jeho koeficienty
a to nebude
zcela triviální o tom si teďka budeme povídat
takže _e nejprve o tom
jak to teda probíhá když do takového filtru pustím
nějaké buzení tady vám prostě generátor buzení
který produkuje nějaký budící signál jo tady mám značený jako Ú N
tady je prostě knoflík volume
jo
géčko který udává jak ten výstupní signál bude velký
a tady je
ten číslicový filtr _e jedna lomeno A Z
který je čistý IIR
a ten bude produkovat výstupní řeč
no a _e já bych si mohl
zkusit napsat _e tu rovnici která popisuje chování filtru
když mu přivedu nějaký vstup jaký bude výstup taktika dva zase trochu po zkouším jak
se ta rovnice menuje u číslicových filtrů
tři možnosti buď semene diferenciální diferenční nebo a milion ať
tak ta druhá bys diferenčního disk bacha diferenciální je ta C u spojitých systémů s
tou to si radši nezačínej _m
takže _e diferenční rovnice takového filtru zase si ukažme to jeho schémátko
když mu na vstup no
mu nastup _e
přivedu signál G krát Ú N
tak tady ten výstup
bude tvořen vstupem
rovná se G
u no
já se omlouvám že jednou mám ty závorky kulaty podruhý hranatý o to _e nemocnice
mínus A jedna
Y N mínus jedna
mínus _e dvě
Y
N mínus dvě
a máš jak se ti a
Y _e teda pardon
a P
Y N
mínus T
jo
diferenční rovnice
tetě když to budu chtít zjednodušit abych se neupřel roku
tak _e napíšu mínus suma
a tady něco špatně
pardon já jsem já sem to trošku zvrtal protože já jsem to výstupní řeči označil
teskem
_e tam sem navazovaly D Y i takže ne prosím vás výstup toho filtru je
S jo omlouvám C protože to prostě tak
tak _e teď teda jako _e perfektní vím jak tu rovnici napsat
ke čím bych to vybudil ale mám problém s těmi koeficienty A Í
o kterých netuším
jak mají být velký
takže
poďme
zkusit sepne zkusit spočítat
budete počítat jako zvláštní metodou
když si vlastně řekneme tady _e toto je člověk
a u toho člověka
při představuju že má prostě sobě nějaké buzení
že má sobě nějaký filtr jedna lomeno A Z
a toto je vlastně hranice kdy když toho člověka nechci kuchař skalpelem
dokáže se dostat k datům to znamená tady
tady je signál S N
a ten dostanu
jo hrozně rád bych se mu napíchl sem
a nebo přímo viděl koeficienty toho filtru ale mám smůlu protože to je prostě schované
nevíme uvnitř tomu pánovi
a řezat emil nechce takže tohle sou jediná viditelná data
takže _e já na to pro takovou flintou
já řeknu _e asi udělám filtr který bude vlastně inverzní k tomu co má ten
člověk zabudovaných sobě
ten filtr bude _e Z
který bude mít naopak jenom čitatele
zase zeptám jakýho charakteru bude tady ten filtr ten bude firem IIR čistý nebo year
špinavý
to bude čistej fire že jo
a na konci tady tohoto filtru budou odebírat
nějaký chybový signál
a tetě prosím vás je docela zajímavé a dá se ukázat že když _e budu
tak dlouho nastavovat koeficienty tady toho filtru a z hvězdičkou Z
až bude energie tady toho ví _e signálu na výstupu minimální
tak jsem právě našel
optimální koeficienty
toho filtru a hvězdičkou
které budou perfektně sedět nebo match o what tady ty koeficienty které sou schované vevnitř
_e člověka
jo tady prosím vás téhleté větě kroutíme parametry filtru tak dlouho
dokud není energie signálu na výstupu minimální se také říká identifikace parametrů nějakého skrytého systému
který je
tedy je tady prostě na levé straně vo té _e o té nepřekonatelné bariéry jo
takže když někde jako uvidíte identifikace parametrů
tak _e to je právě to co se tady snažíme dělat
takže poďme _e si to zkusit nějak
popsat
ale předtím eště neště to bude popisovat tak si řeknem prostě tady tomu celému
proč se to je hradce
říká lineární predikce
_e
ta lineární predikce eště prosím vás to tady trochu zjednodušíme a tady mám nějaký rozděleny
koeficienty filtru člověkovi který budou a V
tady budou a hvězdičkou Z _e ty koeficienty ze kterým a budu _e dekterema budu
hejbat
a já prostě předpokládám že sem tak hrozně chytrej že se mně to vyšlo a
že už sem identifikoval takže se tady na to hvězdičkový kašlu a budu to všechno
značí ten omáčka má
enom proces tu jedničku nikdy neuvidíte
tak _e
my se _e mise zkusíme zaměřit na to
proč takovej filtr
který _e který bude
zapsán pomocí polynomu A Z to znamená bude tam jedna plus A jedna
Z na mínus prvou
_e
pardon tam byly
vlastně mínus A jedna Z na mínus prvou
ne momentových to úplně nezhojí ti omlouvám se
jo prostě bude to polynom ADT facto tomu k tomu jeho změní dostanu za chvilku
tak proč tomu říkáme lineární predikce jo protože na něho vlastně vstupuje obyčejní signál
vystupuje nějaký éčko a teďka proč proboha lineární predikce tak si to zkusme trošku rozepsat
_e teče _e takové do taková otázka když se máte podrbat ze levým uchem tak
to uděláte kterou ruku
a to udělám normálně levou jo lineární predikce předpokládá že se založení uchem drbete pravorukou
protože začneme takovým docela
_e šíleným rozepsáním polynomu A Z
který je jedna mínus jedna mínus A Z
jo to je prosím vás jako kdybyste chtěli říct mám stokorunu a řekli to formou
máme jedna mínus hranaté závorce jedna mínus sto korun
jako je to je to dobře ale to divně ale dobře tak a my tady
toto skutečně budeme dělat poďme se teďka podívat
co sme vyrobili
_e tímto zápisem
takové jednodu se nejednoduché schémátko
do kterého leze signál S N vylézá signál N a je tam prostě filtr _e
zend
sme přepsali nebo pře kreslili _e takovoudle družičku
kdy máme signál S N který nám vlastně leze přímo
to je tady
tato jednička jo
potom tam mám filtr jedna mínus A Z
který zpracovává ten samý signál
a tenhleten signály od toho původního odečten
tady znamínko mínus
a já dostávám ze se zase zpátky
_e
signál E N jo když si představíte jak tady toto schéma to funguje tak je
to opravdu naprosto ekvivalentní tomu vlevo
teď pro sem tady toto strašné harakiri _e dělal
já se tam sem to z jednoho důvodu
a to proto že vlastně tady ten spodní filtr
se dá teďka vyložit nebo interpretovat jako prediktor jako předpovídá ač toho s současného vzorku
protože to takhle dá dělat
je to proto
že _e
dyž máme
tady
tenleten výstup
R N
tak je to vlastně
pokud _e pokud ten náš polynom A Z
je jedna plus A jedna Z na mínus prvou a šlus chroch rok pro
a P
Z na mínus T
tak ten signál N je _e
N
plus
a jedna
S N mínus jedna plus
a šlus _e P S
N mínus P jo
vobě čenský prostě zápis výstupního signálu _e
teďka proto se podívat jak je dám tady tenhleten _e signál S
styl do Ú N
ten je dán jako
_e
polynom jedna mínus a ve kterými jsem to je ten vstupní signál
a jedna mínus A Z
si jednoduše zapíšu jako jedna mínus to nahoře to znamená jednička se mi tam vyruší
to bude tam mínus A jedna Z na mínus prvou mínus pro chroch pro až
mínus a P
Z na mínus této
to znamená že ten signál S jedničkou N bude
_e mínus
a jedna
S
N mínus jedna
mínus
až mínus a P
S
N
mínus T
jo všimněte si prosím vás jedné důležité věci
ten _e vzorek S T ledničkou N
odhaduju pomocí minulýho před minulýho před minulýho až vzorku vzdálený ho vlastně minulosti vo P
takže běžně vo deset vzorku ale nikoliv ze současnýho
to znamená já opravdu si můžu říct no jo takovéto vlastně nějaký odhad současnýho vzorku
těch minulých kde tady té spodní větví prostě ta současný vzorek neznám
a
jaká je tedy vlastně potom interpretace toho
toho éčka
co voni můžu říct
tady odhad
tady je
správná hodnota skutečná cédéčko
prosím
_e nulu no nula když to je správně ale jako my plně
většinou správně nedáte
vy to musíte udělat jako to jako když se člověk prostě
blíží ideálu
list výrobek
taky prostě byste chtěli ideální ale jako se slovy někdy opěrného řekne to sprostě tak
se mi daleko přesně nedáte ale snažíme se k němu blížit
_e můžete ho popsat nějakou kriteriální funkci jako že třeba o pití dva trestný vody
jedno sprostý slova čtyři prsty a tak dále
takže by se snažíte samozřejmě jako takové škaredé chování minimalizovat
a tady se snaží minimalizovat to éčko
co to éčko je tak bysme tomu řekli
_e vlastně to špatný to éčko jo a je to chyba predikce je to vlastně
ten správnej signál ten opravdicky
mínus
ten predikovány
jo to a my sme před chvilkou říkali že _e to téčko budu chtít _e
nasadit tak aby bylo co nejmenší
a v tom případě že bude co nejmenší tak vlastně ten prediktor bude fungovat
co nejlépe protože prostě bude produkovat takový hodnoty který se budou se nejlíp
blížit vstupu aby éčko bylo aby véčko bylo co nejmenší
jo takže toto je prosím vás _e jako taková mentální klička
aby si člověk uvědomil proč se tady tomu celýmu zmatku říká _e říka lineární predikce
my to za chvilku budeme _e za chvilku nevyužívat
jo takže prosím vás jenom _e
kompaktní popis toho predikovanýma signálu S N
je tady je to prostě jako mínus nějaká suma
koeficienty krát
minulý vzorky
tak _e tady je zapsána chyba predikce
to znamená to ten skutečnej signál mínus ten předpovězené ji
to jenom nahrání s tím jak sem si ten chybový _e nebo ten předpovězený signál
zapsal _e na _e minulým slajdu
a když se podíváte semka tak je to vlastně
zase zpátky
_e ten výsledek který jsme tam měli nakresleny před chvilkou znamená S N
plus
a jedna
S N mínus jedna plus bla a s plus a P
S N mínus T jo takže dostáváme zase to ste jenom sem to říkal pro
vysvětlení
o co se jedna
_e
tetě _e
když budeme
získávat ty parametry
tady touhletou metodou
to znamená budeme minimalizovat chybu predikce
tak _e to má tu fajn výhodu že vlastně _e získáme ty koeficienty
které _e jako kdyby má člověk sobě
které nevidíme
teďka mě prosím vás řekněte jednu věc když _e
ten člověk má sobě prostě nějaký ten
nějaký buzení nějaký G krát Ú N
a teďka prostě ten človíček má sobě filtr _e Z
jedna lomeno A Z jo tady je tady je to nepřekonatelná hranice
a teďka my uplně perfektně namodelujeme
filtr _e Z
tak by mě zajímalo co tady dostaneme na výstupu
buzení jo zase vlastně _e tohle se nám navzájem vyruší jo vykrátí že jo
a dostaneme se k buzení to znamená budeme mít k dispozici budící signál
jak má člověk na dva si skala přítelem _e nebudeme muset kuchár
a druhá jako příjemná věc _e tady u té metody je že ty koeficienty do
u docela snadno určit pomocí normální soustavy lineárních _e rovnic
tak poďme se podívat na to jak to
jak to udělat
první věc je že si musíme nějak vyjádřit tu chybu
_e nebo energii chyby lineární tedy
_e kdy
chyby uděláme úplně jednoduchou se takže prostě vezmeme nějaký _e nějaký úsek signálu
zatím nebudu říkat detail nějaký úsek signálu protože pak tom budou nějaký ještě čachry
támle vezmeme chybu lineární predikce
všecky vzorky dáme na druhou
a všecky sečteme
jo a tady toto
teď pro nás bude cílová funkce robot kriteriální tomu někdy říkáme
kterou budeme chtít _e minimalizovat
tak a teďka prosím vás kdo z vás
_e kdo z vás poslouchal dobře v matematice
mýmu úkolem je tady tohleto éčko udělat co nejnižší
a přitom hledám
koeficienty filtru
_e tady mám _e je
hledám koeficienty filtru a je
iont eště zamaluju ne není nedívejte sets a tabulu teďka
se musím to musím udělat
abych ty koeficienty ale _e a je našel
ste sklopit zraky pracovat je tady do očí
když hledám prostě ve mám nějakou funkci velký éčko
která je funkcím koeficientů a je jo protože já sme může jako různě kroutit mydlit
a teďka to téčko se podle toho bude _e podle ní bude zvyšovat nebo snižovat
a teďka za úkol najít takovou sedu sadu koeficientů _e je aby to éčko bylo
co nejmenší
jak na to budem
matematicích
no dobrý instalujte další metodou byste mohli zkusit pokud by to nešlo vypočítat analyticky ale
vono tady tohle kupodivu de
takže když to sem úplně přesně
tak jak
máme úplně vobyčejný s ke jednorozměrný případ jo máte prostě nějakou funkci
teďka ta funkce mají _e je funkcí jedné proměnné a vy máte najít její minimum
protože vo to vám de jo vy chcete vy chcete to éčko co nejmenší
takže derivace že jo a to z derivaci
derivaci nad rovnou nule
a pokud _e bouda tak nám z toho vypadne nějaký výraz pro hodnotu _e X
jo takže to zkusme tady
_e poďme si
poďme si udělat _e opravdu
_e derivování tady tohoto výrazu
podle jednotlivých koeficientu
jako tady ty rovnice vypadají krutě ale _e zjistíme že to není
tady není jako až tak s až tak hrozné
mám tady vlastně vyjádření té
mám tady vyjádření té chyby predikce kterou sme _e kterou jsme ukuchtili
na předchozím E na předchozím slajdu jo
to znamená
_e bude tady ten skutečný signál
krát tohle celé a aby z toho byla energie
tak musím všechny tyhle hodnoty dát na druhou a sečíst je přes nějakých N vzorků
signálu kde těch N je to zatím _e to sem vám zatím zamlčel
a tetě si vy jej dat jsem to udělal pro _m
teď si vyberu _e jeden koeficient a je
a podle něho budu derivovat
jo a připravme se prosím vás na to že těch koeficientů je deset
to znamená budu derivovat potom podle nějakýho jinýho je _e je a ještě podle jinýho
a dostanu deset takových rovnic
který mě dají soustavu v tomhle případě deseti rovnic o deseti neznámých
rumy každý com to dokáže pohody vyřešit jo takže poďme se podívat jak _e jak
probíhá _e ta jedna derivace
protože on je to docela zajímavé
tak _e mám tady prostě koeficient a je podle kterýho nervuju
_e a mám tady nějakou funkci
kterou máme zderivovat
_e když je ta funkce
sumu vaná přes _e nějaký N vzorků tak se s tím nemusím babrat prostě tosu
můžu opsat
jo takže vidíte že _e že ta suma prostě že se s ní nic neděje
a mám funkci kde hranatá závorka nějakej vnitřek pravá hranatá závorka na druhou zase pamatuju
si pamatuje jak se derivuje mocnina na druhou
jako dvakrát ta funkce že jo
tak si všimněte že to tady je zopakovaný dva S N plus
tady ta sumička
uzavřená hranatá závorka už tento dům jsem to na druhou není
ale teďka bacha
když zderivuj u takovou složenou a složitější věc tak tam musí eště být tak vona
derivace vnitřní funkce že
a u té derivace vnitřní funkce bych chtěl abyste se chvilku zamysleli
a řekli si jak se vlastně ta vnitřní funkce derivuje
tak
závisí prosím vás hodnota S N na koeficientu a je
ne takže tam kde derivace nula vpohodě jo
tak se musíme zaměřit tady na tu sumu
a poďme si to sumu rozepsat jo protože jako suma
lidé znalí už to dokážou z hlavy ale lidé neznalí ne ta suma se dá
zapsat takhle jako a jedna
S N mínus jedna plus
chroch rok pro potom je tam někde a je krát S N mínus je
plus měněna až plus _e T S N mínus P
a teďka mě prosím vás tady tenhleten víra zderivujete podle a je
jo českou ostatních toho vypadne
todle repríz todle ne pryč a zbyde tam jediná věc která sedí vedle a je
a to je mínus je
to znamená že já dostáváme se tady tenhleten výraz jako derivace vnitřní funkce
_e teďka užití musím udělat jenom nějaký nějakou reorganizaci
_e ta dvojka kterou jsem dostal
tak _e ji můžu klidně hodit na druhou stranu a utopit i v nule to
znamená to stanic nebude
_e dostávám tady suma S N krát
S N mínus je
přes _e
přes všechny vzorky
a tady si můžu dovolit takovou fintu která se menuje otočení pořadí suma
to znamená já si napřed dám sumu přes _e ty koeficienty
_e Í
a potom si dám sumu
přeze všechny hnedka
která bude obsahovat S N mínus T S N mínus je
tak _e
teďka aniž bych vám ukázal pokračování tady té pohádky
tak by mě zajímalo jestli vám _e něco říkají výrazy typu sumace přes všechny vzorky
S N S N mínus je
_e
konvoluce
pozor jo prosím vás konvoluci
se běželo přes nějakou pomocnou proměnnou
a jeden z těch signálů musel být otočený
a výstupem té konvoluce
byla zase řada vzorků čase
tady nic votočený ho není a běžím přes normální časovou proměnnou
a už sme to tady dneska měli jako kdyby mě tady tahleta _e tahleta
suma určovala jak moc je podobnej signál S N si hospodinu variantou S N mínus
je
a ta podobnost
to _e se říká jak
když se tedy účinně
_e
průběh mého vrávorá ní je podobný množství
škopku který si dám večer hospůdce
co to je působit prostě zajímavě
tak řekněte prostě jako
moje výkyvy jsou korelované tím kolik toho vypiju jo tak znamená tato teko relace
a tady ty výrazy budou korelační koeficienty
a to jaký to budou korelační koeficienty to si povíme příště
takže _e prosím a
_e na půlsemestrální zkoušce to bude tady do tohodle vodu
co s toho dokáže vy derivovat to ještě nevím ale si tady do tohoto černýho
puntíku
příští
příště zkouším
děkuju vám za pozornost a
pěkný týden