se omlouvám za to byl mezku to sem tady hrál na začátku ale jestli se

s si někde vyzkoušeli psát tady na tomhle když teror kalibrovaného píše to o půl

centimetru vedle rush nemáte hroz tužky

tak vám to nepřejou protože

po přestávce teda no po přednášce vydobyla normálně jistá sebevražda případně odvoz

no černovic

tak _e

první věc administrativní

začnu vás hnedka zkraje otravovat s tou nejpříjemnější věcí a to je půlsemestrálka debugging chcete

a velkou hradilo knihu

kniha života

_e ně by se docela líbilo kdybychom tam dokázali dat _e toto vám budu vykládat

dneska

to znamená sem dobře slyšet no nebo ne jo dobře a když mluvím tadle normálně

když nervů tak ještě pořád dobře fajn

takže se kdybychom tam dokázali za to co bude dělat dnes příští týden

takže tak nejdříve přespříští týden anebo někdy potom

jestli už máte nějaké plány

linek předmětu

neříkejte

_e

teďka máme třetí tina semestru

příští týden ne přespříští je možné se pátý týden potom bych nerad protože služeb manner

nich prázdninách

_e troš potom třeba

_e pondělí jednadvacátého

to špatný

a my na

_e tak za dva týdny vode dneška

pondělí jo tím míň toho budete mít samozřejmě tak jo

dobrá takže se sedmého března

bude půlsemestrálka

a vzali bychom tam prostě tohoto stačím udělat do příští přednášky dokonce

abych doktorát udělal operace

a jestli do nedodělám tak tam nebude

tak sme hotoví z administrativou to je fajn

hřbitov předešlo takhle rychle

a poďme do práce

takže _e to máme dneska za úkol dneska bych chtěl do je vlastně takový ten

kondenzovaný

je se sklo

to znamená hlavně se podívat teďka zkraje na lineární filtraci a trošku C refresh know

a potom _e z se mrknout na nějaké základní parametry které dokážeme vykousat z řeči

to znamená tak do poloviny přednášky to ještě pořád bude úplně obecně o signálech

a od poloviny přednášky to začne být trošku _e specifičtější o řeči

jestli si pamatujete tak minule jsme dělali nějaký základ tady toho víc o tu ze

zpracování signálu takže sme tam povídali o frekvenční _e transformaci a vám jenom v rychlosti

ukážu to co sme viděli minule dělal jsem to tady dokonce matlabu

když prostě chci spočítat nějaké spektrum a pomocí D F téčka _e řeči tak si

dva v nejprve jak jedné řečový rámec nebo kus řeči musím vybrat takže většinou prostě

načtete nějaký signál

a ten příslušný rámec si nějak vyberete já tady používám nějakou svoji funkci ale není

nic jednoduššího nešíří prostě X bude _e esko vod vzorku deset tisíc

do vzorku deset tisíc _e sto padesát devět jo prostě

někdo matlabu si vyberete

_e to zajímavé na co chcete koukat

potom _e když de vo to základním frekvenční transformaci

tak je to děsně složité protože

prostě _e

zavoláte

skoro to ani nemůže najít na tom slajdu když potřebujete spočítat spektrum tak prostě zavoláte

F T

a máte ho

a i u vás tady občas budu nutit dat nějaké rozumné hodnoty na osu i

to znamená pokud tam nebudeme chtít čísla vzorků od je od jedničky do sto šedesátky

tak by bylo docela dobrý si _m vybudovat jakou frekvenční osu která vezme v úvahu

že já jsem teďka spočítal vzorky

_e s vod nulté frekvence až skoro do vzorkovací ale ne úplně docela protože jsem

se zastavil jeden vzoreček přední

a když si jenom představíte se tady tyhlety operace dělají tak tady toto

mi udělá _e sekvencí čísel který du vod nuly až skoro do jedničky

jo sou to nula čísla nula až sto padesát devět po normovaný stošedesátku

a když to potřebuju roztáhnou potom na frekvenční osu od nuly až do vzorkovací frekvence

tak to prostě vynásobím jo když potom dá teplot

tak se vám zobrazí takhle vodorovně krásná frekvenční osa

když opravujete spektra tak _e samozřejmě jsou ty ploty potřeba dva

v jednom se díváte na modulové spektrum

ve druhém _m argumentové spektrum a to argumentové teda jako tam většinou nic poslední koukáte

a na modulovém si můžete všimnout

že asi zbytečné se dívat

na tu horní polovinu spektra která je stejně stejná jako spodní akorát že zrcadlově obrácená

vo v _e kolem půlky vzorkovací frekvence jo takže asi dobrý tady tuhletu taky kývnout

a dívat jenom _e jenom na levou půlku tady toto

toto nás zajímá

no a teď že

když při chcete

_e

zobrazit jenom tady tohle část

tak _e si prostě dáte jenom poloviční sekvenci

sto spočítané ho spektra vyberete s toho jenom to začátek vzorku

_e samozřejmě pak potřete taky po modifikovat _e frekvenční osu která teďka už nemá co

šedesát bodu ale mike jenom osmdesát jo takže

spočítáte tak aby vám to vyšlo vod nuly

a skoro do poloviny vzorkovací frekvence zase šup můžete to můžete to vyplotli

a poslední věc která by se vám u toho nemuselo líbit je že celé to

spektrum i takové zubatce protože na celé frekvenční osy máte docela málo bodu na tech

tam jenom osumdesát

a už to nedává žádný pěkný obrázek

takže když tímhle chcete něco udělat a li ten obrázek hezčí neříkám že in formativnějšího

prostě hezčí

tak _e můžete ten vstupní tu vstupní řeč doplnit nulám a až do tolika bodů

kolik chcete mít počítáno a počítá se s tím jo to se potom N _e

zero vedení

neboli

_e neboli doplňování nulami

všimněte si že sem tady prostě vzal ten vektorek i

kde mám schovanej sto šedesát vzorku

matlabu sem ho prodloužil

tolika nulami aby mi to vyšlo celkem do tisíci dvaceti čtyř jo takže je tam

vektor kterýma

jeden řádek a tisíc dvacet čtyři mínus to šedesát nul

já jsem to prostě na táhnul

spočítal s toho S fourierovu transformaci pasivní vzal jenom půlku

potom se musel taky předělat frekvenční osu protože najednou vod nuly do vzorkovací frekvence nemám

sto šedesát budu ale mám mých tisíc zase čtyři

tak sem přepočítal a hups _e vyplatil jsem to obrázek je krásnější ale neříkám že

je v něm není mně vlastně ani vo bytí kvíz informace nečte dostali s tou

minulýho tady

tohoto prostě oba dva jsou počítány úplně ze stejných hodnot akorát že tento je hezčí

z

tak _e a tohle bylo to co jsme si povídali

základní frekvenční _e analýze signálu

teď prosím vás _e mise na řeč budeme

většinou koukat jako na náhodný signál

náhodný protože

se mi vlastně předem nemůžeme říct že hodnota

ne řeči

šesté minutě osmé vteřině a čtyřiadvacáté tisíce ně

style přednášky bude nějaká hodnota to je prostě blbost a nejde

takže _e u těch náhodných signálů můžeme určovat jenom nějaké základní charakteristiky a jedna C

základní charakteristiky tak zvaná spektrální hustota výkonu

teď když se podíváte do slajdů nebo do nějaké knihy o signálech

tak zjistíte že prostě spektrální hustota výkonu má jakési šílené odvození

kde na přebereme nějaké konečné okno signálu a pak ho takhle jako roztahujou až donekonečna

co je pro nás důležité

je to tady velice zjednodušíme

_e že spektrální hustota výkonu

se dá odhadnout jako vlastně diskrétní fourierova transformace kterou zavřeme do modulu do absolutní hodnoty

a dáme to na druhou pak je tam ještě nějaká konstanta

tady jedna lomeno N jako počet vzorků tu tam můžete nechat nebo není můžete zapomenout

této je celkem jedno stejně nám většinou půjde jenom o tvary těch spekter nebo dneš

a o porovnání třeba dvou různých než ho nějaké absolutní hodnoty

jo takže co byste si měli odnést je že prostě spektrální hustota výkonu

výkonnou sám o sobě jako by neměl být _e záporný měl by být jenom nulový

žádný není anebo měl být jenom kladný

takže vezmete prostě ste fourierovy transformace modul na té ho na druhou a máte to

tetě když budete tohle zkoušet počítat v matlabu

tak si na to dejte _e trošku pozor

protože

_e když byste to náhodou jako dělali

li mít rychle za sebou

a řekli si tak jako tady ta absolutní hodnota té stejně no to tam prostě

dávat nebudu vono to nějak jinde _e pokud napíšete tady tohle

kde X je ten vektor komplexních čísel který vylezou fourierovy transformace

tak se mnou po tážete jo prostě _e komplexní číslo na druhou

rozhodně není reálný a je to něco jinýho než to se to počítat

takže dobře to bude takhle napřed vopravdu vzít absolutní hodnotu

a potom dát každej puntík _e každej bots toho vektoru na druhou že tam ten

puntík tak to znamená že se pojede že se pojede prvek po prvku tom vektoru

jo to je taková puntíkovaná konvence v matlabu

pokud by tam nedáte tak _e

ani nevím co se stane když se teda vektor na druhou mám pocit že si

ho jednou před transponuje a pak vám sto udělat takou krásnou maticí radši nezkoušejte

nebo zkoušejte ale vězte co dělat takže tady tohleto je dobře ale to přesně podle

definice

a eště pro hloubavé

_e bych chtěl

my sme si uvědomili že existuje nějaký další

jak je takový převod když máte komplexní číslo když máte nějaké X

_e tak _e platí že

absolutní hodnota X na druhou se rovná X

krát

obecně sdružená o hodnota X

a v zimě nemocně kdovíproč

přitom dokázal co nakreslit

tak takle kdo na mě ukazuje takovou vidličku tak děkuju tak to je dobře tak

jenom si uvědomte že když je takhle _e že takhle komplexní rovina

tady je reálná osa

tady imaginární

je tam máte nějaké _e nějaké komplexní číslo T

tak podle definice podle tady té levé strany systém vlastně měli vzít jeho absolutní hodnotu

to je tady todle

a dá se na druhou jo to normálně směřice metrem bude stodevadesát centimetrů dáte devadesát

na druhou

_e když to chcete počítat tím druhým způsobem tak sis konstruujete

_e komplexní číslo X

komplexně sdružené

to jest _e to _e ten samý modul a má to opačný argument

no a teďka

ten kdo si pamatuje se násobí komplexní čísla

tak by měl vědět že při násobení se násobí moduly

a sečítají se argumenty

jo takže vidíte že násobení modulu dostanete to stejný protože se vynásobí tady těhletěch devadesát

centimetru

s těmahle devadesáti centimetrama jo

se devadesát suma

a moduly

který máme tak jdou proti sobě tendle plus a tenhle se line moduly ale argumenty

se nám navzájem odečtou takže vznikne reálný číslo který je velký jako _e modulu toho

komplexního čísla na druhou

jo takže pokud byste to chtěli počítat elegantněji tak můžete zkusit takhle

_e i X krát hvězdička konjugovaná neboli komplexně sdružená hodnota X

spočítá vám to

krásně taky jo tomletom taková

_e jako matematická vsuvka ale _e

dva komplexníma číslama byste se teďka ve čtvrťáku s mohli prvku kamarádí

tak _e poďme se podívat _e toto co to udělá

zásadě tam uvidíme něco velice podobnýho jako když jsme počítali module toho náhodnýho signálu

akorát mě řekněte jak to bude dynamikou

bude to mít jako většího menší dynamiku letech _e

ne Š to základní

fourierka

jak se nastavuje koukat kusem volit

_e s

jo je tam je ta mocnina na druhou a mocnina na druhou je

když si představíte k probíhá tak T expanzní

unk se to znamená dynamika těch výsledných hodnot bude větší a to tak je znamená

že se vám na to budem blbě koukat prostě maxima budou hodně velká nemám budu

hodně malá toto říkám

říkám lidově ale skutečně to tak jo takže když se podíváme na spektrální hustotu výkonu

tak _e nějakýho kousků řeči můžu dostat

něco podobného

a pak samozřejmě aby se mně na to dobře koukalo tak je dobrý to nějak

nelineárně zkomprimovat a taková asi nejběžnější a nejpoužívanější lineární komprese

že pomocí logaritmu

takže když _e

do toho zapojíme

logaritmus

může být klidně s libovolným základem

čímkoliv násoben A

tak se nám to s rovna

a najednou je to spektrální hustotu výkonu lid vidět

a pokud použijete logaritmus základem deset

a ještě o vynásobíte desítkou

tak _e se dokonce tu spektrální hustotu spočítali decibelech

a protože mám tam výkon

to znamená

logaritmická hodnota nebude přibylová hodnota je s toho desetkrát blok deset kdybych tam měl amplitudy

neptune jak

se pomatuje

když tam měl jenom odvolejte _e té fourierovy transformace kdybych tam neměl to _e

to mocnění na druhou

kolik by musel

_e data by vyšly decibely

dneska byste si měli pamatovat vám to napíšu úplně zhruba

prostě výkon

rovná se

amplituda na druhou

jo to znamená když dávám deset

logaritmus deset výkonu

tak jak dostanu stejný číslo s amplitudy

deset logaritmus deset

amplitudy na druhou

což je

tady ten a dvojka bude pude dopředu před logaritmus takže to dvacet

logaritmus základem deset amplitudy

jo to si to si zkuste nějaký zapsat za uši že když mám amplitudy tak

se to na decibely převádí pomocí dvacet log deset a když výkony tak deset logos

jde to potom stejný

koš _e

tohle bylo povídání ho

_e spektrální hustotě výkonu a teď se poďme podívat na _e na filtry

ty filtry tady budou lítat sem

docela značnou část tohodle kurzu

a navíc nejenom řeči ale jinde použijete to prostě v grafice audiu

dokonce _e když budete prostě sledovat nějaký objekty na obloze a střílet na ně a

sem dneska slyšelo krásným projektu studentským krypl i dali dohromady někde v německu

že studenti mají

dálkově řízenou jak esku vypustím normálně nějaký malý balon

no balonek

a mají napsat soft tak aby ten balónek tragickou sestřelili

ale na ta rakev K středu nějakou prostě výzev B levnou kamerku takže máte řekl

downlink kde se posílá obrázek a jako

no počítači můžete dělat cokoliv ale musíte sundat ten balónek

takže _e

takže _e tam taky byste využili k filtrování mimochodem jo protože

_e dělat to jenom podle současné polohy toho balonků nemůžete on se prostě hejbe _e

jako sou tu jeví trhu někam unáší takže tam se na sledování používají takový věci

jako kalmanův filtr

a najednou tam máte filtr

tak _e pod poďme na to i běžné filtry které používáme řečí indexů tak zvaný

L C E binární časově invariantní

binární znamená

že

_e zachovávají lineární kombinaci

teďka co to je ta lineární kombinace a tolik jako ukazuju na tom mixážní _m

pultu a na nějakým filtru který je píchlý zatím

do toho mixážního pultu máte přivedenou kytaru a buben na dva různých vstupy jo

když _e nastavíte

knoflík se kytary na jedničku

a pustíte to do filtru tak on vám odpoví on vám začne hrát nějakým zvuky

musí místo

víte tu kytaru stáhnete

musíte tam buben na jedničku

a _e ten filtr vám zase

hraje prostě nějak pro filtrovaný buben na svém výstupu

a teď tě vy si začneme s tím vycházím budem hrát prostě záznam nula celá

sedum kytary a jedna celá čtyři bubnu

smícháte toho s těmito poměry

ono to projde filtrem

a text že by se na konci měl ozvat ten zvuk

jako

který byste dostali byste vzali vyfiltrovány výstup jenom kytary

vynásobeného nula celá sedmičkou aby filtrovaný výstup bubnu aby násobného jedna celá šperků pokud dostanete

to sami tak je ten filtr lineární zachovává lineární kombinaci jo matematicky zapsáno

když prostě na nějakej vstup X jedna zareaguje Y jedničkou a nastoupit dva zareaguje Y

dvojkou tak musí fungovat

tady tohle že když nějakýma koeficientama smícháte X jedna X dva

tak musí vylézt přesně to sami _e jako kdybyste namíchali

se stejnými koeficienty původní Y jedna Y dva

druhý _e

druhá vlastnost

je že ty filtry by měl být časově invariantní to znamená že twitter když měl

nastavíte pustíte tak se bude chovat stejně teďka jako za rok

jo zase matematických do popisuje

jako že když ten filtr

nástup X N reaguje nějakým Y N M

takže když něho do něho pustíte zpožděný signál X N mínus N nula tak vod

mám vám musí odpovědět přesně zpožděným výstupem

to tady v řeči bude platit a nebude platit

tak bude to platit jako a krátkých intervalech

ale na delších _e to moc pravda nebude protože my budeme hodně často s koeficientama

toho filtru hýbat

jo vy si my si řeknem za chvilku že vlastně principem vůbec jako filtrování ho

zpracování řeči je to

že koeficienty toho filtru upravuju podle toho podle řeči která přichází nečas je to takže

každých dvacet milisekund musím nějak pošlu richard koeficienty filtru

tak aby reprezentoval prostě moji mojí řeč a najednou jako zjistíte že kdybys do posunuli

o dvacet milisekund

takový vám tady tahleta rovnice nebude fungovat jo takže zapamatujte si že zrovna tady v

řeči bude ta časová invariantnost takovým otazníkem

a za třetí

ten filtr by měl být kauzální to znamená nevidět _e do budoucna měl by být

vlastně entý vzorek jeho výstupu

by měl být funkcí pouze

jo výstupní vzorku

který už byly

takže

funkcí nějakých mohl který sou menší national

a

vstupní vzorku

který už byly

a nebo právě teďka sou

jo to znamená

když se díváme na _e na časovou osu

a počítám vzorek no na výstupu

tak on se může počítat _e s

předchozích vzorků výstupu

to sem nakreslil byl objev unix

tak tady je vstup

jo tady časová osa na a tady výstup

jak je časová osa no

a teďka já prostě počítám nějakej výstup tady a on může záviset na výstupní vzorcích

které jsou tady

a může záviset na vstupních vzorcích který jsou tady

ale neměl by se koukat

do budoucnosti jo sem

ne

když to platí taky kauzální

zase com filtry který tady uvidíme tak kauzální budou

teď že to je ta impulzní odezva

impulsní odezva _e znamená jak vám filtr zareaguje

na jednotkový impulz

když mu ho předložíte na vstup

takže já jsem asi je stezku dost dlouho strašil s tím jednotkovým impulzem

pro spojitej čas jo to byl ten nenáviděný D rakety toho jak je to neskutečně

úzký a neskutečně vysoký propíchne to strop posluchárny

odletí se do vesmíru jo tak tady prosím vás je to dobrý

tady jednotkový impulz

bude normální vy generovatelný představitelný signál číslicový který je všude nula

a jenom

pro čas N nula

je to jednička jo když takovýhle signál pustíte do filtru

tak vám filtru odpoví impulsní odezvu

samozřejmě pokud

ten filtr bude kauzální

tak by ta impulzní odezva měla být

někde jako nenulová pro vzorky N větší než nula

ale tady by měla být nulová

jo když kdyby tady nebyla nulová tak _e ten filtr bude

předvídat budoucnost a toto to je zrovna nechce

dat

celej impulsní odezva

text je jaké získáte výstup filtru jako reakci na libovolný vstup

je to

vlastně takže si představíme

že každý vzorek který přichází na vstup filtru tak si pustí svoji kopii impulsní odezvy

ale na výstupu se potom tady ty kopie budou sečítat a buď si to můžete

nakreslit nebo to dají aut matematicky odvodit ale co s toho vzejde

je _e tak zvaná konvoluční suma

kdy

že prostě říkáme že entý vzorek _e

výstupu

je dána konvolucí vstupu

S

impulsní odezvou

a teďka ta konvoluční _e suma se dá zapsat dvěma různým formám a

mně se nejvíc líbí asi

která se mně líbí

se asi nejvíc lidi tady tahle

kterou si můžete představit následovně my máme vlastně _e

stup toho filtru jo tady je

N

toto je X N

víte co já se to možná _e otevřete k tomu notepad u

smaže se krásnej tvory

tak _e

ta impulsní odezvy píšu že _e Y N

se rovná suma

_e

nějaké má

dcera jede vod mínus nekonečna do nekonečna

a teďka _e tam budu mít D no

krát X N

mínus no

todleto je vstupní signál

no

X N který má nějaký vzorky

a teďka tady máte impulsní odezvu

_e no

_e pro jednoduchost si to ukážeme na nějaký úplně jednoduchoučký impulsní odezvě teda má třeba

hodnoty tři dva jedna jo tři

dva jedna

samozřejmě pro vzorky nula jedna dva

a teďka když budete počítat _e výstupní signál

_e budete počítat Y N

a prostě pojedete po jednotlivých vzorcích

a budete chtít spočítat

hodnotu výstupního signálu třeba tady pro tady tohleto na

tak jak to udělat

podíváte se kloub úplně

obyčejně tady do téhleté _e v téhleté sumy

a řeknete si tak já mám vzít nějakou pomocnou proměnnou mohl

a mám C projet hodnoty vod mínus nekonečna do nekonečna a násobit _e vzorek z

normal

se vzorkem X N mínus no

tak kde to bude mít cenu udělat

asi nemá cenu pouze strkat a mínus nekonečno z nekonečno

když ty hodnoty helma

sou jenom při že jo nula

_e pro

jsou to hodnoty pouze pro vzorky nula jedna dva

tak dobrý den už víte že jako nebudeme konečná sem ale že budete mít jenom

tři hodnoty

teďka _e

já vím že mě to počítadlo bude indexovat tady ty vzorky nula jedna dva

ale

ze kterým a vzorkama se to bude násobit

bude se to násobit se vzorkama X

N mínus nula X N mínus jedna X N mínus dva

to znamená já se

podívám do toho signálu

do toho původního do vstupního

todleto je vzorek N

tohleto je vzorek N mínus jedna

tohleto je vzorek N mínus dva

a úplně jednoduchou čte

při udělám tady todleto násobení udělám tady todleto násobení asimilaci todleto násobení

je tři hodnoty sečtu

a tento součet smida hodnotu toho výstupního

jo není za vopravdu nic složitější

když budete chtít tak se tady ta konvoluce dá představit taky tak

že _e tu impulsní odezvu

vlastně jako kdyby otočíte

a

sesadit A u

com áčkem

jejím původním nultým vzorkem

se vzorkem N vstupního signálu

a teďka máte ty vzorky který potřebujete násobit

přímo na sebou jestli si pamatujete k se málo sme druháků mučil trhat papírky takto

úplně to samý jo to znamená tohleto je konvoluce

a když budete potřebovat další vzorek

no tak prostě impulsní odezvu _e posloupnost se

o kousek dál

vynásobíte

sečtete další vzorek zase ozvou signál

a tak dále a tak dál

některý číslicový filtry právě toho typu fire s konečnou impulzní odezvou opravdu úplně přesně takhle

fungují vždycky se postavíte někam ve vstupním signálu máte buď buffer vzorků to vstupního signálu

nebo máte nějakou paměť kamsi ty minulý hodnoty na strkáte

počítáte prostě všechno pro násobíte sečtete o tom

tak _e tohle bylo

_e opáčko impulsní odezvy

a ještě _e taková poznámka

když počítáme

fourierovu transformaci ste impulsní odezvy

tak dostáváme komplexní kmitočtovou charakteristiku

filtru

tak teď teďka v a zkusím trošku podusit

_e

její fourierův obraz

impulsní odezvy

kterej

u těch fourierových transformací máme asi pět

no to je se někdo která z nich to byla

tak za fourierova řada ne fourierova transformace potom

fourierova transformace s diskrétním časem

diskrétní fourierova transformace eště diskrétní fourierova řada ty dvě posledním flickr o to sami

na to někdo takhle z hlavy

tak co byla ta do to se toto byla to je ta nejmíň oblíbená

to je ta někdy uprostřed semestru síly dochází a ještě se nemusíte na zkoušku

tak _e

tady jako by se mělo

za dotaz a T

fourierova transformace s diskrétním časem

ale vás tady s tím teďka nebudu obtěžovat jenom si prosím vás nějak zapamatujte

že prostě když se udělá spektrum

s impulsní odezvy

tak V D frekvenční charakteristika fin

a teď si tam máme takovou tu pěknou dualitou

těch dvou operací protože když F čase konvoluce

tak je tady násobení spectral konvoluce v jedné oblasti známe na násobení _e ve druhé

oblasti

tak _e jak je to s tou jak je to s tou _e kmitočtovou charakteristiku

za chvilu řeknem ale poďme si napřed ukázat takové schéma

obecného filtru

eště něco popovídat _e o Z T transformaci

_e

tohle je

obecný filtr typu IIR list nekonečný nekonečnou různí odezvou

a když se podíváte na to na ty jednotlivé bloky které obsahuje tak zjistíte že

sou jenom tři

tady vlastně blok který značíme Z mínus jedna zpoždění vo jeden vzorek

násobení nějakým koeficientem

a pak je tady sčítání no

toto je celý

že tři základní operace _e nic jiného

tetě když _e bychom chtěli vědět jestli je tady ten filtr kauzální

tak _e nebo není

to sto schématu poznáme

kauzální filtr by se měl koukat na současný vstup a na vstupy které sou zpožděné

a na výstupy své vlastní které sou zpožděné

jo tak to bych řek že tady je

T C vpohodě pokud byste udělali vekou nějakou kličku jako třeba že by se tady

vzali výstup a chtěli ho zavést do té sčítačky v tom eštěs čítal

tak

to už by bylo špatně jo to prostě vyrábíte kladivo a s tím kladivem chcete

vyrobit

kladivo dopravy vyrábíte

to nende

tak _e

teď prosím vás jak takové chování filtru popsat

my si napíšem takzvanou diferenční rovnici

koš není nic jinýho než že vlastně chytnu tady to schéma a budu opravdu jako

blbeček přepisovat co se tam děje

to znamená že

výstupní vzorek Y N

bude

a teďka se podívat podíváte jak se skládá

vstupní vzorek X N krát koeficient B nula se ve

kolik tam není vidět nějak

jo která koeficient B nula

o jedno zpožděný vzorek

krát koeficient B jedna a todle a to D a šlo Q zpožděný vzorek

_e krát T B Q

tady tohle je vstupní část filtru takže pod nepěkně napsat

B nula

krát

_e

plus

B jedna

X N mínus jedna

plus měněna a šlus B Q

X N mínus Q

jo sme hotoví se vstupní části sem

ale teďka ten filtr máš nějakou výstupní čas tak mi koukám že tady je v

o jedna zpožděným výstupní vzorek

krát koeficient mínus Á jedna tom proč je tam mínus možná za chodu dostanem

že mínus a jedna krát Y N mínus jedna

pak sou tam ty další a že tam

mínus _e té

_e Y

N

mínus T

a tohle tak zvaná diferenční rovnice

která když se vám nechce aby se vám upsala ruka

tak _e dokážete napsat

pomocí takovéhle pomoci takovýdle dvou svom

ta první suma zachycuje chování té vstupní části

druhá suma zachycuje chování výstupních

teď když se na tuto sumu podíváte tak vopravdu zjistíte že po přesně podle této

sumy ten filtr de úplně krásně naimplementovat ease teďka možná přepnu

_e

řeknu semka

a ukážeme si to no to je hezký tak

kladné

ukážeme si kousek kódu

_e

by něco jinýho word

tak _e

podle kterého ten

ten filtr dokážete klidně

naimplementovat

tohleto je děsně složitá funkce která ten filtr _e která ten filtr řeší

má jeden vstup a to je ten současný vstupní vzorek má jeden výstup Y a

to je současným výstupní vzorek

takže _e všechno pamatování předchozích vzorků řešíme vevnitř tady téhleté funkce

a _e

to mám nedefinovaná nějaká pole

bene který si bude pamatovat sto sukní čas

_e pak sou tam

koeficienty B

to je vstupní části

tak tam mám pole a mém

který si bude pamatovat výstupní část

a posuvem koeficienty a se výstupní části

a _e

S tom poli bémem

je současnej vstupní vzorek a jsou tam minulý s vzorky výstupu

jo vstupu pardon

a s poli _e mém

sou jenom minulý vzorky výstupu

současný tam ještě není protože není hotovej ten právě počítal jo takže když se jenom

zhruba podíváme jak to

_e jak to bude fungovat

tak _e my vlastně

jdeme vtom poli bémem op konce

vždycky vezmeme si tady tenhleten vzoreček vynásobíme s příslušným koeficientem vrazíme tam

vrazíme to prostě do sčítačky na nějaké sumy

a potom

přesuneme tady tenhleten vzorek o kus dál

o tom totéž uděláme s tímhletím vzorečkem

vrazíme

přičteme do sumy

přesuneme a tak dále a tak dál jak se dostaneme do začátku

jo a to stavím to samý potom neděláme ve výstupní části

kdy zase důvod konce abych mohl zpožďovat abych si ne přepsal prostě vzorky _e nějakým

jiným a

tak _e

začínám od konce výstupní části tady vo céčka

vynásobím

dám do sčítačky abych to pozor se záporným znamínkem jo protože tady je

mínus je se záporným znaménkem

po šoupnu

zase vynásobím

se záporným znaménkem přidám do sčítačky

po šoupnu a tak dále a tak dále a pozor musíte zastavit tady

tady je stop

protože _e

se vzorkem ve chlívku

_e nula nesmíte počítat ten eště není hotovej na tom právě na tom právě dělat

jo proto prosím vás tady ten _e cyklus výstupní části

de _e nejenom do jedničky

no a _e když to máte hotový voba dva ty cykly to znamená vstupní části

hotova výstupní části hotova

tak _e

ten výstupní vzorek musíte

musíte uložit sem

a potom ten výstup pošlete na výstup funkce zase sem trváním hotový a může nastat

volání pro další vzorek

tak vám jenom teďka položím dotěrný dotaz

tak jsem ten výstupní vzorek uložím sem a nésem

jo když o indexujeme si ty pole tady todleto je nula jedna dvě

tři

čtyři pět

šest a tak dál

pro sem ho strčil tady

do tohoto chlívečku sem

a nedonutil

přesně

my sme si všimli že vlastně když to filtrování probíhalo grafy zpožďovaly ty vzorky a

sem si vlastně chystal na další volání toho filtru

_e to samé musím udělat tím současným výstupem musí být nachystanejch na příští zavolání filtru

takže už to není současnej vzorek vlastně ale pro příští volání ušet o vo jedna

koženej proto jsem ho dal namísto toho černýho puntíku

jo takže _e vidíte že

tato funkce úplně přesně

implementuje

tohle naše _e blokový schéma dva filtry násobení sčítání je teda dva cykly

násobení sčítání posouvání mezi křivka paměti nic složitější

to Š

co dál podle typu T vstupní a výstupní části jestli tam je nebo není

dělíme na tři R

nerekurzívní

IIR čistě rekurzivně když tam sou

_e když bytama

když bych tam tady tu vstupní část vůbec neměl

a šelmy vzorek X N

přímo do sčítačky

tak je to tak zvanej čistě rekurzivní filtr

tyhle tady dost často uvidíme jo protože takle se vlastně bude modelovat řečový ústrojí

a když tam nám ty části vobě

tak je to filtr obecně rekurzivní

obsahuje prostě koeficienty a i B

tak _e

jsme teda viděli že ta diferenční rovnice je bezvadná na to bysme si ten filtr

naimplementovali

že to de prakticky opsat do céčka nebo do jakéhokoliv jiného jazyka

ale se diferenční rovnice dost těžko poznáte jestli ten filtr bude stabilní to znamená jestli

se vám na nějaký rozumný vstup nebude rozkmitá what

a taky _e nepoznáte k vůbec u bude chovat jak se budu jak se vůbec

bude chovat kde bude přednášet

nebude zadržovat

takže na tohle máme úžasnou pomůcku která semene Z transformace

lze transformace

vlastně podle definice

je

definována takže mám nějakou sumu která bije život

mínus nekonečna do nekonečna

a v té sumě se vždycky násobí patřičný vzorek toho diskrétního signálu

se nějakou hodnotou komplexní proměnné která je umocněna na mínus enko

ale tady tohle vás ani tak nemusí brát jako ta i _e definice ze transformace

co je důležité tak zapamatovat si jenom a jenom tři základní věci

a to ty že _e

u ze transformace

signál

který je bez jakýchkoliv změn

není tam žádné zpoždění žádná konstanta

tak prostě přepíšu na jeho ze transformaci

když u toho signálu sedí nějaká konstanta

tak

se ptá sama konstanta

_e promítne do té transformace protože transformace lineární

a konečně když ten signál bude zpožděný když to bude nějaké

měl

jako zpoždění

tak bude _e transformace tatáž ale bude u nich tá hodnota Z mínus _e na

mínus měl jsou

já to je všecko to potřebujete vědět

_e mimochodem tohle taky vysvětluje proč jsme do těch zpožďovacích bločku psali Z na mínus

jedna

protože pokud tady máte zpoždění pouze vo jeden jediný vzorek a proto uvidíte _e devadesáti

devíti procentech všech filtru

tak _e

ta hodnota směr bude jedna to znamená budete ze transformaci zpožďovat krát Z na mínus

prvou

tak a teďka k čemu nám to ze transformace bude dobrá

bude nám dobrá k tomu

že mi takhle jako o Z transformujeme tu V

tu diferenční rovnici

začátku vám ještě nebude jasný

čemu to bude dobrý ale pak nám to snad vysvětlí takže to pojďme na to

já vlastně teďka vezmu to diferenční rovnici

kterou sem si na osm napsal přesně podle schémátka

a zkusím i o Z transformovat takže všecko tady todle

uzavřem

a udělám toho ze transformaci

a bude teďka jednoduchý takže by to

zvládlo a je školaček ve druhé třídě kterým řekneme dáme mu základní přepisovací pravidla jo

takže

pravidlo platí že kdo uvidíš signál

a u toho nic není takto

přepiš

na velký písmenko

změně hranatou závorku na kole to worry tam ze

proto jo

když uvidíš konstantu takže v opiš takže B nula

X Z

a když někde uvidíš požehnej signál

tak tam napíše Z na mínus

_e to zpoždění

takže plus B jedna

X

_e

krát Z na mínus prvou plus rochlov pro až B Q

X

_e

krát Z na mínus Q to jo tím sme hotoví se vstupní části

můžeme s procestovat výstupní

takže mínus A jedna

Y Z

krát Z na mínus jedna mínus něco jasně cache

mínus chápe

Y Z

_e na mínus to

jo hotovo se Z transformoval sem _e

diferenční rovnic

tetě mě půjde o jednu věc _e tohoto že a vždycky vlastně tady kterou ste

doméně Z

hledám takzvanou přenosovou funkci filtru nějakou funkci hrozil

která by vlastně udávala jak je výstup závisely

na vstupu tady

tohle vás bude zajímat tady až budete kdekoliv jo ve zpracování řeči nebo ve finančnictví

to jedno chcete prostě vědět kolik peněz vám vygeneruje nějaká továrna nebo nějakej produkci řízením

není nalejete nějakej vstup jo takže

tenleten přenosová vždycky bude zajímat

poďme si to zkusit úpravy tak abych to dostal opravdu ve formátu Y Z lomeno

X Z se rovná něco

jo takže poďme upravovat

_e asi musíme začít takže ty _e členy s X Z a Y Z hodíme

dycky na jednu stranu

takže Y Z

plus

a jedna

Y Z

Z na mínus prvou plus

_e P

Y Z rovná topenář

_e Z na mínus T tou teďka si všimněte že proto sem tam zaváděla si

to znamínko mínus

protože já vlastně tady při této úpravě musím udělat trochu šachy mezi dvěma stranama rovnice

a z mínusu se mi stranou přes přesunu druhou stranu sluch

a todle se rovná

_e

B nula

X

Z

plus B jedna

X

Z

Z na mínus prvou plus pro chroch no a šlus

B Q

X Z

Z na mínus Q tou jo

nás sem skoro hotovej protože

já si tady vlastně můžu vypnout

Y Z

a zbytek přidat do závorky tam bude

a já vám to napíšu já jsem si to chtěli země to ne že se

mi to nechce opisovat ale chce

takže Y Z a tady bude jedna plus A jedna Z na mínus prvou

cache plus a P

Z na mínus T tou

rovná se X Z

_e

B nula

plus B jedna z na mínus prvou aspoň jo

až B Q

seznámí rozkvetou

jo

a teďka vidíte že už máme skoro všechno nachystaný jedinou věc co potřebuju uděláte tady

chytnout X Z

a převést o semka do jmenovatele

a skytnout tady tuhletu _e závorku a převést to na pravé straně ve jmenovatele a

sem jsem hotovej mám vyděláno

takže _e jde

Y Z

lomeno X Z

a toto sme prosím vás hledali jo to je to je prostě hledaný výsledek

tomu dáváme

tu magickou značku házet říkáme tomu přenosová funkce

a teďka mě vyjde takovej podíl B nula plus B jedna Z na mínus prvou

plus

_e B Q

jedna mínus Q tou

mít tak

tady možná nemusel C

pomáhat

tak jedna plus E A jedna Z na mínus prvou plus

_e té Z na mínus T tou

jo tady tohleto je výsledek

toto je prosím vás to přenosová funkce

která _e která

závisí jenom na koeficientech toho filtru a na nějaké se

komplexní proměnné

_e proměnné ze

tak dokázali byste si tu

funkci H Z

představit tak to tak asi vypadal

Z je komplexní proměna jo takže

prostě tajíte tento lavice

to je komplexní proměnná todleto má reálnou osu

a se to nakreslím

je na

name ovlivňuje člověk beztrestně čmárat skloníme

reálná osa

tady imaginární osa vy mě teďka řekněte jak vypadá funkce V

jak by se to představili

_e top to první část evity

exponenciála ne

kde kdyby se tam vzala

ona je to je to je prostě funkce to je nějaká plocha

představte si prostě že se teďka to lavice jako zdroje zvedne začnete různě kroutit

a je definovaná úplně všude na sou komplexní rovinou

a to je funkce házet jo prostě

nějaká taková kupodivu no plocha která se nám tady zase vám tady mile to normálně

všude pro všechny název

to definovány

_e ještě drobný problém za funkce komplexní

jo takže můžete si představit že se tady melou jako ty funkce vlastně dvě

potřeba reálná

imaginární

a nebo modulová a argumentová

a tak dále takže prostě něco

co je definováno všude na komplexní rovinu

to něco nás nebudeš tak zajímat

_e a šla nějaký důležitý vody kterým se dostaneme teďka

jo jenom prostě když tady na vás někdo blafne funkce _e ve

jako co to je tak byste měli mít aspoň zkusit si udělat nějakou představu

jak to vypadá nevím že totiž

tak _e

frekvenční charakteristika

já se totiž ty data tady k tomu tohohle bodu

že ta frekvenční charakteristika je vlastně ta naše přenosová funkce

do které na místo

Z nám mínus _e na namísto proměnné Z

dosadím E na J dvě pí F

to F je to F je normovaná

normovaná frekvence

tak a teďka mě řekněte jako

pořád sme

tak se komplexní rovině jo teta konce ta rovina proměnné D nad tím že to

chtěl nějak bublava funkce

a řekněte mně to tady tahle náhrada znamenal _e ze všeho nejdřív mě řekněte

kde _m se může pohybovat při výpočtu té frekvenční charakteristiky ta proměnná Z

_e jedna mínus jedna jo ale ještě taky trochu jinde

jo jedna mínus jedna je tady a tady dva body

aby chtěl ještě nějaký další

kružnice jak a

super jednotková kružnice takhle jo když máme funkci N I je něco

tak to jednotková kružnice

ráda mimochodem prochází jedničkou a mínus jedničkou takže

toto měl dobře akorát X to zapomněl ještě na nekonečno dalších budu

ale jinak dobrý tak a teďka mě řekněte ještě pořád vás budu průchodu si T

sečtete celou kružnici o běhnou

tak _e jakým to odpovídá frekvencí

_e

značky splněn možná moc daleko nebo jinde než a

já jsem se chtěl zeptat když chcete o běhnou celou jednotkovou kružnici

jednotkovou kružnici tak co musíte udělat s frekvencí F

odkud dokud si musíte měnit

o pozor dvě do

dvě pí ne protože si už tam máte jo takže tu evko měníte vod nula

do jedna

jo od nula do jedna skutečně mám to vobjedeš celou kružnici a teďka mě řekněte

čemu tady to vod nula dojedná odpovídá opravdický frekvencích třeba máte telefon vzorkovací frekvence osum

tisíc hertzů

přesně tak jo to znamená zvykněte si na to že v těch _e diskrétních signálech

počítáme s normovaným a frekvence má který jsou skutečně vod nula dojedná takže objedete

celý kolo

a v reálných

musíte od normovat vzorkovací frekvencí v obyčejně prostě vynásobit tak jedete u vod nuly do

vzorkovací frekvence

tak a teďka to když si to kolečko dáte ještě jednou když třeba to zkusíte

od vzorkovací frekvence roswell klasika takle

tak to bude to samý přesně tak jo protože pořád jezdíte potom samým kole

dobře takže jsme si vysvětlili _e co to znamená ta náhrada Z se rovná N

a je dvě pí F

a teďka _e co když teda si vyhodnotím tu funkci

H Z

kdy tady toto záměnu udělám jo to znamená najednou to bude a

_e na je dvě pí F

co to znamená

to znamená to že já si vlastně se

komplexní funkce nadrovinou Z

vyberu jenom nějaký hodnoty

a ty hodnoty budou ležet přesně na ty jednotkovou kružnicí

jo já sem vám to vykládal vesele si je desku takže vemete prostě pilku

a takhle potom odříznete s jednotkovou kružnici a pak se na to takhle to kouknete

zboku

a na tom řezu

přesně uvidíte hodnoty _e frekvenční charakteristiky

jo a teď toušek o taky víte

my do vás jako s kolegama tlačíme že když se o to teda jako diskrétní

signály takže to bude periodický Z _e

vzorkovací frekvencí taktika už víte proč L protože když to jedno v objedete vidíte tam

nějaký hodnoty proto objedete podruhý tak sou tam pořád ty samý hodnoty a takhle to

můžete jako podkuřovat

stále dále a dále

jo takže tady

toto je vlastně _e

nějaký návod

jak _e

přijít _e

frekvenční charakteristice

_e samozřejmě to můžete si to vyzkoušet klidně spočítat jihlavy no to docela dokonce jde

to nějak jednoduchý filtr

když to budete chtít _e počítat _e reálně tak asi si na toto můžete nějakou

funkci

třeba v matlabu req Z

je fajn protože jí vlastně zadáte vektor koeficientů vstupní části filtru ty béčka

jako druhý parametr vektor koeficientů jmenovatele áčka

pak ještě tuším dáte počet bodů a vona vám to vyplivne

a dokonce když C nedáte výstupní argumentech vám tady zobrazí

hrozně hodná

tak _e

jenom ilustrace se na všecko řekl

a teď jenom poslední věc _e tady ty dvě přenosové nebo dvě části té přenosové

funkce

do u taky _e upravit

na vobyčejný scheme polynomy tak jak je známe

kde i možná ze střední školy

jo takže když je tady vlastně

nejvyšší mocnina nebo není C Z na mínus Q

a tady nejnižší Z na mínus T

tak že a to můžu tím Z na mínus kvéčka vynásobit tady Z na mínus

téčkem taky

a pak tam dostanu normální polynom Z na Q krát plus něco Z na Q

mínus jedna a tak dále

až konstanta

a v tom druhým případě dostanu znáte a tak dále a tak dále až konstanta

a tady tyhle polynomy si můžu klidně _e upravit

tak takzvaně faktorizovat

že _e se dají rozložit

do

podoby Z mínus

jeden kořen krát Z mínus další kořen krát Z mínus další kořen když to pro

násobíte celý dohromady tak vám teda tenhleten polynom

jo

a _e tetě

samozřejmě ty kořeny

polynomu

si můžete zobrazit můžete s se na ně numericky podívat

_e ten filtr bude stabilní pokud kořeny

jmenovatele

budou uvnitř jednotkové kružnice

bude nestabilní pokud budou

někde jinde

tak a teďka ještě _e tím kořenům jmenovatele tím N kam se říká nulové body

a kořenům netrap _e pardon kořen čitatele se říká nulové body

kořenům jmenovatele semene _e se říká póly a bych chtěl vidět proč

a zase

představte tu funkci házet jo která si to tady valí na s tou komplexní rovinou

a teď že

někde tady komplexní rovině

je nulovej bot třeba N jedna

a mě by zajímalo jaká hodnota

funkce _e vět

je přesně na s tím budeme N jedna

proč nula

dobrý tak vám je to jasný třeba někomu ne tak vysvětlete

jasně či čitateli prostě máte někde _e člen

Z mínus N jedna a to zetko je zrovna N jedna protože jmen na ní

jo takže

dostanete nulu

a ta jedna nula stáhne celou hodnotu celýho výraznou roli takže všech

tady této hodnotě dostanete nulovou _e hodnotu funkce a ze

dobrý teďka sem třeba budou

hodnotě P jedna co že paul

co se stane tady

_e pozornost nebude definovaný bude ale

ale po je to do nekonečného protože se ve jmenovateli najednou dostáváme hodnotu nula takže

v tomletom pólu ta funkce házet prostě vystřelí

no nekonečně a teďka je důležitý opravdu pro stabilitu abychom ty póly měli _e měli

uzavřeny

jednotkové kružnici

takže když bude ten pól tady tak to je dobrý a když bude někde mimo

tak jsou je špatný

to znamená špatný mimochodem co dělá nestabilní filtr

když do něho přivedete jakýkoliv rozumný strobe řeč prostě audio cokoliv tak

no _m rozkmit a samozřejmě teoreticky do nekonečna prakticky

do hodnot a čtu to de

takže většinou do nějakého jako maxima a minima dynamického

rozsahu převodníků a pak je to hrozně příjemný na poslouchání a

hlavně příjemný pro neprovedl

tak

_e dobře tady je nějaký příkládek filtru

_e v matlabu existují nějaké návrhové funkce

tady tím nebudem projíždět jenom jsem se snažil _e navrhnout filtr který by simuloval telefonní

pásmo

myslím že to je to dokonce F obsaženo F prvních počítačových cvičení takže jenom ukážu

jak vypadá jak vypadá výsledek

takhle prostě

jsme se docela trefili protože tady bylo někde tři sta herců

a

a tady tušíme tři tisíce čtyry sta

a _e

_e tady je ukázka

vstupního signálu což budu tady tenhleten janáček

o

jo a po průchodu

filtrem

dostáváme něco jako

když je to nahrajete na mobil

tak

a teďka nevím jestli ten filtr který sem vám tady ukazoval ten úsečku jestli zrovna

_e zrovna _e realizovat tady tohle pásmo

ne ten to bylo něco jinýho ale klidně prostě si můžete v matlabu spočítat koeficienty

více tady ten jako deček

nahradit si to těmi hodnotami který

spočítáte a vyzkoušet to bude vám to fungovat

tak

fajn jo tady jsou ukázány jeho nuly póly

_e dobrý vo céčku sme povídali

a to je

to je k filtrování všecko

tak _e poslední věc když budeme mít náhodný signál

a ten náhodný signál budu pouštět do nějakého filtru

tak jenom bysme měli vědět jak ten filtr bude hrát na jeho spektrální hustotě výkonu

tak tam jenom takový jako základní poznatek

_e

výstupem by zase mělo být nějaké reálné číslo protože to je výkon to znamená neplatíme

tam žádný _e žádny fáze nebo argumenty

a

úplně stačí když vlastně vezmete modul frekvenční charakteristiky toho filtru dáte ho na druhou a

tady tímto pro násobíte spektrální hustotu výkonu toho vstupu

a máte _e máte výsledek jo takže snažte se i když to třeba jako zapomenete

_e

násobit

související nebo relevantní věci takže když toto určite spektrální hustotu výkonu

taky ste frekvenční charakteristiky byste měli udělat něco

co se bude tvářit jako výkon bude to na druhou prostě vezmete absolutní hodnotu dáte

na druhou vynásobíte o to _e které je ukázat čkat

tady to byl nějaký signál který sem používal C esku tečení vody

_e

který má tady tuhletu spektrální hustotu výkonu jo to znamená vidíte tam

jaký hlavní P ve frekvenci a po celkem nic

_e prohání meta filtrem jedna mínus nula celá devět Z na mínus prvou vo kterým

bude za chvilku řeč

to je

filtr jakýho typu mimochodem do to dá z hlavy

horní polopropustnou do

nebo žádná

zase si uvědomit

to takovej filtr bude dělat

když to bude jedna mínus nula celá devět

Z na mínus prvou

tak ten filtr sežene vstupní signál

_e

_e vezme si jeho vo jeden vzorek

zpožděnou variantu to vynásobí

nula celá devět této vezme se znaménkem mínus

a tohleto je výstup

jste měřit _e

co to je v reálu

ve si to představit co dělá takovýdle filtr

aby se vám to představoval eště lístek a toto je tady to nula celá devět

škrtnul

není tam žádná konstanta tam brát

co to dělá teďka

to je až následek já bych chtěl vědět co dělá byste mě zkusili vlastními slovy

říct

S když ten vzorek počítá vzorek Y N jak ho spočítat

mimochodem on posily šum jo

to je ten zrovna

tak zkuste se zamyslet prostě Y N rovná se

X N

mínus X N mínus jedna

co to znamená

to máte pravdu ale a S se nedostal odpověď zněla to jednoduché prostě bere současný

vzorek odečte od něho minulý vzorek

jo

to je celý

když tam vrazíte konstantu nula celá devět

tak to budeme současný vzorek a odečte od něho skoro celý minulý vzorek

jo takže teďka vám to mohlo napovědět a teď se dostáváme k těm výsledkům

_e kterým s těmi tady ukali

když do něho pustím stejnosměrný signál taky jaký bude výstup

nula nebo malý že jo když tam nechám to konstantu nula celá devět

když tam pustím něco co se rychle mění jak říkal ten šum jako když bude

něco na vysokých frekvencí bude to skoro furt měnit

tak to

tak se to ještě mocninné ze zesílí jo protože _e představte si že máte vlastně

úplně nejvyspělejší signál který bude valit _e každý vzorek se bude měnit kladné hodnoty zápornou

tak vy budete mít kladná

mínus záporná

_e to je velká kladná další vzorek bude záporná mínus kladná

je velká záporná takže tady tyhle změny budou ještě posíleny

takže s toho si můžete

vy vydedukovat

že se asi bude jednat vodou horní propust

když to dole bude potlačovat a nahoře to bude _e zesilovat jo

tak _e opravdu jo

pokud funkcí fractals added spočítáme kmitočtovou charakteristiku

a její druhou mocninu tak uvidíme něco takovýho

a potom jenom když ten signál pro žen M

spočítáme _e výslednou

rektální hustotu výkonu tak ten původní peak někde na té spodní frekvenci tam ještě pořád

vidíme

ale to je ten skutečně narostlo

a když srovnáte ty dva si signály

tady tenhle

s tím

dalším

tak uvidíte že vám tam prostě

co se

pardon co se rychle měnilo tak zesílil

co se pomalu měnilo to znamená tady takový ty dlouhý vlny

tak potlačil

jo takže výsledek je

nějaký hodně horno sekvenční signál

to K

vše k filtrování

_e půl minuty oddechneš je tam nám dal další přednášku

apod pojedeme dál

tak jo

promiňte skončilo

takže poďme fikané to povědít o tom

ještě vůbec nejsou řeší začneme něco dělat

co se většinou

je na začátku aby to celé fungovalo

_e řeknu vám něco vo přepracování základních parametrech

potom _e něco o tom jako když se namodelovat řeč

dříky a různými generátor ty tak jak to děláme

něco o spektrogramu i když doufám že se spektrogramem ste si vyhráli slabinách anebo si

možná někteří vyhrajete tady tenhle týden

vopravdu doporučuju o tom _e v labině číslo jedna

je úkol měníte parametry spektrogramu tak abyste pořádně viděli násobky základního tónu tak abyste dostali

_e co nejlepší časového rozlišení tak se s tím opravdu zkuste

trošku zakroutí s parametrama

a _e potom jestli zbyde čas tak ještě se povíme o cepstru

kepstrum je taková pěkná slovní hříčka

spektrum kepstrum

frekvence kvefrence

_e jsou to vlastně nejpopulárnější parametry který se používají k rozpoznávání

a jsou takové dvě základní varianty kepstra jedna je vlastně založená jenom na bych poučka

ze zpracování signálu není tam vlastně nikde žádné řeč

a ste druhé variantě už budeme

_e úvahu to jak člověk slyší to znamená že naše slyšení je nelineární a tyhlety

_e

poznatky jsou nějak zabudovány

do

tak zvané homel frekvenčního kepstra ostrým uslyšíme

tak poďme _e poďme do toho

parametrizace řeči

má člověk terče vytesat nějaké parametry

tak je vlastně úkoly jasné řečový signál _e vyjádřit omezeným množstvím hodnot nějakých parametrů

a teď prosím vás občas v literatuře uvidíte takové dělení

jako že je _e nějaký popis _e neparametrický a nějaký je parametrický

a že teda ten neparametrický bude založený jenom na zpracování signálu jako banky filtrů fourierova

transformace a tak dále a že ten parametrický bude založený na nějakých po znacích o

tvorbě řeči to znamená tady máme hlasivky a pak nějaké hlasové ústrojí

ale _e doporučil bych vám a co to je na to vykašlete protože ono to

stejně neskutečně mixu je

ten

parametrický popis stejně používá spoustu technik toho neparametrického a na konci tomu stejně čemu říkáme

parametry

takže

jenom prostě abych jako zvýšil zmatek

tak to je ten slajd _e jako kdyby se nikdy nebyl

jo kdybyste přesto někdy

přešli a

někdo vazu sinus neparametrický má parametrickým popisem

_e tak mi řekněte že z obvod

tak _e to co teda vlastně

_e to sou parametry a jak jsou nějak uspořádaného strukturovány parametry jsou nějaký čísla který

popisují řeč

většinou jak uslyšíme tu řeč budou popisovat na nějaký krátkých časových úsecích

a můžou být _e důvod

dvojího kardan dvojího druhu

buď skalární

to znamená že na každém

časovém úseku řeči

spočítám jedno číslo

a _e když je takhle potom vynesu čas

tak prostě ten skalární parametr má

pro každý rámec nějakou hodnotu

pro každý úsek jo takže to vlastně jako normálně normální funkce a nebo sou vektorové

ty vektorové tak jako dost často uvidíme

a pak to reprezentuje korkovou dlouhou matici

vy vlastně vodorovným směrem de část

a svislým směrem D index _e

index v jednom

vektoru parametrů

je

docela slušný

pak ty parametry _e

nějak odlišovat takže když třeba budete číst články

tak ty skalární parametry _m se budou snažit vobyčejnýho písmenka _m a

ten čas chcete otázka občas tam uvidíte téčko

ale to téčko třeba bývá v desítkách milisekund

a když jsou vektorové tak

tak

když se měli značit takhle jako že to je vektor ale pokud šel té článek

vo nějakejch francouzů tak enzymy to stejně úplně jedno nic tlustý písmenka neuznávají

takže tam se člověk si _e

rozpoznání co je skalár a co je vektor musí spolehnout na vlastní úsudek intuici

a otřeseni tomu nepomůže

_e T Č předtím než ještě nějaký parametry začnete počítat

tak je dobrý tu řeč nějak trochu _e trochu při upravit

první úprava _e se týká stejnosměrné složky

řeči

tady jasný že když jako řeč posloucháte tak _e že to žádnou stejnosměrnou složku nemá

nebo by nemělo mít

pokud zrovna nesedíte v letadle a nemáte rýmu a vaše

vaše uchovat jako netlačí na jednu nebo na druhou stranu

jsou takový jako ne nepříjemný stavy ale zase když mi slyšíme

tak žádná stejnosměrná složka neexistuje

pokud _e

řeč navzorkujete a máte prostě ní nějak

špatnou

zvukovou kartu nebude tam proražený nějaké oddělovací kondenzátor nebo něco tak se vám může stát

že prostě dostanete řečový signál tady takovoudle

nenulovou stejnosměrnou složkou

jo tak

prostě mělo by to jít vokolo nuly a nejde

a první věc kterou byste měli takovým případě udělat je spolku sice T stejnosměrné složky

zbavit

jak to udělat

odhadnout i

a odečíst

jo takže výslednej signál

by měl být ten vstupní mínus střední hodnota

a pak bych to měli dostat nulovou stejnosměrnou složkou akorát že to střední hodnotu musíme

odhadnout

tetě

odhad

stejnosměrné složky je vpohodě

pokud mám k dispozici offline celej signál třeba mám nějakou půlhodinovou masku

tak _e si můžu úplně vklidu spočítat střední hodnotu ze všech vzorku potom i prostě

odečíst hotovo šmitec

jo jak spočítat stejnosměrnou složku nebo střední hodnotu

proč bych vás možná bych to jako urážel

prvním ročníku magistra že jo

jako průměr prosím

sečtete všechny vzorky

podělíte počtem vzorků a máte střední hodnotu

jo takže tady je to v pohodě

_e když počítáme online

tak už je to trochu me vpohodě protože nemůžete čekat až skončí řeč

něco spočítat a pak se vracet jo musíte

musíte počítat právě teď když vám ty vzorky přicházejí

takže v tomhle případě se používá tak zvanej _e tak zvanej

online téma bit on ne

on

má jen

_e online _e odhad střední hodnoty

který je _e docela fikaný zajímavý a měří po těch letech jako to technika hrozně

líbí

_e máme vlastně

současný odhad střední hodnoty

a ten je počítány z minulýho odhadu střední hodnoty

tedy je vynásobí ne nějakou hodně _e konstantou která se blíží jedničce

třeba nula celá devět

a k tomuhle odhadu je _e konstantou jedna mínus nula celá devět takže nějakou hodně

malou váhou

přidaný současný vzorek

tak _e

teďka by mě zajímalo jestli byste dokázali

takovýhle

schéma

popsat jako číslicový filtr

jo

měl by na tohle ten současný vzorek S M

a měl bys toho bílé závad současný odhad střední hodnoty

S M

za to dokáže

to co je tady na málo nákres napsaný vlastně není nic jinýho než diferenční rovnice

která normálně popisuje chování filtru

takže když se na něho podívám

tak zjistím že tady tu krabičku bych mohl úplně klidně

nahradit

sčítačkou

ten vstupní signál do ní valí

přes koeficient

jedna mínus gama

jo

a pak tam mám výstupní signál který jeho vzorek zpožděn

a do té sčítačky valí s koeficientem

dám

jo takže to normálně typicky

příklad _e Í R

filtru

můžeme si dokonce _e vyhodnotit jeho impulsní odezvu

jo když prostě do takovýhodle filtru

pustíme jednotkový impulz

že si stáhnout

_e svou

z toho písíčka protože

raz dva tři pořád ještě slyšet

no a tady se ozývat takový podivný cvičení

že znaky nebo to slyším jenom jo eprom _e

ne nevím

nevím já sem totiž šekovou bohužel jako mladý a hloupý chlapec experimentoval s pro co

acetonem a

_e ten _e klonech nulou prvně píská sluchu

vchodu

jaký dvacet let

_e tak já nevím jestli jako to s vyšším jenom já nevím uslyší všichni

ale většinou tome pískání vyšší _e

jak prosím vás na pracovat konce dávejte pozor to potvorám udělám kterou ručičky

zná téma čase karafiát o naší skupiny

experta na rozpoznávání řeči s velkým slovníkem tak primality své zkušenosti s procesorem tomu nepískal

sucho letem a spoustu takový zarputile

že podívat se na martě se dopustila to docela zážitek

_e tak sem tak jako pěkně sešli a

popovídali jako kdo to kdy a kolik navařila

proč to dělat nebudem a silně den

tak nic pětek je zpracování řeči prosím _e

tohleto je _e impulsní odezva když do toho pusť spustíte tenhle signál

tak jako první koeficient vyleze na vstup jedna mínus doma

a potom když to tak netočíme pořád dokola

tak _e vylízá jedna mínus doma krát doma jedna mínus gama krát do má druhou

jedna mínus do makra doma na třetí a tak dále

jednou sem dal takový ty kladné zkoušku a tam jak je to nenapsal asi dvacet

takový sledoval podepsat to bych se upsal

jak sem napsal já se mu plný počet bodů protože to je dobře a učinil

sem poznámku že by třeba hodila nějaká suma nebo

tak _e

tak _e

a _e tech je prosím vás když se podíváme na tuhle impulsní odezvu

tak zjistíme že to je vlastně geometrická posloupnost počáteční člen to má Á nula se

rovná jedna mínus doma tady todle čísílko

a kvocient je gama

a když zahrabete paměti a zjistíte co se možná ne gymplu nebo někdy prváku

učili o geometrických posloupnostech

tak my sme si mohli tak cvičně zkusit její součet

součet geometrické posloupnosti Á nula lomeno jedna mínus Q a kupodivu nám to vyjde jako

jednička

což je docela potěšující protože když člověk počítat střední hodnotu nějakých _e nějakých vzorků

a tam sou nějaké prostě _e nějaké násobitele nějaké kvocient i tak by docela chtěla

a bity násobitele dohromady sumě dávali jedničku že jo

jo když počítáme normální střední hodnotu offline

dyž pudeme tady sem

tak _e ty násobitele sou jedna lomeno N

jedna lomeno N jedna lomeno N a tak dále až jedna lomeno N

a dohromady mám N takže mi ta suma

kvocientu dá dohromady jedničku

u těch _e

_e

u těch násobitelů prostřední hodnotu

online

mám jedna mínus gama

jedna mínus do makra gama jedna mínus do makra doma na druhou a tak dál

až donekonečna tak si tak jako nejsem jistý jestli je to v pohodě

ale tato suma

nás přesvědčuje že je to vpohodě protože opravdu dostáváme jedničku jo

a když se podíváme Z jak tady ten výpočet _e funguje

tak zjistíme

pro tenhleten vstupní _e signál který má střední hodnotu někde na

napětí tisících

že to tomu odhadů chvilku trvá

než se tam dostane

ale potom se tam usadí a samozřejmě si nějak osciluje

ty oscilace by se zvolena zase vazeb tam potom

a když potom to střední hodnotu odečtu tak tady mám nějaký takový sjezd kde

ten signál lepší nepoužívat ale potom zjistíte že dáte signálu docela pěkně sedí okolo střední

hodnoty nula

tak a teďka by mě zajímalo a sem tam dá hodnotu má se rovná nula

celá devadesát devět

co kdybych _e řekl že tady ty zákmity jsou trochu moc velké

takže bych nechtěl potlačit že by chtěl vyhlazení nižší střední hodnotu

co byste ně poradili

vy větší gamu eště víc připlatit jedničce že jo takže nula celá devět třeba

dobrý může být ale

co by byl jako nepříznivý

efekt vždycky něco za něco v životě

no takže mu to mnohem déle trval než by se tam dostal _e to znamená

ta časová konstanta

když by to naběhlo do skutečné střední hodnoty

tak by prostě trvala

takhle

tak _e

dobře D to byla střední hodnota říká podmínce preemfázi

preemfáze taková historická operace ale ještě si občas uvidíte

a souvisí s tím že když _e máme tvorbu řeči

tak vlastně hodnota

extra nebo to co jsme schopni vyrobit na

_e na _e různých frekvencích tak takhle lineárně klesá směrem k vyšším frekvencím

takže ta preemfáze vlastně jako kdyby vyrovnává kmitočtové spektrum

a snaží se

ty vyšší frekvence posílit

a todleto dělám právě jednoduchým filtrem prvního řádu jedna mínus _e nějaká konstanta krát Z

na mínus prvou

a ta konstanta je něco mezi nula celá devět cache až jedna

jo a už sme si tady vykládali v tom příkládku před tím že se to

skutečně chová jako horní propusti

a když se podíváme modulovou frekvenční charakteristiku pro

_m konstanta se rovná nula celá devadesát pět

tak _e

tak je to horní propust

filtrování s tím a tím filtrem obyčejné

zase zkusíme si cvičně nám namalovat blokové schémátko

leze do toho

sto

ten vstup de přímo do sčítačky

s toho de výstup

_e

uložení

a

tady budu mít hodnotu

mínus nula celá devadesát pět o to

takže preemfázi z nevyřídili poměrně rychle jo tady ještě naznačeno jak to

_e jak to bude fungovat

tohle kousek _e slyším éčka létajícího procesem ui oblíbený signál

_e tady je

totéž vy preemfázovaný _e takže pořád tam ještě vidíte nějaké základní charakteristiky strofu ale prostě

cokoliv byla změna tak je si tvrdě _e zesílen

tak _e tetě dělení na rámce nebo na segmenty

a před proč

je to protože

celý tady ten kurz bude vlastně vo tom že sto řečového signálu se budu snažit

počítat nějaké parametry něco odhadovat

teti abyste odhadovali

tak _e potřebujete aby

zase podle pouček _e i se sedadly statistiky

aby ten signál je kterého odhadujete se choval pokud možno pořád stejně a B stacionární

řeč je všechno možný ale jenom nestacionární signál

jo kdy vyřeš byla stacionární tak to bude vypadat takhle _e nebo

a to po jako půjde navěky já zase z dobré to přestane bavit

takže to že řeči ste schopni přenést nějakou informaci pramení právě to že řeč stacionární

není

no a jak to teda jako s montovat dohromady když teda com abyste cionální vona

není

tak _e to řešíme tak řekům takovou jako trapnou syn tou a to že to

řeč _e rozsekáme na nějaké úseky

že budem říkat rámce angl tam anglicky frames

jsou s kytkám

německy nevím zeptejte našich němců na ve skupině

a s každý ten rámec budeme vlastně považovat za samostatný signál

počítáme si z něho nějaké parametry

pak se o kousek posuneme a tam zase budeme počítat jiné parametry a takhle pořád

dokola

jo teďka _e

jaké zvolit C parametry těch rámců to jako je téměř neřešitelná filozofická otázka

protože ta délka by měla být dostatečně malá proto aby se na ní ten řečový

signál moc neměnil

ale taky by měla být dostatečně velká protože ze dvou vzorků nic neodhadnete jo statistiky

víte že když máte málo dat

tak _e výsledný odhad stojí za prd takže

nějaký kompromis

kompromisem je typicky dvacet až pět a dvacet milisekund

co Š na

telefonní vzorkovací frekvenci odpovídá nějakým sto šedesáti až dvěma stům vzorku

tech _e ty rámce se taky můžou překrývat že jo nebo se nemusí překrývat

když to překrytí dáte

_e datem ale znamená _e vo pár vzorku nebo vůbec budou takhle prostě navazovat jeden

na druhý

tak _e to bude fajn protože se v tom signálu budete posouvat rychle je to

znamená dnes potřebujete moc výpočetního výkonu

_e akorát že hodnoty

které spočítáte

pro ten rámec a pro ten další

se vám můžou pekelně měnit _e představte si že máte nějakou pilový v u

třeba taková hláska P

to je perfektní protože máte ste řeči před to téměř úplné ticho

a pak najednou během E s na dvou tři milisekund a máte strašný strach

protože vlastně nastane výbuch exploze tu pusu votevře se vektor tak takto buchne

jo takže pokud _e chcete vám stojíte vo nějaké jako pěkné průběhy _e parametrů chcete

třeba zobrazit tak asi budete muset dát _e větší

větší posuv

když to překrytí zase dáte velké

tak _e dostanete pomalý posuv

takže to bude náročnější na procesor na paměť na všecko

průběhy parametrů nebo

vyhlazené

a navíc jako _e dostanete velmi podobné parametry

_e sousedních rámcích

a ty velmi podobné parametry taky nejsou moc dobré protože _e některé vlastně techniky rozpoznávání

jako třeba markovovy modely ze kterým a vás tady budu si později

tak ty _e dokonce jako předpokládají že ty vstupní vektory na sobě navzájem nezávisí

jo to je rozejít předpokladu který samozřejmě není nikdy splněn a když byste dali ty

rámce jako hodně překryté

tak

to není pravda už vůbec

prostě ty sousední hodnoty na sobě budou těžce závisí

takže zase se dostáváte tady do tohoto problém

takže zase nějaký kompromis

_e typicky

bude překrytí

podle délky rámce

buď deset nebo patnáct milisekund

jo to znamená že když budu mít

dvaceti milisekundového rámce

budu překrývat vo deset

tak to wine nějak takhle když budu mít pětadvaceti mi sekundové rámce budou překrývat o

o patnáct

tak to vyjde

nějak tak _e výsledkem je výsledek je vždycky stejný

a to ten že dostanu vlastně sto rámců za vteřinu

toto je asi nejtypičtější hodnota

_e říká se tomu sem ty sekundové vektory protože jich prostě bude sto za vteřinu

todleto je rozpoznávání

kódování je to spíš tak

že ty rámce leží jeden vedle druhého

mají délku dvacet milisekund

to znamená pak tady kladen se

bude padesát

padesát za sekundu

vlož _e tohle byly

řečové rámce

a teď dělám takový počet jako kolik rámců se vám vejde do nějakého úseku

tak _e když mám N vzorků řeči

a ty rámce sou best překrytí

tak prostě vezmu N L lomeno děr délka rámce vezmu si s toho zaokrouhlení dolů

neboli floor

a to je moje výsledná hodnota

když _e se ty rámce budou překrývat

tak je docela dobrý si vlastně vypočítat tady tu

_e

tady tu hodnotu

jo tady mám začnou jako se ram nechápu proč tuto to mělo znamenat jako asi

shift

asi jo asi se ram bude asi jako shift rámce

a shift rámce je délka mínus překrytí

a vy vlastně si řeknete pokud mám takhle jako N vzorků tak ten jeden rámec

do toho strčím vždycky

a potom to co mi zbývá tedy N mínus _e délka toho rámce musím rozdělit

musím rozdělit na ty šifty jo takže podělíte se rám

s toho vezmete slova

a je to jako by aby tady ten vzoreček fungoval opravdu proto se slovně

tak by to ještě chtělo přidat nějakou podmínku jako že když je vzorků eště míň

než jeden rámec

tak tam bude nula ale toto byste si zase dokázali

abyste si dokáže udělat

jo do důležité je si pamatovat že při normálních parametrech

to znamená délka

pět a dvacet milisekund

_e překrytí nějakých patnáct milisekund

tedy

shift deset milisekund a když máte dost řečí doprava ji doleva takže když zrovna jako

nekončí ani nezačala tak prostě dostanete sto rámců za vteřinu

nejdůležitější

tak

tetě _e nějaký poznámky o tom jak ty rámce vybírat

samozřejmě nejjednodušší je prostě jako vzít startovní vzorek konečný vzorek

ty vzorky vy kousnout

a když tady tohleto je mu rámec

tohle jako de do _e si to asi dělá se to asi nejběžněji

_e

ten výběr vlastně to že řeknu jako tenhleten rámec to je vlastně ekvivalentní

pro násobení

s nějakou okénkovou funkcí jo to znamená vy máte

máte takle jako signál

teďka řeknete já potřebuju rámec dlouhý N vzorků

tak ta okénková funkce vlastně vypadá tak

že jedete vod vzorku na

do vzorku nora mínus jedna

a prostě tady ty vzorky vyberete

a ostatní

ostatní neberete úvahu tady tohleto jeden rámec

tak samozřejmě vy tu okénkovou funkci taky můžete nadefinovat nějaký na řeknete si tohle jako

moc brutálním pro s _e

za to okénko mě

na krajích

tam kde sem ten

signál

vy kousl tak mě to udělá nějaké ošklivé přechodové efekty a třeba tady

to může udělat něco takového

takle potom vypadá ten jeden

vyfiknutý rámec

a tady tyhlety

artefakty na kraj se vám vůbec nelíbí

mimochodem _e když takhle vyslechnu a pak bych to dělal frekvenční analýzu co mi tam

tady ty zuby na krajích

dělají

mně generuje každá ostrá hrana kterou sem drobnou signálu

vysoké frekvence jo

no takže můžete říct jak _e já to nechci takhle _e takhle škaredě a na

to proud

je měj

a vy my sme si třeba okénkovou funkci

která bude hammingovo okno

to hammingovo okno

_e

ne vykousal váty rámce

pomocí nul a jedniček

ale tam kde sme tom předešlým okně měli jedničky

tak je tam napřed takový drobný skok potom je tam povolný vzrůst potom povolný pokles

a potom zas takový droboučký

droboučký skok

tohleto je hammingovo

okno

a

když se podíváme na jejich frekvenční charakteristiky

já sem vám vo tom taky něco mi _e říkal _e říkal minule jsme tady

řezali ty kosinusovky

tak vlastně pokud se podíváme na

to pravoúhlé okno

tak _e norma relativně úzké spektrum ale v _e tady spoustu takových jako těch postranních

_e postranních laloků to znamená vopravdu jako roztahuje a přidával vysokofrekvenční složky do spektra

když se podíváte na hammingovo okno taky postranní složky jsou nulové

to znamená vodu vám to spektrum prakticky neznečistím

ale zase

ta jeho střední část

je dvakrát tlustší nešli toho pravoúhlého okna jo tady prostě

je to je to vypočtěme ve stejné měřítku

kdybyste se k jezdit fakt íčka

které co takhle úzké

je to mám vlastně dva krát širší

znamená že _e hammingovo okno

sice jako se bude chovat slušně k tomu spektru že jo vlastně ne začuní těmi

vysokofrekvenčními složkami

a zase nebude moc selektivní když budou tom spektru nějaké dvě

dvě významné události vedle sebe

tak máte velkou šanci u hammingova okna z vám to prostě rozmázne a že může

nikdy neuvidí

tak _e tím se byly

tím jsme hotoví se přeprat

S před zpracováním se strašná slovní kombinace s předzpracováním

se sice klíče chodil do rozhlasového kroužku ale tentro

_e kterou ostrý

_e poďme se teď podívat na ty základní parametry

takže ještě no opakuji skalární jedno číslo na rámec vektorové čísly vektorové je hodně čísel

na nám

základní parametr tak zvaná střední krátkodobá energie

dalo by se tomu taky říct _e střední výkon

_e

tak jak jsme si definovali ten střední výkon je stezku

v rámci to

jednoho

úseku vezmeme hodnoty všech vzorků na druhou

podělíme délkou

jo jednoduchoučkého operace všecko na druhou

suma lomeno délkou

na co to bude může to být dobrý na _e detektor řečové aktivity tam může

člověk mluví tak by ta energie měla by vysoká že jo protože mluví tam kde

ticho tak asi by měla být nízká

můžete zkusit rozlišit hlásky

na znělé neznělé

_e aby se na to dobře koukalo taxes té krátkodobé energie vlastně vědí o průběhu

dost často vy dělá logaritmus

ono to má dost velkou dynamiku jo a když to vyplotit nelineárně tak se na

to špatně kouk a právě proto že jsou tam ty hodnoty vzorků na druhou jo

prostě když je ticho

tak _e opravdu malinká hodnota když najednou máte hodnoty vzorků na druhou a eště sečtete

v rámci jednoho rámce

že vynásobíte sto šedesát krát

tak to nemusíte viď S

_e na co je potřeba si dávat trošku bacha je

že pokud byste toto chtěli použít jako opravdu detektor řečového signálu

tak vám to bude poměrně

dobře fungovat když budete mít čistou řeč

thomasi vopravdu není nic lepšího prostě jako počítáte krátkodobou energii hodíte si na to nějakej

ta

_e některých pracích třeba vod našich kolik žáčků saviňon u

se ta krátkodobá energie modeluje nějakýma gaussovka _m ale prostě funguje to nádherně dokážete detekovat

kde řeč ne není

když _e byste si vzali třeba řeč nahranou s auta

tak se v rejži

protože

základní

průběh toho

řečové signálu bude obraz zhruba nějak takhle

a s toho občas polezou nějaké jako _e silnější hlásky jako _e samohlásky

ale v zásadě prostě tam neuvidíte nikde ticho a pořád tam bude bugr

akorát tom bude někdy trochu větší bugr a to bude když tam člověk mluví

takže dělat na takovémhle signálu detektor řečové aktivity pomocí energie

je docela nebezpečná záležitost

když máte ten _e práh nastavený

_e příliš nízko tak vám to říká pořád že tam řeč

že máte naopak zase příliš vysoko

tak _e když tam bude nějaká samohláska tak

tak to řeč vidíte

ale pro takové příchuť ke hlásič ke jako třeba C nebo šest nebo tě

tak máte smůlu tyhlety hlásky prostě nemají moc energie sami o sebe takže by vám

úplně zanikly šumu a tím energetickým detektorem byste nechytí

tady tohle jenom ilustrace

_e když se to vyplatí to lineárně

tak

to vypadá nějaká tech těch tu úsecích mu toho nevidíte tohle plots logaritmické krátkodobé energie

tak _e další parami tříd je počet průchodů nulou

tak zvaný zero crossing

a tady tam napřed

ukážu asi o co se jedná potom pojem rovnicím

když _e vlastně máme řečový signál tak vopravdu počítáme

kolikrát nám projde nulou sem počet tři

zaznamenáme a hodnota která by tady byla nevím raz dva tři čtyři no asi dvacet

tak bude charakterizovat _e tenleten řečový rámec

jo a tetě zase zkuste si říct na se ten počet průchodů nulou asi nebude

dobrej

když člověk bude

říká nějaké

to je šumu vyšší hlásky jako třeba

F

jak asi bude počet průchodů nulou vypadat

velké N máj

velké jo protože to je vypadá jako šum

takže to častěji krát prosek nenulovou hodnotu

a počítám nejvíc

tak _e

jaké bude mít tady ten počet průchodů nulou problém

tak

zase jako když budete mít šum

tak

bude problém protože všecko bude vypadat jako šumový hlásky pokud tam nebude opravdu nějaká notně

silná samohláska která ten šum na sobě na superponují a vytáhne někam do výšin

_e k čemu myslíte že by tak mohlo být dobrý

tak

můžete zkusit třeba nějaké určení charakteru hlásek

_e můžem to třeba zkusit _e použít jako nějaký jako paralelní

detektor detektoru řečové aktivity ale jinak bych řek že ten počet průchodů nulou se až

tak moc nepoužívá v dnešní době

že to takle spíš historicky parametr

ták a tetě

_m poďme o toho použití zpět k tomu jak by se takovej počet průchodů nulou

spočítal

abyste

co byste navrhli jak to spočítat

to je vlastně pruh od nulové byste jako o matematicky nadefinovali

měla znamínka

jo

dobrý no takže vaše návrh jak ten počet průchodů nulou spočítat

z mohli byste napsat _e cyklus že

a tam přidat nějaké dvě podmínky is znamínko minulýho vzorku bylo plus

ende znamínka současného vzorku je mínus tak někam něco připouští pak _e ještě tu opačnou

podmínku asi byste se k něčemu takovýmu dostali

tak jo jazyka zkusím navrhnout elegantnější variantu

_e

bude to předpokládáte znamínko V signál

to znamená

vezmeme si nějaký C

sobě na

X N

představte si že vo toho odečteme mínus _e se do na

X

N mínus jedna

co jsem teďka právě vyrobil

kombinuje znaménková funkce která pro kladný vzorky plus a pro za plus jedna a pro

záporný mínus jedna

komparátory jo ale mám pocit že sem vyrobil zrovna funkci která když to znamínko vydrží

na stejné hodnotě

tak nebude dělat nic

že jo

jo když bude se krno minulýho vzorku plus jedna asi byl na tohodle vzorku taky

plus jedna tak jedna mínus jedné

nic

když bude se teda minulýho vzorku mínus jedna sebe na todle vzorky mínus jedna tak

nebudete nic

ale bacha když se to změní za je záporný vona kladný tak něco napočítá plus

dvě

že to změní s kladnýma na záporný řekněme napočítá mínus dvě

jo

a

no to jedno tohle

tam už sme mentálních o prostě nesají teďka řeč prostě v jednom případě teda počítá

pro dvojku a ve druhý mínus dvojku

když to dám

zase lodní hodnoty takto pokaždý napočítá pro dvojku

když to

_e podělím dvěma tak to pokaždý napočítá plus jedničkou když se změní znamínko a ta

už sme tam kde sme chtěli víc jo to znamená ose akorát uděla suma tady

tohodle přes rámec

a najednou máte _e máte počítadlo

průchodu nulou

jo ale je možný že s tím _e že s tím jak ste říkali že

uděláme teda cyklus a tam uděláme dvě podmínky to bude rychlejší

sám jako si taky můžete vyhrát _e definicí té funkce signum

můžeme vy vyzkoušet a vymyslet nějak ještě složitější definice který budou řešit nulu a když

zprava bude mínus a zleva plus takto budeme nula já nevím to ale tím asi

nemá cenu se moc _e moc zabývat

tohleto je průběh _e

průchodu nulou pro mé oblíbené létající prase

takže vidíte že pro hlásky typu _e a

je ten počet průchodů nulou nízkej

co

nám to vyplatí

US

taky takže tady byste docela

_e docela jasně poznali že se tam jedna musí kavky tedy o hlásky s vysokým

poměrem sou

tak a už vás nebudu dále obtěžovat narozeného pepíka

se podíváme minule _e teda

ten nekauzální

dělení podíváme se na něho příště

_e a zkusíme si říct access jednotlivý komponenty rozjet jádra říkám rozřezaný pepík to bych

moc neměl protože ten obrázek mě poskytl pan profesor josef psutka

z plzně

takže to je téměř horáckej říkal zvaných netýkaly doufám že se nepodívala toto video

_e takže si řekneme si jednotlivé komponenty modelují plíce budou jednoduchej na ty se číslicové

zpracování vykašleme úplně

ale u hlasivek o vidíme že tam bude nějaký generátor a nejzajímavější bude řečové ústrojí

se kterým vlastně neustále mydlíme a měním ho abych dokázal artikulovat

a to se právě bude měnit pomocí filtru a koeficientíky toho filtru budu muset každých

dvacet milisekund _e počítat tak příště si řekneme jak

pěkný večer přeju nashledanou