každý dneska sme získal místo santa černockého

vy ste se minule bavili o L P se pokud _e tak aby sigstop až

do s _e dvacet dva

takže už teďkaji se že jako si centry _e toho si u true

na modelování řeči se dají spočítat

_e kdy řešením P rovnic o P neznámých jo vy ste počítání nějaké autokorelační koeficienty

tam se si vytvořili jako soustavu rovnic a to se na normální vypočítat

_e druhá možnost jak to vypočítat

je použit tady tenhleten algoritmus a nevím standardy

a vlastně mýho můžeme použít protože ta matice

potom _e

nebo když

ta matice jako osy centů

ve hodnot ukážu lepší

že vlastně

když máme tady todleto soustavu a vypíšeme se jenom do matice tady tydlety autokorelační koeficienty

tak potom vlastně když si můžete všimnout

že v diagonálách nemáme úplně stejné hodnoty jo tady máme errno u všude potom máme

jednička tady takže jednička a tak dál

tady tadleta matice se bude nazývat dopitová a vlastnění teďka možná použít

tady tenhleten iterativní algoritmus jo

vlastněný postupně bude mám a vytvářet prediktory různé řádu od začátku to bude prediktorů to

řádu

a potom máš prediktor toho perského řádu a musíme to projíte krát

_e asi bysme mohli fused vypočítat nějak oněch iteraci sáry abyste si

vlastně

vyzkoušeli jak se to může

dělat

vlastně tady _e tento ten první řádek to je nějaká iniciály z _e C jo

mise řekneme že vlastně

_e

si postavíme prediktor nultého řádu

a she bát _e predikce bude

vlastně to všechno co máte napsané v tom prvním řádku co to znamená

když se podíváte na

na tu inicializaci tak můžete si všimnout že tady máme ten nultý autokorelační ku sice

jo

takže prosím vás zkuste se zamyslet nad tím co

nebo už tady tenhleten tlačte neni žen nedělali

dobře takže zkuste se teďka za ni sled na tím a

co to je za ten prediktor nultého řádu

a co je ta chyba

vlastně

my když se postavíme filtr

kterým a

nula pozice _m to

tak co ten filtr bude dělat

nějaké nápady máte

_m to bysme potřebovali aspoň jeden po třicet

to bude dělat při se změní jo to bude taková ta

ale černá díra jo

která vlastně bude všechno pouhou celá ta a poleno nám stole jenom v podstatě nuly

jo takže právě proto

chyba predikce když máme ten prediktorů toho řádu

budeme mít a Ú ty autokorelační koeficient co je tam mute autokorelační kosice pro

jo R nula teďka nás zajímá

jo může mít teďka víme že vlastně chyba bude maximálně že jo

protože tam ten filtr vlastně na genové vůbec nic

no a maximální chyba to je vlastně ten náš nultý autokorelační koeficient protože my vezmeme

signál

vynásobíme ho sama se sebou jo a dostaneme tomu té autokorelační

kusy C N

tam dobře teďka zkusím a tu první iteraci jo teďka vypočítáme

a K

K jedna čemu se to bude rovnat jo postupně se to zkusíme udělá tak vlastně

já to zkusím nějak psát tady když je to moc neumím

zatkla jedna vlastně

zkusme to udělat pouhého podívete vám ten vzoreček a tak co tam budeme psát

tak jasně že tato mínus jo potom máme

vlastně R jedna že

_e ta suma prosím vás bude napočítat todleto sumu

my se podívám na té hranice tak _e se ne tak té todleto eště viděli

mátou vlastně

chybou

jo E nula

jo

teďka můžeme vypočítat a jedna což bude vlastně to K jedna

jo _e potom vypočítáme vlastně tady zase

pro tenhleten interval musíme vypočítat _e ji Í

takže zase vypočítáme nějaké to

a jedna jo

takže tady ni napíšeme že vlastně a jedna

dvanáctka jedna

a zase Á jedna

jedna den

a co tady bude to bude já to mám napsané

neudělal špatně

_e budeme počítat teďka tady todleto prosím vás a teďka se dívám že to počkat

nebudeme jo protože když se podívá na té hranice

tak vlastně to a tady tenhleten výrazy je u nás nula no takže nemůže napočítat

objednáš

asi už musím udělat

no a vypočítáme teďka šípů u té naše predikce ste první iteraci což bude

vlastně _e

co to bude

to K jedna my vlastně máme

na i mě C zvané nějak ta záznam vlastně toto paní mayer a jo takže

vidíte v té první iterace

děláme a úplně jednoduché výpočet oblast napsat nechci protože tom name psát na tady todleto

tady nějak nepohodlně se to spíše

no a v druhé iteraci vlastně už použijeme hodnoty který jsme se předpočítány jo

vy chcete todleto už _e se mění v laboratořích jestli se nemýlím že jo ústa

se to všechno

_e že asi možná ani nemá moc

_e cenu tím nějak moc dlouho procházet

_e

že na dalším slajdu tady vlastně my máme

všechny _e

všechny hodnoty uši jako kdyby spočítá nette naše kofi centry a taky _e ty nic

mezivýsledky

to todleto budou

no teďka a ty hodnoty našeho filtru

a todleto sou nějaké ty mezivýsledky my si potom a podíváme na co sou ty

mezivýsledky dobrý protože

oni vlastně nejsou jenom tak mezivýsledky letech se potom něčem už

vy ste se už a se říká několik to _e velké P je jo nějak

nějakou tou hodnotou ste obsluž nadefinování

_e byste se o tom bavili na začátku úplně

jak ste stavěli tam _e ten filtr takový se vlastně ten filtr postavili ze třech

části že jo

jste modularity hlasivky potom vy ste modelovali artikulační trakt a

_e nějaké to vyzařování jo

a to P se něčemu rovnalo

my sme se tohoto no to nějak nadefinovány _e jak sme si tam tu hodnotu

nadefinovány

ten artikulační trakt jak sme modelování vlastně my sme

zdraví ste

vy ste vlastně si říkali že _e

že to bude sekvence nějakých filtru

že jo ten artikulační trakt co se tam co se tam děje prosím a my

hlasivkami a vytvoříme nějaký signál

a potom u nás tam spouse podle toho jak si

co _e nastavíme vytváří se nějaké rezonance že jo

a ta krátká ne filtru potom vlastně nám modelovat rezonance že jo kolik bylo těch

filtrů

ty rezonance _e jak se tím rezonance _m eště říká

formám toto si pamatujete jo takže vlastně

my musíme

modelová ty formanty jo

a říkali ste si asi že ne užitečných je asi prvních pět

že

a ten filtr _e každý ten filtr který modeloval nějak info forman byl druhého řádu

jo

je to tak

fajn takže a

my teďka máme počet těl formantů

což je k a jo

dvakrát a potom tam eště _e

jo hlasivek nějak vylezla eště jedna jednička jenom

takže to bylo tu C jedna

jo takže vlastně když K ji pět tak nám vyjde a jedenáct

ale my používáme v podstatě deset

jo

je čtyři až pět formantů nadprůměrně

čtyř řádku

dobře

proč těch a pět formantů jenom používáme nebo proč takovýto číslo budeme užívat

to je v podstatě dáno experimentální jo jako že někdo zkusil

udělat filtry když i v řádu ale potom když se podíváte třeba na tady tenhleten

král

tak si vidíte že ta chyba

ona se nějak ne a _e nezlepšuje dramaticky ste

potom jsou vlastně topped překročí těch deset

jo takže v podstatě může má udělat filtr

když jeho řádu ale nemá to cenu protože to bude a komplexnější ale žádná v

podstatě výhoda toho

neplníme

teďka jestli vás napadají třeba _e nějakém

užitečná je využití

tohoto filtru jo my víme že můžeme

modelovat něco může mapu psát vlastně co my říkáme jo ne já říkáme ale to

říkám

jo takže

jak si můžeme

parametry toho filtru a nebo uspěješ tým mezi

mezivýsledky

of počtu

tuhlenc standardy na použit pro rozpoznávání řeči jo

další věci je toho že v ní může má tečka

parametrů tohoto filtru

jak si teda na s parametrů ale _m

za pomoci

o můžeme vypočítat spektrum signálu

jestliže si třeba víte jak bysme to mohli udělat

tak mi teďka máme postaveny nějaký ten C o to že jo a můžeme a

vypočítá teďka frekvenční charakteristiku toho filtru že jo

jo a ta frekvenční charakteristika bude potom tomáše spektrum

jo

todleto co tady máte

to byl ten náš filtr jo

to géčko tohle je toho co vlastně

to je nějaký ten gain že to je zesílení podstatě jako že

že to je víc nahlas

dáme to normálně a na druhou a bude to

jo

teďka když jste viděli vlastně a příklady těch spekter mnohokrát a to vypadalo tak nějak

jak to vypadalo

to vypadalo tak nějak prostě

dejme tomu že to vypadalo

asi nějak tak že

a to je spektrum které sme normálně výpočet _e je pomocí fourierovy transformace že jo

a co vtom spektru řídíme

my máme tam nějakou tu obálku co když

to je to co jsme nakreslili vlastně _e netrefila

tak

tu a

sebou tou čárou nesouvislou

a potom eště máme

nějaký rychlejší průběh to

a to jsou to ty komponenty

stejně to říct

čím je to dané

čím sou tam ne tady tydlety čárky tady ty čáry

vlastně jednotlivé čáry

todleto mě zajímá

co to je

víte to

no to sou vlastně harmonické základního tom že jo

vy ste se už byl bavili vlastně o cepstru ne

tak tam ste

přesně a se snažili oddělit

ty násobky základního tónu

jo

vlastně snažili ste se je třeba vyfiltrovat pro rozpoznávání řeči o snažili se ste vlastně

s té spojité čáry dostát jenom two _e tu nespojitost máme k

jo

takže ty násobky _e základního tunu oni odpovídají čemu

mně odpovídá je tomu

jak my můžeme jo to je naše nálada třeba dva nebo kdo o tom vy

a tak dále jo

a ta obálka tu je

co to je

to je psema přímá co mi říká

jo je to jasné

takže mít když teďka se budeme snažit

kdy kras nic spektrum pomoci

toho filtru

no máme teďka o pece

uděláme frekvenční charakteristiku vykreslíme to takto to co dostaneme

tak zkuste se na tím za ni se co mi modelujeme tím filtrem

i modelujeme to co my říkáme jo ne jak mi to říkám a ale co

my říkáme takže v podstatě měnám nakonec měla díle s tady tadleta

v podstatě té tadleta pomalu měnit se

čára

jo

je to ta

asi jo

i

dobře

rozumíte tomu jo víte to

no

a proč to nevíte

že byste to měli

tak mi se podíváme teďka i na nějaké příklady konkrétní

tady máme

tak my máme čtečka todleto jo že máme v podstatě nějakou řeč dva prosím řeči

jedna

změny a nezmění který tady těhletěch rámců prosím vás je z měli a který je

mez měli

co si myslíte

a to je tady řeč a co je spíš

jo tak teďka když vidíte tak tady tydlety signálky už byste měli být

tak nějak víceméně schopni odhadnout což je s o aspoň

tak to je ten a horní levý obrázek

to je to je nějaký rámec měl _e řešit pročetl znělé

čili přímý sou ty _e znělé vlastně

zvuky charakteristické

zase zavřít

prosím

tam není to že v těch vysoké frekvence ale my tak je vtom vidíme E

nějaké ty impulzy jo

to sou tady tyhlety části což odpovídá vlastně

čem _e tom základním o tom

jo jaksi

jo to sou in pouze na kterých vlastně potom něco rozumově

takže todleto je _e znělé řeči a todleto je zase neznělé řeči a my máme

_e k tomu i spektrum tam odra čára je spektru vypočítá ne pomoci čejo

_e fourierova transformace a myslím si taky že tvoje

a vlastně

na druhou žen

vypadá to tak

a to červené to je spektrum po žádné pomoc _e obecné

jo

takové obrázek ste už taky asi výdejny že jo

jo to je spektrogram kde v podstatě my máme za sebou nalepené

a spektra jednotlivých rámců jo kde barva nám určuje

amplitudu

teďka mi zase zkuste _m říct co osou tady tydlety čáry

tady

to sou ty formanty že jo toto sou průběhy vlastně těla formantů

jo

a teďka ní podle těch průběhu vpodstatě když byste viděli takových obrázku spoustu aby byly

co se tam

vlastně říká vlož jako s časem byste byli schopni v podstatě i přečíst je

jo

samozřejmě po vás se to nevyžaduje ale jestli se nemýlím

já nevím jestli to je v tomdletom kurzu anebo ovšem ještě dalším nějakým

_e jsem černocký ondro zdálo takové takovej ten vlastně list obrázky

nedostávaly ste nic takovýho jo tam se dostávají vpodstatě

_e jako kdyby Í spektrogram jednotlivých hlásek

jo

a potom ste dostali spektrogram nějaké věty a měli jste vlastně jako kdyby přečíst tak

zkuste sou zeptat třeba _e tuto na se

jo jako je to zábava

relativně

takže fajn todleto už víte

a teďka máme a zase nějaké spektrogram úplně na stejném úseků řiči akurátní když se

na to podíváme psát vlastně nějak se to nižší

jo

a jak se to nižší

a my to počítáme dívejte se jedno se nazývá dlouhodobě spektrogram druhé se nazývá krátkodobé

jo takže to znamená že u dlouhodobýho mi vezmeme dlouhý úsek řeči a vypočítáme spektrum

jo

do krátkodobý umývat na krátký úsek řeči a spočítáme

vlastně _e

to spektrum

a ten Í vidím a takové čáry si myslím vidíte je

po vodorovné čáry jako kdyby vtom

že

a to sou ty vodorovné čáry takové ty

tady bysme měli vědět aspoň si myslím

plně i tím

takové čárky tady mám pouze

tak to sou tady tydlety čáry takové ty jemné částky

to sou násobky to základní frekvence tak fajn

tak už podstatě tomu ty rozumíte

a todleto je L pece spektrum jo my vidíme že tam už na žádné násobky

ten základní překáž

jiné vidíme že to je hezký takový vyházeny

jo

teďka se dostáváme dá a to sou _e

nějaké parametry které dokáže má odvodit

chtěl auto je celku chycen to a nebo spíš těch mezi výsled

tady máme důvody pro oč vlastně ty _e kusy centech filtru a jaký

nejsou moc dobré pro rozpoznávání řeči

jo oni se špatně kvantují zaprvé protože

potom ten náš filtr se může nám pro stabilně

jo to je to je to je blbý

potom a oni jsou tvrdě korelovány co to znamená

a pro vás teďka momentálně to neznamená vůbec není jo to

o tom se bude zabalit a ježků rozpoznávání řeči kde

vlastně budete stanic nějaké _e ješitný marcos model to je to H M

a to sou nějaké pravděpodobnostní _e modely

jo vy ste už zřejmě viděli nějakou gaussovku aspoň ste to měli nic někdy třeba

a vy sto asi sto možná nepamatujete ale třeba na signálech a systém nachystej kdy

se kreslit jakou tu gaussův

jo vám se asi nejspíš neříkalo proč a já taky nevím proč ty obkreslili ale

když jenom tak jako vyzkoušet

jak se to zapíše aničce tam viděli tu klaus ovečku která co _e jednodimenzionální gaussovka

ona potom bude vypadat nějak

podstatě takle

jo pamatujete se jo

jo takže ste měli vlastně nějakou tu střední hodnotu a potom eště rozptyl jo to

znamená jak je to širo

když vy děláte rozpoznávání řeči

to tak gaussovka vlastně znamená ona znamená že my máme soubor nějakým hodnot

jo

_e

většina tě hodnot ona je soustředěna tady někde jo kolem té střední hodnoty

jo

a tady vlastně když je normalizována tak vlastně tady je nějaká pravděpodobnost

kolik tam tě hodnota se je

a když není to normalizace počet

jo

_e

kdy děláte rozpoznávání řeči tak vlastně tam se používá zaprvé hodně takových tě hosts klausule

a za druhé a _e

oni jsou většinou

mají většinou jako vnější dimenzi jo což tak piva polem těch čtyřiceti a šedesáti

jo

a ve dva ADS to bude vypadat zase trochu

jinak já vím že vám to asi možná až tak moc teďka neřekne ale tak

abyste potom třeba příště nebo ne příště to probuďte bavit

třeba se nám to vzpomenete tak to bude vypadat vlastně jako třeba

nějaké kolečko jo kde střední hodnota a potom máme rozptyl

tady a tady

jo ono to totiž to není

není až tak kolečko ale tvoje

_e takový kopeček

jo a my tady máme nejvíc vlastně ke hodnotu úplně nejvíc teček tady můžeme namalovat

a tady jenom prostě užší

jo

a ve tři D to už bude takový mráček a kdyby shopu

a teďka ni se baněma u nějaké ten

ku relaci

co ta korelace znamená

my když teďka vlastně nakreslíme se nějakou klausův k Ú

třeba můžeme si nakreslit takovou

jo tady máme střední hodnotu

a ty nějaké rozptyly jo akorát že ona není kulatá

a je taková jako dlouhá

jo

dlouhá alef takovým tom _e

k tedy avon ale spíš

takže

a když vona není položená ani k takovém ani není takle jo když vlastně tady

máme tu diagonálu tak se prosím vás aspoň pamatuj teďka že tam je jistá korelace

jo že vlastně hodnoty v jedné dimenzi záleží vzali se na hodnota druhé dejme

jo

a tady na popis tady tydlety jsme používali tu střední hodnotu _e nějakou tu

a asi tomu jo tu směrodatnou odchylku

tady bude na používá touž vektor

střední hodnota dvě střední to teda

tam bude i od jako kdyby dvě hodnoty té střední hodnoty X Y a potom

tam bude užší

matice

jo

tady bude má mít

řekneme si to má X

tady budeme mít a sigma Y

a tady budeme mít vlastně sigma X Y _e sigma

Y X

jo eště hodnot máme podstatně

víc

když P je _e když by vlastně ta gaussovka nebo ty parametry vlastně nevinný korelované

tak potom

máme nenulové hodnoty jenom diagonále

jo

a todle máme v podstatě jenom velmi jednoduchý příklad jenom dvě dimenze máme

měl a dyž K dimenzi tak potom to roste kvadraticky

tak jo

tak to je jeden z těch _e důvodů proč se nám to nelíbí protože ty

výpočty jsou potom moc náročné

jo

další věc _e proč se nám ty _e koeficienty filtru nelíbí

to je toho že je

když budeme mít

dva neřečové signály

jeden z měli jo a potom třeba

jeden _e z měli

ani vypočítáme nějaké a jaký třeba a jedna

tady a tady a jedna

jo tak vlastně a o ní se nemusejí vůbec nějak moc liší

jo a nic téma

když máme různé řečové

signály tak adit jako si ten se taky hodně rušeny jo

abysme s toho mohli vůbec něco

_e rozumně vypočítat abysme mohli je třeba použít nějakou akci euklidovskou tam nebo něco takovýho

jo

co tady budeme místo toho použila tak budou sou budou vlastně

tady tydlety _e posvěcení cítí tým mezivýsledky nějaké

to budou vlastně ty káčka sme viděli vtom algoritmus

na tom se říká kostce ta po dráze já si co vůbec nevím proč

a nebo a parku pásu korelejšn jo tady tydlety vlastně

_e sice entitními teďka můžeme

použit pro rozpoznávání řeči

jo

takže

co k tomu eště

tak to je asi tak všechno co sem k tomu mohl říct _e

eště další věc že _e ni můžeme

odstranit jako kdyby válcovým modelem hlasového traktu

a co to co to vlastně znamená

to znamená že mi vezmeme jakési jako kdyby trubky

jo každé bude stejné délky

akorát oni budou různě široké twitteru

to _e ty trubky musejí je tam musejí existovat určitý

poměr mezi sousední nic slupkami jo a když to třeba nějak moc hezky nakonfiguruje tak

když ty poměry správně vypočítáte tak potom když tam data

na vstup nějakým

nějaký ten impulz jo

tak potom by vám toho měla díle řeč

jo a jako ne plynulé řek samozřejmě ale

jenom nějaký konkrétní z

jo třeba _e nebo něco takovýho

jo

a poměr vlastně těch sousedních trubek on se dá

počítat hezký _e pomoci zase ti jako si tento od rázům

jo mně vezmeme

vezmeme třeba je nějakou první a druhou tu trubku první musíme ale

nadefinovat na nějakou určitou hodnotu jo protože my nedokážeme vypočítat a absolutní hodnoty jenom vlastně

jenom vlastně a _e

ty ten poměr takže nastavíme to má jedničku třeba

jo jak to máme napsané tady hezky

a potom bledneme _e příslušný koeficientů odrazu

dosadíme sem do toho vzorečku a s toho už můžeme i vypočítat

v podstatě jako kdyby _e hodnotu sousedního valeč

jo a potom

když _e tak todleto všechno vypočitám naivní můžeme dostat

další kulky centy který nám budou určovat

co se říká jo a ty koeficienty můžeme zase

_e použít

proč ní budeme chtít a používán

poměry jakousi centu od rázu proč

proč

nemůže na použito koncepce o dráze jak sme se o tom bavili předminulý slajd

no to bude _e

toho důvodů ženy sice to koeficienty máme

od mínus jednička do jedničky ale ta citlivost

na přesnost těch

a na přesnost kvantování ona bude

vyšší kolem stanuli jo když vlastně káčko je někde polem ten Ú D

tak potřebuje má vyšší přesnost

na kvantování jo a když to nějak špatně na kvantujeme tak to mi bobby

další _e nějaké ku o sice N ty

jsou zase nadefinovány nějakým tím šíleném vzorečkem a oni s kusem mastku se a pochopit

to ten vzoreček

znamená

když máme a nyní A Z nadefinovány jak u

jak to máme nadefinované

pamatujete se ta

a to byla jednička jo která odpovídá tomu že filtr má nějaký výstup

no a potom a je a A jedna Z na mínus první plus

_e dva Z na mínus druhou

a tak dále že

i když říkám dosadím ani sto Z _e Z na ninu s první tak co

se stane

místo ze tam dáme Z na mínus první tak jak to bude potom vypadat

_mhm

a potom ty mínus se budou plus ne

se nám přehodíme znamínko vpodstatě jo nebo ne

tak asi jo

když to říkám

tak zkuste to tam to _e dosadit jeho když mi teďka máme tady Z

tady máme Z na ninu C jedna

jo tak když místo zeptáme Z na mínus první tak potom se to votočí to

bude zatne mínus první mínus první

jo a to se vynásobí že jo

jo

fajn

a teďka eště musíme vynásobit takovým

takovým čísel K

tak

toto bude znamená my ceny tady tenhle tam díra

tady musím ani násobit tím a _e

Z na mínus

a mínus T plus jedna

jo

takže to se tam sta

co budeme mít místo jedničky teďka

tak přímo tady todleto číslo že

místo toho výhod výrazu co budeme mít

jak to bude asi takle _e

musíme vlastně to mínus jedničku tady

a todleto musíme sečíst dohromady pře

bude mínus T mínus ty a tady

že

a

takže se to v podstatě když to spočítáte přepočítáme tak se to vodpočinu

jo ty zetka

vlastně zetka pro a

a jedničku ona bude mít

jako vyšší hřát podstatě nemeš

než se to _e té

jo

to votočim

tak to můžeš rozumíte ani potom amosem M

máme teďka dobře tady tydlety pak polynomy a teďka těch polynomu musíme

vypočítat kořeny jo asi kůžemi budem a zase potom používat jako

nějaké parametry

tady máme dva polynomy

a vlastně co bych vám mohla k tomu eště říct je to že

my potom vlastně jako že mi těch polynomů vezmeme jako kdyby

na třídách jo když se podíváte na ty

a osy centry tady

a ty indexy

tak potom

teďka když se podíváme

sem tady sou třeba

tady jsou rozmístěny ty kořeny jsou jednotlivé hodnoty

jo _e tu ty sou vlastně jako kdyby na střídačku jo ty zelené patří jednomu

polynomů

a ty červené patří tomu druhýmu polynomu co tady je pozoruhodné pro

jste se podívat na ten obrázek

jo kde máme snímáme vlastně tu modrou čáru to je nějaké spektrum jestli se nemýlím

jo

a potom

ty čárky to tam máte

_e topy odpovídají těm kořen tak když se na to podíváte tak tam je nějaká

určitá

závislost to taky

proč ty kořeny jsou vpodstatě a

informativní

jo oni kdyby byly vlastně rozmístěné úplně periodicky tak neslíbí nějakou informaci vůbec

o tom co se tam říká

tak asi by nemec nenesli vůbec žádnou informaci kdy periodického ale vy teďka je vidět

takže kolem těch nějakým formátu kolem těch kopečku

oni sou jak se koncentrované jo oni sou koncentrované

nějakých lokálních maxim _e

jo takže hodnoty vás někde jsou umístěné

na mi říká ji

to se řekla jo

je to ta

nic

teďka L cca kepstrum i ste se už bavili o tom cepstru že jo a

to kepstrum je co

zkuste se to pole

jak se to kepstrum třeba počítal jestli si pamatujete třeba _e

tak ono to je za prvé je dobré vědět

na co ho počítáme

jo

jako že to je naším cílem

my jsme chtěli oddělit budu buzení moc modulace no jak sme to dělali

my jsme třeba měli nějaký signál potom sme měli spektrum že

zase se namalujeme tostexu mám sme to pochopí nějak

no a ta rychle měnit se složka tu ta odpovídá vlastně násobkům ta základní frekvence

jo to buzení

a ta pomáhala tu je co my chceme říct to je ta

_e ty teraz rezonance nějak

jo

no ani když teďka to spektrum _e známa na druhou potom udělám a logaritmus a

zase nějakou inverzní

a inverzní fourierovu transformaci takto s toho dostaneme

my se teďka chceme na toto spektrum dívat jako na nějaký signál protože ní vidíme

že ten signál v podstatě

má vysoké frekvence

jo to sou ty násobky základní frekvence

jo a prostě to obálkou která vlastně to sou nízké frekvence jo

je ženě když teďka ve žádny dalších mezi operaci tam uděláme inverzní fourierovu transformace nebo

prostě rybu fourierovu transformaci tak dostaneme zpátky ten náš signál

jo mít když uděláme fourierova transformace ještě jednou fourierova transformace dostaneme signál že my chceme

teďka oddělit vlastně ty frekvence v těch našich frekvenci

jo musíme tam dát nějakou operaci mezi to

tak dáme tam

vlastně a _e to spektrum dáme na druhou a dáme tam ten vokraj

jo ten logaritmus je tam vlastně ta klíčová složka

víte proč

ono prostě to násobení se dělá nám na při čekání v podstatě a to tam

co je tam to násobení

no prostě násobení je ve spektru v čase to je konvoluce buzení a vlastně a

té modifikace že jo

tak fajn

tak mi užitečný ten

co je to kepstrum tolik což je dobře no ani vlastně můžeme místo té fourierova

transformace tam dát

a zase to co jsme viděli před chvilkou na nějakým slajdu to ten kdy dělám

A Z

jo

že my už teďka vlastně tam

nemáme

_e nemáme žádnou

žádnou tu rychle měnit se složkami tam budeme mít podstatě jenom tu modrou

jo takže teďka naším cílem není oddělení oddělit buzení od modifikace ale

co je naším cílem

v podstatě proč bysme to dělali

za prvé mějte port licence chceme aby jsme

a používáli

co nejmíň hodnot pro u reprezentace nějaké ostrej může

no a teďka už tam to buzení nebudeme mít a že v podstatě budeme mít

něco to same co N cca akorát

bude čež či vpodstatě jo tady tyhlety koeficientíky se hodně používají

pro rozpoznávání řeči

ten proces je ale zdlouhavý jo protože musela udělat vlastně vypočítat

_e musíme datu na druhou potom dělá nějaký logaritmus a zase nějakou fourierovu transformaci

ani tydlety koeficienty dokážeme vypočítat

zase pomoci nějaký vo

nějakýho iterativního algoritmu

a to je tady tímhle tím způsobem

_e je tam akorát dosadíte

dosadíte nějakého do hloubky

předchozí chytráci

a takovým způsobem se to počítáte aleš vlastně C nula až Á

ač někam jo koník jako sem to budete používat ty hodnoty počítáte v podstatě stejně

ale je to jednoduše o něco jo provádět tady tyhlety

operace

tak fajn máte nějaké otázky

k tomu

nemáte _e děláte si přestávku

neděláte a chcete přestávku nebo nechcete

nechcete

tak

teďka jako

jo je se

státní teďka bude mám

prostice podívat a

na další přednášku a to už den

to se musím ještě stáhnout

_m

no a teďka se budeme chtít bajtu určování základního tónu řeči

účty C T dvěma dvě metody jak byste tomu hi

odhadovat

jo com možné třeba to nebudete vědět úplně přesně ale aspoň řekněte mi

dvě nějaké metody pomoci které který bysme to mohli vypočítat jo nechci jet já ale

aspoň nábytek to

je mi teďka chceme vlastně

užitém základním tónu řeči jo my chceme

odhadnout tu a základní frekvence nějakou na kterou na které kmitají hlasivky

jo

debaty hlasivky budou produkovat

zase nějaký ten signál

jo to není řeč této to leze něco co dělaj naši hlasivky

todleto bude nějaká ten nula

jo a potom S nula je jedna děleno ten nula

jo je data

ani teďka chceme

prostě buď tu scénu nebo tu F no spočítat vzdálenost mezi dvěma

infuzi

jak sme to může dělat

prosím

můžeme použít vlastně tu cepstrální nějakou metodu jo protože

a na konci když vypočítáme kepstrální koeficienty ta potom ste měli

něco jako tady bílá třeba ta nějaké vysoká hodnota a potom tady se plazili

zase nějaký hodnot kyjově sme řekli že prvních třicet odpovídá první třicet k otcem to

odpovídá tomu

co my říkáme že jo

jo

a to je ta pomalá změna ve spektru a ty a

dívající vlastně jak to říkáme jo když vlastně vynulujeme teďka prvních třicet koeficientu a provedeme

inverzní operace k těm které sme aplikování abysme proč tady to kepstrum tam dostaneme

tady todleto

jo samozřejmě to bude trošičku zašuměné eště nebude to úplně tak pěkné

ale potom může mazlit vlastně ty dvě špičky a kdy počítat i vzdálenost a potom

vypočítat citue jo to už umíte

další věc

o tom jste se bavili minule

tak když vlastně jisté dokázali vypočítat kosy centy _e auta cation true

jo máte ty koeficienty

teďka prostě máte třeba kurz licence pro _e pro _e jo

tak uděláte inverzní filtr k tomu

L pece to že _e Z

jo

sem pustit této _e

a tady by vám mělo díle to

tak ten L P zkrátil term modeluje jsou říkám

jo

inverzní on vlastně se snažit toho říkáme odstraní

jo

a teďka nám tam vleze _e

my vlastně to a tu informaci v podstatě snažím a odstraní tak by nám měl

velký let potom zase

by měla vylézt sekvence těch impulzů jo

je zase tady vyleze prostě něco

takovýho

jo

ekologické by to mělo být protekce

jo když se podi ono tam trošičku je zamotána s tím A Z se vším

kterém

protože tam se mluví o několika jestli v podstatě

najednou jo že prostě to je nějaká líně jarní predikce a potom vlastně todleto

ono to

po až tak moc ponesou wifi ale je to tak

fajn

teďka proč se o tom chceme báni celou přednášku když je to tak jednoduché

co se měsíce

to se dá udělat třeba jaký jiným způsobem _e ale eště tam nějaká dietní se

musíme

učte se určitě bavili o nějakým charakteristika že jo toho základního tom tak zkuste mít

popřát ten základní tón všechno co o tom víte zkuste se na to vzpomenu

tak zaprvé musíme třeba _e vědět hodnoty

nějakého z mezi jo vy ste se říkali že muži třeba maji

odpadní padesáti nějak tak jo až sto padesát třeba

jo dětima je kolem těch _e

cysta čtyřista jo a ženy nějak tak mezi

mezitím a samozřejmě to záleží jo úplně krát můžete zpustle

ale a _e no samozřejmě ono to se ještě

a já nevím jestli nám to pan docent černocký říká ale ono to akože

není úplně takle pravda protože

no to záleži taký a _e na té populace jo že evropě lidi mluví prostě

jinak než třeba a z i jeho tam oni mají ten základní tom o něco

vyšší

jo

neříká vám to pan docent přenosky že třebas a v číně údajně děti můžu mluvit

cache tisíc herd

time

jo takže

takže a _e to on mi říká že a vlastně ty mobilní telefony jo s

tím kódováním intel řešené fungování

no takže se to muselo muse se tam přímo dodávat trošičku jiné jako telefon si

nenastal

tak

ale já si myslím že pokud moderní době touž tak zase nemusí platit protože a

_e

že v americe třeba že je samozřejmě hodně číňanu a já poštípnu že oni vlastně

ok odhánějí nemobilní mobilní telefony tak

nevím

ale tédleté mi říkám

fajn dobře i teďka řekneme že někdo má _e základní frekvenci padesát hertzů

jo

je to

úplně pravda nebo není můžeme říct že někdo mluvit prostě na padesáti herci

co tam není prázdný

ono se to může měnit

dobře tak že vlastně ní teďka _e

budeme chtít odhadovat nejenom nějakou konkrétní hodnotu F nula ale celý třeba ten průběh že

jo

jo takže my budeme chtít odhadovat třeba to F nula

ná nějakých krátkých Ú settings řeči třeba na těch pro každý rámec budeme odhadovat

zvlášť

jo

_e tu rozmezí mozek může být _e dva ku jedné jeho takže někdo když někdo

move i třeba těch padesát tak může mluvit místo

jo

zajdeš čovek zpívá tak prostě ta modulace tam

že toto no

rozmezí je docela ustavení soket

po tu _m o _e samo ze samozřejmě záleží na náladě když nějaká žena je

či tak to

dobře tím hybnou

_e

dále

takže teďka pomalu

kde marná to už dvě metody víte

a mít teďka budeme se chtít podívat

_e

na nějak _e definují se tady máte co tady nemáte v podstatě ní

akorát toto už asi víte že ta základní frekvence tomu říkat klíč jo

jo slyšeli jste to nebo ne

a eště se o tom nebát nemáli takže to je to je potřeba změnit takle

se to píše anglicky

ano a ono vlastně tady todleto oslovoval se používá jako že to tady todleto konkretistovo

o normální význam taky znamená namířen třeba smůla jo jako s tou a dřeva

jo potom eště je vlastně todleto a slovo se používá na tu mění nějaký chtěl

facebooku

jo

ale zřejmě se nám to toho strašně líbí

fajn _e nite jaksi poučit _e základní perioda

to je dobře a potom eště jo eště jedna důležitá věc

že musíme zavést eště další termín koši je nula

jo a tu je perioda toho základního tónu ve vzorci

jo

takže vezmeme _e T nula vynásobíme tou a vzorkovací frekvence a máme to

takže ty diecese musíte zapamatovat

teďka se mu sem a eště říct D bysme mohli využít _e

znalosti o tom základním tou jo proč ni třeba chceme mezi

je tu Ú D nějakého člověka třeba jo

a _e D počitá ten průběh

základního tou

dva tak na pádlo třeba když a ví někdo konkrétně řeknete nějakou dvě to a

váš kolega řekne tu větu

on ju řekne

trošičku jinak jo prostě ta melodie vždycky _e

tomu člověku nějak

jak se to řekne

že každý prostě mluvit trochu jinak

takže už vlastně třeba u rozpoznávání mluvčího

my dokážeme tudletu informaci využít nejenom konkrétní hodnotu

jo ale průběh jak se to měnit částce

jo potom na konkrétně z nějakých třeba hláska

obzvlášť

jo tam se to hodně a mění

jako ne hodně ale trochu ale zase s toho něco rozpozná se toho rozpoznat k

tomu vy podle toho jak se mění trajektorie hlasitě hodnot jo

další věc se to může používat u syntézy řeči

jo

když vlastně

bude mání té _e

třeba

parametry toho L pece

jo toho filtru

tak potom do toho nebudeme na syntézu řeči nebudeme chtít do toho

pouštět jenom nějaké konstantní _e

nějakou konstantní sekvence impulsů ale budeme chtít tam prostě přidat i nějaké té změněny

jo můžeme je tam třeba uměle nějak

žida třeba to prostě zašpinit _e nebo nejlépe

třeba _e budeme chtít tam třeba když

sem se zujeme nějakou otázku tak samozřejmě tam ten průběhy vždycky trošku jinak jo než

ukažte řeči to je jinak

no a tam budeme chtít vpodstatě ráčí a _e

radši dat

na vstup

nějaký konkrétní ze života průběhu dnů někoho to odhadneme potom co budeme

třeba i využívá se to prostě u té syntézy

no a pokud o vání taky

jo

je vlastně a my můžeme ten tady průběh potom zakódovat nějak

a

nějak efektivně jo že nebudeme chtít před jako u budování rozdělíme vlastně a

ten signál který generuje hlasivky a to co se u nás vytváří spouse to rozdělíme

na dvě složky a potom zvlášť to zakódujeme a nějak budeme to

_e buď ukládat a nebo nějak někam posílat ano

fajn

ta

se tady máme

tady zase máme nějaké problémy

který můžou nastat

to sme si už si myslím že tak nějak průběhu

i řekli

tady není co

co říct dál tak fajn _e teďka

já jsem vás chci zeptat

a jaké třeba další metody by vás muži napadnout

jo mít když máme teďka nějaký konkrétní signál

máme řečový signál třeba já nevím zase prostě se nakreslíme nějaký signál E

a chceme

určit

a základní periodu jak by sme to dělali prosím a

jo teďka nebudeme po k těch použít

ani kepstrum ani vlastně to L P se teďka máme jenom ten signál a nějak

úplně jednoduše co by vás napadlo

tak to vtom přesadíme jo když je teďka dostanete nějaký signál odfoukla tomu způsobem někdy

kde prostě jak to vypočítáme tak zřejmě když se podíváte že tady máme nějaký ty

kopečky

jo

a kdy počítáme tu vzdálenost

teďka musíme ty kopečky nějak najít

vidíme že vlastně ten letenku signály

tady

jo a ta je tam _e tam u signálu oni sou se nějak podobny že

jo

no a to tak ty autokorelační koeficienty

my teďka vezmeme ten signál začne na postupně

postupně začneme počitáš si autokorelační koeficienty jo

nula aleš třeba

kolika štychy

já jsem vám teďka

možná ani neřekla jednu věc které je docela

docela užitečná ale _e i

proč vlastně my sme se bavili o tom

jakém jakem jako že intervalu sou ty hodnoty a pro základní

pro základní frekvenci jsme si říkali to je padesát dejme tomu až čtyři staře

a profese nadefinovali eště nějak ta nula

jo co je základní perioda ve vzorci

jo a to byla vlastně

bylo něco jako že ten nula to je

základní perioda

že se nula krát

F S

jo

a nebo můžeme říct že to je

F S děleno

S nula třeba

jo

a když nemáme teďka vzorkovací frekvence třeba a osum tisíc

tak můžeme vypočítat vlastně ten vlak

pro o _e nízké frekvence ale pro ty vysoké frekvence že takže teďka uděláme prostě

osum tisíc děleno

padesáti _e

osum tisíc děleno kolik to bylo čtyři s takže

ať vidíme že tady to je kolik sto šedesát

jo

a tady máme kolik tady máme

dvacet

jo

jo tak

takže

tak fajn tak že vlastně vjíždíme

že ten látky a pokud to může být vlastně dvacet až sto šedesát

vzor

jo

přičemž pro nízké frekvence je ten lak vyšší samozřejmě logický

a takže my teďka vlastně vezmu na

to je náš signál budeme používat autokorelační metodu

jo vypočítáme třeba prvních dvě stě

a první dvě stě _e koeficientu

a potom tady tomletom intervalů

dvacet a čtu sto šedesát styku osy C N

my budeme hledat

co

chtěl autokorelační kosice

jak by vlastně teďka ani když vezmu na tady tenhleten

řečový úsek a chceme

si namalovat průběh chtěl autokorelačních

kusy tento chceme teďka to namalovat jak by to vypadalo

tak ten první autokorelační konstant bude vždycky jaký

to

_e _m jednáte když máme všechno normalizované

ale bude maximální jo

prostě budem a tady mít nějaký maximum

jo

a potom zase budeme mít nějaké lokální maximum jo

až vlastně _e ten posunutý signál se posune třeba uplně vzorečku

jo

doprava tam nebo doleva to jenom _e zase nějaké max _e tady podám prostě mít

nějaký globus

no skoro se mi to povedlo

ale nic teďka co budeme a co nás zajímá mě vezmeme

těch dvacet až třeba těsto šedesát

jo

a vkusem a najít

když je to asi je

a vlastně kde si najdeme tento maximální

_e teda to lokální maximum

tak tam budete nula

jo

a už víme

tady todleto všechno víme takže hezky se můžeme vypočítat F

nula

jo

_e fajn

bude to prosím vás vždycky fungovat

jako že ta je tadleta metoda

když budeme mít třeba nějakým nezměněny

to nějak o to esko jo to je prostě šum

tak by to nemuselo fungovat protože vlastně

jako teď se mi tam vždycky najdeme nějaké lokální maximum sta je tomletom intervalu

jo jenže do lokální maximum bude zase někde prostě tady vole

jo takže ještě musel má kontrolovat podstatě na nějakou tu znělost jo jestli prostě má

cenu

vtom hledat nějaký základní

_e

jak se základní to jo

potom teďka půjdeme dál po těch _e jde vlastně tady todleto co vám říkám tam

je všechno těch najede hospodáři bych chtěl aby

zatím trošičku

i záni slevy

teďka dívejte se problém té autokorelační metody spočívá v tom že mi teďka vezmeme ten

jeden rámeček

jo jak to vidíte tady

začneme ho posouvá třeba

do práva

a to co je mimo ten rámec tak vlastně to sou nuly

jo

takže

todleto se věnuje

a todleto sledy nule taky

jo protože máme tam

nohy

a počet hodnot _e ze kterých ní počítáme ty autokorelační koeficient on se zmenšuje vždycky

jo s tím posunutím

takže místečkách když se podívám entá no

ono to bude vypadat nějak takhle

jo to sou ty naše autokorelační koeficienty

tady máme

to maximum nějaké jo potom zase máme

lokální maxima

jo

a takže my bysme teoreticky mohli udělat

to takže když se podíváme sem zpátky

tak a tady vezmeme

prostě tady

vezmeme kus signálu z předchozího rámce prostě se vo zapamatujem

jo

že tam budou zase nějaké ty

_e nenulové hodnoty a tomu se bude říkat cross korela

jo

je v podstatě jako kdyby máme stejný signál a prostě on je už trochu jinýho

protože leze podíl

fajn takže tam už budeme mít zase _e

větší počet

vzorků

to je fajn

svých teďka můžeme

to odhadnout jak svým

jaksi hezkým

ale tam může být zase nějaký další problém

jak je tam může být problémy se podíváme teďka hnedka

S já musím udělat je proč to nepamatuju moc _e jak sou ty slajdy za

sebou

_hm

vždycky podívat na tesla poznámky

jo ani tečkami já sem zase něco přeskočila ale to je jako že hodin se

když se podíváme sem tady máme vlastně _e

až do té zelené čáry odleva máme zleva máme

nahoře ten nějakým dané rámec a dole vidíme že vlastně

používáme teda ne dole a ale

tady

tady dole a tady na hořela že používáme hodnotu stě

buď předchozího anebo toho dalšího rám sem

ano teďka bude zajímat energie

jo předtím snad používali signál a úplně stejný signál když sme pro ty po výpočet

kofi ten požáry míň a

vzorku jo ale energie stě tvou

jako kdyby na zem posunuty signálem kila stejná teďka my budeme používat hodnoty který jsou

mýmu

takže může nastat situace nepříjemná a tu je todleto

jo

tady máme náš ráme tady to vypadá úplně stejně v pohodě

jenže

tohleto na mílétos toho předchozího a má to větší energii

jo právě proto my teďka bude muset dělat nějakou tu normalizace samozřejmě

jo

protože jí na

kdy sme vypočíst by mohla nastat situace taková že temnoty a cross korelační kulky center

nemusí být maximální

těch šest vypočítán

jo a mýtu budeme mít i na obrázku určitě jo

_e tři budeme normalizovat

ten výpočetní teďka dívejte se mi teďka sme vypočítá je cross korelační kusy centry

jak se to taky se

k osum

jo

a budeme chtít je nějak normalizovat

N R

jo takže bude znova energii

prvního signálu třeba to u _e to horního jo řekl jste signál jedna tohle je

signál je

zná prostě energii jedna

energie dvě a

a můžeme to takhle nechat nebo ne

_e test a tady máme v podstatě schováno v jednu energii jo protože děláme

signál krát signál a sečteme všechno dohromady všechny ty vzorky jo

že máme tam slovanu jedno

a tady máme ty dvě energie jako kdyby

tenhleten signál vpodstatě každý vzorek na druhou suma jo

a psaní ta takže udělám ještě to od v něm

jo

a že to rozumíte to je fajn teďka se podíváme na ty konkrétní _e příkládky

co je tohle je to je to řekla

_e

todleto je dobrý příklad tak to máme napsán

jo

máme cross korelační kusy centry a máme vlastně teda to je funkce pardon

_e normalizováno funkce máme

jo vidíme že vlastně

_e v nule

tom a maximální hodnotu vpohodě

jo všechno vypadá

hezky tam normalizace tam v podstatě ani nemusela být protože

energie vlastně toho posunutého signálu aneb posuňte oni jsou víceméně stejné

dobře

a nemáme další příklad

nahoře zase máme nenormalizovanou funkci a my vidíme že tady máme jedničku

jo

ale tady tydlety hodnoty obnaž třeba tady to je nesmysl

jo protože

ten postup osum design _e toto měl když _e energii a má se tady todleto

stálo a nám se to nelíbí takže my když teďka budeme chtít odhadnout

nějaký ten nula

my řekneme že tohle to je ono tři ta

když bysme měli tři sta tak _e když bysme třeba neuvažovali

ten interval na kterým to můžeme hledat

tak by to bylo úplně nesmyslné jo když budeme uvažovat to že to byla velmi

nízký

takže jsme uvažovali ten nějaký interval tak bysme našli třeba po tohleto _e nebo tomhle

jo čili nic

_m

nespíš tady todle

no a uděláme normalizace a všechno zase vypadat pohodě

můžeme najít

_e

nějaké to maximum

teďka

my se budeme chtít _e se podívat někam zpátky

jo třeba na tady tenhleten příklad

my teď každý tím M

nějaké lokální maximum a můžeme říct že prostě todleto

tady bude nějak někde se nacházet tola jo

a mě zajímá co je to co je tohle

to sou ty data kopečky

vy vlastně když máte nějaký ten signálek že jo

a potom máte tady ty rezonance že

jo todleto odpovídá vlastně impulzu

a tady to sou ty postranně zákmity to sou ty rezonance no a teďka kočky

jsou vlastně

odtud

honíte kopečky nám sou k ničemu

že

takže ním můžeme použit takovou věc že já budu má aplikovat a tak zvané klipování

nějak

i vezmeme ten máš signálek

jo to jsem namalována

a nadefinujeme si nějakou klipovací úroveň tak zvanou jo prostě klanu zápornou

všechno co je vlastně mezi

jedinou jeme jo aby nám to prostě já

tak na to bysme to potřeba když se na potřebám tak to prostě nepotřebujem

jo a potom vlastně necháme jenom ty kopečky

a nebo místo těch kopečků buď tam necháme ty hodnoty který tam skutečně sou

a jinde nuly anebo tam prostě dáme

město ještě pobočku třeba jedničku až mínus jedničku

jo

_e deme na to tady máte na definovánu to funkce to je jednoduché to popište

a tady sou ty výsledky tady sme vím vlastně u druhého obrázku sme jenom výřezy

co sme potřebovali

a u toho spodního tak tam sme vlastně nadefinování tu jedničku a nebo

mínus jedničku jo a teďka můžeme počítat Ú korelační funkce

jo

jo nebo ne

mám počítat až dávky u i in teďka já se látce zeptat

řekla jsem a _e že jsme na bych normálně nějaké ty klipovací úrovně

jo

já jsme nadefinovali jak je můžeme nadefinovat vůbec to by na tak asi napadlo

tak na provedy a to nebylo úplně nejlepší

to nadefinovat natvrdo pro všechny rám že jo

jo protože když máme změny tak tam ta úroveň zřejmě mohla bity výši

když je nějakým rámec nezměněný nějaký to esko jo kde máme prostě šum

tak prostě není moc dobrý tam hat

to vysoká protože bysme dostali jenom samé nuly

to je zase nemuse vaně protože uherska počítat vlastně základní

tom taky nemám

ale i tak my máme

nadefinovány je vlastně

_e

tady máte popsán _e nějaké metod jak bysme to mohli udělat tak za prvé můžeme

tu klipovací úroveň počítat pro každý rámec zvlášť potom vtom rámce můžeme taky

_e těch tipovacích

úrovni nadefinovat několik jo tady máte přímo příklad

že se na definuje tři

no ale zase jak sem řekla že vlastně když _e

sebou toho eska nemám oceánu počítat nějaké ten základní tón ale

tak jiný když budeme dělat o adaptivně klipování

tak potom klidně můžeme na ty bola ty hodnoty šumů jo tam prostě dáme nízkou

úroveň

a něco mám toho dívá se přece jenom

jo

takže prostě muset _e vždy jako že my se tady furt baněma o nějakých metoda

který nakonec prostě nikde nefunguje stoprocentně

jo ale některé fungují prostě v některých případech některý fungují stíny křivce a nejlépe je

vždycky prostě ty metody použít všechny

a udělat potom nějakou i _e prostě nějaký průměrování a nebo nějak ví brát výsledek

potom

na základě eště nějaký na všech algoritmů

kterými s tady jenom balíme o potenciále vlastně

fajn

a todleto

o tomhletom sme se taky barvy na začátku úplně jo když jsem se vás ptal

a

že vlastně vezmeme nějaký filtr který definuje áčko na vstup tam a ani vezena vlastně

ta chyba není ani predikce _e cože

vlastně

_e tenhleten druhý obrázek jestli se nemýlím

nebo to je ten třetí

jo

takže vlastně tady mám i napsané co to je

ta chyba lineární predikce to je ten _e

to je ten spodní obrázek čekání vidíme že

vlastně tý a

ty špičky tamto viditelné hezky ktery

jo spočítáme vzdálenost a máme to

a ten a ten prostřední to je ten

který povány signál

N to není klipované se na to sou ty autokorelační funkce uši počítáme že jo

jo takže já vám ta duškovi nám

nepravdu

takže to sou ten naše autokorelační funkce

ani vidíte že

víceméně všechny fungují

jo akorát třeba

a

tady tydlety tvé metod k i

funguje zřejmě lépe protože my nemáme tam typ odstranila vločky tak zvýrazněné jako třeba tady

jo

dobře

to by bylo ono

teďka mise budova podívat na jednu takovou

trošičku matoucím je

a tu je dlouhodobý prediktor chyby predikce pro určení základního tou

jo

toto znamená někdy sme _e dělají to L pecce

tak když sme měli nějaký ten signálek

jo

a chtěli jsme vypočítat třeba ta je todleto vod notku tady

tak my sme použili vlastně a

deset předchozích

jo takhle to fungovalo na

teďka me vlastně a

vezmeme ten filtr do toho filtru dáme kus řeči ani leze nám nějaká chyba

což bude další krok jako kdyby

jo dáme sám

teda ne to L pece ale bylo tam ten a filtr inverzního tam bylo to

áčko

jo

tady sme daně a Z a díle zónám potom

něco

takovýho

jo to je ta jako kdyby šíp _e

a tak si vlastně sme řekli by měla odpovídá tomu co vytváříte naše hlasivky

ani teďka ste žili budeme chtít vlastně vypočítat

to základní nějakou

a periodou jo buď můžeme prostě najít i lokální maxima ani počítat

vzdálenost je no

a nebo i teďka použijeme ten dlouhodobý prediktor což znamená

že _e hodnotu tady

jo i budeme chtít spočítat tady tyhle tě jednoho a nebo

dvou do

a tento máme napsané

a s toho všeho zná se nám potom vyleze

chyba šípy

jako kdyby

jo

a tak si bažiny už bude vypadat jenom fakt jako šum

jo

tady nic dáme ten dlouhodobý

dlouhodobý prediktor

jo

a teďka vlastně ten dlouhodobý prediktor se zapíše jenom takhle

jako lineární kombinace

dvou vzorečku vzdálených

o nějaké to M

jo

to S M sestřičkou vlastně bude

o hodnota

tady

jo

a todleto a ty dvě tečka budou zase hodnoty někde tady

a ty bečka no tibet a vlastně sou nějaký váhová si

k o fitcenter

a proč bysme to mohli to měli dělá tak mi teďka bude má muset abysme

minimalizovali tady tudletu síbíčko

jo teda tady tudletu síbíčko kůže rozdíl

a skutečné chybí a vlastně jako kdyby odhadnuté chyby

jo

tak musíme najít vlastně tu beta jedna a B tady a enko

jo a to enko nám říká

jak moc se musel na zdály

jo my nevíme že musela použít tady tydlety konkrétní dva vzorky je musíme najít

a tím pádem i když najdeme ty parametry optimálně tak najdeme to M kola jo

a to N po je vlastně todle baltazar vzdálenost

jo

je to pole trochu nesmyslném proměnná když

v podstatě musíme jako pro každé možné N T todleto vypočítat

no nevím jestli to moc efektivní

_hm dobře

_m teďka cepstrální analýza už sme u sme něco řekněme sme řekli že může mezi

ty

_e když kepstrální koeficienty

kdy byla se zpátky

jak je se signál

jo a potom tam zase asi v _e nějaký hodnota abysme to

nějak

_e počítány a nebo

eště když ní vlastně se teďka podíváme

a ty kepstrální koeficientíky tady jo tady tadleta tomu butiku totálně konstanta je nějaká energie

taky vždycky maximálně a znovu vystřihli

abysme měli dobré rozlišení pro ostatní ku osy centry

tydlety odpovídají vlastně tomu co sme řekli touž víme že se mikeš

no a tady už vlastně ty koeficienty ti odpovídají

_e

tom základnímu tónu ale mít když se na ně podíváme takle pískat tak mi vidíme

že zase tady

jsou nějaké zvláštní takového úseky

jo

a maximum tady bude odpovídat vlastně tomu lázně

jo takže tohle to není vygenerované zpátky signál todleto sou jenom koeficienty kepstra

jo takže to můžeme udělat vlastně dvěma způsoby

co tam ještě máme

v offline teďka dívejte se teďka sme

udělali co pro každý rámec nějakou tou metodou a nelepil paralelně úplně všem a

není počítání a hodnoty základního to takže dostaneme teďka pro nějakou konkrétně nahrávku

průběh jo dostaneme sekvence hodnot

jo hodnot jestli vypočítali jakž takž nějak to fungovalo

a teďka máme tydlety hodnoty máme padesát sto padesát co si myslíte

můžeme

_e

intervalu dvaceti minisukni což i ta naše ráme

jo dvakrát

prostě vyšší tu frekvenci to nemůžeme dat _e takže jí vidíme zřejmě že tady chyba

to s tím můžeme teďka udělat my teďka nějak to chybu chci jak ta Y

vyhladit semi odstraň

mohli bysme použit třeba interpolace ale co by to udělal

kdy sme třeba měli a něco jako

uděláš bysme interpolaci třeba nějakou tak sme dostali toho

nefunguje špatně ta

a průměrování to je to samé přestaň pole

můžete určitě znát ještě nějaký filtr

jo

jo popožene ten medián víte jak to funguje všichni

řadíme ty hodnoty ale znamená se to prostředního daně říkám _m

tak fajn může na použité mediánový filtr

a nebo

_e

tam můžeme použity eště jednou

metodu

a ta metoda

bude

_e M dva k tomu navedl a teďka bude má štice zase na něčem za

ni sacího to bude poslední něco které se bude a barvy tak pro snad počkejte

pět minut eště

jo a potom to dobře se bavte nebo

_e

mít teďka dívejte se prokáže ráne rámec ve natvrdo vypočítali nějakou hodnotu je to tak

ať vidíme že prostě sme třeba dostali nějakou autokorelační

funkce která třeba

na zem a teďka ta stovka

jo která třeba vypadala já nevím jak už to vypadá

rostli tady to měl nějaké max no tady to měla maximum a tady to měl

jo dejme tomu

jo takhle sme dostali tu

stovku

já myslím se podívali že tady

tady to je určitě ono

jo jenže tohleto je také nějaké lokální maximum

ani když víme že děláme takové chybí tak možné je dobře kubát se informace nejenom

o tom nejlepším _e cons dát tu

takhle

řekne

pro kandidátovi tak za

_e

takže prostě sem necháme informace je vlastně a

pro jejich možnosti

jo ne uložím asi jenom tu nejlepší

ale i ty které taky

možná

budou odpovídat vlastně to naše prán

potom mise udělám a jakousi maticemi ti a hodnot

jo

teďka prostě uděláme se takovou

jako kdyby maticemi

kde vlastně tady třeba

ta matice bude

vnést nám jakési jako kdyby

no nebude to přímo matice ale mělo by to být nějaké pole

nejspíš

no a matice poletuje poslány

jo ale tady máme vlastně ty naše lagy

tady mám _e ty naše a rámce ty frame i jo tak nepíšeme

třeba stejný

bože

core

a hodnoty té matice nám budou vlastně

říká jak moc pravděpodobné to je jak moc tam ověříme

jo

takže třeba my máme ty padesátky kolik tady mám

tak prostě na ty padesátky uděláme že tomu věřila sádře hodně

jo

potom třeba máme tu stovku tomu tati věžemi strašně moc

a potom z _e se

jo děsem atomu hodně

potom třeba když sme si nechali víc N po informace o průběhu třeba T autokorelační

funkce víme že tady bylo taky nějaké lokální maximum

ale prostě

nevěřili jsme tomu až tak moc jo

potom tady

zřejmě to bylo

no a tady třeba úplně něco málo sme měli

jo

teďka budeme hledat tak zvanou optimální cestu

jo ta optimální cesta ni se teďka budeme dívat ona bude prostí para třeba name

jako kdyby podle těch pravděpodobnost nějak takhle

jo potom další průběhu bude

někde takle

no a řekneme _m to je špatný příklad a řekneme že tady k nic nemáme

jo a řekneme že prostě třetí bude průběh třeba

zase takhle

jo

tak teďka co jsem se snažila namalovat nebo zobrazit toho že

přes tu stovku i když máme velmi velkou pravděpodobnost že tam má být akože to

ta stovka jo ta pravděpodobnost

dceru nám dala nějak a ta autokorelační metoda

jo ne ta tečna pravděpodobnost jako by

tam vlastně nám ta cesta prošla jedno jak vidíme

jo a přes tu padesátku kterou sme si až tak dobře neodhadli

tak ta cesta třeba prošla dvakrát

jo to je není to není úplně ten kuželem

_e ten

u ty příklady ve skutečně se to o něco komplikovanější ale pochopili jste to jo

takže my teďka řekneme že vlastně tam sme prolezli dvakrát tak to bude ono

jo to bude vlastními řekneme že ta cesta je tadle

jo a když se cestovky tam

dáme tu padesát

find

to je to máte popsány tady

jo ve skutečnosti to bude třeba vypadat nějak takhle

jo tady máme prostě víc těch rámečku

a máme zase uložené pro každý rámec si nejpravděpodobnější hodnoty nějaké

jo a tady potom

vlastně vybereme _e ty hodnoty kde se to nějak překrývá anebo udělám nějakou interpolaci tam

a my něco takovýho jo

jo vlastně jsem kecala teďka máme ještě jednu věc o které se musíme popálit a

to je desetinné vzorkování

jo rovná se může nastat taková situace že mi když máme

tak se budu malovat ten signál

bože malovat vůbec

takový signál jo teďka mistrova navzorkujeme

ve známém

tudle hodnotu tady tento nebudu malovat jo ale prostě pro znázornění

potom _e třeba to tady

seznam a tady

tady musím namalovat zase

no a u nás víte že vezmeme prostě tydlety hodnoty jo protože máme tu vzorkovací

frekvence

nějakou _e nízkou

jo

takže tady my vidíme že detekujeme v podstatě ten dávala

protože a když třeba vypočítáme ty autokorelační pozice termín vidíme

je tydlety hodnot k i oni nějak tak budou

prostě a budu nálad lepší hodnoty nešpor _e tendleten konkrétní po osum

jo

no ale ní máme tady tyhlety hodnoty co my teďka budeme chtít udělat ní budeme

teďka chtít dělá to desetinné vzorkování což my neděláme fyzicky jo i nemůžeme zvýšit vzorkovací

frekvence ale jenom teoreticky

takže my teďka řekneme že my budeme chtít

vlastně _e si čáry jo teďka náš signál vlastně se mi mám uloženy tomu se

na pracovat postupy modre modré čáry

jo

ani teďka budeme s tím že

prostě ty čáry chceme nějakým způsobem doplnit

takže my rozdělím a tam interval chtěl _e deset

jo

tady všude vše všechno

a uděláme třeba nějakou co interpolace

jo tak on uvidí že

tady to leze náhodou tady tohle za do _e tato dá se nějaký kopec a

ono tam skutečně prostě ty hodnoty ne úplně přesně ale nějak dopočítat

jo po záleží na to co budeme vlastně používat no a potom může má na

to aplikovat autokorelační

funkci

jo

a nebo to udělám úplně naopak vezmeme jenom ty modré hodnoty

počítáme autokorelační funkce a uděláme desetinné

blokování se tomu říká jo tak autokorelační funkce a snad tam potom ty kopečky nám

toto polní

jo podle těch

vlastně sousedních jako kdyby

průběhu nějaké sousední ano

tak nějaké otázky

tyhle já se nebo ni

není jasné

tak já děkuju vám za pozornost

mějte se hezky