každý dneska sme získal místo santa černockého
vy ste se minule bavili o L P se pokud _e tak aby sigstop až
do s _e dvacet dva
takže už teďkaji se že jako si centry _e toho si u true
na modelování řeči se dají spočítat
_e kdy řešením P rovnic o P neznámých jo vy ste počítání nějaké autokorelační koeficienty
tam se si vytvořili jako soustavu rovnic a to se na normální vypočítat
_e druhá možnost jak to vypočítat
je použit tady tenhleten algoritmus a nevím standardy
a vlastně mýho můžeme použít protože ta matice
potom _e
nebo když
ta matice jako osy centů
ve hodnot ukážu lepší
že vlastně
když máme tady todleto soustavu a vypíšeme se jenom do matice tady tydlety autokorelační koeficienty
tak potom vlastně když si můžete všimnout
že v diagonálách nemáme úplně stejné hodnoty jo tady máme errno u všude potom máme
jednička tady takže jednička a tak dál
tady tadleta matice se bude nazývat dopitová a vlastnění teďka možná použít
tady tenhleten iterativní algoritmus jo
vlastněný postupně bude mám a vytvářet prediktory různé řádu od začátku to bude prediktorů to
řádu
a potom máš prediktor toho perského řádu a musíme to projíte krát
_e asi bysme mohli fused vypočítat nějak oněch iteraci sáry abyste si
vlastně
vyzkoušeli jak se to může
dělat
vlastně tady _e tento ten první řádek to je nějaká iniciály z _e C jo
mise řekneme že vlastně
_e
si postavíme prediktor nultého řádu
a she bát _e predikce bude
vlastně to všechno co máte napsané v tom prvním řádku co to znamená
když se podíváte na
na tu inicializaci tak můžete si všimnout že tady máme ten nultý autokorelační ku sice
jo
takže prosím vás zkuste se zamyslet nad tím co
nebo už tady tenhleten tlačte neni žen nedělali
dobře takže zkuste se teďka za ni sled na tím a
co to je za ten prediktor nultého řádu
a co je ta chyba
vlastně
my když se postavíme filtr
kterým a
nula pozice _m to
tak co ten filtr bude dělat
nějaké nápady máte
_m to bysme potřebovali aspoň jeden po třicet
to bude dělat při se změní jo to bude taková ta
ale černá díra jo
která vlastně bude všechno pouhou celá ta a poleno nám stole jenom v podstatě nuly
jo takže právě proto
chyba predikce když máme ten prediktorů toho řádu
budeme mít a Ú ty autokorelační koeficient co je tam mute autokorelační kosice pro
jo R nula teďka nás zajímá
jo může mít teďka víme že vlastně chyba bude maximálně že jo
protože tam ten filtr vlastně na genové vůbec nic
no a maximální chyba to je vlastně ten náš nultý autokorelační koeficient protože my vezmeme
signál
vynásobíme ho sama se sebou jo a dostaneme tomu té autokorelační
kusy C N
tam dobře teďka zkusím a tu první iteraci jo teďka vypočítáme
a K
K jedna čemu se to bude rovnat jo postupně se to zkusíme udělá tak vlastně
já to zkusím nějak psát tady když je to moc neumím
zatkla jedna vlastně
zkusme to udělat pouhého podívete vám ten vzoreček a tak co tam budeme psát
tak jasně že tato mínus jo potom máme
vlastně R jedna že
_e ta suma prosím vás bude napočítat todleto sumu
my se podívám na té hranice tak _e se ne tak té todleto eště viděli
mátou vlastně
chybou
jo E nula
jo
teďka můžeme vypočítat a jedna což bude vlastně to K jedna
jo _e potom vypočítáme vlastně tady zase
pro tenhleten interval musíme vypočítat _e ji Í
takže zase vypočítáme nějaké to
a jedna jo
takže tady ni napíšeme že vlastně a jedna
dvanáctka jedna
a zase Á jedna
jedna den
a co tady bude to bude já to mám napsané
neudělal špatně
_e budeme počítat teďka tady todleto prosím vás a teďka se dívám že to počkat
nebudeme jo protože když se podívá na té hranice
tak vlastně to a tady tenhleten výrazy je u nás nula no takže nemůže napočítat
objednáš
asi už musím udělat
no a vypočítáme teďka šípů u té naše predikce ste první iteraci což bude
vlastně _e
co to bude
to K jedna my vlastně máme
na i mě C zvané nějak ta záznam vlastně toto paní mayer a jo takže
vidíte v té první iterace
děláme a úplně jednoduché výpočet oblast napsat nechci protože tom name psát na tady todleto
tady nějak nepohodlně se to spíše
no a v druhé iteraci vlastně už použijeme hodnoty který jsme se předpočítány jo
vy chcete todleto už _e se mění v laboratořích jestli se nemýlím že jo ústa
se to všechno
_e že asi možná ani nemá moc
_e cenu tím nějak moc dlouho procházet
_e
že na dalším slajdu tady vlastně my máme
všechny _e
všechny hodnoty uši jako kdyby spočítá nette naše kofi centry a taky _e ty nic
mezivýsledky
to todleto budou
no teďka a ty hodnoty našeho filtru
a todleto sou nějaké ty mezivýsledky my si potom a podíváme na co sou ty
mezivýsledky dobrý protože
oni vlastně nejsou jenom tak mezivýsledky letech se potom něčem už
vy ste se už a se říká několik to _e velké P je jo nějak
nějakou tou hodnotou ste obsluž nadefinování
_e byste se o tom bavili na začátku úplně
jak ste stavěli tam _e ten filtr takový se vlastně ten filtr postavili ze třech
části že jo
jste modularity hlasivky potom vy ste modelovali artikulační trakt a
_e nějaké to vyzařování jo
a to P se něčemu rovnalo
my sme se tohoto no to nějak nadefinovány _e jak sme si tam tu hodnotu
nadefinovány
ten artikulační trakt jak sme modelování vlastně my sme
zdraví ste
vy ste vlastně si říkali že _e
že to bude sekvence nějakých filtru
že jo ten artikulační trakt co se tam co se tam děje prosím a my
hlasivkami a vytvoříme nějaký signál
a potom u nás tam spouse podle toho jak si
co _e nastavíme vytváří se nějaké rezonance že jo
a ta krátká ne filtru potom vlastně nám modelovat rezonance že jo kolik bylo těch
filtrů
ty rezonance _e jak se tím rezonance _m eště říká
formám toto si pamatujete jo takže vlastně
my musíme
modelová ty formanty jo
a říkali ste si asi že ne užitečných je asi prvních pět
že
a ten filtr _e každý ten filtr který modeloval nějak info forman byl druhého řádu
jo
je to tak
fajn takže a
my teďka máme počet těl formantů
což je k a jo
dvakrát a potom tam eště _e
jo hlasivek nějak vylezla eště jedna jednička jenom
takže to bylo tu C jedna
jo takže vlastně když K ji pět tak nám vyjde a jedenáct
ale my používáme v podstatě deset
jo
je čtyři až pět formantů nadprůměrně
čtyř řádku
dobře
proč těch a pět formantů jenom používáme nebo proč takovýto číslo budeme užívat
to je v podstatě dáno experimentální jo jako že někdo zkusil
udělat filtry když i v řádu ale potom když se podíváte třeba na tady tenhleten
král
tak si vidíte že ta chyba
ona se nějak ne a _e nezlepšuje dramaticky ste
potom jsou vlastně topped překročí těch deset
jo takže v podstatě může má udělat filtr
když jeho řádu ale nemá to cenu protože to bude a komplexnější ale žádná v
podstatě výhoda toho
neplníme
teďka jestli vás napadají třeba _e nějakém
užitečná je využití
tohoto filtru jo my víme že můžeme
modelovat něco může mapu psát vlastně co my říkáme jo ne já říkáme ale to
říkám
jo takže
jak si můžeme
parametry toho filtru a nebo uspěješ tým mezi
mezivýsledky
of počtu
tuhlenc standardy na použit pro rozpoznávání řeči jo
další věci je toho že v ní může má tečka
parametrů tohoto filtru
jak si teda na s parametrů ale _m
za pomoci
o můžeme vypočítat spektrum signálu
jestliže si třeba víte jak bysme to mohli udělat
tak mi teďka máme postaveny nějaký ten C o to že jo a můžeme a
vypočítá teďka frekvenční charakteristiku toho filtru že jo
jo a ta frekvenční charakteristika bude potom tomáše spektrum
jo
todleto co tady máte
to byl ten náš filtr jo
to géčko tohle je toho co vlastně
to je nějaký ten gain že to je zesílení podstatě jako že
že to je víc nahlas
dáme to normálně a na druhou a bude to
jo
teďka když jste viděli vlastně a příklady těch spekter mnohokrát a to vypadalo tak nějak
jak to vypadalo
to vypadalo tak nějak prostě
dejme tomu že to vypadalo
asi nějak tak že
a to je spektrum které sme normálně výpočet _e je pomocí fourierovy transformace že jo
a co vtom spektru řídíme
my máme tam nějakou tu obálku co když
to je to co jsme nakreslili vlastně _e netrefila
tak
tu a
sebou tou čárou nesouvislou
a potom eště máme
nějaký rychlejší průběh to
a to jsou to ty komponenty
stejně to říct
čím je to dané
čím sou tam ne tady tydlety čárky tady ty čáry
vlastně jednotlivé čáry
todleto mě zajímá
co to je
víte to
no to sou vlastně harmonické základního tom že jo
vy ste se už byl bavili vlastně o cepstru ne
tak tam ste
přesně a se snažili oddělit
ty násobky základního tónu
jo
vlastně snažili ste se je třeba vyfiltrovat pro rozpoznávání řeči o snažili se ste vlastně
s té spojité čáry dostát jenom two _e tu nespojitost máme k
jo
takže ty násobky _e základního tunu oni odpovídají čemu
mně odpovídá je tomu
jak my můžeme jo to je naše nálada třeba dva nebo kdo o tom vy
a tak dále jo
a ta obálka tu je
co to je
to je psema přímá co mi říká
jo je to jasné
takže mít když teďka se budeme snažit
kdy kras nic spektrum pomoci
toho filtru
no máme teďka o pece
uděláme frekvenční charakteristiku vykreslíme to takto to co dostaneme
tak zkuste se na tím za ni se co mi modelujeme tím filtrem
i modelujeme to co my říkáme jo ne jak mi to říkám a ale co
my říkáme takže v podstatě měnám nakonec měla díle s tady tadleta
v podstatě té tadleta pomalu měnit se
čára
jo
je to ta
asi jo
i
dobře
rozumíte tomu jo víte to
no
a proč to nevíte
že byste to měli
tak mi se podíváme teďka i na nějaké příklady konkrétní
tady máme
tak my máme čtečka todleto jo že máme v podstatě nějakou řeč dva prosím řeči
jedna
změny a nezmění který tady těhletěch rámců prosím vás je z měli a který je
mez měli
co si myslíte
a to je tady řeč a co je spíš
jo tak teďka když vidíte tak tady tydlety signálky už byste měli být
tak nějak víceméně schopni odhadnout což je s o aspoň
tak to je ten a horní levý obrázek
to je to je nějaký rámec měl _e řešit pročetl znělé
čili přímý sou ty _e znělé vlastně
zvuky charakteristické
zase zavřít
prosím
tam není to že v těch vysoké frekvence ale my tak je vtom vidíme E
nějaké ty impulzy jo
to sou tady tyhlety části což odpovídá vlastně
čem _e tom základním o tom
jo jaksi
jo to sou in pouze na kterých vlastně potom něco rozumově
takže todleto je _e znělé řeči a todleto je zase neznělé řeči a my máme
_e k tomu i spektrum tam odra čára je spektru vypočítá ne pomoci čejo
_e fourierova transformace a myslím si taky že tvoje
a vlastně
na druhou žen
vypadá to tak
a to červené to je spektrum po žádné pomoc _e obecné
jo
takové obrázek ste už taky asi výdejny že jo
jo to je spektrogram kde v podstatě my máme za sebou nalepené
a spektra jednotlivých rámců jo kde barva nám určuje
amplitudu
teďka mi zase zkuste _m říct co osou tady tydlety čáry
tady
to sou ty formanty že jo toto sou průběhy vlastně těla formantů
jo
a teďka ní podle těch průběhu vpodstatě když byste viděli takových obrázku spoustu aby byly
co se tam
vlastně říká vlož jako s časem byste byli schopni v podstatě i přečíst je
jo
samozřejmě po vás se to nevyžaduje ale jestli se nemýlím
já nevím jestli to je v tomdletom kurzu anebo ovšem ještě dalším nějakým
_e jsem černocký ondro zdálo takové takovej ten vlastně list obrázky
nedostávaly ste nic takovýho jo tam se dostávají vpodstatě
_e jako kdyby Í spektrogram jednotlivých hlásek
jo
a potom ste dostali spektrogram nějaké věty a měli jste vlastně jako kdyby přečíst tak
zkuste sou zeptat třeba _e tuto na se
jo jako je to zábava
relativně
takže fajn todleto už víte
a teďka máme a zase nějaké spektrogram úplně na stejném úseků řiči akurátní když se
na to podíváme psát vlastně nějak se to nižší
jo
a jak se to nižší
a my to počítáme dívejte se jedno se nazývá dlouhodobě spektrogram druhé se nazývá krátkodobé
jo takže to znamená že u dlouhodobýho mi vezmeme dlouhý úsek řeči a vypočítáme spektrum
jo
do krátkodobý umývat na krátký úsek řeči a spočítáme
vlastně _e
to spektrum
a ten Í vidím a takové čáry si myslím vidíte je
po vodorovné čáry jako kdyby vtom
že
a to sou ty vodorovné čáry takové ty
tady bysme měli vědět aspoň si myslím
plně i tím
takové čárky tady mám pouze
tak to sou tady tydlety čáry takové ty jemné částky
to sou násobky to základní frekvence tak fajn
tak už podstatě tomu ty rozumíte
a todleto je L pece spektrum jo my vidíme že tam už na žádné násobky
ten základní překáž
jiné vidíme že to je hezký takový vyházeny
jo
teďka se dostáváme dá a to sou _e
nějaké parametry které dokáže má odvodit
chtěl auto je celku chycen to a nebo spíš těch mezi výsled
tady máme důvody pro oč vlastně ty _e kusy centech filtru a jaký
nejsou moc dobré pro rozpoznávání řeči
jo oni se špatně kvantují zaprvé protože
potom ten náš filtr se může nám pro stabilně
jo to je to je to je blbý
potom a oni jsou tvrdě korelovány co to znamená
a pro vás teďka momentálně to neznamená vůbec není jo to
o tom se bude zabalit a ježků rozpoznávání řeči kde
vlastně budete stanic nějaké _e ješitný marcos model to je to H M
a to sou nějaké pravděpodobnostní _e modely
jo vy ste už zřejmě viděli nějakou gaussovku aspoň ste to měli nic někdy třeba
a vy sto asi sto možná nepamatujete ale třeba na signálech a systém nachystej kdy
se kreslit jakou tu gaussův
jo vám se asi nejspíš neříkalo proč a já taky nevím proč ty obkreslili ale
když jenom tak jako vyzkoušet
jak se to zapíše aničce tam viděli tu klaus ovečku která co _e jednodimenzionální gaussovka
ona potom bude vypadat nějak
podstatě takle
jo pamatujete se jo
jo takže ste měli vlastně nějakou tu střední hodnotu a potom eště rozptyl jo to
znamená jak je to širo
když vy děláte rozpoznávání řeči
to tak gaussovka vlastně znamená ona znamená že my máme soubor nějakým hodnot
jo
_e
většina tě hodnot ona je soustředěna tady někde jo kolem té střední hodnoty
jo
a tady vlastně když je normalizována tak vlastně tady je nějaká pravděpodobnost
kolik tam tě hodnota se je
a když není to normalizace počet
jo
_e
kdy děláte rozpoznávání řeči tak vlastně tam se používá zaprvé hodně takových tě hosts klausule
a za druhé a _e
oni jsou většinou
mají většinou jako vnější dimenzi jo což tak piva polem těch čtyřiceti a šedesáti
jo
a ve dva ADS to bude vypadat zase trochu
jinak já vím že vám to asi možná až tak moc teďka neřekne ale tak
abyste potom třeba příště nebo ne příště to probuďte bavit
třeba se nám to vzpomenete tak to bude vypadat vlastně jako třeba
nějaké kolečko jo kde střední hodnota a potom máme rozptyl
tady a tady
jo ono to totiž to není
není až tak kolečko ale tvoje
_e takový kopeček
jo a my tady máme nejvíc vlastně ke hodnotu úplně nejvíc teček tady můžeme namalovat
a tady jenom prostě užší
jo
a ve tři D to už bude takový mráček a kdyby shopu
a teďka ni se baněma u nějaké ten
ku relaci
co ta korelace znamená
my když teďka vlastně nakreslíme se nějakou klausův k Ú
třeba můžeme si nakreslit takovou
jo tady máme střední hodnotu
a ty nějaké rozptyly jo akorát že ona není kulatá
a je taková jako dlouhá
jo
dlouhá alef takovým tom _e
k tedy avon ale spíš
takže
a když vona není položená ani k takovém ani není takle jo když vlastně tady
máme tu diagonálu tak se prosím vás aspoň pamatuj teďka že tam je jistá korelace
jo že vlastně hodnoty v jedné dimenzi záleží vzali se na hodnota druhé dejme
jo
a tady na popis tady tydlety jsme používali tu střední hodnotu _e nějakou tu
a asi tomu jo tu směrodatnou odchylku
tady bude na používá touž vektor
střední hodnota dvě střední to teda
tam bude i od jako kdyby dvě hodnoty té střední hodnoty X Y a potom
tam bude užší
matice
jo
tady bude má mít
řekneme si to má X
tady budeme mít a sigma Y
a tady budeme mít vlastně sigma X Y _e sigma
Y X
jo eště hodnot máme podstatně
víc
když P je _e když by vlastně ta gaussovka nebo ty parametry vlastně nevinný korelované
tak potom
máme nenulové hodnoty jenom diagonále
jo
a todle máme v podstatě jenom velmi jednoduchý příklad jenom dvě dimenze máme
měl a dyž K dimenzi tak potom to roste kvadraticky
tak jo
tak to je jeden z těch _e důvodů proč se nám to nelíbí protože ty
výpočty jsou potom moc náročné
jo
další věc _e proč se nám ty _e koeficienty filtru nelíbí
to je toho že je
když budeme mít
dva neřečové signály
jeden z měli jo a potom třeba
jeden _e z měli
ani vypočítáme nějaké a jaký třeba a jedna
tady a tady a jedna
jo tak vlastně a o ní se nemusejí vůbec nějak moc liší
jo a nic téma
když máme různé řečové
signály tak adit jako si ten se taky hodně rušeny jo
abysme s toho mohli vůbec něco
_e rozumně vypočítat abysme mohli je třeba použít nějakou akci euklidovskou tam nebo něco takovýho
jo
co tady budeme místo toho použila tak budou sou budou vlastně
tady tydlety _e posvěcení cítí tým mezivýsledky nějaké
to budou vlastně ty káčka sme viděli vtom algoritmus
na tom se říká kostce ta po dráze já si co vůbec nevím proč
a nebo a parku pásu korelejšn jo tady tydlety vlastně
_e sice entitními teďka můžeme
použit pro rozpoznávání řeči
jo
takže
co k tomu eště
tak to je asi tak všechno co sem k tomu mohl říct _e
eště další věc že _e ni můžeme
odstranit jako kdyby válcovým modelem hlasového traktu
a co to co to vlastně znamená
to znamená že mi vezmeme jakési jako kdyby trubky
jo každé bude stejné délky
akorát oni budou různě široké twitteru
to _e ty trubky musejí je tam musejí existovat určitý
poměr mezi sousední nic slupkami jo a když to třeba nějak moc hezky nakonfiguruje tak
když ty poměry správně vypočítáte tak potom když tam data
na vstup nějakým
nějaký ten impulz jo
tak potom by vám toho měla díle řeč
jo a jako ne plynulé řek samozřejmě ale
jenom nějaký konkrétní z
jo třeba _e nebo něco takovýho
jo
a poměr vlastně těch sousedních trubek on se dá
počítat hezký _e pomoci zase ti jako si tento od rázům
jo mně vezmeme
vezmeme třeba je nějakou první a druhou tu trubku první musíme ale
nadefinovat na nějakou určitou hodnotu jo protože my nedokážeme vypočítat a absolutní hodnoty jenom vlastně
jenom vlastně a _e
ty ten poměr takže nastavíme to má jedničku třeba
jo jak to máme napsané tady hezky
a potom bledneme _e příslušný koeficientů odrazu
dosadíme sem do toho vzorečku a s toho už můžeme i vypočítat
v podstatě jako kdyby _e hodnotu sousedního valeč
jo a potom
když _e tak todleto všechno vypočitám naivní můžeme dostat
další kulky centy který nám budou určovat
co se říká jo a ty koeficienty můžeme zase
_e použít
proč ní budeme chtít a používán
poměry jakousi centu od rázu proč
proč
nemůže na použito koncepce o dráze jak sme se o tom bavili předminulý slajd
no to bude _e
toho důvodů ženy sice to koeficienty máme
od mínus jednička do jedničky ale ta citlivost
na přesnost těch
a na přesnost kvantování ona bude
vyšší kolem stanuli jo když vlastně káčko je někde polem ten Ú D
tak potřebuje má vyšší přesnost
na kvantování jo a když to nějak špatně na kvantujeme tak to mi bobby
další _e nějaké ku o sice N ty
jsou zase nadefinovány nějakým tím šíleném vzorečkem a oni s kusem mastku se a pochopit
to ten vzoreček
znamená
když máme a nyní A Z nadefinovány jak u
jak to máme nadefinované
pamatujete se ta
a to byla jednička jo která odpovídá tomu že filtr má nějaký výstup
no a potom a je a A jedna Z na mínus první plus
_e dva Z na mínus druhou
a tak dále že
i když říkám dosadím ani sto Z _e Z na ninu s první tak co
se stane
místo ze tam dáme Z na mínus první tak jak to bude potom vypadat
_mhm
a potom ty mínus se budou plus ne
se nám přehodíme znamínko vpodstatě jo nebo ne
tak asi jo
když to říkám
tak zkuste to tam to _e dosadit jeho když mi teďka máme tady Z
tady máme Z na ninu C jedna
jo tak když místo zeptáme Z na mínus první tak potom se to votočí to
bude zatne mínus první mínus první
jo a to se vynásobí že jo
jo
fajn
a teďka eště musíme vynásobit takovým
takovým čísel K
tak
toto bude znamená my ceny tady tenhle tam díra
tady musím ani násobit tím a _e
Z na mínus
a mínus T plus jedna
jo
takže to se tam sta
co budeme mít místo jedničky teďka
tak přímo tady todleto číslo že
místo toho výhod výrazu co budeme mít
jak to bude asi takle _e
musíme vlastně to mínus jedničku tady
a todleto musíme sečíst dohromady pře
bude mínus T mínus ty a tady
že
a
takže se to v podstatě když to spočítáte přepočítáme tak se to vodpočinu
jo ty zetka
vlastně zetka pro a
a jedničku ona bude mít
jako vyšší hřát podstatě nemeš
než se to _e té
jo
to votočim
tak to můžeš rozumíte ani potom amosem M
máme teďka dobře tady tydlety pak polynomy a teďka těch polynomu musíme
vypočítat kořeny jo asi kůžemi budem a zase potom používat jako
nějaké parametry
tady máme dva polynomy
a vlastně co bych vám mohla k tomu eště říct je to že
my potom vlastně jako že mi těch polynomů vezmeme jako kdyby
na třídách jo když se podíváte na ty
a osy centry tady
a ty indexy
tak potom
teďka když se podíváme
sem tady sou třeba
tady jsou rozmístěny ty kořeny jsou jednotlivé hodnoty
jo _e tu ty sou vlastně jako kdyby na střídačku jo ty zelené patří jednomu
polynomů
a ty červené patří tomu druhýmu polynomu co tady je pozoruhodné pro
jste se podívat na ten obrázek
jo kde máme snímáme vlastně tu modrou čáru to je nějaké spektrum jestli se nemýlím
jo
a potom
ty čárky to tam máte
_e topy odpovídají těm kořen tak když se na to podíváte tak tam je nějaká
určitá
závislost to taky
proč ty kořeny jsou vpodstatě a
informativní
jo oni kdyby byly vlastně rozmístěné úplně periodicky tak neslíbí nějakou informaci vůbec
o tom co se tam říká
tak asi by nemec nenesli vůbec žádnou informaci kdy periodického ale vy teďka je vidět
takže kolem těch nějakým formátu kolem těch kopečku
oni sou jak se koncentrované jo oni sou koncentrované
nějakých lokálních maxim _e
jo takže hodnoty vás někde jsou umístěné
na mi říká ji
to se řekla jo
je to ta
nic
teďka L cca kepstrum i ste se už bavili o tom cepstru že jo a
to kepstrum je co
zkuste se to pole
jak se to kepstrum třeba počítal jestli si pamatujete třeba _e
tak ono to je za prvé je dobré vědět
na co ho počítáme
jo
jako že to je naším cílem
my jsme chtěli oddělit budu buzení moc modulace no jak sme to dělali
my jsme třeba měli nějaký signál potom sme měli spektrum že
zase se namalujeme tostexu mám sme to pochopí nějak
no a ta rychle měnit se složka tu ta odpovídá vlastně násobkům ta základní frekvence
jo to buzení
a ta pomáhala tu je co my chceme říct to je ta
_e ty teraz rezonance nějak
jo
no ani když teďka to spektrum _e známa na druhou potom udělám a logaritmus a
zase nějakou inverzní
a inverzní fourierovu transformaci takto s toho dostaneme
my se teďka chceme na toto spektrum dívat jako na nějaký signál protože ní vidíme
že ten signál v podstatě
má vysoké frekvence
jo to sou ty násobky základní frekvence
jo a prostě to obálkou která vlastně to sou nízké frekvence jo
je ženě když teďka ve žádny dalších mezi operaci tam uděláme inverzní fourierovu transformace nebo
prostě rybu fourierovu transformaci tak dostaneme zpátky ten náš signál
jo mít když uděláme fourierova transformace ještě jednou fourierova transformace dostaneme signál že my chceme
teďka oddělit vlastně ty frekvence v těch našich frekvenci
jo musíme tam dát nějakou operaci mezi to
tak dáme tam
vlastně a _e to spektrum dáme na druhou a dáme tam ten vokraj
jo ten logaritmus je tam vlastně ta klíčová složka
víte proč
ono prostě to násobení se dělá nám na při čekání v podstatě a to tam
co je tam to násobení
no prostě násobení je ve spektru v čase to je konvoluce buzení a vlastně a
té modifikace že jo
tak fajn
tak mi užitečný ten
co je to kepstrum tolik což je dobře no ani vlastně můžeme místo té fourierova
transformace tam dát
a zase to co jsme viděli před chvilkou na nějakým slajdu to ten kdy dělám
A Z
jo
že my už teďka vlastně tam
nemáme
_e nemáme žádnou
žádnou tu rychle měnit se složkami tam budeme mít podstatě jenom tu modrou
jo takže teďka naším cílem není oddělení oddělit buzení od modifikace ale
co je naším cílem
v podstatě proč bysme to dělali
za prvé mějte port licence chceme aby jsme
a používáli
co nejmíň hodnot pro u reprezentace nějaké ostrej může
no a teďka už tam to buzení nebudeme mít a že v podstatě budeme mít
něco to same co N cca akorát
bude čež či vpodstatě jo tady tyhlety koeficientíky se hodně používají
pro rozpoznávání řeči
ten proces je ale zdlouhavý jo protože musela udělat vlastně vypočítat
_e musíme datu na druhou potom dělá nějaký logaritmus a zase nějakou fourierovu transformaci
ani tydlety koeficienty dokážeme vypočítat
zase pomoci nějaký vo
nějakýho iterativního algoritmu
a to je tady tímhle tím způsobem
_e je tam akorát dosadíte
dosadíte nějakého do hloubky
předchozí chytráci
a takovým způsobem se to počítáte aleš vlastně C nula až Á
ač někam jo koník jako sem to budete používat ty hodnoty počítáte v podstatě stejně
ale je to jednoduše o něco jo provádět tady tyhlety
operace
tak fajn máte nějaké otázky
k tomu
nemáte _e děláte si přestávku
neděláte a chcete přestávku nebo nechcete
nechcete
tak
teďka jako
jo je se
státní teďka bude mám
prostice podívat a
na další přednášku a to už den
to se musím ještě stáhnout
_m
no a teďka se budeme chtít bajtu určování základního tónu řeči
účty C T dvěma dvě metody jak byste tomu hi
odhadovat
jo com možné třeba to nebudete vědět úplně přesně ale aspoň řekněte mi
dvě nějaké metody pomoci které který bysme to mohli vypočítat jo nechci jet já ale
aspoň nábytek to
je mi teďka chceme vlastně
užitém základním tónu řeči jo my chceme
odhadnout tu a základní frekvence nějakou na kterou na které kmitají hlasivky
jo
debaty hlasivky budou produkovat
zase nějaký ten signál
jo to není řeč této to leze něco co dělaj naši hlasivky
todleto bude nějaká ten nula
jo a potom S nula je jedna děleno ten nula
jo je data
ani teďka chceme
prostě buď tu scénu nebo tu F no spočítat vzdálenost mezi dvěma
infuzi
jak sme to může dělat
prosím
můžeme použít vlastně tu cepstrální nějakou metodu jo protože
a na konci když vypočítáme kepstrální koeficienty ta potom ste měli
něco jako tady bílá třeba ta nějaké vysoká hodnota a potom tady se plazili
zase nějaký hodnot kyjově sme řekli že prvních třicet odpovídá první třicet k otcem to
odpovídá tomu
co my říkáme že jo
jo
a to je ta pomalá změna ve spektru a ty a
dívající vlastně jak to říkáme jo když vlastně vynulujeme teďka prvních třicet koeficientu a provedeme
inverzní operace k těm které sme aplikování abysme proč tady to kepstrum tam dostaneme
tady todleto
jo samozřejmě to bude trošičku zašuměné eště nebude to úplně tak pěkné
ale potom může mazlit vlastně ty dvě špičky a kdy počítat i vzdálenost a potom
vypočítat citue jo to už umíte
další věc
o tom jste se bavili minule
tak když vlastně jisté dokázali vypočítat kosy centy _e auta cation true
jo máte ty koeficienty
teďka prostě máte třeba kurz licence pro _e pro _e jo
tak uděláte inverzní filtr k tomu
L pece to že _e Z
jo
sem pustit této _e
a tady by vám mělo díle to
tak ten L P zkrátil term modeluje jsou říkám
jo
inverzní on vlastně se snažit toho říkáme odstraní
jo
a teďka nám tam vleze _e
my vlastně to a tu informaci v podstatě snažím a odstraní tak by nám měl
velký let potom zase
by měla vylézt sekvence těch impulzů jo
je zase tady vyleze prostě něco
takovýho
jo
ekologické by to mělo být protekce
jo když se podi ono tam trošičku je zamotána s tím A Z se vším
kterém
protože tam se mluví o několika jestli v podstatě
najednou jo že prostě to je nějaká líně jarní predikce a potom vlastně todleto
ono to
po až tak moc ponesou wifi ale je to tak
fajn
teďka proč se o tom chceme báni celou přednášku když je to tak jednoduché
co se měsíce
to se dá udělat třeba jaký jiným způsobem _e ale eště tam nějaká dietní se
musíme
učte se určitě bavili o nějakým charakteristika že jo toho základního tom tak zkuste mít
popřát ten základní tón všechno co o tom víte zkuste se na to vzpomenu
tak zaprvé musíme třeba _e vědět hodnoty
nějakého z mezi jo vy ste se říkali že muži třeba maji
odpadní padesáti nějak tak jo až sto padesát třeba
jo dětima je kolem těch _e
cysta čtyřista jo a ženy nějak tak mezi
mezitím a samozřejmě to záleží jo úplně krát můžete zpustle
ale a _e no samozřejmě ono to se ještě
a já nevím jestli nám to pan docent černocký říká ale ono to akože
není úplně takle pravda protože
no to záleži taký a _e na té populace jo že evropě lidi mluví prostě
jinak než třeba a z i jeho tam oni mají ten základní tom o něco
vyšší
jo
neříká vám to pan docent přenosky že třebas a v číně údajně děti můžu mluvit
cache tisíc herd
time
jo takže
takže a _e to on mi říká že a vlastně ty mobilní telefony jo s
tím kódováním intel řešené fungování
no takže se to muselo muse se tam přímo dodávat trošičku jiné jako telefon si
nenastal
tak
ale já si myslím že pokud moderní době touž tak zase nemusí platit protože a
_e
že v americe třeba že je samozřejmě hodně číňanu a já poštípnu že oni vlastně
ok odhánějí nemobilní mobilní telefony tak
nevím
ale tédleté mi říkám
fajn dobře i teďka řekneme že někdo má _e základní frekvenci padesát hertzů
jo
je to
úplně pravda nebo není můžeme říct že někdo mluvit prostě na padesáti herci
co tam není prázdný
ono se to může měnit
dobře tak že vlastně ní teďka _e
budeme chtít odhadovat nejenom nějakou konkrétní hodnotu F nula ale celý třeba ten průběh že
jo
jo takže my budeme chtít odhadovat třeba to F nula
ná nějakých krátkých Ú settings řeči třeba na těch pro každý rámec budeme odhadovat
zvlášť
jo
_e tu rozmezí mozek může být _e dva ku jedné jeho takže někdo když někdo
move i třeba těch padesát tak může mluvit místo
jo
zajdeš čovek zpívá tak prostě ta modulace tam
že toto no
rozmezí je docela ustavení soket
po tu _m o _e samo ze samozřejmě záleží na náladě když nějaká žena je
či tak to
dobře tím hybnou
_e
dále
takže teďka pomalu
kde marná to už dvě metody víte
a mít teďka budeme se chtít podívat
_e
na nějak _e definují se tady máte co tady nemáte v podstatě ní
akorát toto už asi víte že ta základní frekvence tomu říkat klíč jo
jo slyšeli jste to nebo ne
a eště se o tom nebát nemáli takže to je to je potřeba změnit takle
se to píše anglicky
ano a ono vlastně tady todleto oslovoval se používá jako že to tady todleto konkretistovo
o normální význam taky znamená namířen třeba smůla jo jako s tou a dřeva
jo potom eště je vlastně todleto a slovo se používá na tu mění nějaký chtěl
facebooku
jo
ale zřejmě se nám to toho strašně líbí
fajn _e nite jaksi poučit _e základní perioda
to je dobře a potom eště jo eště jedna důležitá věc
že musíme zavést eště další termín koši je nula
jo a tu je perioda toho základního tónu ve vzorci
jo
takže vezmeme _e T nula vynásobíme tou a vzorkovací frekvence a máme to
takže ty diecese musíte zapamatovat
teďka se mu sem a eště říct D bysme mohli využít _e
znalosti o tom základním tou jo proč ni třeba chceme mezi
je tu Ú D nějakého člověka třeba jo
a _e D počitá ten průběh
základního tou
dva tak na pádlo třeba když a ví někdo konkrétně řeknete nějakou dvě to a
váš kolega řekne tu větu
on ju řekne
trošičku jinak jo prostě ta melodie vždycky _e
tomu člověku nějak
jak se to řekne
že každý prostě mluvit trochu jinak
takže už vlastně třeba u rozpoznávání mluvčího
my dokážeme tudletu informaci využít nejenom konkrétní hodnotu
jo ale průběh jak se to měnit částce
jo potom na konkrétně z nějakých třeba hláska
obzvlášť
jo tam se to hodně a mění
jako ne hodně ale trochu ale zase s toho něco rozpozná se toho rozpoznat k
tomu vy podle toho jak se mění trajektorie hlasitě hodnot jo
další věc se to může používat u syntézy řeči
jo
když vlastně
bude mání té _e
třeba
parametry toho L pece
jo toho filtru
tak potom do toho nebudeme na syntézu řeči nebudeme chtít do toho
pouštět jenom nějaké konstantní _e
nějakou konstantní sekvence impulsů ale budeme chtít tam prostě přidat i nějaké té změněny
jo můžeme je tam třeba uměle nějak
žida třeba to prostě zašpinit _e nebo nejlépe
třeba _e budeme chtít tam třeba když
sem se zujeme nějakou otázku tak samozřejmě tam ten průběhy vždycky trošku jinak jo než
ukažte řeči to je jinak
no a tam budeme chtít vpodstatě ráčí a _e
radši dat
na vstup
nějaký konkrétní ze života průběhu dnů někoho to odhadneme potom co budeme
třeba i využívá se to prostě u té syntézy
no a pokud o vání taky
jo
je vlastně a my můžeme ten tady průběh potom zakódovat nějak
a
nějak efektivně jo že nebudeme chtít před jako u budování rozdělíme vlastně a
ten signál který generuje hlasivky a to co se u nás vytváří spouse to rozdělíme
na dvě složky a potom zvlášť to zakódujeme a nějak budeme to
_e buď ukládat a nebo nějak někam posílat ano
fajn
ta
se tady máme
tady zase máme nějaké problémy
který můžou nastat
to sme si už si myslím že tak nějak průběhu
i řekli
tady není co
co říct dál tak fajn _e teďka
já jsem vás chci zeptat
a jaké třeba další metody by vás muži napadnout
jo mít když máme teďka nějaký konkrétní signál
máme řečový signál třeba já nevím zase prostě se nakreslíme nějaký signál E
a chceme
určit
a základní periodu jak by sme to dělali prosím a
jo teďka nebudeme po k těch použít
ani kepstrum ani vlastně to L P se teďka máme jenom ten signál a nějak
úplně jednoduše co by vás napadlo
tak to vtom přesadíme jo když je teďka dostanete nějaký signál odfoukla tomu způsobem někdy
kde prostě jak to vypočítáme tak zřejmě když se podíváte že tady máme nějaký ty
kopečky
jo
a kdy počítáme tu vzdálenost
teďka musíme ty kopečky nějak najít
vidíme že vlastně ten letenku signály
tady
jo a ta je tam _e tam u signálu oni sou se nějak podobny že
jo
no a to tak ty autokorelační koeficienty
my teďka vezmeme ten signál začne na postupně
postupně začneme počitáš si autokorelační koeficienty jo
nula aleš třeba
kolika štychy
já jsem vám teďka
možná ani neřekla jednu věc které je docela
docela užitečná ale _e i
proč vlastně my sme se bavili o tom
jakém jakem jako že intervalu sou ty hodnoty a pro základní
pro základní frekvenci jsme si říkali to je padesát dejme tomu až čtyři staře
a profese nadefinovali eště nějak ta nula
jo co je základní perioda ve vzorci
jo a to byla vlastně
bylo něco jako že ten nula to je
základní perioda
že se nula krát
F S
jo
a nebo můžeme říct že to je
F S děleno
S nula třeba
jo
a když nemáme teďka vzorkovací frekvence třeba a osum tisíc
tak můžeme vypočítat vlastně ten vlak
pro o _e nízké frekvence ale pro ty vysoké frekvence že takže teďka uděláme prostě
osum tisíc děleno
padesáti _e
osum tisíc děleno kolik to bylo čtyři s takže
ať vidíme že tady to je kolik sto šedesát
jo
a tady máme kolik tady máme
dvacet
jo
jo tak
takže
tak fajn tak že vlastně vjíždíme
že ten látky a pokud to může být vlastně dvacet až sto šedesát
vzor
jo
přičemž pro nízké frekvence je ten lak vyšší samozřejmě logický
a takže my teďka vlastně vezmu na
to je náš signál budeme používat autokorelační metodu
jo vypočítáme třeba prvních dvě stě
a první dvě stě _e koeficientu
a potom tady tomletom intervalů
dvacet a čtu sto šedesát styku osy C N
my budeme hledat
co
chtěl autokorelační kosice
jak by vlastně teďka ani když vezmu na tady tenhleten
řečový úsek a chceme
si namalovat průběh chtěl autokorelačních
kusy tento chceme teďka to namalovat jak by to vypadalo
tak ten první autokorelační konstant bude vždycky jaký
to
_e _m jednáte když máme všechno normalizované
ale bude maximální jo
prostě budem a tady mít nějaký maximum
jo
a potom zase budeme mít nějaké lokální maximum jo
až vlastně _e ten posunutý signál se posune třeba uplně vzorečku
jo
doprava tam nebo doleva to jenom _e zase nějaké max _e tady podám prostě mít
nějaký globus
no skoro se mi to povedlo
ale nic teďka co budeme a co nás zajímá mě vezmeme
těch dvacet až třeba těsto šedesát
jo
a vkusem a najít
když je to asi je
a vlastně kde si najdeme tento maximální
_e teda to lokální maximum
tak tam budete nula
jo
a už víme
tady todleto všechno víme takže hezky se můžeme vypočítat F
nula
jo
_e fajn
bude to prosím vás vždycky fungovat
jako že ta je tadleta metoda
když budeme mít třeba nějakým nezměněny
to nějak o to esko jo to je prostě šum
tak by to nemuselo fungovat protože vlastně
jako teď se mi tam vždycky najdeme nějaké lokální maximum sta je tomletom intervalu
jo jenže do lokální maximum bude zase někde prostě tady vole
jo takže ještě musel má kontrolovat podstatě na nějakou tu znělost jo jestli prostě má
cenu
vtom hledat nějaký základní
_e
jak se základní to jo
potom teďka půjdeme dál po těch _e jde vlastně tady todleto co vám říkám tam
je všechno těch najede hospodáři bych chtěl aby
zatím trošičku
i záni slevy
teďka dívejte se problém té autokorelační metody spočívá v tom že mi teďka vezmeme ten
jeden rámeček
jo jak to vidíte tady
začneme ho posouvá třeba
do práva
a to co je mimo ten rámec tak vlastně to sou nuly
jo
takže
todleto se věnuje
a todleto sledy nule taky
jo protože máme tam
nohy
a počet hodnot _e ze kterých ní počítáme ty autokorelační koeficient on se zmenšuje vždycky
jo s tím posunutím
takže místečkách když se podívám entá no
ono to bude vypadat nějak takhle
jo to sou ty naše autokorelační koeficienty
tady máme
to maximum nějaké jo potom zase máme
lokální maxima
jo
a takže my bysme teoreticky mohli udělat
to takže když se podíváme sem zpátky
tak a tady vezmeme
prostě tady
vezmeme kus signálu z předchozího rámce prostě se vo zapamatujem
jo
že tam budou zase nějaké ty
_e nenulové hodnoty a tomu se bude říkat cross korela
jo
je v podstatě jako kdyby máme stejný signál a prostě on je už trochu jinýho
protože leze podíl
fajn takže tam už budeme mít zase _e
větší počet
vzorků
to je fajn
svých teďka můžeme
to odhadnout jak svým
jaksi hezkým
ale tam může být zase nějaký další problém
jak je tam může být problémy se podíváme teďka hnedka
S já musím udělat je proč to nepamatuju moc _e jak sou ty slajdy za
sebou
_hm
vždycky podívat na tesla poznámky
má
jo ani tečkami já sem zase něco přeskočila ale to je jako že hodin se
když se podíváme sem tady máme vlastně _e
až do té zelené čáry odleva máme zleva máme
nahoře ten nějakým dané rámec a dole vidíme že vlastně
používáme teda ne dole a ale
tady
tady dole a tady na hořela že používáme hodnotu stě
buď předchozího anebo toho dalšího rám sem
ano teďka bude zajímat energie
jo předtím snad používali signál a úplně stejný signál když sme pro ty po výpočet
kofi ten požáry míň a
vzorku jo ale energie stě tvou
jako kdyby na zem posunuty signálem kila stejná teďka my budeme používat hodnoty který jsou
mýmu
takže může nastat situace nepříjemná a tu je todleto
jo
tady máme náš ráme tady to vypadá úplně stejně v pohodě
jenže
tohleto na mílétos toho předchozího a má to větší energii
jo právě proto my teďka bude muset dělat nějakou tu normalizace samozřejmě
jo
protože jí na
kdy sme vypočíst by mohla nastat situace taková že temnoty a cross korelační kulky center
nemusí být maximální
těch šest vypočítán
jo a mýtu budeme mít i na obrázku určitě jo
_e tři budeme normalizovat
ten výpočetní teďka dívejte se mi teďka sme vypočítá je cross korelační kusy centry
jak se to taky se
k osum
jo
a budeme chtít je nějak normalizovat
N R
jo takže bude znova energii
prvního signálu třeba to u _e to horního jo řekl jste signál jedna tohle je
signál je
zná prostě energii jedna
energie dvě a
a můžeme to takhle nechat nebo ne
_e test a tady máme v podstatě schováno v jednu energii jo protože děláme
signál krát signál a sečteme všechno dohromady všechny ty vzorky jo
že máme tam slovanu jedno
a tady máme ty dvě energie jako kdyby
tenhleten signál vpodstatě každý vzorek na druhou suma jo
a psaní ta takže udělám ještě to od v něm
jo
a že to rozumíte to je fajn teďka se podíváme na ty konkrétní _e příkládky
co je tohle je to je to řekla
_e
todleto je dobrý příklad tak to máme napsán
jo
máme cross korelační kusy centry a máme vlastně teda to je funkce pardon
_e normalizováno funkce máme
jo vidíme že vlastně
_e v nule
tom a maximální hodnotu vpohodě
jo všechno vypadá
hezky tam normalizace tam v podstatě ani nemusela být protože
energie vlastně toho posunutého signálu aneb posuňte oni jsou víceméně stejné
dobře
a nemáme další příklad
nahoře zase máme nenormalizovanou funkci a my vidíme že tady máme jedničku
jo
ale tady tydlety hodnoty obnaž třeba tady to je nesmysl
jo protože
ten postup osum design _e toto měl když _e energii a má se tady todleto
stálo a nám se to nelíbí takže my když teďka budeme chtít odhadnout
nějaký ten nula
my řekneme že tohle to je ono tři ta
když bysme měli tři sta tak _e když bysme třeba neuvažovali
ten interval na kterým to můžeme hledat
tak by to bylo úplně nesmyslné jo když budeme uvažovat to že to byla velmi
nízký
takže jsme uvažovali ten nějaký interval tak bysme našli třeba po tohleto _e nebo tomhle
jo čili nic
_m
nespíš tady todle
no a uděláme normalizace a všechno zase vypadat pohodě
můžeme najít
_e
nějaké to maximum
teďka
my se budeme chtít _e se podívat někam zpátky
jo třeba na tady tenhleten příklad
my teď každý tím M
nějaké lokální maximum a můžeme říct že prostě todleto
tady bude nějak někde se nacházet tola jo
a mě zajímá co je to co je tohle
to sou ty data kopečky
vy vlastně když máte nějaký ten signálek že jo
a potom máte tady ty rezonance že
jo todleto odpovídá vlastně impulzu
a tady to sou ty postranně zákmity to sou ty rezonance no a teďka kočky
jsou vlastně
odtud
honíte kopečky nám sou k ničemu
že
takže ním můžeme použit takovou věc že já budu má aplikovat a tak zvané klipování
nějak
i vezmeme ten máš signálek
jo to jsem namalována
a nadefinujeme si nějakou klipovací úroveň tak zvanou jo prostě klanu zápornou
všechno co je vlastně mezi
jedinou jeme jo aby nám to prostě já
tak na to bysme to potřeba když se na potřebám tak to prostě nepotřebujem
jo a potom vlastně necháme jenom ty kopečky
a nebo místo těch kopečků buď tam necháme ty hodnoty který tam skutečně sou
a jinde nuly anebo tam prostě dáme
město ještě pobočku třeba jedničku až mínus jedničku
jo
_e deme na to tady máte na definovánu to funkce to je jednoduché to popište
a tady sou ty výsledky tady sme vím vlastně u druhého obrázku sme jenom výřezy
co sme potřebovali
a u toho spodního tak tam sme vlastně nadefinování tu jedničku a nebo
mínus jedničku jo a teďka můžeme počítat Ú korelační funkce
jo
jo nebo ne
mám počítat až dávky u i in teďka já se látce zeptat
řekla jsem a _e že jsme na bych normálně nějaké ty klipovací úrovně
jo
já jsme nadefinovali jak je můžeme nadefinovat vůbec to by na tak asi napadlo
tak na provedy a to nebylo úplně nejlepší
to nadefinovat natvrdo pro všechny rám že jo
jo protože když máme změny tak tam ta úroveň zřejmě mohla bity výši
když je nějakým rámec nezměněný nějaký to esko jo kde máme prostě šum
tak prostě není moc dobrý tam hat
to vysoká protože bysme dostali jenom samé nuly
to je zase nemuse vaně protože uherska počítat vlastně základní
tom taky nemám
ale i tak my máme
nadefinovány je vlastně
_e
tady máte popsán _e nějaké metod jak bysme to mohli udělat tak za prvé můžeme
tu klipovací úroveň počítat pro každý rámec zvlášť potom vtom rámce můžeme taky
_e těch tipovacích
úrovni nadefinovat několik jo tady máte přímo příklad
že se na definuje tři
no ale zase jak sem řekla že vlastně když _e
sebou toho eska nemám oceánu počítat nějaké ten základní tón ale
tak jiný když budeme dělat o adaptivně klipování
tak potom klidně můžeme na ty bola ty hodnoty šumů jo tam prostě dáme nízkou
úroveň
a něco mám toho dívá se přece jenom
jo
takže prostě muset _e vždy jako že my se tady furt baněma o nějakých metoda
který nakonec prostě nikde nefunguje stoprocentně
jo ale některé fungují prostě v některých případech některý fungují stíny křivce a nejlépe je
vždycky prostě ty metody použít všechny
a udělat potom nějakou i _e prostě nějaký průměrování a nebo nějak ví brát výsledek
potom
na základě eště nějaký na všech algoritmů
kterými s tady jenom balíme o potenciále vlastně
fajn
a todleto
o tomhletom sme se taky barvy na začátku úplně jo když jsem se vás ptal
a
že vlastně vezmeme nějaký filtr který definuje áčko na vstup tam a ani vezena vlastně
ta chyba není ani predikce _e cože
vlastně
_e tenhleten druhý obrázek jestli se nemýlím
nebo to je ten třetí
jo
takže vlastně tady mám i napsané co to je
ta chyba lineární predikce to je ten _e
to je ten spodní obrázek čekání vidíme že
vlastně tý a
ty špičky tamto viditelné hezky ktery
jo spočítáme vzdálenost a máme to
a ten a ten prostřední to je ten
který povány signál
N to není klipované se na to sou ty autokorelační funkce uši počítáme že jo
jo takže já vám ta duškovi nám
nepravdu
takže to sou ten naše autokorelační funkce
ani vidíte že
víceméně všechny fungují
jo akorát třeba
a
tady tydlety tvé metod k i
funguje zřejmě lépe protože my nemáme tam typ odstranila vločky tak zvýrazněné jako třeba tady
jo
dobře
to by bylo ono
teďka mise budova podívat na jednu takovou
trošičku matoucím je
a tu je dlouhodobý prediktor chyby predikce pro určení základního tou
jo
toto znamená někdy sme _e dělají to L pecce
tak když sme měli nějaký ten signálek
jo
a chtěli jsme vypočítat třeba ta je todleto vod notku tady
tak my sme použili vlastně a
deset předchozích
jo takhle to fungovalo na
teďka me vlastně a
vezmeme ten filtr do toho filtru dáme kus řeči ani leze nám nějaká chyba
což bude další krok jako kdyby
jo dáme sám
teda ne to L pece ale bylo tam ten a filtr inverzního tam bylo to
áčko
jo
tady sme daně a Z a díle zónám potom
něco
takovýho
jo to je ta jako kdyby šíp _e
a tak si vlastně sme řekli by měla odpovídá tomu co vytváříte naše hlasivky
ani teďka ste žili budeme chtít vlastně vypočítat
to základní nějakou
a periodou jo buď můžeme prostě najít i lokální maxima ani počítat
vzdálenost je no
a nebo i teďka použijeme ten dlouhodobý prediktor což znamená
že _e hodnotu tady
jo i budeme chtít spočítat tady tyhle tě jednoho a nebo
dvou do
a tento máme napsané
a s toho všeho zná se nám potom vyleze
chyba šípy
jako kdyby
jo
a tak si bažiny už bude vypadat jenom fakt jako šum
jo
tady nic dáme ten dlouhodobý
dlouhodobý prediktor
jo
a teďka vlastně ten dlouhodobý prediktor se zapíše jenom takhle
jako lineární kombinace
dvou vzorečku vzdálených
o nějaké to M
jo
to S M sestřičkou vlastně bude
o hodnota
tady
jo
a todleto a ty dvě tečka budou zase hodnoty někde tady
a ty bečka no tibet a vlastně sou nějaký váhová si
k o fitcenter
a proč bysme to mohli to měli dělá tak mi teďka bude má muset abysme
minimalizovali tady tudletu síbíčko
jo teda tady tudletu síbíčko kůže rozdíl
a skutečné chybí a vlastně jako kdyby odhadnuté chyby
jo
tak musíme najít vlastně tu beta jedna a B tady a enko
jo a to enko nám říká
jak moc se musel na zdály
jo my nevíme že musela použít tady tydlety konkrétní dva vzorky je musíme najít
a tím pádem i když najdeme ty parametry optimálně tak najdeme to M kola jo
a to N po je vlastně todle baltazar vzdálenost
jo
je to pole trochu nesmyslném proměnná když
v podstatě musíme jako pro každé možné N T todleto vypočítat
no nevím jestli to moc efektivní
_hm dobře
_m teďka cepstrální analýza už sme u sme něco řekněme sme řekli že může mezi
ty
_e když kepstrální koeficienty
kdy byla se zpátky
jak je se signál
jo a potom tam zase asi v _e nějaký hodnota abysme to
nějak
_e počítány a nebo
eště když ní vlastně se teďka podíváme
a ty kepstrální koeficientíky tady jo tady tadleta tomu butiku totálně konstanta je nějaká energie
taky vždycky maximálně a znovu vystřihli
abysme měli dobré rozlišení pro ostatní ku osy centry
tydlety odpovídají vlastně tomu co sme řekli touž víme že se mikeš
no a tady už vlastně ty koeficienty ti odpovídají
_e
tom základnímu tónu ale mít když se na ně podíváme takle pískat tak mi vidíme
že zase tady
jsou nějaké zvláštní takového úseky
jo
a maximum tady bude odpovídat vlastně tomu lázně
jo takže tohle to není vygenerované zpátky signál todleto sou jenom koeficienty kepstra
jo takže to můžeme udělat vlastně dvěma způsoby
co tam ještě máme
v offline teďka dívejte se teďka sme
udělali co pro každý rámec nějakou tou metodou a nelepil paralelně úplně všem a
není počítání a hodnoty základního to takže dostaneme teďka pro nějakou konkrétně nahrávku
průběh jo dostaneme sekvence hodnot
jo hodnot jestli vypočítali jakž takž nějak to fungovalo
a teďka máme tydlety hodnoty máme padesát sto padesát co si myslíte
můžeme
_e
intervalu dvaceti minisukni což i ta naše ráme
jo dvakrát
prostě vyšší tu frekvenci to nemůžeme dat _e takže jí vidíme zřejmě že tady chyba
to s tím můžeme teďka udělat my teďka nějak to chybu chci jak ta Y
vyhladit semi odstraň
mohli bysme použit třeba interpolace ale co by to udělal
kdy sme třeba měli a něco jako
uděláš bysme interpolaci třeba nějakou tak sme dostali toho
nefunguje špatně ta
a průměrování to je to samé přestaň pole
můžete určitě znát ještě nějaký filtr
jo
jo popožene ten medián víte jak to funguje všichni
řadíme ty hodnoty ale znamená se to prostředního daně říkám _m
tak fajn může na použité mediánový filtr
a nebo
_e
tam můžeme použity eště jednou
metodu
a ta metoda
bude
_e M dva k tomu navedl a teďka bude má štice zase na něčem za
ni sacího to bude poslední něco které se bude a barvy tak pro snad počkejte
pět minut eště
jo a potom to dobře se bavte nebo
_e
mít teďka dívejte se prokáže ráne rámec ve natvrdo vypočítali nějakou hodnotu je to tak
ať vidíme že prostě sme třeba dostali nějakou autokorelační
funkce která třeba
na zem a teďka ta stovka
jo která třeba vypadala já nevím jak už to vypadá
rostli tady to měl nějaké max no tady to měla maximum a tady to měl
jo dejme tomu
jo takhle sme dostali tu
stovku
já myslím se podívali že tady
tady to je určitě ono
jo jenže tohleto je také nějaké lokální maximum
ani když víme že děláme takové chybí tak možné je dobře kubát se informace nejenom
o tom nejlepším _e cons dát tu
takhle
řekne
pro kandidátovi tak za
_e
takže prostě sem necháme informace je vlastně a
pro jejich možnosti
jo ne uložím asi jenom tu nejlepší
ale i ty které taky
možná
budou odpovídat vlastně to naše prán
potom mise udělám a jakousi maticemi ti a hodnot
jo
teďka prostě uděláme se takovou
jako kdyby maticemi
kde vlastně tady třeba
ta matice bude
vnést nám jakési jako kdyby
no nebude to přímo matice ale mělo by to být nějaké pole
nejspíš
no a matice poletuje poslány
jo ale tady máme vlastně ty naše lagy
tady mám _e ty naše a rámce ty frame i jo tak nepíšeme
třeba stejný
bože
core
a hodnoty té matice nám budou vlastně
říká jak moc pravděpodobné to je jak moc tam ověříme
jo
takže třeba my máme ty padesátky kolik tady mám
tak prostě na ty padesátky uděláme že tomu věřila sádře hodně
jo
potom třeba máme tu stovku tomu tati věžemi strašně moc
a potom z _e se
jo děsem atomu hodně
potom třeba když sme si nechali víc N po informace o průběhu třeba T autokorelační
funkce víme že tady bylo taky nějaké lokální maximum
ale prostě
nevěřili jsme tomu až tak moc jo
potom tady
zřejmě to bylo
no a tady třeba úplně něco málo sme měli
jo
teďka budeme hledat tak zvanou optimální cestu
jo ta optimální cesta ni se teďka budeme dívat ona bude prostí para třeba name
jako kdyby podle těch pravděpodobnost nějak takhle
jo potom další průběhu bude
někde takle
no a řekneme _m to je špatný příklad a řekneme že tady k nic nemáme
jo a řekneme že prostě třetí bude průběh třeba
zase takhle
jo
tak teďka co jsem se snažila namalovat nebo zobrazit toho že
přes tu stovku i když máme velmi velkou pravděpodobnost že tam má být akože to
ta stovka jo ta pravděpodobnost
dceru nám dala nějak a ta autokorelační metoda
jo ne ta tečna pravděpodobnost jako by
tam vlastně nám ta cesta prošla jedno jak vidíme
jo a přes tu padesátku kterou sme si až tak dobře neodhadli
tak ta cesta třeba prošla dvakrát
jo to je není to není úplně ten kuželem
_e ten
u ty příklady ve skutečně se to o něco komplikovanější ale pochopili jste to jo
takže my teďka řekneme že vlastně tam sme prolezli dvakrát tak to bude ono
jo to bude vlastními řekneme že ta cesta je tadle
jo a když se cestovky tam
dáme tu padesát
find
to je to máte popsány tady
jo ve skutečnosti to bude třeba vypadat nějak takhle
jo tady máme prostě víc těch rámečku
a máme zase uložené pro každý rámec si nejpravděpodobnější hodnoty nějaké
jo a tady potom
vlastně vybereme _e ty hodnoty kde se to nějak překrývá anebo udělám nějakou interpolaci tam
a my něco takovýho jo
jo vlastně jsem kecala teďka máme ještě jednu věc o které se musíme popálit a
to je desetinné vzorkování
jo rovná se může nastat taková situace že mi když máme
tak se budu malovat ten signál
bože malovat vůbec
takový signál jo teďka mistrova navzorkujeme
ve známém
tudle hodnotu tady tento nebudu malovat jo ale prostě pro znázornění
potom _e třeba to tady
seznam a tady
tady musím namalovat zase
no a u nás víte že vezmeme prostě tydlety hodnoty jo protože máme tu vzorkovací
frekvence
nějakou _e nízkou
jo
takže tady my vidíme že detekujeme v podstatě ten dávala
protože a když třeba vypočítáme ty autokorelační pozice termín vidíme
je tydlety hodnot k i oni nějak tak budou
prostě a budu nálad lepší hodnoty nešpor _e tendleten konkrétní po osum
jo
no ale ní máme tady tyhlety hodnoty co my teďka budeme chtít udělat ní budeme
teďka chtít dělá to desetinné vzorkování což my neděláme fyzicky jo i nemůžeme zvýšit vzorkovací
frekvence ale jenom teoreticky
takže my teďka řekneme že my budeme chtít
vlastně _e si čáry jo teďka náš signál vlastně se mi mám uloženy tomu se
na pracovat postupy modre modré čáry
jo
ani teďka budeme s tím že
prostě ty čáry chceme nějakým způsobem doplnit
takže my rozdělím a tam interval chtěl _e deset
jo
tady všude vše všechno
a uděláme třeba nějakou co interpolace
jo tak on uvidí že
tady to leze náhodou tady tohle za do _e tato dá se nějaký kopec a
ono tam skutečně prostě ty hodnoty ne úplně přesně ale nějak dopočítat
jo po záleží na to co budeme vlastně používat no a potom může má na
to aplikovat autokorelační
funkci
jo
a nebo to udělám úplně naopak vezmeme jenom ty modré hodnoty
počítáme autokorelační funkce a uděláme desetinné
blokování se tomu říká jo tak autokorelační funkce a snad tam potom ty kopečky nám
toto polní
jo podle těch
vlastně sousedních jako kdyby
průběhu nějaké sousední ano
tak nějaké otázky
tyhle já se nebo ni
není jasné
tak já děkuju vám za pozornost
mějte se hezky