co bude dnešní přednášce
dodělání velké v úvodu obsáhlého
_e kde vlastně představuju jednotlivé technologie tak je pokud s kostce a na pěkných obrázcích
a populárně
a potom se podíváme už do takové tuší věci a bude to vlastně průlet T
číslicové zpracování signálu aby se to shrnout jako isosceles kostce
jo takže _e teď to bude taková pohodička a ve druhé části přednášky to bude
možná ne pohodička
ale na druhé straně jako když člověk potřebuje se zvukem řeči nebo jist lidem něco
dělat prostě musí počítat
takže razení dělat poďme do toho
_e
na minulé přednášce na tom úvodu sem vám popovídal tedy o těchto budící dneska se
podíváme
odch identifikace jazyka dál
takže _e když _e
potřebujete teda jako zjistit tady mám ste krásnej krásného brázdičky jakým jazykem se mluvilo
tak _e máme vlastně v k dispozici takové dva základní přístupy které se po světě
používají a první přístup je akustický a druhýmu se říká von o takticky
vlastně se akustice pokud ještě trochu něco pamatujete z minulé přednášky
v _e nějaký gaussovským o daleko o tom že se do těch dosovský modelu vlastně
pošlou ty naše velké matice parametrů tak ten _e akusticky přístup funguje úplně stejně to
znamená na jeden jazyk
ale prostě jeden model který je tvořený spoustou _e spoustou gaussovek
ten nebo dal model na tróne na trénujeme na co nejvíce datech _e s toho
daného jazyka
a pak prostě když máme těch modelu několik pro češtinu pro čínština nevím ještě P
proto dalšího tak do všech modelu vlastně pošleme _e tu stejnou maticí parametrů a jenom
si
řekneme jak moc nám to je který model pálil
srovnáme co vybereme nejvyšší číslo řek ale ten jazyk to je
u toho von o taktického přístupu je to _e trochu jinak
_e už toho názvu vám bude zřejmý že se bude jednat osivo nějaké fonémy
a vo nějaký prostě
když máte taktiku tak je to vlastně na sledu nějakých událostí že jo tak to
tam bude taky
je to vlastně
takový líbí V název pro počítání statistik jednotit dvojic a trojic fonému které se následují
_e za sebou a s toho ste schopni jako na který detaily za chvilku
takže _e ten
_e podívám sto mám dete a
detaily tam nemám za chvilku tak možná víc _e více detailů tady
takže _e u toho fantastického přístupu
to máte jako vlastně první
_e jako první bloček je tam samozřejmě k extrakce příznaků toto děláme úplně všude to
už bych ani nemusel zmínila
druhý je tady ten mozek to je hrozně hezký obrázek který vlastně ty sekvence příznaků
má _e má přepsat sekvencemi nějakých hlásek _e fonémů
tak
teďka se vo tom jako zkusme chlup obavy
_e představte si že má moc sebe z rozpoznávat _e
hongkongskou čínštin úvod mandarinky _e češtiny _e obvod tcha ionské češtiny
a nikdy jsem neviděl žádný trénovací data prostě přepsanej pro češtinu to že si neumim
udělat čínskej fonému ve rozpoznávač
myslíte že to mám rovnou zabalit ale už to bude nějaký a
relevanci mě nabídli sto tisíc dolarů když takovej
rozpoznávač udělám artroskopy tady že nechcou nebo
nebo něco
tak uvědomte si o to co tady jde v tom fonetickým přístupu _e vlastně máme
tu vstupní řeč přepsat do nějakých sekvencí jednotek
ale _e
já to mohl jazyků ve skutečnosti nemusí vůbec rozumět jo když prostě je _e mandarinky
_e čínštině
_e
ten procent tak
hrozně jako _e častý a ten znak se _e vyslovuje
_e svolán
_e J u
že jo u
a ta je v antitěžišti ně bude zase
hrozně častý tady tento znak
a ten se bude _e vyslovovat _e
_e chůvo _e C
ta ho
tak já jsem _e teďka udělal co když sem vám říkal tady tyhle
je krásný slova
že by si že umím čínsky
abych hrozně na tom já neumím takže já jsem vlastně na jejich reprezentaci voni to
ti _e číňani a charváty skutečně takhle nějak řeknou ale já jsem vlastně tady tyhlety
slova
nějak vyslovil pomocí vobyčejnej českej fonému který umím
a úplně to samý vy můžete udělat _e číslo taktickým systém jo to znamená na
místě tady tohoto nemovi horký rozpoznávače prostě použijete nějaký který máte k dispozici nemáme samozřejmě
nejoblíbenější český
_e kterým máme doma který jako známe ale taky násobíme si třeba maďarský fonému vy
rozpoznávač
nikdo z nás maďarsky neumí ale natrénovali z mého na nějaké standardní maďarské databázi a
zjistili jsme že když se zapíchne do takového ale systému pro rozpoznávání jazyka takže prostě
úžasný a může se čtyři roky spekuluje ne pro
možná že to je protože se maďarštině _e ten _e ta databáze prostě má nadefinovaných
mnohem více fonému neštěstí měl řečníka máme asi třicet devět
jestli se nepletu tak maďarských jestli šedesát a možná že to tou bohatostí fonémů že
prostě jako nám pomůže znáte popsat ostatní jazyky no takže tímhletím rozpoznávač M
prostě
_e data těch vašich jazyků já nevím tady bude mandarinky tina tady bude _e tady
manštin a přepíšete dostanete takovéhle dlouhatánský je několika limitu milionové řady fonému
ale těch zadá fonému potom spočítáte statistiky spočítáte statistiky každýho jednotlivýho symbolu to znamená uděláte
si tabulku kde bude a někde bude na někde bude J
potom se počítají statistiky dvojic fonému tak zvaný bigramy a pak se počítají statistiky projít
fonému
tak zvaný trigramy jo to znamená zjednodušeně řečeno máte ke každýmu jazyku tři tabulky v
jedné soubory gramy druhé bigramy ve třetí trigramy
tomuhle jazyku je máte taky a potom vám přijde nějaký _e neznámý signál
a vy si ho přepíšete zase tím po nebojím rozpoznávač M který máte takže to
bude třeba
_e chůvo
co
no
a teď toho _e foném ového řetězce
vyberete jednotlivý znaky
podíváte se do tabulek pro jednotlivý jazyky jaký mají tady tyto znaky předpočítaný pravděpodobnosti to
vám dat jedno skóre pak se tam podíváte na bigramy
druhý score podíváte se na trigramy třetí score a
zjednodušeně prostě který s těch jazykových modelů nebo tak zvaných von o taktický modelu pro
který jazyk tam bude víc bečova tady s těmahle testovacím a data má tak ten
prohlásíte prostě že je dobrý a že vyhrává
a že tenleten jazyk se nám rozpozná jo takže todleto je princip vono taktický ho
přístupu
který se taky rozpoznávání jazyka velice používá a je
docela dobrý je že většinou komplementární tím akustickým
takže když se výsledky tady těch dvou systému smíchají tak je to prostě lepší než
jednotlivé
_e
jo takže rozpoznávání jazyka tetě vlastně jako taková _e takový
poznámka k tomu na čem ty systémy pro rozpoznávání jazyka trénovat
potřebujete zjednodušeně mnoho nahrávek daného jazyka a k tomu mnoho bych ještě připojil že potřebujete
se z té cílové oblasti kterou je budete chtít rozpoznávat znamená pokud C budete takový
systém vybije vyvíjet
pro _e nějakou _e za nějakou armádu nebo pro někoho tak vás asi nebude zajímat
_e krásná řeč _e nějakých mluvčích nebo hlasatel u k televizi
ale potřebovali byste nahrnou co nejvíce prostě _e telefonních nebo v obyčejných hovoru pomocí
prostě ten styl řeči kterým lidi _e normálně mluví
tady v tom tímto jsme se zabývali
vlastně _e v jednom takovém projektíku bysme vlastně pomáhaly americké len když _e není byste
kdy ta konzorcium sesbírat nějaká data to evaluace _e těchdle těch systémů v roce dva
tisíce osum
adam toto dokonce jako přesile surface li nějaké peníze
ale šlo vlastně o to že my sme si řekli na světě spousta dat volně
dostupných které můžete stáhnout z internetu nebo se můžete napíchnout na satelitní vysílání a můžete
prostě během jediného dnem indispozici já nevím jako ti se tisíce hodin dat
akorát že ta data vám většinou nebudou k ničemu protože to právě jako
je to hudba jsou to nějací školení mluvčí hlasatele je tam pořád ten M ten
samý moderátor který tam dva stačí nějaká moudra takže _e jsme vlastně udělali takový systém
kde se tady tyhle těch dat napřed detekují telefonní hovory
a potom se prostě telefonních hovorů se něco trénuje když se ten mimochodem na detekovat
telefonní hovor rozhlasovém vysílání tak to docela jednoduchý protože se podíváte na spektrum
normální rozhlasové vysílání má prostě široké spektrum vod nuly snad až do osmi nebo do
deseti kilohertzů a když je v tom potom vidět ten telefonní hovor tak vidíte jasně
jak to spektrum dosahu jenom vodstvo od nuly do tři a půl kila nebo roste
čtyř kilohertzu už tam není
takže na základě vobyčejný stýho spektra se dá udělat poměrně pěkný detektor
a dá se s tím _e
tady tohle
tohle natrénovat
další věc samozřejmě že když máte takové nějaké _e přítelíčka i co tyhle telefonní hovory
sbírají
jo
my raději ani nevíme jak tak _e si to tihle ti přátelé můžou přímo do
trénovat na svých _e na svých vlastních dat
a naše současná práce v rozpoznávání jazyka je _e není to moc překvapující je to
úplně to samý co seděla rozpoznávání mluvčího to znamená boj nechtěnou variabilitou
jo my jsme si říkali že rozpoznání mluvčího vlastně chtěná variabilita jetá co rozlišuje jednotlivý
mluvčí všechno vostatní prostě co říkají emoční stav prostředí a taky jejich jazyk je špatný
a u rozpoznání jazyka
je to zase takže ten jazyk je důležitej a všechno ostatní včetně toho mluvčího je
spatny
jo takže pomocí úplně stejný ho _e matematického formalismu jako co sem vám tady předváděn
minule s nějakýma posouvacího nouzovka má
dokážeme bojovat jistou _e jistou _e inter řešení
_e a tentokrát inter speaker variabilitou rozpoznávání jazyk
tak to nebyl I D
pak _e máme přepis řeči na text troše jako taková takový ferrari _e zpracování řeči
prostě tom tento nejlepšího nejvíc super
co člověk může udělat
se budeme tady o tom mít
_e přednášky který se budou týkat nějakých jednodušších metod
_e dynamicky borcení času potom nějaký složitější hádanek poďme se podívat teďka jako úplně
úplně znaku na takový systém
mimochodem ještě když _e
když _e se budeme bavit o přepis řeči na text
tak uslyšíte po světě různých zkratky jako třeba ve dva T jako vojtu text
nebo S dva testy čtvrtek
odborných kruzích je asi nejpoužívanější ilwis je s _e to znamená lásky by velikán téměř
spíše konečný
rozpoznávání spojité řeči s velkým slovníkem a všechny tři jsou to sem sou to sami
jo
a teď se pojďme podívat jak tady toto sem _e sedí nebo jak se srovnává
s tím naším rozporům základním
rozpoznávací _m _e schématem
tedy jestli si pamatujete tak byl nějaký signál na vstupu výpočet parametru
modely nám hodí nějaký čísla
a na těch číslech probíhá výběr
výběr toho nejlepší
zjistili jsme že třeba v rozpoznávání pohlaví to byly tady si ti kluci a holky
co sem vám tady promítal minule tak to bylo extrémně jednoduchý tady případě existuje sanito
trochu složitější ale zase jako _e tam ty základní bloky uvidíme takže
tady nám do systému přiveze řeč
výpočet příznaku probíhal naprosto stejně jako u těch předcházejících aplikacích
to znamená nějaký vektory který nám týkají každých _e každých deset _e milisekund
a teď tady máme _e nějakou sadu modelu
a ta sada modeluje vlastně chod schovaná tak zvané rozpoznávací síti
tetě
čeho je ta rozpoznávací sítích _e zkompilovaná nebo _e nebo _e postavena
je postavena s akustických modelu
kde zase jako
nebudeme překvapeně když najdeme jimem K znamená modely do úsov kam a
a ty akustické modely na vlastně říkají
když _e
tady mám třeba
masku a ste vlasy hláska a
a tady mám akustický model pro áčko
tak ten model je tvořený nějakou prostě soustavou několika rozměrných gaussovek
a říká mně jak je pravděpodobný že tady tenhleten kousek signálu zrovna mohlo být káčko
jo potom tam bude mít samozřejmě model pro byl C D a tak dále a
tak dále to znamená
tady mi to vlastně dává jakýsi startuje kousek vstupní vlásky odpovídá nějaké hlásce
potom tam mám další komponent a _e to je jazykový model
jazykový model mi říka schválně zkuste při na to co
to může být návykový model
když řeknu prezident václav jak jestli bude další slovo
ale nebo klaus že jo tak to bude asi tak půl na půl asi to
jako nebude slovo jary
takže jazykový model vám dává přesně tady tohle vlastně na základě nějaké historie slov
která V nejčastějším případě býval boj slovní
tam udává podmíněnou pravděpodobnost
do že
tento okamžik bude pravděpodobný nějaký slovo
jo když si to představiteli můžeme mít
opravdu _e historii prezident
václav
a teďka tady budete mít _e klaus
havel
a jardin
a zjistíte že tohleto slovo podmíněný touto historií je pravděpodobný zhruba tak nula celá čtyrycet
devět procent tady tohle
zhruba nebo nula celá čtyrycet devět let taky nula celá čtyrycet devět
a tady to bude nula celá nula
nula jedna jo takže tady tyto hodnoty nám vlastně _e udává jazykový model a ještě
schválně značen takový jazykový model o čem to natrénovali
a čem byste odhadli tydlety pravděpodobnosti
tak
zkuste noviny správně
_e no noviny jsou docela dobrej zdroje víte že prostě nich jako giga seženete zadarmo
na internetu případně ještě víc když se nějaký koupíte _e
od lidovek nebo já nevím od koho
_e na co bude tenhleten řekli model kterej na trénujete na novinách dobře fungovat
a televizi na zprávy jo na rozhlas na zprávy a ná _e řeč která se
bude svým charakterem podobat tím textu na který ste kterých se trénovali
co takhle třeba přednášky na fitu
se pokoušíme dělat si pročesat com
jak by to bylo tam takový modelům kterým na trénujete na _e na nový na
žádná sláva jako prostě nebo nebude zná slova jako fourierova transformace
půlsemestrální zkouška a tak takový chudičký který tady je to máme _e máme rádi takže
u trénování těch jazykových modelu
vlastně _e nějaký obecný dokáže to jednoduše postavy ale potom by abyste udělali takový model
tak vypracoval dobře pro takzvaně indo main data znamená data dané domény kterou budete rozpoznávat
tak si musí teda trošku práci a sesbírat ty textový _e ty textový zdroje tak
aby seděli
tou cílovou doménou kde budete rozpoznal jo toto prostě se nám bude táhnul jako červená
nic
celým kurzem aby něco furt fungovalo tak by si musíte trénovat na datech který jsou
co nejblíž tomu co budete chtít _e potom zpracovávat
co takhle _e
eště pořád vás nenechám s tím jazykový model
_e
takový říkali model který třeba na trénujete na novinách a šli do něho na hrnete
všechny studijní opory fitu bude potom perfektně pracovat _e
na těch
obecných věta
na světa který obsahují tady naše informatický termíny to bude bezvadný
a co takhle
slova prostá nebudu tady říkat nebo toho že se člověk různě zadrhává a začíná jednu
větu čtyřikrát že se tam byste _e zaslechli čtyři krát za sebou a tak jsem
byste natrénovali tohle
přepis řeči správně
cokoli myslíte řekli přepis řeči stojí
hodně no
přepis řeči stojí tak jako melouna takovou menší databázi
naštěstí ná _e na _e spontánní data existují databáze který
se dají koupit
táhnout a něco možná kosovi přepsat byla to zajímalo
tak sme tady hodně dat se jako přepisovali nebo organizovali přepisují sami ale to vopravdu
šílená práce která
R a není věda která jenom otročina
která stojí spoustu peněz tak _e
poďme k tomu dalším bloku
a to je výslovnostní slovník co to je
co myslíte že musí výslovnostní slovník udávat
když výslovnosti že jo jako daná forma jednotlivých šlo
vedle toho musí být postavená fonetická forma protože
mám tady základní jednotky pro rozpoznávání který jsou fonémy a nebo nějaký fonémy kontextu ale
potom teďka nemluvme a musí mít nějakej převodník kterým a to ze slov _e dokážu
na fonémy pře ve
taktéž byste ten výslovnostní slovník vyrobili
zase
navrhujete
buď bodmer jednoduchým případě pro češtinu
já mám studijní oporu
i se selmo Y se stane
_e a chtěl bych i převést nechť ovlivní vybrat všechna slova převezte na fonetickou formu
jak na to
prosím
_e
to nevím jestli byste takovýho dobráka sehnali
nejenom přečte léky napíše op
tak další návrhy
tak buď ten slovník někdo už udělali filovo něho koupíte nebo řeknete nebo něco takovýho
asi nejjednodušší
nebo ho vytvoříte přesně tak jak řekl pan kolega to znamená že někdo zasedne opravdu
pro každý nový slovo foneticky zapíše jeho výslovnost
co takhle vymyslet něco chytřejšího
to takhle zkusit natrénovat nějakej převodník
psané formy na fonetickou
jo tak tady tohleto de
když se podíváte _e po netu
a dáte si tam _e dáte si tam zkratku se k vy tour
tak _e najdete
systém trénovat silný
který je založený na nějakých takzvaných join s máte krámech o těch teďka vůbec nebudeme
_e povídat ale tenleten systém prostě když mu předložíte existující _e výslovnostní slovník
na jedné straně psanou formu na druhé straně fonetickou tak se vám dokáže naučit C
pravděpodobnostně pravidla tak
že potom dostane nějaký neznámý slovo
znamená ne jiné dokopu koko
koná liší a dokáže vám vyhoví derivovat se fonetickou formu dokonce to dokáže nejen
pro jazyky s takovou rozumnou výslovností jako je čeština lancelot on když tím
tak a eště jedna možnost nám zbývá
o které sme tady nemluvili
ste navrhnout
jak udělat výslovnostní slovník
já sem vám rovně začal
možná že to jako někde D češtině byste vlastně možná že chcete říct ocel _e
to co vlastně _e řešení a to je napsat si pravidla
češtině třeba _e takovýdle pravidla pro většinu slov do u napsat protože čeština je fajn
téměř fonetický jazyk
prostě _e když _e máte slovo rozpoznávací
a přepíše toho do fonému tak zjistíte že je to téměř
zjistíte že to téměř fonetický zápis
jo a sou tam nějaký _e nějaký jevy nějaký fenomény jako že P
jako že já nevím _e že _e znělé D před neznělo ohlávkou nám přechází do
_e do S
ale na to toho dokážete pokud si vezmete knížku fonetice zase dokážete napsat pravidla
jo to znamená uděláte sadu pravidel
a nějakým způsobem nějakou chybovosti potom budou fungovat _e potom budou fungovat _e i na
neznámý slova
tak a když máte všechny tady tyhlety komponenty
tak se s toho dá zkompilovat tak zvaná rozpoznávací C a von jenom říkám zkompilovat
protože _e pokud prostě ste se děsili toho co vám tady vykládají pan profesor češka
medu know
_e a zvolená nemo konečných stavových automatech a mysleli takže si že může jako nikdy
nikde neuvidíte když tu zkoušku máte úspěšně za sebou takhle prostě přišlo z hračko
a _e za zase tady tyhlety věci
vidíme jo tyhlety věci je tyto komponenty
se dají normálně reprezentovat pomocí konečných _e stavových automatů který jsou _e samozřejmě narozdíl od
těch tiskových
_e vážený
jo vy tam
sto asi viděli prostě
F S a jako si my state automat on a nebo F S P
ceny state _e ten tým se a u těch našich jesliček dám ještě dycky V
takže to obsahuje pravděpodobnosti takže to wait i a pomocí _e takových operaci s těma
konečným a to vím automat a máte v strom a který jste viděli to znamená
nějaká kompozice determinizace minimalizace dokážete postavit takovouhle rozpoznávací C
pokud třeba půjdete _e _m
oni podíváte se po netu
_e budete se koukat po tu open F S T
tak tohle to je záležitost která tuším začal někde tritiem T dales a teďka je
to všecko pod úhlem
ale _e je to prostě sada úžasných pomůcek pro práci právě vážený malý nevařím A
konečným stavovým automatem
jo můžete
že se mrknu na to a to je asi tak jako dneska hlavní proud rozpoznávací
pro rozpoznávání řeči protože spoustu práce za vás můžou právě udělat konečný stavový automaty a
vy potom dostanete jako docela
malou a do paměti na co smrtelnou rozpoznávací C
se kterou s poměrně jednoduše dokážete rozpozná
tak abych se dostal k těm _e rychle s tím dalším dvěma blokům
tak _e ste rozpoznávací síti jednak uvidíme jednotlivý akustický modely
který nám dávají zase nějaká čísla a ta čísla vyhodnocují _e zdá na tomletom místě
v řeči bylo pravděpodobně _e nebo B nebo C nebo ne
a potom _e tam přicházejí dekódování a to je v tomhle případě o něco složitější
než jenom vobyčejný K výběr maxima který jsme viděli v těch minulých aplikacích a tam
sme třeba měli
_e modely deseti různejch jazyku
říkat zatím prohnali data ty modely nám dali nějaké
číslá nějaké likelihoody a my jsme vybrali maximu
a todleto bylo celý dekódování vobyčejný výběr maxima
_e při dekódování
rozpoznávání spojité řeči
je to tak že vlastně vám ten _e prostor hypotéz strašně způsobem bobtná
zásadní byste měli
vyhodnocovat pravděpodobnost toho že na libovolném místě v řeči je libovolné slovo
což prostě jako v životě nedokážete protože by se to nikdy nespočítali takže pak přichází
_e ke slovu takový
techniky je kopie prořezávání
pruning že jo pokuste někde slyšeli vo algoritmu i stále
jo jako _e prohledávání grafu tak tady tohle taky občas uvidíte časově synchronní časově nesynchronní
prostě jako můžete celý dvě přednášky strávit tím že budeme _e budem povídat ode kodérech
měli sme tady na konci
zimního semestru mirka nováka že místo myslím viděli ibm klastry
to jenom tak jako na tukwila
povídal tři hodiny
tak _e tohle jenom potomek příklad takové rozpoznávací sítě
která pokud si dobře pamatuju tak dokáže rozpoznávat slova Á a B
jo a V _e tuto slova a B můžou být _e můžou být nějaké _e
nějaké smyčce když budete mít takovou rozpoznávací síť pro nějaký reálný slovní
reálný slovník má pro angličtinu velikost _e zhruba padesát kilo slov jo s tím se
naposledy velice slušnej rozpoznávač
pro češtinu
je to tak více než tři sta kilo slov protože čeština je potvora o jedna
tak jako bysme to samozřejmě na to je jako na obrazovku nedostali
tak _e zase
trénování systému pro voice tu _e vojsko text
_e
akustický modely se musí trénovat na korpusu mluvené řeči
_e na nějaký textových předpisech
jo to znamená máme prostě na hraných spoustu věc
ne
nejsem
přišel
tomu je wavka
a abychom natrénovali ty akustický modely tak potřebujeme vědět že tady je téma se D
tady je na
tady je tady je F
a tak dále a tak dál
existuje snad jenom jediná databáze na světě kde _e tady
tohleto _e kde sou tady ty značky dělaný a načasovaný ručně a to sem net
limit jo
to databáze americké angličtiny
a tam jako vopravdu sedělo stádo fonetiku a označilo ručně kde sou který hlásky
běžně by se tady z tohoto všichni zbláznili takže co
těm databázím
máte většinou dispozici
souhlásky
a textový přepis a když potřebujeme trénovat nějaký akustický modely tak sis tohodle textový do
přepisu musíme _e vyrobit pomocí výslovnostní ho slovníku nebo v nějakýho pomocí _e nebo pomocí
automaticky objev into phoneme tool u
_e fonetický řady že prostě do N F S
a tak dále potom vím že tahleta věta obsahuje tyto fonémy ale nevím kde sou
a naštěstí když se trénují takový systémy pro rozpoznávání takto nemusím přesně vědět protože ty
trénovací algoritmy po několika _e po několika koleč tých si ty _e si ty
fonémy za rovnají sami
na jednotlivý řečový segment i když tady tohleto budete dělat a uslyšíte slovíčko fork alarmem
tak u toho furt elementu prostě máte k dispozici forem _e řetězce fonému máte k
dispozici masku nějaký modely
a tím modelům řeknete já vím že sou _e mojí promluvě tady tyhle fonémy ale
nevím kde
a ono vám to automaticky zrovna
tak _e co je docela problém je tady fonetická sada
a výslovnostní slovník
protože to musíte mít _e to musíte mít jak sme říkali jako nějak předem definovanou
_e textový korpus tak jak jsme tady s kolegy dali dohromady zase až tak _e
cache tak _e důležitý a složitý není jenom musí do za pozor aby byl _e
ste domény kde chcete něco dělat
tak a my se tady snažíme v rámci nějakého projektu
trošku zjednoduší tady ten postup _e a
pracovat na technika
který by dokázali
i vlastně pro nový a neznámý jazyky
_e
se obejít best _e fonetické sady abych výslovnostní ho slovní
jo tady tohle docela zajímavý protože
jako skupina dostáváme občas požadavky udělejte nám rozpoznávač pro nějaké úplně divnej jazyk
a říkám jako a máte
v tom co to jazyka máte no máme nějaký nahrávky aby jsou nějak přepsány
no
a znáte jako nějakýho fonetika to říkat ne
mates výslovnostní slovník jazyka ne máte nějaký texty _e možná takže _e řekl je to
do je to docela důležitý
pro rychlý vývoj dej takový v aplikaci do nových nebo do nových jazyků nebo i
do třeba velkých jazyků D tady tyhle zdroje nemáte k dispozici jo třeba jsme se
dívali na thajštin u eště nemá si osmdesát milionů mluvčí
a když se chcete koupit nějakou thajskou databázi tak prostě máte smůlu protože žádná není
tak
poďme se podívat na _e etapu detekce klíčových slov
tak co to znamená
znamená to že řeknete já nechci přepsat celou nahrávku
ale máme nějaký klíčový slova když byste měli třeba online zpracování meetingu
tak to může být třeba slovo rozpočet jo nebo vyhození šéfa nebo něco takovýho a
potřebujete aby vás ten systém upozornil na tihle na místě kde se takový klíčový slova
_e objeví
tak _e jak se na to de
v zásadě
můžete _e
budete aplikovat úplně zase stejný schémátko kterým sme tady několika několikrát viděli
jestli si pamatujete na rozpoznávání mluvčího tak jsme tam měli dobrej model dobrej model _e
vlastně vyhodnocovalo že to je ten daný mluvčí
a pak sme tam měli špatný modelům říkali jak obliga modul
a ten vyhodnocovalo _e skóre toho že tam není ten daný mluvčí
a nebudem teď mít úplně to samý akorát že ten dobrej model bude
model klíčový ho slova a ten model pořadí bude _e budeme se snažit aby prostě
na sebe chytal vychytal všechno jiné
tyhle dva modely pro každej časový okamžik jo to je tady důležitý
je pro každej čas
budou _e produkovat
budou produkovat nějaký _e skóre věrohodnosti
budete dělat jejich poměr
pak tady tenhleten prom poměr budete prahovat prahem a když to ten práv přeleze tak
prostě řeknete tady je
míčový slovo tady je taky klíčových
a zase jako když člověk dělá s takovouhle _e
tu aplikaci nebo zjistím keyboard pocením hraje
tak je potřeba
zohlednit jako různý volby takovéto má být rychlý jak to má být přesný tak je
docela důležitý si uvědomit jestli ta data budete prohánět s tím systémem jenom jednou
anebo jestli to bude nějaký archív typu _e typuju superlectures dot com
kde prostě ta řeč bude bydlet _e teďka jako budete mít dejme tomu desítky uživatelů
který to budou prohledávat furt dokola
a tak je docela důležitý si říct jak moc nám vadí nebo jak moc budu
potřebovat slova mimo slovník rozpoznávač
tak zvaných pouhý s
o V sou noční můrou každýho rozpoznávat celé řeči
a jsou to slova který prostě _e při učení neviděl může rozpoznávač takže
když budete
dělat _e
budete dělat třeba rozpoznávač _e tady _e pro přednášky na fitu
tak se tam prostě pokusíte nacpat _e nacpat všechny slova který se tady těch přednáškách
používají
ale pak tady _e otevřeme
kurz na
na co
na
kreativní
okres plování stropu pomocí
fraktálu
a najednou
budete mít _e ve slovníku
_e sádrokarton nás jo protože to budou lidí z se kterýma budete vyjednávat
a slovo sádrokarton _e sme při tvorbě toho systému nikde neviděli přitom proto na ten
předmět bude úplně zásadní prostoru prostě nepude dál
jo _e teďka jako otázka je _e jak moc často budete toho sádrokarton _e nehledáte
k bude jaký bude problém toho z toho _e z toho třeba nemáš
tak za chvilu potom popovídat no teďka _e jak _e jak k tomu kývl spotting
u přistupovat
vona takový tři techniky
jeden se menuje akustický pak prohledávání výstupu rozpoznávače s velkým slovníkem a pak prohledávání vstupu
rozpoznávače s velkým slovníkem které je trošku při ohnuty aby to právě takováhle slova dokázalo
chytat tak poďme teďka
_e nějaké detail k i _e s těmi musím technikám
u té akustiky je to _e řekněme relativně jednoduchý
protože
nějakých modelů fonémů
postavíte prostě
modely těch slov
který chcete
který chcete chytat
to znamená
pro přednášky bych
postavil model sádrokarton _e s
tyhlety model rychlost vám dávají ty dobrý věrohodnosti
pak je tam nějaký model pozadí který dává ty špatný věrohodnosti tady se nám to
celý odečítá a tady prostě toho systému lezou detekce
jo takže vlastně když ten systém chcete používat tak si teprve na základě zadané klíčových
slov postavíte modely těch slovíček který budete chtít použít
je to _e
bezvadný vtom že tady nemáte problém se slovy mimo slovník
jo protože sádrokartonová
super postavíte to prostě jako modelkou jednotlivých fonému můžete to klíčové slovo klidně chytat
ovšem je to za cenu _e za cenu jedné zásadní věci že pokud to slovo
sádrokarton vás použijete
tak ten systém můžete znovu
pustit na všema data má kde chcete vyhledávat
toto jako není problém pokud těch dat máte hodinu ale už to může být problém
vy máte deset tisíc hodin protože když se třeba dostanete na nějakou hodnotu nula celá
nula jedna krát výhod zájem tak deset tisíc hodin
rád nula celá nula na kabrioletem
máte pořád ještě sto hodin no a když byste měli sto serverů kdybyste to rozprskl
i tak je to ještě pořád hodina a takovej google kterým nějakou církvi říkám hodina
takže vám asi moc nelíbil
jo takže tady toto je toto je problém
druhý problém tady toho _e systému je že nemá sílu _e jazykového modelu prostě nikde
tomletom systému není _e není žádná _e žádná znalost toho jak se můžou následovat jednotlivý
slova to znamená pokud tam _e zadáte slovo typu sádrokarton _e s které dostatečně dlouhé
a jako
jasně ho slyšíte tady akusticky rozdílné moc všeho ostatního tak to bude docela fungovat
ale ne po nepokoušejte se takovým systémem _e
chytat slova
jako třeba já _m
nebo po
nebo něco takovýho pokutová prostě jednu slabiku
tak je to
téměř k nepoznání protože buďto někde nechytne a nebo naopak to chytne všude a máte
všude faleš nebo pro
jo takže
ne nepřítomnost jazykového modelu
je docela problém
tak druhý přístup je _e prohledávání výstupu rozpoznávače
velkým slovníkem
_e teďka zapomeňte tady na ten krásný obrázek
ale dá se to _e udělat tak že prostě uděláte rozpoznávání
do textu to znamená někde wavka aby to přepíšete na dnes jsem přišel a potom
když hledáte klíčové slovo přišel tak uděláte prostě vobyčejné graph a na ty matek tam
a
a buďto najdete nebo to nenajdete jo
todleto je možnost jedna možnost další je _e trochu se zamyslet a říci že ten
rozpoznávač taky nemusel být úplně přesnej a že si třeba mohl _e mohl myslet
že tam je
ne sem
přišel
nebo taky došel
nebo taky našel
nebo _e
nebo já nevím ještě si něco vymyslete
a tady tyhlety varianty o kterých si rozpoznávač může myslel že jsou správný dokážete dostat
_e s takové struktuře kterou my vlastně často necháváme rozpoznávač generovat a to je se
říká orientovaný graf nebo s vás
a nebo tomu taky říkám velatice rozes anglického lety
takže když jako se budete byly vnímali má pořád nám budou hodit nějaký mlati matice
hasičů roky
tak při čili case of each S a ale ti se sou tady tyhlety orientované
grafy na výstupu rozpoznávač jo takže pokud rozpoznávač necháte vypudit takovouhle strukturu
_e
tak _e C pokud na té nejlepší cestě je třeba dnes jsem přišel
a ten rozpoznávače tam se k nul protože _e ten člověk ve skutečnosti říká dnes
sem našel
a vy potom použito detektor klíčových slov kde budete _e hledat slovo našel
tak ho tam najdete protože prostě bylo někde jako druhá nebo třetí varianta ale stihla
tisísce uměli zavřeny mimochodem _e ten systém _m se pročesat com nebo přednášky do com
tedy ste možná viděli tak právě používá indexování tady těchhle těch _e těch druhých a
třetí se dalších variant
takže _e občas
když si tam dáte klíčové slovo to budete hledat
tak prostě sto místě kdo systém našeho nenajdete tom nejlepším přepisu jo ale přitom tam
slyšíte evidentně se tam ten rozpoznávač na té nejlepší cestě se knol ale bylo to
někde schované mlaty si na indexoval i sme to takže _e tohle slovíčko dohledat
tak _e
jak si myslíte že se tady ty matice dají reprezentovat
no zase konečný stavový automat
takže no protože
tam máte všude pravděpodobnosti které můžete používat nemusíte ale je docela dobrý je používat
ale ten konečný stavový automat prostě je docela fajn cesta na to je tady to
tuhle _e tohleto lety volati si reprezentovat
a pak se s tím dají dělat krásný operace jo jako že se třeba uděláte
jiný konečný stavový automat který bude obsahovat _m nějakou sadu prohledávaných slov
uděláte kompozici a přímo je najdete prostě jako tady se s tím dělat krásné věci
tak _e taky nějaký nevýhody samozřejmě té rozpoznávače limitována slovníkem který máte zadrátovaný to znamená
budeme mít problém slovy mimo slovní
a za druhé ten servis je sáry složitější a náročnější a pomalejší než jenom akustika
jo takže to že sou tam takový komponent jako výslovnostní slovník
a jazykový model samozřejmě bude znamenat že to bude že to bude přesnější ale že
se vám to bude titíž _e vyvíjet zvlášť pro jazyky kde nebudete mít _e dispozici
patřičný zdroj
tak a teďka _e nemáš naše děťátko
kterým se tady chlubím E
_e rozpoznávač _e visí S R který má ale eště nějakou půlslovní C
znamená to že je vlastně dáno dohromady rozpoznávací C která má sobě standardní slova
ale je tam ještě taková podsíť která když na rozpoznávač prostě úplně vedle a neví
_e který si standardní slov by to mohlo být tak mu umožňuje odskočit
do _e do nějaké po slovní sítě a to je poslední síti to dokáže přepsat
buď pomocí fonémů nebo pomocí nějakých takový několik jako kdyby slabik
jo to znamená že byste měli _e v tomhle případě
_e
když by ta věta byla _e strof mi zmršil sádrokarton a
výstup rozpoznávače ostrov
my
zmršil
a teďka to pouhý slovo by byl přepsaný ně něčím možná jako s R
rok
R
on a jo schválně to ne přepisuju pomocí _e solidních českých slabik protože ten systém
si to může na myslet tak jak _e tak jak jsou to hodí a tak
jak byl takže byla trénován
takže tendleten systém je dobrý vtom že když potom
takováhle obuví slova prohledávat se
tak máte šanci řekni _m dostanete
a mimochodem je to _e i na _e si dobrý na jednu další krásnou je
teplý byste viděli na kterou
je tady tomu systému říkáme hybris jo
_e teda tady jako
slovní síť a tady po slovní na to dobrýho si myslíte že ještě takový hybrid
je
tak
dobrej na to že
dokáže najít obuví slova
prostě
zkuste přinese další
představte si že máte
_e že máte standardní rozpoznávat
tady je věta strop mi zmršil sádrokarton a
a vy máte standardní rozpoznávač kterej tady tuhletu feature u _e ten _e tu po
slovní síť nemá co si myslíte že bude na jeho výstupu když tam vleze věta
strop mi zmršil sádrokarton
něco
co ten rozpoznávač si myslí že dobře
a co má ve slovníku jo to znamená pravděpodobně by tam bylo něco jakost osmi
zmršil
sám
tu káru
dáš nebo něco takovýho podobně
podobně inteligentního
jo tetě a vy samozřejmě nevíte že tady toto je špatně prostě to na výstupu
rozpoznávače on si myslí že to takhle je se jako jednu mann best
rozpoznávací cesta
toho _e toho tečka potom jako hrůzou zjistíte že tady toto byla chyba ale nemáte
vlastně to jak odhadnout přede
takže výhodou toho hybridního přistupuje
_e že vod mám vlastně dá nějaký vodítko k tomu že když se to přepne
do té do té po slovní sítě tak se děje něco divný ho jo budce
na vstupu objevilo auto vocabulary slovo
nebo je tam třeba soubor který bylo invoked byly ale ten člověk se v něm
zadrhnul
a neřeklo pořádně
nebo ho řekl nějakým pekelným dialektem na kterým ten náš rozpoznávač nebylo trénovaný takže kombinace
tady těch dvou sítí vám prostě jako dokáže
říct že něco bylo špatně
jako ramena takový jako ně poznat ně co bylo špatně měli celej vzorky evropské projekt
no vás vybírat
jestli vás třeba z něčeho
měli _e naši dva němečtí doktorandi výborní štefan com blinkal a mirko a nemám
tak ti právě jako
dělali a dělají pořád na těchdle technika
nejenom jak poznatku umí slova
ale jak co s nima potom dál jo
neznám jako pokud bate jednou hybridní rozpoznávač tak se tam otevírá velká rada možností co
dělat když na takovýdle slovo přijdete
jo můžete třeba zkusit ho přepsat zpátky do slov
když máme grapheme to phoneme
tak my můžeme natrénovat tady systém který pracuje naopak které je forintu trefím
to znamená _e takovouhle
sadu
jednotek potom narvete do převodníku a dokážete toho vysoce a zase zpátky slovo
nebo to dělal mirko úžasný ho
snažím se udělat _e takový konečný stavový automat
který by tohleto slovo srovnal se slovy který existují ve slovníku
jo to znamená
_e v tomhle případě by byl schopnej poznat
že tady nějaký sádrokarton který třeba měl ve slovníku
a že tady přípona a která je tam jenom protože se mění nějak morfologie
slova nebo _e jako čím se taky bavil
tak _e bylo shlukování nebo klastrování tady těhletěch slovíček měl třeba nějakou _e jak u
přednášku houbách
různé proháněli standardním slovníkem
a tam bylo prostě jakým mají síly jem
my celýho _m ani nevím pořád jak se to tak se to řekne a _e
vysloví anglicky
a to je tuším jako odborný výraz
pro houbu lesy té někdo
ste houba spektrum asi budete rozumět V
a vy _e kdy prostě máte rozpoznávač který normálně rozpoznává angličtinu nezná tady tohleto slovíčko
to znamená každou chvilku to vyprodukuje něco jako
malej
i
vy
_e nebo něco takového a to se přednášce budete mít čtyrycet krát
jo a teďka jako je docela zajímavý úkolu říci
sekera jako
tady jsem severa dedikoval slova mimo slovník
není náhodou něco z nich jako důležitýho není to nějaký termín který se ste přednášce
mnohokrát opakuje
a právě tady ty klastr ovací algoritmy vám řeknou nebo tak jako tady bylo mají
síly je má pak se to ještě rozpoznalo jednou možná s nějakou fonetickou chřipkou a
pak ještě jednou a ještě jednou poďme tady tyhle slova dat do jednoho klastru
a prezentovat ji uživateli protože to bude asi něco důležitýho
mimochodem
sme na tohle měli nějaký
týden íčko
_e já doufám že ještě
a
no nic kdybyste chtěli tak _e máme _e máme někde demo který ta který tady
toto docela pěkný kozo
tak
no takže bysme byly Ú _e detekce klíčových slov
a pak tady mám nějakou věc organizacích a projekty toto nevím jestli je nevím jestli
je moc _e zajímavý tady tohle může nám může být zajímavý slajd pro vás
protože
jako někdy asi budete do práce neděláte dali bambus tady toto fakultu
tak jenom sme jako se tady snažili zase to byla taková komerčních Í prezentace
lístek o co je vlastně co kdo dělá
a když _e budete ve výzkumu že budete tady
když budete tady na fakultě třeba s námi
tak výstupem je vlastně součástí do jsou technické zprávy
musí se tady dělat C jako s reálnými dacia z running kódem ale ten kód
bych vám vobčas ani nepsal vidět jo protože jsou to jako nějaké bločky matlabu tu
s C plus
_e které se napsali buď dvě nebo vaši kolegové nebo někdo úplně jinde to potřebuje
teda rychle dohromady to znamená napíšete nějaké lepidlo vyšší nebo folku nebo perlu nebo třeba
zrovna přijde pod ruku
dostanete úžasné výsledky
je to nejpřesnější na světě ale zpracování hodiny řeči trvá den
a rozumí tomu rozumíte tomu jenom vy
jo to znamená jako že by toto někam předali nemůže to by to někdo dokázal
zopakovat
to je totální luze
no takže pak je další ste
a to je vývoj technologií že teda jako by to mělo dělat pokud možno to
samé
ale mělo by to být stabilní to znamená mělo by to chytat chyby
kód by měl být nějak verifikován o
mělo by se to testovat na úrovni a komponentu tak potom jako celých systému
kdybyste mít nějaký cíl životní cykly plánování
jo by to me
užívat _e ne uživatelská ale programátorská rozhraní
a taky třese prostě světe by se k tomu přes mladost nějaká dokument a
no a
pak se u produktu
kdy _e vám někdo _e zavolá prostě z nějakého call centra řekne že by tam
silně to detekovat
a zbytek se teda měli zamyslet co máte k dispozici jaké technologie jaké jsou požadavky
zákazníka jak se teda na šroubová dohromady
můžete taky si promyslet komerční model to znamená to co budete chtít peníze jestli budete
dělat nějaké se vzorové řešení do kterého vám budou posílat data většinou lidi nechtějí protože
data nechtějí dat vůbec ruky
no budete prodávali sence jak budete licence vo tak je to docela
to docela zajímavý a samozřejmě u toho potom bude _e sedět člověk kterým bude srdečně
jedno že ve městě nějaký skrytý markovův model ale on tam potřebuje do velké červená
zelené tlačítko na které bude klikat jo takže musíte _e
se
musíte se zaměřit i na to kdo to bude používat a jak to udělat tak
aby
tam sto
místo uživatel dostal to sou čekal
tak
jo tak _e takové závěrečné _e závěrečná věc
tohleto je když tady třeba děláme na nějakých výzkumných projektech tak jsem se snažil udělat
takové veselé schéma jak jsou tady ty projekty organizovány ve státech
my jako sme přepiš ním je tím že se vych asi dvou účastní moje
začíná to vždycky vlastně od uživatele který má problém
když jako _m je
třeba tou agenturou darpa kde hnedka první slovíčko je D sem tak sem si představíte
kdo ten uživatel je že jo nový se to tady vymalováno zeleně
tak _e potom prostě máte agenturu výzkumnou která podporuje takovéhle
projekty jak právo toho du uživatele dostane _e dostane nějaký požadavek
a ta _e agentura vypíše
zadání projektu americe tomu říkají proud oděn si _e jenom sme B A normálně jsou
volně dostupný dokáže to je najít na internetu
no a teďka prostě se dá dohromady _e několik česky tomu říká řešitel
hezky když někdo jako řekne že řeší nějaký grant tak města vyvrací blůzou na hlavě
protože
že to řešíte tak to znamená ta na konci vyřešíte jo jako
mám pocit že
rozpoznávání řeči
že by to byl takový řešitelná úloha ze strany akorát možná by se mohli jmenovat
posouvač i posouvače jedna
posouvat dvě a posouvače N které který se snaží prostě ty technologie lavinu někam posunout
ale nevyřeší
no a _e tím můžou být jednak samotní nebo dají dohromady nějaká konzorcia
a na každý takový projekty je _e je potřeba někdo kdo nasbírá data
a na těch datech se pak bude
něco zkoušet
a potom _e je musí být někdo kdo bude říkali si je to dobře nebo
jestli se špatně
takže ve státech mají mi to že vlastně zavedena evaluační instituce
občas lety bývá někdo jiný když se jedná se o nějaká citlivější data
no a tetě _e
co je docela důležitý
tak jsou tak zvaný kompetitivní evaluace to znamená řešitele
tady dohromady nějaký systémy
lysý nebo někdo jinej dá data a teďka když systémy na těch datech musí pustit
samozřejmě se dosáhne nějakých výsledku
a uši jenom to že ty lidi navzájem mezi sebou soutěží je docela velký _e
velký motor
který prostě každý motivuje abysme bity výsledky byly co nejlepší
no a občas na základě těch public kompetitivní k evaluaci taky někomu někoho vyškrtnou prostě
že by ho postřelili ale řeknu mu tak jako pane nebo paní na příští rok
prostě s váma nepočítáme jako s podporou a prostě mu zastaví peníze o to
no a tady tyhlety
etapy dvou dnů pořád dokola
takže jako by se ta technologie
na konci takovýhle projektu nebo
nebo _e problém uživatel mohl posunout a pokud možno uzeného problém vyřešit
a samozřejmě já se tady tyhle těchdle koleček projede pár
tak ten _e tak to nejlepší konzorcium nebo ten nejlepší řešitel prostě řekne jak se
to má dělat správně
a pak nastoupí zase se bavíme vo státech nějaký prověřeny integrátor
který dokáže jako pracovat tady s těmi _e s těmi zadanými plány a který vlastním
tu technology naprogramuje integruje a
die no neprůstřelného kufříku
tak
té dva všechno úvodu
takže teďka ne přestávka ale _e jenom mini oddech a pak si dáme
průjezd _e
ruje zpracování signálu
takže jsem
jo tady metoda
tak pojď poďme do toho bude to vlastně takový jako víc u C číslicového zpracování
signálu
to znamená to co ste viděli ve druháku pět esku _e nekomprimovanou formu
to je takový politický slice tady tohle jako pro číslicové zpracování signálu vám asi když
vás nebudu přesvědčovat tomu naplatil tak někde před dvaceti lety
jak to obvykle vypadá taky pro jeden rychle prostě analogový signál
_e
číslicový který prošel A D převodníkem potom se s ním číslicově něco děje a pak
ještě někdy se taky převede zpátky do analogu
a tady toto _e
toto bude probíhat jako jo
případě kódování řeči
a ne
případně třeba rozpoznávání jo protože když budeme dělat rozpoznávání tak vlastně přímo cucám jako digitální
informaci a najdete tady jako dali dneska tom T nezpracování a zase docela zajímavý že
když se třeba dělá syntéza
tam nebudete mít na začátku tady tenhleten blok tam vlastně blok zpracování a potom s
toho musíte dostat _e nějakou že
tak teďka _e začněme teda jako stroji nebo s popisem těch našich signálku
na začátku
nebylo slovo
ale _e byl tam signál se spojitým časem
definovaný sudého vod mínus nekonečna do nekonečna
nekonečné množství hodnot
a když budeme chtít takový signál reprezentovat s frekvenční oblasti
tak
fourierova transformace
prostě integrujeme od mínus nekonečna do nekonečna
ten signál čase krát E na mínus dvě pí F T do to
všimněte si prosím vás že tady Z herečku _e už zase přestává mít drát kruhové
frekvence kterými jsem vám vás oblažovala ve druháku
takže
dost často tady uvidíme
je F což bude v obyčejných K _e frekvence R C
a neska někde vedle vono mi napsaný dvě pí
abych to udělal kruhovou
ale pozor
za chvilku když se budeme bavit T číslicovými signály a to teďka bude hodně rychle
tak to F
ne schválně všem
že budou diskrétní signály
u spojitých
je to F v hertzích
čím bude F diskrétní
frekvence
povědět _e nebo v ničem
jo protože v těch diskrétních signálech budeme mít takzvanou normovanou frekvenci
teda vlastně vůbec nebude záviset na tom jako jak ten signál vypadal frekvenční původně
ale bude to jenom nějaké poměrné číslo které prostě půjde vod nuly pro nulu do
jedničky a ta jednička odpovídá vzorkovací frekvenci
a jako vo nějaký hercích se začneme bavit až teprv někdo řekne jaká ta vzorkovací
frekvence vůbec byla nebo má být jo
tak
teďka _e co takové fourierovy transformace vyleze
funkce X F říkáme jí spektrální funkce
je komplexní
je definována pro všechny frekvence zase vod mínus nekonečna do nekonečna má nějakej modulu nějakej
argument
a ty jako funkci frekvence dokážeme _e dokážeme vyplotnout
pokud máme na _e reálný signál tak vlastně stačí znát pominu tady toho spektra pro
kladný frekvence protože tam nějaká _e nějaká symetrie
a my vlastně víme že modul
pro záchranu frekvenci je ten samej pro koplo _e co pro snadnou frekvenci
argument
pro zápornou frekvenci
že bude schválně tohle si z nich zapamatuje
máme frekvence proti sobě
mám reálnej vobyčejný ski signál
tak jak je vztah mezi argumentová na mínus
něčem
a plus něčem
tak ty argumenty jsou tam zápor opačný jo takže tady jedno velký mínus
a kdybyste tady tohle chtěli napsat s dohromady
tak byste udělali
když má něco stejnou absolutní hodnotu opačný argument
dvě komplexní čísla
tak jsou komplexně sdružená a že sto takovou pěknou hvězdičkou takže bysme mohli napsat že
X mínus _e
se rovná X
jedničkou F
komplexní sdružení znamená že _e modul nechám na pokoji
argument nám opačně
tak
takže todleto bla
v rychlosti mezku blesku fourierova transformace no vida
to je tady to dokonce máme tech _e co to je fourierově transformaci dodat
inteligentní signály
mají
frekvenčně omezené spektrum to znamená mají tu fourierovu transformaci koncentrovaná koncentrovanou vodce nějaké mínus mezní
frekvence do plus mezní frekvence X N
do
do frekvence jo
_e klasicky když tady tohle bude třeba telefonní signál
tak ta F mám bude nějakých running tři tisíce šest set
_e herců
když budete _e nic chcete kvalitu tak to bude vokolo dvaceti kilo hertzů
a tak dále té první věc
pokud _e
ty signály nebudou mít omezené spektrum
tak ho buď omezím natvrdo nějakým filtrem
a nebo řeknu _hm
a nechám to tak
a _e pak se mi to může trošku vymstít
když budeme vzorkovat protože dojde k čemu
aliasingu jo tomu k překrytí jednotlivých _e spekter tam se to dostane
tak a eště taková _e vtipná poznámka o fourierově transformaci ta spektrální funkce semene nedá
přesně spočítat jo protože máme tady vlastně nekonečna jednak čase jinak ve frekvenci
máme tady prostě nekonečný moc časových bodu takže můžete to zkusit pro nějaký signál typu
obdélníkový impuls
když mučení C se S ale pro cokoliv reálného prostě to vobyčejná fourierova transformace ne
nejde
tak _e tetě jak je to s tím vzorkováním _e
možná jí kvantováním když myslím že kvantování tady nemám
_e když budeme vzorkovat
tak vlastně na stuff přichází ten
analogový ten černý signál
ten vzorkovač musí mít k dispozici
nějaký periodický signál který má _e mezi jednotlivými má impulz zama
vzorkovací periodu
_e ten výsledný navzorkovaný signál je _e vlastně tady
tenhle červený krát ten původní černý
a když si uvědomíte co se děje tak vlastně ten černý určuje výšky těch jednotlivých
nových tím políčku a toto je náš
navzorkovaný signál
tak a teďka by se dalo vlastně vypočítat
nebo nějak uchopit _e co se děje se spektrem takového signálu když se navzorkuje
tak zase _e sme se bavili _e s tím že se ten
že se ten signál
řekne že jo ne úplně ideální že to tam impulzy které jsou nekonečně krátký a
nekonečně vysoké toto vlastně diracových pulzy
a potom _e když se tady tohle provede tak ten navzorkovaný signál je sled
takových vlastně na váhovaných
diracových impulsů
když si člověk udělá trošku _e trošku nějaké počítání
tak _e zjistí že _e spektrum toho výsledného navzorkovaného signálu
je vlastně spektrum toho původního
je to i X
ale které je nekonečně krát rozkopírovat ne na té frekvenční ose jo takže kdybyste _e
kdybyste tady tenhleten
člen mazali
tak je to prostě pořád to původní
to původní spektrum
ale když doteďka worm až N
a vezmeme v úvahu všechna ta _e všechna možná směnka
tak tady prostě mám
další kopii a tady mám další kopii a tady mám další kopii přístupy
a tak dále a tak dál
no a teď tě _e když budeme
vzorkovat
tak samozřejmě záleží na tom jak bliká bude ta vzorkovací frekvence
a jestli se přitom vzorkování tady ty jednotlivé kopie pře kryjou a nebo se ne
překryvu
si uvědomíme jak to tady s tím bude chodit tak toto je maximální frekvence signálu
F mám
tady tohleto je polovina vzorkovací frekvence
F S
lomeno dvěma
takže dělám celkem jasně že když ta polovina vzorkovací frekvence bude prostě naftou maximální frekvencí
tak to bude v pohodě protože ty jednotlivý kopie se překrývat nebudou
a když _e se netrefíme
tak se prostě ty jednotlivý
opět takhle
pěkně při kryjou
ale
prosím uvědomte si že _e
to není tak že by jako byl takový pěkný obrázek doby ty jednotlivé kopie byly
vidět aby tam ty malované červenou tužkou
ony se prostě jako pře kryjou a sečtou samozřejmě jo takže
že výsledkem je
něco
něco takového
L ještě horšího
jo stromy tato se to z hlavy si neumim moc dobře sčítat
prostě najednou dostanete spektrum
který se _e trochu podobá tomu původnímu ale není přesně ekvivalentní a nedokážete z něho
to původní spektrum získat a
no tohleto nám říká ten slavný šenonův kotelnikovův nyquistův nebo vzorkovací teorém vyberte se podle
preferované národnosti a nebo můžete zůstat politicky korektní
a tohle je ilustrace co se teda bude dít když _e nebude aliasingu
kde ty jednotlivý kopie dokážu krásně oddělit
to znamená pak když si rekonstruovat
a vy kousnou takhle jednu kopii _e toho signálu
pomoci
jaké dolní propusti tak prostě dostanu úplně krásně a přesně to původní spektrum
no a takhle to dopadne když _e
když bude aliasingu
když se vám ty jednotlivé kopie ve spektru
_e překryjí a sečtou
a pak vidíte že tím
rekonstrukční filtrem dostanete nějakou machu která
L a není podobná
_m původnímu spektru
takže teďka máte jako _e za úkol vymyslet co s tím protože tady s tím
výsledkem jako asi nebudete spokojeni
možnost číslo jedna je zvýšit vzorkovací frekvenci že jo
nedávat i nedávat i sem ale posunout i třeba sem
to byste museli případě telefonu třeba jako přemluvit
motoru a noky a siemens _e a
asi tak jako několik miliard lidí na téhle planetě aby zavodili své mobil jakub lysý
nejsou satanisti podaří
a když se vám to nepodaří tak musíte přijít nějakým technologicky špinavější _m ale fungujícím
řešením
a to se menuje antialiasingový filtr že jo
takže tato formule takže máte tady původní spektrum
spektrum před prací té
takže
z něj uřeže té všechny komponenty
které sou výše
dneš plus nezdřímneš plus polovina vzorkovací frekvence avní ženeš
dneš mínus polovina vzorkovací frekvence
když tady to před prase ne spektrum potom _e
_e se vám periodizuje
tak to už zjistíte že se ty jednotlivé jeho kopie nepřekrývají ale že jsou těsně
vedle sebe
a pokud potom uděláte takového _e před prase ne _e o a zperiodizované ho spektra
rekonstrukci to znamená rychle si vyberete
jeden jeho kousek
rekonstrukční dolní propusti jo zbytek zabijete
tak _e dostanete zase zpátky to původní před prase ne spektrum to znamená
je zcela jasný že ste přišli o vyšší frekvence
protože se uřezali
ale aspoň něco co bylo těch nižší
tak je původní
a _e není to zkreslen o
jako v případě minulém by se nám vlastně do toho překlopil i ty vyšší frekvenční
složky a začali se vám tady _e souviselo není
jo mimochodem dybyste todle někdo chtěl zkusit
tak _e si vemte
třeba do matlabu nebudu céčka
_e
nějaký hodně vysoký zvuk třeba senátorovi činely já bitu
co ste si udělat _e podvzorkování
nedělejte žádný antialiasingový filtrování jenom prostě vyberte každý druhý vzorek
a pak se to přehrejte zjistíte že jako
tím zvukem činelů se
tady poměrně zajímavé věci no to vlastně překlopil
_e do nižší frekvencí a na místo činu se vám tam budou vývod nějaké změní
tak
tohle sou je teda poznámky o vzorkování a teďka poďme _e zápisu
vzorkovaného signálu
takže když to vzorkování jenom uděláme
tak vlastně _e dostáváme
_e dostáváme velikosti toho původního signálu nějakých časových bodech
vy časové body jsou určeny jako násobek _e vzorkovací periody
a vidíme že tady v tomhletom zápisu vtom X S N T se nám tam
jako pořád ještě nějak objevuje čas
pořád asi bude tam vzorkovací perioda
se na ni můžeme
klidem vykašlat
a říci že ten vzorkovali je že ten diskrétní signál že to vlastně bude jenom
vobyčejná posloupnost čísel
jo tady toto je strašně důležité protože kdyby tam pořád ta informace _e o čase
musela zůstat
tak bych to měl něco jako
vektor
časovou informací a my to nechceme jsem prostě jenom sekvence čísel
a _e tu dostaneme poměrně jednoduše takže prostě řeknem já si vezmu jenom tady tyhlety
velikosti a všechno ostatní zapomínám a dostávám se potom k _e takzvanému diskrétnímu času
koše hrozně
_e jako hrozně vědecký pojem
ale zase je to není nic jinýho než obyčejný počítadlo
diskrétní časy prostě počítadlo
vzorku podle toho jakým píšete programovacím jazyku nemůže začínat na nule nebo na jedničce
ale
prostě není to nic jinýho usneš než ukazatel já vám se vám jako schválně
nám to někde otevřený matlat
_e do něho načtený kus _e u zvuku
pěkný
_e mám tuším nějaký
jednoduše nějaký dvoukanálový zvuk
tak sis toho vyberu jenom jeden kanál
X bude
no
všechny rozmetadle
jeden sloupec
a to s jako
X je řada čísel
a když si takovýhle X potom zahrajete
kdybych já věděl na jaké vzorkovací frekvenci
si na C déčko
tak ten dvou dostanete v N jo a všimněte si že já jsem vlastně přitom
přidávání
musel dodat informaci vo tom opravdický _m čase na kterým jsou načasovaný jednotlivý vzorky a
to sem tam dodal takže sem té funkci hrající museli co bylo vzorkovací frekvenci protože
tady ta řada čísel prostě to iksko
to je jako
to je prostě vektor to
si dělá srandu
a tak takhle
takže to je _e prostě vektor sto šedesáti osmi tisíc šesti set osumdesáti tří hodnot
tečka
tak _e
fajn když metráků normovaný ho času
tak _e se nám to taky projeví takže potom a nebudeme mít _e
_e když přestal existovat čas
tak samozřejmě přestává existovat výsledek i frekvence v hertzích
a ta frekvence vektoru u diskrétních signálů budeme pracovat bude tak zvaná normovaná
a zase tu normovanou frekvenci
dostanu tak že tu opravdickou frekvencí podělím tou _e podělím vzorkovací
jo takže čas bude mít jednotku nic
obyčejný počítadlo a frekvence bude mít taky jednotku nic
protože to prostě nějaké číslo které teprve cache
sdělím vzorkovací frekvenci začne mít _e smysl R
a dejte si prosím vás pozor na to že když budeme
se dívat do nějaké literatury
takovou času to člověk pozná jo čas vobyčejný ski se značí pomocí tečka a ten
diskrétní pomocí zenka
ale u frekvence to poznat není tam prostě jako se používá F a je to
pořád stejný takže _e poznáte to tak že když tam bude pak třeba zapsaná nějaká
frekvenční transformace
tak pokud _e
tam uvidíte třeba _e na
_e na mínus J dvě pí
S T
tak tady to S asi bude to vobyčejný scheme hercích protože vedle stojí čas sekunda
ale když vidíme třeba _e na mínus je
_e
dvě pí S N
tak si buďte jisti
že tadyta frekvence bude zřejmě normovaná
protože vedle není prostě žádnej _e žádnej čas v sekundách letem počítadlo vzorků
_e
říkal jsem vám
cože ráda funkce komplexní exponenciála
unk se komplexní exponenciále velmi mlsná
že _e pouze vůli radiánech jo stejně jako kosinus nemusí news
to jsou funkce který musíte nakrmit úhlem
a úplně stejně tak _e potřebujete nakrmit komplexní exponenciálu úhle
jo takže jenom _e jako takových quick czech
když máte _e takovouhle
takovouhle funkci
tak _e časy je sekunda
frekvence je jedna lomeno sekunda
to dvě pí je v radiánech
to tam vlastně zavání ten úhel
a sekundy se nám navzájem vyruší a vy tu funkci naplň nakrmíte radián a málo
nespokojená
tady vlastně _e si dejte pozor
protože
pokud _e
rozměr toho N je nic
taky rozměr toho S musí být taky nic
aby vám to zase vycházeli radiány protože jinak to ta funkce E na mínus je
nebude hrát
tak _e toho byl zápis tak tady mám nějaký příkládek
napište funkci pro generování kosinusovky na dvou stech hercích
pro vzorkovací kmitočet _e osum tisíc
můžete si udělat nějaký jako
drobný odvození ale zjistíte že _e že vlastně
normovaná frekvence
bude
dvě sta
lomeno
osum tisíc a pokud prostě pak budete dělat C diskrétní kosinusovku
taky vyrobíte tak
že uděláte kosinus dvě pí krát právě ta
normovaná frekvence záznam schválně nebude dělat žádnou speciální značku
abyste si _e testu trochu procvičili
tak tam bude číslo vzorku
a _e
tím tímto bude
no to bude dáno jo poďme si zase
matlab ukázat něco takovýho budete chtít _e budete chtít vyrobit
_e
F bude
_e se bude
čtyrycet lomeno osum tisíc normovaná frekvence schválně kolik to je nula celá nula pět
pak budeme mít se budeme chtít nějaký rozsah vzorku
tak dejme tomu že půjdu vod nuly a teďka když budu chtít vygenerovat vteřinu takové
kosinusovky tak kolik amanda
jako a ty frekvence osum ti
vteřinu
tak polovinami může říct že osum tisíc druhá polovina že sedum tisíc devades devět set
devadesát devět
je to jedno
já to zkusím D tímhle
a pak si ten signálek pohodě vygenerujete jako dva krát T
krát
F krát no
baum
můžeme si ho dokonce ukázat že jo
bude hrozně krásný
až ten obrázek najdu
no to je vono tak vidno dostali tak tam asi bude kosinusovka
a co víc může si ho zahrát
jo takže když zahrneme to
a
co se udělá špatně
_e no _e který infra
zvuk život navozuje deprese
tak pokud bysme teda se začneme k vyvolání proběhly _m
prostor nenene _e teďka vážně pročte neslyšeli _e kosinusovku na frekvenci
osum tisíc
protože ta funkce samce se má nějaký defaults na vzorkovací frekvenci o kterým vůbec nevím
jaký takže já sem tam nedal vzorkovací frekvenci neřekl jsem nějaké vzorky jsou časovaný takže
vona použila nějaký defaults a _e ten vůbec nevím kde takže pod mi zkusit říct
co to teda mělo být
_e
tak
se špatně
no
já už vím co jsem udělal já sem vám opravdu nebo čtyrycet hertzů a ne
čtyřista herců že
tak se omlouvám ten infrazvuk jako
je skutečně byl
test tak jo
_e
čtyry sta hertzů
kdybyste chtěli čtyry sta čtyrycet _e tady má funkční sluch
áčko nosných _e že
_e vona
se mně doma ozývá přes _e tak _e fajn takže vidíme na jednoduchým příkládku že
není potřeba se bát _e normovaných frekvencí jedna se dá přepočítat na druhou jo pokud
bychom chtěli samozřejmě tenleten normované frekvence
vypočítat tu v opravdickou tak prostě o od normu ju
vynásobím to vzorkovací frekvencí a máma _e mám za tu správnou hodnotu
tak
_e poďme teďka se podívat na to když máme diskrétní signál
jak ho frekvenčně _e analyzovat
jaksi spočítat jeho spektrum
tak _e bude to pomocí diskrétní fourierovy transformace
no i D F téčka
a my si musíme uvědomit jednu věc _e
zaprvé
signál musí být
navzorkovaný nebo diskrétní soustruž teda je
za druhé nebudeme rozhodně schopni počítat prostě nějakou teoretickou haluzi od mínus nekonečna do plus
nekonečna nepůjde budeme muset vždycky ten signál vyslechnout nějakým oknem který bude mít N vzorků
to nám bude mít nějakou rozumnou hodnotu třeba dvě stě padesát šest nebo tisíc zase
čtyři
a s toho budeme počítat _e frekvenční transformaci
takže to bude vstup
text _e to proženeme tady tímhletím krásným
_e
tímhle tím krásným vzorečkem
a na výstupu dostanu zase N hodnot
a teď musím strávit chvilku času N na s tím co my vlastně výstup té
diskrétní fourierovy transformace dál
listu mi dáva
N hodnot
rozmezí vod nuly
a když
do skoro jedničky
ve normovaných frekvencích
podnebí přesnější ještě
tady prostě je spousta hodnot
tady hodnota nula jedna dvě a tak dál a tak dále a cache
hodnota N mínus jedna
a to je konec
jo kdybych chtěl diskrétní fourierovu transformaci
na normované frekvenci jedna
tak potřebuju _e tak už zase musím vzít hodnotu
nutilo vzorku protože to may nějaká periodicita
to znamená počítá se nám to všecko _e všecko dokola
poďme _e poďme si říct _e
jak by to bylo třeba to že naši kosinusovku jo vezmem kus kosinusovky
a zkusíme zní udělat _e fourierovu transformaci
a to si potom si potom zkusíme zobrazit
jo takže mám tady kousíček
kosinusovky
že nekousej kosinusovky má
no
ten kousek kosinusovky bude mít _e
osum tisíc vzorku a řeknu sem tisíce moc co si vybrat dvě stě padesát šest
a z toho budu počítat _e fourierovu transformaci tak si udělám nějaký třeba přes X
který bude X vo T jedničky do byste padesátky šestky
velikost že dobra
pro ženu _e fourierovu transformaci
což je v matlabu
hodnota fronta schválně nebo nakonec zaostření
abyste se podívali se nám to hází _e za hodnoty to vlastně dvě stě padesát
šest hodnot
a ty hodnoty jsou _e ty hodnoty jsou komplexní
jo takže první věc která vás může napadnout je něco takovýho máte spočítány je plot
výkřik
to bude hrozně pěkný vypadá to takhle
jo to prostě japonské tyčky najezení rýže
ale jako asi _e asi
si ne to co jsme chtěli
takže druhy
pokus bude
jistě no tak jsou to komplexní čísla vy bych to mohl zkusit nastat nějakou možná
nějakou jako
osu X rozumnou
tak tu osu X zkusím udělat od nuly do dvě stě padesáti pěti když to
budeme si presaři vzorku
a
najednou dostanu něco takového
už vypadá možná trochu V
a vidíte že vlastně mi to vypsal volný
že se zobrazují pouze reálné části _e toho nás počítaného spektra
_e bych to teda
možná chtěl trochu jinak já bych chtěl ty obrázky nejlépe dva
jeden nebudou moduly
a druhý kde budou
argumenty
jo tak poďme si udělat takové matlabové cvičení
kde _e prvním obrázku
vyplo tneme
moduly díky
bude absolutní hodnota
asi nepude že jo
no tak dvěstě padesát pět
a
to je ve druhém obrázku
bude
jsou argumenty
no tak
pět
_e
no
není byl
_e
jo takže push dostávám něco
N kolmá zřejmě nějaký význam
vidíme že na frekvenční ose
dostávám dvě špičky jedna by asi odpovídáte frekvenci čtyry sta herců že jo
druhá a bude vzor to vodící frekvence mínus čtyry sta hertzů
to znamená někde _e někde na konci
a co se týče to _e toho úhlu nebo
_e té fáze
tak _e
a to se radši ani na to sražením nedívejte
tak teď tě co se mi na těch obrázcích
ne pozdává co je tam špatně
proč _e
se na takovédle obrázky nebudu chtít koukat
měli by se měl osa X
osady se ve vzorcích
a nejsou tam žádný pořádný frekvence prostě jako nedokážu interpretovat co znamenají tady tyhlety
_e to znamenající čísílka na iksové ose
takže my máme dvě možnosti
buď si udělat osu _e normovaných frekvencí
anebo si udělat osu opravdický frekvencí
pokud známe vzorkovací frekvenci jo tak poďme si ukázat voboje voba dva případy
_e když _e osa normovaných frekvencí
tak _e
asi musím vyrobit něco seš co bude nula a skoro jednička a budete mít dvěstě
padesát šest bodů
jo takže poďme zkusit _e něco jako nula až dvěstě padesát pět
radši takhle
děleno mysli padesáti šesti
hold
a pak když to
když to před plotnu
s osou
těch normovaných frekvencí
evuš se mi to bude trošku víc líbit protože tam budou prostě hodnoty bod nula
do jedničky jo takže normované frekvence
na iksové ose
jo že ty normované frekvence jako ještě pořád
nedokážu jako licky
pochopit
tak _e je poďme od normovat milník udělat opravdický frekvence
kromě poradce jak mám udělat osum opravdický frekvencí když vím že vzorkovací frekvence osum tisíc
R
já se bit že jo není tam žádná
žádná vydal to znamená tady
eště přidám násobení osmi tisíci jim osmi tisíci
a o
a už sem tam kde sem chtěl být a dokonce když si to tady jako
někde na sumujeme
tak možná přijdeme na to že ten vrcholek je opravdu okolo _e okolo čtyry sta
_e čtyryceti hertz
mimochodem kde je
kde opravdu
jak je frekvenční rozlišení takové diskrétní
fourierovy transformace
po kolika
hercích tom budu mít jednotlivý díleček
vzorečky
to vůbec není těžký spočítat
protože
prostě mám osu od nuly do vzorkovací frekvence
a na té ose mám N vzorků
jo to znamená to rozlišení prostě vobyčejný ski dělení
osum tisíc děleno dvě stě padesáti šesti znamenal ještě ožer frekvenční rozlišení
to jarek téhle fourierovy transformace třicet jedna herců cokoli bude blíž nejš třicet jedna herců
tak nebudu schopny _e nebudu schopnej rozlišit
jo
tak _e
dyž se vrátím tady k tomu obrázku
tak _e
co je tam se tam takovýho divný ho jako co vás možná
co se co se nám může nelíbit
sme udělali čistou kosinusovku jo
kosinus nějaká _m nějaká frekvence
a jaký spektrum by měla mít takovádle kosinusovka
jeden impulz jedna čára a jinak všude nula
to že tam ta druhá čára to berem jo protože to je vlastně _e dám
z ohledně to že
kosinusovka
když u vzali zem fourierovou transformací tak musí mít nějakou kladnou ale I zápornou frekvenci
takže dobrý ale to že ta čára taková rozplynula
to se nám nelíbí
kdo ví pro činnosti nula
co se stalo
tak _e možná že
by teďka kilo se podívat
co sme to vlastně analyzovali na signál jo
poďme se kouknout co sme vlastně poslali do fourierovy transformace
_e
tady sme tam todle
kosinusovka si
no tady zotavení
tak richmond vidět
já sem vám chtěl říct
jak je ta jak je ta kosinusovka u řezána
ale ze že teda vopravdu no nepovedlo
protože jsem se trefím téměř opravdu oříznutí
přesně na jedné
změna jedné periodě
sme to co sme to ještě trochu jinak
já si udělám signál a _e který bude
_e který bude
dejme tomu čtyři sta třicet pět herců
přemýšlím S to vyjde
no
pískově vygenerujeme znova
tisíc si vyberu
tak no a teďka je úplně jasně vidět že _e nám prostě ste kosinusovce něco
chybí
že
při frekvenční analýze bude
bude řízla
a _e pojmy s frekvenční analýzu teda udělat to znamená X bude s F téčko
tady tohle umíme
_e mám pocit že sem si vtipně přepsal
_e frekvenci
_e
všimněte si hodnoty obrázek
tak
no ze
aha
obrázek je tady ho mám pocit že se může sme dostali trošku _e trošku širší
dneš
když minulý _e zkuste měří ste myslíte že by _e to šlo udělat tak abych
se do té
abych dostal úplně přesný výsledek to znamená vyčíslí čáry
tak kdybych do toho analyzed o analyzační okna vecpal úplně přesnej počet period té kosinusovky
to by se mohlo po vezdil zkusme
zkusme si udělat protipříklad
_e kdy bude
kdy bude
ta frekvence
čtyři sta
čtyři sta lano osum set by mělo dat _e nějaký pěkný číslo
a
o
ho
tak to je docela zajímavý výsledek
jo já musím co sem udělala jsem si zase přepsal tu frekvenci to
možná že
von _e jako frekvence normovaná se podkapitolu a
zbabělci si definuji
proměnné které mají rozumné názvy
tak _e
dávám teda protože jsem se netrefil vůbec takto račice se mu zkoušet
_e
tak teda tak je možné že jsem se netrefil vůbec
vzali jsem neměl na frekvenci čtyry sta herců ale spíš něco
to _e
ne prosím vás _e
před představám tady do tohodle rýpat protože my musel vyrobit něco co nám na osmi
tisících vzorcích udělá celistvý počet
_e
_e co bude mít takovou periodu aby její celočíselný násobek se dokázal
celým číslem na to do dvě stě padesáti šesti o to třeba co
takže nám se
počítač na tady nepříjemný kilo hertz
poslední pokus prosím vás jo
F bude jeden kilo R
říkali domluvit
jo
jo takže dostáváme teďka jako přesný _e přesný čáry
no
tam kde sem očekával _e a nuly jinde
tak _e
tetě mě zkuste říct když metra měli _e ten _e ten případ
že sme měli tu kosinusovku odřízl O někde při nedokončené periodě co se teda vlastně
stalo při počítání spektra
čemu tam došlo
tak tady mám trochu napovím _e když vlastně mám nějaký signál který má nějaký spektrum
a pak toho signálu vyberu kurz pravoúhlým oknem
tak vlastně dělám násobení dvou signálů jo toho původního
a toho okna
jo za vám to tady zkusím možná sem tady někde mám i
_e i napsané ale tady to namaluju
si mám nějaký signál
tetě pro výpočet de este
o potřebuju omezit na nějakou délku
a to omezení provádím takže vlastně vezmu okno který má tady nuly tady má jedničky
tady mám zase nuly
a tím oknem kus toho signálu vyber
jo
a tady tohleto potom vlastně pouštím do
_e diskrétní fourierovy transformace
tech _e když v čase
budu
násobit nějaké dva signály
co se stane vím aspekt jejich spektra má
jo tady je násobení toho červenýho signálu
S modrým vybírat si mokne
mě by zajímalo
co se stane zich spektry protože i to pravoúhlý okno má nějaký spektrum jo
tak zase napovím když nějaký signály vynásobím
tak jejich spektra se
spolu jo je tam prostě ta _e ta nepěkná _e je pěkná
operace konvoluce tak a teďka rvát ještě budu výpad snímků dál jaký je spektrum takovýho
hle pravoúhlý okna
_e nekonečný jo ale vypadal tyto se tam úplně přesně
obdelníkový
impulz
dostatečně jsem se vás tady s tímto impulzem natrápil C F S ku
draku sme
kardinální sínus že jo tak takovýhle nějaký _e spektrum takže my bychom vlastně měli vidět
_e z _e oblasti spektra
konvoluci
opravdický ho spektra kosinusovky to čtou prostě takovýhle dvě čáry
a
_e nějakýho spektra který vypadá takhle
a to je ten obdelníkový impuls
pamatujete si jak vypadá konvoluce
když jeden z těch signálu je takový pěkný čárový
jsou tam jenom dvě čáry
že jeden ze signálu čárový
nebo jeden z těch vstupů tak ta konvoluce hrozně příjemná protože funguje jako kopírka
jo to znamená tam kde sou ty čáry tak vokopíruju ten druhej signál takže moje
spektrum
by mělo vypadat
já takhle prostě okopírovány na jednu stranu a okopírovány
na druhou stranu
tak a teďka je taková jako lipova otázka
jak to že tady tohleto spektrum nevidíme
vtom
_e spektru
toho našeho vzorkovaným signál protože tam prostě jako nejsou vidět ty
postranní _m lalůčky
kde sou slovany
tak zase odpovědět _e že mi ho nevidíme
protože vlastně _e tyhle ty body
se nám trefu jo u
přesně do násobků
té základní toho základního frekvenčního rozlišení který nám _e poskytuje naše D F téčko dokonce
si můžete udělat jako drobný odvození je to asi nebudou řádcích
ale tady vlastně ty body na frekvenční ose
mají vzdálenosti
_e nebo ty jsou daný jakou k a
jedna lomeno N krát
vzorkovací frekvence
a
_e prostě minima toho
kardinálního synu nám padají přesně tady v těchdle bodu
to že to tak _e tak jestli vám dovolím
demonstrovat na jednom příkladu
kdy vlastně jak uměle zvýším _e frekvenční rozlišení toho _e toho D tečka a najednou
tam na nás začnou ty _e začnou ty _e funkce sinus kardiální skákat tak mě
projektech mám zvýšit frekvenční rozlišení D tečka
potřebuju přidat při kotli počet bodů na frekvenční ose
dělat velkou flintou trase které se říká doplňování nul nebo zero P ding znamená vezmu
pořád ten samý signál to mám k dispozici
ale prodlouží vo nula má na nějakou délku
a s toho potom _e spočítáme fourierovu transformaci tak poďme na to
dáme X zrovna _e
nebude to žádná čuměla na ale _e
ale X _e ten prodlouží nulám a
a budeme počítat třeba s tisíci dvaceti čtyřma vzorkama
takže tam bude jedna a tisíc dvacet čtyři mínus dvě stě padesát šest
op
jo vidíte že na začátku _e vektoru mi to nacpalo moje čísla potom na potom
samý nuly
_e
X bude jeho fourierova
transformace
budu muset předělat C normovanou frekvenci protože už nebude mít ta frekvenční osa dvě stě
padesát šest bodu ale budeš mít tisíc dvacet čtyři
takže třeba von ona
bude nula až tisíc dvacet tři _e lomeno
jestli zase čtyři krát osum tisíc
a
jsem měl by se to dalo vyplotit takže tady bude von a na
_e
princip si
S N
jaksi _m X
jej
tak se špatně
v los
_e
tak _e tady to je sem vám něco po vrtat
jak protože má
že má velikost
musím říct že jo
prosím
ježišmarja děkuju jasně _e
takže
opravujeme takhle že jo
jo děkuju
dobrý
ho
a
S oplození mohl no fungovat
no vida takže najednou na začínají vyskakovat ty postranním lalůčky
_e karmy nární _e toho kardinálního stínu
který předtím nebyly vidět jo protože _e když se měl to základní frekvenční rozlišení tak
jsem měl vzorky jenom tady A
a tak dále
a tak dál jo
takže _e _m končíme ale jenom prosím vás i v uvědomte vlastně co tou diskrétní
fourierovou transformací vlastně počítáme
vypočítáme spektrum vzorkovaného signálu takže dostaneme frekvenci něco periodického
signál neříkal oknem
to znamená že ve spektru dostáváme
vlastně jeho konvoluci
se spektrem obdelníkový o impulzu
a teďka ještě pozor to spektrum který jsme spočítali N je diskrétní má prostě konečný
počet hodnot
to znamená že když byste to dotáhli do jako uplně do extrému tak vlastně jsme
spočítali spektrum
čase periodický o signálu kde ta perioda prostě byl mnohokrát za sebou a tohle jenom
taková opakovací tabulka uvědomte si prosím vás
to sou ty komplementární operace včas a ve spektru viset čase vzorkuje tak si ve
frekvenci periodizuje
když se čase periodizuje tak se ve frekvenci vzorkuje akorát domu neříká vzorkování ale diskretizace
jo
tak
toto prosím pro dnešek že
_e prakticky už sme to udělali tak prostě budem asi trošku filtrovat
jinak prosím vás laboratoře má se zápisem na labiny všechno v pohodě nedostal jsem žádné
žádné útočné maily tento která se předpokládá že se vám registrace zadařilo
several
ano tento týden laboratoře jsou
eště se si pořádně sem ui
tím L
a tento týden je
podle kalendáře takže mám pocit že lichý ne
a strašně podívejte se nebo má