takže můžeme začít
tak já vás tady vítám emisi dorost a
vám tady s kolegama řekneme něco o tom jak se důl informace z řeči a co ani google neumí
tak
kolik dva milouš na nějaké velké konferenci něco jak třeba tady parkem webexpo podobně
hezky paralelní sekce teď to tam vaří všechno i nevíte kam máte i dřív
dobrý dobrý spousta lidí
tak takový na to by tomuto
když se podíváte nahoru tam
tady máme kamerky
takže nahráváme to a
bude to všechno potom co jsem přístupný někde na internetu takže se můžete dívat
nicméně to je celkem běžný to asi znáte
tak jiného soudku
do z vás má
takovou zkušenost
přednášek tříhodinových
dlouhých
první přednáška druhá přednáška tak tam byly toto přestanete chodit
patří do vánoce tak si dáte kapříka řekněte na paštice
copak přijde
zkouškový
protože se učit a terči
dohánět je všechno co ste
co se minuli
no
a
někteří studenti naši fakulty tím že se tady nahráli přednášky
tak zasednou k internetu
zrovna web server a sme video server
začalo to hat takže motorovou pilou na železo řeknete tu funkci na S přesně podle imaginární osy rozhraní takhle zvuku
podíváte
jo a koukají a určí se prostě a rychle rychle rychle rychle vstřebávají všechno co jako neviděli během semestru
a zjistí že teďka jít a já se osumnáct hodin usmáli na zkoušku a musím ještě zvednou třicet dodíval
jsou obraz tak
takže zrychlení
řeknu _m do inte u unk na S minimální si ukážeme pokud máte nepřímo a je omega nordistovými tam kde
runge nabídnout _e jméno
no a jak si myslíte že to dopadne
není smál
takže
tudy cesta nevede
když potřebujete něco najít ve hromadě nějaký textový dokumentu
cože podstatě celej internet co uděláte
zavolat esíčka hugo
strýčku tričku co je to fourierova transformace _e zrovna transformace přijde dřevěné tyče ukázat deset milisekund a máte padesát milionů
se
jo pohoda
jenže teče uklouzl vydá lidí jo ste si problém
A jo prostě video se můžete
můžete koukám na celý ale prostě v tomhle zatím
špatná zpráva
nenastala
sme tady mi
místo umíme
takže
představte že máte takovou přijmout ranečku máte nabídek o tak jako na jo tu můžete si oka na přednášku
máte u toho slajdíky takže vidíte
hezky pěkně čitelně to co je na tom výdejku tam vidět
máte to synchronizovaný držíš máte poznámka na třicátým padding slajdu _e načtete přednášce přednášky si mluví o tom že to
bude na písemce tak si rychle kliknu se hezky hnedka tu vidíte
máte to přepsat do textu takže se tam krásně můžete orientovat přičíst divoce hlavně
vyhledává
oknem
koukneme
v praxi
služtička se menuje todle čas
barcamp se nahrává bude tam tak za tejden čtrnáct dní se nám podaří bude prostě tady přístupní takže si sami
můžete vyzkoušet
vyhledat navigovat rychle
jo takže zkusme si prostě
potřebujete se tady naučit
no výborně
že budete rychle zjistit se to fourierova transformace
znáte
tahle přes přiběhnou neska vidíte
i přes riziko
dneska vidíte deset o přednášce říkalo jo tady se o tom hodně mluví volnýho původní jo
no to symetrické podle si svého u nesymetricky na mínus X mínus T je základní vlastnosti
nervy transformace fatální by bylo dobrý že _e když jsme se s času dostali do spektra
nedostatek nazpátek že
vememe _e zpětnou fourierovu transformaci
tak už
si tady
po klikat synchronizovaný slajdy
_e takovéto
jednotkového impulzu
tak
bylo
demonstrace vše
tak se abysme povídali jenom o tom se vlastně jako zvenku jak to vypadá
tak se podívám i
to je uvnitř velice lehce
rozhlas má nějaký ve gram počítačový prostě vidí programuje
S lidí výborně
tak těm tohleto musím vysvětlovat
jo to je jenom takový schémátko toho co je uvnitř
vy co programujete si to dokážete zhruba představy bytostí možnosti nemáte dobyto stejně dlouho
řekneme si jenom velikosti
to
důležité vlastně z našeho pohledu tady tahleta krabička co která nějakým způsobem teda audio dělat toho něco se přes závislé
no tak
velice zjednodušený jestli to můžete představit ano
jo nacpete do toho audio mikrofonů tady teďka mluvím
natočíte kličkou vypadne vám je text něco co se dá
za indexovat čemuž prostě standardní počítače me
pěkně pro co
co to umí
je to tak a krabičkách kterou musíte naučit
a chová se to stejně jako u malé dítě tak jako můj synek
ten umí to co nauč
jo zatím až bude starší tak US čísla
takže
na tu krabičku musíme nějak naučit a tu krabičku určíme takže vezmeme prostě velký kvanta řeči tu řeč musíme mít
přepsanou takže přesně to musím poslouchat na slovo co přepsat a tyto informace vezmeme strčíme to
zase zatočíme nějakou čipsy kličkou ono se to prostě naučí rozumět _e řeči a převážně ten signál textu
takže
naučí se to přesně to
co to naučíme tudíž tak jako já bych vzal svého synka proto aby otočí on by měl čínsky
přestože se neuděl na _e narodil čechách prostě jako by zadeček prostě v domě prasečí
že opravdu spojených státu bude umět rozpoznávat krásně mluvit krásně prostě americkou angliš
Y novej how
experiment a nacvičují
pole nula
jsou
S barcamp jestli kódy ten byl byly okna špaček vykonaj
you ten čaj
how věneček rico mail vykonání na u maticových síť
ze vejplata
ale a je to mnou od dozvíte op a dobře
takže první věc audio jazyk jo rozpoznávače prostě závisí na jazyků tak jak naučíte ten jazyků
druhá důležitá věc je com
jo nebo my ho naučíme nějak slova třeba sto tisíc přes sto padesáti anglicky to or umí rozpoznává tady tato
slova ale prostě vám rozpozná ani o slovo navíc který sto předtím nenaučí
mimoto
on umí on preferuje to pořadí slov tak jak toho naučit
jo prostě si to nějakým způsobem pamatuje
takže
když to naučíme na standardní tuzemské hospodské řeči
představte si jo budeme mít výraz spoustu takle nahrávek ve teďka ty studenti přídou do té hospody po zkoušce a
sinus nula ty vole se rozdělí dneska byla zkouška
já jsem to tak postaral že to není možný prostě mě v něm vyhodí úplně prostě a stojí
jo tak té rozpoznávač bude mít tento naučený krát slovník a budou P se
takže pak příde krásná vážná sence vymete vy vemete tento rozpoznávač a budete se diví že za každou čtvrt obětuje
ty vo
což se nám stalo kdy jsme dělali přenosový systém tady tak jsme tam měli tak u češtinu a pak prostě
soudní procesory tady jako mluvili občas vulgárně
takže jsme samozřejmě oni nemluvili jako ale ty předpisy vzdálený takže sme museli vyhazuju žádný slova torusu rostou slovníku toto
celkem fuška tam
jo
takže další důležitá věc když byste někdy příště to styků prostě rozpoznávače mám pamatovat si omezeny slovní
a omice a roklina domén vona tak jako naučíte na doménu když ho naučíte na nějakou běžnou fotkou řešte prostě
to bude preferovat jo a když budete chtít přejít na nějakou normální prostě na nějakou tady televize nebo cokoli takovýho
tak se musí hodnotu jo to znamená když zase aby se začal přednášky nějakou básničku rozpoznávač to bude totálně zmatenej
což nenaučili že např
což mimochodem tomletom rozpoznávači to prosazovat které sem řekl taky jo takže si zase můžete zkusit prostě jako zjistili pořád
takže na závěr co bych chtěl abyste si odnést
rozpoznávač řeči krabičkách právem no to nahoře dostanete v nějakém fondu a vyplivne mám na výstup nějaký text něco čím
se dá potom ušní a pracovat klasický také třeba googlu nebo cokoli
je to prostě nějak text nějak slova ty slovama tím vývodu že mají se částečně sepnuta pak jednoduše vyhledá
rozpozná jen to na to byl naučen A jazyk akustický prostředí slovník
popis prostě stylu mluvy tak jak bluffovat se
plně na závěr
superlectures sou nahrávaný budu rozpoznaný zkuste si po přednášce pokuď máte někdo pocit že k tomu máte co říct jako
zajímavá sou chcete spolupracovat cokoli přijďte za mnou o zvlášť jestli jsou tady z naznačen si to mají rádi I
com ajpek při té za mnou na seznam o něčem pobavím
sledujte twitter panter barcampu jak to budeme indexovaný někdo bude nějakej když už to máme hotový takže si pak můžete
za domácí úkol může schválně podívat jak rozpoznávač prostě
se vypořádal můj angličtinu a
se
prostými slovy který sem tak
takže to je za mě všechno jo tady předám
slovo
péťovi který vám řekne
něco
vyššího dalším technologií
mimochodem i nějaký dotaz
takže
no
_e
tak _e nějak rychle jestli phonexia _e ta ta vznikla řada založena lidmi právě tady sme u té a dostáváme
se řečové technologie z celého světa
já vám oj něco jaké sou technologie jestli jak můžete věk stravovat z řeči aneb forma
proč jsme se tady tím vlastně zaznačily zabývat se je to kvůli tomu že vidíme že kolem nás je v
oblasti množství informací každý den se díváme na televizi diskutuje mezi lidmi díváme zaneseny testem internetu telefonujeme a této informace
je podstatně víc než textové informace bohužel
toto většinou kolem vás projde sem tak něco zapamatujete sem tam ne ale většina této informace se v dnešní době
ztrácí
_e jen tak se to tady u co bych se chtěl zmínit si je to jaké sou řečové technologie ne
k dispozici co umí chtěl bych navazuji se kdy se budeme tak teď to řeknu dva _e setkávat a i
pro vás _e jaké třeba můžete použít se zapojit
tady je na _e
igor třeba ukázal nádhernej příklad se
_e přepisu sou řeči já že bych jenom si že informace _e
_e řeči podstatně víc
víš třeba užitek druhu jsme nebo další službu není to jenom _e ta very na kterou se ptáte kterou kterou
václavu získá ale ty řeči jezdit je třeba když takhle tady s access rozdíl došlo čtyř kategorií je tam informace
o mluvčím je tam informace o obsahu
ale u to informace o prostředí technice
co se týká třeba mluvčího jestli je to jazyk dialekt _e pohlaví může to být vzdělání řečníka
tak dál
technologie který který má zabýváme mí E chcete tak jsou uvedeny na tomto slajdu je to třeba přepis řeči
se který _e
budete moci zkoušet _e vlastnosti superlectures
ale toto je jednodušší formy sme detektor klíčových slov a můžeme identifikovat jazyk neschopný identifikovat pohlaví
_e sme schopný desinfikovat konkrétního S
tak _e to co se týká přepisu řeči
_e
pomoci přepisu byste schopný získat _e řeči doplňkovou informaci kterou potom můžeme tím nechápu potom může použít klasický technologie na
indexování textu a ste schopný toto o co je to k audiu dohledá
_e tady sou dva projekty ty na který sto můžete vyzkoušet přepis řeči cz je projekt jestli můžete zavolat si
tady něco nadiktovat a podívat se i rozpoznávač
funguje pro vaši řeč
před přednášky nebo superlectures bude se kdy svazu parkem
můžete získat určitou pře
_e to co se týká kvality přepisu
vzorů zmínil _e pokuď je ten _e rozpoznávače adaptovány na konkrétní doménu může být medicína právo I P většinou teda
přepis je téměř dokonalý můžete očí ste nemůže to prezentovat pokuď sedí adaptován tak _e většinou ten přepis je na
takový úrovni že ste schopni pochopit obsah toho textu
tady jen pro představu jak funguje takový rozpoznávač který vidí adoptovali na konkrétní domén
vidí se
nahoře originál dole je _e to rozpoznávač před
toto třeba bylo
pořízení pozici číslice
teďka co je důležitý je že já jsem řek tady vidíte že vám přepis řeči a ale i sami nějaká
chybu když to použijeme obecnej tech
se důležitý ten přepis řeči nemusí
právě _e poskytovat i jenom ten přepis tu nejlepší variantu ale ten přepis se
umožňuje nám vrátí ty alternativní slova se z toho důvodu jistě tyto technologie ještě asi nebylo důvodu dobu dokonalý to
kvůli tomu že po za počítač nezná fyzikální souvislosti nezná vaše vztahy kamarády když si unk _e se to třeba
mění a ale dítě dopravy těžkých domýšlet nějaký věci to co třeba nerozuměl já
další technologie _e je _e detekce klíčových to detekce klíčových to je to takové jednodušší přepis ale
co je dobrý Ú forme _e je
že se algoritmus je rychlejší ze ze _e
tímto puse pokrýt daleko větší množství jazyků a
třeba D
používá se třeba na monitorování nějak nějakých televizní vysílání konstrukce práce operátorů vkusem se tak dál
tak se mi jim o důležitý technologií je
která což což je identifikace řečníka
dost často se je lidi ptají _e
jestli _e je nějaká řečová technologie která funguje podstatně líp nebo
předčila u člověka to tohle to je zrovna jedna sme se smyslových kterým se to stalo
ono to
když zkusíte když se ze třeba tisíc nahrávek a chtěli byste to mají konkrétního řečníka znovu porovnat dva řečníky detekce
klíčových D slyšíte čtvrtou nahrávku tak už víte zněl se první říční tohlencto ta technologie mít
i v dnešní době už ze _e v podstatě z nahrávky i spravovat masovej vo ti
což je záznam který má jenom šest set bajtů to teda pár čísel a ti s tímto toho člověka unikátní
_e potom ruce zajímavý T tak tajle si hlasují otisky můžete mezi sebou porovnávat takže během _e
sekundy schopný porovná se milióny hlasových otisku ste schopni dohledat o informaci kterou potřebujete
se taky zajímavý
_e etapy a chce zdi zde si zmíníte těsně si dělaj ty úrovně je default dvě sou tady toto je
technologie která se v dnešní době nejvíc V V a že dva roky podobně jako moorův zákon se klesne chybovost
ati tady ty technologie na polovinu
takže ze třeba _e určitá vadit je tady ta technologie bude prvky době a tím telefonu proces bych K
pokuď chcete dělat nějaký systém pro vyhledávání audia na internetu důležitý je vůbec na začátku když použijeme rozpoznávač řeči
vůbec se identifikovat jazyk tato technologie je dnes taky k dispozici je funguje to jako trénován V D klasifikátor T
C takže vy vy si vezmete nahrávky v několika jazyků a tenhleten klasifikátor apod potom ste schopni rozpoznat podstatě libovolné
jazyk
zboží dialekt toho jazyka
říká se kdy se teda budeme s řečovými technologií by jedný běžně setkávat
v dnešní době sou tyto technologie E už běžně dostupných použili jako
používají je zpravodajský složky potom už možná ste neuvědomím nic _e ale každý den tyto technologie
tati chrání vaše životy
sobě říct že omezujícím faktorem pro jo široký N na nasazení těchto technologií _e aby opravdu byly kdekoliv na internetu
tak taky většinou kvalita řečový ho záznam
to je je důležitý je tady třeba vhodné nezmínil ta kvalita toho přepis řeči _e za záleží na tom hodně
na vzdáleností mikrofonu o C
řečníka jak mikrofon mám
těsně u musíte zažitý se záznam bude paritní _e
závisí to na na neřečových událostech teda šumech
a taky _e množstvím
kdy se používá já záznamových zařízení opět _e je složitější to si dobrej rozpoznávač
takže řešení matici a _e vlastně tím posetou u port posune tak je do hardvér
_e lepší algoritmy
takže technologie _e dovolá R R
vidíte dnešní době sou objevuje přepis řeči nebo rok rozpoznávání řeči a mobilní telefony proč tomu tak je protože i
mobilní telefony E i děti na tak je potřeba _e jakýho lepšího vstupu I nasypu využívat vyráběji milionových který se
takže ten samý mikrofony použít _e _e
věc miliony měli měli
co je důležité dat další důležitý zařízení který prvky době tento sekvence ovlivní je _e mikrofonní pole co koši je
_e nějaký sada mikrofonu a to zařízení vám umožní potom nasměrovat
přichystat tady sedíme přednáškový místnosti tak jako paprsek a přesně zaměřit a konkrétního člověka který mluví toto zařízení bylo
nedávný minulosti zas velmi nákladný ale v dnešní době uši takový zařízení jako je _e microsoft C
kyne zase _e takže toto myslím si že
opozicí zpracování řeči ovlivní
další věc _e se který v dnešní době není problém
i mikrofon tady ty takovej halejte zda
nedá se
ten
teďka něco pro vás se jakým způsobem za se zapojit se _e pokud _e toto za zaujalo _e
my rádi uvidíme _e inovativní lidí inovativní firmy po pokuď se třeba stala spolupracovat ráta technologie k dispozici jakož _e
lze K přepis řeči _e za ni
výpadu dá zlepší nešlo důvodu týká identifikace řečníka to tak se na si to ve špičce té a takže
chcete na začít pracovat taky zadávací my budeme rádi
pokud pokud udělá
samozřejmě hledáme tady každou chvíli na spolupracovníky se
taky jestli za spousta pozic
a pokud vás zajímají přímo ty technologie chcete typ posouvat dáte se tady bude D T
další _e přednášku za černocký E zde tyčových op ty piny je tady opravdu _e
možnost mezinárodní spolupráce není problém dostat lidi třeba na sem force srší spisů zbyde kterýho vlastně z kopce výsledek odlehlý
dobu u do microsoft
tímto institucemi
open sem
takže to je všechno bude ode mě předám slovo tady _e
černocký mu pokuď chcete vzít někdo vizitku na na nebo
kontaktovat
_e
_e přičte bůra
jaký otázky
o o _e do tady tyto technologie _e se zavání postupně pes právě ta tady ty _e komplikace _e to
tomto má ani
_e sme si řekli že že by největší zvíře se to používá třeba pro kontrolu vlastních operátorů protože zas aby
aby kontrolovali vás to potřebuju sebou aby _e ty kladné získal informace o vás potřebuju třeba u ale toho je
i jestli jich operátor máme na dáván
nemluví sláma prostě alu vopravdu vám poskytne tu informaci co má se tak tohle to je největší oblast kde se
to těch call centrech používat právě
co se týká _e
párování jezdil u atomem to si myslím že je _e
i bude několika ta X letech
za další oblast takže já si myslím že se tady ty problémy is
_e
_e o o takle po pokoji ty _e řečový technologie postupně se dostala do praxe _e
ne nej největší komplikace kterou se tady tady cyklostezka _e řešili ten takle byla kvalita vlastních lidí tak se takže
tam cena nasazený podporo _e právě _e P zákazníky ta samá
to používá Í zase záleží na legislativy K konkrétní země je je třeba evropa je dost dost konzervativních v tomto
_e if že potřebujete vždycky vyjádření
_e příslušných úřadů F
co se týká třeba ameriky a asie se takto prosím
o o po ono _e je pokud byste si chtěl slyšet konkrétní číslo že se těžký protože když vždycky si
nenajdete _e ně nějakou sadu testovací na který se dosáhne stoprocentní úspěšnosti rychle se mluvit člověka s marketingu tak všechno
tvrdí to prase na sto procent se _e
řeknete řek by _e když když budu mluvit _e jako technik ta tak _e _e
toho přepis řeči se to může být _e _e
_e mezi padesátiprocentní zjištěné datovaný systém nebo devadesáti procent se když to je _e
systém adaptovaný na tlumené
toho řečníka ste schopen už najít _e prostě osobu
tisícinu desetitisících nahrávka
o čas sem tam se jsem udělal chybu ale když hledat někoho to tak se něco na internetu po pokuď
máte tisíc _e _e třeba stránek nebo tisíc záznamu a pokud
prohlédněte si prvních deset a má stav informací srdce se jako zákazník
pokoj
to se tadyhle _e to tady ty
se jsem se nesrůstá
to tohle se všechno statistice pokutě _e tyto systémy se trénují řádově naval namiřte a na na předpisech vo T
tisíců řečníků po pokuď trénovací sadě byl data to chyba třeba zastoupena byla vždy tak blízko se tak se s
tím vyrovná pod pokud ne tak to může selhává a ale si třeba na naše rozpoznávače pro angličtinu do trénován
na lidech _e
real zpětná se takže celý funguje perfektně na nerodinný angličtině kde každý si tam začnu trošku nějakým způsobem komorní
dobře děkuju rámci o
tak děkuju zapózoval nějakou petrovi do toho docenta černockého dybyste mně viděli dneska dopoledne let po stromech švestkový charlesi například
tak byste si říkali to je zase sending jenom taková úmorná sinusovka já bych chtěl chvilku popovídat o tom se
pozadí _e phonexia a super vlečnou trity krásný firem a projektu který se tady teď viděli
tak
_e
je to výzkumná skupina které říkáme D hodí spíše si výhod jako brno university of technology takle nás lidí většinou
znají venku tady na domácím písečku je to většinou spíše si asi by vám říct jako
tím trošku jak to děláme kdo to dělá na čem to děláme kdo to všechno platí a možná něco pro
vás proč byste to měli dělat také a když teda jako by se vám to líbilo takto proto máte udělat
tak jak to děláme _e vlastně když si vezmete nějakou knížku a učebnici vo _e rozpoznáváním nebo v o detekci
nebo vo mistrovi učení tak tam na uvidíte tady tohleto základní schéma tady nasbírat data nějaký dotaz perimetr zouvat nějak
se rozhodnout jaký bude modelovat
a ten model natrénovat pak _e to zbavovat nebo zjistit jak to funguje na nějakých neznámých daty a zjistíte toniku
nechodí vůbec a pak následuje prostě N
desítky stovky tisíce takovýhle koleček kdy už musíte nasbírat víc dát nebo lepší parametry lepší model líbo natrénovat a tak
dále až nakonec prostě už tu práci máte odevzdat tak tady potom jako _m přichází nasazení a pak se klepeto
jestli to bude fungovat i na těch datech vašeho partnera projektu nebo _e nebo zásadní _e takže
modrý schémátko přesně podle knížky kterou si můžete za padesát u
co je výsledkem
takovýhle schéma který je zase _e vlastně strašně jednoduchý myslím principu to tedy audio nebo řeč
vypočteme nějaký příznaky
pak vyhodnotíme pomocí nějakých předtrénovaných motyl modelu nějaké pravděpodobnosti nebudem taky říkáme věrohodností a na konci přichází blok dekódování na
jehož konci musím udělat rozhodnutí a já vám zkusím tady tyhlety bloky přestavěna takové nejednodušší úloze k _e kterou se
asi setkáváme a to je _e případ rozpoznávání pohlaví
to znamená stupuje řečová nahrávka a na výstupu mám více informace tyto kluk nebo holka
na že se nekousněte ale _e tohle je aplikace která je důležitá která případě z desetitisíců telefonních hovorů nám pomůže
omezit C ten hledací prostor na polovinu asi ze všech který tady jako umíme uděláte to nejpřesnější protože tam sme
na nějaký devadesáti devíti
_e téměř to procentech podle toho na jakých datech se to _e s pochvaluje takže trošku detaily toho severní napřed
nemáte ní samozřejmě
tak má teda právo spousty kluků
těma data má si představte prostě adresář plný wavek
jo který vám namluvily tady tyhlety kluci máte tak to taky data od holek
tak tady tyhle těch dat _e na trénujeme nějaké gaussovské modely tak unk vám tady _e se kterým takový hrůzostrašně
téma
a _e když tady tohle máte hotový tak můžete postavit systém který bude mít tu počítají se tam nějaké koeficienty
které reprezentují vstupní řeč pak se to do těch modelů přivede každý z těch modelů kde mi pro kluky druhým
pro holky tak vám dá nějaký skóre takže tady sou ty modrý A červenáš tečka
na základě toho skóre vlastně rozhodujete jestli teda na vstupu _e sme viděli neviděli kluka nebo
že eště eště víc do detailů když se podíváme na ten úplný začátek a řekneme si čím tu řeč vlastně
jako budeme popisovat nebo nebo reprezentovat tak si najednou uvědomíte že ta řeč není stejná pořád ze a když mluvím
za každých pár milisekund musím s tím hlasem něco udělat abych vám přenesl nějakou informaci jak bych tady mohl říkat
soudou a lze hrozně
takže tu řeč přes tou parametrizací musím rozdělit na nějaký kousky říkáme rámce vypadají zhruba takhle nějak mám celou půlku
přednášky potom potom jako jak mají dlouhý lexém překrývat
a pak si taky můžeme uvědomit že to jak mi lidé slyšíme sto není lineární že neslyšíme stejně jako póly
uprostřed klavírů letouny navrchu klavírů a taky neslyšíme vinárně hlasitost takže se tam přidává nějaký schémátko který se snaží nějak
reflektovat i ty nelinearit a na jeho konci
vyjede takováhle pěkná matice
má to nějakej prostě
N parametrů a tenhle tu sadu parametrů dostaneme každých deset milisekund takže vlastně když si představíte třeba vteřinu řeči tak
za ni dostaneme sto takovýdle pěknejch textu
s těma vektor má děláme dál na ten _e do takzvaných gaussovských modelu
který _e
mají nějaký parametry takováhle gaussovka ve dvou z rozměrným prostoru má nějakou střední hodnotu má to nějakou kovariancí která určuje
ten kopec vypadá
_e by to bylo ještě složitější tak _e to není jenom jednou se stal můžeme ji mít X mě
a pořád i tady tohleto původně vzduchových jednoduchý příkládek protože já vám to tady ukážu ve dvě de až do
vůbec lo zobrazit a vyplotnout akorát že tomu vonné to většinou tak ve třiceti devíti de
X touž potom moc představit nejdéle počítat s tím do úplně a každý z těhletěch _e tyhlety modelu nám dá
_e nějaký číslo
a na konci máme takovou slavnou for bulku do vlastně je pravděpodobnosti dat když viděli kluka apriorní pravděpodobnost luká pak
pravděpodobnosti dat
na tu pravděpodobnost zase vykašleme protože na to nějak moc neumíme spočítat ale naštěstí je to pro oba dva případy
stejný apriorní pravděpodobnost taky většinou neřešíme protože si řekneme že možná těch kluků je tak jako stejně těch holek a
zbydou mě tady tyhlety dva výrazy které dostanu mých sony gaussovek takže srovnám tak toho bude kluk anebo takže to
je princip
nejjednoduššího
detekčního a vzory
samozřejmě tohle moc jednoduchý jo to jako řeknete s tady slovy předvádí tak může to být tady určí tady tohle
_e kousek _e nějakého článku který napsal na zaměstnanec vo právě adaptaci systému pro rozpoznávání řeči na jinou akustiku
tady _e _e jinej trošku určí _e tohleto je součást tak zvané a je vektorové metody
rohu úpon používáme pro rozpoznávání mluvčího a funguje prostě mnohem lépe než všechny ostatní a když se bude zeptat proč
a je vektory tak _e _e vono to tlumené jako touto variability s a spisy strž zní hrozně vědecky řešme
kolegové hledali nějaký sexy termín tak říkal že tak dobrý tak tady I port imax
I I I P nebo jak se to ne ne všechny ty a já je tak tomu budeme říkat a
je vektory a ujalo se to a teďka no tak říkaj všichni
_e tohleto je zase nějaký jako parametry noční schéma do kterýho mícháme je neuronový sítě
a abych vás úplně dorazil tak todleto je rozpoznávací síť která bude třeba pracovat tygrovi je _e rozpoznávači na _e
na přednášky akorát že tahle jestli se pamatuju tak dokáže rozpoznávat dvě slova tomu ještě dva fonémy většinou tam těch
slov máme tak tři sta tisíc plus eště nějakých
pár fonému k tomu takže by mě to zabralo asi tak
mohou se lišit než by se vyplatí
co si ale prosím vás jako tady všimněte je že se tam používají jakýsi _e konečný stavový trendy si nebo
konečný stavový automaty abych tady možná ještě to co se to řek
tak a teďka
taková diskuze ti lidi to dělají proto aby
se mohli vytahovat samozřejmě
soutěží o rekord počtu rovnic na centimetr čtvereční
někdy jo ale myslím že matematici jako nastane dostávaj byli atraktivnější pro holky to nevím teda
možná někdy jo když se podíváme přítelkyně a manželky členu se laboratoře tak to není špatný
a protože na barcampu ještě dneska nebyly žádné rovnice tak já tady mám teda proč to děláme opravdu
protože tam matematika má vždycky smím smyslová my chceme aby ty naše rozpoznávače byly přesnější rychlejší odolnější vůči všem těm
změnám mezi řečníka má krásnýma kanálama a tak dále a to je taky hrozně důležitý _e datalog který tady povídal
s igor tak sou neskutečně drahý
u tím musíte za drahý peníze kupovat anebo je _e musíte sami vyrábět to že neskutečná v rvačka takže _e
chcete aby vaše algoritmy potřebovali ní nic a pokud možno nějakou velmi špatně a nebo vůbec popsán
tak kdo to dělá
výčet si skupina která má asi tak třináct let trvání
_e současné době zhruba dvacet lidí šéfuju tomu tři lidé tady tenhleten pánská vo u kterého jinak prakticky lněný není
vidět tak mi lukáš burget
současné době právě _e na stanfordu jiné germánský rakovina guru a světoznámý profesor zpracování řeči a tady moje maličkost která
se snaží nějak řídit haně proto peníze
tak na čem to děláme tohleto je oficiální té který píšu jako rose grantový cihláři ale prostě hodně šrotu takže
tu pokud máte doma nějaký důvěra vo jádrový počítač
myslíte si to je dobrý nebo osmi jádrový tak je to dobrý samozřejmě ne minimalizovat pět set
tohleto ale je zhruba _e místo na našich discích abych jako
se jenom nechvátali ty máme teda dat tak tohle do S mínus T
v linuxu můžeme cosi protože co to znamená nějak nějakých partnera tam bude pořád přibývají pořád jsou doplněny
a toto je nějaký graf C K cpu czech našem dávkovém systému jezdí
tady na té ose je nějakých osum set současné době nebo tak polovina průměrně toho bývá toho bývá _e
použití
tak kdo to všechno platí a neměli na výplaty tak samozřejmě něco fakulta ale zhruba čtyři pětiny si musíme pohánět
sami takže evropské projekty americké projekty a lokální projekty zatím se dycky aby to financování skupinu stálou na třech no
a
a teď která čím se klasy nejvíc T mluvíme tak je darpa projekt který máme sednou významnou americkou firmou darpa
jestli si pamatujete si jestli jste četli někdy nějaké historické trakt _e ty tak financovala takovou drobnost obrazy internet
tak _e dělat u nás průmyslem
phonexia superlectures tady zazněli jako dvě vlastně naše _e nejsem si dva naše úspěšné synovci
pak sou tady prostě světové významné firmy _e taky někteří lokální hráči například lingea africe _e vážený a tradiční partnerství
matice že máme asi třetí prvek
tak tetě se dostávám závěru proč bych to měl dělat také tak teďka vám budu možná se uštvat protože já
jsem jednou jel trolejbusem takhle to musí nějaký dva takový kluci kteří by asi tak metr dvacet vysocí aby to
radoval tak na pátou třídu
povídali o nějakým P a péčku jo a tak o tom pálilo a já sem minusky dostal
otevřenou posouvá nechápal sem ani desetinu tohoto říkají
takže takové ty věci jako
ve a a php a kaskádové styly a tak dále to je jako hrozně pěkný ale vopravdu se touž teďka
učí kurzech informatiky na základ
takže možná jako když nechcete zůstat na této úrovni tak byste mohli dělat něco trošku drsnějšího
_e
to zpracování řeči drsnější je
protože se tam míchá matika _e trochu i fyziologie
trochu i _e rozpoznávání klasifikace ne šílený _e a tak dál a tak dále a přitom si myslím že to
užitečné se prostě jako to má spoustu komerčních bezpečnostních já nevím nějakých aplikací který se tedy věděli
_e dá se na tom taky celkem
vydělat
neříkám že plat výzkumníka s ty vždy v naší skupině jakou kdovíjak bombastický ale pokud chcete více taky pořád možnosti
ste dobrý se nechat _e zaměstnám microsoftu ibm nebo googlu který mě neskutečně a pořád bombardují ozónem váš nějaký dobrý
lidí ozónem až do brýlí
tak jako
dá se a pokud byste chtěli ještě více peněz tak se můžete nechat zaměstnaná vostrý a tady si nedělám srandu
protože _e ty algoritmy které se používají nefinanční analýze rozkradou časových hřát já nevím predikce odhad rizik
tak sou postavený na tom stejným aparátu jako to co děláme my kdybyste sama chtěli dělat něco už teďka tak
jako občas víc zmínit podporujeme i studenty poslední z bot který sem tady napsal spíš jako pro lidí mého věku
je mám pocit že oproti svým spolužákům
jiří třeba jako dělají nějaká standardní zaměstnání tak rovnou něco pomaleji ale tu
musí posoudit oni nebo vnějšího tak co pro to mám udělat když byste chtěli a
té vladimír iljič lenin
a já jsem si vyrůstal za komunismu takže nám říkali že on měl heslo učit se učit se učit se
což není tak úplná blbost že _e to tady našem oboru platí a si vezmete seznam tady těch kurzu nebo
věcí který by naši lidi měli umět tak jsou to
velké většiny vinnej nenávidí nižší kurzy tady na fakultě jo
takže lineární algebra statistika B teoretická informatika B a tak a tak dále a tak dále u té teoretické informatiky
bych chtěl říct že všichni _e lidi nevím kolik vás _e dělá si tak když se přídou do prváku magistrála
mají tam ty _m teoretická informatika u profesora češky tak soustavu zděšení a ty vylítávaj Í
toho a přesouvají se na masarykovo univerzitu kde prý de nějak projít magistr westerny s informatiky
tak já bych vám chtěl říct že když přijdete do řeči a tam _e na vás najednou vypadne pět minimalizací
_e konečných automatů tady _e pro pro věci které dělají vzor tak najednou jako rádi vezmete skripta stínovat bude existovat
o čem to vlastně
tak _e pak jo napětí o třeba programovat
ale narozdíl cílem je to spíš takovej experimentální guláš jako vaříme prostě věci aby rychle fungovaly
a co je asi nejdůležitější tak je přemýšlet o výsledcích chtít přijít věcem na kluk nejenom prostě to jako pouštět
a napsat výsledky někam a hry
tak
to byl konec nic
jich nitře děkujeme za pozornost kdybyste chtěli další informace tak sme tady nebo si nás najdete možných webových stran