takže můžeme začít

tak já vás tady vítám emisi dorost a

vám tady s kolegama řekneme něco o tom jak se důl informace z řeči a co ani google neumí

tak

kolik dva milouš na nějaké velké konferenci něco jak třeba tady parkem webexpo podobně

hezky paralelní sekce teď to tam vaří všechno i nevíte kam máte i dřív

dobrý dobrý spousta lidí

tak takový na to by tomuto

když se podíváte nahoru tam

tady máme kamerky

takže nahráváme to a

bude to všechno potom co jsem přístupný někde na internetu takže se můžete dívat

nicméně to je celkem běžný to asi znáte

tak jiného soudku

do z vás má

takovou zkušenost

přednášek tříhodinových

dlouhých

první přednáška druhá přednáška tak tam byly toto přestanete chodit

patří do vánoce tak si dáte kapříka řekněte na paštice

copak přijde

zkouškový

protože se učit a terči

dohánět je všechno co ste

co se minuli

no

a

někteří studenti naši fakulty tím že se tady nahráli přednášky

tak zasednou k internetu

zrovna web server a sme video server

začalo to hat takže motorovou pilou na železo řeknete tu funkci na S přesně podle imaginární osy rozhraní takhle zvuku

podíváte

jo a koukají a určí se prostě a rychle rychle rychle rychle vstřebávají všechno co jako neviděli během semestru

a zjistí že teďka jít a já se osumnáct hodin usmáli na zkoušku a musím ještě zvednou třicet dodíval

jsou obraz tak

takže zrychlení

řeknu _m do inte u unk na S minimální si ukážeme pokud máte nepřímo a je omega nordistovými tam kde

runge nabídnout _e jméno

no a jak si myslíte že to dopadne

není smál

takže

tudy cesta nevede

když potřebujete něco najít ve hromadě nějaký textový dokumentu

cože podstatě celej internet co uděláte

zavolat esíčka hugo

strýčku tričku co je to fourierova transformace _e zrovna transformace přijde dřevěné tyče ukázat deset milisekund a máte padesát milionů

se

jo pohoda

jenže teče uklouzl vydá lidí jo ste si problém

A jo prostě video se můžete

můžete koukám na celý ale prostě v tomhle zatím

špatná zpráva

nenastala

sme tady mi

místo umíme

takže

představte že máte takovou přijmout ranečku máte nabídek o tak jako na jo tu můžete si oka na přednášku

máte u toho slajdíky takže vidíte

hezky pěkně čitelně to co je na tom výdejku tam vidět

máte to synchronizovaný držíš máte poznámka na třicátým padding slajdu _e načtete přednášce přednášky si mluví o tom že to

bude na písemce tak si rychle kliknu se hezky hnedka tu vidíte

máte to přepsat do textu takže se tam krásně můžete orientovat přičíst divoce hlavně

vyhledává

oknem

koukneme

v praxi

služtička se menuje todle čas

barcamp se nahrává bude tam tak za tejden čtrnáct dní se nám podaří bude prostě tady přístupní takže si sami

můžete vyzkoušet

vyhledat navigovat rychle

jo takže zkusme si prostě

potřebujete se tady naučit

no výborně

že budete rychle zjistit se to fourierova transformace

znáte

tahle přes přiběhnou neska vidíte

i přes riziko

dneska vidíte deset o přednášce říkalo jo tady se o tom hodně mluví volnýho původní jo

no to symetrické podle si svého u nesymetricky na mínus X mínus T je základní vlastnosti

nervy transformace fatální by bylo dobrý že _e když jsme se s času dostali do spektra

nedostatek nazpátek že

vememe _e zpětnou fourierovu transformaci

tak už

si tady

po klikat synchronizovaný slajdy

_e takovéto

jednotkového impulzu

tak

bylo

demonstrace vše

tak se abysme povídali jenom o tom se vlastně jako zvenku jak to vypadá

tak se podívám i

to je uvnitř velice lehce

rozhlas má nějaký ve gram počítačový prostě vidí programuje

S lidí výborně

tak těm tohleto musím vysvětlovat

jo to je jenom takový schémátko toho co je uvnitř

vy co programujete si to dokážete zhruba představy bytostí možnosti nemáte dobyto stejně dlouho

řekneme si jenom velikosti

to

důležité vlastně z našeho pohledu tady tahleta krabička co která nějakým způsobem teda audio dělat toho něco se přes závislé

no tak

velice zjednodušený jestli to můžete představit ano

jo nacpete do toho audio mikrofonů tady teďka mluvím

natočíte kličkou vypadne vám je text něco co se dá

za indexovat čemuž prostě standardní počítače me

pěkně pro co

co to umí

je to tak a krabičkách kterou musíte naučit

a chová se to stejně jako u malé dítě tak jako můj synek

ten umí to co nauč

jo zatím až bude starší tak US čísla

takže

na tu krabičku musíme nějak naučit a tu krabičku určíme takže vezmeme prostě velký kvanta řeči tu řeč musíme mít

přepsanou takže přesně to musím poslouchat na slovo co přepsat a tyto informace vezmeme strčíme to

zase zatočíme nějakou čipsy kličkou ono se to prostě naučí rozumět _e řeči a převážně ten signál textu

takže

naučí se to přesně to

co to naučíme tudíž tak jako já bych vzal svého synka proto aby otočí on by měl čínsky

přestože se neuděl na _e narodil čechách prostě jako by zadeček prostě v domě prasečí

že opravdu spojených státu bude umět rozpoznávat krásně mluvit krásně prostě americkou angliš

Y novej how

experiment a nacvičují

pole nula

jsou

S barcamp jestli kódy ten byl byly okna špaček vykonaj

you ten čaj

how věneček rico mail vykonání na u maticových síť

ze vejplata

ale a je to mnou od dozvíte op a dobře

takže první věc audio jazyk jo rozpoznávače prostě závisí na jazyků tak jak naučíte ten jazyků

druhá důležitá věc je com

jo nebo my ho naučíme nějak slova třeba sto tisíc přes sto padesáti anglicky to or umí rozpoznává tady tato

slova ale prostě vám rozpozná ani o slovo navíc který sto předtím nenaučí

mimoto

on umí on preferuje to pořadí slov tak jak toho naučit

jo prostě si to nějakým způsobem pamatuje

takže

když to naučíme na standardní tuzemské hospodské řeči

představte si jo budeme mít výraz spoustu takle nahrávek ve teďka ty studenti přídou do té hospody po zkoušce a

sinus nula ty vole se rozdělí dneska byla zkouška

já jsem to tak postaral že to není možný prostě mě v něm vyhodí úplně prostě a stojí

jo tak té rozpoznávač bude mít tento naučený krát slovník a budou P se

takže pak příde krásná vážná sence vymete vy vemete tento rozpoznávač a budete se diví že za každou čtvrt obětuje

ty vo

což se nám stalo kdy jsme dělali přenosový systém tady tak jsme tam měli tak u češtinu a pak prostě

soudní procesory tady jako mluvili občas vulgárně

takže jsme samozřejmě oni nemluvili jako ale ty předpisy vzdálený takže sme museli vyhazuju žádný slova torusu rostou slovníku toto

celkem fuška tam

jo

takže další důležitá věc když byste někdy příště to styků prostě rozpoznávače mám pamatovat si omezeny slovní

a omice a roklina domén vona tak jako naučíte na doménu když ho naučíte na nějakou běžnou fotkou řešte prostě

to bude preferovat jo a když budete chtít přejít na nějakou normální prostě na nějakou tady televize nebo cokoli takovýho

tak se musí hodnotu jo to znamená když zase aby se začal přednášky nějakou básničku rozpoznávač to bude totálně zmatenej

což nenaučili že např

což mimochodem tomletom rozpoznávači to prosazovat které sem řekl taky jo takže si zase můžete zkusit prostě jako zjistili pořád

takže na závěr co bych chtěl abyste si odnést

rozpoznávač řeči krabičkách právem no to nahoře dostanete v nějakém fondu a vyplivne mám na výstup nějaký text něco čím

se dá potom ušní a pracovat klasický také třeba googlu nebo cokoli

je to prostě nějak text nějak slova ty slovama tím vývodu že mají se částečně sepnuta pak jednoduše vyhledá

rozpozná jen to na to byl naučen A jazyk akustický prostředí slovník

popis prostě stylu mluvy tak jak bluffovat se

plně na závěr

superlectures sou nahrávaný budu rozpoznaný zkuste si po přednášce pokuď máte někdo pocit že k tomu máte co říct jako

zajímavá sou chcete spolupracovat cokoli přijďte za mnou o zvlášť jestli jsou tady z naznačen si to mají rádi I

com ajpek při té za mnou na seznam o něčem pobavím

sledujte twitter panter barcampu jak to budeme indexovaný někdo bude nějakej když už to máme hotový takže si pak můžete

za domácí úkol může schválně podívat jak rozpoznávač prostě

se vypořádal můj angličtinu a

se

prostými slovy který sem tak

takže to je za mě všechno jo tady předám

slovo

péťovi který vám řekne

něco

vyššího dalším technologií

mimochodem i nějaký dotaz

takže

no

_e

tak _e nějak rychle jestli phonexia _e ta ta vznikla řada založena lidmi právě tady sme u té a dostáváme

se řečové technologie z celého světa

já vám oj něco jaké sou technologie jestli jak můžete věk stravovat z řeči aneb forma

proč jsme se tady tím vlastně zaznačily zabývat se je to kvůli tomu že vidíme že kolem nás je v

oblasti množství informací každý den se díváme na televizi diskutuje mezi lidmi díváme zaneseny testem internetu telefonujeme a této informace

je podstatně víc než textové informace bohužel

toto většinou kolem vás projde sem tak něco zapamatujete sem tam ne ale většina této informace se v dnešní době

ztrácí

_e jen tak se to tady u co bych se chtěl zmínit si je to jaké sou řečové technologie ne

k dispozici co umí chtěl bych navazuji se kdy se budeme tak teď to řeknu dva _e setkávat a i

pro vás _e jaké třeba můžete použít se zapojit

tady je na _e

igor třeba ukázal nádhernej příklad se

_e přepisu sou řeči já že bych jenom si že informace _e

_e řeči podstatně víc

víš třeba užitek druhu jsme nebo další službu není to jenom _e ta very na kterou se ptáte kterou kterou

václavu získá ale ty řeči jezdit je třeba když takhle tady s access rozdíl došlo čtyř kategorií je tam informace

o mluvčím je tam informace o obsahu

ale u to informace o prostředí technice

co se týká třeba mluvčího jestli je to jazyk dialekt _e pohlaví může to být vzdělání řečníka

tak dál

technologie který který má zabýváme mí E chcete tak jsou uvedeny na tomto slajdu je to třeba přepis řeči

se který _e

budete moci zkoušet _e vlastnosti superlectures

ale toto je jednodušší formy sme detektor klíčových slov a můžeme identifikovat jazyk neschopný identifikovat pohlaví

_e sme schopný desinfikovat konkrétního S

tak _e to co se týká přepisu řeči

_e

pomoci přepisu byste schopný získat _e řeči doplňkovou informaci kterou potom můžeme tím nechápu potom může použít klasický technologie na

indexování textu a ste schopný toto o co je to k audiu dohledá

_e tady sou dva projekty ty na který sto můžete vyzkoušet přepis řeči cz je projekt jestli můžete zavolat si

tady něco nadiktovat a podívat se i rozpoznávač

funguje pro vaši řeč

před přednášky nebo superlectures bude se kdy svazu parkem

můžete získat určitou pře

_e to co se týká kvality přepisu

vzorů zmínil _e pokuď je ten _e rozpoznávače adaptovány na konkrétní doménu může být medicína právo I P většinou teda

přepis je téměř dokonalý můžete očí ste nemůže to prezentovat pokuď sedí adaptován tak _e většinou ten přepis je na

takový úrovni že ste schopni pochopit obsah toho textu

tady jen pro představu jak funguje takový rozpoznávač který vidí adoptovali na konkrétní domén

vidí se

nahoře originál dole je _e to rozpoznávač před

toto třeba bylo

pořízení pozici číslice

teďka co je důležitý je že já jsem řek tady vidíte že vám přepis řeči a ale i sami nějaká

chybu když to použijeme obecnej tech

se důležitý ten přepis řeči nemusí

právě _e poskytovat i jenom ten přepis tu nejlepší variantu ale ten přepis se

umožňuje nám vrátí ty alternativní slova se z toho důvodu jistě tyto technologie ještě asi nebylo důvodu dobu dokonalý to

kvůli tomu že po za počítač nezná fyzikální souvislosti nezná vaše vztahy kamarády když si unk _e se to třeba

mění a ale dítě dopravy těžkých domýšlet nějaký věci to co třeba nerozuměl já

další technologie _e je _e detekce klíčových to detekce klíčových to je to takové jednodušší přepis ale

co je dobrý Ú forme _e je

že se algoritmus je rychlejší ze ze _e

tímto puse pokrýt daleko větší množství jazyků a

třeba D

používá se třeba na monitorování nějak nějakých televizní vysílání konstrukce práce operátorů vkusem se tak dál

tak se mi jim o důležitý technologií je

která což což je identifikace řečníka

dost často se je lidi ptají _e

jestli _e je nějaká řečová technologie která funguje podstatně líp nebo

předčila u člověka to tohle to je zrovna jedna sme se smyslových kterým se to stalo

ono to

když zkusíte když se ze třeba tisíc nahrávek a chtěli byste to mají konkrétního řečníka znovu porovnat dva řečníky detekce

klíčových D slyšíte čtvrtou nahrávku tak už víte zněl se první říční tohlencto ta technologie mít

i v dnešní době už ze _e v podstatě z nahrávky i spravovat masovej vo ti

což je záznam který má jenom šest set bajtů to teda pár čísel a ti s tímto toho člověka unikátní

_e potom ruce zajímavý T tak tajle si hlasují otisky můžete mezi sebou porovnávat takže během _e

sekundy schopný porovná se milióny hlasových otisku ste schopni dohledat o informaci kterou potřebujete

se taky zajímavý

_e etapy a chce zdi zde si zmíníte těsně si dělaj ty úrovně je default dvě sou tady toto je

technologie která se v dnešní době nejvíc V V a že dva roky podobně jako moorův zákon se klesne chybovost

ati tady ty technologie na polovinu

takže ze třeba _e určitá vadit je tady ta technologie bude prvky době a tím telefonu proces bych K

pokuď chcete dělat nějaký systém pro vyhledávání audia na internetu důležitý je vůbec na začátku když použijeme rozpoznávač řeči

vůbec se identifikovat jazyk tato technologie je dnes taky k dispozici je funguje to jako trénován V D klasifikátor T

C takže vy vy si vezmete nahrávky v několika jazyků a tenhleten klasifikátor apod potom ste schopni rozpoznat podstatě libovolné

jazyk

zboží dialekt toho jazyka

říká se kdy se teda budeme s řečovými technologií by jedný běžně setkávat

v dnešní době sou tyto technologie E už běžně dostupných použili jako

používají je zpravodajský složky potom už možná ste neuvědomím nic _e ale každý den tyto technologie

tati chrání vaše životy

sobě říct že omezujícím faktorem pro jo široký N na nasazení těchto technologií _e aby opravdu byly kdekoliv na internetu

tak taky většinou kvalita řečový ho záznam

to je je důležitý je tady třeba vhodné nezmínil ta kvalita toho přepis řeči _e za záleží na tom hodně

na vzdáleností mikrofonu o C

řečníka jak mikrofon mám

těsně u musíte zažitý se záznam bude paritní _e

závisí to na na neřečových událostech teda šumech

a taky _e množstvím

kdy se používá já záznamových zařízení opět _e je složitější to si dobrej rozpoznávač

takže řešení matici a _e vlastně tím posetou u port posune tak je do hardvér

_e lepší algoritmy

takže technologie _e dovolá R R

vidíte dnešní době sou objevuje přepis řeči nebo rok rozpoznávání řeči a mobilní telefony proč tomu tak je protože i

mobilní telefony E i děti na tak je potřeba _e jakýho lepšího vstupu I nasypu využívat vyráběji milionových který se

takže ten samý mikrofony použít _e _e

věc miliony měli měli

co je důležité dat další důležitý zařízení který prvky době tento sekvence ovlivní je _e mikrofonní pole co koši je

_e nějaký sada mikrofonu a to zařízení vám umožní potom nasměrovat

přichystat tady sedíme přednáškový místnosti tak jako paprsek a přesně zaměřit a konkrétního člověka který mluví toto zařízení bylo

nedávný minulosti zas velmi nákladný ale v dnešní době uši takový zařízení jako je _e microsoft C

kyne zase _e takže toto myslím si že

opozicí zpracování řeči ovlivní

další věc _e se který v dnešní době není problém

i mikrofon tady ty takovej halejte zda

nedá se

ten

teďka něco pro vás se jakým způsobem za se zapojit se _e pokud _e toto za zaujalo _e

my rádi uvidíme _e inovativní lidí inovativní firmy po pokuď se třeba stala spolupracovat ráta technologie k dispozici jakož _e

lze K přepis řeči _e za ni

výpadu dá zlepší nešlo důvodu týká identifikace řečníka to tak se na si to ve špičce té a takže

chcete na začít pracovat taky zadávací my budeme rádi

pokud pokud udělá

samozřejmě hledáme tady každou chvíli na spolupracovníky se

taky jestli za spousta pozic

a pokud vás zajímají přímo ty technologie chcete typ posouvat dáte se tady bude D T

další _e přednášku za černocký E zde tyčových op ty piny je tady opravdu _e

možnost mezinárodní spolupráce není problém dostat lidi třeba na sem force srší spisů zbyde kterýho vlastně z kopce výsledek odlehlý

dobu u do microsoft

tímto institucemi

open sem

takže to je všechno bude ode mě předám slovo tady _e

černocký mu pokuď chcete vzít někdo vizitku na na nebo

kontaktovat

_e

_e přičte bůra

jaký otázky

o o _e do tady tyto technologie _e se zavání postupně pes právě ta tady ty _e komplikace _e to

tomto má ani

_e sme si řekli že že by největší zvíře se to používá třeba pro kontrolu vlastních operátorů protože zas aby

aby kontrolovali vás to potřebuju sebou aby _e ty kladné získal informace o vás potřebuju třeba u ale toho je

i jestli jich operátor máme na dáván

nemluví sláma prostě alu vopravdu vám poskytne tu informaci co má se tak tohle to je největší oblast kde se

to těch call centrech používat právě

co se týká _e

párování jezdil u atomem to si myslím že je _e

i bude několika ta X letech

za další oblast takže já si myslím že se tady ty problémy is

_e

_e o o takle po pokoji ty _e řečový technologie postupně se dostala do praxe _e

ne nej největší komplikace kterou se tady tady cyklostezka _e řešili ten takle byla kvalita vlastních lidí tak se takže

tam cena nasazený podporo _e právě _e P zákazníky ta samá

to používá Í zase záleží na legislativy K konkrétní země je je třeba evropa je dost dost konzervativních v tomto

_e if že potřebujete vždycky vyjádření

_e příslušných úřadů F

co se týká třeba ameriky a asie se takto prosím

o o po ono _e je pokud byste si chtěl slyšet konkrétní číslo že se těžký protože když vždycky si

nenajdete _e ně nějakou sadu testovací na který se dosáhne stoprocentní úspěšnosti rychle se mluvit člověka s marketingu tak všechno

tvrdí to prase na sto procent se _e

řeknete řek by _e když když budu mluvit _e jako technik ta tak _e _e

toho přepis řeči se to může být _e _e

_e mezi padesátiprocentní zjištěné datovaný systém nebo devadesáti procent se když to je _e

systém adaptovaný na tlumené

toho řečníka ste schopen už najít _e prostě osobu

tisícinu desetitisících nahrávka

o čas sem tam se jsem udělal chybu ale když hledat někoho to tak se něco na internetu po pokuď

máte tisíc _e _e třeba stránek nebo tisíc záznamu a pokud

prohlédněte si prvních deset a má stav informací srdce se jako zákazník

pokoj

to se tadyhle _e to tady ty

se jsem se nesrůstá

to tohle se všechno statistice pokutě _e tyto systémy se trénují řádově naval namiřte a na na předpisech vo T

tisíců řečníků po pokuď trénovací sadě byl data to chyba třeba zastoupena byla vždy tak blízko se tak se s

tím vyrovná pod pokud ne tak to může selhává a ale si třeba na naše rozpoznávače pro angličtinu do trénován

na lidech _e

real zpětná se takže celý funguje perfektně na nerodinný angličtině kde každý si tam začnu trošku nějakým způsobem komorní

dobře děkuju rámci o

tak děkuju zapózoval nějakou petrovi do toho docenta černockého dybyste mně viděli dneska dopoledne let po stromech švestkový charlesi například

tak byste si říkali to je zase sending jenom taková úmorná sinusovka já bych chtěl chvilku popovídat o tom se

pozadí _e phonexia a super vlečnou trity krásný firem a projektu který se tady teď viděli

tak

_e

je to výzkumná skupina které říkáme D hodí spíše si výhod jako brno university of technology takle nás lidí většinou

znají venku tady na domácím písečku je to většinou spíše si asi by vám říct jako

tím trošku jak to děláme kdo to dělá na čem to děláme kdo to všechno platí a možná něco pro

vás proč byste to měli dělat také a když teda jako by se vám to líbilo takto proto máte udělat

tak jak to děláme _e vlastně když si vezmete nějakou knížku a učebnici vo _e rozpoznáváním nebo v o detekci

nebo vo mistrovi učení tak tam na uvidíte tady tohleto základní schéma tady nasbírat data nějaký dotaz perimetr zouvat nějak

se rozhodnout jaký bude modelovat

a ten model natrénovat pak _e to zbavovat nebo zjistit jak to funguje na nějakých neznámých daty a zjistíte toniku

nechodí vůbec a pak následuje prostě N

desítky stovky tisíce takovýhle koleček kdy už musíte nasbírat víc dát nebo lepší parametry lepší model líbo natrénovat a tak

dále až nakonec prostě už tu práci máte odevzdat tak tady potom jako _m přichází nasazení a pak se klepeto

jestli to bude fungovat i na těch datech vašeho partnera projektu nebo _e nebo zásadní _e takže

modrý schémátko přesně podle knížky kterou si můžete za padesát u

co je výsledkem

takovýhle schéma který je zase _e vlastně strašně jednoduchý myslím principu to tedy audio nebo řeč

vypočteme nějaký příznaky

pak vyhodnotíme pomocí nějakých předtrénovaných motyl modelu nějaké pravděpodobnosti nebudem taky říkáme věrohodností a na konci přichází blok dekódování na

jehož konci musím udělat rozhodnutí a já vám zkusím tady tyhlety bloky přestavěna takové nejednodušší úloze k _e kterou se

asi setkáváme a to je _e případ rozpoznávání pohlaví

to znamená stupuje řečová nahrávka a na výstupu mám více informace tyto kluk nebo holka

na že se nekousněte ale _e tohle je aplikace která je důležitá která případě z desetitisíců telefonních hovorů nám pomůže

omezit C ten hledací prostor na polovinu asi ze všech který tady jako umíme uděláte to nejpřesnější protože tam sme

na nějaký devadesáti devíti

_e téměř to procentech podle toho na jakých datech se to _e s pochvaluje takže trošku detaily toho severní napřed

nemáte ní samozřejmě

tak má teda právo spousty kluků

těma data má si představte prostě adresář plný wavek

jo který vám namluvily tady tyhlety kluci máte tak to taky data od holek

tak tady tyhle těch dat _e na trénujeme nějaké gaussovské modely tak unk vám tady _e se kterým takový hrůzostrašně

téma

a _e když tady tohle máte hotový tak můžete postavit systém který bude mít tu počítají se tam nějaké koeficienty

které reprezentují vstupní řeč pak se to do těch modelů přivede každý z těch modelů kde mi pro kluky druhým

pro holky tak vám dá nějaký skóre takže tady sou ty modrý A červenáš tečka

na základě toho skóre vlastně rozhodujete jestli teda na vstupu _e sme viděli neviděli kluka nebo

že eště eště víc do detailů když se podíváme na ten úplný začátek a řekneme si čím tu řeč vlastně

jako budeme popisovat nebo nebo reprezentovat tak si najednou uvědomíte že ta řeč není stejná pořád ze a když mluvím

za každých pár milisekund musím s tím hlasem něco udělat abych vám přenesl nějakou informaci jak bych tady mohl říkat

soudou a lze hrozně

takže tu řeč přes tou parametrizací musím rozdělit na nějaký kousky říkáme rámce vypadají zhruba takhle nějak mám celou půlku

přednášky potom potom jako jak mají dlouhý lexém překrývat

a pak si taky můžeme uvědomit že to jak mi lidé slyšíme sto není lineární že neslyšíme stejně jako póly

uprostřed klavírů letouny navrchu klavírů a taky neslyšíme vinárně hlasitost takže se tam přidává nějaký schémátko který se snaží nějak

reflektovat i ty nelinearit a na jeho konci

vyjede takováhle pěkná matice

má to nějakej prostě

N parametrů a tenhle tu sadu parametrů dostaneme každých deset milisekund takže vlastně když si představíte třeba vteřinu řeči tak

za ni dostaneme sto takovýdle pěknejch textu

s těma vektor má děláme dál na ten _e do takzvaných gaussovských modelu

který _e

mají nějaký parametry takováhle gaussovka ve dvou z rozměrným prostoru má nějakou střední hodnotu má to nějakou kovariancí která určuje

ten kopec vypadá

_e by to bylo ještě složitější tak _e to není jenom jednou se stal můžeme ji mít X mě

a pořád i tady tohleto původně vzduchových jednoduchý příkládek protože já vám to tady ukážu ve dvě de až do

vůbec lo zobrazit a vyplotnout akorát že tomu vonné to většinou tak ve třiceti devíti de

X touž potom moc představit nejdéle počítat s tím do úplně a každý z těhletěch _e tyhlety modelu nám dá

_e nějaký číslo

a na konci máme takovou slavnou for bulku do vlastně je pravděpodobnosti dat když viděli kluka apriorní pravděpodobnost luká pak

pravděpodobnosti dat

na tu pravděpodobnost zase vykašleme protože na to nějak moc neumíme spočítat ale naštěstí je to pro oba dva případy

stejný apriorní pravděpodobnost taky většinou neřešíme protože si řekneme že možná těch kluků je tak jako stejně těch holek a

zbydou mě tady tyhlety dva výrazy které dostanu mých sony gaussovek takže srovnám tak toho bude kluk anebo takže to

je princip

nejjednoduššího

detekčního a vzory

samozřejmě tohle moc jednoduchý jo to jako řeknete s tady slovy předvádí tak může to být tady určí tady tohle

_e kousek _e nějakého článku který napsal na zaměstnanec vo právě adaptaci systému pro rozpoznávání řeči na jinou akustiku

tady _e _e jinej trošku určí _e tohleto je součást tak zvané a je vektorové metody

rohu úpon používáme pro rozpoznávání mluvčího a funguje prostě mnohem lépe než všechny ostatní a když se bude zeptat proč

a je vektory tak _e _e vono to tlumené jako touto variability s a spisy strž zní hrozně vědecky řešme

kolegové hledali nějaký sexy termín tak říkal že tak dobrý tak tady I port imax

I I I P nebo jak se to ne ne všechny ty a já je tak tomu budeme říkat a

je vektory a ujalo se to a teďka no tak říkaj všichni

_e tohleto je zase nějaký jako parametry noční schéma do kterýho mícháme je neuronový sítě

a abych vás úplně dorazil tak todleto je rozpoznávací síť která bude třeba pracovat tygrovi je _e rozpoznávači na _e

na přednášky akorát že tahle jestli se pamatuju tak dokáže rozpoznávat dvě slova tomu ještě dva fonémy většinou tam těch

slov máme tak tři sta tisíc plus eště nějakých

pár fonému k tomu takže by mě to zabralo asi tak

mohou se lišit než by se vyplatí

co si ale prosím vás jako tady všimněte je že se tam používají jakýsi _e konečný stavový trendy si nebo

konečný stavový automaty abych tady možná ještě to co se to řek

tak a teďka

taková diskuze ti lidi to dělají proto aby

se mohli vytahovat samozřejmě

soutěží o rekord počtu rovnic na centimetr čtvereční

někdy jo ale myslím že matematici jako nastane dostávaj byli atraktivnější pro holky to nevím teda

možná někdy jo když se podíváme přítelkyně a manželky členu se laboratoře tak to není špatný

a protože na barcampu ještě dneska nebyly žádné rovnice tak já tady mám teda proč to děláme opravdu

protože tam matematika má vždycky smím smyslová my chceme aby ty naše rozpoznávače byly přesnější rychlejší odolnější vůči všem těm

změnám mezi řečníka má krásnýma kanálama a tak dále a to je taky hrozně důležitý _e datalog který tady povídal

s igor tak sou neskutečně drahý

u tím musíte za drahý peníze kupovat anebo je _e musíte sami vyrábět to že neskutečná v rvačka takže _e

chcete aby vaše algoritmy potřebovali ní nic a pokud možno nějakou velmi špatně a nebo vůbec popsán

tak kdo to dělá

výčet si skupina která má asi tak třináct let trvání

_e současné době zhruba dvacet lidí šéfuju tomu tři lidé tady tenhleten pánská vo u kterého jinak prakticky lněný není

vidět tak mi lukáš burget

současné době právě _e na stanfordu jiné germánský rakovina guru a světoznámý profesor zpracování řeči a tady moje maličkost která

se snaží nějak řídit haně proto peníze

tak na čem to děláme tohleto je oficiální té který píšu jako rose grantový cihláři ale prostě hodně šrotu takže

tu pokud máte doma nějaký důvěra vo jádrový počítač

myslíte si to je dobrý nebo osmi jádrový tak je to dobrý samozřejmě ne minimalizovat pět set

tohleto ale je zhruba _e místo na našich discích abych jako

se jenom nechvátali ty máme teda dat tak tohle do S mínus T

v linuxu můžeme cosi protože co to znamená nějak nějakých partnera tam bude pořád přibývají pořád jsou doplněny

a toto je nějaký graf C K cpu czech našem dávkovém systému jezdí

tady na té ose je nějakých osum set současné době nebo tak polovina průměrně toho bývá toho bývá _e

použití

tak kdo to všechno platí a neměli na výplaty tak samozřejmě něco fakulta ale zhruba čtyři pětiny si musíme pohánět

sami takže evropské projekty americké projekty a lokální projekty zatím se dycky aby to financování skupinu stálou na třech no

a

a teď která čím se klasy nejvíc T mluvíme tak je darpa projekt který máme sednou významnou americkou firmou darpa

jestli si pamatujete si jestli jste četli někdy nějaké historické trakt _e ty tak financovala takovou drobnost obrazy internet

tak _e dělat u nás průmyslem

phonexia superlectures tady zazněli jako dvě vlastně naše _e nejsem si dva naše úspěšné synovci

pak sou tady prostě světové významné firmy _e taky někteří lokální hráči například lingea africe _e vážený a tradiční partnerství

matice že máme asi třetí prvek

tak tetě se dostávám závěru proč bych to měl dělat také tak teďka vám budu možná se uštvat protože já

jsem jednou jel trolejbusem takhle to musí nějaký dva takový kluci kteří by asi tak metr dvacet vysocí aby to

radoval tak na pátou třídu

povídali o nějakým P a péčku jo a tak o tom pálilo a já sem minusky dostal

otevřenou posouvá nechápal sem ani desetinu tohoto říkají

takže takové ty věci jako

ve a a php a kaskádové styly a tak dále to je jako hrozně pěkný ale vopravdu se touž teďka

učí kurzech informatiky na základ

takže možná jako když nechcete zůstat na této úrovni tak byste mohli dělat něco trošku drsnějšího

_e

to zpracování řeči drsnější je

protože se tam míchá matika _e trochu i fyziologie

trochu i _e rozpoznávání klasifikace ne šílený _e a tak dál a tak dále a přitom si myslím že to

užitečné se prostě jako to má spoustu komerčních bezpečnostních já nevím nějakých aplikací který se tedy věděli

_e dá se na tom taky celkem

vydělat

neříkám že plat výzkumníka s ty vždy v naší skupině jakou kdovíjak bombastický ale pokud chcete více taky pořád možnosti

ste dobrý se nechat _e zaměstnám microsoftu ibm nebo googlu který mě neskutečně a pořád bombardují ozónem váš nějaký dobrý

lidí ozónem až do brýlí

tak jako

dá se a pokud byste chtěli ještě více peněz tak se můžete nechat zaměstnaná vostrý a tady si nedělám srandu

protože _e ty algoritmy které se používají nefinanční analýze rozkradou časových hřát já nevím predikce odhad rizik

tak sou postavený na tom stejným aparátu jako to co děláme my kdybyste sama chtěli dělat něco už teďka tak

jako občas víc zmínit podporujeme i studenty poslední z bot který sem tady napsal spíš jako pro lidí mého věku

je mám pocit že oproti svým spolužákům

jiří třeba jako dělají nějaká standardní zaměstnání tak rovnou něco pomaleji ale tu

musí posoudit oni nebo vnějšího tak co pro to mám udělat když byste chtěli a

té vladimír iljič lenin

a já jsem si vyrůstal za komunismu takže nám říkali že on měl heslo učit se učit se učit se

což není tak úplná blbost že _e to tady našem oboru platí a si vezmete seznam tady těch kurzu nebo

věcí který by naši lidi měli umět tak jsou to

velké většiny vinnej nenávidí nižší kurzy tady na fakultě jo

takže lineární algebra statistika B teoretická informatika B a tak a tak dále a tak dále u té teoretické informatiky

bych chtěl říct že všichni _e lidi nevím kolik vás _e dělá si tak když se přídou do prváku magistrála

mají tam ty _m teoretická informatika u profesora češky tak soustavu zděšení a ty vylítávaj Í

toho a přesouvají se na masarykovo univerzitu kde prý de nějak projít magistr westerny s informatiky

tak já bych vám chtěl říct že když přijdete do řeči a tam _e na vás najednou vypadne pět minimalizací

_e konečných automatů tady _e pro pro věci které dělají vzor tak najednou jako rádi vezmete skripta stínovat bude existovat

o čem to vlastně

tak _e pak jo napětí o třeba programovat

ale narozdíl cílem je to spíš takovej experimentální guláš jako vaříme prostě věci aby rychle fungovaly

a co je asi nejdůležitější tak je přemýšlet o výsledcích chtít přijít věcem na kluk nejenom prostě to jako pouštět

a napsat výsledky někam a hry

tak

to byl konec nic

jich nitře děkujeme za pozornost kdybyste chtěli další informace tak sme tady nebo si nás najdete možných webových stran