0:00:15takže můžeme začít
0:00:17tak já vás tady vítám emisi dorost a
0:00:20vám tady s kolegama řekneme něco o tom jak se důl informace z řeči a co ani google neumí
0:00:28tak
0:00:32kolik dva milouš na nějaké velké konferenci něco jak třeba tady parkem webexpo podobně
0:00:38hezky paralelní sekce teď to tam vaří všechno i nevíte kam máte i dřív
0:00:45dobrý dobrý spousta lidí
0:00:48tak takový na to by tomuto
0:00:52když se podíváte nahoru tam
0:00:54tady máme kamerky
0:00:56takže nahráváme to a
0:00:59bude to všechno potom co jsem přístupný někde na internetu takže se můžete dívat
0:01:05nicméně to je celkem běžný to asi znáte
0:01:08tak jiného soudku
0:01:12do z vás má
0:01:14takovou zkušenost
0:01:16přednášek tříhodinových
0:01:19dlouhých
0:01:20první přednáška druhá přednáška tak tam byly toto přestanete chodit
0:01:26patří do vánoce tak si dáte kapříka řekněte na paštice
0:01:31copak přijde
0:01:35zkouškový
0:01:36protože se učit a terči
0:01:39dohánět je všechno co ste
0:01:41co se minuli
0:01:43no
0:01:45a
0:01:47někteří studenti naši fakulty tím že se tady nahráli přednášky
0:01:52tak zasednou k internetu
0:01:55zrovna web server a sme video server
0:01:58začalo to hat takže motorovou pilou na železo řeknete tu funkci na S přesně podle imaginární osy rozhraní takhle zvuku
0:02:07podíváte
0:02:09jo a koukají a určí se prostě a rychle rychle rychle rychle vstřebávají všechno co jako neviděli během semestru
0:02:16a zjistí že teďka jít a já se osumnáct hodin usmáli na zkoušku a musím ještě zvednou třicet dodíval
0:02:22jsou obraz tak
0:02:25takže zrychlení
0:02:27řeknu _m do inte u unk na S minimální si ukážeme pokud máte nepřímo a je omega nordistovými tam kde
0:02:34runge nabídnout _e jméno
0:02:37no a jak si myslíte že to dopadne
0:02:43není smál
0:02:45takže
0:02:47tudy cesta nevede
0:02:51když potřebujete něco najít ve hromadě nějaký textový dokumentu
0:02:55cože podstatě celej internet co uděláte
0:02:59zavolat esíčka hugo
0:03:01strýčku tričku co je to fourierova transformace _e zrovna transformace přijde dřevěné tyče ukázat deset milisekund a máte padesát milionů
0:03:10se
0:03:11jo pohoda
0:03:12jenže teče uklouzl vydá lidí jo ste si problém
0:03:17A jo prostě video se můžete
0:03:20můžete koukám na celý ale prostě v tomhle zatím
0:03:24špatná zpráva
0:03:26nenastala
0:03:29sme tady mi
0:03:30místo umíme
0:03:32takže
0:03:38představte že máte takovou přijmout ranečku máte nabídek o tak jako na jo tu můžete si oka na přednášku
0:03:46máte u toho slajdíky takže vidíte
0:03:49hezky pěkně čitelně to co je na tom výdejku tam vidět
0:03:56máte to synchronizovaný držíš máte poznámka na třicátým padding slajdu _e načtete přednášce přednášky si mluví o tom že to
0:04:02bude na písemce tak si rychle kliknu se hezky hnedka tu vidíte
0:04:08máte to přepsat do textu takže se tam krásně můžete orientovat přičíst divoce hlavně
0:04:14vyhledává
0:04:18oknem
0:04:21koukneme
0:04:23v praxi
0:04:25služtička se menuje todle čas
0:04:29barcamp se nahrává bude tam tak za tejden čtrnáct dní se nám podaří bude prostě tady přístupní takže si sami
0:04:34můžete vyzkoušet
0:04:36vyhledat navigovat rychle
0:04:38jo takže zkusme si prostě
0:04:41potřebujete se tady naučit
0:04:43no výborně
0:04:56že budete rychle zjistit se to fourierova transformace
0:05:05znáte
0:05:08tahle přes přiběhnou neska vidíte
0:05:11i přes riziko
0:05:14dneska vidíte deset o přednášce říkalo jo tady se o tom hodně mluví volnýho původní jo
0:05:21no to symetrické podle si svého u nesymetricky na mínus X mínus T je základní vlastnosti
0:05:32nervy transformace fatální by bylo dobrý že _e když jsme se s času dostali do spektra
0:05:39nedostatek nazpátek že
0:05:41vememe _e zpětnou fourierovu transformaci
0:05:46tak už
0:05:47si tady
0:05:49po klikat synchronizovaný slajdy
0:05:55_e takovéto
0:05:57jednotkového impulzu
0:06:00tak
0:06:02bylo
0:06:04demonstrace vše
0:06:11tak se abysme povídali jenom o tom se vlastně jako zvenku jak to vypadá
0:06:17tak se podívám i
0:06:19to je uvnitř velice lehce
0:06:22rozhlas má nějaký ve gram počítačový prostě vidí programuje
0:06:30S lidí výborně
0:06:31tak těm tohleto musím vysvětlovat
0:06:35jo to je jenom takový schémátko toho co je uvnitř
0:06:41vy co programujete si to dokážete zhruba představy bytostí možnosti nemáte dobyto stejně dlouho
0:06:47řekneme si jenom velikosti
0:06:50to
0:06:51důležité vlastně z našeho pohledu tady tahleta krabička co která nějakým způsobem teda audio dělat toho něco se přes závislé
0:07:00no tak
0:07:01velice zjednodušený jestli to můžete představit ano
0:07:06jo nacpete do toho audio mikrofonů tady teďka mluvím
0:07:11natočíte kličkou vypadne vám je text něco co se dá
0:07:15za indexovat čemuž prostě standardní počítače me
0:07:19pěkně pro co
0:07:21co to umí
0:07:23je to tak a krabičkách kterou musíte naučit
0:07:26a chová se to stejně jako u malé dítě tak jako můj synek
0:07:30ten umí to co nauč
0:07:34jo zatím až bude starší tak US čísla
0:07:38takže
0:07:39na tu krabičku musíme nějak naučit a tu krabičku určíme takže vezmeme prostě velký kvanta řeči tu řeč musíme mít
0:07:46přepsanou takže přesně to musím poslouchat na slovo co přepsat a tyto informace vezmeme strčíme to
0:07:54zase zatočíme nějakou čipsy kličkou ono se to prostě naučí rozumět _e řeči a převážně ten signál textu
0:08:03takže
0:08:05naučí se to přesně to
0:08:08co to naučíme tudíž tak jako já bych vzal svého synka proto aby otočí on by měl čínsky
0:08:14přestože se neuděl na _e narodil čechách prostě jako by zadeček prostě v domě prasečí
0:08:21že opravdu spojených státu bude umět rozpoznávat krásně mluvit krásně prostě americkou angliš
0:08:29Y novej how
0:08:31experiment a nacvičují
0:08:33pole nula
0:08:35jsou
0:08:36S barcamp jestli kódy ten byl byly okna špaček vykonaj
0:08:40you ten čaj
0:08:42how věneček rico mail vykonání na u maticových síť
0:08:47ze vejplata
0:08:48ale a je to mnou od dozvíte op a dobře
0:08:54takže první věc audio jazyk jo rozpoznávače prostě závisí na jazyků tak jak naučíte ten jazyků
0:09:02druhá důležitá věc je com
0:09:07jo nebo my ho naučíme nějak slova třeba sto tisíc přes sto padesáti anglicky to or umí rozpoznává tady tato
0:09:14slova ale prostě vám rozpozná ani o slovo navíc který sto předtím nenaučí
0:09:18mimoto
0:09:20on umí on preferuje to pořadí slov tak jak toho naučit
0:09:24jo prostě si to nějakým způsobem pamatuje
0:09:27takže
0:09:30když to naučíme na standardní tuzemské hospodské řeči
0:09:38představte si jo budeme mít výraz spoustu takle nahrávek ve teďka ty studenti přídou do té hospody po zkoušce a
0:09:45sinus nula ty vole se rozdělí dneska byla zkouška
0:09:50já jsem to tak postaral že to není možný prostě mě v něm vyhodí úplně prostě a stojí
0:09:56jo tak té rozpoznávač bude mít tento naučený krát slovník a budou P se
0:10:03takže pak příde krásná vážná sence vymete vy vemete tento rozpoznávač a budete se diví že za každou čtvrt obětuje
0:10:12ty vo
0:10:15což se nám stalo kdy jsme dělali přenosový systém tady tak jsme tam měli tak u češtinu a pak prostě
0:10:20soudní procesory tady jako mluvili občas vulgárně
0:10:25takže jsme samozřejmě oni nemluvili jako ale ty předpisy vzdálený takže sme museli vyhazuju žádný slova torusu rostou slovníku toto
0:10:32celkem fuška tam
0:10:35jo
0:10:36takže další důležitá věc když byste někdy příště to styků prostě rozpoznávače mám pamatovat si omezeny slovní
0:10:42a omice a roklina domén vona tak jako naučíte na doménu když ho naučíte na nějakou běžnou fotkou řešte prostě
0:10:49to bude preferovat jo a když budete chtít přejít na nějakou normální prostě na nějakou tady televize nebo cokoli takovýho
0:10:57tak se musí hodnotu jo to znamená když zase aby se začal přednášky nějakou básničku rozpoznávač to bude totálně zmatenej
0:11:04což nenaučili že např
0:11:09což mimochodem tomletom rozpoznávači to prosazovat které sem řekl taky jo takže si zase můžete zkusit prostě jako zjistili pořád
0:11:21takže na závěr co bych chtěl abyste si odnést
0:11:25rozpoznávač řeči krabičkách právem no to nahoře dostanete v nějakém fondu a vyplivne mám na výstup nějaký text něco čím
0:11:34se dá potom ušní a pracovat klasický také třeba googlu nebo cokoli
0:11:39je to prostě nějak text nějak slova ty slovama tím vývodu že mají se částečně sepnuta pak jednoduše vyhledá
0:11:49rozpozná jen to na to byl naučen A jazyk akustický prostředí slovník
0:11:55popis prostě stylu mluvy tak jak bluffovat se
0:12:01plně na závěr
0:12:03superlectures sou nahrávaný budu rozpoznaný zkuste si po přednášce pokuď máte někdo pocit že k tomu máte co říct jako
0:12:12zajímavá sou chcete spolupracovat cokoli přijďte za mnou o zvlášť jestli jsou tady z naznačen si to mají rádi I
0:12:18com ajpek při té za mnou na seznam o něčem pobavím
0:12:22sledujte twitter panter barcampu jak to budeme indexovaný někdo bude nějakej když už to máme hotový takže si pak můžete
0:12:28za domácí úkol může schválně podívat jak rozpoznávač prostě
0:12:33se vypořádal můj angličtinu a
0:12:35se
0:12:37prostými slovy který sem tak
0:12:39takže to je za mě všechno jo tady předám
0:12:42slovo
0:12:43péťovi který vám řekne
0:12:46něco
0:12:47vyššího dalším technologií
0:12:52mimochodem i nějaký dotaz
0:13:01takže
0:13:26no
0:13:27_e
0:14:39tak _e nějak rychle jestli phonexia _e ta ta vznikla řada založena lidmi právě tady sme u té a dostáváme
0:14:47se řečové technologie z celého světa
0:14:50já vám oj něco jaké sou technologie jestli jak můžete věk stravovat z řeči aneb forma
0:14:58proč jsme se tady tím vlastně zaznačily zabývat se je to kvůli tomu že vidíme že kolem nás je v
0:15:05oblasti množství informací každý den se díváme na televizi diskutuje mezi lidmi díváme zaneseny testem internetu telefonujeme a této informace
0:15:17je podstatně víc než textové informace bohužel
0:15:21toto většinou kolem vás projde sem tak něco zapamatujete sem tam ne ale většina této informace se v dnešní době
0:15:27ztrácí
0:15:29_e jen tak se to tady u co bych se chtěl zmínit si je to jaké sou řečové technologie ne
0:15:35k dispozici co umí chtěl bych navazuji se kdy se budeme tak teď to řeknu dva _e setkávat a i
0:15:44pro vás _e jaké třeba můžete použít se zapojit
0:15:48tady je na _e
0:15:51igor třeba ukázal nádhernej příklad se
0:15:54_e přepisu sou řeči já že bych jenom si že informace _e
0:16:00_e řeči podstatně víc
0:16:02víš třeba užitek druhu jsme nebo další službu není to jenom _e ta very na kterou se ptáte kterou kterou
0:16:10václavu získá ale ty řeči jezdit je třeba když takhle tady s access rozdíl došlo čtyř kategorií je tam informace
0:16:18o mluvčím je tam informace o obsahu
0:16:22ale u to informace o prostředí technice
0:16:26co se týká třeba mluvčího jestli je to jazyk dialekt _e pohlaví může to být vzdělání řečníka
0:16:34tak dál
0:16:38technologie který který má zabýváme mí E chcete tak jsou uvedeny na tomto slajdu je to třeba přepis řeči
0:16:47se který _e
0:16:49budete moci zkoušet _e vlastnosti superlectures
0:16:52ale toto je jednodušší formy sme detektor klíčových slov a můžeme identifikovat jazyk neschopný identifikovat pohlaví
0:17:02_e sme schopný desinfikovat konkrétního S
0:17:09tak _e to co se týká přepisu řeči
0:17:12_e
0:17:13pomoci přepisu byste schopný získat _e řeči doplňkovou informaci kterou potom můžeme tím nechápu potom může použít klasický technologie na
0:17:22indexování textu a ste schopný toto o co je to k audiu dohledá
0:17:28_e tady sou dva projekty ty na který sto můžete vyzkoušet přepis řeči cz je projekt jestli můžete zavolat si
0:17:38tady něco nadiktovat a podívat se i rozpoznávač
0:17:41funguje pro vaši řeč
0:17:43před přednášky nebo superlectures bude se kdy svazu parkem
0:17:47můžete získat určitou pře
0:17:51_e to co se týká kvality přepisu
0:17:54vzorů zmínil _e pokuď je ten _e rozpoznávače adaptovány na konkrétní doménu může být medicína právo I P většinou teda
0:18:05přepis je téměř dokonalý můžete očí ste nemůže to prezentovat pokuď sedí adaptován tak _e většinou ten přepis je na
0:18:13takový úrovni že ste schopni pochopit obsah toho textu
0:18:21tady jen pro představu jak funguje takový rozpoznávač který vidí adoptovali na konkrétní domén
0:18:27vidí se
0:18:29nahoře originál dole je _e to rozpoznávač před
0:18:35toto třeba bylo
0:18:36pořízení pozici číslice
0:18:41teďka co je důležitý je že já jsem řek tady vidíte že vám přepis řeči a ale i sami nějaká
0:18:48chybu když to použijeme obecnej tech
0:18:51se důležitý ten přepis řeči nemusí
0:18:55právě _e poskytovat i jenom ten přepis tu nejlepší variantu ale ten přepis se
0:19:02umožňuje nám vrátí ty alternativní slova se z toho důvodu jistě tyto technologie ještě asi nebylo důvodu dobu dokonalý to
0:19:10kvůli tomu že po za počítač nezná fyzikální souvislosti nezná vaše vztahy kamarády když si unk _e se to třeba
0:19:18mění a ale dítě dopravy těžkých domýšlet nějaký věci to co třeba nerozuměl já
0:19:28další technologie _e je _e detekce klíčových to detekce klíčových to je to takové jednodušší přepis ale
0:19:37co je dobrý Ú forme _e je
0:19:40že se algoritmus je rychlejší ze ze _e
0:19:45tímto puse pokrýt daleko větší množství jazyků a
0:19:50třeba D
0:19:51používá se třeba na monitorování nějak nějakých televizní vysílání konstrukce práce operátorů vkusem se tak dál
0:20:02tak se mi jim o důležitý technologií je
0:20:05která což což je identifikace řečníka
0:20:09dost často se je lidi ptají _e
0:20:13jestli _e je nějaká řečová technologie která funguje podstatně líp nebo
0:20:19předčila u člověka to tohle to je zrovna jedna sme se smyslových kterým se to stalo
0:20:26ono to
0:20:27když zkusíte když se ze třeba tisíc nahrávek a chtěli byste to mají konkrétního řečníka znovu porovnat dva řečníky detekce
0:20:35klíčových D slyšíte čtvrtou nahrávku tak už víte zněl se první říční tohlencto ta technologie mít
0:20:43i v dnešní době už ze _e v podstatě z nahrávky i spravovat masovej vo ti
0:20:49což je záznam který má jenom šest set bajtů to teda pár čísel a ti s tímto toho člověka unikátní
0:20:58_e potom ruce zajímavý T tak tajle si hlasují otisky můžete mezi sebou porovnávat takže během _e
0:21:07sekundy schopný porovná se milióny hlasových otisku ste schopni dohledat o informaci kterou potřebujete
0:21:14se taky zajímavý
0:21:17_e etapy a chce zdi zde si zmíníte těsně si dělaj ty úrovně je default dvě sou tady toto je
0:21:25technologie která se v dnešní době nejvíc V V a že dva roky podobně jako moorův zákon se klesne chybovost
0:21:31ati tady ty technologie na polovinu
0:21:34takže ze třeba _e určitá vadit je tady ta technologie bude prvky době a tím telefonu proces bych K
0:21:46pokuď chcete dělat nějaký systém pro vyhledávání audia na internetu důležitý je vůbec na začátku když použijeme rozpoznávač řeči
0:21:55vůbec se identifikovat jazyk tato technologie je dnes taky k dispozici je funguje to jako trénován V D klasifikátor T
0:22:05C takže vy vy si vezmete nahrávky v několika jazyků a tenhleten klasifikátor apod potom ste schopni rozpoznat podstatě libovolné
0:22:14jazyk
0:22:14zboží dialekt toho jazyka
0:22:20říká se kdy se teda budeme s řečovými technologií by jedný běžně setkávat
0:22:26v dnešní době sou tyto technologie E už běžně dostupných použili jako
0:22:32používají je zpravodajský složky potom už možná ste neuvědomím nic _e ale každý den tyto technologie
0:22:40tati chrání vaše životy
0:22:43sobě říct že omezujícím faktorem pro jo široký N na nasazení těchto technologií _e aby opravdu byly kdekoliv na internetu
0:22:53tak taky většinou kvalita řečový ho záznam
0:22:57to je je důležitý je tady třeba vhodné nezmínil ta kvalita toho přepis řeči _e za záleží na tom hodně
0:23:05na vzdáleností mikrofonu o C
0:23:10řečníka jak mikrofon mám
0:23:12těsně u musíte zažitý se záznam bude paritní _e
0:23:16závisí to na na neřečových událostech teda šumech
0:23:20a taky _e množstvím
0:23:24kdy se používá já záznamových zařízení opět _e je složitější to si dobrej rozpoznávač
0:23:30takže řešení matici a _e vlastně tím posetou u port posune tak je do hardvér
0:23:38_e lepší algoritmy
0:23:42takže technologie _e dovolá R R
0:23:45vidíte dnešní době sou objevuje přepis řeči nebo rok rozpoznávání řeči a mobilní telefony proč tomu tak je protože i
0:23:55mobilní telefony E i děti na tak je potřeba _e jakýho lepšího vstupu I nasypu využívat vyráběji milionových který se
0:24:05takže ten samý mikrofony použít _e _e
0:24:10věc miliony měli měli
0:24:13co je důležité dat další důležitý zařízení který prvky době tento sekvence ovlivní je _e mikrofonní pole co koši je
0:24:21_e nějaký sada mikrofonu a to zařízení vám umožní potom nasměrovat
0:24:28přichystat tady sedíme přednáškový místnosti tak jako paprsek a přesně zaměřit a konkrétního člověka který mluví toto zařízení bylo
0:24:38nedávný minulosti zas velmi nákladný ale v dnešní době uši takový zařízení jako je _e microsoft C
0:24:46kyne zase _e takže toto myslím si že
0:24:51opozicí zpracování řeči ovlivní
0:24:53další věc _e se který v dnešní době není problém
0:24:57i mikrofon tady ty takovej halejte zda
0:25:00nedá se
0:25:01ten
0:25:04teďka něco pro vás se jakým způsobem za se zapojit se _e pokud _e toto za zaujalo _e
0:25:12my rádi uvidíme _e inovativní lidí inovativní firmy po pokuď se třeba stala spolupracovat ráta technologie k dispozici jakož _e
0:25:25lze K přepis řeči _e za ni
0:25:27výpadu dá zlepší nešlo důvodu týká identifikace řečníka to tak se na si to ve špičce té a takže
0:25:36chcete na začít pracovat taky zadávací my budeme rádi
0:25:41pokud pokud udělá
0:25:43samozřejmě hledáme tady každou chvíli na spolupracovníky se
0:25:48taky jestli za spousta pozic
0:25:50a pokud vás zajímají přímo ty technologie chcete typ posouvat dáte se tady bude D T
0:25:58další _e přednášku za černocký E zde tyčových op ty piny je tady opravdu _e
0:26:07možnost mezinárodní spolupráce není problém dostat lidi třeba na sem force srší spisů zbyde kterýho vlastně z kopce výsledek odlehlý
0:26:17dobu u do microsoft
0:26:19tímto institucemi
0:26:20open sem
0:26:22takže to je všechno bude ode mě předám slovo tady _e
0:26:27černocký mu pokuď chcete vzít někdo vizitku na na nebo
0:26:31kontaktovat
0:26:32_e
0:26:33_e přičte bůra
0:26:36jaký otázky
0:26:55o o _e do tady tyto technologie _e se zavání postupně pes právě ta tady ty _e komplikace _e to
0:27:02tomto má ani
0:27:04_e sme si řekli že že by největší zvíře se to používá třeba pro kontrolu vlastních operátorů protože zas aby
0:27:13aby kontrolovali vás to potřebuju sebou aby _e ty kladné získal informace o vás potřebuju třeba u ale toho je
0:27:21i jestli jich operátor máme na dáván
0:27:27nemluví sláma prostě alu vopravdu vám poskytne tu informaci co má se tak tohle to je největší oblast kde se
0:27:34to těch call centrech používat právě
0:27:38co se týká _e
0:27:40párování jezdil u atomem to si myslím že je _e
0:27:44i bude několika ta X letech
0:27:48za další oblast takže já si myslím že se tady ty problémy is
0:28:17_e
0:28:17_e o o takle po pokoji ty _e řečový technologie postupně se dostala do praxe _e
0:28:24ne nej největší komplikace kterou se tady tady cyklostezka _e řešili ten takle byla kvalita vlastních lidí tak se takže
0:28:32tam cena nasazený podporo _e právě _e P zákazníky ta samá
0:28:39to používá Í zase záleží na legislativy K konkrétní země je je třeba evropa je dost dost konzervativních v tomto
0:28:48_e if že potřebujete vždycky vyjádření
0:28:52_e příslušných úřadů F
0:28:54co se týká třeba ameriky a asie se takto prosím
0:29:13o o po ono _e je pokud byste si chtěl slyšet konkrétní číslo že se těžký protože když vždycky si
0:29:20nenajdete _e ně nějakou sadu testovací na který se dosáhne stoprocentní úspěšnosti rychle se mluvit člověka s marketingu tak všechno
0:29:29tvrdí to prase na sto procent se _e
0:29:33řeknete řek by _e když když budu mluvit _e jako technik ta tak _e _e
0:29:40toho přepis řeči se to může být _e _e
0:29:44_e mezi padesátiprocentní zjištěné datovaný systém nebo devadesáti procent se když to je _e
0:29:51systém adaptovaný na tlumené
0:29:54toho řečníka ste schopen už najít _e prostě osobu
0:29:59tisícinu desetitisících nahrávka
0:30:01o čas sem tam se jsem udělal chybu ale když hledat někoho to tak se něco na internetu po pokuď
0:30:08máte tisíc _e _e třeba stránek nebo tisíc záznamu a pokud
0:30:13prohlédněte si prvních deset a má stav informací srdce se jako zákazník
0:30:17pokoj
0:30:18to se tadyhle _e to tady ty
0:30:22se jsem se nesrůstá
0:30:37to tohle se všechno statistice pokutě _e tyto systémy se trénují řádově naval namiřte a na na předpisech vo T
0:30:47tisíců řečníků po pokuď trénovací sadě byl data to chyba třeba zastoupena byla vždy tak blízko se tak se s
0:30:55tím vyrovná pod pokud ne tak to může selhává a ale si třeba na naše rozpoznávače pro angličtinu do trénován
0:31:03na lidech _e
0:31:05real zpětná se takže celý funguje perfektně na nerodinný angličtině kde každý si tam začnu trošku nějakým způsobem komorní
0:31:17dobře děkuju rámci o
0:31:47tak děkuju zapózoval nějakou petrovi do toho docenta černockého dybyste mně viděli dneska dopoledne let po stromech švestkový charlesi například
0:31:54tak byste si říkali to je zase sending jenom taková úmorná sinusovka já bych chtěl chvilku popovídat o tom se
0:32:01pozadí _e phonexia a super vlečnou trity krásný firem a projektu který se tady teď viděli
0:32:08tak
0:32:09_e
0:32:12je to výzkumná skupina které říkáme D hodí spíše si výhod jako brno university of technology takle nás lidí většinou
0:32:19znají venku tady na domácím písečku je to většinou spíše si asi by vám říct jako
0:32:25tím trošku jak to děláme kdo to dělá na čem to děláme kdo to všechno platí a možná něco pro
0:32:30vás proč byste to měli dělat také a když teda jako by se vám to líbilo takto proto máte udělat
0:32:36tak jak to děláme _e vlastně když si vezmete nějakou knížku a učebnici vo _e rozpoznáváním nebo v o detekci
0:32:44nebo vo mistrovi učení tak tam na uvidíte tady tohleto základní schéma tady nasbírat data nějaký dotaz perimetr zouvat nějak
0:32:53se rozhodnout jaký bude modelovat
0:32:55a ten model natrénovat pak _e to zbavovat nebo zjistit jak to funguje na nějakých neznámých daty a zjistíte toniku
0:33:03nechodí vůbec a pak následuje prostě N
0:33:07desítky stovky tisíce takovýhle koleček kdy už musíte nasbírat víc dát nebo lepší parametry lepší model líbo natrénovat a tak
0:33:14dále až nakonec prostě už tu práci máte odevzdat tak tady potom jako _m přichází nasazení a pak se klepeto
0:33:21jestli to bude fungovat i na těch datech vašeho partnera projektu nebo _e nebo zásadní _e takže
0:33:28modrý schémátko přesně podle knížky kterou si můžete za padesát u
0:33:34co je výsledkem
0:33:35takovýhle schéma který je zase _e vlastně strašně jednoduchý myslím principu to tedy audio nebo řeč
0:33:44vypočteme nějaký příznaky
0:33:46pak vyhodnotíme pomocí nějakých předtrénovaných motyl modelu nějaké pravděpodobnosti nebudem taky říkáme věrohodností a na konci přichází blok dekódování na
0:33:55jehož konci musím udělat rozhodnutí a já vám zkusím tady tyhlety bloky přestavěna takové nejednodušší úloze k _e kterou se
0:34:02asi setkáváme a to je _e případ rozpoznávání pohlaví
0:34:05to znamená stupuje řečová nahrávka a na výstupu mám více informace tyto kluk nebo holka
0:34:11na že se nekousněte ale _e tohle je aplikace která je důležitá která případě z desetitisíců telefonních hovorů nám pomůže
0:34:21omezit C ten hledací prostor na polovinu asi ze všech který tady jako umíme uděláte to nejpřesnější protože tam sme
0:34:27na nějaký devadesáti devíti
0:34:29_e téměř to procentech podle toho na jakých datech se to _e s pochvaluje takže trošku detaily toho severní napřed
0:34:37nemáte ní samozřejmě
0:34:39tak má teda právo spousty kluků
0:34:41těma data má si představte prostě adresář plný wavek
0:34:45jo který vám namluvily tady tyhlety kluci máte tak to taky data od holek
0:34:50tak tady tyhle těch dat _e na trénujeme nějaké gaussovské modely tak unk vám tady _e se kterým takový hrůzostrašně
0:34:58téma
0:34:59a _e když tady tohle máte hotový tak můžete postavit systém který bude mít tu počítají se tam nějaké koeficienty
0:35:06které reprezentují vstupní řeč pak se to do těch modelů přivede každý z těch modelů kde mi pro kluky druhým
0:35:13pro holky tak vám dá nějaký skóre takže tady sou ty modrý A červenáš tečka
0:35:18na základě toho skóre vlastně rozhodujete jestli teda na vstupu _e sme viděli neviděli kluka nebo
0:35:26že eště eště víc do detailů když se podíváme na ten úplný začátek a řekneme si čím tu řeč vlastně
0:35:32jako budeme popisovat nebo nebo reprezentovat tak si najednou uvědomíte že ta řeč není stejná pořád ze a když mluvím
0:35:38za každých pár milisekund musím s tím hlasem něco udělat abych vám přenesl nějakou informaci jak bych tady mohl říkat
0:35:45soudou a lze hrozně
0:35:48takže tu řeč přes tou parametrizací musím rozdělit na nějaký kousky říkáme rámce vypadají zhruba takhle nějak mám celou půlku
0:35:57přednášky potom potom jako jak mají dlouhý lexém překrývat
0:36:01a pak si taky můžeme uvědomit že to jak mi lidé slyšíme sto není lineární že neslyšíme stejně jako póly
0:36:08uprostřed klavírů letouny navrchu klavírů a taky neslyšíme vinárně hlasitost takže se tam přidává nějaký schémátko který se snaží nějak
0:36:17reflektovat i ty nelinearit a na jeho konci
0:36:20vyjede takováhle pěkná matice
0:36:23má to nějakej prostě
0:36:25N parametrů a tenhle tu sadu parametrů dostaneme každých deset milisekund takže vlastně když si představíte třeba vteřinu řeči tak
0:36:33za ni dostaneme sto takovýdle pěknejch textu
0:36:37s těma vektor má děláme dál na ten _e do takzvaných gaussovských modelu
0:36:41který _e
0:36:44mají nějaký parametry takováhle gaussovka ve dvou z rozměrným prostoru má nějakou střední hodnotu má to nějakou kovariancí která určuje
0:36:54ten kopec vypadá
0:36:55_e by to bylo ještě složitější tak _e to není jenom jednou se stal můžeme ji mít X mě
0:37:02a pořád i tady tohleto původně vzduchových jednoduchý příkládek protože já vám to tady ukážu ve dvě de až do
0:37:08vůbec lo zobrazit a vyplotnout akorát že tomu vonné to většinou tak ve třiceti devíti de
0:37:14X touž potom moc představit nejdéle počítat s tím do úplně a každý z těhletěch _e tyhlety modelu nám dá
0:37:23_e nějaký číslo
0:37:25a na konci máme takovou slavnou for bulku do vlastně je pravděpodobnosti dat když viděli kluka apriorní pravděpodobnost luká pak
0:37:34pravděpodobnosti dat
0:37:35na tu pravděpodobnost zase vykašleme protože na to nějak moc neumíme spočítat ale naštěstí je to pro oba dva případy
0:37:41stejný apriorní pravděpodobnost taky většinou neřešíme protože si řekneme že možná těch kluků je tak jako stejně těch holek a
0:37:49zbydou mě tady tyhlety dva výrazy které dostanu mých sony gaussovek takže srovnám tak toho bude kluk anebo takže to
0:37:59je princip
0:38:01nejjednoduššího
0:38:01detekčního a vzory
0:38:03samozřejmě tohle moc jednoduchý jo to jako řeknete s tady slovy předvádí tak může to být tady určí tady tohle
0:38:12_e kousek _e nějakého článku který napsal na zaměstnanec vo právě adaptaci systému pro rozpoznávání řeči na jinou akustiku
0:38:22tady _e _e jinej trošku určí _e tohleto je součást tak zvané a je vektorové metody
0:38:30rohu úpon používáme pro rozpoznávání mluvčího a funguje prostě mnohem lépe než všechny ostatní a když se bude zeptat proč
0:38:37a je vektory tak _e _e vono to tlumené jako touto variability s a spisy strž zní hrozně vědecky řešme
0:38:43kolegové hledali nějaký sexy termín tak říkal že tak dobrý tak tady I port imax
0:38:48I I I P nebo jak se to ne ne všechny ty a já je tak tomu budeme říkat a
0:38:52je vektory a ujalo se to a teďka no tak říkaj všichni
0:38:56_e tohleto je zase nějaký jako parametry noční schéma do kterýho mícháme je neuronový sítě
0:39:03a abych vás úplně dorazil tak todleto je rozpoznávací síť která bude třeba pracovat tygrovi je _e rozpoznávači na _e
0:39:10na přednášky akorát že tahle jestli se pamatuju tak dokáže rozpoznávat dvě slova tomu ještě dva fonémy většinou tam těch
0:39:18slov máme tak tři sta tisíc plus eště nějakých
0:39:21pár fonému k tomu takže by mě to zabralo asi tak
0:39:25mohou se lišit než by se vyplatí
0:39:28co si ale prosím vás jako tady všimněte je že se tam používají jakýsi _e konečný stavový trendy si nebo
0:39:34konečný stavový automaty abych tady možná ještě to co se to řek
0:39:39tak a teďka
0:39:41taková diskuze ti lidi to dělají proto aby
0:39:45se mohli vytahovat samozřejmě
0:39:47soutěží o rekord počtu rovnic na centimetr čtvereční
0:39:51někdy jo ale myslím že matematici jako nastane dostávaj byli atraktivnější pro holky to nevím teda
0:39:58možná někdy jo když se podíváme přítelkyně a manželky členu se laboratoře tak to není špatný
0:40:05a protože na barcampu ještě dneska nebyly žádné rovnice tak já tady mám teda proč to děláme opravdu
0:40:11protože tam matematika má vždycky smím smyslová my chceme aby ty naše rozpoznávače byly přesnější rychlejší odolnější vůči všem těm
0:40:20změnám mezi řečníka má krásnýma kanálama a tak dále a to je taky hrozně důležitý _e datalog který tady povídal
0:40:28s igor tak sou neskutečně drahý
0:40:31u tím musíte za drahý peníze kupovat anebo je _e musíte sami vyrábět to že neskutečná v rvačka takže _e
0:40:39chcete aby vaše algoritmy potřebovali ní nic a pokud možno nějakou velmi špatně a nebo vůbec popsán
0:40:46tak kdo to dělá
0:40:48výčet si skupina která má asi tak třináct let trvání
0:40:54_e současné době zhruba dvacet lidí šéfuju tomu tři lidé tady tenhleten pánská vo u kterého jinak prakticky lněný není
0:41:03vidět tak mi lukáš burget
0:41:05současné době právě _e na stanfordu jiné germánský rakovina guru a světoznámý profesor zpracování řeči a tady moje maličkost která
0:41:14se snaží nějak řídit haně proto peníze
0:41:18tak na čem to děláme tohleto je oficiální té který píšu jako rose grantový cihláři ale prostě hodně šrotu takže
0:41:25tu pokud máte doma nějaký důvěra vo jádrový počítač
0:41:29myslíte si to je dobrý nebo osmi jádrový tak je to dobrý samozřejmě ne minimalizovat pět set
0:41:35tohleto ale je zhruba _e místo na našich discích abych jako
0:41:41se jenom nechvátali ty máme teda dat tak tohle do S mínus T
0:41:46v linuxu můžeme cosi protože co to znamená nějak nějakých partnera tam bude pořád přibývají pořád jsou doplněny
0:41:54a toto je nějaký graf C K cpu czech našem dávkovém systému jezdí
0:42:02tady na té ose je nějakých osum set současné době nebo tak polovina průměrně toho bývá toho bývá _e
0:42:10použití
0:42:11tak kdo to všechno platí a neměli na výplaty tak samozřejmě něco fakulta ale zhruba čtyři pětiny si musíme pohánět
0:42:20sami takže evropské projekty americké projekty a lokální projekty zatím se dycky aby to financování skupinu stálou na třech no
0:42:28a
0:42:28a teď která čím se klasy nejvíc T mluvíme tak je darpa projekt který máme sednou významnou americkou firmou darpa
0:42:36jestli si pamatujete si jestli jste četli někdy nějaké historické trakt _e ty tak financovala takovou drobnost obrazy internet
0:42:45tak _e dělat u nás průmyslem
0:42:48phonexia superlectures tady zazněli jako dvě vlastně naše _e nejsem si dva naše úspěšné synovci
0:42:54pak sou tady prostě světové významné firmy _e taky někteří lokální hráči například lingea africe _e vážený a tradiční partnerství
0:43:05matice že máme asi třetí prvek
0:43:08tak tetě se dostávám závěru proč bych to měl dělat také tak teďka vám budu možná se uštvat protože já
0:43:15jsem jednou jel trolejbusem takhle to musí nějaký dva takový kluci kteří by asi tak metr dvacet vysocí aby to
0:43:21radoval tak na pátou třídu
0:43:23povídali o nějakým P a péčku jo a tak o tom pálilo a já sem minusky dostal
0:43:28otevřenou posouvá nechápal sem ani desetinu tohoto říkají
0:43:31takže takové ty věci jako
0:43:34ve a a php a kaskádové styly a tak dále to je jako hrozně pěkný ale vopravdu se touž teďka
0:43:41učí kurzech informatiky na základ
0:43:44takže možná jako když nechcete zůstat na této úrovni tak byste mohli dělat něco trošku drsnějšího
0:43:51_e
0:43:52to zpracování řeči drsnější je
0:43:55protože se tam míchá matika _e trochu i fyziologie
0:44:00trochu i _e rozpoznávání klasifikace ne šílený _e a tak dál a tak dále a přitom si myslím že to
0:44:09užitečné se prostě jako to má spoustu komerčních bezpečnostních já nevím nějakých aplikací který se tedy věděli
0:44:16_e dá se na tom taky celkem
0:44:19vydělat
0:44:20neříkám že plat výzkumníka s ty vždy v naší skupině jakou kdovíjak bombastický ale pokud chcete více taky pořád možnosti
0:44:27ste dobrý se nechat _e zaměstnám microsoftu ibm nebo googlu který mě neskutečně a pořád bombardují ozónem váš nějaký dobrý
0:44:34lidí ozónem až do brýlí
0:44:36tak jako
0:44:37dá se a pokud byste chtěli ještě více peněz tak se můžete nechat zaměstnaná vostrý a tady si nedělám srandu
0:44:44protože _e ty algoritmy které se používají nefinanční analýze rozkradou časových hřát já nevím predikce odhad rizik
0:44:52tak sou postavený na tom stejným aparátu jako to co děláme my kdybyste sama chtěli dělat něco už teďka tak
0:44:59jako občas víc zmínit podporujeme i studenty poslední z bot který sem tady napsal spíš jako pro lidí mého věku
0:45:06je mám pocit že oproti svým spolužákům
0:45:10jiří třeba jako dělají nějaká standardní zaměstnání tak rovnou něco pomaleji ale tu
0:45:14musí posoudit oni nebo vnějšího tak co pro to mám udělat když byste chtěli a
0:45:21té vladimír iljič lenin
0:45:23a já jsem si vyrůstal za komunismu takže nám říkali že on měl heslo učit se učit se učit se
0:45:28což není tak úplná blbost že _e to tady našem oboru platí a si vezmete seznam tady těch kurzu nebo
0:45:36věcí který by naši lidi měli umět tak jsou to
0:45:40velké většiny vinnej nenávidí nižší kurzy tady na fakultě jo
0:45:44takže lineární algebra statistika B teoretická informatika B a tak a tak dále a tak dále u té teoretické informatiky
0:45:52bych chtěl říct že všichni _e lidi nevím kolik vás _e dělá si tak když se přídou do prváku magistrála
0:45:59mají tam ty _m teoretická informatika u profesora češky tak soustavu zděšení a ty vylítávaj Í
0:46:06toho a přesouvají se na masarykovo univerzitu kde prý de nějak projít magistr westerny s informatiky
0:46:13tak já bych vám chtěl říct že když přijdete do řeči a tam _e na vás najednou vypadne pět minimalizací
0:46:19_e konečných automatů tady _e pro pro věci které dělají vzor tak najednou jako rádi vezmete skripta stínovat bude existovat
0:46:26o čem to vlastně
0:46:28tak _e pak jo napětí o třeba programovat
0:46:31ale narozdíl cílem je to spíš takovej experimentální guláš jako vaříme prostě věci aby rychle fungovaly
0:46:38a co je asi nejdůležitější tak je přemýšlet o výsledcích chtít přijít věcem na kluk nejenom prostě to jako pouštět
0:46:46a napsat výsledky někam a hry
0:46:50tak
0:46:51to byl konec nic
0:46:53jich nitře děkujeme za pozornost kdybyste chtěli další informace tak sme tady nebo si nás najdete možných webových stran