0:00:15 | takže můžeme začít |
---|
0:00:17 | tak já vás tady vítám emisi dorost a |
---|
0:00:20 | vám tady s kolegama řekneme něco o tom jak se důl informace z řeči a co ani google neumí |
---|
0:00:28 | tak |
---|
0:00:32 | kolik dva milouš na nějaké velké konferenci něco jak třeba tady parkem webexpo podobně |
---|
0:00:38 | hezky paralelní sekce teď to tam vaří všechno i nevíte kam máte i dřív |
---|
0:00:45 | dobrý dobrý spousta lidí |
---|
0:00:48 | tak takový na to by tomuto |
---|
0:00:52 | když se podíváte nahoru tam |
---|
0:00:54 | tady máme kamerky |
---|
0:00:56 | takže nahráváme to a |
---|
0:00:59 | bude to všechno potom co jsem přístupný někde na internetu takže se můžete dívat |
---|
0:01:05 | nicméně to je celkem běžný to asi znáte |
---|
0:01:08 | tak jiného soudku |
---|
0:01:12 | do z vás má |
---|
0:01:14 | takovou zkušenost |
---|
0:01:16 | přednášek tříhodinových |
---|
0:01:19 | dlouhých |
---|
0:01:20 | první přednáška druhá přednáška tak tam byly toto přestanete chodit |
---|
0:01:26 | patří do vánoce tak si dáte kapříka řekněte na paštice |
---|
0:01:31 | copak přijde |
---|
0:01:35 | zkouškový |
---|
0:01:36 | protože se učit a terči |
---|
0:01:39 | dohánět je všechno co ste |
---|
0:01:41 | co se minuli |
---|
0:01:43 | no |
---|
0:01:45 | a |
---|
0:01:47 | někteří studenti naši fakulty tím že se tady nahráli přednášky |
---|
0:01:52 | tak zasednou k internetu |
---|
0:01:55 | zrovna web server a sme video server |
---|
0:01:58 | začalo to hat takže motorovou pilou na železo řeknete tu funkci na S přesně podle imaginární osy rozhraní takhle zvuku |
---|
0:02:07 | podíváte |
---|
0:02:09 | jo a koukají a určí se prostě a rychle rychle rychle rychle vstřebávají všechno co jako neviděli během semestru |
---|
0:02:16 | a zjistí že teďka jít a já se osumnáct hodin usmáli na zkoušku a musím ještě zvednou třicet dodíval |
---|
0:02:22 | jsou obraz tak |
---|
0:02:25 | takže zrychlení |
---|
0:02:27 | řeknu _m do inte u unk na S minimální si ukážeme pokud máte nepřímo a je omega nordistovými tam kde |
---|
0:02:34 | runge nabídnout _e jméno |
---|
0:02:37 | no a jak si myslíte že to dopadne |
---|
0:02:43 | není smál |
---|
0:02:45 | takže |
---|
0:02:47 | tudy cesta nevede |
---|
0:02:51 | když potřebujete něco najít ve hromadě nějaký textový dokumentu |
---|
0:02:55 | cože podstatě celej internet co uděláte |
---|
0:02:59 | zavolat esíčka hugo |
---|
0:03:01 | strýčku tričku co je to fourierova transformace _e zrovna transformace přijde dřevěné tyče ukázat deset milisekund a máte padesát milionů |
---|
0:03:10 | se |
---|
0:03:11 | jo pohoda |
---|
0:03:12 | jenže teče uklouzl vydá lidí jo ste si problém |
---|
0:03:17 | A jo prostě video se můžete |
---|
0:03:20 | můžete koukám na celý ale prostě v tomhle zatím |
---|
0:03:24 | špatná zpráva |
---|
0:03:26 | nenastala |
---|
0:03:29 | sme tady mi |
---|
0:03:30 | místo umíme |
---|
0:03:32 | takže |
---|
0:03:38 | představte že máte takovou přijmout ranečku máte nabídek o tak jako na jo tu můžete si oka na přednášku |
---|
0:03:46 | máte u toho slajdíky takže vidíte |
---|
0:03:49 | hezky pěkně čitelně to co je na tom výdejku tam vidět |
---|
0:03:56 | máte to synchronizovaný držíš máte poznámka na třicátým padding slajdu _e načtete přednášce přednášky si mluví o tom že to |
---|
0:04:02 | bude na písemce tak si rychle kliknu se hezky hnedka tu vidíte |
---|
0:04:08 | máte to přepsat do textu takže se tam krásně můžete orientovat přičíst divoce hlavně |
---|
0:04:14 | vyhledává |
---|
0:04:18 | oknem |
---|
0:04:21 | koukneme |
---|
0:04:23 | v praxi |
---|
0:04:25 | služtička se menuje todle čas |
---|
0:04:29 | barcamp se nahrává bude tam tak za tejden čtrnáct dní se nám podaří bude prostě tady přístupní takže si sami |
---|
0:04:34 | můžete vyzkoušet |
---|
0:04:36 | vyhledat navigovat rychle |
---|
0:04:38 | jo takže zkusme si prostě |
---|
0:04:41 | potřebujete se tady naučit |
---|
0:04:43 | no výborně |
---|
0:04:56 | že budete rychle zjistit se to fourierova transformace |
---|
0:05:05 | znáte |
---|
0:05:08 | tahle přes přiběhnou neska vidíte |
---|
0:05:11 | i přes riziko |
---|
0:05:14 | dneska vidíte deset o přednášce říkalo jo tady se o tom hodně mluví volnýho původní jo |
---|
0:05:21 | no to symetrické podle si svého u nesymetricky na mínus X mínus T je základní vlastnosti |
---|
0:05:32 | nervy transformace fatální by bylo dobrý že _e když jsme se s času dostali do spektra |
---|
0:05:39 | nedostatek nazpátek že |
---|
0:05:41 | vememe _e zpětnou fourierovu transformaci |
---|
0:05:46 | tak už |
---|
0:05:47 | si tady |
---|
0:05:49 | po klikat synchronizovaný slajdy |
---|
0:05:55 | _e takovéto |
---|
0:05:57 | jednotkového impulzu |
---|
0:06:00 | tak |
---|
0:06:02 | bylo |
---|
0:06:04 | demonstrace vše |
---|
0:06:11 | tak se abysme povídali jenom o tom se vlastně jako zvenku jak to vypadá |
---|
0:06:17 | tak se podívám i |
---|
0:06:19 | to je uvnitř velice lehce |
---|
0:06:22 | rozhlas má nějaký ve gram počítačový prostě vidí programuje |
---|
0:06:30 | S lidí výborně |
---|
0:06:31 | tak těm tohleto musím vysvětlovat |
---|
0:06:35 | jo to je jenom takový schémátko toho co je uvnitř |
---|
0:06:41 | vy co programujete si to dokážete zhruba představy bytostí možnosti nemáte dobyto stejně dlouho |
---|
0:06:47 | řekneme si jenom velikosti |
---|
0:06:50 | to |
---|
0:06:51 | důležité vlastně z našeho pohledu tady tahleta krabička co která nějakým způsobem teda audio dělat toho něco se přes závislé |
---|
0:07:00 | no tak |
---|
0:07:01 | velice zjednodušený jestli to můžete představit ano |
---|
0:07:06 | jo nacpete do toho audio mikrofonů tady teďka mluvím |
---|
0:07:11 | natočíte kličkou vypadne vám je text něco co se dá |
---|
0:07:15 | za indexovat čemuž prostě standardní počítače me |
---|
0:07:19 | pěkně pro co |
---|
0:07:21 | co to umí |
---|
0:07:23 | je to tak a krabičkách kterou musíte naučit |
---|
0:07:26 | a chová se to stejně jako u malé dítě tak jako můj synek |
---|
0:07:30 | ten umí to co nauč |
---|
0:07:34 | jo zatím až bude starší tak US čísla |
---|
0:07:38 | takže |
---|
0:07:39 | na tu krabičku musíme nějak naučit a tu krabičku určíme takže vezmeme prostě velký kvanta řeči tu řeč musíme mít |
---|
0:07:46 | přepsanou takže přesně to musím poslouchat na slovo co přepsat a tyto informace vezmeme strčíme to |
---|
0:07:54 | zase zatočíme nějakou čipsy kličkou ono se to prostě naučí rozumět _e řeči a převážně ten signál textu |
---|
0:08:03 | takže |
---|
0:08:05 | naučí se to přesně to |
---|
0:08:08 | co to naučíme tudíž tak jako já bych vzal svého synka proto aby otočí on by měl čínsky |
---|
0:08:14 | přestože se neuděl na _e narodil čechách prostě jako by zadeček prostě v domě prasečí |
---|
0:08:21 | že opravdu spojených státu bude umět rozpoznávat krásně mluvit krásně prostě americkou angliš |
---|
0:08:29 | Y novej how |
---|
0:08:31 | experiment a nacvičují |
---|
0:08:33 | pole nula |
---|
0:08:35 | jsou |
---|
0:08:36 | S barcamp jestli kódy ten byl byly okna špaček vykonaj |
---|
0:08:40 | you ten čaj |
---|
0:08:42 | how věneček rico mail vykonání na u maticových síť |
---|
0:08:47 | ze vejplata |
---|
0:08:48 | ale a je to mnou od dozvíte op a dobře |
---|
0:08:54 | takže první věc audio jazyk jo rozpoznávače prostě závisí na jazyků tak jak naučíte ten jazyků |
---|
0:09:02 | druhá důležitá věc je com |
---|
0:09:07 | jo nebo my ho naučíme nějak slova třeba sto tisíc přes sto padesáti anglicky to or umí rozpoznává tady tato |
---|
0:09:14 | slova ale prostě vám rozpozná ani o slovo navíc který sto předtím nenaučí |
---|
0:09:18 | mimoto |
---|
0:09:20 | on umí on preferuje to pořadí slov tak jak toho naučit |
---|
0:09:24 | jo prostě si to nějakým způsobem pamatuje |
---|
0:09:27 | takže |
---|
0:09:30 | když to naučíme na standardní tuzemské hospodské řeči |
---|
0:09:38 | představte si jo budeme mít výraz spoustu takle nahrávek ve teďka ty studenti přídou do té hospody po zkoušce a |
---|
0:09:45 | sinus nula ty vole se rozdělí dneska byla zkouška |
---|
0:09:50 | já jsem to tak postaral že to není možný prostě mě v něm vyhodí úplně prostě a stojí |
---|
0:09:56 | jo tak té rozpoznávač bude mít tento naučený krát slovník a budou P se |
---|
0:10:03 | takže pak příde krásná vážná sence vymete vy vemete tento rozpoznávač a budete se diví že za každou čtvrt obětuje |
---|
0:10:12 | ty vo |
---|
0:10:15 | což se nám stalo kdy jsme dělali přenosový systém tady tak jsme tam měli tak u češtinu a pak prostě |
---|
0:10:20 | soudní procesory tady jako mluvili občas vulgárně |
---|
0:10:25 | takže jsme samozřejmě oni nemluvili jako ale ty předpisy vzdálený takže sme museli vyhazuju žádný slova torusu rostou slovníku toto |
---|
0:10:32 | celkem fuška tam |
---|
0:10:35 | jo |
---|
0:10:36 | takže další důležitá věc když byste někdy příště to styků prostě rozpoznávače mám pamatovat si omezeny slovní |
---|
0:10:42 | a omice a roklina domén vona tak jako naučíte na doménu když ho naučíte na nějakou běžnou fotkou řešte prostě |
---|
0:10:49 | to bude preferovat jo a když budete chtít přejít na nějakou normální prostě na nějakou tady televize nebo cokoli takovýho |
---|
0:10:57 | tak se musí hodnotu jo to znamená když zase aby se začal přednášky nějakou básničku rozpoznávač to bude totálně zmatenej |
---|
0:11:04 | což nenaučili že např |
---|
0:11:09 | což mimochodem tomletom rozpoznávači to prosazovat které sem řekl taky jo takže si zase můžete zkusit prostě jako zjistili pořád |
---|
0:11:21 | takže na závěr co bych chtěl abyste si odnést |
---|
0:11:25 | rozpoznávač řeči krabičkách právem no to nahoře dostanete v nějakém fondu a vyplivne mám na výstup nějaký text něco čím |
---|
0:11:34 | se dá potom ušní a pracovat klasický také třeba googlu nebo cokoli |
---|
0:11:39 | je to prostě nějak text nějak slova ty slovama tím vývodu že mají se částečně sepnuta pak jednoduše vyhledá |
---|
0:11:49 | rozpozná jen to na to byl naučen A jazyk akustický prostředí slovník |
---|
0:11:55 | popis prostě stylu mluvy tak jak bluffovat se |
---|
0:12:01 | plně na závěr |
---|
0:12:03 | superlectures sou nahrávaný budu rozpoznaný zkuste si po přednášce pokuď máte někdo pocit že k tomu máte co říct jako |
---|
0:12:12 | zajímavá sou chcete spolupracovat cokoli přijďte za mnou o zvlášť jestli jsou tady z naznačen si to mají rádi I |
---|
0:12:18 | com ajpek při té za mnou na seznam o něčem pobavím |
---|
0:12:22 | sledujte twitter panter barcampu jak to budeme indexovaný někdo bude nějakej když už to máme hotový takže si pak můžete |
---|
0:12:28 | za domácí úkol může schválně podívat jak rozpoznávač prostě |
---|
0:12:33 | se vypořádal můj angličtinu a |
---|
0:12:35 | se |
---|
0:12:37 | prostými slovy který sem tak |
---|
0:12:39 | takže to je za mě všechno jo tady předám |
---|
0:12:42 | slovo |
---|
0:12:43 | péťovi který vám řekne |
---|
0:12:46 | něco |
---|
0:12:47 | vyššího dalším technologií |
---|
0:12:52 | mimochodem i nějaký dotaz |
---|
0:13:01 | takže |
---|
0:13:26 | no |
---|
0:13:27 | _e |
---|
0:14:39 | tak _e nějak rychle jestli phonexia _e ta ta vznikla řada založena lidmi právě tady sme u té a dostáváme |
---|
0:14:47 | se řečové technologie z celého světa |
---|
0:14:50 | já vám oj něco jaké sou technologie jestli jak můžete věk stravovat z řeči aneb forma |
---|
0:14:58 | proč jsme se tady tím vlastně zaznačily zabývat se je to kvůli tomu že vidíme že kolem nás je v |
---|
0:15:05 | oblasti množství informací každý den se díváme na televizi diskutuje mezi lidmi díváme zaneseny testem internetu telefonujeme a této informace |
---|
0:15:17 | je podstatně víc než textové informace bohužel |
---|
0:15:21 | toto většinou kolem vás projde sem tak něco zapamatujete sem tam ne ale většina této informace se v dnešní době |
---|
0:15:27 | ztrácí |
---|
0:15:29 | _e jen tak se to tady u co bych se chtěl zmínit si je to jaké sou řečové technologie ne |
---|
0:15:35 | k dispozici co umí chtěl bych navazuji se kdy se budeme tak teď to řeknu dva _e setkávat a i |
---|
0:15:44 | pro vás _e jaké třeba můžete použít se zapojit |
---|
0:15:48 | tady je na _e |
---|
0:15:51 | igor třeba ukázal nádhernej příklad se |
---|
0:15:54 | _e přepisu sou řeči já že bych jenom si že informace _e |
---|
0:16:00 | _e řeči podstatně víc |
---|
0:16:02 | víš třeba užitek druhu jsme nebo další službu není to jenom _e ta very na kterou se ptáte kterou kterou |
---|
0:16:10 | václavu získá ale ty řeči jezdit je třeba když takhle tady s access rozdíl došlo čtyř kategorií je tam informace |
---|
0:16:18 | o mluvčím je tam informace o obsahu |
---|
0:16:22 | ale u to informace o prostředí technice |
---|
0:16:26 | co se týká třeba mluvčího jestli je to jazyk dialekt _e pohlaví může to být vzdělání řečníka |
---|
0:16:34 | tak dál |
---|
0:16:38 | technologie který který má zabýváme mí E chcete tak jsou uvedeny na tomto slajdu je to třeba přepis řeči |
---|
0:16:47 | se který _e |
---|
0:16:49 | budete moci zkoušet _e vlastnosti superlectures |
---|
0:16:52 | ale toto je jednodušší formy sme detektor klíčových slov a můžeme identifikovat jazyk neschopný identifikovat pohlaví |
---|
0:17:02 | _e sme schopný desinfikovat konkrétního S |
---|
0:17:09 | tak _e to co se týká přepisu řeči |
---|
0:17:12 | _e |
---|
0:17:13 | pomoci přepisu byste schopný získat _e řeči doplňkovou informaci kterou potom můžeme tím nechápu potom může použít klasický technologie na |
---|
0:17:22 | indexování textu a ste schopný toto o co je to k audiu dohledá |
---|
0:17:28 | _e tady sou dva projekty ty na který sto můžete vyzkoušet přepis řeči cz je projekt jestli můžete zavolat si |
---|
0:17:38 | tady něco nadiktovat a podívat se i rozpoznávač |
---|
0:17:41 | funguje pro vaši řeč |
---|
0:17:43 | před přednášky nebo superlectures bude se kdy svazu parkem |
---|
0:17:47 | můžete získat určitou pře |
---|
0:17:51 | _e to co se týká kvality přepisu |
---|
0:17:54 | vzorů zmínil _e pokuď je ten _e rozpoznávače adaptovány na konkrétní doménu může být medicína právo I P většinou teda |
---|
0:18:05 | přepis je téměř dokonalý můžete očí ste nemůže to prezentovat pokuď sedí adaptován tak _e většinou ten přepis je na |
---|
0:18:13 | takový úrovni že ste schopni pochopit obsah toho textu |
---|
0:18:21 | tady jen pro představu jak funguje takový rozpoznávač který vidí adoptovali na konkrétní domén |
---|
0:18:27 | vidí se |
---|
0:18:29 | nahoře originál dole je _e to rozpoznávač před |
---|
0:18:35 | toto třeba bylo |
---|
0:18:36 | pořízení pozici číslice |
---|
0:18:41 | teďka co je důležitý je že já jsem řek tady vidíte že vám přepis řeči a ale i sami nějaká |
---|
0:18:48 | chybu když to použijeme obecnej tech |
---|
0:18:51 | se důležitý ten přepis řeči nemusí |
---|
0:18:55 | právě _e poskytovat i jenom ten přepis tu nejlepší variantu ale ten přepis se |
---|
0:19:02 | umožňuje nám vrátí ty alternativní slova se z toho důvodu jistě tyto technologie ještě asi nebylo důvodu dobu dokonalý to |
---|
0:19:10 | kvůli tomu že po za počítač nezná fyzikální souvislosti nezná vaše vztahy kamarády když si unk _e se to třeba |
---|
0:19:18 | mění a ale dítě dopravy těžkých domýšlet nějaký věci to co třeba nerozuměl já |
---|
0:19:28 | další technologie _e je _e detekce klíčových to detekce klíčových to je to takové jednodušší přepis ale |
---|
0:19:37 | co je dobrý Ú forme _e je |
---|
0:19:40 | že se algoritmus je rychlejší ze ze _e |
---|
0:19:45 | tímto puse pokrýt daleko větší množství jazyků a |
---|
0:19:50 | třeba D |
---|
0:19:51 | používá se třeba na monitorování nějak nějakých televizní vysílání konstrukce práce operátorů vkusem se tak dál |
---|
0:20:02 | tak se mi jim o důležitý technologií je |
---|
0:20:05 | která což což je identifikace řečníka |
---|
0:20:09 | dost často se je lidi ptají _e |
---|
0:20:13 | jestli _e je nějaká řečová technologie která funguje podstatně líp nebo |
---|
0:20:19 | předčila u člověka to tohle to je zrovna jedna sme se smyslových kterým se to stalo |
---|
0:20:26 | ono to |
---|
0:20:27 | když zkusíte když se ze třeba tisíc nahrávek a chtěli byste to mají konkrétního řečníka znovu porovnat dva řečníky detekce |
---|
0:20:35 | klíčových D slyšíte čtvrtou nahrávku tak už víte zněl se první říční tohlencto ta technologie mít |
---|
0:20:43 | i v dnešní době už ze _e v podstatě z nahrávky i spravovat masovej vo ti |
---|
0:20:49 | což je záznam který má jenom šest set bajtů to teda pár čísel a ti s tímto toho člověka unikátní |
---|
0:20:58 | _e potom ruce zajímavý T tak tajle si hlasují otisky můžete mezi sebou porovnávat takže během _e |
---|
0:21:07 | sekundy schopný porovná se milióny hlasových otisku ste schopni dohledat o informaci kterou potřebujete |
---|
0:21:14 | se taky zajímavý |
---|
0:21:17 | _e etapy a chce zdi zde si zmíníte těsně si dělaj ty úrovně je default dvě sou tady toto je |
---|
0:21:25 | technologie která se v dnešní době nejvíc V V a že dva roky podobně jako moorův zákon se klesne chybovost |
---|
0:21:31 | ati tady ty technologie na polovinu |
---|
0:21:34 | takže ze třeba _e určitá vadit je tady ta technologie bude prvky době a tím telefonu proces bych K |
---|
0:21:46 | pokuď chcete dělat nějaký systém pro vyhledávání audia na internetu důležitý je vůbec na začátku když použijeme rozpoznávač řeči |
---|
0:21:55 | vůbec se identifikovat jazyk tato technologie je dnes taky k dispozici je funguje to jako trénován V D klasifikátor T |
---|
0:22:05 | C takže vy vy si vezmete nahrávky v několika jazyků a tenhleten klasifikátor apod potom ste schopni rozpoznat podstatě libovolné |
---|
0:22:14 | jazyk |
---|
0:22:14 | zboží dialekt toho jazyka |
---|
0:22:20 | říká se kdy se teda budeme s řečovými technologií by jedný běžně setkávat |
---|
0:22:26 | v dnešní době sou tyto technologie E už běžně dostupných použili jako |
---|
0:22:32 | používají je zpravodajský složky potom už možná ste neuvědomím nic _e ale každý den tyto technologie |
---|
0:22:40 | tati chrání vaše životy |
---|
0:22:43 | sobě říct že omezujícím faktorem pro jo široký N na nasazení těchto technologií _e aby opravdu byly kdekoliv na internetu |
---|
0:22:53 | tak taky většinou kvalita řečový ho záznam |
---|
0:22:57 | to je je důležitý je tady třeba vhodné nezmínil ta kvalita toho přepis řeči _e za záleží na tom hodně |
---|
0:23:05 | na vzdáleností mikrofonu o C |
---|
0:23:10 | řečníka jak mikrofon mám |
---|
0:23:12 | těsně u musíte zažitý se záznam bude paritní _e |
---|
0:23:16 | závisí to na na neřečových událostech teda šumech |
---|
0:23:20 | a taky _e množstvím |
---|
0:23:24 | kdy se používá já záznamových zařízení opět _e je složitější to si dobrej rozpoznávač |
---|
0:23:30 | takže řešení matici a _e vlastně tím posetou u port posune tak je do hardvér |
---|
0:23:38 | _e lepší algoritmy |
---|
0:23:42 | takže technologie _e dovolá R R |
---|
0:23:45 | vidíte dnešní době sou objevuje přepis řeči nebo rok rozpoznávání řeči a mobilní telefony proč tomu tak je protože i |
---|
0:23:55 | mobilní telefony E i děti na tak je potřeba _e jakýho lepšího vstupu I nasypu využívat vyráběji milionových který se |
---|
0:24:05 | takže ten samý mikrofony použít _e _e |
---|
0:24:10 | věc miliony měli měli |
---|
0:24:13 | co je důležité dat další důležitý zařízení který prvky době tento sekvence ovlivní je _e mikrofonní pole co koši je |
---|
0:24:21 | _e nějaký sada mikrofonu a to zařízení vám umožní potom nasměrovat |
---|
0:24:28 | přichystat tady sedíme přednáškový místnosti tak jako paprsek a přesně zaměřit a konkrétního člověka který mluví toto zařízení bylo |
---|
0:24:38 | nedávný minulosti zas velmi nákladný ale v dnešní době uši takový zařízení jako je _e microsoft C |
---|
0:24:46 | kyne zase _e takže toto myslím si že |
---|
0:24:51 | opozicí zpracování řeči ovlivní |
---|
0:24:53 | další věc _e se který v dnešní době není problém |
---|
0:24:57 | i mikrofon tady ty takovej halejte zda |
---|
0:25:00 | nedá se |
---|
0:25:01 | ten |
---|
0:25:04 | teďka něco pro vás se jakým způsobem za se zapojit se _e pokud _e toto za zaujalo _e |
---|
0:25:12 | my rádi uvidíme _e inovativní lidí inovativní firmy po pokuď se třeba stala spolupracovat ráta technologie k dispozici jakož _e |
---|
0:25:25 | lze K přepis řeči _e za ni |
---|
0:25:27 | výpadu dá zlepší nešlo důvodu týká identifikace řečníka to tak se na si to ve špičce té a takže |
---|
0:25:36 | chcete na začít pracovat taky zadávací my budeme rádi |
---|
0:25:41 | pokud pokud udělá |
---|
0:25:43 | samozřejmě hledáme tady každou chvíli na spolupracovníky se |
---|
0:25:48 | taky jestli za spousta pozic |
---|
0:25:50 | a pokud vás zajímají přímo ty technologie chcete typ posouvat dáte se tady bude D T |
---|
0:25:58 | další _e přednášku za černocký E zde tyčových op ty piny je tady opravdu _e |
---|
0:26:07 | možnost mezinárodní spolupráce není problém dostat lidi třeba na sem force srší spisů zbyde kterýho vlastně z kopce výsledek odlehlý |
---|
0:26:17 | dobu u do microsoft |
---|
0:26:19 | tímto institucemi |
---|
0:26:20 | open sem |
---|
0:26:22 | takže to je všechno bude ode mě předám slovo tady _e |
---|
0:26:27 | černocký mu pokuď chcete vzít někdo vizitku na na nebo |
---|
0:26:31 | kontaktovat |
---|
0:26:32 | _e |
---|
0:26:33 | _e přičte bůra |
---|
0:26:36 | jaký otázky |
---|
0:26:55 | o o _e do tady tyto technologie _e se zavání postupně pes právě ta tady ty _e komplikace _e to |
---|
0:27:02 | tomto má ani |
---|
0:27:04 | _e sme si řekli že že by největší zvíře se to používá třeba pro kontrolu vlastních operátorů protože zas aby |
---|
0:27:13 | aby kontrolovali vás to potřebuju sebou aby _e ty kladné získal informace o vás potřebuju třeba u ale toho je |
---|
0:27:21 | i jestli jich operátor máme na dáván |
---|
0:27:27 | nemluví sláma prostě alu vopravdu vám poskytne tu informaci co má se tak tohle to je největší oblast kde se |
---|
0:27:34 | to těch call centrech používat právě |
---|
0:27:38 | co se týká _e |
---|
0:27:40 | párování jezdil u atomem to si myslím že je _e |
---|
0:27:44 | i bude několika ta X letech |
---|
0:27:48 | za další oblast takže já si myslím že se tady ty problémy is |
---|
0:28:17 | _e |
---|
0:28:17 | _e o o takle po pokoji ty _e řečový technologie postupně se dostala do praxe _e |
---|
0:28:24 | ne nej největší komplikace kterou se tady tady cyklostezka _e řešili ten takle byla kvalita vlastních lidí tak se takže |
---|
0:28:32 | tam cena nasazený podporo _e právě _e P zákazníky ta samá |
---|
0:28:39 | to používá Í zase záleží na legislativy K konkrétní země je je třeba evropa je dost dost konzervativních v tomto |
---|
0:28:48 | _e if že potřebujete vždycky vyjádření |
---|
0:28:52 | _e příslušných úřadů F |
---|
0:28:54 | co se týká třeba ameriky a asie se takto prosím |
---|
0:29:13 | o o po ono _e je pokud byste si chtěl slyšet konkrétní číslo že se těžký protože když vždycky si |
---|
0:29:20 | nenajdete _e ně nějakou sadu testovací na který se dosáhne stoprocentní úspěšnosti rychle se mluvit člověka s marketingu tak všechno |
---|
0:29:29 | tvrdí to prase na sto procent se _e |
---|
0:29:33 | řeknete řek by _e když když budu mluvit _e jako technik ta tak _e _e |
---|
0:29:40 | toho přepis řeči se to může být _e _e |
---|
0:29:44 | _e mezi padesátiprocentní zjištěné datovaný systém nebo devadesáti procent se když to je _e |
---|
0:29:51 | systém adaptovaný na tlumené |
---|
0:29:54 | toho řečníka ste schopen už najít _e prostě osobu |
---|
0:29:59 | tisícinu desetitisících nahrávka |
---|
0:30:01 | o čas sem tam se jsem udělal chybu ale když hledat někoho to tak se něco na internetu po pokuď |
---|
0:30:08 | máte tisíc _e _e třeba stránek nebo tisíc záznamu a pokud |
---|
0:30:13 | prohlédněte si prvních deset a má stav informací srdce se jako zákazník |
---|
0:30:17 | pokoj |
---|
0:30:18 | to se tadyhle _e to tady ty |
---|
0:30:22 | se jsem se nesrůstá |
---|
0:30:37 | to tohle se všechno statistice pokutě _e tyto systémy se trénují řádově naval namiřte a na na předpisech vo T |
---|
0:30:47 | tisíců řečníků po pokuď trénovací sadě byl data to chyba třeba zastoupena byla vždy tak blízko se tak se s |
---|
0:30:55 | tím vyrovná pod pokud ne tak to může selhává a ale si třeba na naše rozpoznávače pro angličtinu do trénován |
---|
0:31:03 | na lidech _e |
---|
0:31:05 | real zpětná se takže celý funguje perfektně na nerodinný angličtině kde každý si tam začnu trošku nějakým způsobem komorní |
---|
0:31:17 | dobře děkuju rámci o |
---|
0:31:47 | tak děkuju zapózoval nějakou petrovi do toho docenta černockého dybyste mně viděli dneska dopoledne let po stromech švestkový charlesi například |
---|
0:31:54 | tak byste si říkali to je zase sending jenom taková úmorná sinusovka já bych chtěl chvilku popovídat o tom se |
---|
0:32:01 | pozadí _e phonexia a super vlečnou trity krásný firem a projektu který se tady teď viděli |
---|
0:32:08 | tak |
---|
0:32:09 | _e |
---|
0:32:12 | je to výzkumná skupina které říkáme D hodí spíše si výhod jako brno university of technology takle nás lidí většinou |
---|
0:32:19 | znají venku tady na domácím písečku je to většinou spíše si asi by vám říct jako |
---|
0:32:25 | tím trošku jak to děláme kdo to dělá na čem to děláme kdo to všechno platí a možná něco pro |
---|
0:32:30 | vás proč byste to měli dělat také a když teda jako by se vám to líbilo takto proto máte udělat |
---|
0:32:36 | tak jak to děláme _e vlastně když si vezmete nějakou knížku a učebnici vo _e rozpoznáváním nebo v o detekci |
---|
0:32:44 | nebo vo mistrovi učení tak tam na uvidíte tady tohleto základní schéma tady nasbírat data nějaký dotaz perimetr zouvat nějak |
---|
0:32:53 | se rozhodnout jaký bude modelovat |
---|
0:32:55 | a ten model natrénovat pak _e to zbavovat nebo zjistit jak to funguje na nějakých neznámých daty a zjistíte toniku |
---|
0:33:03 | nechodí vůbec a pak následuje prostě N |
---|
0:33:07 | desítky stovky tisíce takovýhle koleček kdy už musíte nasbírat víc dát nebo lepší parametry lepší model líbo natrénovat a tak |
---|
0:33:14 | dále až nakonec prostě už tu práci máte odevzdat tak tady potom jako _m přichází nasazení a pak se klepeto |
---|
0:33:21 | jestli to bude fungovat i na těch datech vašeho partnera projektu nebo _e nebo zásadní _e takže |
---|
0:33:28 | modrý schémátko přesně podle knížky kterou si můžete za padesát u |
---|
0:33:34 | co je výsledkem |
---|
0:33:35 | takovýhle schéma který je zase _e vlastně strašně jednoduchý myslím principu to tedy audio nebo řeč |
---|
0:33:44 | vypočteme nějaký příznaky |
---|
0:33:46 | pak vyhodnotíme pomocí nějakých předtrénovaných motyl modelu nějaké pravděpodobnosti nebudem taky říkáme věrohodností a na konci přichází blok dekódování na |
---|
0:33:55 | jehož konci musím udělat rozhodnutí a já vám zkusím tady tyhlety bloky přestavěna takové nejednodušší úloze k _e kterou se |
---|
0:34:02 | asi setkáváme a to je _e případ rozpoznávání pohlaví |
---|
0:34:05 | to znamená stupuje řečová nahrávka a na výstupu mám více informace tyto kluk nebo holka |
---|
0:34:11 | na že se nekousněte ale _e tohle je aplikace která je důležitá která případě z desetitisíců telefonních hovorů nám pomůže |
---|
0:34:21 | omezit C ten hledací prostor na polovinu asi ze všech který tady jako umíme uděláte to nejpřesnější protože tam sme |
---|
0:34:27 | na nějaký devadesáti devíti |
---|
0:34:29 | _e téměř to procentech podle toho na jakých datech se to _e s pochvaluje takže trošku detaily toho severní napřed |
---|
0:34:37 | nemáte ní samozřejmě |
---|
0:34:39 | tak má teda právo spousty kluků |
---|
0:34:41 | těma data má si představte prostě adresář plný wavek |
---|
0:34:45 | jo který vám namluvily tady tyhlety kluci máte tak to taky data od holek |
---|
0:34:50 | tak tady tyhle těch dat _e na trénujeme nějaké gaussovské modely tak unk vám tady _e se kterým takový hrůzostrašně |
---|
0:34:58 | téma |
---|
0:34:59 | a _e když tady tohle máte hotový tak můžete postavit systém který bude mít tu počítají se tam nějaké koeficienty |
---|
0:35:06 | které reprezentují vstupní řeč pak se to do těch modelů přivede každý z těch modelů kde mi pro kluky druhým |
---|
0:35:13 | pro holky tak vám dá nějaký skóre takže tady sou ty modrý A červenáš tečka |
---|
0:35:18 | na základě toho skóre vlastně rozhodujete jestli teda na vstupu _e sme viděli neviděli kluka nebo |
---|
0:35:26 | že eště eště víc do detailů když se podíváme na ten úplný začátek a řekneme si čím tu řeč vlastně |
---|
0:35:32 | jako budeme popisovat nebo nebo reprezentovat tak si najednou uvědomíte že ta řeč není stejná pořád ze a když mluvím |
---|
0:35:38 | za každých pár milisekund musím s tím hlasem něco udělat abych vám přenesl nějakou informaci jak bych tady mohl říkat |
---|
0:35:45 | soudou a lze hrozně |
---|
0:35:48 | takže tu řeč přes tou parametrizací musím rozdělit na nějaký kousky říkáme rámce vypadají zhruba takhle nějak mám celou půlku |
---|
0:35:57 | přednášky potom potom jako jak mají dlouhý lexém překrývat |
---|
0:36:01 | a pak si taky můžeme uvědomit že to jak mi lidé slyšíme sto není lineární že neslyšíme stejně jako póly |
---|
0:36:08 | uprostřed klavírů letouny navrchu klavírů a taky neslyšíme vinárně hlasitost takže se tam přidává nějaký schémátko který se snaží nějak |
---|
0:36:17 | reflektovat i ty nelinearit a na jeho konci |
---|
0:36:20 | vyjede takováhle pěkná matice |
---|
0:36:23 | má to nějakej prostě |
---|
0:36:25 | N parametrů a tenhle tu sadu parametrů dostaneme každých deset milisekund takže vlastně když si představíte třeba vteřinu řeči tak |
---|
0:36:33 | za ni dostaneme sto takovýdle pěknejch textu |
---|
0:36:37 | s těma vektor má děláme dál na ten _e do takzvaných gaussovských modelu |
---|
0:36:41 | který _e |
---|
0:36:44 | mají nějaký parametry takováhle gaussovka ve dvou z rozměrným prostoru má nějakou střední hodnotu má to nějakou kovariancí která určuje |
---|
0:36:54 | ten kopec vypadá |
---|
0:36:55 | _e by to bylo ještě složitější tak _e to není jenom jednou se stal můžeme ji mít X mě |
---|
0:37:02 | a pořád i tady tohleto původně vzduchových jednoduchý příkládek protože já vám to tady ukážu ve dvě de až do |
---|
0:37:08 | vůbec lo zobrazit a vyplotnout akorát že tomu vonné to většinou tak ve třiceti devíti de |
---|
0:37:14 | X touž potom moc představit nejdéle počítat s tím do úplně a každý z těhletěch _e tyhlety modelu nám dá |
---|
0:37:23 | _e nějaký číslo |
---|
0:37:25 | a na konci máme takovou slavnou for bulku do vlastně je pravděpodobnosti dat když viděli kluka apriorní pravděpodobnost luká pak |
---|
0:37:34 | pravděpodobnosti dat |
---|
0:37:35 | na tu pravděpodobnost zase vykašleme protože na to nějak moc neumíme spočítat ale naštěstí je to pro oba dva případy |
---|
0:37:41 | stejný apriorní pravděpodobnost taky většinou neřešíme protože si řekneme že možná těch kluků je tak jako stejně těch holek a |
---|
0:37:49 | zbydou mě tady tyhlety dva výrazy které dostanu mých sony gaussovek takže srovnám tak toho bude kluk anebo takže to |
---|
0:37:59 | je princip |
---|
0:38:01 | nejjednoduššího |
---|
0:38:01 | detekčního a vzory |
---|
0:38:03 | samozřejmě tohle moc jednoduchý jo to jako řeknete s tady slovy předvádí tak může to být tady určí tady tohle |
---|
0:38:12 | _e kousek _e nějakého článku který napsal na zaměstnanec vo právě adaptaci systému pro rozpoznávání řeči na jinou akustiku |
---|
0:38:22 | tady _e _e jinej trošku určí _e tohleto je součást tak zvané a je vektorové metody |
---|
0:38:30 | rohu úpon používáme pro rozpoznávání mluvčího a funguje prostě mnohem lépe než všechny ostatní a když se bude zeptat proč |
---|
0:38:37 | a je vektory tak _e _e vono to tlumené jako touto variability s a spisy strž zní hrozně vědecky řešme |
---|
0:38:43 | kolegové hledali nějaký sexy termín tak říkal že tak dobrý tak tady I port imax |
---|
0:38:48 | I I I P nebo jak se to ne ne všechny ty a já je tak tomu budeme říkat a |
---|
0:38:52 | je vektory a ujalo se to a teďka no tak říkaj všichni |
---|
0:38:56 | _e tohleto je zase nějaký jako parametry noční schéma do kterýho mícháme je neuronový sítě |
---|
0:39:03 | a abych vás úplně dorazil tak todleto je rozpoznávací síť která bude třeba pracovat tygrovi je _e rozpoznávači na _e |
---|
0:39:10 | na přednášky akorát že tahle jestli se pamatuju tak dokáže rozpoznávat dvě slova tomu ještě dva fonémy většinou tam těch |
---|
0:39:18 | slov máme tak tři sta tisíc plus eště nějakých |
---|
0:39:21 | pár fonému k tomu takže by mě to zabralo asi tak |
---|
0:39:25 | mohou se lišit než by se vyplatí |
---|
0:39:28 | co si ale prosím vás jako tady všimněte je že se tam používají jakýsi _e konečný stavový trendy si nebo |
---|
0:39:34 | konečný stavový automaty abych tady možná ještě to co se to řek |
---|
0:39:39 | tak a teďka |
---|
0:39:41 | taková diskuze ti lidi to dělají proto aby |
---|
0:39:45 | se mohli vytahovat samozřejmě |
---|
0:39:47 | soutěží o rekord počtu rovnic na centimetr čtvereční |
---|
0:39:51 | někdy jo ale myslím že matematici jako nastane dostávaj byli atraktivnější pro holky to nevím teda |
---|
0:39:58 | možná někdy jo když se podíváme přítelkyně a manželky členu se laboratoře tak to není špatný |
---|
0:40:05 | a protože na barcampu ještě dneska nebyly žádné rovnice tak já tady mám teda proč to děláme opravdu |
---|
0:40:11 | protože tam matematika má vždycky smím smyslová my chceme aby ty naše rozpoznávače byly přesnější rychlejší odolnější vůči všem těm |
---|
0:40:20 | změnám mezi řečníka má krásnýma kanálama a tak dále a to je taky hrozně důležitý _e datalog který tady povídal |
---|
0:40:28 | s igor tak sou neskutečně drahý |
---|
0:40:31 | u tím musíte za drahý peníze kupovat anebo je _e musíte sami vyrábět to že neskutečná v rvačka takže _e |
---|
0:40:39 | chcete aby vaše algoritmy potřebovali ní nic a pokud možno nějakou velmi špatně a nebo vůbec popsán |
---|
0:40:46 | tak kdo to dělá |
---|
0:40:48 | výčet si skupina která má asi tak třináct let trvání |
---|
0:40:54 | _e současné době zhruba dvacet lidí šéfuju tomu tři lidé tady tenhleten pánská vo u kterého jinak prakticky lněný není |
---|
0:41:03 | vidět tak mi lukáš burget |
---|
0:41:05 | současné době právě _e na stanfordu jiné germánský rakovina guru a světoznámý profesor zpracování řeči a tady moje maličkost která |
---|
0:41:14 | se snaží nějak řídit haně proto peníze |
---|
0:41:18 | tak na čem to děláme tohleto je oficiální té který píšu jako rose grantový cihláři ale prostě hodně šrotu takže |
---|
0:41:25 | tu pokud máte doma nějaký důvěra vo jádrový počítač |
---|
0:41:29 | myslíte si to je dobrý nebo osmi jádrový tak je to dobrý samozřejmě ne minimalizovat pět set |
---|
0:41:35 | tohleto ale je zhruba _e místo na našich discích abych jako |
---|
0:41:41 | se jenom nechvátali ty máme teda dat tak tohle do S mínus T |
---|
0:41:46 | v linuxu můžeme cosi protože co to znamená nějak nějakých partnera tam bude pořád přibývají pořád jsou doplněny |
---|
0:41:54 | a toto je nějaký graf C K cpu czech našem dávkovém systému jezdí |
---|
0:42:02 | tady na té ose je nějakých osum set současné době nebo tak polovina průměrně toho bývá toho bývá _e |
---|
0:42:10 | použití |
---|
0:42:11 | tak kdo to všechno platí a neměli na výplaty tak samozřejmě něco fakulta ale zhruba čtyři pětiny si musíme pohánět |
---|
0:42:20 | sami takže evropské projekty americké projekty a lokální projekty zatím se dycky aby to financování skupinu stálou na třech no |
---|
0:42:28 | a |
---|
0:42:28 | a teď která čím se klasy nejvíc T mluvíme tak je darpa projekt který máme sednou významnou americkou firmou darpa |
---|
0:42:36 | jestli si pamatujete si jestli jste četli někdy nějaké historické trakt _e ty tak financovala takovou drobnost obrazy internet |
---|
0:42:45 | tak _e dělat u nás průmyslem |
---|
0:42:48 | phonexia superlectures tady zazněli jako dvě vlastně naše _e nejsem si dva naše úspěšné synovci |
---|
0:42:54 | pak sou tady prostě světové významné firmy _e taky někteří lokální hráči například lingea africe _e vážený a tradiční partnerství |
---|
0:43:05 | matice že máme asi třetí prvek |
---|
0:43:08 | tak tetě se dostávám závěru proč bych to měl dělat také tak teďka vám budu možná se uštvat protože já |
---|
0:43:15 | jsem jednou jel trolejbusem takhle to musí nějaký dva takový kluci kteří by asi tak metr dvacet vysocí aby to |
---|
0:43:21 | radoval tak na pátou třídu |
---|
0:43:23 | povídali o nějakým P a péčku jo a tak o tom pálilo a já sem minusky dostal |
---|
0:43:28 | otevřenou posouvá nechápal sem ani desetinu tohoto říkají |
---|
0:43:31 | takže takové ty věci jako |
---|
0:43:34 | ve a a php a kaskádové styly a tak dále to je jako hrozně pěkný ale vopravdu se touž teďka |
---|
0:43:41 | učí kurzech informatiky na základ |
---|
0:43:44 | takže možná jako když nechcete zůstat na této úrovni tak byste mohli dělat něco trošku drsnějšího |
---|
0:43:51 | _e |
---|
0:43:52 | to zpracování řeči drsnější je |
---|
0:43:55 | protože se tam míchá matika _e trochu i fyziologie |
---|
0:44:00 | trochu i _e rozpoznávání klasifikace ne šílený _e a tak dál a tak dále a přitom si myslím že to |
---|
0:44:09 | užitečné se prostě jako to má spoustu komerčních bezpečnostních já nevím nějakých aplikací který se tedy věděli |
---|
0:44:16 | _e dá se na tom taky celkem |
---|
0:44:19 | vydělat |
---|
0:44:20 | neříkám že plat výzkumníka s ty vždy v naší skupině jakou kdovíjak bombastický ale pokud chcete více taky pořád možnosti |
---|
0:44:27 | ste dobrý se nechat _e zaměstnám microsoftu ibm nebo googlu který mě neskutečně a pořád bombardují ozónem váš nějaký dobrý |
---|
0:44:34 | lidí ozónem až do brýlí |
---|
0:44:36 | tak jako |
---|
0:44:37 | dá se a pokud byste chtěli ještě více peněz tak se můžete nechat zaměstnaná vostrý a tady si nedělám srandu |
---|
0:44:44 | protože _e ty algoritmy které se používají nefinanční analýze rozkradou časových hřát já nevím predikce odhad rizik |
---|
0:44:52 | tak sou postavený na tom stejným aparátu jako to co děláme my kdybyste sama chtěli dělat něco už teďka tak |
---|
0:44:59 | jako občas víc zmínit podporujeme i studenty poslední z bot který sem tady napsal spíš jako pro lidí mého věku |
---|
0:45:06 | je mám pocit že oproti svým spolužákům |
---|
0:45:10 | jiří třeba jako dělají nějaká standardní zaměstnání tak rovnou něco pomaleji ale tu |
---|
0:45:14 | musí posoudit oni nebo vnějšího tak co pro to mám udělat když byste chtěli a |
---|
0:45:21 | té vladimír iljič lenin |
---|
0:45:23 | a já jsem si vyrůstal za komunismu takže nám říkali že on měl heslo učit se učit se učit se |
---|
0:45:28 | což není tak úplná blbost že _e to tady našem oboru platí a si vezmete seznam tady těch kurzu nebo |
---|
0:45:36 | věcí který by naši lidi měli umět tak jsou to |
---|
0:45:40 | velké většiny vinnej nenávidí nižší kurzy tady na fakultě jo |
---|
0:45:44 | takže lineární algebra statistika B teoretická informatika B a tak a tak dále a tak dále u té teoretické informatiky |
---|
0:45:52 | bych chtěl říct že všichni _e lidi nevím kolik vás _e dělá si tak když se přídou do prváku magistrála |
---|
0:45:59 | mají tam ty _m teoretická informatika u profesora češky tak soustavu zděšení a ty vylítávaj Í |
---|
0:46:06 | toho a přesouvají se na masarykovo univerzitu kde prý de nějak projít magistr westerny s informatiky |
---|
0:46:13 | tak já bych vám chtěl říct že když přijdete do řeči a tam _e na vás najednou vypadne pět minimalizací |
---|
0:46:19 | _e konečných automatů tady _e pro pro věci které dělají vzor tak najednou jako rádi vezmete skripta stínovat bude existovat |
---|
0:46:26 | o čem to vlastně |
---|
0:46:28 | tak _e pak jo napětí o třeba programovat |
---|
0:46:31 | ale narozdíl cílem je to spíš takovej experimentální guláš jako vaříme prostě věci aby rychle fungovaly |
---|
0:46:38 | a co je asi nejdůležitější tak je přemýšlet o výsledcích chtít přijít věcem na kluk nejenom prostě to jako pouštět |
---|
0:46:46 | a napsat výsledky někam a hry |
---|
0:46:50 | tak |
---|
0:46:51 | to byl konec nic |
---|
0:46:53 | jich nitře děkujeme za pozornost kdybyste chtěli další informace tak sme tady nebo si nás najdete možných webových stran |
---|