0:00:17 | extrakce informací řeči jaké informace máme v řeči |
---|
0:00:21 | zkuste popřemýšlet co vás všechno napadne |
---|
0:00:25 | no |
---|
0:00:25 | jejich celkem lasice |
---|
0:00:28 | já to vemu po směru hodinových ručiček pět se budeme bavit o zem tomu že |
---|
0:00:32 | sme tady pavla datová analytika vykryta |
---|
0:00:36 | takže se budeme bavit o jakoby záznamech a potom záznamu nějakém řečovém záznamu kohokoliv |
---|
0:00:43 | je schovaná identita toho člověka znamená můžeme ho porovnávat pohlaví nějaký obsah to znamená |
---|
0:00:51 | vlastně kdybyste to před do textu |
---|
0:00:53 | se věk je tam schovaných pokud by šlo telefonní záznamy nějakým způsobem je tam schopnost |
---|
0:00:58 | dost a třeba i kudy to šlo nějaký kodeky |
---|
0:01:02 | čím to bylo nahráno prostředí kterým to za nahrávka vznikla a jazyk třeba kterým se |
---|
0:01:07 | tam je a tak dál |
---|
0:01:09 | je tam spousta informaci |
---|
0:01:11 | a mám velmi krátký čas takže já se jenom lehce zmíním o tady vlastně přepisu |
---|
0:01:18 | do textu to znamená převodu toho jako řečového signálu textu a pak bych spíš vám |
---|
0:01:23 | říkal něco obecnějšího |
---|
0:01:25 | co by se mohlo hodit jako datový datovým analytikům to znamená dát nějaké klasifikátory a |
---|
0:01:31 | tady tyhlety obecnější věci |
---|
0:01:33 | tak jak vlastně sou udělána nějaká ta mašinka která vám převede řeč do textu |
---|
0:01:41 | podstatě vy když neboli teďka já sem nahrávanej mám tady mikrofon a ten převádějte můj |
---|
0:01:47 | hlas tedy produkuj u řečovým ústrojím nějaký elektrický signál a ten si někam nahrává dostanete |
---|
0:01:53 | s toho |
---|
0:01:54 | když se to potom podívat na počítači dostanete tady takový signály to by von se |
---|
0:01:58 | tomu říká |
---|
0:02:00 | ano s |
---|
0:02:01 | tenleten bych vám odpovídá větě anglické větě ty trubice pět |
---|
0:02:05 | ano |
---|
0:02:06 | ten problém je že v reálném světě vlastně |
---|
0:02:11 | my máme řeky máme nekonečně mnoho realizaci toho signál |
---|
0:02:16 | tou teď opět může říct někdo jiný může tady být nějaký randall okolo já to |
---|
0:02:20 | musí s pomalu rychle a těch variací je tolik že v podstatě že nekonečně mnoho |
---|
0:02:25 | a vy těch ten prostor ten nekonečný prostor nějakým způsobem vtom rozpoznávač rozpoznávače řeči |
---|
0:02:32 | potřebujete namapoval do takového krát krátkého krásného prostoru počítači to budete mi několik desítek bytů |
---|
0:02:39 | tedy jsou reprezentovány tady písmenka madridu bit a to je celý den to prostě mapování |
---|
0:02:45 | v podstatě nekonečních nekonečno množství realizaci do nějakého krásného omezeného prostoru |
---|
0:02:50 | v tom rozpoznávači jsou |
---|
0:02:52 | dvě taková dvě důležité komponenty jedna z nich je akustický model a druhá z nich |
---|
0:02:58 | jazykovým ten akustický model ten vpodstatě slouží k tomu že se snaží |
---|
0:03:05 | vzít sto audio a vlastně |
---|
0:03:09 | přepsat nebo nějakým způsobem k tomu audio u dodat |
---|
0:03:13 | takové základní jednotky těm říkáme fonémy asi poznáte se systém filozofické fakulty |
---|
0:03:21 | a |
---|
0:03:22 | v podstatě vám to jenom říká že fajn tady tahleta část vlastně toho signálu který |
---|
0:03:26 | pak převedeme do nějakého spektra odpovídá von do tady pak vedle von i a tak |
---|
0:03:31 | dále a tak dále |
---|
0:03:32 | toto je |
---|
0:03:34 | akustický model a ten jakoby dělá tu velkou černou práci že mapuje ten nekonečným no |
---|
0:03:41 | mnoho realizaci signálu do nějakých těch diskrétních jednotek |
---|
0:03:45 | pak je tam mezi tím jaký slovník ten není až tak důležitý ten napomáhání s |
---|
0:03:49 | těch fonémů dostat nějaký slova no a nakonec jazykový model |
---|
0:03:53 | a ten nějakým způsobem řídí a nějakým způsobem usměrňovala ten akustický model protože tak jak |
---|
0:04:00 | my mluvíme když to přepíšeme vlastně píšeme text nebo se podáte do knihy tak ta |
---|
0:04:05 | slova nejdou za sebou tak jak |
---|
0:04:07 | se nám líbí ale prostě máte nějaké má to nějaká pravidla máme tam jako gramatiku |
---|
0:04:12 | co v češtině zkujňování a tak dále takže ta jazykový model tomu dává jakýsi smysl |
---|
0:04:16 | dybysme to přepsali čistě do fonémů tak se vtom úplně tolik nepozná úplně se vtom |
---|
0:04:21 | tak nevyznáte jo kdybyste si to přečetli tak vám to suchem dojde ale jako vyloženě |
---|
0:04:26 | číslem chemické přepis není úplně fajn |
---|
0:04:28 | takže k tomu je tam potom tento jazykových model no a výstupem toho celého je |
---|
0:04:34 | teda |
---|
0:04:35 | buď text to znamená máte nějaký vlastně vás nějakým časováním z nějakým a potom čísel |
---|
0:04:42 | tam o co sou nějaký pravděpodobnosti likelihood |
---|
0:04:45 | to je z toho důvodu že ten rozpoznávač si není jistý |
---|
0:04:50 | prostě vám dá vždycky to nejlepší co si myslí ale to nemusí být zdaleka pravda |
---|
0:04:55 | takže |
---|
0:04:56 | datové analytice vždycky minimálně ste řečové je dobré přemýšlet na tím |
---|
0:05:03 | to co sem dostali to nejlepší co si myslíte rozpoznávače dvou můžu dostat víc můžu |
---|
0:05:07 | dostat třeba nějaké paralelní hypotézy nebo něco takového samozřejmě to jde |
---|
0:05:12 | a potom |
---|
0:05:13 | se to dá třeba i převést nějak do nějakého rozumného grafu kdy pro nějakou nahrávku |
---|
0:05:18 | můžete mít nějaké časové linie a pro každý ten by můžete mít seznam |
---|
0:05:23 | co s nějakýma pravděpodobnostma a pak |
---|
0:05:27 | to můžete využít k tomu že případě že rozpoznávač udělá někde chybu tak vy stejně |
---|
0:05:32 | jako by to sou tam bylo řečeno zjistíte protože to může být na druhé nebo |
---|
0:05:37 | třetí pravděpodobné jako třetí pravděpodobně přenosu |
---|
0:05:44 | tak tady bych |
---|
0:05:46 | skončil něco řeči a spíš trošku obecný |
---|
0:05:50 | jak sem říkal nebo možná sem říkal akustický model to je to statě to klasifikátory |
---|
0:05:57 | to jakási mašinka |
---|
0:05:59 | kterou vy naučíte aby vám klasifikoval nějaké objekty v našem případě to je nějak spektrum |
---|
0:06:04 | ale to můžete mašinku která vás kterou na učitelovi vám klasifikoval aby to rozpoznal se |
---|
0:06:10 | to čtvereček |
---|
0:06:11 | no a potom vy jako mašinku naučíte taky dáváte ty objekty a ptáte se to |
---|
0:06:16 | je to čtvereček ano s proto čtvereček roce tady toto to neví |
---|
0:06:20 | jako to sem třeba neviděl během trénování dodržet toto je klasifikátor |
---|
0:06:26 | praktického pohledu |
---|
0:06:30 | v řeči tam máme teďka dva jakési druhy klasifikátorů ten |
---|
0:06:35 | starší historicky jsou nějaké skryté markovovy modely víceméně de o to že každý ten von |
---|
0:06:42 | s toho slova větru pět that |
---|
0:06:46 | je reprezentován ničím takovýmto je skrytý markovův model a uvnitř jsou potom nějaké gaussovky to |
---|
0:06:52 | znamená nějaké pravděpodobnostní rozložení tady těch příznaků s toho spektra které bereme jako ustupte kvůli |
---|
0:06:58 | tomu že respektujeme |
---|
0:07:00 | jak funguje lidském vlastně u lidi osle která vám převádí ten signál a převádí do |
---|
0:07:05 | nějakých do nějakých frekvenčních při support jdou potom tím nervem do mozku a bitů o |
---|
0:07:11 | tom dozvíte |
---|
0:07:12 | takže to sou skryté markovovy modely a jenom abyste měli představu úplně vememe nejjednodušší případ |
---|
0:07:19 | nejednodušší úlohu a to je detekce pohlaví svědčí to znamená |
---|
0:07:24 | budeme mít nahrávku a my chcem říct mluvil ta pluk nebo tam |
---|
0:07:29 | jak to udělám |
---|
0:07:31 | je tam ještě nádherných potřebujeme dat za námi potřebujeme roman nahrávek odchylku |
---|
0:07:37 | a |
---|
0:07:37 | hromadu nahrávek od nuly |
---|
0:07:39 | tak |
---|
0:07:40 | a tečka |
---|
0:07:41 | potřebujeme si zvolit nějaký příznak potřebu nebo jaké příznaky něco na základě čeho vlastně co |
---|
0:07:47 | budem sypal toto klasifikátor |
---|
0:07:49 | no a to nejen odrušit co asi můžeme vzít je že vezmeme celou tu nahrávku |
---|
0:07:53 | toho jednoho řečníka a spočítáme průměrnou hodnotu základního tom frekvence základního tónu a to je |
---|
0:08:01 | takový rozumí příznak protože víme že kluci prostě miluje tím hlubokým hlasem zatímco holky mojí |
---|
0:08:07 | vysokým hláskem |
---|
0:08:09 | a |
---|
0:08:10 | to sou prostě dvě jakási čísla která mohou být krásně separovatelná a můžeme vlastně ten |
---|
0:08:17 | klasifikátor na to dobře naučit |
---|
0:08:19 | totiž vememe si data od kluku |
---|
0:08:23 | a tady vlastně ta frekvence toho základního tónu to jedno číslo ste nahrávky no a |
---|
0:08:28 | když bysme to hodina nějakou hromadu tak zjistíme že nám se toto podivu vypadá jako |
---|
0:08:34 | gaussovka |
---|
0:08:35 | a potom to vlastně můžeme |
---|
0:08:37 | můžeme vlastně přepočítat do nějakého pravděpodobnostního rozložení |
---|
0:08:42 | a to sami uděláme pro holky |
---|
0:08:44 | a skončíme vlastně s nějakým |
---|
0:08:46 | rozložení pro kluky rozložení pro holky potom když nám přide neznáma nahrávkami potřebujem zjistit kluk |
---|
0:08:52 | holka tak si zase spočítáme z tu frekvenci základního tónu průměrnou dostaneme to jednu tato |
---|
0:08:59 | to jedno číslo podíváme se na osu x a zjistíme tak modelu klukovi tomu se |
---|
0:09:04 | to nelíbí to je tady |
---|
0:09:06 | malá věrohodnost ale pro model holky to celkem sedí takže nula nahrávce udělal |
---|
0:09:12 | to je ta nejtriviálnější asi případ nějakého takového klasifikátoru postaveného vlastně na gaussovských |
---|
0:09:20 | druhý |
---|
0:09:21 | jo takle ještě do takle dyž bysme měli trošku dvojrozměrný prostor tak potom ta vlastně |
---|
0:09:28 | ty třídy dvě můžou vypadat třeba takto tady nějaká ta separační linie těch model |
---|
0:09:34 | tak a |
---|
0:09:36 | druhý klasifikátoru druhý typ klasifikátoru kterým dnešní době zaznamenává velký boom a služeb tady po |
---|
0:09:43 | mně michal tomu bude ještě trošku mluvit jsou umělé neuronové sítě je to zase jakýsi |
---|
0:09:48 | aparát |
---|
0:09:49 | který je inspirován biologickými neurony to znamená jsou tam nějaké prvky které berou nějaké vstupy |
---|
0:09:56 | tak jak neuron uvnitř se potom nějak rozhodnout a se rozhodnout tak zase to posílají |
---|
0:10:02 | dal do dalších neuronů |
---|
0:10:04 | dybysme to vlastně namalovali nějak technický tak ta měla neuronová síť nebo klasifikátor postaveny na |
---|
0:10:10 | umělých neuronových sítích může vypadat takto |
---|
0:10:13 | kdy tady máme modrý vstup co šije vlastně |
---|
0:10:16 | v tomto případě pěti dimenzionální pěti dimenzionální nějaký vektor to znamená máte pět nějakých čísel |
---|
0:10:24 | ano |
---|
0:10:24 | toto je jakoby nějaká první vrstva |
---|
0:10:27 | druhá vrstva tady nějaký výstup |
---|
0:10:30 | tady ta velká kulička to je ten jeden umělý neuron a on dělá vpodstatě to |
---|
0:10:34 | že |
---|
0:10:35 | veme ty vstupy |
---|
0:10:37 | všechny nejdřív se ty vstupy na váhují tady nějakými vahami to znamená vynásobí se nějakým |
---|
0:10:42 | číslem |
---|
0:10:43 | vleze toto místo toho neuronů tam je sčítačka všechno se sečte pak se aplikuje na |
---|
0:10:47 | nějaký bias to není podstatné a u místa neuronu ještě nelinearita já tam je lineární |
---|
0:10:53 | funkce pro nás stačí třeba může tam je takzvaná sigmoida to znamená je to funkce |
---|
0:10:58 | která je mínus nekonečna tady takle třeba na mínus jedničce a pak tam někde |
---|
0:11:03 | tak to je tam takové kopeček nahoru a pak to zas do nekonečna jede třeba |
---|
0:11:06 | značce |
---|
0:11:07 | a to je vlastně to místo kde se dělá to rozhodnutí na té na ten |
---|
0:11:11 | linearitě no a to rozhodnutí vlastně ten výstup ste funkce se propaguje dal do další |
---|
0:11:16 | vrstvy a tak dále hash dostanete nějaký výstup |
---|
0:11:20 | a to je pak otázka co vy si řeknete že chcete aby byl ten výstup |
---|
0:11:24 | nebo tady víc mluvit o tom jak se to trénuje kdyby vás to zajímá sou |
---|
0:11:28 | to měl přednášku simoně howard imports a to můžete |
---|
0:11:31 | podívat |
---|
0:11:32 | a pojďme sebrat spíš na nějaký příklad |
---|
0:11:37 | mám tady |
---|
0:11:39 | nějaký datový se to dvourozměrný kde máme červenou třídu která bude nám reprezentovat na výstup |
---|
0:11:44 | takovéto sítě nebo této sítě jedničku a modrou třídu době třeba ty |
---|
0:11:49 | kluci tady no bude na výstupu deseti reprezentovaný a vstupte sítě x jedna x dva |
---|
0:11:56 | do toho dvou tady tyhlety čísla vlastně s ty souřadný s těch souřadnic který tady |
---|
0:11:59 | máme cyrila a dijkstra |
---|
0:12:02 | a teďka co uděláme vezmeme |
---|
0:12:04 | tato data a budeme ty sítě trénovat problém se dívat co se může ty |
---|
0:12:09 | se zeptat jestli bude fungovat |
---|
0:12:11 | jinak rozdíl je že tady nahoře máme síť která má |
---|
0:12:16 | tři neurony a tady máme si která má třicet neuronů ve skryté vrstvě |
---|
0:12:22 | ano |
---|
0:12:22 | pustíme trénování teďka vlastně obezitě sypeme ta data vstupní |
---|
0:12:27 | a tak jak se to vy máte vždycky po nějakým s a před udělat já |
---|
0:12:30 | nevím potřeba postup prvcích teď jak se to zastaví tak to znamená skončila jedna epocha |
---|
0:12:34 | a jedna epocha je že sme s propagoval i všechny data přes tu síť |
---|
0:12:38 | a |
---|
0:12:39 | toto je vlastně výstup |
---|
0:12:41 | ten neuronové sítě pro tenleten prostor kdy černá barva znamená jako by ten y je |
---|
0:12:47 | nula a ta bílá barva znamená že ten vypsal ten výstupy cílem je aby vlastně |
---|
0:12:52 | ta jednička pokrývala tady tuhletu červen třídu a zbytek |
---|
0:12:56 | to černý to nula pokrývala to budou tři |
---|
0:12:58 | tak vidíte vlastně ta kuš po nějaký třech čtyřech iteracích ta neuronová síť je došlo |
---|
0:13:04 | zhruba co se po ní chce a chtěla naučila tady krásný klasifikovat červených červený body |
---|
0:13:10 | vám tady říkala hele tam je jednička ta je také |
---|
0:13:17 | co je možná |
---|
0:13:20 | dobré zmínit ještě |
---|
0:13:22 | jo to posunutá lištou skončí to trénování po nějaký dvaceti epochách takto skončí takhle |
---|
0:13:29 | pokuď budete dělat machine learning k a budete vlastně pracovat klasifikátory je dobré si uvědomit |
---|
0:13:35 | že ty klasifikátory můžou mít někdy problém zaprvé s přetrénováním když máte |
---|
0:13:41 | velký model kterým a sobě moc parametrů moc neuronů ale máte malou dát tak potom |
---|
0:13:46 | může dojít k něčemu takovýmu |
---|
0:13:48 | jo |
---|
0:13:49 | prostě to vypadá jako přetrénované a mimoto některé třeba klasifikátory nebo obecně tylety myšlený přístupy |
---|
0:13:56 | můžou mít problémy z ne viděnými daty |
---|
0:13:59 | na tak krásně klasifikuje tady vlastně ty ta data která jste toto dali ale já |
---|
0:14:03 | pokud bych vzal tato který nikdy úplně mimo |
---|
0:14:06 | tak se |
---|
0:14:07 | datum že krásně trefit vlastně vidíte tak tady asi nějaká taková základní je to pokračuje |
---|
0:14:13 | a to neuronová síť na tomletom okamžiku klidně může říct jo to je prostě červená |
---|
0:14:17 | třída přitom jako člověk se na to podíváte na čtverci no tak data to si |
---|
0:14:22 | nejsem zrovna jistej protože teda to který se mění |
---|
0:14:25 | a jako tak to trošku odvážně tohleto takže pozor na to |
---|
0:14:30 | toto s může se vám stát |
---|
0:14:33 | ano |
---|
0:14:37 | vy když budete pracovat vlastně s těmi by kdy tango pracujete s datovou analytickou |
---|
0:14:42 | a používáte tam nějaké takže to rozpoznávače řeči cokoliv může to by ta je rozpoznávače |
---|
0:14:49 | obrazu |
---|
0:14:51 | s number vždycky v těch algoritmech jako říkala nám vždycky tě algoritmech se snažíte dosahovat |
---|
0:14:57 | nějakou accuracy |
---|
0:14:59 | že to mišule to znamená máte nějaká trénovací data na tom na trénujete nějakou tu |
---|
0:15:03 | vaši mašinku a chcete abyste dosáhli co největší accuracy co největší přesnosti |
---|
0:15:09 | no jak toho dosáhl můžete toho dosáhnout tím že budete to sypat více a více |
---|
0:15:14 | a více dat |
---|
0:15:16 | tak jak |
---|
0:15:17 | říkal před deseti lety měli já nevím deset na sedmou tak mají deset na čtrnáct |
---|
0:15:21 | tu pixelů |
---|
0:15:22 | přidáváte data přidáváním dát dostáváte prostě větší úspěšný |
---|
0:15:26 | jedna možnost |
---|
0:15:28 | problém bývá |
---|
0:15:29 | že vy ty data nemůže teče a přidává do nekonečna protože někdy ty data s |
---|
0:15:33 | se draze platit pro nás třeba v řeči pokud bychom chtěli pokud bychom chtěli opravdu |
---|
0:15:40 | jako vážně konkurovat udělat bysme museli mi to že to byl prostě milióny a milióny |
---|
0:15:44 | dolarů |
---|
0:15:44 | za to jenom nakoupit ta data která člověk přepíše aby my sme to mohli něco |
---|
0:15:48 | natrénovat |
---|
0:15:49 | takže dřív nebo později se možná dostanete do místa kde jako by končíte protože na |
---|
0:15:53 | to nemáte by |
---|
0:15:55 | pak vám nezbyde nic jinýho dyž nemáte svaly musíte mít |
---|
0:15:59 | mozek to znamená musíte zati přemýšlet a musíte začít vymýšlet lepší algoritmy lepší klasifikátory robustnější |
---|
0:16:05 | a samozřejmě jako jestli získáte taky tím že budete mít lepší algoritmy |
---|
0:16:10 | no a my nejlepší je |
---|
0:16:14 | standardu |
---|
0:16:15 | nejlepší je když to spojte takže budete mít i ty svaly ten mozek a |
---|
0:16:21 | získáte asi s toho |
---|
0:16:26 | poznámka ještě |
---|
0:16:28 | ta závislost |
---|
0:16:30 | úspěšnosti na datech je většinou silně nelineární to znamená vy na to abyste získali |
---|
0:16:36 | zase nějaké další jedno procento třeba musíte zdvojnásobit množství trénovacích dat nebo zdesetinásobí a tak |
---|
0:16:41 | dál takže pozor na to sou věci které vás můžou čekat |
---|
0:16:47 | a |
---|
0:16:48 | pokud byste si chtěli hrát třeba |
---|
0:16:50 | zpracování řeči nebo si zkoušet nějaký takovýdle klasifikátory z něčeho takového |
---|
0:16:55 | tak |
---|
0:16:56 | data |
---|
0:16:58 | musíte si koupit působí databáze který se dají stánku normo |
---|
0:17:02 | musíte mít někoho nebo musíte mít ty znalosti vědět jak na to a třetí asi |
---|
0:17:08 | důležitá věc potřebujete nějaký nástroje tohleto celé stavět si je |
---|
0:17:14 | ne zrovna efektivní když sednete a začnete to všechno vypsat nějakým sečku sice je to |
---|
0:17:19 | fajn protože se všechno dozvíte spoustu věcí tím že si to opravdu můžeme implementujete na |
---|
0:17:24 | druhou stranu když se někam dostanete tak byly může uběhnout x let |
---|
0:17:28 | takže je dobré používat nějaké nástroje na toto |
---|
0:17:32 | já tady zmíním nástroj pro právě to řeči řečový tu tito kaluby je to je |
---|
0:17:39 | s na které se tady spolupodílí jako universita na vývoji a to používají lidi microsoftu |
---|
0:17:45 | googlu |
---|
0:17:46 | amazonu a tak dále všichní všechny tyhle velký firmy během posledních dvou tří let dělali |
---|
0:17:52 | velký boom řeči však všichni kdo máte mobilita koš víte že tam máte nějaký diktování |
---|
0:17:56 | a nějaký tady tyhlety věci takže ten pokrok vlastně se tady teďka stal |
---|
0:18:02 | není to není to tak dávno ještě před pěti lety sme mluvili jako že to |
---|
0:18:05 | co tady děláme tak to ani hubu neumí tak to funguje i |
---|
0:18:10 | a |
---|
0:18:10 | telete nástroje velmi vlastně ten toolkit je velmi dobrý vtom že stáhnete making stal pustíte |
---|
0:18:17 | a u si můžete ráznější takže |
---|
0:18:20 | pokud byste chtěli doporučuji |
---|
0:18:25 | na závěr |
---|
0:18:27 | bych se zmínil radko |
---|
0:18:29 | využití vlastně třemu ta |
---|
0:18:33 | ze nasedejte řečové technologie sou dobré |
---|
0:18:36 | v současné době je tady passwords aspoň vtom našemu vtom naše řečové světě a to |
---|
0:18:40 | je speech analytik to znamená vytěžovat ní jakékoliv informace z řečových nahrávek které nějakým způsobem |
---|
0:18:47 | tou ve firmách nebo kdekoliv okolo vás |
---|
0:18:50 | a jako je to jednen příkladu může být deset tohleto dá pěkně aplikovat sou call |
---|
0:18:55 | centra limit jedno z vás měl tu možnost být jako brigádník nebo jako zaměstnanec operátor |
---|
0:19:02 | který centru |
---|
0:19:04 | jsou takoví ti lidi co sedí s těma mikrofon a má sluchátkama lidským počítačů útočí |
---|
0:19:09 | číslování se představí a teďka posluchače volají a snaží se vám něco vnutit nebo zas |
---|
0:19:13 | vytáhnu nějak informace |
---|
0:19:15 | a třeba call centra je vlastně takový byznys kde |
---|
0:19:22 | samozřejmě potřebujete zvyšovat efektivitu snižovat náklady a tak dále tak jak to platí všude |
---|
0:19:29 | a je tlak na operátory aby prostě uzavírali co nejvíc já nevím se mu zjistili |
---|
0:19:34 | co nejvíc informaci o těch lidí |
---|
0:19:36 | a pokud operátor není efektivní taky |
---|
0:19:40 | obvykle se to když tam nejsou zapojení ty řečové technologie děje takže nějaký manažer |
---|
0:19:46 | prostě si poslouchá třeba nahrávky nebo to nějak od obou zjišťuje samozřejmě momentě kdy na |
---|
0:19:51 | tedy nasadíme řečové technologie tak všechno nějakým způsobem de přes počítač a počítačová krásně vyhodnotí |
---|
0:19:59 | fajn tenleten operátor |
---|
0:20:00 | tomletom hovorů |
---|
0:20:02 | se nepředstavil protože oni má nějaký skripty a je možný přepisem řeči nebo detektorem klíčových |
---|
0:20:07 | slov zkontrolovat jestli on dodržuje ten daný skript je možné zkontrolovat jestli neskáče do řeči |
---|
0:20:12 | tomu komu volá nebo jestli třeba dlouho neva když někdo něco řekne na druhé straně |
---|
0:20:17 | tak teďka zaražený a ty neví |
---|
0:20:19 | deset pět vteřin přemýšlí suma odpovědět špatně to by se mu nemělo stát |
---|
0:20:25 | jestli tam vypadají sprostá slova jestli tam jsou nějaké moc se a tak dále a |
---|
0:20:28 | tak dál takže t všechna vlastně mašina toto všechno zjisti vyplivne manažerovi tenleten na ten |
---|
0:20:35 | operátor na tom není dobře se na to podívá pošle na přeškolení nebo |
---|
0:20:41 | takže |
---|
0:20:42 | jeden z příkladu bude deset |
---|
0:20:44 | na s |
---|
0:20:46 | aplikovat řečová mantic |
---|
0:20:48 | tak na závěr |
---|
0:20:54 | vytěžovat ani informaci z řeči je přesně ten případ |
---|
0:20:59 | nebo ideální případ proto to sou právě ty kdy ta je to hromada nějakýho se |
---|
0:21:03 | na nebo hromada prostě informaci který máte aby se vtom nevyznáte a potřebujete |
---|
0:21:09 | té hromadě najít ty čtyři pět kousíčku utracené informace |
---|
0:21:15 | tak toto je místo kde řečový technologie v současné době mají své jasné uplatnění a |
---|
0:21:21 | push tam uplatňování jsou |
---|
0:21:23 | pořád sem trošku skepticky k tomu že dnešní době bych si dovolil mít nějaký řečově |
---|
0:21:29 | ovládaného robota který bude někoho někde někoho někde operovat anebo řečové ovládané auto nebo kokpit |
---|
0:21:35 | protože pořád jsou to technologie jsou to automatické stroje i s i jiné dělají chyby |
---|
0:21:40 | to znamená ne vždycky všem už je rozumíte |
---|
0:21:43 | a ta úspěšnost jakoby těchto aplikacích si myslím že ještě taková aby |
---|
0:21:49 | pokud de o život aby tam to nasazení bylo nicméně bitrate řečové technologie sou jednoznačně |
---|
0:21:57 | v současné době |
---|
0:22:00 | dobré |
---|
0:22:03 | děkuji |
---|
0:22:12 | lidi bucka řekněme za extrémně zajímavou přednášku já se musím přiznat čili že |
---|
0:22:18 | co se týče neuronových sítí tak jo vím přesně to co dal eště jsem nikdy |
---|
0:22:22 | nevěděl tak krásně umělecký ztvárnění |
---|
0:22:25 | takže máme do ten obrázek bylo to je úžasnej do si zobrazení asi sme čekali |
---|
0:22:29 | tu otázku tři kreslíš nám moč graphic ten tupesy prosím sami proč emisemi chce vyrábět |
---|
0:22:34 | sledy power pointu tak je to rychlejší to namalovat fixl úzkému |
---|
0:22:39 | když bychom neuhodit nekreslím |
---|
0:22:41 | a teď naprosto otázky s publika |
---|
0:23:09 | dotaz byl že s jestli se používají nějaké koupit to informace a používají se kontextové |
---|
0:23:16 | informace to všechno je jazykové modelu to znamená pokuď bysme přepisovali třeba přednášky nebo něco |
---|
0:23:24 | takového tak samozřejmě chceme adaptovat jazykovým ona na přednášky aby tam byla ta slova to |
---|
0:23:28 | pokrytí toho slovníku |
---|
0:23:30 | a jiné to budou přednášek na lékařské fakultě jinde na ty jak na právech |
---|
0:23:35 | a mimo to zase v dnešní době začínají se aplikovat neuronové sítě i v jazykových |
---|
0:23:40 | modelech s tím že sou rekurentní to znamená my si třeba nějakým způsobem pamatuji jakoby |
---|
0:23:45 | minulost kontexty v nich zpětná vazba a tím pádem nejsou schopni dopředu jakoby predikovat ta |
---|
0:23:51 | slova a usměrňovat n jazykový model na základě toho |
---|
0:23:54 | jak to |
---|
0:23:56 | věta začala a jak ta věta vlastně se dozví včas se co řečeno ty standardní |
---|
0:24:00 | model jako nějaké statistické trigramy nedělali |
---|
0:24:04 | takže určitě kontext cokoliv jakákoliv informace o a pro adaptaci na řečníka jazyk na téma |
---|
0:24:10 | kterou do toho strčíte také užitečná a používá se |
---|
0:24:16 | zdravím další dotaz |
---|
0:24:35 | ta čeština má vždycky a bude mít asi hendikep tom že mám inflexní jazyk takže |
---|
0:24:39 | máme prostě měl nejsou něco šardičtí ale |
---|
0:24:43 | když na minulé slovních se tam vyšším ještě neviděl |
---|
0:24:46 | a |
---|
0:24:47 | druhá věc se máme málo dat je nás deset milionů aby anglicky mluvících prostě máte |
---|
0:24:52 | to máte |
---|
0:24:54 | jestli stovky by ale prostě těch |
---|
0:24:57 | těch dát je tam řádově víc takže angličtina budem vždycky náskok |
---|
0:25:01 | tomto jo za předpokladu že bysme měli |
---|
0:25:04 | data měli bysme tak můžeme dohnala ale tak prostě inflexní ono zase závisí co znamená |
---|
0:25:10 | jako by nepřesnost l jestli vám to slovo to jako znáte hře jako kořen ale |
---|
0:25:14 | budete mít jinou koncovkou tak jestli to berete jako chybu nebo ne pokud uvedete jako |
---|
0:25:18 | chybu ano prostě ty rozpoznávači vtom lety chybovat budou |
---|
0:25:22 | pokud řeknete fajtem kořeny dobře tak tam chyby je tam i na koncovka tak můžeme |
---|
0:25:27 | se tvářit jako že by to mohlo by se máte místo čtyři |
---|
0:25:57 | pozitivní negativní emoce vám to řeknu takto pokuď |
---|
0:26:01 | my máme a jako jsou dostupné robustní dobré |
---|
0:26:05 | algoritmy a tady ty na šílených nástroje na to abysme něco takového vyrobili zásadní problém |
---|
0:26:11 | s touto je že vy potřebujete rána data |
---|
0:26:15 | a tady je problém v tom že kdykoliv kdokoli zkoušel trénovat detektor emocí tak databáze |
---|
0:26:20 | byly od hertz |
---|
0:26:22 | to jsou reálná data |
---|
0:26:24 | ona vám to krásně rozpozná když pak tam pustíte nějakej film nebo pustíte něco takovýho |
---|
0:26:29 | herci hrajou ty jsou naštvaní |
---|
0:26:31 | bude to perfektní fungovat prostě vtom reálu je to jinak a ta je nejhorší dostat |
---|
0:26:36 | i ta data anotovaný data mít ty kvanta těch telefonní hovor u třeba vtom koncentruju |
---|
0:26:41 | někdo musí poslouchat tady musí rozhodnout tak ty ten člověk je naštvaný |
---|
0:26:44 | a teď není ty na tom natrénovat pak to bude fungovat ale pokavaď máte ten |
---|
0:26:49 | mismatch akože máte měli data herců jako že vám tam předstírají že sou naštvaný takto |
---|
0:26:55 | auto moc |
---|
0:26:59 | tak já mockrát děkuju tak je to budeme těžko vyčerpat a myslím si že to |
---|
0:27:04 | zvládneme třeba večer |
---|
0:27:06 | tam |
---|
0:27:07 | jsem řádek dat |
---|