0:00:17extrakce informací řeči jaké informace máme v řeči
0:00:21zkuste popřemýšlet co vás všechno napadne
0:00:25no
0:00:25jejich celkem lasice
0:00:28já to vemu po směru hodinových ručiček pět se budeme bavit o zem tomu že
0:00:32sme tady pavla datová analytika vykryta
0:00:36takže se budeme bavit o jakoby záznamech a potom záznamu nějakém řečovém záznamu kohokoliv
0:00:43je schovaná identita toho člověka znamená můžeme ho porovnávat pohlaví nějaký obsah to znamená
0:00:51vlastně kdybyste to před do textu
0:00:53se věk je tam schovaných pokud by šlo telefonní záznamy nějakým způsobem je tam schopnost
0:00:58dost a třeba i kudy to šlo nějaký kodeky
0:01:02čím to bylo nahráno prostředí kterým to za nahrávka vznikla a jazyk třeba kterým se
0:01:07tam je a tak dál
0:01:09je tam spousta informaci
0:01:11a mám velmi krátký čas takže já se jenom lehce zmíním o tady vlastně přepisu
0:01:18do textu to znamená převodu toho jako řečového signálu textu a pak bych spíš vám
0:01:23říkal něco obecnějšího
0:01:25co by se mohlo hodit jako datový datovým analytikům to znamená dát nějaké klasifikátory a
0:01:31tady tyhlety obecnější věci
0:01:33tak jak vlastně sou udělána nějaká ta mašinka která vám převede řeč do textu
0:01:41podstatě vy když neboli teďka já sem nahrávanej mám tady mikrofon a ten převádějte můj
0:01:47hlas tedy produkuj u řečovým ústrojím nějaký elektrický signál a ten si někam nahrává dostanete
0:01:53s toho
0:01:54když se to potom podívat na počítači dostanete tady takový signály to by von se
0:01:58tomu říká
0:02:00ano s
0:02:01tenleten bych vám odpovídá větě anglické větě ty trubice pět
0:02:05ano
0:02:06ten problém je že v reálném světě vlastně
0:02:11my máme řeky máme nekonečně mnoho realizaci toho signál
0:02:16tou teď opět může říct někdo jiný může tady být nějaký randall okolo já to
0:02:20musí s pomalu rychle a těch variací je tolik že v podstatě že nekonečně mnoho
0:02:25a vy těch ten prostor ten nekonečný prostor nějakým způsobem vtom rozpoznávač rozpoznávače řeči
0:02:32potřebujete namapoval do takového krát krátkého krásného prostoru počítači to budete mi několik desítek bytů
0:02:39tedy jsou reprezentovány tady písmenka madridu bit a to je celý den to prostě mapování
0:02:45v podstatě nekonečních nekonečno množství realizaci do nějakého krásného omezeného prostoru
0:02:50v tom rozpoznávači jsou
0:02:52dvě taková dvě důležité komponenty jedna z nich je akustický model a druhá z nich
0:02:58jazykovým ten akustický model ten vpodstatě slouží k tomu že se snaží
0:03:05vzít sto audio a vlastně
0:03:09přepsat nebo nějakým způsobem k tomu audio u dodat
0:03:13takové základní jednotky těm říkáme fonémy asi poznáte se systém filozofické fakulty
0:03:21a
0:03:22v podstatě vám to jenom říká že fajn tady tahleta část vlastně toho signálu který
0:03:26pak převedeme do nějakého spektra odpovídá von do tady pak vedle von i a tak
0:03:31dále a tak dále
0:03:32toto je
0:03:34akustický model a ten jakoby dělá tu velkou černou práci že mapuje ten nekonečným no
0:03:41mnoho realizaci signálu do nějakých těch diskrétních jednotek
0:03:45pak je tam mezi tím jaký slovník ten není až tak důležitý ten napomáhání s
0:03:49těch fonémů dostat nějaký slova no a nakonec jazykový model
0:03:53a ten nějakým způsobem řídí a nějakým způsobem usměrňovala ten akustický model protože tak jak
0:04:00my mluvíme když to přepíšeme vlastně píšeme text nebo se podáte do knihy tak ta
0:04:05slova nejdou za sebou tak jak
0:04:07se nám líbí ale prostě máte nějaké má to nějaká pravidla máme tam jako gramatiku
0:04:12co v češtině zkujňování a tak dále takže ta jazykový model tomu dává jakýsi smysl
0:04:16dybysme to přepsali čistě do fonémů tak se vtom úplně tolik nepozná úplně se vtom
0:04:21tak nevyznáte jo kdybyste si to přečetli tak vám to suchem dojde ale jako vyloženě
0:04:26číslem chemické přepis není úplně fajn
0:04:28takže k tomu je tam potom tento jazykových model no a výstupem toho celého je
0:04:34teda
0:04:35buď text to znamená máte nějaký vlastně vás nějakým časováním z nějakým a potom čísel
0:04:42tam o co sou nějaký pravděpodobnosti likelihood
0:04:45to je z toho důvodu že ten rozpoznávač si není jistý
0:04:50prostě vám dá vždycky to nejlepší co si myslí ale to nemusí být zdaleka pravda
0:04:55takže
0:04:56datové analytice vždycky minimálně ste řečové je dobré přemýšlet na tím
0:05:03to co sem dostali to nejlepší co si myslíte rozpoznávače dvou můžu dostat víc můžu
0:05:07dostat třeba nějaké paralelní hypotézy nebo něco takového samozřejmě to jde
0:05:12a potom
0:05:13se to dá třeba i převést nějak do nějakého rozumného grafu kdy pro nějakou nahrávku
0:05:18můžete mít nějaké časové linie a pro každý ten by můžete mít seznam
0:05:23co s nějakýma pravděpodobnostma a pak
0:05:27to můžete využít k tomu že případě že rozpoznávač udělá někde chybu tak vy stejně
0:05:32jako by to sou tam bylo řečeno zjistíte protože to může být na druhé nebo
0:05:37třetí pravděpodobné jako třetí pravděpodobně přenosu
0:05:44tak tady bych
0:05:46skončil něco řeči a spíš trošku obecný
0:05:50jak sem říkal nebo možná sem říkal akustický model to je to statě to klasifikátory
0:05:57to jakási mašinka
0:05:59kterou vy naučíte aby vám klasifikoval nějaké objekty v našem případě to je nějak spektrum
0:06:04ale to můžete mašinku která vás kterou na učitelovi vám klasifikoval aby to rozpoznal se
0:06:10to čtvereček
0:06:11no a potom vy jako mašinku naučíte taky dáváte ty objekty a ptáte se to
0:06:16je to čtvereček ano s proto čtvereček roce tady toto to neví
0:06:20jako to sem třeba neviděl během trénování dodržet toto je klasifikátor
0:06:26praktického pohledu
0:06:30v řeči tam máme teďka dva jakési druhy klasifikátorů ten
0:06:35starší historicky jsou nějaké skryté markovovy modely víceméně de o to že každý ten von
0:06:42s toho slova větru pět that
0:06:46je reprezentován ničím takovýmto je skrytý markovův model a uvnitř jsou potom nějaké gaussovky to
0:06:52znamená nějaké pravděpodobnostní rozložení tady těch příznaků s toho spektra které bereme jako ustupte kvůli
0:06:58tomu že respektujeme
0:07:00jak funguje lidském vlastně u lidi osle která vám převádí ten signál a převádí do
0:07:05nějakých do nějakých frekvenčních při support jdou potom tím nervem do mozku a bitů o
0:07:11tom dozvíte
0:07:12takže to sou skryté markovovy modely a jenom abyste měli představu úplně vememe nejjednodušší případ
0:07:19nejednodušší úlohu a to je detekce pohlaví svědčí to znamená
0:07:24budeme mít nahrávku a my chcem říct mluvil ta pluk nebo tam
0:07:29jak to udělám
0:07:31je tam ještě nádherných potřebujeme dat za námi potřebujeme roman nahrávek odchylku
0:07:37a
0:07:37hromadu nahrávek od nuly
0:07:39tak
0:07:40a tečka
0:07:41potřebujeme si zvolit nějaký příznak potřebu nebo jaké příznaky něco na základě čeho vlastně co
0:07:47budem sypal toto klasifikátor
0:07:49no a to nejen odrušit co asi můžeme vzít je že vezmeme celou tu nahrávku
0:07:53toho jednoho řečníka a spočítáme průměrnou hodnotu základního tom frekvence základního tónu a to je
0:08:01takový rozumí příznak protože víme že kluci prostě miluje tím hlubokým hlasem zatímco holky mojí
0:08:07vysokým hláskem
0:08:09a
0:08:10to sou prostě dvě jakási čísla která mohou být krásně separovatelná a můžeme vlastně ten
0:08:17klasifikátor na to dobře naučit
0:08:19totiž vememe si data od kluku
0:08:23a tady vlastně ta frekvence toho základního tónu to jedno číslo ste nahrávky no a
0:08:28když bysme to hodina nějakou hromadu tak zjistíme že nám se toto podivu vypadá jako
0:08:34gaussovka
0:08:35a potom to vlastně můžeme
0:08:37můžeme vlastně přepočítat do nějakého pravděpodobnostního rozložení
0:08:42a to sami uděláme pro holky
0:08:44a skončíme vlastně s nějakým
0:08:46rozložení pro kluky rozložení pro holky potom když nám přide neznáma nahrávkami potřebujem zjistit kluk
0:08:52holka tak si zase spočítáme z tu frekvenci základního tónu průměrnou dostaneme to jednu tato
0:08:59to jedno číslo podíváme se na osu x a zjistíme tak modelu klukovi tomu se
0:09:04to nelíbí to je tady
0:09:06malá věrohodnost ale pro model holky to celkem sedí takže nula nahrávce udělal
0:09:12to je ta nejtriviálnější asi případ nějakého takového klasifikátoru postaveného vlastně na gaussovských
0:09:20druhý
0:09:21jo takle ještě do takle dyž bysme měli trošku dvojrozměrný prostor tak potom ta vlastně
0:09:28ty třídy dvě můžou vypadat třeba takto tady nějaká ta separační linie těch model
0:09:34tak a
0:09:36druhý klasifikátoru druhý typ klasifikátoru kterým dnešní době zaznamenává velký boom a služeb tady po
0:09:43mně michal tomu bude ještě trošku mluvit jsou umělé neuronové sítě je to zase jakýsi
0:09:48aparát
0:09:49který je inspirován biologickými neurony to znamená jsou tam nějaké prvky které berou nějaké vstupy
0:09:56tak jak neuron uvnitř se potom nějak rozhodnout a se rozhodnout tak zase to posílají
0:10:02dal do dalších neuronů
0:10:04dybysme to vlastně namalovali nějak technický tak ta měla neuronová síť nebo klasifikátor postaveny na
0:10:10umělých neuronových sítích může vypadat takto
0:10:13kdy tady máme modrý vstup co šije vlastně
0:10:16v tomto případě pěti dimenzionální pěti dimenzionální nějaký vektor to znamená máte pět nějakých čísel
0:10:24ano
0:10:24toto je jakoby nějaká první vrstva
0:10:27druhá vrstva tady nějaký výstup
0:10:30tady ta velká kulička to je ten jeden umělý neuron a on dělá vpodstatě to
0:10:34že
0:10:35veme ty vstupy
0:10:37všechny nejdřív se ty vstupy na váhují tady nějakými vahami to znamená vynásobí se nějakým
0:10:42číslem
0:10:43vleze toto místo toho neuronů tam je sčítačka všechno se sečte pak se aplikuje na
0:10:47nějaký bias to není podstatné a u místa neuronu ještě nelinearita já tam je lineární
0:10:53funkce pro nás stačí třeba může tam je takzvaná sigmoida to znamená je to funkce
0:10:58která je mínus nekonečna tady takle třeba na mínus jedničce a pak tam někde
0:11:03tak to je tam takové kopeček nahoru a pak to zas do nekonečna jede třeba
0:11:06značce
0:11:07a to je vlastně to místo kde se dělá to rozhodnutí na té na ten
0:11:11linearitě no a to rozhodnutí vlastně ten výstup ste funkce se propaguje dal do další
0:11:16vrstvy a tak dále hash dostanete nějaký výstup
0:11:20a to je pak otázka co vy si řeknete že chcete aby byl ten výstup
0:11:24nebo tady víc mluvit o tom jak se to trénuje kdyby vás to zajímá sou
0:11:28to měl přednášku simoně howard imports a to můžete
0:11:31podívat
0:11:32a pojďme sebrat spíš na nějaký příklad
0:11:37mám tady
0:11:39nějaký datový se to dvourozměrný kde máme červenou třídu která bude nám reprezentovat na výstup
0:11:44takovéto sítě nebo této sítě jedničku a modrou třídu době třeba ty
0:11:49kluci tady no bude na výstupu deseti reprezentovaný a vstupte sítě x jedna x dva
0:11:56do toho dvou tady tyhlety čísla vlastně s ty souřadný s těch souřadnic který tady
0:11:59máme cyrila a dijkstra
0:12:02a teďka co uděláme vezmeme
0:12:04tato data a budeme ty sítě trénovat problém se dívat co se může ty
0:12:09se zeptat jestli bude fungovat
0:12:11jinak rozdíl je že tady nahoře máme síť která má
0:12:16tři neurony a tady máme si která má třicet neuronů ve skryté vrstvě
0:12:22ano
0:12:22pustíme trénování teďka vlastně obezitě sypeme ta data vstupní
0:12:27a tak jak se to vy máte vždycky po nějakým s a před udělat já
0:12:30nevím potřeba postup prvcích teď jak se to zastaví tak to znamená skončila jedna epocha
0:12:34a jedna epocha je že sme s propagoval i všechny data přes tu síť
0:12:38a
0:12:39toto je vlastně výstup
0:12:41ten neuronové sítě pro tenleten prostor kdy černá barva znamená jako by ten y je
0:12:47nula a ta bílá barva znamená že ten vypsal ten výstupy cílem je aby vlastně
0:12:52ta jednička pokrývala tady tuhletu červen třídu a zbytek
0:12:56to černý to nula pokrývala to budou tři
0:12:58tak vidíte vlastně ta kuš po nějaký třech čtyřech iteracích ta neuronová síť je došlo
0:13:04zhruba co se po ní chce a chtěla naučila tady krásný klasifikovat červených červený body
0:13:10vám tady říkala hele tam je jednička ta je také
0:13:17co je možná
0:13:20dobré zmínit ještě
0:13:22jo to posunutá lištou skončí to trénování po nějaký dvaceti epochách takto skončí takhle
0:13:29pokuď budete dělat machine learning k a budete vlastně pracovat klasifikátory je dobré si uvědomit
0:13:35že ty klasifikátory můžou mít někdy problém zaprvé s přetrénováním když máte
0:13:41velký model kterým a sobě moc parametrů moc neuronů ale máte malou dát tak potom
0:13:46může dojít k něčemu takovýmu
0:13:48jo
0:13:49prostě to vypadá jako přetrénované a mimoto některé třeba klasifikátory nebo obecně tylety myšlený přístupy
0:13:56můžou mít problémy z ne viděnými daty
0:13:59na tak krásně klasifikuje tady vlastně ty ta data která jste toto dali ale já
0:14:03pokud bych vzal tato který nikdy úplně mimo
0:14:06tak se
0:14:07datum že krásně trefit vlastně vidíte tak tady asi nějaká taková základní je to pokračuje
0:14:13a to neuronová síť na tomletom okamžiku klidně může říct jo to je prostě červená
0:14:17třída přitom jako člověk se na to podíváte na čtverci no tak data to si
0:14:22nejsem zrovna jistej protože teda to který se mění
0:14:25a jako tak to trošku odvážně tohleto takže pozor na to
0:14:30toto s může se vám stát
0:14:33ano
0:14:37vy když budete pracovat vlastně s těmi by kdy tango pracujete s datovou analytickou
0:14:42a používáte tam nějaké takže to rozpoznávače řeči cokoliv může to by ta je rozpoznávače
0:14:49obrazu
0:14:51s number vždycky v těch algoritmech jako říkala nám vždycky tě algoritmech se snažíte dosahovat
0:14:57nějakou accuracy
0:14:59že to mišule to znamená máte nějaká trénovací data na tom na trénujete nějakou tu
0:15:03vaši mašinku a chcete abyste dosáhli co největší accuracy co největší přesnosti
0:15:09no jak toho dosáhl můžete toho dosáhnout tím že budete to sypat více a více
0:15:14a více dat
0:15:16tak jak
0:15:17říkal před deseti lety měli já nevím deset na sedmou tak mají deset na čtrnáct
0:15:21tu pixelů
0:15:22přidáváte data přidáváním dát dostáváte prostě větší úspěšný
0:15:26jedna možnost
0:15:28problém bývá
0:15:29že vy ty data nemůže teče a přidává do nekonečna protože někdy ty data s
0:15:33se draze platit pro nás třeba v řeči pokud bychom chtěli pokud bychom chtěli opravdu
0:15:40jako vážně konkurovat udělat bysme museli mi to že to byl prostě milióny a milióny
0:15:44dolarů
0:15:44za to jenom nakoupit ta data která člověk přepíše aby my sme to mohli něco
0:15:48natrénovat
0:15:49takže dřív nebo později se možná dostanete do místa kde jako by končíte protože na
0:15:53to nemáte by
0:15:55pak vám nezbyde nic jinýho dyž nemáte svaly musíte mít
0:15:59mozek to znamená musíte zati přemýšlet a musíte začít vymýšlet lepší algoritmy lepší klasifikátory robustnější
0:16:05a samozřejmě jako jestli získáte taky tím že budete mít lepší algoritmy
0:16:10no a my nejlepší je
0:16:14standardu
0:16:15nejlepší je když to spojte takže budete mít i ty svaly ten mozek a
0:16:21získáte asi s toho
0:16:26poznámka ještě
0:16:28ta závislost
0:16:30úspěšnosti na datech je většinou silně nelineární to znamená vy na to abyste získali
0:16:36zase nějaké další jedno procento třeba musíte zdvojnásobit množství trénovacích dat nebo zdesetinásobí a tak
0:16:41dál takže pozor na to sou věci které vás můžou čekat
0:16:47a
0:16:48pokud byste si chtěli hrát třeba
0:16:50zpracování řeči nebo si zkoušet nějaký takovýdle klasifikátory z něčeho takového
0:16:55tak
0:16:56data
0:16:58musíte si koupit působí databáze který se dají stánku normo
0:17:02musíte mít někoho nebo musíte mít ty znalosti vědět jak na to a třetí asi
0:17:08důležitá věc potřebujete nějaký nástroje tohleto celé stavět si je
0:17:14ne zrovna efektivní když sednete a začnete to všechno vypsat nějakým sečku sice je to
0:17:19fajn protože se všechno dozvíte spoustu věcí tím že si to opravdu můžeme implementujete na
0:17:24druhou stranu když se někam dostanete tak byly může uběhnout x let
0:17:28takže je dobré používat nějaké nástroje na toto
0:17:32já tady zmíním nástroj pro právě to řeči řečový tu tito kaluby je to je
0:17:39s na které se tady spolupodílí jako universita na vývoji a to používají lidi microsoftu
0:17:45googlu
0:17:46amazonu a tak dále všichní všechny tyhle velký firmy během posledních dvou tří let dělali
0:17:52velký boom řeči však všichni kdo máte mobilita koš víte že tam máte nějaký diktování
0:17:56a nějaký tady tyhlety věci takže ten pokrok vlastně se tady teďka stal
0:18:02není to není to tak dávno ještě před pěti lety sme mluvili jako že to
0:18:05co tady děláme tak to ani hubu neumí tak to funguje i
0:18:10a
0:18:10telete nástroje velmi vlastně ten toolkit je velmi dobrý vtom že stáhnete making stal pustíte
0:18:17a u si můžete ráznější takže
0:18:20pokud byste chtěli doporučuji
0:18:25na závěr
0:18:27bych se zmínil radko
0:18:29využití vlastně třemu ta
0:18:33ze nasedejte řečové technologie sou dobré
0:18:36v současné době je tady passwords aspoň vtom našemu vtom naše řečové světě a to
0:18:40je speech analytik to znamená vytěžovat ní jakékoliv informace z řečových nahrávek které nějakým způsobem
0:18:47tou ve firmách nebo kdekoliv okolo vás
0:18:50a jako je to jednen příkladu může být deset tohleto dá pěkně aplikovat sou call
0:18:55centra limit jedno z vás měl tu možnost být jako brigádník nebo jako zaměstnanec operátor
0:19:02který centru
0:19:04jsou takoví ti lidi co sedí s těma mikrofon a má sluchátkama lidským počítačů útočí
0:19:09číslování se představí a teďka posluchače volají a snaží se vám něco vnutit nebo zas
0:19:13vytáhnu nějak informace
0:19:15a třeba call centra je vlastně takový byznys kde
0:19:22samozřejmě potřebujete zvyšovat efektivitu snižovat náklady a tak dále tak jak to platí všude
0:19:29a je tlak na operátory aby prostě uzavírali co nejvíc já nevím se mu zjistili
0:19:34co nejvíc informaci o těch lidí
0:19:36a pokud operátor není efektivní taky
0:19:40obvykle se to když tam nejsou zapojení ty řečové technologie děje takže nějaký manažer
0:19:46prostě si poslouchá třeba nahrávky nebo to nějak od obou zjišťuje samozřejmě momentě kdy na
0:19:51tedy nasadíme řečové technologie tak všechno nějakým způsobem de přes počítač a počítačová krásně vyhodnotí
0:19:59fajn tenleten operátor
0:20:00tomletom hovorů
0:20:02se nepředstavil protože oni má nějaký skripty a je možný přepisem řeči nebo detektorem klíčových
0:20:07slov zkontrolovat jestli on dodržuje ten daný skript je možné zkontrolovat jestli neskáče do řeči
0:20:12tomu komu volá nebo jestli třeba dlouho neva když někdo něco řekne na druhé straně
0:20:17tak teďka zaražený a ty neví
0:20:19deset pět vteřin přemýšlí suma odpovědět špatně to by se mu nemělo stát
0:20:25jestli tam vypadají sprostá slova jestli tam jsou nějaké moc se a tak dále a
0:20:28tak dál takže t všechna vlastně mašina toto všechno zjisti vyplivne manažerovi tenleten na ten
0:20:35operátor na tom není dobře se na to podívá pošle na přeškolení nebo
0:20:41takže
0:20:42jeden z příkladu bude deset
0:20:44na s
0:20:46aplikovat řečová mantic
0:20:48tak na závěr
0:20:54vytěžovat ani informaci z řeči je přesně ten případ
0:20:59nebo ideální případ proto to sou právě ty kdy ta je to hromada nějakýho se
0:21:03na nebo hromada prostě informaci který máte aby se vtom nevyznáte a potřebujete
0:21:09té hromadě najít ty čtyři pět kousíčku utracené informace
0:21:15tak toto je místo kde řečový technologie v současné době mají své jasné uplatnění a
0:21:21push tam uplatňování jsou
0:21:23pořád sem trošku skepticky k tomu že dnešní době bych si dovolil mít nějaký řečově
0:21:29ovládaného robota který bude někoho někde někoho někde operovat anebo řečové ovládané auto nebo kokpit
0:21:35protože pořád jsou to technologie jsou to automatické stroje i s i jiné dělají chyby
0:21:40to znamená ne vždycky všem už je rozumíte
0:21:43a ta úspěšnost jakoby těchto aplikacích si myslím že ještě taková aby
0:21:49pokud de o život aby tam to nasazení bylo nicméně bitrate řečové technologie sou jednoznačně
0:21:57v současné době
0:22:00dobré
0:22:03děkuji
0:22:12lidi bucka řekněme za extrémně zajímavou přednášku já se musím přiznat čili že
0:22:18co se týče neuronových sítí tak jo vím přesně to co dal eště jsem nikdy
0:22:22nevěděl tak krásně umělecký ztvárnění
0:22:25takže máme do ten obrázek bylo to je úžasnej do si zobrazení asi sme čekali
0:22:29tu otázku tři kreslíš nám moč graphic ten tupesy prosím sami proč emisemi chce vyrábět
0:22:34sledy power pointu tak je to rychlejší to namalovat fixl úzkému
0:22:39když bychom neuhodit nekreslím
0:22:41a teď naprosto otázky s publika
0:23:09dotaz byl že s jestli se používají nějaké koupit to informace a používají se kontextové
0:23:16informace to všechno je jazykové modelu to znamená pokuď bysme přepisovali třeba přednášky nebo něco
0:23:24takového tak samozřejmě chceme adaptovat jazykovým ona na přednášky aby tam byla ta slova to
0:23:28pokrytí toho slovníku
0:23:30a jiné to budou přednášek na lékařské fakultě jinde na ty jak na právech
0:23:35a mimo to zase v dnešní době začínají se aplikovat neuronové sítě i v jazykových
0:23:40modelech s tím že sou rekurentní to znamená my si třeba nějakým způsobem pamatuji jakoby
0:23:45minulost kontexty v nich zpětná vazba a tím pádem nejsou schopni dopředu jakoby predikovat ta
0:23:51slova a usměrňovat n jazykový model na základě toho
0:23:54jak to
0:23:56věta začala a jak ta věta vlastně se dozví včas se co řečeno ty standardní
0:24:00model jako nějaké statistické trigramy nedělali
0:24:04takže určitě kontext cokoliv jakákoliv informace o a pro adaptaci na řečníka jazyk na téma
0:24:10kterou do toho strčíte také užitečná a používá se
0:24:16zdravím další dotaz
0:24:35ta čeština má vždycky a bude mít asi hendikep tom že mám inflexní jazyk takže
0:24:39máme prostě měl nejsou něco šardičtí ale
0:24:43když na minulé slovních se tam vyšším ještě neviděl
0:24:46a
0:24:47druhá věc se máme málo dat je nás deset milionů aby anglicky mluvících prostě máte
0:24:52to máte
0:24:54jestli stovky by ale prostě těch
0:24:57těch dát je tam řádově víc takže angličtina budem vždycky náskok
0:25:01tomto jo za předpokladu že bysme měli
0:25:04data měli bysme tak můžeme dohnala ale tak prostě inflexní ono zase závisí co znamená
0:25:10jako by nepřesnost l jestli vám to slovo to jako znáte hře jako kořen ale
0:25:14budete mít jinou koncovkou tak jestli to berete jako chybu nebo ne pokud uvedete jako
0:25:18chybu ano prostě ty rozpoznávači vtom lety chybovat budou
0:25:22pokud řeknete fajtem kořeny dobře tak tam chyby je tam i na koncovka tak můžeme
0:25:27se tvářit jako že by to mohlo by se máte místo čtyři
0:25:57pozitivní negativní emoce vám to řeknu takto pokuď
0:26:01my máme a jako jsou dostupné robustní dobré
0:26:05algoritmy a tady ty na šílených nástroje na to abysme něco takového vyrobili zásadní problém
0:26:11s touto je že vy potřebujete rána data
0:26:15a tady je problém v tom že kdykoliv kdokoli zkoušel trénovat detektor emocí tak databáze
0:26:20byly od hertz
0:26:22to jsou reálná data
0:26:24ona vám to krásně rozpozná když pak tam pustíte nějakej film nebo pustíte něco takovýho
0:26:29herci hrajou ty jsou naštvaní
0:26:31bude to perfektní fungovat prostě vtom reálu je to jinak a ta je nejhorší dostat
0:26:36i ta data anotovaný data mít ty kvanta těch telefonní hovor u třeba vtom koncentruju
0:26:41někdo musí poslouchat tady musí rozhodnout tak ty ten člověk je naštvaný
0:26:44a teď není ty na tom natrénovat pak to bude fungovat ale pokavaď máte ten
0:26:49mismatch akože máte měli data herců jako že vám tam předstírají že sou naštvaný takto
0:26:55auto moc
0:26:59tak já mockrát děkuju tak je to budeme těžko vyčerpat a myslím si že to
0:27:04zvládneme třeba večer
0:27:06tam
0:27:07jsem řádek dat