dobré dopoledne je to skutečně tak já sem
co sem
přijel pohřbí cíl sem pohřby svou kariéru
experta neotevřené data kterým asi po tři roky jsem
na pohřbí protože jsem se proces osobních důvodů rozhodl
žít trvale na vesnici a dělat tam povolání vesnického učitel
ale abych stručně řek
co mám teda za sebou abyste věděli že je částečně vím o čem mluvím a
částečně vůbec nevím o čem mluvím a tím krásně doplnil tu řadu těch předchozí hostu
kteří také nic neumí
já jsem istro makromolekulární firmy se neprovede komína k nešel účinkem je na střední škole
určen onak informatiku
ve které nejsem nějak formálně vzdělán takže také umím pár příkazů a trochu statistiku
ale spíš jako samouk
sem učitel na nebeském gymnáziu uši asi tři týdny jsem komunálním politikem t m nejnovější
kariéra které dávám přednost před tou otevřenými daty
no a jak jsem říkal jsem bývalý obrovitá advokát
co znamená že sem byl člověk který chodil leštit kliky now základy ministerstvo vnitra
do firem a na mezinárodní konference a tam vypravil o tom jak by bylo skvělé
dybychom české republice otevřena data měl
o čem
tady mám dneska mluvit jsou teda otevřená data třeš jak víte je v zásadě pit
všem nahodim více to slovo které nic neznamená
já hrozně rád důkazu včas se tuhle křivku co šenků byl ten se pro ty
kteří ste se s nimi generále to moc doporučí s tím k
tak to je to sou po sobě otevřená data
které google publikuje pomocí takovédle vizualizační aplikace a ukazuje jak se včas se hledají nějaké
konkrétní pojmy nějaká konkrétní klíčová slova tak tohle se hledání v české republice pojmu otevřená
data je vidět že je asi tak do roku dva tisíce dvanáct znáte rubeny sem
tam přišel já
nula jo
prostě baseline vůbec nic
a pak najednou
to se byla nějaká dovolená nebo něco to nevím ale
je se za docela setrváme drží jo
pokud otevřená data byla tématem někdy konce té předchozí kdy tady
vy ten berners lee trio předpokládám znáte tak o tom začal tak napoprvé pořádně mluvit
tak v americe prostě dva tisíce pět sedum
velký p maminku nás prostě standardně opět ať po zdi
tím víc tím se o tom mluví a to je vidět jak se to skutečně
drží takle pěkně nahoře tak chtění lidí co se ti myslí a tím víc lidí
toho zneužívat
ještě když nám ta koule prezentaci pravou část narostly nebo lidi s krajů tak tam
dycky ještě ukazuju pro za co dostal ocenění že jako publikuje otevřená data ve veřejné
správy je obvykle to vůbec na vás otevřený dat nic společnýho prostě je to pojem
který se aktuální nepoužívá nikdo poznání lidi k čemu to je
no já jsem se řekl že vašeho příležitostí použit tuhlectu pohřebním přednášku k tomu aby
vlastně se konečně zamyslel hodit třech letech těma otevřel nejsou proč jsou pracemi prosazoval je
to tedy více pro mě jakési filozofické zamyšlení které abych tady dostal nárokům nebo požadavkům
organizátoru tak b zakončeno jakýmisi čtyřmi příběhy nějakými případovými studiemi
a pak se mi nástroji které sem jsou zásadně které byste
v jakékoli svojí praxi pokud si nikdy budete špinit ruce od dat
tak byste ani neměli zapomenout
tak já jsem konzole ním pustím do té filozofie uvidím jestli vaše očekávání
budou naplním aspoň trochu
proč filozofie všem filozofie to pozadí ten obrázek a zase nefunguje úplně dobře
verzi power pointu tak asi poznáte že tedy prohlášení nezávislosti spojených států které si dovolím
odpíchnout protože právě teďko někdy na konci osmnáctého století se začíná
jakási idea moderního státu a moderního člověka
to je člověka kterej osvobozeno moct otrocké dřevěnej osvobozen prostě o
tak manuální práce má potřebu se vzdělávat a podobně
tady nejde o nic jinýho nešlo jakýsi šťastný život ke kterému to celé směřuje no
myslím že jako člověk který
design o nějaké systémy nebo pracuje s daty tak by měl na to maso myslet
že jako vlastně z veškeré lidské činný má nějaké s tomu abychom vzdělanější spokojenější veselejší
radostnější a tak dál a to zní moc hezky dokonce bych řek že
jako informatika jako věda vlastně tomu nějakým způsobem směřuje podobně jako svého času strojírenství které
bych navázala votočka prostě zadá sem století aby ulehčilo člověku prďolou ty velké stroje tak
informatika taky dělá jakési stroj aby uletěla člověku to zní dobře do chvílemi se to
dete vyzkoušet ve vztahu ke státu to funguje výborně
zubejda vobrázek žádosti o řidičák začneme se snad poslední době jako někdo absolvoval neboli se
stěhovali té báječní prosím máme takovej ten registr o osoba register práv a povinností rozsah
vyznačení registr zastánci stovky milionů korun nástroje to speciální se to za ministerstva vnitra
styl rozmyslete pro občanku to tam jenom přijde té dáte to starou těm kolísá si
fotit nic sami nosíte žádný fotky ten seznam podepíšete ještě jako na takový skener dobrý
a lžete hned dovedeš okýnka prostředí čára tak musíte vyplnit s ten příšerný papír kde
to všechno vypadněte znova
a na kde se říkáte jak obvod f prost
jako proč tomlectom okýnko to jde a proč tam je to kurgane jde
pro protože
prostě
informatika v roce dva tisíce stará zejména pokud to řídí
nějaká korporace stát je docela vobrovská neprůhledná korporace tak to nefunguje tak jak by měl
prostě s těma databáze tam zachází nějak zvláštně
takže ve výsledku to nejen že jako
vás neuspokojuje nedělá vás to šťastnýma spokojeným občanem nebo zákazníkem nebo čímkoli zůstal stát pět
korporace jako kterákoli na firma akorát jasný efektivní
ale je eště ke všemu vás to jako deprimuje
protože vidíte že nějaký potenciál tady je někde to prostě funguje dobře
a vedle to prostě nefunguje
o co tedy d podle mě jako celej informatice o konvergenci jo o spojování dat
o to aby se by se prostě přibližovaly aby se věci neusmívali ale spojoval pokud
tedy použili ten příklad tím registrem obyvatel pokus ten stát nikde má data
o tom kdo sem kde bydlim když jsem tentýž získáme by se měl předchozí kartičku
tak proč já tomu jsem znova celý vyplňovat že když prostě by stačilo nakonec data
toho jinýho registru plus tam určitě mají nějaký univerzální identifikátory třeba rodný číslo
vědí že to sem já nemusím nic vyplnil to toto by byla taková majce takovou
konvergenci že by takto jako ty databáze prostě pěkně byly propojeny ne všechno to fungovalo
do
no to se neděje
a co se naopak teda děje tam je diverge krok místo konvergence ke zamořeny divergence
ta z nám zbývá to jsou spuštěna tenký léta je to koneckonců s tak jako
provázená věc z do neudržitelné takže moc dlouho ale v zásadě jako poslední deset let
jich český republice
platí že based on se exponenciální nárůst dat
souvisí to s třema věc na
interneto finds prostě když máte hromadu věcí který jako neustále shromáždil nějaký data
podstatě kterýkoli senzor od vašeho mobilu až poté co ste teda šťastnější a bohatší máte
ledničku co sama jako eviduje politý hlavní je to už tam je
tak taky generuje data každá kamera eviduje dat a tak dále takže prostě exponenciálně tady
rostou data nemluvme to sociální sítích já jsem tady dal nějaký čísla který se někdy
s koncem roku poli každou minutu přibyde nakažen tom kanálu jako dat ju tu čtyrycet
osum hodin
pět set sendesát i na webu a tak dál to nějaký průměrný číslo a jedno
jestli je teďkon jako dvakrát vyšší nebo takle je vidět že prostě je to ohromí
množství na poslední demokratizace webů rysem prostě proces devět vyráběl von notepad u své první
webový stránky
tak jsem si přebrala jsem jako hroznej master
když prostě sem jako dokážou udělat takovoudle hnusnou webovou stránku koneckonců některá nebyli žádní ty
profesionální o moc větší chtěli držadel to jako věc nějakou odbornost nějakou expertizu nějakou zkušenost
prostě se museli hodně snažit
dneska
prostě založit sigtran profitu to zvládne každý idiot taky do pole to pak vypadá
nechci neproladit ale obsah jenom tím říkám že těch dat je strašně moc a místa
toho aby tady prostě je byl třeba jedna wikipedie tam se to docela povedlo myslím
to je docela fajn příklad kde prostě hromada různých zdrojů
a move moje představa o konvergenci je že nebudu mít hromadu různých zdrojů budu mí
prostě pár velmi dobrý zdrojů který a se budou reagovat budou se pro chovat to
je můj tajný sem důvod proč jsem vlastně chtěli dělat otevřená data rysem otevřena ta
nevnímal jako cíl a jako prostředek právě které se konvergenci
namísto nějaké rozbíhavost
na
tak tohle můj oblíbený fit který se dá prostě jednoduše se okomentovat jako informační zahlcení
o jenom teda rychle byl na to nevidíte zdálky přišel jsem na to jak se
vyrovnat s informačním zahlcení
copak kůže lze to nebo to nebo to nenene zjistil jsem že to má vypínat
í tlačítko
a
nemyslím to k čemu to vede jo to že prostě sme zahlceni tak stačí jako
nechceme vědět prostě geniální tak jako moderní cenzory je že v zahlaď informace máme odpírá
při soba zahltí vás a my sme sem uprostřed toho všeho tady tato metoda toho
obecného jakoby sociologického hlediska
hodně povšechného ale vlastně tím chce tak jako komentovat jo to co tady push jako
padalo tohle co sou prostě vykryta byste prostě když máte těch informací moc
tak to pak nezvládáte říkáte že máte bydlíte
ty teorie definice taky říkat nebudu u velkých dat se mluví o třech ne
to sou ty první tři
kdo má objem nějakého jakou to má proměnlivost a tak dál ano a poslední startují
který se tomu nově přidává je
jaká je jakási pravdivosti napil co ty data dovopravdy říká jako jenom to že máte
hodně jenom to že sám rychle mění to že máte prostě
nějaký jsem za nastavenej tak že vám jako ne snímat intervalu deset minut ale co
vteřinu jako je to vo něco lepší
pomáhá to něčemu
je to otázka budou pravděpodobně n
a pravděpodobně ty kteří jenom muži natož lidé mají být tak nezvládne ve které se
omlouvám pro blues to začíná
přestávek vidět to co sem tam měl poctím taky je není celé auto vůbec celeru
poslední doby
signál šum který která se recitace ste knihy který teda říká že tím že teda
to skutečně máte víc tak neznamená že šestou dáte nějakou dobrou analýzu
to shrnutí je tam přesto přilepené to známý zda
není lepší porozumění té věci naopak je třeba o tom víc přemýšlet a máte větší
potenciál k nějakému šum
a kde to funguje
já se zase vrátím do oblasti té stát informatiky protože stresem se zlem ke své
logistickém úloze docela dlouho pohybovala sledoval jsem je příšerný to je
data můžou dávat smysl ve chvíli kdy máte jednu jedinou platform je prostě máte jeden
jediný systém informační
který obě dobře postaveny tak mám prostě generuje docela dobrý data aby na ni mám
jste dělat nějakou analytiku a pořádek nějakým predikcím a podobně
to si bohužel takové řekl každý státní úřad
kterými pořád nějaký informační systém co za prosím dvacet let potřebovali všechny některých být pro
čísla přesně já jsem zapomněl
ale v české republice několik tisíc informačních systémů veřejné správy co je neuvěřitelný jo prostě
to z n že každý udatných má si tak deset a všechny zoznam si navzájem
nekompatibilní a všechny stále zádu milionů korun
výsledek je
že se ty systémy s tou nepovídejte srazím obloukem zase zpátky ke se musí byl
řidičák prosíš má nebo si velký registr zejícího právní a registr obyvatel a ty systém
s tou nejsou schopný povídat no tak důsledek je že občanů musí prostě
jako blbec vyplnila pořád stejný formulář
a kde to eště funguje když teda si řekneme že jednotným platformy nemáme budovat je
poměrně náročným tak to je případ oper propojený dat
lindy ta pokud to někdy použil
dovíte co sou lindy ta
roku nahoru kde se nevyslyšela víte co to je
dobře
tak kdo to neví
děkuju do se přihlásil
tradiční patnáct procent
tak co sou lindy ta velmi stručně velmi jednoduše takový příklad pro studenty gymnázia
máte nějakou tabulku kde sou země světa celá brazílie čilé pak jako další sto osumdesát
a máte na počet obyvatel
ta čísla jsou kupodivu realistické
a napadnete druhou tabulkou kde totéž akorát tam není počet obyvatel rozloha
a no ideální je když máte takovéhle dvě tabulky tam lze zavřen velmi jednoduchý příklad
tak lindy ta znamená takže máme nějaký systém řekne
takhle brazílie
je totéž jako tato brazílie
to točila je totéž jako toto čile to znamená že nás to můžu udělat fakticky
jednu jedinou tabulku role kde to pro postupuju a řeknu ty dva sloupečky patří sem
taky
jo
no uronil ti data vás dosažení tak jednoduchý a velmi často tak typ identifikátory tomu
brazílii brazílie či léčila
není tak jednoduchý ale je vidět jako k čemu to spěje zpět o tomu o
čem se mluvil že ten cíl ta konvergence těch na to aby to nedávalo smysl
dohromady abyste měli spoustu rozbíhavý zdrojů ale ideálně jeden dobrý fungující
tak jak to je pravidel
vtom to skvělém světě kde teda exponenciálně roste objem dat tak těch propojených to zná
velmi dobře struktury dat ve kterých se můžete dotazoval velmi dobře a široce
tak je hodně mám já sem tady ukázal přinesl dva diagramy
tak se z roku dva tisíce jeden se to tak zvaný l only to alt
zvaná jakýsi
u block
síť s propojených dat
každá ta
takže to kolečko
znamená nějakou databázi
tady uprostřed je d v p děje líný tedy je
jakási nadstavba na tvý type d strukturovaná databáze která posyp informace sty wikipedie
mám nějaký databázovým formě je toho hodně chytřejší wikipedie teďko na to přišla taky tak
jste pokouší dělat a to b jeden z mých závěrečný příběhu tak na ní tedy
jsou nalinkovaný nějaký další databáze
já jsem je nepočítal proti tady je ale odhadněme třeba dvě stovky
dnes je to jako by dobrá heuristika dejme tomu tak dvě stovky každá ta čára
znamená jsou spolu pro venkovany to znám přesunou data se na tom předchozím slajdu ten
propojit tuhle tabulku s touhle tabulkou pokud se týkají stejné věci
co jsou tedy výběry je docela fajn požehnaným tedy jako na wikipedii máte prostě hromadu
různých prostě objektů území přes osoby historické události a podobně
tak takle vypadá jako plnej strukturovanější co o mimo jednotné platformy asi na zemi lze
aktuálně vidět tedy šlo vidět no cena tisíceré
ten í obrázek dubem dva tisíce strana
je vidět že se o prsty ve wikipedie malinko se na to přes kupilo a
tohoto přibyl jo odhadem tak jako třetinová čoklovi malinko to roste jo to co udělali
jako ty nej strukturovanější ajdsáci na týhle planetě zakoření tři roky je že s tohodle
vobrázku
dělitelem obrázek l tak vypadá že i jako je to vlastně docela dost se že
toho za ty tři roky moc nestihli
my což je docela špatná zpráva protože pokud nám exponenciálně roste objem dat
a tady konvergence trvá takle strašně dlouho
takže je naprostá většina těch exponenciální chybějící daty jsou jako nesnesla blbost
takže jako relevantní že to taky nepřibývá exponenciálně
nicméně to znepokojující ho pokud prostě skenuje té hromady dohromady k ní
hromady nějakých prostě starých databázových záznamu a podobně
nedokážete nějak propojit tak máte jenom lisovaný ostrůvky který se ne nedávat žádnýho kontext
co neuspokojující a této sebe červeně orámován
tak to je to že ty databáze který byly někde ve středu už na tom
předchozím obrázku tak sou eště víc pro linkovaný
v podstatě s téměř každá s každým
a to je dobrá zpráva protože to znamená že
můžete ty data pro hlinková máte ještě o něco účinně
a
tak eště srovnání aby to bylo myslím dobře vidět
jsou že ten odhad že to nás to takto polovinu je asi je asi docela
dobrý
takže dobrá zpráva
ale jako z hlediska celého systému nic moc teda jako nějak to spěje nějak dokonverguje
ale že by to byla teda jako nějaký vítězství ducha nad hmotou to teda ani
náhodou
tak jak ten zařídit abyste měli ta propojena data by to konvergovat no tak musí
to být nějak jako strukturovaný a srozumitelný konec té nejznámější tak zvané pětihvězdičkové schéma který
právě vynálezcem webu climber nesly jestli formulářů bylo dobré aby prostě data splňovaly tyhlety ten
a to velmi stručně projedu dokumentu to abyste věděli tak kde se jakou současnosti pohybuje
o
tak
jednička nebo jedna hvězdička znamená že nějaký data se vůbec na webu
to tam příde možná mezi sestrá z legrační ale jako za chvilku vidíte nejenom si
příběhů tak zdaleka není zejména ve státní správě samozřejmě že všechno je na webu dokonce
to platí takže na webu není téměř nic a jednotkovým koupou na webu něco je
no tak železí nebudem spokojný když bude
aspoň něco naprosto strojově nečitelný ho pdfka nějaký naskenovaným prostě fuji tak to aspoň že
to bude na webu ralston se to dá prohlížet
dobrý příklad aby taky to start ostrou pořád nehanila je tady nějaký amatérský generálu
někdo já teda taky ne ale kamarádka ano
a půl by se někdy chtěli zjišťovat svůj rodokmen tak dobrá zpráva ediční těch začaly
scan všechny ty bláznivý matriky prostě vocet nás je století do dvacátýho století takže neska
nemusíte si do archivu někam úplně do prčic do třeboně ale můžete si to prostě
klikat
teďka doma není to struktura databáze sou to nasměrovaný historický matriky ty jsou tady divišova
k nedá se to pořád ničí zvířata nemáte kurz
ale sou to nějaká s tou latencí aplikované na
druhý obrázek ještě sou strojově čitelná to znamená není toto nás ke není vhodné naskenovaný
obrázek i když samozřejmě jako cirkulace dá všechno
trojka je že je to o formát který nevyžaduje
speciální přístroje speciální softwarové vybavení
hele ty tři hvězdičky to je něco co já sem tam tři roky platil státní
správy aby aspoň do téhle se úrovně
data byl no a pak
no a pak ta hvězdička to sou jednotné identifikátory to sme ná aby bylo jasné
že brazílie ano posledně sto napojíte do toho proudu hovořil že tam mám přibyde
tady vtom o
tomlectom obrázku mám tam přibyly no kolečko navíc to bude ta naše tabulka ta naše
databáze
prahu švéd natolik struktura strukturovaná natolik propojená single že
že se dál to zahrnu m kantora driftové sem obrázku sou asi tři kolečka čez
vložení čistě nemáte zhotovena
tak k tomudle nějakou pozemském vidět že ty kroku je poměrně dost a zamořuje nesmyslný
všechny data převádět takhle takové strukturovat má to smysl nutně který vopravdu ze kterých můžete
něco vytěžit
jak to udělat
já jsem na nějaký čtyři cesty teďka sem se setkala k velmi rychle oku mementu
pizzy poslední dvě o něco detailně
první regulace
prostě přijde nějaký regulátor to jedno kdo to bude a řekne tak milý producent teda
ty to budeš produkovat takovýmdle datovým modelem
f takovýdle formátech bez doplňková v a tam a tam
já se jasný že to příliš nefunguje
zejména lištami dáte žádnou sankci a hlavně tady není jako ní nikdo pozici nějaké autority
kdo by tohlecto dělat
standardy jsou na tom líp
o chápeme to jakési do jako jakési chytře vymyšlené doporučení jak se mají data strukturovat
o standardy se neska pokouší kdekdo zejména konzorcium ve tři c l postavil zase která
se snaží chtěla s tím se nemilým
nějak udržovat work nějaké jako dobré kondici a udržitelné podobě na tom na tom záleží
když to vymyslel nicméně ne všichni samozřejmě standarty nerespektuj byl jsem loni na konferenci obnovit
foundation v ženevě kde byl celý n velký blok o tom
že tam zástupci různých ministerstev nitra informatiky sledovaného tam který standarty nejlepší je pak se
dohodli že by nejlepší bylo kdyby udělali standard po standardy
což není vtipný jo pak se dokonce ukazatel sme úrovním shannon sada pro standardy existuje
a je na základně jaký slovníku a že to pravděpodobně bude takle dál jo i
je to opět snaha o nějakou základní konvergenci ovšem ve chvíli prosím vás spousta těch
snad hrozně rozbije
chytrý design je něco sem s m co má velkou šanci změn co tam za
chvilku
a pak nutnost řídit té smutná zpráva pro všechny kteří nemají rádi uklízení tak
hybridizace jako moc konvergenci světa konvergenci dat pomocí chytrého design
město rovná tenhlecten pán a znáte někdo
prvně
tak pepane nitra
který je i jak je vidět nezkoušej přednášející na nějaké vysoké škole fandili prestižní nějakým
od sblížil přesně už nevím kde
člověk který ji prostě pracovalo pindy dlouhý léta nám vlastně z nějakého jako na ten
sto zájmu
nulu záleželo tom aby ty děti chtěch slámy
indický naprosto fully aby byly dobře zdělání třeba by měly docela solidní anglicky
on s ním velmi pokus ničil je to velmi zajímavý vůbec to sem nepatří do
bod číslo prostudovat na nadtyp na jednu spousta této ú velmi dobrý ono to čili
děti anglický výslovnosti ta že jim dal klasický hlasy vyhledávání google
a říkal mluvte do tyhlecty recitando nečtou dokud orbits to co vy chcete
nevelím obecné říkal jaksi ty věci vysvětlit vyslovuju honem prostě dá nějakej seznam slov no
věci který by mohli zajímá a oni prostě nějakou jako velmi špatnou výslovností do toho
říkali device nedopsal něco jinýho vyhazoval n to jiný věci
a viděli to tak dlouho ozdobili děti jeden to tak dlouho dokud to skutečně jako
nezafungoval onen to nenašlo to co oni potřeboval repríze které neznám jako hodně zajímat o
pokud chceme po lidech nějaký strukturovaný data tak nemůžete říct nějakými prosím vás dejte to
zkuste
jako libovolným člověku náhodně vybraný vzorek pěti lidí počínaje vlastní rodinou poničená voni vybraným bezdomovcem
na silnici jo aby vám strukturovaně je co před a byla musela vyplnil nějakou tabulku
nebo tak jako obvykle to dost hrůze
zase by jsem uzené dávat na veřejnou spravuje se tam pracuje s tabulka má databáze
takže to nejde bylo data na com volný pole působnosti moc nejde ale kde
to nastavit tak
design nově aby ty lidi chtě nechtě má museli teda ta vyplnit strukturu
jo
jak se to dá dělat ukážu zase nějaký příbězích
jednoduchá věc kterou vymyslel britská státní správa už před sto padesáti lety a tyto přebujelou
a nebo já se to dobře sou formulář máte latencí formuláře můžete velmi snadno ovlivňovat
o co tam ty lidi vyplní omezí p prostě možnost vyplníme nějaké hodnoty
jak je tam předvýběr a podobně všechno velmi jako základní typ dyzajnu ale kdyby za
jenom který vám hodně usnadní to že vaše data budou prostě použitelná budu propojitelná budou
struktura
to je všechno kdyby to něko zajímalo napsal jsem na luků když si o tom
nějaký článek tak tam najdete
se to jak naučit lidi strukturované
data poslední a teda špatná zpráva s vopravdu zahlcení
velmi špatnými daty který nic neříkej a svůj to roučkem syrovém nesouhlasit tom smyslu
že jako algoritmy toho nebo algoritmy na zachrání a chytrý lidi přídou práci n
my se zahltím
dřív než vůbec bude šance nějaké algoritmy vytvořit takže proto tady víš o
buďte vklidu a vyhazujete bez jakýhokoli sentimentu vyhazujete a nebo ještě lépe pokud můžeme předcházejte
tvorby zbytečných dat
pokud jako ujíždějte na tom antifa jedna jaký mají sel sledujete si prostě srdeční tep
a
políbení ujdete a kolik nesnědli kalorií a tak jako dělejte si to jo a které
hlavně jako někam určete kdo ty data zdědí a šednou zemřete
ale doporučuje se nechcete vy se vaše příbuzný názvy nesnaž této o unese verze se
zbláznili vy tak to velmi prostředkem naved za chvilku dělat nic stihneš metal život meta
život znamená řvete sledovat svůj život ale hlásím že pro ten život a nějak nezbyde
čas a místo
a
je třeba hodně třídit hodně přemýšlet co má smysl dělat
aktuální politická možná se zaznamenali
tady nějaké neustále bitky jo ustav prostorům totalitních režimů se vše nějaká banda prostě historiků
s t dvou mám historiků a který se mezi sebou řežou a není mediánní moc
jasný
jako bude ten správně jak a kdo je ten zlou no ale vy tam ho
jakýsi spor jestli digitalizovat úplně všechno co std kdy vytvořila a je tam nějaký jako
přitom který říká ano je tam napsáno zákoně my máme zdigitalizovat úplně všechno
jako pro dává to prostě práci jako několika desítkami lidí tak dobrá to je sociální
rozměr ale jako z hlediska obsahové ho datového jako proč bych měl mít naskenovaný úplně
jako každý papírny std kdy vytvořila by stejně to musí existovat těch fyzický na
takže nebojte setřídit nebojte se data vyhazovat nebojte se předcházet to může produkuje možná se
to sami zažili na záležitosti digitální fotografie doby dokud ti lidi měli positiv foťáky na
těch třicet šest políček to kinofilmu r docela zvažovali co fotit
tak n a neříkám že to špatně to jednoznačně dobře že sou digitální foťák i
puzzle košem pak je že pak je fotek máte tolik že nejzásadnější aktivitou při fotkách
z dovolený je to pro třídění bez vás nikdy
promítal pět set fotek z dovolený svýmu kamarádovi tak jistě lůžko hodině postavte fotek na
něm viděli byl znuděný výraz otrávený výraz takže přemnožení dat je způsob axis kazi dobré
vztahy
shrnutí pokud tohlecto sou nějaké čtyři cesty neříkám že to úplný výčet je to můj
výčet
jak produkovat čistá data
tak za že jak graficky vyjádřit co je tak účinně to tak není součinem opravdu
jako zbytečná na to ne poroubková a produkovat jenom ty dobré
a s těch když už ta data na ten olše potřebujete tak doporučil zejména pro
se všemi ženatí jak by zahrnovat ten sběr dat tak aby to bylo chytrý
si na co se neodpustím je určena to můj název jako informační gramotnost o že
taková datová analytika prvou osmnáctiletý děti
a je tam jedna studentka dělá hrozně zajímavou seminárku
že porovnává dělá to se takový jako metě mizí
poradenství nebo byznys intelligent nebo jak ste museli dnes to muréně říká pro dva zámky
tam u nás regionu jeden teplicka byly vděčně porovnává to read oni jako daly ty
data
no paříže na papíru
a je to úplně příšerný podoby jo
tak kdyby jako oni ty data prostě sbírali nějak inteligentně a ne tak jaký to
vykonal jaký to prostě bulletins práce oni mají tak nějaký nástroj pro řízení
vlastní prostě
tak
ponec filozofie ty tři se na filozofie budu jenom odvolávat nějaký čtyřech příbězích které jsem
slíbil na začátku
pojďme na to
ten obrázek pozadí možná to nepromítnou postupně rozbitý
to možná poznáte někdo
to je knihovna poslanecké sněmovny tak hrozně krásnej tvůrcem a je tam takový ty vyřezávaný
prostě police hromadu knížek sbírku prosím historický knihy dlouho foster dozadu
no a ta knihovna má jeden obrovský prima
ona shromažďuje výroční zprávy politických stran vše který tak v český republice sou minuty velký
sešije papíru
co šije jediný místo tam ty politicky strany mají uvést
zdroje svýho financování takže docela to bylo hodně seskupí před prezidentskou volbou kdy se tak
nějak jako řešil kde vzal miloš zeman peníze na tu svojí tampa nic jenom jako
ze sbírek s p z nebo z někoho jinýho na deset a chcete dozvědět tak
zavřete data jsou přístupný a veřejný jo
konkrétně co přístupný až po prvním dubnu každý pracovní den osum a šestnáct a přijdete
do snímaný čtyři kde zavoláte čtyři pět jedna tři a požádat r pro dopadne díký
ale myslím požádáte o kartu hosta s doprovodem nutný platný dopad protože si podle projde
bezpečnostních kontro super přístupný data jo veřejný data
kde je sem evidentní veřejný zájem proč by lidi měli vědět do finance politický strany
jo
a reservní můžete dostat ale takto jo takže pokud chcete na novináře jako
dejme tomu mladý fronty tak prostě jedete těch pár stanic s toho andělu kde mají
to centrum váš někam do tý sněmovní je tam teda zajde ta strávíte tím dopoledne
pokud se prostě novinář nebo kdokoli který bydlíte fašismem tak je to pro nás prostě
jako jeden z aby ty pracovní den možná spíš dva nutná dovolená tak dám prostě
se to nedá dělat
naštěstí
existujou beta chci který tam zajdou všechno to vyzvednout nafoť a si to a pak
to s těch fotek přepisu
s armádou otroků teda armáda otroku opisuje takže dneska vyrůst o osvobození moc této trapné
povinnosti chodí vždycky až po prvním dubnu a můžete několik let zpátky se podívat na
ty data na politické finance c z
to si tímlectím příkladem řídit
v tomto pochlubit zabořený font otakara motejla
to platil a dělat míchaná teďka skok velice tak ale vo trest a říkám je
že prostě řada důležitých dat
na rozdíl od řady blbostí prostě jako online nejsou a pokud je chcete apod skutečně
vyhodnotit že za to stojí
tak prostě někdy musíte udělat tu špinavou práci že prostě z digitalizuje ta nikdy to
nejde jinak než at prostě máte bandu těch otroku který vám to prostě opisovat jo
stejný příběh by se dalo říct o koho volit u možná štvete znáte docela jako
by známej projekt je ledakde volební kalkulačky předvolbama jestli ste se to všichni diskuse
mně by pokrývající hlavy tak
to je dobře oni dělali volební kalkulačky na základě dotazníku raky na základě hlasování ve
sněmovně
když to začali dělat asi před třemi lety je tak zjistili že ve smlouvě od
roku devadesát dva bylo asi padesát tisíc hlasová sto naprostá víťa samozřejmě bylo jako totální
šum
to bylo hlasování o tom jestli b přestávka teď neboli za chvíli je sice při
hlasování nebo ne
ale pozor ne všechny ty hlasování byly jako ty rush
protože někdy prostě opozice přišla jako s přerušením jednání dobrý by bylo třeba něco schválit
a tak to bylo třeba dozná ten kontextem jenom se to úplně jako mechanicky jednoduše
co udělali toho volit u s michalem schopen to že brilantní některé možné nezlepší který
jako tahle země má který se neboj o tom veřejně mluvit tak tento brilantní hektore
najal prostě davy studentů který to ručně kódován prostě četli vždycky jako už do hlasování
bylo kdysi přečetli ten zápis t schůze protože patřil znát kontext
o ten projekt lituje jako nějakej k otto hlasová vestou sto mají
teda ty můžou dělat jako stojí analytika dělat na tím všechny ty bezva aplikace jako
je koho volit neuvalení kalkulačka volební průzkumy a podobně a začátku byla tahle stav otrocká
práce
ve ty digitalizace jo
takže pokrytou tady už víme na to jaksi divili ty data sou
tak musíme vědět že třeba docela často ty důležitý prostě vůbec nejsou
tak to jsem příklad to inteligentního dyzajnu aplikace kterou vyrobila obnovit foundation oblasti otevřené přístup
k informacím asi jako lídr ovská organizace prvků spolu psaní stojí doporučuju faulovat na svět
všechny tyhlencty lidi tohle se vyrobil asi před rokem
zeptaj metr
a co to dělá jo dělá toto že vám to vyrobí takovoudle trasu mapou tady
tohleto přímo dělal teda pan schafer uchu spolu o pitvy napoleonských devatenáctým století kdy máte
ta koule krásnou jako
aplikací aplikaci jako nějakej javaskriptu tady je takové časová osa který soap jednotlivý by tedy
který sám za rovinka zónová pět i kolečka jsou velký podle toho kolik tam bylo
vojáků kolik tam zemřelo to už nejde japanisto klikaté tu s tady nebo tady tak
tam jak to ukazuje nějaký vobrázky a popisy k těm bitva jo prostě
nádherná věc pro studium pro nějaký jak u školy a
nebo pro prezentaci čehokoli tohle se prosím jakou kasková nějaká aplikace
pozadí toho je obyčejnym google s proč vobyčejná tabulka
ale dobře strukturované ohniskem nemám to dáme zadarmo klidně se to používejte
dělejte si ty pole chcete takovejdle jakoby propojeny časovej to sama
na komerčním člena nekomerčnímu čili jakkoli ale ty data museli spektrum tak jak mi vám
říkám jo takže není tyhlencty dělají to se dělá a my teda s těma chemickém
a dětma ta jestli chcete
aby to dělalo to co chcete tak musíte nám ty data dá tak jak my
chcem
musím řezu není úplně intuitivně sem se s tím hrál si na třetí pokusme se
nepodařilo
aby to fungovalo tak jak jako na
a voni teda ta pak používá jako otevřený a pokud to z nějakema dalším za
tou lossless měli příklad jak donutit lidi aby teda data publikovali
tím zajímavým způsobem
konverguje má integrujeme
postoupíme dál
příklad encyklopedie léků to je aplikace která vznikla nut u s propojenými daty na tím
jedním kolečkem ste možná dvěma kolečkama
vtom load výkladu který sem vám ukazoval lze dva tisíce jedenácty čtrnáct
a je to teda jako nejsou vnější informační báze oblecích které veřejně přístupná složení farmaceutických
nepravěpromě mají databázi o něco lepší ale jinak vám í nedají je nebo c nechaj
poměrně draze zaplatí rehabilitaci ochrnul dostala naší soutěži aplikací pro otevřený data monash otevřenýma na
tom
a nějakou cenu minulý rok
příští týden je tuším vyhlášení pro ročníku tak to tam taky zajímavý aplikace na tvořena
tam a tady to ukazu taky protože díky tomu že ty data jsou propojeny tak
se tam tak to auto nalinkovat je
na farmaceutický data
z nějakýho americkýho registru
takže tahle aplikace korun to že to jako by obyčejná encyklopedie tak je schopná vám
třeba říká
kterej který míle jak má stejný nestih mučený látky opoře porovnávat
porovnávat ty léky mezi sebou dokázali najdeme ty lékárně to nějak je asi je to
je to poměrně vymazaná záležitost
která
přesně nejsem nenajedí mokrý sem jo pro se tohlencto sou
krásně skon verbování data
o lécích nějakým a můžete dělat takovýdle legrace jako encyklopedie teďka c z
no poslední té částečně smutný příběh ale s potenciální dobrým koncem
wikipedie samozřejmě jako slily příklad kterou co synku a jakou moudrosti davů a tak všeho
fakt je to dobrý má to ale s tou velikostí jeden velký problém má to
prostě dvě stě osmdesát jazykových verzích terénom těch asi sedum největší který tvořej asi devadesát
procent toho objem strašně moc
a
problém je že prostě nejen všude je tak mu nebo jak velká by dokázal všechny
trvat aktualizovat takže když vám třeba nějaký člověk zemřel to se docela často stává a
tak prostě noc aktualizovat tou kdy zemřel ve všech těch jazykových verzích znamená prostě
tolik záznam pizza nikdo opravdu známý
tak prostě ve šedive se osmdesáti verzí nepravěpromě má svůj profilu svoji stránku svoje encyklopedický
heslo tak to musíte ručně pře kolika jo
to je neznamená zametá nevěrohodnost a jinak to ohromná práce je to přesně ten divergentním
přístup proto se mu to je znázorněn tím schématem velmi divergentní ještě se potkali s
tím
že když na české wikipedii jsem si tajita koukáte na tom lidskou ten obvykle bývá
mnohem lepší otřel chemii má nejlíp udělám německá
wikipedie tak na chemický jestli koukam jenom němčiny
na věky data je projekt asi dva roky starý který se tohlecto změní který říká
chlapci sto vrátíme se k základům
postavíme tu databázi jako strukturovaná databázi budou to všechno lindy ta
a tím pádem když někdo někde něco změní například o tom úmrtí nějakého člověka tak
se to projeví úplně všem
tohle chvíli
je to ve stádiu kdy to musíte dělat velkými ručně
takže dneska se bity komunita
zaměřené na tvorbu nových článků těch může koneckonců dost ještě šumím všechny dost chybí těch
zásadních jenom pár a na to se ty com soustředí tak je
panič integrace ta vnitřní konvergence těch dat tak aby tohlecto co pro vás jako uživatele
není vlastně vidět tak aby ty střeva zatím ve strukturovaný a dlouhodobě použitelný na jakýkoli
další rozvoj
takže zatim sme ve fázi upocená práce ale doufáme že jednou to budou
lindy ta stejně jako slavný b p g
tak to byly čtyři příběhy které doufám ilustrovali filozofy
já mám posledních pár minut na to
abych doporučil aspoň tři věci které s omezen zásadní a pořád bylo řečeno že většina
z vás jako přímo na toho analytiku nedělá takto doufám jsem cíl dobře když jsem
vybral následující tři
o tom refine kdo to znáte
super polovina
tak open refine dříve google refine
vlastně docela jednoduchý a přitom velmi sofistikovaný nástroj jak s takovýdle prostě nějaký složitý databází
tabulek je tam nacházet duplicity a je tam režírovat věci jak porovnávat věrohodnosti dat
existuje na to s řada tutoriálu najdu tubu je to zadarmo je to o tom
musel stáhněte si to používejte to jakmile naše data jsou bit
a jedno kolik těch řádků mají abych se vraťte se mu předřečník prostě pokud ty
data vám přijde že extrospekce ustavena máte tak open fajn ten správný nástroj
vyplatí se na to jeden večer věnovat tam nějak se základní synovče pracovat
u ten na ty pitomý duplicit je to výborný
ugrofinštin table z kdo to znáte
který
třeba tak senilně lenošný
je to svého času pokusná aplikace dneska už je to nějak oficiální třešně se to
menuje dynamické tabulky google se z ní jo hodně v s pohlavně nezemřeš umožní table
s je lepší název najdete to normálně jsem google krajkou když tak se tam na
doinstalovat jako aplikace
co to je nástroj ná jedna hosting nějaký databází potom zde někam nahrát svůj databázemi
leží na těch bobulí server
kdekoli dost na nemusíte to hostovat někde u sebe
ale hlavně to můžete právy narušovat
se všema těma dalšíma google tabulka má který tam jsou
velmi často nepotře vede dějinách moc na to abyste si vyrobil docela svojí databáze hezkej
bonusů mít okrasný vizualizace a tak základní analytiků statistickou na ty vizualizace sou hezký zvlášť
napoví jo takže pokud vazba vydělat mapují aplikaci jedno co to je
takže to znaky na nějaký bitmapy nebo nějaký body na mapě nebo nějaký
nějaký trasy a tak jo datové výstupem mocenské mimochodem
všechny ty aplikace který dělá koho volit ú všechny dynamický grafy a tak
tak šroubů byl fízlům table se o nás rezervu který já učím děti na gymplu
tak
ne sem sto můžete naučit tak
tak jo dá se tato přidat jako aplikace tam ano
kdo to byl kraje
no a poslední to je spíš vějička a zase těm vracím k tomu co je
ten chytrý design
okny ta institut což asi sto padesát instituce kterou založil pin berners lee
taky basy obrovská instituce v londýně s obrovskou podporou vlády která má
jaksi rozšiřovat otevřená data
oni hned na začátku své existence nikdy loni
přišli zemském nasereme se to o tom je i ta certifikace
ve von otakara motejla
a já sem tam to byl můj poslední projekty s nedokončil
totiž s m začalo ukazovat oponenta certifikát tady českou je to velmi dobře udělaný sofistikovaný
dotazník který se snaží zjistit informace o vašem data se to
to se jediný datasety tam aktuálně soudy české republiky soupis všech sou v české republice
ten sem tam dělený sem s tím poprvé no pušek na tom jenom záznamu je
vidět spousta věcí jo
znáš důležitý je tohlencto vidíte že ty data nebyly nic moc to byl nějaký státní
data tak je to ta nejnižší úroveň jako by otevřenosti dá dat nějaký rotate a
pak je tady a tak dál
pak je tady velké na gymplu vizita roman to rovnou doporučí co máte udělat aby
ty data byly strukturovanější lepší ale použitelný
tohle someday lokalizujeme proto protože čeští úředníci neumí anglicky a když bude státní správa používat
českou verzi okny ta certifikátu tak doufáme že je to tímlectím chitin design a jakousi
soutěživostí
popostrčí k tomu aby ta data ze něco stále abyste pak mohli používali dělat na
nima nějaký pěkně aplikací
tak chtěl jsem skončil druhou část čtyři příběhy a tři nástroje tak znova tady pro
mi tam se vymrskat ti to co sem sliboval
a teď je otázka jestli sem naše očekávání případně své sliby splnit
pokud ne tak se tam máte po si že to není marný
tak se mně ještě je můžete samozřejmě ta asi tak jako pěkné do
a když ne tak vám moc děkuju za pozornost vrátí vačnatci radši muru pouze aktivní
roli poblít
dobrý den za tři dnešku možné tyčku netradiční si nebudete zlobit jak první otázku
může si cvičně z je tedy někde kde c
že by děku neměl říct a řeknem si tam pokud
b c dva zápory takže já jsem do neporozuměl
ale jen jeden či direct je jasné jak by vyvine mít dvěstě rozmisťuje
ne vidíte že přednáška padesát pět minut už nevyčerpal následeky na formát pětaštyrycet menu neděsme
je na konci přestávky jo takže já nemůžu víc než pětaštyrycet
nějak znamená že byste byl o té
chci teorií
vesnické nutit u se stalo vysvětlil
když zjistíte že je vhodné zdicí dělá
o tom je abeceda
brzo je to jako by jedna s těch věcí která mi lákala
to se o tom povídat i o přestávce tak eště pro ostatní
to co teďkon třeba dělám na té škole cache tam právě učím ty postup bezcelní
ty jako dělat ty tabulky a zjednodušeně řečeno
a je to něco co strašně není
pokud věříte mýtu o vědět o nejty o lidech který umí velmi dobře s výpočetní
technikou taky do mýtus to neplatí to prostě a ty děti učím učim prostě dvanáctiletí
děti před patnácti lidi děti o čem patrné osmnáctiletý děti a kerý skupině je právě
jeden t asi tak pět procent
lidí který vopravdu jako něco v ní
pak je tam nějaký střed je to úplně typická gaussovka program jako tragická desetina která
neumí vůbec nic a bují se zapnout počítačů jsou restartovat
já se trochu pojem toho že jsme jako hrozně ujeli nebo mediálně smluvená to
že tady teďko nějaká generace hrozně dobře umí jako s výpočetní technikou není to pravda
jo
vůbec
brzo hodně brzo
rastr pro hesitate
který insbruku ten řidič seeds vždycky do
pořád
řeknu nesnadný problém
nějaké případy kdy
rovná
velmi stručně vstupy jsou jako na všechno dva klasická dichotomie jede nebo tu nápad druhy
je prostě vobráceně jo
a tak česku je to jako bolestný nikam
na
salát ten uzel který sme nesprávná základních registru cože vopravdu se musela jsem to c
tak se snaží dělá to ad jo zatímco tak spíš někde mi to nebo
v ani tak moc
let je to zatím že to jako by vznikalo mocnina téměř všude jo vždycky v
desátý liso trochu rozjíždělo
tak jako ve všech státech byly těch západních rozvinutý tak byly prostě uzly který byl
něco progresivněji všemu měli lepší rozpočet nebo u osvícenější ho šéfa takže všude to vlastně
vznikalo takhle ale leckde si docela rychle uvědomili že prostě beztíží restoring naše momentu to
bude průšvih
takže třeba david kamennou mimochodem ten spratci právě principy otevřený na jed jestli před čtyřma
pěti lety zabouchnul do stolu řek vícepremiér reference si mode pět obecný na starost měl
po za chvilku ministra informatiky a zřídili podpořené má nějaký systém na tom taky jako
se říkají
který má za úkol koordinovat právě jakou veškerou i p politiků
a n t realizace britský státní správy
za dva roky protáhnout z migrovat takže dneska je to pro nás jako nedostižný vzor
apod nemohl cauchy trim dyzajnu
a taky obou vy golfu government design princip else doporučuju to načíst je to prostě
skvělý hrozně inspirativní a hrozím to funguje
nutno vzít že ten jakou britská vláda kamarád tam dělá tak
to popisoval jsem že všichni tam tenhlecten podle co kancelář
strašně nesnášej ale je ty výstupy ú šprot státní správu
tak pro občany jsou jako naprosto fenomenální takže třeba británii skvělej příklad
kde to sice začíná stejně ale včas to moralista
a ty tisíce nejsou vymyšlený jenom zapomněl to číslo přesně
nějaký
cizi další otázku nestihneme malovance nicméně vyřízení klidný plno lidí
nějaký c a z nesměl díky za ním ne jen děkuji za inspirativní stylu tři
dnes bandě kozap lze