Enterprise Data Hackathon - měsíc poté

“Čau Padáku! Neuděláme hackathon s datama ze spořky?” zeptal se mě před 3/4 rokem na ulici Pavel Doležal. Nejdřív jsem si myslel, že mu hráblo. "Spořka? To myslíš tu spořku, co spravuje vkladní knížky a tečou přes ni důchody?”… A pak jsem poznal kovboje Jirku, co hackuje s Android telefonama bezkontaktní karty a v mezičase staví banku zevnitř na hlavu. Tím začala několikaměsíční jízda na horské dráze.

Proč to děláme popsal Pavel tady (baví nás to / chceme sami zkusit nové věci a poznat zajímavé lidi / ukazuje to místnímu trhu kam se žene cloud+data). 

Já už teď jen zaznamenám, co nás všechno u toho potkalo...

Fáze 0 - potřebujeme data

Hackathon má být o datech, takže potřebujeme zajímavý data - a protože si s tím má každý hrát, musí být veřejně k dispozici. Na startu jsme si naťukli Českou spořitelnu, T-Mobile, Geewu a Seznam. Nakonec jsme měli data od 8 místních firem, každý dataset něčím specifický. 

Dodneška vzpomínám na den, kdy mi Pavel volal, jestli bych nezašel do 'spořky' a nepobavil se tam s lidma o tom, jaký vlastně data chceme. "Uf - vůbec nevím, omg, to bude ostuda.” 

Na boso v sandálech a potrhaným tričku jsem se ocitl v zasedačce s partou v botech z krokodýlí kůže. Sebrali mi mobil, zapli rušičky a pustili se do mě… Na konci dne jsem ale neležel zalitej v betonu na dně Vltavy, ale měl nový kámoše, co kopali za stejnou věc a jen řešili, jak to celé udělat, aby to dávalo všem smysl.


Kamkoli jsme následně vlezli (teda asi kromě T-Mobile :) jsme našli pro hackathon nadšený lidi, schopný interně vyjednat zázraky. Všem patří můj velký dík za odvahu a vytrvalost. Jsou to hrdinové hackathonu, bez nich by to nešlo!

Fáze 1 - potřebujeme technologie

Volám Jardu Gergiče z GoodData. “Hele, Jardo, mám tady další hackathon. Potřeboval bych pro všechny účastníky přístup ke GoodData technologii, k tomu někoho od vás, kdo udělá 5 min prezentaci a pak bude celej víkend hrát “taťku”, kterej pomůže/poradí/odblokuje/úsměvem rozzáří. Jo a taky by nám bodly nějaký peníze na jídlo”. Jardovi trvá asi 100ms aby se vším nadšeně souhlasil. Wow! 

Jdu dál - Radovan Janeček mi dává kontakt do HP, Jana Žižková do SASu. Filip Hráček nám pomáhá s Google Cloudem, Pavel Kordík s RapidMinerem a ModGenem. S každým mluvíme stejně - úvodní technická prezentace, pro každého účastníka neomezený přístup k vaší technologii a mentora po celou dobu. Když to dává smysl, říkáme si o peníze, protože je jasné, že to z lístků nezaplatíme. Všechno chceme od partnerů zadarmo - nikomu ze speakerů neplatíme ani korunu, ale nakrmit 120 lidí bude něco stát.

Az na pár vyjímek máme obrovskou podporu od vendorů. Někdy to sice skřípe - třeba zkontaktovat SAP nebo DataSift zůstane nerozlousklým oříškem a Amazon na nás kašle, protože jsme pro ně divný týpci z Čečny někde na východě. Marketing Google se probral až když to celé proběhlo :) 


Fáze 2 - potřebujeme střechu nad hlavou

Volba je jasná - věříme že přijde aspoň 40 lidí a doufáme že dorazí tak 20 čumilů - volíme teda TechSquare, protože je šance, že se tam líp vejdeme. Petra Hubačová a její tým nám v průběhu času postupně vytrhává asi 300 trnů z paty.


TSQ holky za nás postupně zařídí jídlo, sprchy, spaní, posílí konektivitu a pořeší každičký detail akce, od survival balíčků po plánky a faq/how-to. Jak jde čas, je nám jasný, že bez nich bysme tohle nedali!

Fáze 3 - potřebujeme lidi

Akci na eventbrite.com jsme spustili uprostřed noci a jen ji dali na Facebook. Prvních 10 lístků bylo zadarmo, dalších 15 bylo s volitelným vstupným... do 20 hodin jsme měli 50 prodaných lístků. Museli jsme začít omezovat tempo prodeje - zvedali jsme cenu, která se na konci zaparkovala na skoro $90 za lístek! Holky z TechSquare nám dali limit 120 lidí - víc se tam prý pohodlně nevejde. Na konci jsme měli 194 prodaných lístků (bacha při nastavování ceny - ke každému lístku je potřeba vystavit fakturu a zaplatit DPH).


Den D

Na páteční večer hackathonu nám dorazilo neuvěřitelných 176 lidí - totálně to nechápeme a s Pavlem se schováváme v kuchyni a polykáme antidepresiva :)  

Večer začíná prezentací technologií: Jirka Tobolka za GoodData, Pavel Kordík za RapidMiner a ModGen, Filip Hráček za Google BigQuery, Ondřej Popelka za Vertica+R, Jan Pospíšil za MS Azure ML (v té chvíli ještě veřejně nedostupné), Martin Veselý za SAP HANA, Lukáš Eštvanc za Inventoro a Alaksandr Aliashkevich za Shards.io. Francisco Martin pak ukazuje BigML přes YouTube, Scott Van Boeyen ukazuje Semantria a Alon Bartur má video prezentaci Trifacta.com.

V půl deváté je večeře a po ní spouštíme prezentace dat (videa za odkazem): Petr Martinec za Seznam, Miroslav Červený za Geewa, Eduard Kučera za Avast, Pavel Vaněček za Českou Spořitelnu, Michal Illich za Flowreader, Patrick Zandl za Energomonitor a Karel Tušek za 1188. Všechny data byly navíc předem v náhledech v GitHubu. Ostrá data jsme distribuovali pomocí CDN77 (Díky Zdeněk Cenda za unlimited použití zadarmo - nakonec to bylo víc než jen užitečné => skrz CDN distribuujeme týmům ad-hoc generované náhledy dat a různě upravené formáty) a na jejich přípravě trávil mnoho hodin dobrovolním Michal Bláha, bez kterého bysme nespali o pár nocí víc.

Po konci prezentací následovalo rozstřelení do týmů. Limitujeme lidi na max 15 skupin(témat). Po prvních rozpacích se nám plní tabule dvanácti projektama a začíná noční švanda :)


Veškerou komunikaci řešíme přes slack.com. V noci z pátka na sobotu jede na plný kotel asi 70 lidí. Bylo vidět, že pražáci odešli domů a vrací se ráno. V sobotu krmíme na obědě necelou stovku a v neděli odpoledne se držíme zase na cca 70+ aktivních účastnících.



Výsledky

Do neděle se nám probojovalo 12 týmů. Všichni si ošahali technologie i data, naučili se spoustu věcí a potkali super lidi, naladěné na stejnou notu. Záměrně jsme nevypsali žádnou cenu - nechtěli jsme “soutěžit pro prachy”, ale vytvořit prostředí kde je zábava a dobrá nálada. Doufám, že se nám to povedlo! Odměnu pro "nejlepší" tým jsme ale měli samozřejmě připravenou. Neoficiální první cenu dostal tým pracující s datama 1188, primárně za kompaktnost a rozsah jejich “data story”. Vítěz od nás dostal prasečí nohu, tak doufám, že na všechny došlo :)

nedělní videa: DOPLNIT

Peníze

Celé jsme to dělali pro zábavu - design hackathonu byl “všechno narvem do akce”. Čekali jsme příjem tak 50.000,- Kč na jídlo a co nám zbyde z lístků, dáme za pronájem TechSquare. 

Povedlo se nám nakonec sehnat dost peněz:


Aktuálně evidované náklady:


a rozpis největší položky do TechSquare:


Finálně hospodaříme s přebytkem téměř 55.000,- Kč. Jen co nám dorazí poslední peníze, co jsou na cestě, uzavřeme účetnictví hackathonu a odneseme “zisk” holkám do TechSquare, aby z toho dotovaly jiné zajímavé akce, kterým se nepovede získat si dostatek financí. 

Lessons Learned

Je to mnohem těžší zorganizovat, než jsme si představovali. Veliké stěstí bylo, že nám všechno kolem techniky, lidí, prostoru, jídla, apod. pořešily holky z TechSquare a my se mohli soustředit na data, speakery, peníze, technologie a jiné vylomeniny. I tak to byl téměř 1/2 roku de-facto denního zařizování, přemýšlení, domlouvání, lobování. Ale stálo to za to!

V pondělí po akci jsme se sešli v Můjšálekkávy.cz a začali psát dokument “Lessons Learned”, kam jsme za čerstva chtěli zapsat dojmy, nápady a připomínky. Přišlo nám super to dát public a tak jsem tweetli link k editaci dokumentu. Během 10 minut tam bylo skoro 50 lidí, kteří nám pomáhali dokument doplňovat.


Tady je výsledek: https://docs.google.com/document/d/16XeI-vNM107_ZS4RxTow8EFPgoSLQ8o4InkK-nI6fr0/edit?usp=sharing

Budeme moc rádi za jakékoliv další připomínky! Tady je náš soupis "Echoes", kam jsme "komprimovaně" dali všechno k sobě, včetně odpovědí z feedback formuláře (který nám zodpověděla asi 1/4 lidí): https://docs.google.com/document/d/1WI1peS0trglMSSG2hKLXxjrEzVW47Gipgcyl3nk0cfc/edit?usp=sharing

Linky

Sdílený “tech info” dokument: https://docs.google.com/a/keboola.com/document/d/1E4DxTQM9KDgr0HTj_45HYc_3W5fBUHwfRSSkNPI4u6A/edit?usp=sharing
Fotky z instagramu: http://www.vyvolej.to/hackathonbi

Jirka Tobolka: http://jirtob.tumblr.com/post/100491594852/enterprise-data-hackathon-den-pote
Radek Tomášek: http://blog.tomasrad.cz/post/100453502646/enterprise-hackathon-bi-powered-by-keboola

1188&CartoDB: https://github.com/MicTech/hackathonBI
Flowreader & Semantia: https://github.com/iki/hack-bi-flow

Článek na CzechCrunch: http://www.czechcrunch.cz/2014/09/jedna-z-nejlepsich-akci-roku-se-blizi-enterprise-data-hackathon-v-praze/
Článek na Lupě: http://www.lupa.cz/clanky/enterprise-data-hackathon-2014/
Článek na iHned před: http://tech.ihned.cz/c1-62955380-enterprise-data-hackathon-vydoluj-z-firemnich-dat-co-muzes
Článek na iHned po: http://archiv.ihned.cz/c1-62973980-enterprise-data-hackathon-od-technologickeho-bizaru-az-po-seriozni-vyzkum



TODO: prezentace, videa z neděle