Snowflake v Keboola Connection

Tohle si sem odložím na památku - dneska ve ~2:00AM se v interní telemetrii Keboola Connection "oficiálně" objevily první 2 operace proti Snowflake.net backendu. 

V létě 2013 jsme podobné nadšení s Najlošem zažívali při hrátkách s AWS Redshiftem. Snowflake je ale koncepčně o řádný kus před čímkoliv na trhu. 

Jsem zvědavej, jak rychle to objeví místní tech scéna :)



Agenturní business a BI

Při půlnočním šmírování Zendeskovejma ticketama našich analytiků jsem našel report co si udělali v H1. Jmenuje se "neběžící kampaně". Je v něm jedna metrika, pět attributů typu datum, klient, apod. a čtyři filtery (časový období, agentura klienta, atd...).

Vrací to tabulku, která je nejspíš snem každý digitální agentury - přes úplně všechny reklamní kanály vidět "cokoliv". V tomto případě kampaně co neběží. Po delší době je to jeden dobrej příklad, co si nechce nikdo klikat v Tableau, SAPu, BellaDati, Chartiu, periscope.io, RJMetrics nebo v čemkoliv jiným. Rock&Roll multidimenzionálního systému, kterej je potřeba zažít, protože to většina lidí není schopná pochopit. 

V modelu, který není záměrně čitelný, se nad žlutýma oválama počítají věci, na které se pak dívá v kontextu zelených obdelníčků:

Karel Semerák z H1 si naklikal report, a nejspíš aniž to tuší, rozjel megasoukolí, který na základě fyzický podoby dat, logickýho modelu, definice metriky a kontextu reportu vygenerovalo 460 řádek SQL kódu nad datawarehouse, který H1 projekt pohání. Když si představíme že tam sedí člověk a má tu tabulku udělat ručně (ignoruju neřešitelný objem dat), bude muset udělat spoustu úkonů. Každý takový úkon (podívej se do Skliku, najdi tam aktivní klienty, sečti jejich kampaně, zkontroluj v CRM zaplacenost, vytvoř pracovní pivotní tabulku...) by pak mohl reprezentovat jeden obdelníček v tomhle obrázku:

Těch úkonů je 90. Při ruční práci některý zabere minutu, jiný 3 dny. Zadat to konzultantovi z Teradata je na týden vysvětlování, expertovi na IBM Cognos pak na dva... dodání samozřejmě "už" ke konci příštího kvartálu, faktura minimálně s pěti nulama. 

Well played, GoodData & multi-dimensional BI! 

Kalkulačku pro počítání návratnosti získání odpovědi na neběžící kampaně nechte v šuplíku, podobných reportů má H1 dneska přes 400 - vyrobit to v Excelu vyžaduje desítky hodně zapálených neomylných Excel profíků. Podobnou pracovní sílu jsem viděl naposledy asi 3 roky nazad v OMD - kancl jako kráva a všichni smažili pivot tabulky. Pokud vás zajímá pravděpodobnost se kterou vás naše "data AI roboti" nahradí, tady je na to kalkulačka

Karel Semerák z H1 je samozřejmě v klidu, protože on je ten co nad datama přemejšlí, místo aby trávil čas jejich chroustáním! Nicméně až se vaše P&L zeptá, jakou efektivitu měli agenturní headcounti... Vždycky je čas dát lidskejm robotům šanci začít (v případě digitální agentury například místo copy&paste mezi Sklik reportem a Excelem) kreativně používat hlavu za účelem pobití konkurence, ne? 

"Hrdinové" na Facebooku - schvalování trestného činu

Včera běžela na FB "diskuse" kolem mrtvých uprchlíků nalezených v náklaďáku v Rakousku. Rozjíždeli to tam takový "ty správný češi", co "jejich děcka běhaj spokojeně na hřišti, oni choděj v neděli do kostela (křesťanský tradice #FTW), pomáhaj sousedům, sbíraj bobky po pejskách, tříděj odpad, apod.". A samozřejmě kdokoliv né dost českej je pro ně ohrožení - chápu že maj naděláno v gatích, nicméně způsob jakým svůj nezvládanej strach ventilujou, je lehce k zblití

Pak tam jeden komentující hrdina, co by všechny postřílel, upekl a uplynoval, dostal decentní info že by mohl jít na 3 roky podávat mejdlo do sprch, což hrdině glosoval slovy "Sluníčko, táhni do háje." - a že prej nic mazat nebude. To už stálo za test - do komentáře putuje screenshot z mobilu

Hrdinové se postupně odtagovávaj a ráno už je celej blitko-post stáhnutej. Nejhlasitější aktéři jsou podle svejch profilů řidiči kamionů, možná maj zkušenost s "nájezdama" uprchlíků na jihu, možná si ani neuvědomují, jaký sra*ky vypouštěj. Mě z toho docela mrazí v zádech a jsem rád že se najdou pohotový lidi, co vyšvihnou trestní oznámení na 

§ 365 - Schvalování trestného činu
§ 364 - Podněcování k trestnému činu
§ 403 - Založení, podpora a propagace hnutí směřujícího k potlačení práv a svobod člověka

opatří ho screenshotama a pošlou do světa. Trestní oznámení na tuhle "kauzu" je k vidění tady

Je dobrý si uvědomit, že radovat se ze zabití 71 lidí není cajk a je super, že na to náš trestní řád pamatuje. Pokud narazíte na podobnou rakovinu, stačí vzít "naší šablonu" a v Google Docs dát "File > Download as". Autora trestního oznámení tady nechám bez "credits"

Uf, tvl... Hotový obludárium :-( Nicméně pořád věřím, že normálních lidí je podstatně víc. Nejenom tohle mi dává naději, že se všichni nezbláznili.

UPDATE: V komentářích různě píšete že to je neprokazatelný, apod. Narazil jsem na tohle "Za schvalování atentátu na české vojáky dostal komunista podmínku" - napsal slinty na svůj facebook... a dneska je pravomocně odsouzenej.

Med bez cholesterolu

Med je jediná potravina co se nezkazí (pokud nevyschne). Stejně tak je med fat-free a neobsahuje cholesterol, takže byste si ho měli kupu pořídit, jelikož až uprchlíci a ruský invazní vojska vykoupěj vaší oblíbenou večerku, budete rádi za kilíčko medu ve vaší tajný spížce! 

Shodou okolností mám v kanclu asi 20kg medu z Včelařství Dobrovolný, takže kdyby náhodou někdo potřeboval med ve kterým nejsou schopný přežít bakterie a pomáhá spalovat tuky zatímco spíte, neváhejte mi napsat! 

Včelař Václav

Před pár týdny mi kámoš Maruška řekl o nenápadný vesnici Taneček, která leží na kraji CHKO České středohoří. Na jejím okraji hospodaří Václav, který vyměnil bordel města za kopcovitý panoramata a neskutečný ticho a začal se živit "medařením". Letos má první rok kdy začíná hospodařit ve velkém. My jsme k němu dorazili akorát když začal stáčet med.

Vašek nás oblíkl do kukel a vyrazil nám ukázat královnu. Narozdíl od nás se vůbec nechrání, vypadá to že mu žihadla nevadí. Královnu vytáhl spolu s chumlem včel holou rukou, jak když nabíráš suchý listí. Nikdy předtím jsem to neviděl - dost mě to fascinovalo. Královně se zastřihují křídla, aby nemohla s rojem uletět, takže když se občas včely vyrojí, sednou si na strom a nikam neuletí, protože královna jen vypadne z úlu a potácí se v trávě. 

Po exkurzi ke včelám jsem popili čaj, požvejkali medový plástve (mňam!!) a s kupou tipů na výlety do okolí (třeba hrad Helfenburk, který stojí podivně v údolí, místo na kopci) vyrazili domů. Pokud budete vandrovat mezi Litoměřicema a Českou Lípou, možná narazíte v přírodě na úly, které Václav přesouvá podle toho kde co nejlepšího kvete. 

Určitě se u nich na Tanečku zastavte na exkurzi a pro svojí sklenici medu! Bude praktické se ozvat předem na vaclav.dobrovolny@centrum.cz nebo telefonem na +420739084594. Kdo má zájem, mám v kanclu v Karlíně sklenice medu stočeného v neděli dopoledne. 1kg lesního za 180,- Kč nebo lipový či akátový (bohužel jen jedna sklenice) za 170,- Kč. 

Cestujte děti, dokud jste mladý

Právě mi Facebook řekl, že se je to 2 roky co jsme se s Pavlem Doležalem 'zafrendili' na FB

Podle mě kecá, protože se na Facebooku kámošíme asi 16 let. Tak jsem šel do mailu a tenhle měsíc to byly přesně tři roky, co jsem mu poslal první "cold email" - vykačka, vlezlý sliby, atd... (chtěl jsem od něj intro do Mediatelu kvůli analytice AdOcean :-)

Jako haluz jak ten čas letí... 

Moje prateta (88) říká, ať hodně cestujeme, protože než se nadějeme, budeme mít umělý kyčle a slavit 90. No není čas přešlapovat na místě, že? Tak hlavně makejte na smysluplnejch věcech, ať pak před vnoučatama nevypadáte jako P&L a PowerPoint ztroskotanci z korporátu! :) 

Analýza nákupního košíku

Nákupní košík a jeho analýza (anglicky Market Basket Analysis (MBA) - někdy také nazývaná jako “afinitní analýza") je celkem podceňovaná záležitost. Cílem MBA je identifikovat položky (v nákupním košíku), které jsou kupovány společně. V momentě kdy známe kombinace kupovaných produktů, můžeme si na nich spočítat výnos a v případě že mám třeba často kupovaný produkt táhne nákup vysoce maržového produktu, stojí za to začít nabízet tuhle kombinaci společně v bundle za výhodnější cenu. 


Jak to funguje? 

Na vstupu jsou data s transakcema a jejich položkama (můj sample):

1, citrus fruit, semi-finished bread, margarine, ready soups
2, tropical fruit, yogurt, coffee
3, whole milk
4, pip fruit, yogurt, cream cheese, meat spreads
5, other vegetables, whole milk, condensed milk, long life bakery product
6, whole milk, butter, yogurt, rice, abrasive cleaner

Ty přechroustá stroj a vyplivne seznamy kombinací, ze kterých můžeme doporučit cross-sell, přeorganizovat umístění produktů, vymyslet akční balíčky a nebo (za mě trochu haluz) vyladit layout katalogu.

Spousta firem se snaží MBA prodat jako vědu. Nástrojů na to je mnoho. IBM SPSS, SAS, RapidMiner, Weka, iPython nebo třeba Rko

U nás (Keboola Connection) je “Basket Analysis” jako připravený recept. K jeho nastavení stačí určit tabulku obsahující “účtenky" a definovat sloupečky - ID účtenky a ID položky (prodaného produktu). 


Dodatečně chceme zadat ještě segment - což je sloupeček, který může obsahovat cokoliv. Pokud je tam měsíc v roce, bude výstupem analýza košíku pro každý měsíc zvlášť. Pokud je tam region, vypadne z toho tolik “analýz”, kolik je regionů. 

Výstupem je pak tabulka plná pravidel. Příklad jednoho:


Takový řádek říká, že pokud někdo nakoupí máslo a kořenovou zeleninu (sloupec lhs (left hand side)), existuje 66% pravděpodobnost (sloupec confidence), že koupí zároveň i plnotučné mléko (sloupec rhs (right hand side)). Tato kombinace produktů se pak vyskytuje v 0.6% všech nákupních košíků (sloupec support). Třetí metrikou co vypadne z MBA je pak ještě “lift”, což je vyjádření toho jak moc se kombinace produktů kupuje víc spolu než samostatně. 

Jednoduchý příklad zobrazení takových dat bez liftu je pak třeba ve scatter plotu:


Určitě je dobré každý produkt v katalogu obohatit o profit nebo náklady s jeho distribucí či propagací. Pokud se vám povede zároveň i říct jak jsou lidi spokojeni s tím co nakupují (spojit data ze supportu s obchodníma transakcema), máte náhle k dispozici skvělé informace pro cross-selling, rozkročené od marketingu po zákaznickou podporu. 

CSV s testovacíma datama nákupů a CSV s výstupem z Keboola receptu.

Jak s náma vyjebává T-Mobile

Náhoda tomu chtěla, že jsem si nevyndal australskou SIMku z mobilu a zapnul si s ní mobil v Praze na letišti. Pokud přijedete do Austrálie jako klient T-Mobile, zaplatíte 360,- Kč / MB

Pokud přijedete jako klient australského OPTUSu do ČR, zaplatíte 9,8Kč/MB

Solidní vojebávka, T-Mobile. Díky!

UPDATE 14.5.2015:

T-Mobile na FB (zdroj) i Twitteru (zdroj) píše, že všem aktivuje po prvním připojení balíček a tím sráží cenu z té astronomické na "lepší". Twitter @TMobile_Podpora nepíše reply na můj původní tweet, ale začne novou konverzaci, asi aby nebylo snadno k nalezení moje hejtování.

Pokud si i u Optusu aktivuju datovej balíček "Optus Travel™ Data Pack", vyjde ve srovnání ceny za přenesený roamingový GB T-Mobile už "jen" 14x dražší.