RFM segmentace

Pomalu končí vánoční nakupovací horečka a sčítají se příjmy. V lednu začnou všichni nahánět lidi na slevách (takže si doma budeme zase říkat, proč ty vánoce neslavíme o 3 týdny později :)

Já se dneska trochu zanořím do nejlacinější metody používané v marketingu - RFM segmentace - která se používá pro cílení při oslovování zákazníků. Vnímám to jako vhodné téma na leden, kdy bude každá objednávka drahá. Pokud RFM segmentaci neznáte nebo neděláte, čtěte dál. 


RFM segmentace není nic jiného než rozčlenění zákazníků do tří kategorií, podle:

  • doby od posledního nákupu (Recency)
  • počtu nákupů (Frequency) 
  • celkového objemu utracených peněz (Monetary)

Představte si, že máte 3 prádelní šňůry, jednu pro každou kategorii. Na Monetary šňůru pověsíte jména zákazníků vzestupně, podle útraty, na Frequency šňůru vzestupně podle počtu objednávek a na Recency šňůru dáte na jednu stranu ty zákazníky, co už dlouho nenakoupili a na druhou stranu naopaky ty, co nakoupili před chvilkou.

Pak si každou šňůru rozdělíte na dílky (segmenty), které očíslujete od jedničky směrem nahoru. Jednička znamená nejméně význaný segment (nízký obrat, málo nákupů nebo dlouhá doba od poslední objednávky - mrtvý zákazník). Jakmile to máte, začnete se na svoje zákazníky dívat optikou segmentů a jejich významů. Odteď zahodíme šňůry a všechno si vyneseme na kostku, která má na každé hraně vždy jednu kategorii:

Když se pak podíváte na jednu stěnu kostky, budete mít skupiny zákazníků, kteří vyhovují dvěma segmentům. Například zákazníky, co nakupují hodně často (Frequency), ale realizují nevýznamné objemy peněz (Monetary). Nebo zákazníky, kteří se významnou měrou podílejí na vašem obratu (Monetary), ale je to docela dlouho, kdy naposledy nakoupili (Recency).

Pohled na Recency/Frequency kategorii pak dělá takovou “heatmapu”:

Frequency 5 znamená “nakupuje hodně často” a Recency 5 znamená “nakoupil nedávno”. Cílem je mít k dispozici konkrétní seznam zákazníků, kteří jsou uvnitř každého čtverečku heatmapy + samozřejmě dobře rozumět specifiku daného segmentu. Existuje spousta pouček, jak se na jednotlivé segmenty koukat. Podobně jako u bostonské matice existují označení jako “Dojná kráva”, “Bídný pes”, apod. má RFM segmentace svoje klasifikační pojmy (loajální zákazníci, velký spendři, nový dojný krávy, …). Pro každý z těchto pojmů pak existuje přehršel rad, jak se chovat (těmhle popřej k narozeninám, na tyhle prď úplně, tyhle pozvem na golf, aj.). 

V RFM segmentaci je ohromné kouzlo - hlavně proto, jak je to celé (v dobrém slova smyslu) primitivní věc. Seřadit zákazníky na “šňůru” dovede každý, jedinou otázkou zůstane, jak se definují jednotlivé hranice mezi segmenty. 

Můžete na to použít věci jako je IBM® SPSS® Modeler, který vám vysype "machrovací" grafy, podobné tomuhle:

a nebo si to uděláte na koleně doma. Je pár věcí, které je dobré vzít v potaz, jinak budou výsledky RFM segmentace tristní, resp. nebude snadné vydělat jejím použitím peníze.

Významy R/F/M kategorií

Největší význam přikládejte zákazníkům podle doby od posledního nákupu (Recency), pak četnosti nákupů (Frequency) a teprve nakonec podle celkového obratu (Monetary). Je dobré přiřadit každému zákazníkovi zároveň nějaké jednoduché skóre, díky kterému budeme schopni plošně určit, který zákazník je nejhodnotnější, aniž se díváme na dimenze RFM. Jestliže máme v každé kategorii například 5 skupin, pak každému zákazníkovi můžeme přiřadit skóre od 1,1,1 do 5,5,5. Zákazník, který bude v kategorii Recency v segmentu 4, u Frequency v segmentu 2 a v Monetary 3, dostane skóre 4+2+3 = 9. Abysme neměli tisíce zákazníků oskórovaných pouze 125 hodnotama (počty kombinací při 5ti segmentech na každou kategorii), použijeme pro skórování ještě “váhy”. Váha bude jiná podle toho, zda je zákazník na spodní nebo horní hranici segmentu. Pokud bych měl Frequency segment pro zákazníky co nakoupili 5x až 8x, bude váha zvýhodňovat ty co nakoupili víckrát a diskriminovat ty co nakoupili méněkrát. Je vhodné, aby váha byla u Recency obecně větší než u Frequency a u Frequecy větší než u Monetary - tím se zároveň zvýhodňuje důležitější kategorie.  Vzoreček by mohl být takovýhle:

RFM Skóre Klienta = (Recency segment x Recency váha) + (Frequency segment x Frequency váha) + (Monetary segment x Monetary váha)

Seřazení všech klientů podle RFM Skóre nám pak umožní (obecně) ukázat na 20% nejhodnotnějších zákazníků.


Hranice segmentů 

Velkou otázkou tvorby RFM segmentace je jak definovat hranice jednotlivých segmentů (kdy je Recency 2 a kdy už 3). Konstatovat, že ten kdo nakoupil 6x je v jiném (méně hodnotném) segmentu než ten, kdo nakoupil 7x, není vždy úplně snadné. Můžete za sebe nechat rozhodnout robota, ale mozkové cvičení na tohle téma vám jedině prospěje a s RFM segmentací pak budete lépe pracovat. Navíc platí, že na to neexistuje správná odpověď (=automat to neudělá lépe než vy) a tak jediné co vám zbyde, je si to nakonec stejně otestovat. Nuže, více variant pro různé situace a následně praktické použití (direct mail, etc.) je jediná - i když trochu trnitá - cesta.

Správné segmenty by měly mít jisté charakteristiky:

  1. podobnost v rámci segmentu - neměli byste si později klást otázky, jestli daný typ mailu pošlete všem v rámci jednoho segmentu nebo jen části zákazníků.
  2. rozdílnost mezi segmenty - pokud se zákazníci v jednom segmentu podobají zákazníkům v jiném segmentu, je jeden ze segmentů zbytečný. Může se nám stát, že časem někde vypozorujeme velkou podobnost a segmenty se rozhodneme sloučit, nicméně by mezi nimi měl být od začátku jasný rozdíl.
  3. ověřitelnost v čase - segmenty budeme používat pro plánování kampaní a srovnávání výsledků v čase. Chceme být schopni srovnat výsledky jednoho segmentu mezi dvěma kampaněmi a/nebo v časovém odstupu. K tomu potřebujeme stabilní RFM strukturu - časté měnění hranic mezi segmentama je problém.
  4. dostatečná velikost - segment, ve kterém máme jednoho zákazníka je k ničemu. V každém segmentu by měl být vyvážený počet zákazníků, přičemž problém “3 extrémě silných (monetary) klientů” vyřešíme tím, že je prohlásíme za “příliš odlehlé” a vřadíme je do největšího segmentu (M5), ale hranice toho segmentu podle nich nekalibrujeme. Přesto se snažíme mít segmenty vzájemně co nejvíc shodné - toho docílíme laděním hranic.


Princip definice segmentů

  • Recency - vezmeme jednoduše datum poslední objednávky. Říká se, že “Recency” je nejsilnější určení toho, kdo nejspíše nakoupí. U toho kdo nakoupil tento týden, máme větší šanci na prodej, než u toho, kdo nakoupil před 1/2 rokem. Tenhle fakt je základním dogmatem direct marketingu a tady ho budu považovat za axiom a nebudu to obhajovat.
  • Frequency - stejně jako u doby od posledního nákupu, máme s frekvencí jistotu, že toho kdo nakoupil 3x zlomíme ke čtvrtému nákupu spíš, než prvokupce ke druhé objednávce. Pokud máte dost dat, nedává asi smysl použít celoživotní historii objednávek, protože to dává zbytečně velkou váhu aktivitě v dávné minulosti. Velmi staré objednávky nejsou dobrý indikátor budoucí aktivity. Doporučuju použít fixní okno směrem dozadu od poslední objednávky - třeba 3 roky transakcí. Pokud někdo naposledy objednal před rokem, podíváme se na jeho objednávky od teď 4 roky dozadu. Objednal-li někdo naposledy před 5 lety, podíváme se na 8 let dozadu.
  • Monetary - objem peněz je nejslabší ukazatel budoucí ochoty znovu objednat. Nepoužíváme celkovou hodnotu objednávek (CLV) - to příliš koreluje s jejich počtem. Lepší je použít průměrnou velikost objednávky ze všech objednávek, použitých ke spočítání Fequency kategorie. To nám z peněz udělá víc nezávislou proměnnou. Monetary ve svém malém dopadu na uskutečnění další objednávky mohou skvěle sloužit ke dvoum věcem:
    • zákazníky, kteří mají shodné Recency nebo Frequency rozdělíme tak, že ti s větším Monetary budou mít větší hodnotu
    • izolujeme zákazníky s příliš malou hodnotou - pokud by měl někdo “Monetary” ve výši ceny direct mailu, nebudeme ho asi chtít kontaktovat


Praktické nastavení

Není nezbytné mít ve všech dimenzích stejný počet segmentů. Naše segmentační “kostka” může být klidně kvádr o hranách Recency 5x, Frequency 5x a Monetary 3x. Pokud vám to nedává smysl, netlačte se do symetrických kategorií!

Pro Recency kategorii je dobré mít jemnější dělení pro čerstvé nákupy, zatímco zákazníci aktivní naposledy před 2 až 2.5 lety mohou být klidně v jednom společném segmentu. Sami si na začátku vymyslete hranice, přičemž zkuste vnímat, že Recency 1 a Frequency 1 je nový zákazník (koupil “nedávno” a celoživotně jen jednou). Kolik chcete, aby uběhlo času od prvonákupu, když takový segmentu budete oslovovat? 2 dny? Týden? Měsíc?

U Frequence je to podobné jako u Recency - nejnovější zákazníci vyžadují speciální zacházení, aby znovu nakoupili. Pokud přesvědčíte zákazníka s frekvencí 2, aby nakoupil znovu, máte ho nejspíš na doživotí. Zákazníci s frekvencí 3+ jsou vaše tvrdé jádro. Frekvence by tohle měla precizně rozlišovat.

Přesné nastavení Monetary je u každého úplně jiné - je třeba správné hranice hodně hledat. Pokud nemáte žádné lepší podněty, začněte s průměrnou objednávkou (Average Order Size  - AOS) a udělejte si 3 monetary segmenty: méně než polovina AOS, více než polovina a méně než 1.5 AOS a více než 1.5 AOS. Pokud je průměrná objednávka 450,- Kč, budete mít hranice (M1) 0,- Kč až 225,- Kč, (M2) 225,- Kč až 675,- Kč a (M3) 675,- Kč a více. Můžete si udělat ještě skupinu “pod 50,- Kč”, kam dáte extrémně nízké nákupy.


Vylepšování

  • “Co prodávám” - zákazníci kupující rozdílné druhy produktů (produktových linií) se chovají rozdílně. Je dobré udělat RFM segmentaci zvlášť pro každou produktovou linií vašeho katalogu a odděleně ji vyhodnocovat.
  • Druh zákazníka - zákazníci jsou z různých prostředí, firmy mají v ČR NACE kódy, v americe jsou na to SIC kódy
  • Velikost zákazníka - zákazníci různých velikostí se budou malinko jinak chovat - firma s 10 lidma nejspíš nemá oddělení procurmentu, takže se jí prodává snáze než firmě o 500+ zaměstnancích. Je dobré si s tím hrát. Můžete si na začátku rozdělit zákazníky do 2 skupin. Třeba 0 až 4 zaměstnanci a 5+ zaměstnanců - a sledovat pro tyhle dvě kategorie RFM segmentaci zvlášť. 

Pro zanořování se do dat je vhodné mít flexibilní systém, který umí data míchat a transformovat (Keboola Connection) a BI nástroj, díky kterému budete schopni segmenty kroutit, prohlížet, filtrovat a těžit - pro zjištění, zda se reakviziční kampaň na "chovatele zvířat za účelem výroby kožešin” (NACE kód 014920, 479 ekonomických subjektů v ČR) v segmentu (R2, F5, M3) vyplatila, už Excel nestačí a přichází GoodData. Doplňkový pohled přes vaší penetraci trhu a sledování toho, jak se chová saturovaný tržní segment, je už třešnička na dortu :)


Závěr

Statická RFM segmentace vám bude (skoro) k ničemu, desktopové programy typu SPSS vám sice udělají "kvalitní" segmentaci, na kterou ale nenapojíte dodatečné informace. Pokud navíc nerozumíte pravidlům, podle jakých byly jednotlivé segmenty definovány, nebudete nejspíš schopni výstupy správně zapojit do vaší marketingové strategie. Navíc věřím, že je třeba s nastavením experimentovat a nenechat si “to nastřelit automaticky” = pusťte se do toho s vervou a na vlastní triko, mozkové cvičení kolem definice segmentace byste neměli outsourcovat na dodavatele.

Pokud uděláte úkrok stranou a podíváte se na RFM segmentaci trochu z nadhledu, dá se to celé obalit spoustou buzzwordů typu "Predictive customer scoring", "Anti-churn detection", "Advanced segmentation", atd… 

Jednorázovou RFM segmentaci si snadno uděláte "doma na koleně", pokud ji ale chcete zapojit do všedního rozhodování, potřebujete ji mít součástí vašeho BI řešení. Kvalitní ukázka toho, jak jde obyčejné RFM nafouknout na "maximum", je Futurelytics.com - startup, který z mého pohledu utáhl pár lidí na vařenou nudli, nicméně jejich marketingová exekuce RFM segmentace je brilantní a za to jim určitě patří poklona. Jsem zvědavý, kolik startupů v “datovém” kole StartupYardu přijde s něčím podobným - je to za málo peněz hodně muziky :-)


Hezký povánoční segmentování!

Kohort Analýza

Empiricky jsem v minulém týdnu ověřil, že náhodný vzorek studentů na VŠ nezná tak super věc, jako jsou reporty s "Cohortama". Takže děcka:

Kohort Analýza není typ reportu ale spíš reportovací technika. Kohorta je skupina objektů, které sdílejí jednu společnou vlastnost. Je to velmi jednoduchá věc s velkým potenciálem, která jde dělat nad jednoduchou tabulkou. Cílem téhle analýzy je rozkrýt trendy právě přes dimenzi těch společných vlastností.

Mějme tabulku předplatného, kde je ID transakce (platba každý měsíc), ID předplatitele, Datum ve kterém předplatné vzniklo, Datum kdy jsme se se zákazníkem prvně potkali a cena kterou předplatné v daný měsíc stálo:

Je-li kohortou moment vzniku předplatného, můžeme si pak veškerý náš měsíční příjem "obarvit" měsícem vzniku předplatného. Tady je to vyjádřené v % - tedy kolik procent našeho obratu tvoří předplatitelé, které jsem získali v daném měsíci:

Vypadá to trochu jako hezká tapeta, ale když se podíváte na červen 2012, můžete vidět, kolik obratu nám dělají lidi, které jsme sehnali (zobchodovali) v březnu 2011.  

Tady je vidět jak to vypadá u služby SEOmoz (dnešní moz.com). Moz.com je služba placená měsíčně. Někdy kolem března 2009 se rozhodli dát novým lidem službu na 3 měsíce zadarmo. Reakcí na to byl ohromný zájem - a služba okamžitě zdvojnásobila svojí uživatelskou základnu. Jakmile akce skončila, polovina uživatelů zase odešla. Vypadalo to takhle:

Kohortou je tady, stejně jako v horním příkladu, měsíc registrace. Y-osa (vlevo) pak ukazuje počet uživatelů. 

Pokud se na to celé podíváme optikou peněz, dostaneme trochu jiný pohled:

Je krásně vidět, že nárůst uživatelů po dobu "akce" nevedl k žádnému zásadnímu zisku. Jakmile ale akce skončila, masivně se zvedl příjem služby - asi o $100k/měsíc. 

Rada na závěr: společný atribut může být téměř cokoliv, datum registrace, "tag" marketingové akce nebo nějaká jasně definovaná incentiva, kterou pro lidi děláme. Díky zobrazeným kohortám pak můžeme poměrně snadno získat povědomí, "co se nám vyplatí pro uživatele dělat". Pokud plocha toho modrého pruhu z posledního obrázku bude v čase větší než náklady na akviziční akci, vyhráli jsme. Známe-li navíc metriku CLV (client lifetime value), můžeme to celé zohlednit v souvislostech. Pak získáme odvahu k (drahým) akcím typu: "hej, pozveme kravaťáky na golf, oni si pak něco koupí".

Howg!


UPDATE 2013-12-10: Pavel Jašek v komentáři na facebooku doplňuje další info k CLV metrikám na své prezentaci na SlideShare