Naše AWS bebíčka

Amazon AWS nepomáhá v optimalizaci útraty. Pokud máme rezervaci serveru a k ní není žádné využití, není snadné se to dozvědět. Stejně tak není snadné získat kvalitní přehled o útratě (kolik za co). Pro detailní billing si platíme službu https://cloudability.com/ (zkoušel jsem ještě CloudHealth), ale stejně nám to nepomůže správně bidovat SPOT instance nebo optimalizovat útratu. Většina jejich doporučení na změny v infrastruktuře nefunguje. 

Dneska máme v produkcním prostředí (VPC v us-east) denní traffic lehce přes 2.5TB. Aktuálně nám "to" jede na 28 serverech (plus databázové backendy (RDS+Redshifty)), disky dávaj zhruba 300M I/O operací za den a letošní nejzatíženější den si vzal 11.03% CPU (letošní denní průměr 7.96%). Paradoxně vlastně samotný výkon není pro nás asi tolik podstaný. 

HR Okénko:

Pomalu koketujeme s myšlenkou, že by se nám hodil nějaký AWS admin, který by nám pomohl zamést náš nepořádek a připravit infrastrukturu na roztažení do Evropy a Asie (používáme CloudFormation). Jedem devOps, takže programátoři dneska plně přistupují k serverům. Baví-li vás Amazon API, umíte spravovat template v CloudFormation, víte co je MTU, jak funguje source routing, subnety a DNS, pak zbývá jen překypovat zájmem o nás samotné :) 

2 responses
Ahoj, chápu že máte AWS kvůli škálování a nechcete mít žádný vlastní HW. Neuvažovali jste ale o optimalizaci nákladů pořízením dedikátů (eventuelně managed) alespoň na tu "stálou" část vytížení , které máte? Přijde mi že surové železo dneska stále přijde mnohem levněji. Pokud ne tak proč? Díky
@Tomáš: uvažovali. Chvíli jsme měli HP Vertica mimo AWS, ale je drahé posílat ven hodně dat. V AWS máme primárně uložená data, která se různě přepočítávají, upravují a "něco" se v nich hledá. Postupně začínáme mít jako "DWH" server AWS Redshift - levný a super! - tohle ven dáme blbě. Máme sady worker strojů, co "něco" dělají - to se super škáluje - a pro vstupy si sahají a výsledky ukládají z/do backend DWH clusterů. Tenhle koncept je hrozně jednoduchý a špatně se trhá do "multi cloud" architektury. Prodlevy, ceny trafficu, komplexita údržby... A do toho platí, že nás to nestojí $150k/měsíčně, takže to ještě pořád dává (a asi pár let bude) smysl tam nechat mít.