Dowiedz się, jak eksperci Devoteam pomogli w migracji platformy analitycznej z klasteru Hadoop na chmurę Google Cloud Platform (GCP), w celu zoptymalizowania infrastruktury, zwiększenia efektywności pracy analityków oraz zmniejszenia kosztów.
O kliencie
Agora to 4. największa grupa medialna w Polsce. Jej oferta obejmuje sieć kin Helios SA, firmę produkcji i dystrybucji filmowej Next Film, 9 rozgłośni radiowych działających pod szyldem Grupa Eurozet, reklamę zewnętrzną (AMS SA), cenione media informacyjne – „Gazetę Wyborczą” i Wyborcza.pl, portal Gazeta.pl i jego serwisy (m.in. Sport.pl, Moto.pl i Plotek.pl) oraz ponadregionalne Radio TOK FM, wydawnictwa książkowe, muzyczne i filmowe, a także działalność gastronomiczną.
Wyzwanie
W 2014 roku Agora rozpoczęła zbieranie danych o aktywności użytkowników serwisów przy użyciu własnej technologii.
Na potrzeby przechowywania i przetwarzania danych powstał klaster Hadoop, model danych i mechanizmy gromadzenia danych.
Hive został wybrany do celów analitycznych. Wymogiem biznesowym był stały dostęp do aktualnych, zagregowanych danych. Zbudowane zostały procesy zarządzania danymi oraz szereg procesów ETL na nim bazujących. Oprócz danych o ruchu, Hive przechowywał również metadane treści z monitorowanych stron internetowych oraz inne dane z różnych systemów.
Stale rosnący wolumen danych, rosnące potrzeby związane z raportowaniem po stronie Biznesu, łączenie różnych zbiorów danych, utrzymywanie infrastruktury fizycznej oraz oprogramowania, adresowanie błędów i awarii – to były główne wyzwania setupu onprem.
Podsumowując, wyzwanie cechowało się:
- 70 TB danych do zmigrowania z Hive do BigQuery
- Integracją z Kafka i innymi rozwiązaniami dostarczającymi dane w czasie rzeczywistym
- Optymalizacją wykorzystania usług
- Zmiennym obciążeniem jednostki obliczeniowej
Cel projektu
Biorąc pod uwagę ryzyka i ograniczenia obecnej platformy analitycznej, Zarząd Agory podjął decyzję o migracji procesów analitycznych do chmury Google Cloud. Ze względu na ograniczone doświadczenia w obszarze cloud, Agora poszukiwała partnera, który wesprze pracowników w procesie migracji na etapie modelowania docelowej struktury danych oraz tworzenia architektury systemu zasilania w chmurze – w celu optymalizacji powyższych elementów rozwiązania pod kątem kosztów.
Rozwiązanie
Zespół Devoteam G Cloud przygotował koncepcję wykorzystującą rozwiązania Managed i Serverless, które gwarantowałoby zachowanie dotychczasowego stylu pracy zespołów analitycznych Agory S.A.
Po akceptacji przez klienta, został wdrożony projekt migracji platformy analitycznej do chmury Google, przy wykorzystaniu komponentów takich jak BigQuery, Google Cloud Storage, Cloud Composer (Airflow), Cloud Functions czy Dataflow.
Rezultaty
Efekty jakie osiągnęliśmy:
- Wszystkie dane historyczne o ruchu zostały przeniesione do chmury
- Stworzony został framework / systemu procedur związanych z zarządzaniem danymi i dostępem do danych
- Wprowadzone zostały ujednolicone procesy zasilające dla Data Lake i Data Warehouse
- W jednym miejscu udostępnione zostały dane z kilku najważniejszych źródeł
- Ujednolicone zostało środowisko pracy analityków
Najważniejsze korzyści dla organizacji:
- Brak prac utrzymaniowych związanych z infrastrukturą
- Wyższa wydajność obliczeniowa / szybsze działanie
- Większa stabilność
- Skalowalność on-demand
- Demokratyzacja dostępu do danych
- Optymalizacja kosztów
Obecnie zespół Agory S.A. jest wspierany przez zespół Devoteam (Center of Excellence) w zakresie wsparcia ciągłości usług Google Cloud.
Szukasz podobnego rozwiązania dla Twojej firmy? Zapraszamy do kontaktu.