Przejdź do treści

Agora S.A. – Enterprise Analytical Platform: od Hadoopa do BigQuery 

Google Cloud

Dowiedz się, jak eksperci Devoteam pomogli w migracji platformy analitycznej z klasteru Hadoop na chmurę Google Cloud Platform (GCP), w celu zoptymalizowania infrastruktury, zwiększenia efektywności pracy analityków oraz zmniejszenia kosztów.

O kliencie

Agora to 4. największa grupa medialna w Polsce. Jej oferta obejmuje sieć kin Helios SA, firmę produkcji i dystrybucji filmowej Next Film, 9 rozgłośni radiowych działających pod szyldem Grupa Eurozet, reklamę zewnętrzną (AMS SA), cenione media informacyjne – „Gazetę Wyborczą” i Wyborcza.pl, portal Gazeta.pl i jego serwisy (m.in. Sport.pl, Moto.pl i Plotek.pl) oraz ponadregionalne Radio TOK FM, wydawnictwa książkowe, muzyczne i filmowe, a także działalność gastronomiczną.

Wyzwanie

W 2014 roku Agora rozpoczęła zbieranie danych o aktywności użytkowników serwisów przy użyciu własnej technologii.

Na potrzeby przechowywania i przetwarzania danych powstał klaster Hadoop, model danych i mechanizmy gromadzenia danych.

Hive został wybrany do celów analitycznych. Wymogiem biznesowym był stały dostęp do aktualnych, zagregowanych danych. Zbudowane zostały procesy zarządzania danymi oraz szereg procesów ETL na nim bazujących. Oprócz danych o ruchu, Hive przechowywał również metadane treści z monitorowanych stron internetowych oraz inne dane z różnych systemów.
Stale rosnący wolumen danych, rosnące potrzeby związane z raportowaniem po stronie Biznesu, łączenie różnych zbiorów danych, utrzymywanie infrastruktury fizycznej oraz oprogramowania, adresowanie błędów i awarii – to były główne wyzwania setupu onprem.

Podsumowując, wyzwanie cechowało się:

  • 70 TB danych do zmigrowania z Hive do BigQuery
  • Integracją z Kafka i innymi rozwiązaniami dostarczającymi dane w czasie rzeczywistym
  • Optymalizacją wykorzystania usług
  • Zmiennym obciążeniem jednostki obliczeniowej

Devoteam G Cloud był niezawodnym partnerem w takich obszarach jak szkolenia, transfer wiedzy i DevOps dla naszego zespołu odpowiedzialnego za migrację hurtowni danych na dużą skalę z rozwiązania On-prem do chmury. Praca z inżynierami Devoteam była przyjemnością.

Cel projektu

Biorąc pod uwagę ryzyka i ograniczenia obecnej platformy analitycznej, Zarząd Agory podjął decyzję o migracji procesów analitycznych do chmury Google Cloud. Ze względu na ograniczone doświadczenia w obszarze cloud, Agora poszukiwała partnera, który wesprze pracowników w procesie migracji na etapie modelowania docelowej struktury danych oraz tworzenia architektury systemu zasilania w chmurze – w celu optymalizacji powyższych elementów rozwiązania pod kątem kosztów.

Rozwiązanie

Zespół Devoteam G Cloud przygotował koncepcję wykorzystującą rozwiązania Managed i Serverless, które gwarantowałoby zachowanie dotychczasowego stylu pracy zespołów analitycznych Agory S.A. 

Po akceptacji przez klienta, został wdrożony projekt migracji platformy analitycznej do chmury Google, przy wykorzystaniu komponentów takich jak BigQuery, Google Cloud Storage, Cloud Composer (Airflow), Cloud Functions czy Dataflow.

Współpraca między Devoteam a zespołem Agory S.A. w projekcie pozwoliła na sprawny transfer wiedzy, dzięki czemu pracownicy Agora S.A. z sukcesem mogą realizować dalsze prace rozwojowe, a także utrzymywać stworzone wspólnie z nami środowisko Big Data. Partnerskie podejście i bardzo dobre przygotowanie zespołu Agora S.A. pozwoliły na wykonanie wszystkich niezbędnych prac zgodnie z planem.

Rezultaty

Efekty jakie osiągnęliśmy:

  • Wszystkie dane historyczne o ruchu zostały przeniesione do chmury
  • Stworzony został framework / systemu procedur związanych z zarządzaniem danymi i dostępem do danych
  • Wprowadzone zostały ujednolicone procesy zasilające dla Data Lake i Data Warehouse
  • W jednym miejscu udostępnione zostały dane z kilku najważniejszych źródeł 
  • Ujednolicone zostało środowisko pracy analityków

Najważniejsze korzyści dla organizacji:

  • Brak prac utrzymaniowych związanych z infrastrukturą
  • Wyższa wydajność obliczeniowa / szybsze działanie
  • Większa stabilność
  • Skalowalność on-demand
  • Demokratyzacja dostępu do danych
  • Optymalizacja kosztów

Obecnie zespół Agory S.A. jest wspierany przez zespół Devoteam (Center of Excellence) w zakresie wsparcia ciągłości usług Google Cloud.

Szukasz podobnego rozwiązania dla Twojej firmy? Zapraszamy do kontaktu.