Amazon EMR - przetwarzanie danych w chmurze

28 maja 2021

Amazon EMR to narzędzie służące do szybkiego i optymalnego kosztowo przetwarzania ogromnych ilości danych w chmurze, przy użyciu open source'owch frameworków, takich jak Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache Hudi i Presto.

Amazon EMR ułatwia konfigurację, obsługę i skalowanie środowisk Big Data, poprzez automatyzację czasochłonnych zadań związanych z udostępnianiem pojemności czy dostrajaniem klastrów. Amazon EMR pozwala analizować petabajty danych 3x szybciej niż standardowy Apache Spark. Obciążenia mogą być uruchamiane w instancjach Amazon EC2, klastrach Amazon Elastic Kubernetes Service (EKS) lub lokalnie, wykorzystując EMR w AWS Outposts.