Nowość —Szybkie wykrywanie i rozwiązywanie problemów dzięki nowej funkcji Log Anomaly Detection and Recommendations od Amazon DevOps Guru

4 sierpnia 2022

W lipcu, AWS ogłosił nową funkcję Log Anomaly Detection and Recommendations dla Amazon DevOps Guru. Dzięki tej funkcji możesz znajdować anomalie w odpowiednich logach w swojej aplikacji i uzyskiwać ukierunkowane zalecenia dotyczące rozwiązywania problemów.

Oto podgląd na tę funkcję:

Nowość —Szybkie wykrywanie i rozwiązywanie problemów dzięki nowej funkcji Log Anomaly Detection and Recommendations od Amazon DevOps Guru

W grudniu 2020 roku, AWS uruchomił w pełni zarządzaną usługę platformy AIOps o nazwie DevOps Guru, aby ułatwić programistom i operatorom poprawę niezawodności i dostępności aplikacji. Usługa DevOps Guru minimalizuje czas potrzebny na naprawę problemów, korzystając z modeli uczenia maszynowego opartych na ponad 20-letniej wiedzy operacyjnej w zakresie budowania, skalowania i utrzymywania aplikacji dla Amazon.com.

Za pomocą DevOps Guru można identyfikować anomalie, takie jak zwiększone opóźnienia, współczynniki błędów i problemy z zasobami, a następnie wysyłać alerty z opisem i zaleceniami dotyczącymi działań naprawczych. Aby korzystać z DevOps Guru, nie potrzebujesz żadnej wcześniejszej wiedzy z zakresu uczenia maszynowego, wystarczy aktywować go w panelu DevOps Guru.

Nowa funkcja – Log Anomaly Detection and Recommendations

Obserwowalność i monitorowanie to integralne części DevOps i nowoczesnych aplikacji. Aplikacje mogą generować kilka typów danych telemetrycznych, z których jednym są metryki, aby ujawnić wydajność aplikacji i pomóc w identyfikacji problemów.

Chociaż metryki analizowane obecnie przez DevOps Guru mają kluczowe znaczenie dla ujawniania problemów występujących w aplikacjach, nadal trudno jest znaleźć pierwotną przyczynę tych problemów. Ponieważ aplikacje stają się coraz bardziej rozproszone i złożone, deweloperzy i operatorzy IT potrzebują większej automatyzacji, aby skrócić czas i wysiłek poświęcany na wykrywanie, debugowanie i rozwiązywanie problemów operacyjnych. Pozyskując odpowiednie logi w połączeniu z metrykami, deweloperzy mogą teraz skuteczniej monitorować i rozwiązywać problemy ze swoimi aplikacjami.

Dzięki nowej funkcji Log Anomaly Detection and Recommendations możesz uzyskać szczegółowe informacje wraz z dokładnymi zaleceniami z logów aplikacji bez ręcznego wysiłku. Funkcja ta dostarcza kontekstowe dane logów o wystąpieniach anomalii i zapewnia praktyczne wglądy w rekomendacje zintegrowane z dashboardem DevOps Guru.

Funkcja Log Anomaly Detection and Recommendations umożliwia wykrywanie słów kluczowych wyjątków, anomalii liczbowych, kodów stanu HTTP, anomalii formatu danych i nie tylko. Gdy DevOps Guru zidentyfikuje anomalie z logów, na dashboardzie DevOps Guru znajdziesz odpowiednie próbki logów i głębokie linki do CloudWatch Logs. Te kontekstowe logi są ważnym składnikiem funkcji DevOps Guru, która zapewnia dodatkowe funkcje, a mianowicie ukierunkowane zalecenia ułatwiające szybsze rozwiązywanie problemów.

Na początek

Nowa funkcja składa się z dwóch elementów: „Log Anomaly Detection” oraz „Recommendations”. Przyjrzyjmy się dokładniej, jak możemy użyć tej funkcji, aby znaleźć główną przyczynę problemu i uzyskać rekomendacje. Jako przykład przyjrzymy się naszemu bezserwerowemu API zbudowanemu przy użyciu Amazon API Gateway ze zintegrowanym AWS Lambda z Amazon DynamoDB. Architektura jest pokazana na poniższym obrazku:

Nowość —Szybkie wykrywanie i rozwiązywanie problemów dzięki nowej funkcji Log Anomaly Detection and Recommendations od Amazon DevOps Guru

Jeśli po raz pierwszy korzystasz z funkcji DevOps Guru, musisz ją włączyć odwiedzając dashboard DevOps Guru. Możesz dowiedzieć się więcej, odwiedzając stronę Pierwsze kroki.

Ponieważ mamy już włączoną funkcję DevOps Guru, możemy przejść do strony Insights, następnie przejść do sekcji Log groups i wybrać opcję Enable log anomaly detection.

Nowość —Szybkie wykrywanie i rozwiązywanie problemów dzięki nowej funkcji Log Anomaly Detection and Recommendations od Amazon DevOps Guru

Funkcja Log Anomaly Detection

Po kilku godzinach możemy odwiedzić dashboard DevOps Guru, aby sprawdzić spostrzeżenia. Tutaj otrzymujemy kilka ustaleń od DevOps Guru, co widać na poniższych zrzutach ekranu:

Funkcja Log Anomaly Detection

Dzięki funkcji Log Anomaly Detection, DevOps Guru pokaże wyniki naszego bezserwerowego interfejsu API w sekcji Log groups, jak widać na poniższym zrzucie ekranu:

Funkcja Log Anomaly Detection

Możemy najechać kursorem na anomalię i uzyskać ogólne podsumowanie kontekstowych danych wzbogacenia znalezionych w tej grupie logów. Zapewnia nam to również dodatkowe informacje w tym liczbę przeanalizowanych rekordów logów i zakres czasu skanowania logów. Z tych informacji wiemy, że te anomalie to nowe typy zdarzeń, które nie zostały wykryte w przeszłości za pomocą słowa kluczowego ERROR.

Funkcja Log Anomaly Detection

W celu głębszej analizy możemy wybrać link do grupy logów i przejść do strony Detail. Wykres przedstawia istotne zdarzenia, które mogły mieć miejsce w tym przypadku, co jest przydatne do znalezienia i naprawienia przyczyny problemu. Strona Detail zawiera różne wydarzenia, z których każda reprezentuje klaster podobnych zdarzeń w logach, takich jak słowa kluczowe wyjątków i anomalie liczbowe, znalezionych w logach w momencie wystąpienia anomalii.

Patrząc na pierwszą prezentację logów, zauważyliśmy błąd ConditionalCheckFailedException w funkcji AWS Lambda. Może się to zdarzyć, gdy AWS Lambda nie może wywołać funkcji DynamoDB. Dowiedzieliśmy się z tego, że wystąpił błąd w sekcji sprawdzania warunkowego, dlatego przejrzeliśmy logikę na AWS Lambda. Możemy również zbadać powiązane grupy CloudWatch Logs, wybierając opcję View details in CloudWatch links.

Log Anomaly Detection

Jedną rzeczą, którą chcemy tutaj podkreślić, jest to, że DevOps Guru identyfikuje istotne zdarzenia związane z wydajnością aplikacji i pomaga nam dostrzec ważne rzeczy, na których musimy się skupić, oddzielając sygnał od szumu.

Docelowe Rekomendacje

Oprócz wykrywania anomalii w logach, nowa funkcja zapewnia również precyzyjne zalecenia oparte na ustaleniach z logów. Możesz znaleźć te rekomendacje na stronie Insights, przewijając w dół do sekcji Recommendations.

Tutaj otrzymaliśmy kilka zaleceń od DevOps Guru, które ułatwiają nam podjęcie natychmiastowych kroków w celu naprawienia problemu. Jednym z zaleceń pokazanych na poniższym obrazie jest Check DynamoDB ConditionalExpression, który odnosi się do anomalii znalezionej w logach pochodzących z AWS Lambda.

DevOps Guru

Dostępność

Z funkcji Log Anomaly Detection and Recommendations DevOps Guru można korzystać bez dodatkowych opłat we wszystkich regionach, w których dostępna jest usługa DevOps Guru, wschodnich stanach USA (Ohio), wschodnich stanach USA (północna Wirginia), zachodnich stanach USA (Oregon), Azji i Pacyfiku (Singapur), Azja i Pacyfik (Sydney), Azja-Pacyfik (Tokio), Europa (Frankfurt), Europa (Irlandia) i Europa (Sztokholm).

Aby dowiedzieć się więcej, odwiedź stronę Amazon DevOps Guru oraz dokumentację techniczną.

źródło: AWS

 

Case Studies
Referencje

Bardzo istotną zaletą jest szybkie i fachowe wsparcie techniczne Hostersów, którzy wiedzą, że każda chwila przerwy technicznej w dostępie do serwisów WWW oznacza poważny uszczerbek na wizerunku każdej firmy, zwłaszcza instytucji państwowej, jaką jest Instytut Pamięci Narodowej.

Sebastian Górkiewicz
Kierownik Samodzielnej Sekcji ds. Serwisów Internetowych
W skrócie o nas
Specjalizujemy się w dostarczaniu rozwiązań IT w obszarach projektowania infrastruktury serwerowej, wdrażania chmury obliczeniowej, opieki administracyjnej i bezpieczeństwa danych.