AIOps — sztuczna inteligencja w IT
AIOps czyli Artificial Intelligence for IT Operations. Jest to nowy trend na rynku IT zmierzający w kierunku wsparcia i automatyzacji działów operacyjnych IT.
Pierwszy raz akronim AIOps został użyty przez firmę Gartner w 2016 roku jako opis systemów, które łączą Big Data oraz sztuczną inteligencję (AI) lub uczenie maszynowe (ML) w celu usprawnienia procesów i zadań operacyjnych w IT. Przykładowe zastosowania to monitorowanie wydajności, dostępności, analiza zdarzeń oraz automatyzacja.
AIOps nie zastąpi obecnych systemów wspomagających operacje w IT, jest nakładką, kolejna warstwą matrixu, która ma ułatwić człowiekowi podejmowanie lepszych decyzji. Co ważne, nie wymaga też zmiany obecnych systemów i może działać wykorzystując już posiadane dane.
Dziś
Wyobraźmy sobie zespół DevOps, który zarządza infrastrukturą, zazwyczaj używa kilku, w skrajnych przypadkach kilkunastu różnych systemów: prometheus, zabbix, nagios, ELK, Graylog, Fluentd, AlertManager, VictorOps, NewRelic i jeszcze wiele innych, których nie wymieniłem. Po otrzymaniu alertu o niedostępności usługi sprawdzamy monitoring, patrzymy w logi i szukamy, kiedy już namierzmy prawdopodobną przyczynę, logujemy się na serwer.
Idylla
Zespół DevOps otrzymuje alert o niedostępności usługi, nasz system AIOps podpowiada nam, że spadła ilość połączeń na bazie danych, ale nie jest to problem z bazą danych. Ten sam system informuje nas, że kilka minut temu miał miejsce deployment nowej wersji aplikacji i od tego czasu zużycie procesora wzrosło do 100%. Dodatkowo wiemy, który wątek w aplikacji zużywa najwięcej zasobów i trwa najdłużej. A wszystko to w jednym miejscu bez przełączania się między zakładkami, logowania w różne miejsca. Czyż nie jest to piękna wizja ?
Polecam kilka linków dla bardziej zainteresowanych:
- https://www.moogsoft.com/
- https://www.splunk.com/en_us/artificial-intelligence-aiops.html
- https://www.bmc.com/blogs/what-is-aiops/
Polski akcent, prezentacja Piotra Jarkiewicza z T-Mobile Poland https://www.slideshare.net/elasticsearch/tmobilepl-powering-telco-aiops-with-elastic-machine-learning
Tomasz Gintowt jest SysOps/DevOps/DBA, głównie skupiony na dostarczaniu rozwiązań składowania i przetwarzania danych. Nie są mu obce wszelkiej maści bazy danych, systemy real-time data i streamingu. Obecnie pracuje z Apache Kafka, RabbitMQ, Elastic Stack i PostgreSQL. Prywatnie fan ciasta marchewkowego.