2022/11/30
AIは運用業務を変えるか?
明日から12月です。日脚もめっきり短くなり、冬の訪れを感じる今日このごろです。
1年が経つのは速いものですが、ちょうど1年前ごろはフェースブック社がメタ社と名前を変えて、メタバース事業への参入を公開したあたりです。またWeb3も話題にあがりました。メタ社自体は1万人のリストラを発表し、NFTも一時のブームは過ぎ去り、DAOも微妙な立ち位置です。新興技術の立ち上げは、なかなか難しいものですね。
さて、今週の月曜に”Kompass Days 2022″と題して弊社Kompiraシリーズのユーザー会を開催いたしました。
ご参加くださった皆様ありがとうございます。
スピーカーの皆様よりシステム運用の改善への取り組みについて、様々なお話を頂きましたが、チームビルディングから自動化の推進まで、いろいろな課題があるもんだなあと思います。また今後の活動の方向性としてはAIの導入を挙げられているのが興味深いところでした。
これらは、いわゆる『AIOps」と呼ばれるカテゴリーのお話と思います。大量のログデータ、モニタリングデータ、イベントなどをリアルタイムに収集を行い、トラブルの予兆を検知したり、問題事象の原因の推定などを行わせるものです。従来のしきい値ベース、発生イベントによる判断のみならず、人が見切れない解像度・ボリュームのデータを学習させることによって、予防余地が取れる事が期待されています。
システムも複雑化かつ大規模になるにつれて、これまでのように目視で丁寧に確認していくという対応が限界を迎えつつあるわけです。
学習用の教師データをどのように作るのかはノウハウの塊なのだと推察しますが、実験中のシステムでの予兆検知では、はなかなか良い成績を出しているそうです。
障害の事後解析でネットワーク、アプリケーション、データベースなどのログを突き合わせて、どこで何が起こってどのように波及していったのかの分析は良く行われると思いますが、それらの知見を用いてトラブル発生の予兆が明らかに出来ればとても助かりますよね。この分野もいろいろな現場での知見を持ち寄って、使い所が探れれば良いなと思います。