辛い、でも楽しい。自動化を語る日。

Kompira Meeting 2020 Session Log Kompira Meeting 2020 Session Log

NoOpsへの第一歩!One Cockpitと
Kompiraの融合による自動化事例

株式会社SMSデータテック ソリューションサービス本部
第二ソリューションサービス部 部長 松井 幸介氏

SMSデータテックの松井でございます。
本日はNoOpsへの第一歩One çockpitと SDT×Kompiraの融合による自動化事例ということでお話をさせていただきます。宜しくお願いします。

本日の流れとしては、初めに会社概要をご説明させて頂きまして、弊社、運用自動化ラボと統合運用管理ツール「One Cockpit」のご紹介させていただきます。そして「One Cockpit」と「SDT×Kompira」の融合による事例のご紹介、最後に「NoOpsへ向けて」ということで、弊社の取り組みについてお話しをさせて頂きます。

弊社SMSデータテックは、2001年6月にシステム運用・保守部門からスタートした会社でございまして、設立して19年になります。
今ではシステムの企画、開発、及びインフラの設計構築部隊がありまして、ITシステムのライフサイクル全般に対応できる体制へと強化しております。

弊社では、官公庁様や金融機関様と言った社会インフラのシステムに関わる機会が多く、大規模システムの開発、及び運用保守業務について長年にわたり経験を培ってきております。
また請負開発や社内でのリモート監視による運用、維持管理、テクニカルサポートデスク業務なども多くご対応させて頂いております。

事業拠点としては、4拠点ございまして、東京だけでなく、大阪、名古屋と地方への展開も行っております。

私共は、スキルベースの一つとして、ITサービスマネジメントの成功事例を体系化したITILを参照し活用しております。
全社員が知識としてITILの資格を保持させている事と、会社としてもITIL教育事業者認定を取得し、教育と資格取得支援に向けたサービスを展開させて頂いております。ITILに関しては、現在、V4の教育者認定の取得に取り組んでおります。

私が担当しておりますソリューションサービス本部では、システム運用の改善コンサルや運用設計、また運用管理業務および保守サポートを行っている組織となります。
弊社の基本的価値観の一つに、傍を楽にすると書いて「傍楽」という言葉があります。「自分の周りの人々に楽になってもらうため、楽しくなってもらうために働く」と言う意味でございまして、こちらを我々は、常に意識し活動をしております。

システム運用業務のノウハウを活かし、また、この傍楽をベースに、後程ご紹介させて頂きます運用自動化ラボを昨年立ち上げております。

弊社の特長になりますが、わたくしどもが長年にわたり培ってきたシステム運用の経験をベースに、ITILを参照して、
品質の確保と中長期的なコスト削減を意識して、お客様のビジネスをサポートさせていただいております。
特にご提案時には、お客様のご要望に柔軟に対応をさせて頂いております。
また常に問題意識を持ち、継続的改善活動を活発に行い、問題解決や課題達成に向けた取り組みを実施することができます。
リモート監視センターでは、お客様のシステムをお守りするために、24/365の対応も可能となっており、問い合わせサポートも含めたサービスをご提供しております。

運用自動化ラボとは


続きまして弊社の運用自動化サービスの全体像として、運用自動化ラボをご紹介させていただきます。
弊社のソリューションである運用自動化ラボでは、運用業務で抱えているお客様の様々なお悩みに対し、解決に向けたプロセスを構築しております。
まずソリューション診断と言うことで自動化コンサルティングがありまして、そこから各種の自動化ツール導入フェーズでSDT×KompiraやRPA導入支援、個別ツール開発などをご提案させて頂いております。
また導入後の運用・保守では運用・保守サービスがございますので、導入して終わりではなくアフターフォローも充実しております。

わたくし共は、ただ自動化のためのツールを導入すれば良いと、考えているわけではなく、自動化コンサルで、お客様のIT資産(これは、既に利用されている技術や使われていなかったり、十分に活用されていない機能)などの無駄を洗い出し、有効活用するためのご提案もさせて頂く事ができます。
これにより、短期間でコストをかけずに最適化と自動化の機会を実行に移すという事を意識しております。
自動化ラボのツールとして、フィックスポイントさんのKompiraと、私共の運用ノウハウを融合させた自動化ソリューションとしてSDT×Kompiraをサービス展開させて頂いております。

Kompiraに着目した理由


わたくしどもがKompiraに着目した理由になりますが、まず一つにFixpointさんではシステム運用に関する豊富な自動化の実績がございます。
また弊社では、システム運用・保守業務に関する豊富な実績がございます。
これらを組み合わせることで、更なる自動化の可能性を引き出すことができると考えました。
既存のシステムを自動化するという点では、現状の運用フローを変更せず、既に存在しているツールとの連携も可能である点も最大の魅力でした。

システム運用の自動化だけでなく、事務作業などの業務自動化にも対応できるようになっておりますので、RPAと同じように使って頂くことも可能ですし、また既に導入されているRPAとの連携も可能である点も着目した理由となっております。

昨今、RPAの導入が進んでいる中でRPAと比較した場合でも、Kompiraはバックグラウンドでの処理となるため、処理時間の大幅な削減やクライアント側の事情で処理が止まることがないところは、大きなメリットになると考えております。

Kompiraは、自動化を実行するためにジョブフローを作成する必要がありますが、Pythonベースとなっており柔軟にカスタマイズが可能です。

導入におきましてもオンプレでもクラウドでも対応が可能ですので、お客様のニーズに合わせた提案が可能となっており、冗長構成が取れることも魅力です。
また連携処理基盤ソフトウェアと言ったオーケストレーションツールでありますが、連携実績が多くあり、他社の製品と比べても安価でありますので、導入が容易となっております。
これらが弊社がKompiraに着目した理由となっております。

「OneCockpit」開発の背景

ここまで、運用自動化ラボについて、ご紹介させて頂きましたが、その運用自動化ラボから誕生した弊社の統合運用管理ツール「One Cockpit」についてご紹介いたします。

まず、初めにOne Cockpitを開発した背景からご紹介させて頂きます。
私共が所属しているソリューションサービス本部は、システム運用のプロフェッショナル部門として、お客様のシステムをお守りしております。
その経験を活かし、弊社のリモート監視センターから、お客様のシステムを統合的に運用・監視を行っております。
年々、弊社のリモート監視センターをご利用いただくお客様が増えてきておりますが、その一方で様々な課題も上がってきました。
運用・監視を行うシステム数の増加に比例して、オペレーターによる運用作業や障害対応が増加しておりまして、オペレータの稼働が逼迫する状況となってしまいました。
障害対応時には、一次切り分けを行い、影響範囲を判断し、迅速にお客様へ報告する必要がございますが、対象サーバにログインを行い、状態確認を行っていた為、お客様とのSLAに抵触しなくとも、時間が掛かってしまうことがありました。
月次の運用作業として、CPUやメモリといったリソース情報のレポート作成も行っていますが、お客様毎に作成して、報告する必要がありますので、稼働が掛かってしまっている状況でございました。
また、お客様側でもシステムの稼働状況を確認できるようにして欲しいとの要望がありましたので、これらの課題・ご要望に応えるべく、統合運用管理ツール「One Cockpit」を開発しております。

統合運用管理ツール「One Cockpit」


こちらは、One Cockpitのシステム概要図になります。
この後、実際の画面もお見せしますが、One Cockpitは、各監視ツールからの情報を基にダッシュボードにシステムの稼働状況を表示することができます。
また、レポーティング機能も備えておりますので、手動で、リソース情報を取得し、グラフに変換していた作業をOne Cockpitが自動でグラフ化してくれます。
更に、Ansibleのジョブを操作することも可能になっておりますので、既知のエラーに対しては、Ansibleのジョブを紐づけておくことにより、復旧処理を自動化することが可能となっております。

こちらがOne Cockpitの実際の画面になります。

ダッシュボード画面では、監視しているサーバの状態に分けて、監視しているサーバの件数を表示いたします。また、エラーログを選択することにより、詳細を確認することができます。

こちらが、エラーログの詳細確認画面になります。

One Cockpit上でログまで確認ができるので、わざわざサーバにログインしなくても、One Cockpitからシステムの状況を確認することが出来ます。また、お客様側でも簡単に状況を把握することが可能となりました。

こちらは、Ansibleのジョブを登録する画面になります。
「Action-Playbooks」タブから、Ansibleのジョブを登録し、既知のエラーと紐づけておくことにより、復旧作業を自動化することが出来ます。
登録方法は、yamlファイルをアップロードするだけでエラーとの紐づけも簡単に操作が可能となっております。

こちらは、レポート作成画面になります。

「Create Reports」タブから、CPUやメモリといった取得したい情報と日時を設定するだけで、グラフを出力することが可能です。
こちらの機能により、お客様側でもお好きなタイミングでリソース情報を閲覧することが可能となっております。

SDT×Kompiraユーザ事例


ここまでは、One Cockpitについてご紹介させて頂きましたが、そのOne CockpitとSDT×Kompiraを融合させた事例をご紹介させて頂きます。

まずSDT×Kompiraのお客様でシステム障害対応に関する一連の作業フロー自動化した事例をご紹介させて頂きます。
説明とシステム概要図のとおり、各監視システムから検知したアラートに対して、対処の要否をSDT×Kompiraで判断して、対処が必要なアラートのみ復旧オペレーションを自動で実行、実行結果を担当者へ通知いたします。

また、担当者による判断が必要なアラートは、チャットシステムや自動電話サービスと連携し、担当者へ通知いたします。
こちらの事例では、単純作業や障害対応を自動化することにより、オペレータの負荷を軽減し、運用品質を向上させるための取り組みとして、自動化のご支援をさせて頂きました。
ここまででも自動化の十分な効果が得られたのですが、さらに、追加仕様のご相談がございました。

結論から言うと、SDT×KompiraのWEB UIが欲しいとのご要望でした。
監視しているシステムの状態を確認するのに、それぞれのサーバへログインし、コマンドを実行する必要がありますが、せっかくKompiraで監視を集約しているので、専用のWEB UIから簡単に確認できるようにしたい。
また、同じWEB UIから、Kompiraのジョブフローを実行できるようになれば、複数の画面を立ち上げずに一元的に管理ができる。
さらには、元々、Ansibleのジョブを使用し、自動化を行っていたので、One Cockpitと連携させることにより、お客様のご要望にお応えできるのではないかと考え、開発を進めました。

One CockpitとSDT×Kompiraの融合


こちらは、One CockpitとSDT×Kompiraを融合させた事例になります。。
One Cockpitのダッシュボード機能により、各監視システムから集約された情報を即座に確認することが可能になりました。。
Ansibleのジョブ操作については、One Cockpitの標準機能として備えているので、元々活用していたAnsibleのジョブを実行することが可能です。。
また、追加の開発となりましたが、Kompiraのジョブフローを呼び出して、One Cockpitから実行させることを可能になりました。。

Kompira は、柔軟に多様な連携を可能としておりますので、大規模なシステム改修を必要とせず、お客様のご要望にお応えすることが出来ました。

自動化ラボのスライドで、お話させて頂きましたが、我々はツールを導入して終わりという考え方ではなく、お客様のIT資産、既に利用されている機能を連携させることで、自動化のメリットを最大限、引き出すことができたと考えております。

One Cockpitは、連携処理基盤として、既に多種多様な連携実績があるKompiraと連携させることにより、更なる機能拡張をすることが出来ました。


KompiraとしてもOne Cockpitと連携させることにより、複数のシステム状況を集約し“可視化”することが可能となっております。
また、複数の自動化ツールを使用したオペレーション作業も集約して実行させることが出来るようになりましたので、SDT×Kompiraのお客様が運用しやすい環境にしていくことが出来ております。
今後も、One CockpitとKompiraを融合させ、連携先の拡充やお客様が使用しやすいWEB UIをご提供していきたいと考えております。

NoOpsに向けて


最後になりますが、NoOpsということで弊社の取り組みをご紹介させていてきます。

弊社は、NoOpsへ向けて、「可視化」⇒「自動化」⇒「無人化」というステップで取り組んでおります。
運用自動化ラボのご説明と重複する部分もございますが、「可視化」のフェーズでは、自動化・運用改善コンサルティングにより、自動化する業務を可視化し、「自動化」のフェーズで、KompiraやRPAを使用した開発から、お客様のご要望に合わせたツール開発を行い、自動化を進めております。

今後、コロナの影響もあり、テレワークの推進が進む中で、さらにNoOpsへの関心が高まり、またDXを加速させる必要が出てくると思われます。
そんな中、弊社は、「無人化」というフェーズに向かって、今回ご紹介したOne CockpitにAI機能を持たせることで、非定型・非定常業務の自動化を行いNoOpsを目指したいと考えております。One Cockpitにつきましては、システム運用に関するあらゆるデータを蓄積させ、AI化することでNoOpsを目指します。

今まで、オペレータが対応していた障害対応について、既知のエラーに対しては、自動化が進んでおりますが、どうしても人手が必要となってしまっている“既知のエラー以外の対応を自動化できるよう“研究を進めまして、故障が発生しても自動で即時サービスが復旧できるような仕組みを考えていきます。
また、障害が発生する前に、リソース情報等の時系列パターンから“故障予兆を事前検知”することで、
そもそも故障を発生させないシステム運用を目指します。
ChaBot機能では、サーバにログインしなくても欲しい情報をチャットから気軽に受け付けて、自動で取得してくれる仕組みであったり、スマートスピーカに知りたい情報を伝えるとOne Cockpitと連動して、必要な情報が取得できるような仕組みを検討しています。これは人ではなく、ロボットがシステムと連動していて、話しかけるだけで情報を得られるといったイメージです。
このような開発が進めば、故障予兆と組み合わせる事で、システムと対話をしながらシステム運用を行う日が来るのではないかと考えております。
まだまだ、研究、開発段階ではありますが、NoOpsを目指し、弊社一丸となり、システム運用のプロフェッショナルとして、フィックスポイントさんと共にお客様のシステム運用を最適化してまいります。

傍楽を実現する会社 SMSデータテックでございました。 最後までご視聴頂きましてありがとうございます。

辛い、でも楽しい。
自動化を語る日。

辛い、でも楽しい。
自動化を語る日。

Kompira Meeting 2020 Event Report > >

Session Log

監視オペレーター
僕らの給料アップ大作戦

株式会社フィックスポイント
代表取締役 三角 正樹

自動化で実現!セキュリティ
アラートの24時間365日対応!

株式会社オージス総研 プラットフォームサービス本部
運用サービス部 運用エンジニアリングチーム リーダー 辻 知晃 氏

NoOpsへの第一歩!One Cockpitと
Kompiraの融合による自動化事例

株式会社SMSデータテック ソリューションサービス本部
第二ソリューションサービス部 部長 松井 幸介 氏

fixpoint社との共同開発による
統合管理マネージドプラットフォーム

NTTコミュニケーションズ株式会社
プラットフォームサービス本部 マネージド&セキュリティサービス部
マネージドサービス部門 第1グループ グループリーダー 島貫 卓 氏

サービスマネジメント実践の
最後のワンピース「自動化」

株式会社ユニリタ
クラウドビジネス本部 サービスマネジメント部
デザイン&デリバリグループ グループリーダー 兼
マーケティング&セールス エグゼクティブ 澤田 大輔 氏

エージェントレスでの
シャドウIT対策とは?

BlueCat Japan株式会社
カントリーマネージャー 中原 浩輝 氏

バッサリ辛口!新サービス
Kompira AlertHub MSPから見た本音

株式会社クイックガード
代表取締役 栗原 邦彦 氏

「新しい働き方」支援サービス
~ Vario Telework Manager ~

バリオセキュア株式会社 取締役
技術本部/本部長 山森 郷司 氏

構成管理だけじゃないんです。
Kompira Sonarのさらなる活用術

シニアエンジニア 根岸 経 氏

Kompiraセミナー講師が教える
ジョブフロー開発のコツと落とし穴

株式会社フィックスポイント
エバンジェリスト 冨 洋一

ユーザーと一緒にシステム運用の
新常識を作る”Kompira”とは

株式会社フィックスポイント
プロダクトデベロップメント部 部長 上野 啓明