
2.対応履歴を学習
本技術では、保守者が障害対応した結果をフィードバックすることで、ルールを自動学習(定義すべきアラームの選定と適正化)します。
本技術のポイントとなるのが、さまざまな障害ケースにおける障害固有のアラームの組み合わせを抽出するアルゴリズムです。オープンソースであるリアルタイム分散機械学習基盤Jubatusの機能を用いることで、障害ケースごとに発生しているアラーム群を比較し、各障害ケースで固有なアラームの組み合わせの抽出を実現しました。本アルゴリズムにより抽出された固有のアラームの組み合わせを基にルールの学習を行います。
ルール学習の簡易な例(図2)としては、まず、障害αのケースが発生すると、障害α固有のアラームを抽出し障害αを判定するルールを生成します(図2(a))。次に、障害βのケースが発生すると障害α、障害βそれぞれの障害ケースでしか発生していないアラームの組み合わせを抽出し、障害βを判定するルールを生成します(図2(b-1))。同時に障害αに対しても固有なアラームの組み合わせを見直し、ルールを修正します(図2(b-2))。このように、障害ケースが増えるたびに、過去に発生したすべての障害ケースを含めて、ルールを自律的に導出・適正化します。

図2 ルール学習の仕組み
![]() 1.保守者の分析・切分け試験稼働を削減 |
![]() TOP |
![]() 3.システム化について |