【BI】イベントログを PowerPivot に読み込んで分析ーその1 分析の計画

「イベントログを PowerPivot に読み込んで分析」シリーズです。 ※ SSASと併用したデータマイニング については別の機会に..ということでご了承ください はじめに 計画 ← 今回はここ 分析軸の作成 ※2010/03/30 追記  PowerPivot for EXCEL 2010 の準備とデータの取り込み 計算列の作成とテーブル間リレーションの作成 ピボットテーブルの作成 Business Intelligence という言葉から、BIに関連する機能って「なんか人口知能のようなもの」をイメージしてしまう方もいらっしゃると思います。え?いません!? じ、実は、何を隠そう、私がそうです(恥ずかしい….)。 ということで、今回は「分析の考え方」についてズブの素人なりに説明してみたいと思います。 分析を実行するには、はじめに「何を分析したいのか?」をざっくりと洗い出しておく必要があります。具体的に言えば、分析のための「メジャー(尺度)」と「ディメンジョン(軸)」が明確になっていないと分析に着手することができません。 メジャー(尺度)とは、分析したい数字です。イベントログであれば「イベントの数」が該当するでしょう。 もちろん、「イベントの数」といっても、単なる総数では意味がありません。「いつ発生した」「どのサーバーの」「どんなサービスが出した」イベントの数であるかを明確にすることで、はじめて分析が行えます。具体的には、例えば「3月1日から3月10日のあいだの、DNSに関連したエラー」の数 などです。 この「いつ」や「どの」、「どんな」に相当するのがディメンジョン(軸)です。 メジャーが「売上」であれば、ディメンジョンは「店舗」「商品名」「地域」「日時」「値引き額」などでしょう。 恥の上塗りになるので言いたかありませんが、「ディメンジョン」と聞いて「中学校で習ったXYZ軸」を思い浮かべてしまうと、かえって混乱します。だって、店舗、商品名、地域、日時、値引き額 で既に5次元ですから、立体を頭に思い浮かべようとするとワケが分からなくなります。わたしゃ馬鹿なので、その呪縛から抜け出すために相当な時間がかかりました…ほんとに恥ずかしい話です。だからいまだに Newton とか読めないんですよね…。 話を戻しまして。 イベントログの分析であれば、求められるのは以下のような結果かと思います。 ※ 本当は、ここにパフォーマンスログを重ね合わせたいところですが、ひとまず今回はイベントログだけを見ていきます。 時間帯およびサーバーごと、およびサービスごとのエラーの傾向 不正なアクセスが発生している時間帯 重大およびエラーイベントの発生履歴 サーバーの稼働状況 ・ ・などなど 例えば「時間帯およびサーバーごと、およびサービスごとのエラーの傾向」を分析したいと考えた場合には、メジャーとディメンジョンは以下のようになるでしょう。 メジャー(尺度) = エラーの数 ディメンジョン(軸) = 日時、サーバー名、エラーを出しているサービス ここに「サーバーのメンテナンススケジュール」などを組み合わせられると、SEの夜間作業の正当性を主張する際のネタにもなりますね。 メジャーとディメンジョンがざっくり決まったら、必要なデータを準備します。 メジャーとなる「エラーの数」は、イベントログが格納されているテーブルを集計することで取ってこられますから、事前に準備する必要はありません。 では、ディメンジョンはどうでしょうか?…

2