WO2023238412A1

WO2023238412A1 - 分類装置、分類方法、及び分類プログラム

Info

Publication number: WO2023238412A1
Application number: PCT/JP2022/023547
Authority: WO
Inventors: 諒内田; 晴夫大石; 公雄土川; 泰輔若杉; 史拓横瀬
Original assignee: 日本電信電話株式会社
Priority date: 2022-06-10
Filing date: 2022-06-10
Publication date: 2023-12-14

Abstract

実施形態の分類装置（１０）は、端末装置（２０）の操作ログを収集する。分類装置（１０）は、操作ログを基に、端末装置（２０）に対する操作間の共起頻度を表す情報を作成する。分類装置（１０）は、共起頻度を表す情報と操作間の類似度を表す情報とを用いて、端末装置（２０）に対する操作をクラスに分類する。

Description

分類装置、分類方法、及び分類プログラム

　本発明は、分類装置、分類方法、及び分類プログラムに関する。

　企業等で効果的な業務改善を実現するためには、対象となる業務を正確に把握することが重要である。業務を行う担当者は、日々、複数の業務を、ＰＣ、タブレット等の情報端末を用いて実施しており、情報端末を介して行われた業務は、複数の作業で構成されている。ＰＣで行われる作業は、例えば、業務を遂行するために必要な一連の情報入力操作（テキストボックスへの入力、ボタンのクリック、等）を指す。

　実業務では、担当者やオーダの内容等様々な要因で操作手順が多様である。操作手順は、基本的にはマニュアルにより規定されているが、マニュアル作成当初から作業内容に変更があったり、担当者が独自の方法で作業を実施していたりするため、マニュアルと乖離が発生する場合がある。

　業務分析者は、業務改善策検討の前提として、どのような作業にどれくらいの時間やどのような手順（操作）で実施されているのかを把握する必要がある。例えば、ＲＰＡ（Robotic　Process　Automation）を導入し、改善効果を高めるためには、業務で行われる作業の種別と量を把握し、作業量の多い作業種別からＲＰＡを導入することで効率よく業務改善を実現することができる。

特開２０２０－９５５７４号公報

横瀬、卜部、八木、土川、増田、大石、DX推進に貢献する業務可視化技術,　NTT技術ジャーナル,　vol.　32,　no.　2,　2020年2月卜部、八木、土川、増田、操作ログを入力とした業務プロセス可視化手法の検討、信学技報,　vol.　118,　no.　483,　ICM2018-64,　pp.　83-88,　2019年3月卜部、小笠原、土川、八木、大石、業務マニュアルを利用した操作ログの業務分類手法の検討、信学技報、vol.　120,　no.　259,　ICM2020-22,　pp.　23-28,　2020年11月 Y.　Urabe,　S.　Yagi,　K.　Tsuchikawa,　and　H.　Oishi,　"Task　Clustering　Method　Using　User　Interaction　Logs　to　Plan　RPA　Introduction",　In　Business　Process　Management　-　19th　International　Conference　(BPM　2021),　Aug.　2021

　しかしながら、従来の技術では、操作間の類似度を考慮して作業の分類を行うことが難しい場合がある。

　例えば、非特許文献４には、操作ログを操作種別ごとに分類した後、操作の共起性に着目し操作ログをセグメントに分割し、分割されたセグメントを凝集型クラスタリングを用いて作業の単位に分類する方法が記載されている。

　ここで、案件によってＵＲＬ及びウィンドウスタイルが変わるシステムを考える。このとき、例えば「決定ボタンを押す」という操作は、ＵＲＬ及びウィンドウスタイルが変わったとしても同じ作業に分類されることが望ましい。

　一方で、非特許文献４の方法では、操作間の類似度が考慮されないため、ＵＲＬ及びウィンドウスタイルが変わった場合、「決定ボタンを押す」という操作が異なる作業に分類されることがある。

　上述した課題を解決し、目的を達成するために、本発明の分類装置は、情報処理装置の操作ログを収集する収集部と、前記操作ログを基に、前記情報処理装置に対する操作間の共起頻度を表す情報を作成する作成部と、前記共起頻度を表す情報と前記操作間の類似度を表す情報とを用いて、前記情報処理装置に対する操作をクラスに分類する分類部と、を有することを特徴とする。

　本発明によれば、操作間の類似度を考慮して作業の分類を行うことができる。

図１は、分類装置の構成の一例を示すブロック図である。図２は、操作ログの一例を示す図である。図３は、共起行列の一例を示す図である。図４は、類似行列の一例を示す図である。図５は、類似共起行列の作成方法を説明する図である。図６は、操作系列の一例を示す図である。図７は、重心間の類似度の変化を説明する図である。図８は、分類結果の一例を示す図である。図９は、分類結果の一例を示す図である。図１０は、操作ログを収集する処理の流れを示すフローチャートである。図１１は、類似行列を作成する処理の流れを示すフローチャートである。図１２は、共起行列を作成する処理の流れを示すフローチャートである。図１３は、類似共起行列を作成する処理の流れを示すフローチャートである。図１４は、重心ベクトルの類似度を算出する処理の流れを示すフローチャートである。図１５は、操作系列を分割する処理の流れを示すフローチャートである。図１６は、操作をクラスに分類する処理の流れを示すフローチャートである。図１７は、分類プログラムを実行するコンピュータの一例を示す図である。

　以下に、本願に係る分類装置、分類方法、及び分類プログラムの実施の形態を図面に基づいて詳細に説明する。また、本発明は、以下に説明する実施の形態により限定されるものではない。

［分類装置の構成］
　図１は、分類装置の構成の一例を示すブロック図である。図１に示すように、分類装置１０は、端末装置２０とネットワークを介して接続されている。

　端末装置２０は、ユーザによって使用される情報処理装置である。ユーザは、例えば、業務担当者である。業務担当者は、例えば、端末装置２０上で、業務システム及び汎用的なアプリケーション等の、各種ソフトウェアを使用する。

　なお、端末装置２０は、スマートフォン、デスクトップ型ＰＣ、ノート型ＰＣ、タブレット型ＰＣ等のクライアント装置を含む、任意のタイプの情報処理装置であってよい。

　また、図１の例では、分類装置１０と端末装置２０とを別々の装置としているが、端末装置２０が分類装置１０の一部又は全ての機能を有していてもよい。

　端末装置２０は、ユーザの操作ログを取得する。例えば、端末装置２０は、操作イベントが発生したタイミングで、操作日時、操作箇所、操作位置等を含む操作ログを取得する。端末装置２０は、取得した操作ログを分類装置１０に送信する。

　分類装置１０は、通信部１１、記憶部１２及び制御部１３を有する。

　通信部１１は、ＮＩＣ（Network　Interface　Card）等で実現され、ＬＡＮ（Local　Area　Network）及びインターネット等の電気通信回線を介した外部の装置との通信を制御する。例えば、通信部１１は、端末装置２０から操作ログを受信する。

　記憶部１２は、制御部１３による各種処理に必要なデータ及びプログラムを格納し、操作ログ記憶部１２１及び類似度記憶部１２２を有する。例えば、記憶部１２は、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置等である。

　操作ログ記憶部１２１は、端末装置２０から取得した操作ログを記憶する。

　図２は、操作ログの一例を示す図である。図２に示すように、操作ログ記憶部１２１に記憶される操作ログには、操作日時、操作を行ったユーザを識別する情報であるユーザ情報、操作対象のアプリケーションを識別する情報であるアプリケーション情報、操作対象のウィンドウに関する情報であるウィンドウ情報、操作箇所（ボタン、テキストボックス、セル等のオブジェクト）、操作が行われたときの画面のキャプチャ画像、及び操作位置（画面内での座標）が含まれる。

　分類装置１０は、端末装置２０から操作ログを受信し、受信した操作ログを、操作ログ記憶部１２１に格納する。なお、分類装置１０が操作ログを受信するタイミングはどのようなタイミングであってもよい。例えば、分類装置１０は、一定の時間間隔で操作ログを受信してもよいし、新たな操作ログが生じるたびに操作ログを受信してもよい。

　類似度記憶部１２２は、後述する重心ベクトル間の類似度を記憶する。重心ベクトル及び類似度については後述する。

　制御部１３は、各種の処理手順等を規定したプログラム及び所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。

　例えば、制御部１３は、収集部１３１、特定部１３２、作成部１３３及び分類部１３４を有する。

　また、制御部１３は、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等の電子回路やＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路である。

　収集部１３１は、端末装置２０の操作ログを収集する。端末装置２０は、情報処理装置の一例である。

　特定部１３２は、操作ログに対応する操作を特定する。例えば、特定部１３２は、操作ログ記憶部１２１から、図２に示す操作ログのテーブルを読み出し、操作内容というカラムを追加する。

　特定部１３２は、操作内容のカラムに、ウィンドウ情報及び操作箇所を組み合わせた情報を追加し、操作ログ記憶部１２１に格納する。

　例えば、特定部１３２は、操作内容のカラムに、「ウェブページ１＋ボタンｅ」、「ウェブページ１＋テキストボックスｂ」といった情報を追加する。

　さらに、特定部１３２は、操作内容が同じ操作については、同一の操作であると特定する。特定部１３２は、操作の種類を特定するということができる。

　具体例を挙げて説明すると、特定部１２は、操作内容が「ウェブページ１＋ボタンａ」である操作が複数ある場合には、それらの操作を同一の操作であると特定する。

　作成部１３３は、操作ログを基に、端末装置２０に対する操作間の共起頻度を表す情報、及び操作間の類似度を表す情報を作成する。

　例えば、作成部１３３は、端末装置２０に対する操作の数と同数の行と列を持ち、操作間の共起頻度を要素とする共起行列、及び操作の数と同数の行と列を持ち、操作間の類似度を要素とする類似行列を作成する。

　図３は、共起行列の一例を示す図である。作成部１３３は、操作ログ記憶部１２１から操作を時系列順（操作日時が早い順）に読み込み、各操作の前後ｎ（ただし、ｎは１以上の整数）個の操作をカウントして、操作ごとの共起行列を作成する。なお、操作ログ記憶部１２１の各行が操作に対応している。

　このとき、作成部１３３は、前後の操作が同一ウィンドウ内（ウェブページ、ファイルが共通）で発生する場合は、重みをつけてカウントしてもよい。例えば、作成部１３３は、異なるウェブページの操作は１個とカウントし、同じウェブページの操作は、０．５個とカウントする。

　図４は、類似行列の一例を示す図である。ここでは、ａ、ｂ、ｃ、ｄ、ｅのそれぞれは、特定部１３２によって同一であることが特定された操作である。

　このため、例えば各操作（例えば操作ａ）に対応する操作ログは、操作ログ記憶部１２１に複数存在していてもよい。

　図４に示すように、類似行列は、各操作を行及び列に対応させた正方行列として表される。

　類似行列の各成分は操作間の類似度である。類似度は、０から１までの連続値である。実施形態ではこのような類似度を考慮することで、操作間の関係を二値（１（同一）又は０（非同一））で表す場合と比べ、類似度を考慮してより適切に操作の分類を行うことができる。

　なお、類似度が大きいほど操作が類似していることを意味し、２つの操作の類似度が１であれば、当該２つの操作は同一とみなされる。

　操作間の類似度は、事前に管理者等により与えられていてもよい。また、類似度は、操作ログ記憶部１２１の各項目の類似度を基に作成部１３３が算出してもよい。

　例えば、作成部１３３は、同じ値の項目が多いほどの類似度を大きくしてもよい。また、例えば、作成部１３３は、操作位置が近いほど類似度を大きくしてもよい。

　さらに、作成部１３３は、共起行列と類似行列から、類似共起行列を作成する。

　ここで、共起行列Ｃは（１）式のように表される。例えば、ｃ_ｉｊは、操作ｉと操作ｊの共起頻度である。なお、作成部１３３は、非特許文献４に記載の方法で共起行列を作成することができる。

　また、類似行列Ｓは（２）式のように表される。例えば、ｓ_ｉｊは、操作ｉと操作ｊの類似度である。

　この場合、ｎは操作の種類の数である。そして、作成部１３３は、（３）式により類似共起行列の成分を計算する。ただし、ｉ、ｊ、ｋは行列の成分を特定するためのインデックスである。

　図５は、類似共起行列の作成方法を説明する図である。作成部１３３は、（３）式の方法を図３の共起行列及び図４の類似行列に適用し、図５のように操作ａに対応する行の成分を計算する。

　図５の例では、操作ａの操作ベクトルは、［０．４，　１．６，　２，　０．７］となる。

　このように、作成部１３３は、類似共起行列により各操作の操作ベクトルを作成する。

　操作ベクトルの長さは操作の種類数と等しいため、操作の種類数が多いほど計算コストが高くなる。このため、作成部１３３は、ＳＶＤ（Single　Value　Decomposition）等の次元削減手法を利用し、各操作ベクトルの次元削減を行ってもよい。例えば、作成部１３３は、ＳＶＤにより、１０００次元の操作ベクトルを５０次元に圧縮する。

　分類部１３４は、共起頻度を表す情報と類似度を表す情報とを用いて、端末装置２０に対する操作をクラスに分類する。例えば、分類部１３４は、共起行列と類似行列とを用いて、端末装置２０に対する操作をクラスに分類する。

　また、分類部１３４は、共起行列に、共起行列と類似行列との積を加えた類似共起行列を用いて、端末装置２０に対する操作をクラスに分類する。

　具体的には、分類部１３４は、類似共起行列の各行を操作ベクトルとして取得し、操作ログに基づく操作の系列に分割点を定め、系列における分割点の前後の複数の操作の操作ベクトルの重心間の類似度の変化を基に、分割点で分割した操作の集合をクラスに分類する。

　まず、分類部１３４は、操作を時系列順に並べる。ここで得られる系列を操作系列と呼ぶ。また、操作系列における各操作は番号によって識別される（例えば、操作１、操作ｉ、操作ｎ）。

　そして、分類部１３４は、操作系列のｉ番目の操作である操作ｉを分割判断対象操作（分割点）とし、操作ｉまでのｍ個の操作系列（操作（ｉ－ｍ），　操作（ｉ－ｍ＋１），…，操作ｉ）と、操作ｉより後のｍ個の操作系列（操作（ｉ＋１），　操作（ｉ＋２），…，操作（ｉ＋ｍ＋１））と、を取得する。

　操作ｉまでのｍ個の操作系列を操作系列Ａとする。また、操作ｉより後のｍ個の操作系列を操作系列Ｂとする。

　分類部１３４は、操作系列Ａに含まれる各操作の操作ベクトルを取得し、取得した操作ベクトルの重心ベクトルを計算する。

　図６は、操作系列の一例を示す図である。図６の例では、操作系列ｂｄｅｆｇ（操作系列Ａ）と操作系列ｏｐｑｒｓ（操作系列Ｂ）の間に分割点が定められているものとする。

　このとき、分類部１３４は、操作系列Ａの重心（重心ベクトルＡ）を（４）式のように計算する。

　また、分類部１３４は、操作系列Ｂの重心（重心ベクトルＢ）を（５）式のように計算する。

　ただし、ｍは操作ベクトルの数であり、（４）式及び（５）式の例ではｍ＝５である。なお、分類部１３４は、重心ベクトルの代わりに和ベクトルを計算してもよい。

　さらに、分類部１３４は、計算した重心ベクトル間の類似度を（６）式のように計算し、計算した類似度を類似度記憶部１２２に格納する。ただし、｜Ｖ｜は重心ベクトルの次元数である。

　同様に、分類部１３４は操作系列の各分割点について重心ベクトル間の類似度を計算する。なお、類似度は（６）式に示すコサイン類似度であってもよいし、ユークリッド距離等であってもよい。

　図７は、重心間の類似度の変化を説明する図である。図７の線は、分割点ごとの重心ベクトル間の類似度の変化を表している。

　分類部１３４は、類似度の差が閾値以上である分割点で、操作系列を分割する。図７の矢印は、単調減少と単調増加を表している。分類部１３４は、（単調減少の開始位置の類似度－極小点の類似度）＋（単調増加の終了位置の類似度－極小点の類似度）が閾値以上であれば、当該極小点に相当する分割点で操作系列を分割する。

　図７の例では、分類部１３４は、分割により、操作系列ａｂｃｄｅｆｇ、操作系列ｏｐｑｒｓｔｕｖｗｘｙｚ、及び操作系列ｈｉｊｋｌｍｎを得る。このように、分割によって得られた操作系列を操作集合と呼ぶ。

　分類部１３４は、操作集合をクラスに分類する。まず、分類部１３４は、含まれる操作の種類が多い順に分類を行う。

　図８及び図９は、分類結果の一例を示す図である。図８の例では、図９に示すように、操作集合は、含まれる操作の種類数ごとに分けることができる。

　まず、分類部１３４は、含まれる操作の種類が最も多い操作集合ａｂｃｄｅｆｇａｂｃｄｅｆｅｆｇをクラス１に分類する。

　そして、含まれる操作の種類が２番目に多い操作集合ｏｐｑｒｓｓｕｔｘｗｘｙｚは、分類済みの操作集合ａｂｃｄｅｆｇａｂｃｄｅｆｅｆｇと共通する操作の数が０であり、閾値（例えば５）以下であるため、分類部１３４は、操作集合ｏｐｑｒｓｓｕｔｘｗｘｙｚを新しいクラスであるクラス２に分類する。

　また、操作集合ａｂｃｄｅｆｇは、分類済みの操作集合ａｂｃｄｅｆｇａｂｃｄｅｆｅｆｇと共通する操作の数が５であり、閾値以上であるため、分類部１３４は、操作集合ａｂｃｄｅｆｇをクラス１に分類する。

［分類装置の処理手順］
　フローチャートを用いて、分類装置１０による各処理の流れを説明する。

　図１０は、操作ログを収集する処理の流れを示すフローチャートである。図１０に示すように、分類装置１０は、ＰＣ端末（端末装置２０）のユーザが、処理を停止するか、ＰＣ端末を落とすまでの間（ステップＳ１０１、Ｎｏ）、ＰＣ端末から操作ログを取得する（ステップＳ１０２）。

　また、分類装置１０は、ＰＣ端末のユーザが、処理を停止するか、ＰＣ端末を落とした場合（ステップＳ１０１、Ｙｅｓ）、操作ログを収集する処理を終了する。

　図１１は、類似行列を作成する処理の流れを示すフローチャートである。図１１に示すように、分類装置１０は、類似行列の全ての成分に類似度を代入するまで（ステップＳ２０１、Ｎｏ）、操作間類似度を類似行列の各成分に代入する（ステップＳ２０２）。

　分類装置１０は、類似行列の全ての成分に類似度を代入し終わった場合（ステップＳ２０１、Ｙｅｓ）、類似行列を作成する処理を終了する。

　図１２は、共起行列を作成する処理の流れを示すフローチャートである。図１２に示すように、分類装置１０は、全ての操作を対象とするまで（ステップＳ３０１、Ｎｏ）、時系列順に操作を対象とし、前後ｎ個の操作をカウントし、共起行列に反映する（ステップＳ３０２）。

　分類装置１０は、全ての操作を対象として共起行列の反映が完了した場合（ステップＳ３０１、Ｙｅｓ）、共起行列を作成する処理を終了する。

　図１３は、類似共起行列を作成する処理の流れを示すフローチャートである。図１３に示すように、分類装置１０は、共起行列の全ての成分を対象とするまで（ステップＳ４０１、Ｎｏ）、類似行列と共起行列から類似共起行列を作成する（ステップＳ４０２）。

　分類装置１０は、共起行列の全ての成分を対象とし終わった場合（ステップＳ４０１、Ｙｅｓ）、類似共起行列から各操作の操作ベクトルを生成する（ステップＳ４０３）。

　図１４は、重心ベクトルの類似度を算出する処理の流れを示すフローチャートである。図１４に示すように、分類装置１０は、全ての操作を対象とするまで（ステップＳ５０１、Ｎｏ）、時系列順に操作を対象とし、対象操作を含む前ｍ個の操作の、重心ベクトルを生成する（ステップＳ５０２）。

　続いて、分類装置１０は、対象操作の次の操作からｍ個の操作の重心ベクトルを生成する（ステップＳ５０３）。そして、上記２つの重心ベクトルの類似度を算出し、類似度記憶部１２２に蓄積する（ステップＳ５０４）。

　分類装置１０は、全ての操作を対象とし終わった場合（ステップＳ５０１、Ｙｅｓ）、重心ベクトルの類似度を算出する処理を終了する。

　図１５は、操作系列を分割する処理の流れを示すフローチャートである。図１５に示すように、分類装置１０は、全ての操作を対象とするまで（ステップＳ６０１、Ｎｏ）、時系列に並べた重心ベクトル間の類似度の下がり始めを検知する（ステップＳ６０２）。

　ここで、分類装置１０は、類似度の下がり始めから、次の下がり始め（＝上がり終わり）及びその間の極小点を検知する（ステップＳ６０３）。

　分類装置１０は、深さ（ｄ）＝類似度の下がり始めから極小点の差分＋極小点と上がり終わりの差分を算出する（ステップＳ６０４）。

　算出した深さが閾値以上である場合（ステップＳ６０５、Ｙｅｓ）、分類装置１０は、対象の操作と次の操作の間を分割する（ステップＳ６０６）。算出した深さが閾値以上でない場合（ステップＳ６０５、Ｎｏ）、分類装置１０はステップＳ６０１に戻る。

　分類装置１０は、全ての操作を対象とし終わった場合（ステップＳ６０１、Ｙｅｓ）、操作系列を分割する処理を終了する。

　図１６は、操作をクラスに分類する処理の流れを示すフローチャートである。図１６に示すように、分類装置１０は、全ての操作系列を対象とするまで（ステップＳ７０１、Ｎｏ）、対象の操作系列を決定する（ステップＳ７０２）。

　ここで、分類済みの操作系列がなければ（ステップＳ７０３、Ｎｏ）、分類装置１０は、対象の操作系列を新しいクラスに分類する（ステップＳ７０７）。

　分類済みの操作系列がある場合は（ステップＳ７０３、Ｙｅｓ）、分類装置１０は、対象の操作系列と各クラス内の操作系列との共通操作種類数を算出する（ステップＳ７０４）。

　そして、分類装置１０は、共通操作種類数が閾値以上、かつ、共通操作種類数が最も多いクラスがある場合（ステップＳ７０５、Ｙｅｓ）、対象の操作系列を条件を満たすクラスに分類する（ステップＳ７０６）。

　分類装置１０は、共通操作種類数が閾値以上、かつ、共通操作種類数が最も多いクラスがない場合（ステップＳ７０５、Ｎｏ）、対象の操作系列を条件を新しいクラスに分類する（ステップＳ７０７）。

　分類装置１０は、全ての操作系列を対象とし終わった場合（ステップＳ７０１、Ｙｅｓ）、操作系列を分割する処理を終了する。

［実施形態の効果］
　これまで説明してきたように、実施形態の分類装置１０は、収集部１３１と、作成部１３３と、分類部１３４と、を有する。収集部１３１は、端末装置２０の操作ログを収集する。作成部１３３は、操作ログを基に、端末装置２０に対する操作間の共起頻度を表す情報を作成する。分類部１３４は、共起頻度を表す情報と類似度を表す情報とを用いて、端末装置２０に対する操作をクラスに分類する。作成部１３３は、操作ログに含まれる項目又は操作位置を基に類似度を表す情報を作成することができる。

　このように、分類装置１０は、操作間の類似度を考慮して作業の分類を行うことができる。その結果、より業務の実態に近い形で作業を分類することができるようになる。

　また、作成部１３３は、端末装置２０に対する操作の数と同数の行と列を持ち、操作間の共起頻度を要素とする共起行列、及び操作の数と同数の行と列を持ち、操作間の類似度を要素とする類似行列を作成する。分類部１３４は、共起行列と類似行列とを用いて、端末装置２０に対する操作をクラスに分類する。例えば、分類部１３４は、共起行列に、共起行列と類似行列との積を加えた類似共起行列を用いて、端末装置２０に対する操作をクラスに分類する。

　これにより、操作間の共起頻度と類似度の両方を考慮した分類を行うことが可能になる。

　また、分類部１３４は、類似共起行列の各行を操作ベクトルとして取得し、操作ログに基づく操作の系列に分割点を定め、系列における分割点の前後の複数の操作の操作ベクトルの重心間の類似度の変化を基に、分割点で分割した操作の集合をクラスに分類する。

　これにより、操作間の類似度を操作系列の分割にも反映させることができる。

［実施形態のシステム構成について］
　図１に示した分類装置１０の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、分類装置１０の機能の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。

　また、分類装置１０において行われる各処理は、全部又は任意の一部が、ＣＰＵ及びＣＰＵにより解析実行されるプログラムにて実現されてもよい。また、分類装置１０において行われる各処理は、ワイヤードロジックによるハードウェアとして実現されてもよい。

　また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともできる。もしくは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上述及び図示の処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて適宜変更することができる。

［プログラム］
　図１７は、分類プログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、ＯＳ（Operating　System）１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、分類装置１０の各処理を規定するプログラムは、コンピュータ１０００により実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、分類装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid　State　Drive）により代替されてもよい。

　また、上述した実施の形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　以上、本発明者によってなされた発明を適用した実施の形態について説明したが、本実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等はすべて本発明の範疇に含まれる。

　１０　分類装置
　１１　通信部
　１２　記憶部
　１３　制御部
　２０　端末装置
　１２１　操作ログ記憶部
　１２２　類似度記憶部
　１３１　収集部
　１３２　特定部
　１３３　作成部
　１３４　分類部

Claims

　情報処理装置の操作ログを収集する収集部と、
　前記操作ログを基に、前記情報処理装置に対する操作間の共起頻度を表す情報を作成する作成部と、
　前記共起頻度を表す情報と前記操作間の類似度を表す情報とを用いて、前記情報処理装置に対する操作をクラスに分類する分類部と、
　を有することを特徴とする分類装置。
　前記作成部は、前記情報処理装置に対する操作の数と同数の行と列を持ち、前記操作間の共起頻度を成分とする共起行列、及び前記操作の数と同数の行と列を持ち、前記操作間の類似度を成分とする類似行列を作成し、
　前記分類部は、前記共起行列と前記類似行列とを用いて、前記情報処理装置に対する操作をクラスに分類することを特徴とする請求項１に記載の分類装置。
　前記分類部は、前記共起行列に、前記共起行列と前記類似行列との積を加えた類似共起行列を用いて、前記情報処理装置に対する操作をクラスに分類することを特徴とする請求項２に記載の分類装置。
　前記分類部は、前記類似共起行列の各行を操作ベクトルとして取得し、前記操作ログに基づく操作の系列に分割点を定め、前記系列における前記分割点の前後の複数の操作の前記操作ベクトルの重心間の類似度の変化を基に、前記分割点で分割した操作の集合をクラスに分類することを特徴とする請求項３に記載の分類装置。
　前記作成部は、前記操作ログに含まれる項目又は操作位置を基に前記類似度を表す情報を作成することを特徴とする請求項１に記載の分類装置。
　分類装置によって実行される分類方法であって、
　情報処理装置の操作ログを収集する収集工程と、
　前記操作ログを基に、前記情報処理装置に対する操作間の共起頻度を表す情報を作成する作成工程と、
　前記共起頻度を表す情報と前記操作間の類似度を表す情報とを用いて、前記情報処理装置に対する操作をクラスに分類する分類工程と、
　を含むことを特徴とする分類方法。
　情報処理装置の操作ログを収集する収集ステップと、
　前記操作ログを基に、前記情報処理装置に対する操作間の共起頻度を表す情報を作成する作成ステップと、
　前記共起頻度を表す情報と前記操作間の類似度を表す情報とを用いて、前記情報処理装置に対する操作をクラスに分類する分類ステップと、
　をコンピュータに実行させることを特徴とする分類プログラム。