JPWO2014109040A1

JPWO2014109040A1 - 制御方法、制御プログラム、および制御装置

Info

Publication number: JPWO2014109040A1
Application number: JP2014556274A
Authority: JP
Inventors: 博信山崎
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-01-10
Filing date: 2013-01-10
Publication date: 2017-01-19
Anticipated expiration: 2033-01-10
Also published as: TWI533145B; WO2014109040A1; JP6274114B2; US20150293951A1; TW201435613A; CN104903957A

Abstract

制御装置（１０１）は、所定データが有する各種の特徴量のうちの所定種類の特徴量（Ｘ，Ｙ）に応じて所定データを複数のクラスタ（ａ〜ｃ）のいずれかに分類する分類装置（１０２）を制御する。制御装置（１０１）は、複数のクラスタ（ａ〜ｃ）の各々について、分類装置（１０２）によって分類された所定データにおける特徴量の分布位置を示す情報に基づいて、複数のクラスタ（ａ〜ｃ）の間の特徴量の分布位置間の近さを示す情報を導出し、導出した近さを示す情報が所定条件を満たしたか否かを判定する。制御装置（１０１）は、所定条件を満たしたと判定した場合、所定データと同種のデータを、各種の特徴量のうちの所定種類と異なる種類を追加した種類の特徴量（Ｘ，Ｙ，Ｚ）に応じて複数のクラスタ（ａ〜ｃ）のいずれかに分類装置（１０２）によって分類させる制御を行う。

Description

本発明は、制御方法、制御プログラム、および制御装置に関する。

対象ユーザ端末から他のユーザ端末へ画像を配布する際に、ネットワークへの負荷を軽減するために、対象ユーザ端末は画像データから特徴量を計算して他のユーザ端末へ送信する技術が知られている（たとえば、下記特許文献１参照）。また、特徴量に応じて各データがグループ化される技術が知られている。

また、携帯電話機での処理負荷を軽減するため、携帯電話機に代わりプロキシサーバが、携帯電話機からのコンテンツの閲覧リクエストに応じてコンテンツサーバから取得したコンテンツを解析する技術が知られている（たとえば、下記特許文献２参照）。

特開２００４−４６６４１号公報特開２００５−５６０９６号公報

しかしながら、各データが有する特徴量に応じて各データがグループ化される際に、特徴量の種類によっては分類精度が低下する問題点がある。

１つの側面では、本発明は、分類精度の向上を図ることができる制御方法、制御プログラム、および制御装置を提供することを目的とする。

本発明の一の側面によれば、所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる処理を実行する制御方法、制御プログラム、および制御装置が提案される。

本発明の一の側面によれば、分類精度の向上を図ることができる。

図１は、特徴量の種類を増やす例を示す説明図である。図２は、特徴量の種類を減らす例を示す説明図である。図３は、実施の形態にかかる制御装置と分類装置の各々のハードウェア構成例を示すブロック図である。図４は、各クラスタについての複数の種類の各々の特徴量を記憶するデータベースを示す説明図である。図５は、分類装置の機能的構成を示すブロック図である。図６は、クラスタ分析部によるクラスタリングを示す説明図である。図７は、制御装置の機能的構成を示すブロック図である。図８は、分類装置によるクラスタリング処理手順の一例を示すフローチャートである。図９は、制御装置による制御処理手順の一例を示すフローチャートである。図１０は、制御装置による詳細な制御処理手順の一の例を示すフローチャートである。図１１は、制御装置による詳細な制御処理手順の他の例を示すフローチャートである。

以下に添付図面を参照して、本発明にかかる制御方法、制御プログラム、および制御装置の実施の形態を詳細に説明する。

図１は、特徴量の種類を増やす例を示す説明図である。図１のクラスタリングを行うシステム１００は、制御装置１０１と、分類装置１０２と、を有する。図１の例では、各データが有する特徴量Ｘおよび特徴量Ｙによって各データが３つのグループに分類されている。グラフ１１１では、各データの特徴量Ｘと特徴量Ｙとの組み合わせの分布位置を示す。ここでのグループは、クラスタと称し、分類することをクラスタリングと称する。クラスタリングの利用例は、たとえば、録音された会議の音声データの各データに出席者をラベリングするためのクラスタリングが挙げられる。たとえば、データとしては、録音された音声データなどが挙げられ、クラスタとしては、音声データに録音されている会議の出席者が挙げられる。

制御装置１０１は、所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて所定データを複数のクラスタのいずれかにクラスタリングするコンピュータである分類装置１０２を制御するコンピュータである。所定データは上述したように音声データなどが挙げられる。制御装置１０１は、たとえば、サーバである。分類装置１０２は、たとえば、携帯端末装置である。たとえば、ディジタル化された音声データからは、ＭＦＣＣ（Ｍｅｌ−ＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒａｌＣｏｅｆｆｉｃｉｅｎｔ）、ピッチ、ＧＰＲ（ＧｌｏｔｔａｌＰｕｌｓｅＲａｔｅ）、ＶＴＬ（ＶｏｃａｌＴｒａｃｔＬｅｎｇｔｈ）などの複数の種類の特徴量が得られる。分類装置１０２は、複数の種類の特徴量のいずれも計算可能であって、制御装置１０１からの指示によって複数の種類のうちいずれの種類を計算するかを変更可能とする。複数の種類のうちの所定種類については、分類装置１０２が計算可能な特徴量の種類のうち、任意またはユーザによって指定、または過去に制御装置１０１によって指示された種類である。図１の例では、所定種類は１以上の種類である。

制御装置１０１は、複数のクラスタの各々について、所定データにおける特徴量の分布位置を示す情報を記憶部に書き込む。ここでは、当該情報は、分類装置１０２によって分類された所定データにおける特徴量の分布位置を示す情報である。特徴量の分布位置を示す情報については、分類装置１０２から受信してもよいし、制御装置１０１がアクセス可能な記憶装置から読み出してもよいし、入力手段によって制御装置１０１のユーザから入力されてもよい。ここでは、制御装置１０１は、分類装置１０２から送信された分布位置に関する情報を受信することとする。また、記憶部は、ＲＡＭやディスクなどの制御装置１０１が有する記憶装置である。各クラスタについての特徴量の分布位置を示す情報は、たとえば、各クラスタに分類されたデータの特徴量そのものであってもよいし、特徴量がモデル化されることによって得られる各クラスタについての特徴量の分布範囲を示す情報であってもよい。

図１の例では、各グラフ１１１，１１２上に示す三角形、正方形、ダイヤ型の形の各点は正規化された特徴量の分布位置に関する情報を示している。グラフ１１１上に示す各輪が正規化された特徴量によってモデル化されることにより得られる各クラスタについての分布範囲ａｒ１１，ａｒ１２，ａｒ１３を示す情報である。グラフ１１２上にも同様に、符号を付していないが、クラスタについての分布範囲を示す情報がある。具体的に分布範囲ａｒ１１，ａｒ１２，ａｒ１３を示す情報は、中心位置と、楕円の直径の長さと、などを有していればよい。特徴量の分布位置に関する情報は、複数の情報の集合であってもよいし、各クラスタについての特徴量の分布範囲ａｒ１１，ａｒ１２，ａｒ１３を示す情報のように１つの情報であってもよい。

特徴量の分布位置に関する情報は、正規化されているため、図１に示す各グラフ１１１，１１２の軸の単位は同一となっており、制御装置１０１は、異なる種類の特徴量であっても、位置や長さを比較することができる。正規化については、分類装置１０２が行ってもよいし、制御装置１０１が行ってもよい。各特徴量が正規化された値を分類装置１０２がクラスタリング時にモデル化することにより、分類装置１０２から制御装置１０１への通信量を低減させることができる。

つぎに、制御装置１０１は、記憶部に書き込んだ特徴量の分布位置を示す情報に基づいて、複数のクラスタの間の特徴量の分布位置の近さを示す情報を導出する。図１の例では、近さを示す情報は、分布範囲ａｒ１１，ａｒ１２，ａｒ１３の重複度合いを示す情報である。より具体的に、各分布範囲ａｒ１１，ａｒ１２，ａｒ１３の中心間を結ぶ線分のうち重複する領域に含まれる線分の長さである。上述したように、分布範囲ａｒ１１，ａｒ１２，ａｒ１３を示す情報は、正規化されているため、異なる種類の特徴量であっても比較することができる。図１の例では、クラスタａとクラスタｂとの近さを示す情報は長さｄ１であるが、クラスタａとクラスタｃとの近さを示す情報は０であり、クラスタｂとクラスタｃとの近さを示す情報は０である。

または、たとえば、近さを示す情報は、複数のクラスタの各々についての特徴量の平均値や中央値間の分布位置の距離であってもよい。または、たとえば、近さを示す情報は、複数のクラスタの各々についての特徴量のうちの分布位置が最も近い特徴量の分布位置間の距離であってもよいし、最も遠い特徴量の分布位置間の距離であってもよい。

制御装置１０１は、導出された近さを示す情報が所定条件を満たしたか否かを判定する。たとえば、所定条件とは、所定の近さよりも近いことである。所定の近さは、制御装置１０１の設計者によって設定される。図１の例では、たとえば、制御装置１０１は、クラスタａとクラスタｂとの近さを示す情報であるｄ１が閾値以上であるか否かを判定する。閾値は、制御装置１０１の設計者によって設定されてもよいし、入力手段を介してユーザによって入力された値であってもよい。また、閾値は、制御装置１０１がアクセス可能な記憶装置に記憶されていることとする。

制御装置１０１は、所定条件を満たしたと判定した場合、所定データと同種のデータを、各種の特徴量のうちの所定種類と異なる種類の特徴量に応じて複数のクラスタのいずれかに分類装置１０２によってクラスタリングさせる制御を行う。所定データと同種のデータとは、所定データと同種の特徴量を有するデータであり、所定データと同種のデータは同一データであってもよいし、異なるデータであってもよい。各種の特徴量のうちの所定種類と異なる種類から、いずれの種類が選択されるかについては、後述する。たとえば、制御装置１０１は、分類装置１０２に対して、異なる種類によって分類させることを示す情報を送信することにより、分類装置１０２を制御してもよい。これにより、特徴量の種類が変更され、分類精度の向上を図ることができる。

また、制御装置１０１は、所定条件を満たしたと判定した場合、所定データと同種のデータを、所定種類に異なる種類を追加した種類の特徴量に応じて分類装置１０２によって複数のクラスタのいずれかに分類装置１０２によってクラスタリングさせる制御を行う。グラフ１１２では、特徴量Ｚが追加されたため、グラフ１１１よりも軸が一つ増えている。これにより、特徴量の種類が追加され、分類精度の向上を図ることができる。

図２は、特徴量の種類を減らす例を示す説明図である。制御装置２００は、所定データが有する複数の種類の特徴量に応じて所定データを複数のクラスタのいずれかにクラスタリング可能な分類装置１０２を制御するコンピュータである。

制御装置２００は、複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を記憶部に書き込む。データは、図１で示した例と同一であってもよい。グラフ２１１では、各データの特徴量Ｘと特徴量Ｙとの組み合わせの分布位置を示す。図２の例では、分布位置を示す情報についても図１で説明した例と同様に、グラフ２１１に示すように分布範囲ａｒ２１，ａｒ２２，ａｒ２３を示す情報が取得されてもよい。制御装置２００は、書き込んだ複数の種類の特徴量の分布位置を示す情報に基づいて、複数の種類の各組み合わせについて、組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する。具体的には、制御装置２００は、複数の種類の各組み合わせについて相関係数を算出する。相関係数は、１または−１に近い値であるほど２つの組み合わせの値の相関が強いことを示し、０に近い値であるほど２つの組み合わせの値の相関が弱いことを示す。

制御装置２００は、複数の種類の各組み合わせのうち、算出した情報が示す相関の強さが所定の強さ以上である組み合わせを特定する。所定の強さについては、予め制御装置２００の設計者や制御装置２００のユーザによって設定されることとする。相関の強さを示す情報が相関係数の場合、制御装置２００は、複数の種類の各組み合わせのうち、算出された相関係数の絶対値が所定値以上である組み合わせを特定する。図２に示す特徴量Ｘと特徴量Ｙとについての相関係数が閾値以上であるとする。

制御装置２００は、複数の種類から、特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。これにより、分類精度を維持しつつ、最小限の種類の特徴量によって分類を行わせることができる。

また、制御装置２００は、特定された組み合わせに含まれる各種類のうち、特定された組み合わせに含まれる種類の特徴量のばらつき度合いが大きい方の種類を特定する。図２の例では、制御装置２００は、各種類方向に対して各分布範囲の長さを計測する。制御装置２００は、種類ごとに計測した長さの合計値を算出する。図２の例では、特徴量Ｘについてのばらつき度合いは、ｄｘ２１とｄｘ２２とｄｘ２３との合計値であり、特徴量Ｙについてのばらつき度合いは、ｄｙ２１とｄｙ２２とｄｙ２３との合計値である。ここでは、算出した合計値をばらつき度合いとし、制御装置２００は、合計値が大きい方の種類をばらつき度合いが大きい方の種類として特定する。図２の例では、縦方向の種類である特徴量Ｙの合計値の方が横方向の種類である特徴量Ｘの合計値よりも大きいため、制御装置２００は、特徴量Ｙを特定する。

そして、制御装置２００は、複数の種類から、特定された種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行ってもよい。図２の例では、制御装置２００は、特徴量Ｘに応じて所定データを複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。グラフ２１２では、特徴量Ｘだけで分類された例を示している。これにより、ばらつきが小さい方の種類の特徴量の方が、ばらつきが大きい方の種類の特徴量よりも分類精度が高いため、最小限の種類の特徴量であり、分類精度が高い種類の特徴量によって分類を行わせることができる。

（制御装置のハードウェア構成例）
図３は、実施の形態にかかる制御装置と分類装置の各々のハードウェア構成例を示すブロック図である。システム１００は、制御装置３００と、分類装置１０２と、を有する。ここでは、制御装置３００は、図１にて説明した制御装置１０１と、図２にて説明した制御装置２００と、のいずれの機能も有するコンピュータである。図３において、制御装置３００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１と、記憶装置３０２と、ネットワークＩ／Ｆ（ＩｎｔｅｒＦａｃｅ）３０３と、を有する。また、各部はバス３０４によってそれぞれ接続されている。

ここで、ＣＰＵ３０１は、制御装置３００の全体の制御を司る。ＣＰＵ３０１は、記憶装置３０２に記憶されている各種プログラムを実行することにより、記憶装置３０２内のデータを読み出したり、実行結果となるデータを記憶装置３０２に書き込んだりする。

記憶装置３０２は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、フラッシュメモリ、磁気ディスクドライブなどの記憶部である。ＣＰＵ３０１のワークエリアになったり、各種プログラムや各種データを記憶したりする。

ネットワークＩ／Ｆ３０３は、通信回線を通じてＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどのネットワークＮＥＴに接続され、このネットワークＮＥＴを介して分類装置１０２に接続される。そして、ネットワークＩ／Ｆ３０３は、ネットワークＮＥＴと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワークＩ／Ｆ３０３には、たとえばモデムやＬＡＮアダプタなどを採用することができる。

また、分類装置１０２は、ＣＰＵ３１１と、記憶装置３１２と、ネットワークＩ／Ｆ３１３と、入力装置３１４と、出力装置３１５と、センサー３１６と、を有する。また、各部はバス３１７によってそれぞれ接続されている。

ここで、ＣＰＵ３１１は、分類装置１０２の全体の制御を司る。ＣＰＵ３１１は、記憶装置３１２に記憶されている各種プログラムを実行することにより、記憶装置３１２内のデータを読み出したり、実行結果となるデータを記憶装置３１２に書き込んだりする。

記憶装置３１２は、ＲＯＭ、ＲＡＭ、フラッシュメモリ、磁気ディスクドライブなどが挙げられる。ＣＰＵ３１１のワークエリアになったり、各種プログラムや各種データを記憶したりする。

ネットワークＩ／Ｆ３１３は、通信回線を通じてＬＡＮ、ＷＡＮ、インターネットなどのネットワークＮＥＴに接続され、このネットワークＮＥＴを介して制御装置３００に接続される。そして、ネットワークＩ／Ｆ３１３は、ネットワークＮＥＴと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワークＩ／Ｆ３１３には、たとえばモデムやＬＡＮアダプタなどを採用することができる。

入力装置３１４は、キーボード、マウス、タッチパネルなどユーザの操作により、各種データの入力を行うインターフェースである。また、入力装置３１４は、カメラから画像や動画を取り込むこともできる。

出力装置３１５は、ＣＰＵ３１１の指示により、データを出力するインターフェースである。出力装置３１５には、ディスプレイやプリンタが挙げられる。

センサー３１６は、たとえば、分類装置１０２が設置された設置箇所における所定の変位量を検出する。たとえば、センサー３１６は、音声を検出したり、温度を検出したりできる。

図４は、各クラスタについての複数の種類の各々の特徴量を記憶するデータベースを示す説明図である。ここでは、クラスタを会議の出席者候補としている。データベース４００は、出席者候補、および複数種類の特徴量の分布位置のフィールドを有している。各フィールドに情報が設定されることにより、レコード（たとえば、４０１−１，４０１−２〜）が記憶される。データベース４００は、記憶装置によって実現される。

たとえば、出席者候補のフィールドには、会議の出席者の候補を示す識別情報が登録されている。たとえば、特徴量の分布位置のフィールドには、各出席者候補についての音声に関する特徴量の分布位置に関する情報が登録されている。各音声に関する特徴量の分布位置に関する情報は、たとえば、特徴量が正規化されてデータベース４００に登録されていることとし、異なる種類の特徴量であっても、制御装置３００によって比較可能とする。

また、たとえば、各種類について、複数の分布位置に関する情報がデータベース４００に記憶されていてもよい。または、たとえば、各出席者候補についての各種類の特徴量の分布位置の最小値、および最大値を記憶しておいてもよいし、複数の特徴量の分布位置がモデル化された分布範囲を記憶しておいてもよい。

（分類装置１０２の機能的構成例）
図５は、分類装置の機能的構成を示すブロック図である。分類装置１０２は、受信部５０１と、選択指示部５０２と、センサー部５０３と、特徴量計算部５０４と、クラスタ分析部５０５と、特徴量記憶部５０６と、クラスタモデル化部５０７と、送信部５０８と、を有する。送信部５０８と受信部５０１とは、ネットワークＩ／Ｆ３１３によって実現される。

選択指示部５０２からクラスタ分析部５０５と、クラスタモデル化部５０７とは、論理積回路であるＡＮＤ、否定論理回路であるＩＮＶＥＲＴＥＲ、論理和回路であるＯＲや、ラッチ回路であるＦＦ（ＦｌｉｐＦｌｏｐ）などの素子によって形成されてもよい。または、選択指示部５０２と、センサー部５０３と、特徴量計算部５０４と、クラスタ分析部５０５と、クラスタモデル化部５０７との処理は、たとえば、ＣＰＵ３１１がアクセス可能な記憶装置３１２に記憶された分類プログラムにコーディングされている。そして、ＣＰＵ３１１が記憶装置３１２から分類プログラムを読み出して、分類プログラムにコーディングされている処理を実行する。これにより、選択指示部５０２と、センサー部５０３と、特徴量計算部５０４と、クラスタ分析部５０５と、クラスタモデル化部５０７と、の処理が、実現されてもよい。

センサー部５０３は、制御装置３００における変位量を検出可能である。たとえば、図１で説明したように、変位量としては、音声が挙げられる。たとえば、センサー部５０３は、音声を検出する。センサー部５０３は、たとえば、第１〜第ｍセンサー部５０３−１〜５０３−ｍのように複数のセンサー部５０３を設け、複数のセンサー部５０３によって音声を検出してもよい。複数のセンサー部５０３−１〜５０３−ｍのうちいずれのセンサー部５０３が動作するかについては、選択指示部５０２によって選択されることとする。

特徴量計算部５０４は、センサー部５０３によって検出されたデータから得られる複数の種類の特徴量を計算可能である。たとえば、特徴量計算部５０４は、複数の種類の各々を計算可能であって、ｎ種類の特徴量の各々を第１〜第ｎ特徴量計算部５０４−１〜５０４−ｎのそれぞれによって算出する。第１〜第ｎ特徴量計算部５０４−１〜５０４−ｎのうちいずれの特徴量計算部５０４が選択されるかについては、選択指示部５０２によって指示されることとする。

クラスタ分析部５０５は、特徴量計算部５０４によって算出された特徴量に応じてクラスタリングを行う。

図６は、クラスタ分析部によるクラスタリングを示す説明図である。グラフ６００では、各データから得られる特徴量Ｘと特徴量Ｙとの組み合わせの分布位置によっていずれのクラスタにクラスタリングされるかを示している。たとえば、クラスタごとに各種類の特徴量についての閾値が予め定義されており、クラスタ分析部５０５は、特徴量計算部５０４によって算出された特徴量を各閾値以下であるか否かなどを判定することによって、クラスタリングを行う。図６のグラフ６００内に記載された斜めの線ｌ１，ｌ２が閾値を示している。たとえば、制御装置３００は、グラフ６００上において、各データが有する特徴量Ｘと特徴量Ｙとの組み合わせがクラスタａ〜ｄのいずれのエリアに含まれるかによってクラスタリングを行う。

特徴量記憶部５０６は、特徴量計算部５０４によって計算された一定時間分の特徴量を記憶する。一定時間については、分類装置１０２の設計者によって設定されることとする。特徴量記憶部５０６は、記憶装置３１２によって実現される。

受信部５０１は、複数の種類のうちいずれの種類の特徴量に応じてクラスタリングを行うかに関する情報を制御装置３００から受信する。また、受信部５０１は、クラスタ分析部５０５によってクラスタリングされる際に用いられる閾値を制御装置３００から受信してもよい。

選択指示部５０２は、受信部５０１によって受信された情報に基づいて、センサー部５０３内のいずれを実行させるかをセンサー部５０３に指示し、特徴量計算部５０４内のいずれを実行させるかを特徴量計算部５０４に指示する。さらに、選択指示部５０２は、いずれの種類の特徴量によってクラスタリングされるかをクラスタ分析部５０５に指示する。

クラスタモデル化部５０７は、一定時間、またはユーザによって指定されたタイミングごとに、特徴量記憶部５０６に記憶されている直近の一定時間分の指定された各種類の特徴量に応じてモデル化を行う。モデル化の手法としては、たとえば、ｋ−平均法が挙げられる。たとえば、クラスタモデル化部５０７は、ｋ−平均法によってモデル化することにより、クラスタごとに図１と図２に示した分布範囲を示す情報を生成する。さらに、クラスタモデル化部５０７は、分布範囲を示す情報について正規化を行っておく。

送信部５０８は、クラスタモデル化部５０７によって得られた分布範囲を示す情報を制御装置３００へ送信する。または、送信部５０８は、クラスタ分析部５０５によって得られる特徴量の分布位置を示す情報を制御装置３００へ送信してもよい。ここでは、分類装置１０２は、特徴量の分布位置を示す情報または特徴量の分布範囲を示す情報を制御装置３００へ送信しているが、制御装置３００と分類装置１０２がいずれもアクセス可能な記憶装置に記憶させるとしてもよい。

（制御装置３００の機能的構成例）
図７は、制御装置の機能的構成を示すブロック図である。制御装置３００は、取得部７０１と、第１導出部７０２と、判定部７０３と、検出部７０４と、第２導出部７０５と、抽出部７０６と、算出部７０７と、特定部７０８と、種類特定部７０９と、制御部７１０と、を有する。取得部７０１から制御部７１０の処理は、具体的には、たとえば、記憶装置３０３に記憶された制御プログラムにコーディングされている。そして、ＣＰＵ３０２が記憶装置３０３から解析プログラムを読み出して、解析プログラムにコーディングされている処理を実行することにより、取得部７０１部から制御部７１０の処理が、実現される。または、ＣＰＵ３０２が、ネットワークＩ／Ｆ３０３を介してネットワークＮＥＴから解析プログラムを取得してもよい。図１で説明したように、グループについては、クラスタと称する。

取得部７０１は、複数のクラスタの各々について、分類装置１０２によって分類された所定データにおける特徴量の分布位置を示す情報を取得して記憶部に記憶する。図１を用いて説明したように、特徴量の分布位置を示す情報は、特徴量が正規化された値であってもよいし、特徴量の分布範囲を示す情報であってもよい。具体的に、取得部７０１は、図７に示すように受信部７１１によって分類装置１０２から受信してもよいし、制御装置３００がアクセス可能な記憶装置から、分類装置１０２から得られる特徴量の分布位置を示す情報を取得してもよい。または、制御装置３００に入力手段が設けられていれば、入力手段を介して分類装置１０２から得られる特徴量の分布位置を示す情報の入力を受け付けてもよい。

第１導出部７０２は、取得部７０１によって取得された特徴量の分布位置を示す情報に基づいて、複数のクラスタの間の特徴量の分布位置の近さを示す情報を導出する。図１を用いて説明したように、たとえば、特徴量の分布位置の近さを示す情報は、分布範囲の重複度合いを示す情報であってもよいし、最も近い分布位置間の距離、平均の分布位置間の距離であってもよい。

判定部７０３は、第１導出部７０２によって導出された近さを示す情報が所定条件を満たしたか否かを判定する。制御部７１０は、判定部７０３によって所定条件を満たしたと判定された場合、所定データと同種のデータを、各種の特徴量のうちの所定種類と異なる種類の特徴量に応じて複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。具体的には、制御部７１０は、いずれの種類の特徴量に応じてクラスタリングさせるかを示す情報を分類装置１０２へ送信することにより、分類装置１０２を遠隔制御する。

また、制御部７１０は、判定部７０３によって所定条件を満たしたと判定された場合、同種のデータを、所定種類と異なる種類との特徴量に応じて複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。

また、検出部７０４は、データベース４００から、判定部７０３によって近さを示す情報が所定条件を満たしたと判定されたクラスタの組み合わせについて、異なる種類の各々の特徴量の分布位置を検出する。図１で用いた例では、クラスタａとクラスタｂとの組み合わせについての近さを示す情報が判定部７０３によって所定条件を満たしたと判定され、所定種類は、特徴量Ｘと特徴量Ｙである。具体的には、検出部７０４は、データベース４００から、クラスタａとクラスタｂとの各々について、特徴量Ｘと特徴量Ｙ以外の種類の特徴量の分布位置を検出する。

第２導出部７０５は、特定された組み合わせについて、検出部７０４によって検出された特徴量の分布位置の近さを示す情報を導出する。具体的には、第２導出部７０５は、特徴量Ｘと特徴量Ｙ以外の種類の各々について、クラスタａとクラスタｂとの間の検出された分布位置の距離を算出する。たとえば、データベース４００に記憶されている分布位置に関する情報が特徴量の分布範囲に関する情報である場合、クラスタａとクラスタｂとの間の検出された分布位置の距離は、分布範囲のうちの最も近い位置同士の距離であってもよい。この最も近い位置同士の距離が各種類における分類装置１０２によるクラスタリング能力の限界となる。

または、データベース４００に記憶されている分布位置に関する情報が特徴量の分布範囲に関する情報である場合、クラスタａとクラスタｂとの間の検出された分布位置の距離は、分布範囲のうちの最も離れた位置同士の距離であってもよい。または、たとえば、データベース４００に記憶されている分布位置に関する情報が複数の特徴量の場合、クラスタａとクラスタｂとの間の検出された分布位置の距離は、特徴量の分布位置の間の距離のうち最も遠い距離である。

抽出部７０６は、異なる種類のうち、第２導出部７０５によって導出された近さを示す情報が所定条件を満たす種類を抽出する。たとえば、導出された近さを示す情報が上述した最も近い位置同士の距離の場合、所定条件は、算出された距離が最も大きいこととしてもよいし、算出された距離が大きい順に所定番目以内としてもよい。最も近い位置同士の距離が遠い種類ほど、クラスタａとクラスタｂとの分類精度が高い。図１の例では、特徴量Ｚが抽出される。

制御部７１０では、判定部７０３によって所定条件を満たしたと判定された場合、同種のデータを、抽出部７０６によって抽出された種類の特徴量に応じて分類装置１０２によって複数のクラスタのいずれかに分類させる制御を行う。図１の例では、制御部７１０は、同種のデータを、所定種類の特徴量Ｘと特徴量Ｙに加えて特徴量Ｚに応じて分類装置１０２によって複数のクラスタのいずれかに分類させる制御を行う。これにより、複数の種類のうち、分類精度が向上すると推定される種類の特徴量によってクラスタリングが行われ、分類精度の向上を図ることができる。

つぎに、図２に示した例について各機能ブロックを用いて説明する。算出部７０７は、取得部７０１によって取得された複数の種類の特徴量の分布位置を示す情報に基づいて、複数の種類の各組み合わせについて、組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する。図２を用いて説明したように、相関の強さを示す情報は、たとえば、相関係数である。

特定部７０８は、複数の種類の各組み合わせのうち、算出部７０７によって算出された情報が示す相関の強さが所定の強さ以上である組み合わせを特定する。たとえば、特定部７０８は、相関係数の絶対値が閾値以上である組み合わせを、相関の強さを示す情報が所定の強さ以上である組み合わせとして特定する。所定の強さについては、たとえば、ユーザによって指示された強さであり、予め記憶装置３０２に記憶されてある。

制御部７１０は、複数の種類から、特定部７０８によって特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。

また、種類特定部７０９は、特定部７０８によって特定された組み合わせに含まれる各種類のうち、特定された組み合わせに含まれる種類の特徴量のばらつき度合いが大きい方の種類を特定する。図２を用いて説明したように、ばらつき度合いは、各種類方向に対して各分布範囲の長さを、種類ごとに合計した合計値である。種類特定部７０９は、合計値が大きい方の種類をばらつき度合いが大きい方の種類として特定する。

そして、制御部７１０は、複数の種類から、種類特定部７０９によって特定された種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置１０２によって分類させる制御を行う。具体的には、制御部７１０は、いずれの種類の特徴量に応じてクラスタリングさせるかを示す情報を送信部７１２によって分類装置１０２へ送信することにより、分類装置１０２を遠隔制御してもよい。

（分類装置１０２によるクラスタリング処理手順）
図８は、分類装置によるクラスタリング処理手順の一例を示すフローチャートである。分類装置１０２は、種類、閾値の変更を示す情報を受信したか否かを判断する（ステップＳ８０１）。分類装置１０２は、種類、閾値の変更を示す情報を受信した場合（ステップＳ８０１：Ｙｅｓ）、各部へ種類の変更や閾値の変更を指示し（ステップＳ８０２）、センサーサンプリングを行う（ステップＳ８０３）。分類装置１０２は、種類、閾値の変更を示す情報を受信していない場合（ステップＳ８０１：Ｎｏ）、ステップＳ８０３へ移行する。

分類装置１０２は、センサーサンプリングによる検出結果に基づいて、特徴量を計算し（ステップＳ８０４）、計算した特徴量に応じてクラスタ分析を行いつつ（ステップＳ８０５）、計算した特徴量を記憶装置に記憶する（ステップＳ８０６）。ステップＳ８０５、ステップＳ８０６のつぎに、分類装置１０２は、以前クラスタモデル化を行った時から一定時間経過したか否かを判断する（ステップＳ８０７）。

分類装置１０２は、一定時間経過したと判断した場合（ステップＳ８０７：Ｙｅｓ）、クラスタモデル化を行い（ステップＳ８０８）、モデル化結果を制御装置３００へ送信し（ステップＳ８０９）、ステップＳ８０１へ戻る。モデル化結果は、上述したクラスタごとの特徴量の分布範囲を示す情報である。分類装置１０２は、一定時間経過していないと判断した場合（ステップＳ８０７：Ｎｏ）、ステップＳ８０１へ戻る。

（制御装置３００による制御処理手順）
図９は、制御装置による制御処理手順の一例を示すフローチャートである。制御装置３００は、モデル化結果を分類装置１０２から受信する（ステップＳ９０１）。モデル化結果は、上述したようにクラスタごとの特徴量の分布範囲を示す情報である。制御装置３００は、分離度を測定しつつ（ステップＳ９０２）、モデル化結果に基づいて出席者候補から出席者を確定する（ステップＳ９０３）。

制御装置３００は、確定した出席者と、測定した分離度に基づいて、特徴量の種類を決定し（ステップＳ９０４）、クラスタリングを行う際の閾値を決定する（ステップＳ９０５）。そして、制御装置３００は、決定結果を分類装置１０２へ送信し（ステップＳ９０６）、一連の処理を終了する。ステップＳ９０３、ステップＳ９０４についての詳細について、図１０、図１１を用いて説明する。

図１０は、制御装置による詳細な制御処理手順の一の例を示すフローチャートである。制御装置３００は、クラスタごとの各種類の特徴量の分布位置に関する情報を取得して記憶部に記憶する（ステップＳ１００１）。記憶部は、たとえば、記憶装置３０２である。制御装置３００は、複数の種類の各組み合わせのうち、未選択の組み合わせがあるか否かを判断する（ステップＳ１００２）。ここでの複数の種類は、取得された分布位置に関する情報をクラスタリング時の特徴量の種類である。

未選択の組み合わせがある場合（ステップＳ１００２：Ｙｅｓ）、制御装置３００は、未選択の組み合わせから１つの組み合わせを選択する（ステップＳ１００３）。制御装置３００は、選択された組み合わせの相関係数ｃを算出し（ステップＳ１００４）、｜ｃ｜＜閾値であるか否かを判断する（ステップＳ１００５）。

｜ｃ｜＜閾値でない場合（ステップＳ１００５：Ｎｏ）、制御装置３００は、選択された組み合わせを冗長な種類を含む組み合わせとして特定し（ステップＳ１００６）、ステップＳ１００２へ戻る。｜ｃ｜＜閾値である場合（ステップＳ１００５：Ｙｅｓ）、ステップＳ１００２へ戻る。

一方、ステップＳ１００２において、未選択の組み合わせがない場合（ステップＳ１００２：Ｎｏ）、特定した冗長な種類を含む組み合わせのうち、未選択の組み合わせがあるか否かを判断する（ステップＳ１００７）。未選択の組み合わせがある場合（ステップＳ１００７：Ｙｅｓ）、制御装置３００は、未選択な冗長な種類を含む組み合わせから１つの組み合わせを選択する（ステップＳ１００８）。そして、制御装置３００は、クラスタごとの分布範囲を示す情報に基づいて、選択された組み合わせに含まれる各種類方向の長さを特定する（ステップＳ１００９）。

制御装置３００は、特定した長さを組み合わせに含まれる種類ごとに合計値を算出する（ステップＳ１０１０）。制御装置３００は、選択された組み合わせに含まれる種類のうち、合計値が大きい方の種類をばらつき度合いが大きい冗長な種類として特定し（ステップＳ１０１１）、Ｓ１００７へ戻る。そして、未選択な組み合わせがない場合（ステップＳ１００７：Ｎｏ）、制御装置３００は、複数の種類から特定した種類を除いた種類の特徴量に応じてクラスタリングさせる制御を行い（ステップＳ１０１２）、一連の処理を終了する。制御装置３００は、ステップＳ１０１２において分類装置１０２を制御しているが、分類装置１０２と制御装置３００とが同一装置である場合、単に複数の種類から特定した種類を除いた種類の特徴量に応じてクラスタリングすればよい。

図１１は、制御装置による詳細な制御処理手順の他の例を示すフローチャートである。制御装置３００は、クラスタごとの各種類の特徴量の分布位置に関する情報を取得して記憶部に記憶し（ステップＳ１１０１）、複数のクラスタの各組み合わせのうち、未選択な組み合わせがあるか否かを判断する（ステップＳ１１０２）。記憶部は、たとえば、記憶装置３０２である。複数のクラスタの各組み合わせのうち、未選択な組み合わせがある場合（ステップＳ１１０２：Ｙｅｓ）、制御装置３００は、未選択の組み合わせから１つの組み合わせを選択する（ステップＳ１１０３）。

制御装置３００は、選択された組み合わせの各クラスタの分布位置の中心間の線分を検出し（ステップＳ１１０４）、検出した線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上であるか否かを判断する（ステップＳ１１０５）。所定割合については、たとえば、ユーザによって指示された割合であって、予め記憶装置３０２に記憶されてある。検出された線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上である場合（ステップＳ１１０５：Ｙｅｓ）、ステップＳ１１０２へ戻る。検出された線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上でない場合（ステップＳ１１０５：Ｎｏ）、ステップＳ１１０６へ移行する。制御装置３００は、選択された組み合わせの各クラスタの分布位置との距離が閾値以下の分布位置であるクラスタと選択された組み合わせの各クラスタとを分析候補のクラスタとして検出する（ステップＳ１１０６）。

制御装置３００は、分析候補のクラスタの各組み合わせについて、未選択の種類の各々の特徴量をデータベースから検出する（ステップＳ１１０７）。制御装置３００は、分析候補のクラスタの各組み合わせについて、未選択の種類の特徴量についての各々の分布位置間の距離を算出する（ステップＳ１１０８）。ここで、未選択の種類とは、データが有する特徴量の複数の種類の中で分類装置１０２によって予め計算可能な複数の種類のうち、ステップＳ１１０１によって取得した分類結果において使用されていない種類を示している。

制御装置３００は、未選択の種類の特徴量ごとに算出した距離から最小距離を導出し（ステップＳ１１０９）、未選択の種類から、最小距離が最も大きい種類を抽出し（ステップＳ１１１０）、ステップＳ１１０２へ戻る。

ステップＳ１１０２において、未選択な組み合わせがない場合（ステップＳ１１０２：Ｎｏ）、制御装置３００は、抽出した種類の特徴量を追加して分類装置１０２にクラスタリングさせる制御を行い（ステップＳ１１１１）、一連の処理を終了する。制御装置３００は、ステップＳ１１１１において分類装置１０２を制御しているが、分類装置１０２と制御装置３００とが同一装置である場合、単に抽出した種類の特徴量を追加してクラスタリングすればよい。

以上説明したように、制御装置は、音声データ等の所定データを所定種類の特徴量に応じて分類装置が分類した結果を用いて、グループ間の特徴量の分布位置が近ければ、特徴量の種類を変更して以降のデータを分類装置に分類させる制御を行う。これにより、分類精度の向上を図ることができる。

また、制御装置は、グループ間の特徴量の分布位置が近ければ、特徴量の種類を増やして以降のデータを分類装置に分類させる制御を行ってもよい。これにより、分類精度の向上を図ることができる。

また、制御装置は、分布位置が近いグループ間を分類可能であると推定される種類を増やして以降のデータを分類装置に分類させる制御を行ってもよい。これにより、未選択な種類からランダムに選択された種類が追加される場合よりも、分類精度の向上を図ることができる。さらに、追加される種類を最小限に抑制することができるため、分類装置における消費電力の増大を抑制でき、分類装置が制御装置へ特徴量の分布位置を示す情報を送信する際の通信量の低減化を図ることができる。

また、分類装置が、制御装置へ特徴量の分布位置に関する情報として、特徴量の分布範囲に関する情報を送信し、制御装置は、特徴量の分布範囲に関する情報を取得する。これにより、分類装置から制御装置へのデータ送信時の通信量を低減させることができる。

また、制御装置が、グループ間の分布位置の近さを示す情報として、特徴量の分布範囲の重なり度合いを用いる。これにより、制御装置における計算量を低減させることができ、消費電力を低減させることができる。

以上説明したように、制御方法、制御プログラム、および制御装置によれば、複数種類の各組み合わせから、各データにおける複数の種類の特徴量によって相関度が強い組み合わせを特定する。そして、制御装置は、複数の種類から特定した組み合わせに含まれる一方の種類を除いた種類の特徴量に応じて分類装置によってデータを分類させる制御を行う。これにより、分類精度を維持しつつ特徴量の種類を低減させることができる。分類装置による特徴量の計算量を低減させることができるため、分類装置における消費電力を低減させることができる。また、分類装置が制御装置へ特徴量の分布位置を示す情報を送信する際の通信量の低減化を図ることができる。

また、制御装置は、複数の種類から、相関度が強い組み合わせに含まれる種類のうちの特徴量のばらつき度合いが大きい方の種類を除いた種類の特徴量に応じて分類装置によってデータを分類させる制御を行う。

なお、本実施の形態で説明した制御方法や分類方法は、予め用意された制御プログラムや分類プログラムをＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、サーバやワークステーション等のコンピュータで実行することにより実現することができる。本制御プログラムと本分類プログラムのそれぞれは、ハードディスク、ＣＤ−ＲＯＭ、ＤＶＤ、ＵＳＢメモリ等の可変型記録媒体、フラッシュメモリなどの半導体メモリ、ハードディスクドライブ等のコンピュータで読み取り可能な記録媒体に記録される。そして、コンピュータによって記録媒体から本制御プログラムと本分類プログラムが読み出されることによって実行される。また本制御プログラムや分類プログラムは、インターネット等のネットワークを介して配布してもよい。

また、本実施の形態で説明した制御装置は、スタンダードセルやストラクチャードＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）などの特定用途向けＩＣ（以下、単に「ＡＳＩＣ」と称す。）やＦＰＧＡなどのＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）によっても実現することができる。具体的には、たとえば、上述した制御装置の機能をＨＤＬ記述によって機能定義し、そのＨＤＬ記述を論理合成してＡＳＩＣやＰＬＤに与えることにより、制御装置を製造することができる。

また、本実施の形態で説明した分類装置は、スタンダードセルやＡＳＩＣやＦＰＧＡなどのＰＬＤによっても実現することができる。具体的には、たとえば、上述した分類装置の機能をＨＤＬ記述によって機能定義し、そのＨＤＬ記述を論理合成してＡＳＩＣやＰＬＤに与えることにより、分類装置を製造することができる。

また、本実施の形態では、分類装置が分類する対象のデータを音声データとしているが、これに限らない。また、本実施の形態では、クラスタの候補を会議の出席者などの人物にしているが、これに限らない。

１０１，２００，３００制御装置
１０２分類装置
４００データベース
７０１取得部
７０２第１導出部
７０３判定部
７０４検出部
７０５第２導出部
７０６抽出部
７０７算出部
７０８特定部
７０９種類特定部
７１０制御部
ａｒ１１，ａｒ１２，ａｒ１３，ａｒ２１，ａｒ２２，ａｒ２３分布範囲

上述した実施の形態に関し、さらに以下の付記を開示する。

（付記１）所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。

（付記２）前記分類して前記記憶部に記憶させる処理では、
前記所定条件を満たした場合、前記同種のデータを、前記所定種類と、前記異なる種類と、の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記１に記載の制御方法。

（付記３）前記コンピュータが、
前記複数のグループの各々についての前記各種の特徴量の分布位置を記憶する記憶装置から、前記近さを示す情報が前記所定条件を満たしたグループの組み合わせについて、前記異なる種類の各々の特徴量を検出し、
前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布位置間の近さを示す情報を算出し、
前記異なる種類のうち、算出した前記近さを示す情報が所定条件を満たす種類を抽出する
処理を実行し、
前記分類して記憶させる制御を行う処理では、
前記所定条件を満たしたと判定した場合、前記同種のデータを、抽出した種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記１または２に記載の制御方法。

（付記４）前記特徴量の分布位置を示す情報は、前記特徴量の分布範囲を示す情報であることを特徴とする付記１〜３のいずれか一つに記載の制御方法。

（付記５）前記特徴量の分布位置の近さを示す情報は、前記特徴量の分布範囲の重複度合いであることを特徴とする付記４に記載の制御方法。

（付記６）所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。

（付記７）前記分類して記憶させる制御を行う処理では、
前記複数の種類から、特定した組み合わせに含まれる各種類のうち、取得した情報が示す前記分布位置のばらつき度合いが大きい方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記６に記載の制御方法。

（付記８）所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。

（付記９）所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。

（付記１０）所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類する分類装置を制御する制御装置であって、
前記複数のグループの各々について、前記分類装置によって分類された前記所定データにおける特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を導出する導出部と、
前記導出部によって導出された前記近さを示す情報が所定条件を満たしたか否かを判定する判定部と、
前記判定部によって前記所定条件を満たしたと判定された場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。

（付記１１）所定データが有する複数の種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類可能な分類装置を制御する制御装置であって、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する算出部と、
前記複数の種類の各組み合わせのうち、前記算出部によって算出された情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定する特定部と、
前記複数の種類から、前記特定部によって特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。

Claims

所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。
前記分類して前記記憶部に記憶させる処理では、
前記所定条件を満たした場合、前記同種のデータを、前記所定種類と、前記異なる種類と、の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする請求項１に記載の制御方法。
前記コンピュータが、
前記複数のグループの各々についての前記各種の特徴量の分布位置を記憶する記憶装置から、前記近さを示す情報が前記所定条件を満たしたグループの組み合わせについて、前記異なる種類の各々の特徴量を検出し、
前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布位置間の近さを示す情報を算出し、
前記異なる種類のうち、算出した前記近さを示す情報が所定条件を満たす種類を抽出する
処理を実行し、
前記分類して記憶させる制御を行う処理では、
前記所定条件を満たしたと判定した場合、前記同種のデータを、抽出した種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする請求項１または２に記載の制御方法。
前記特徴量の分布位置を示す情報は、前記特徴量の分布範囲を示す情報であることを特徴とする請求項１〜３のいずれか一つに記載の制御方法。
前記特徴量の分布位置の近さを示す情報は、前記特徴量の分布範囲の重複度合いであることを特徴とする請求項４に記載の制御方法。
所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。
前記分類して記憶させる制御を行う処理では、
前記複数の種類から、特定した組み合わせに含まれる各種類のうち、取得した情報が示す前記分布位置のばらつき度合いが大きい方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする請求項６に記載の制御方法。
所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。
所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。
所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類する分類装置を制御する制御装置であって、
前記複数のグループの各々について、前記分類装置によって分類された前記所定データにおける特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を導出する導出部と、
前記導出部によって導出された前記近さを示す情報が所定条件を満たしたか否かを判定する判定部と、
前記判定部によって前記所定条件を満たしたと判定された場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。
所定データが有する複数の種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類可能な分類装置を制御する制御装置であって、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する算出部と、
前記複数の種類の各組み合わせのうち、前記算出部によって算出された情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定する特定部と、
前記複数の種類から、前記特定部によって特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。