JP6274114B2 - 制御方法、制御プログラム、および制御装置 - Google Patents

制御方法、制御プログラム、および制御装置

Info

Publication number
JP6274114B2
JP6274114B2 JP2014556274A JP2014556274A JP6274114B2 JP 6274114 B2 JP6274114 B2 JP 6274114B2 JP 2014556274 A JP2014556274 A JP 2014556274A JP 2014556274 A JP2014556274 A JP 2014556274A JP 6274114 B2 JP6274114 B2 JP 6274114B2
Authority
JP
Japan
Prior art keywords
predetermined
groups
feature
data
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014556274A
Other languages
English (en)
Other versions
JPWO2014109040A1 (ja
Inventor
博信 山崎
博信 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2014109040A1 publication Critical patent/JPWO2014109040A1/ja
Application granted granted Critical
Publication of JP6274114B2 publication Critical patent/JP6274114B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、制御方法、制御プログラム、および制御装置に関する。
対象ユーザ端末から他のユーザ端末へ画像を配布する際に、ネットワークへの負荷を軽減するために、対象ユーザ端末は画像データから特徴量を計算して他のユーザ端末へ送信する技術が知られている(たとえば、下記特許文献1参照)。また、特徴量に応じて各データがグループ化される技術が知られている。
また、携帯電話機での処理負荷を軽減するため、携帯電話機に代わりプロキシサーバが、携帯電話機からのコンテンツの閲覧リクエストに応じてコンテンツサーバから取得したコンテンツを解析する技術が知られている(たとえば、下記特許文献2参照)。
特開2004−46641号公報 特開2005−56096号公報
しかしながら、各データが有する特徴量に応じて各データがグループ化される際に、特徴量の種類によっては分類精度が低下する問題点がある。
1つの側面では、本発明は、分類精度の向上を図ることができる制御方法、制御プログラム、および制御装置を提供することを目的とする。
本発明の一の側面によれば、所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる処理を実行する制御方法、制御プログラム、および制御装置が提案される。
本発明の一の側面によれば、分類精度の向上を図ることができる。
図1は、特徴量の種類を増やす例を示す説明図である。 図2は、特徴量の種類を減らす例を示す説明図である。 図3は、実施の形態にかかる制御装置と分類装置の各々のハードウェア構成例を示すブロック図である。 図4は、各クラスタについての複数の種類の各々の特徴量を記憶するデータベースを示す説明図である。 図5は、分類装置の機能的構成を示すブロック図である。 図6は、クラスタ分析部によるクラスタリングを示す説明図である。 図7は、制御装置の機能的構成を示すブロック図である。 図8は、分類装置によるクラスタリング処理手順の一例を示すフローチャートである。 図9は、制御装置による制御処理手順の一例を示すフローチャートである。 図10は、制御装置による詳細な制御処理手順の一の例を示すフローチャートである。 図11は、制御装置による詳細な制御処理手順の他の例を示すフローチャートである。
以下に添付図面を参照して、本発明にかかる制御方法、制御プログラム、および制御装置の実施の形態を詳細に説明する。
図1は、特徴量の種類を増やす例を示す説明図である。図1のクラスタリングを行うシステム100は、制御装置101と、分類装置102と、を有する。図1の例では、各データが有する特徴量Xおよび特徴量Yによって各データが3つのグループに分類されている。グラフ111では、各データの特徴量Xと特徴量Yとの組み合わせの分布位置を示す。ここでのグループは、クラスタと称し、分類することをクラスタリングと称する。クラスタリングの利用例は、たとえば、録音された会議の音声データの各データに出席者をラベリングするためのクラスタリングが挙げられる。たとえば、データとしては、録音された音声データなどが挙げられ、クラスタとしては、音声データに録音されている会議の出席者が挙げられる。
制御装置101は、所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて所定データを複数のクラスタのいずれかにクラスタリングするコンピュータである分類装置102を制御するコンピュータである。所定データは上述したように音声データなどが挙げられる。制御装置101は、たとえば、サーバである。分類装置102は、たとえば、携帯端末装置である。たとえば、ディジタル化された音声データからは、MFCC(Mel−Frequency Cepstral Coefficient)、ピッチ、GPR(Glottal Pulse Rate)、VTL(Vocal Tract Length)などの複数の種類の特徴量が得られる。分類装置102は、複数の種類の特徴量のいずれも計算可能であって、制御装置101からの指示によって複数の種類のうちいずれの種類を計算するかを変更可能とする。複数の種類のうちの所定種類については、分類装置102が計算可能な特徴量の種類のうち、任意またはユーザによって指定、または過去に制御装置101によって指示された種類である。図1の例では、所定種類は1以上の種類である。
制御装置101は、複数のクラスタの各々について、所定データにおける特徴量の分布位置を示す情報を記憶部に書き込む。ここでは、当該情報は、分類装置102によって分類された所定データにおける特徴量の分布位置を示す情報である。特徴量の分布位置を示す情報については、分類装置102から受信してもよいし、制御装置101がアクセス可能な記憶装置から読み出してもよいし、入力手段によって制御装置101のユーザから入力されてもよい。ここでは、制御装置101は、分類装置102から送信された分布位置に関する情報を受信することとする。また、記憶部は、RAMやディスクなどの制御装置101が有する記憶装置である。各クラスタについての特徴量の分布位置を示す情報は、たとえば、各クラスタに分類されたデータの特徴量そのものであってもよいし、特徴量がモデル化されることによって得られる各クラスタについての特徴量の分布範囲を示す情報であってもよい。
図1の例では、各グラフ111,112上に示す三角形、正方形、ダイヤ型の形の各点は正規化された特徴量の分布位置に関する情報を示している。グラフ111上に示す各輪が正規化された特徴量によってモデル化されることにより得られる各クラスタについての分布範囲ar11,ar12,ar13を示す情報である。グラフ112上にも同様に、符号を付していないが、クラスタについての分布範囲を示す情報がある。具体的に分布範囲ar11,ar12,ar13を示す情報は、中心位置と、楕円の直径の長さと、などを有していればよい。特徴量の分布位置に関する情報は、複数の情報の集合であってもよいし、各クラスタについての特徴量の分布範囲ar11,ar12,ar13を示す情報のように1つの情報であってもよい。
特徴量の分布位置に関する情報は、正規化されているため、図1に示す各グラフ111,112の軸の単位は同一となっており、制御装置101は、異なる種類の特徴量であっても、位置や長さを比較することができる。正規化については、分類装置102が行ってもよいし、制御装置101が行ってもよい。各特徴量が正規化された値を分類装置102がクラスタリング時にモデル化することにより、分類装置102から制御装置101への通信量を低減させることができる。
つぎに、制御装置101は、記憶部に書き込んだ特徴量の分布位置を示す情報に基づいて、複数のクラスタの間の特徴量の分布位置の近さを示す情報を導出する。図1の例では、近さを示す情報は、分布範囲ar11,ar12,ar13の重複度合いを示す情報である。より具体的に、各分布範囲ar11,ar12,ar13の中心間を結ぶ線分のうち重複する領域に含まれる線分の長さである。上述したように、分布範囲ar11,ar12,ar13を示す情報は、正規化されているため、異なる種類の特徴量であっても比較することができる。図1の例では、クラスタaとクラスタbとの近さを示す情報は長さd1であるが、クラスタaとクラスタcとの近さを示す情報は0であり、クラスタbとクラスタcとの近さを示す情報は0である。
または、たとえば、近さを示す情報は、複数のクラスタの各々についての特徴量の平均値や中央値間の分布位置の距離であってもよい。または、たとえば、近さを示す情報は、複数のクラスタの各々についての特徴量のうちの分布位置が最も近い特徴量の分布位置間の距離であってもよいし、最も遠い特徴量の分布位置間の距離であってもよい。
制御装置101は、導出された近さを示す情報が所定条件を満たしたか否かを判定する。たとえば、所定条件とは、所定の近さよりも近いことである。所定の近さは、制御装置101の設計者によって設定される。図1の例では、たとえば、制御装置101は、クラスタaとクラスタbとの近さを示す情報であるd1が閾値以上であるか否かを判定する。閾値は、制御装置101の設計者によって設定されてもよいし、入力手段を介してユーザによって入力された値であってもよい。また、閾値は、制御装置101がアクセス可能な記憶装置に記憶されていることとする。
制御装置101は、所定条件を満たしたと判定した場合、所定データと同種のデータを、各種の特徴量のうちの所定種類と異なる種類の特徴量に応じて複数のクラスタのいずれかに分類装置102によってクラスタリングさせる制御を行う。所定データと同種のデータとは、所定データと同種の特徴量を有するデータであり、所定データと同種のデータは同一データであってもよいし、異なるデータであってもよい。各種の特徴量のうちの所定種類と異なる種類から、いずれの種類が選択されるかについては、後述する。たとえば、制御装置101は、分類装置102に対して、異なる種類によって分類させることを示す情報を送信することにより、分類装置102を制御してもよい。これにより、特徴量の種類が変更され、分類精度の向上を図ることができる。
また、制御装置101は、所定条件を満たしたと判定した場合、所定データと同種のデータを、所定種類に異なる種類を追加した種類の特徴量に応じて分類装置102によって複数のクラスタのいずれかに分類装置102によってクラスタリングさせる制御を行う。グラフ112では、特徴量Zが追加されたため、グラフ111よりも軸が一つ増えている。これにより、特徴量の種類が追加され、分類精度の向上を図ることができる。
図2は、特徴量の種類を減らす例を示す説明図である。制御装置200は、所定データが有する複数の種類の特徴量に応じて所定データを複数のクラスタのいずれかにクラスタリング可能な分類装置102を制御するコンピュータである。
制御装置200は、複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を記憶部に書き込む。データは、図1で示した例と同一であってもよい。グラフ211では、各データの特徴量Xと特徴量Yとの組み合わせの分布位置を示す。図2の例では、分布位置を示す情報についても図1で説明した例と同様に、グラフ211に示すように分布範囲ar21,ar22,ar23を示す情報が取得されてもよい。制御装置200は、書き込んだ複数の種類の特徴量の分布位置を示す情報に基づいて、複数の種類の各組み合わせについて、組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する。具体的には、制御装置200は、複数の種類の各組み合わせについて相関係数を算出する。相関係数は、1または−1に近い値であるほど2つの組み合わせの値の相関が強いことを示し、0に近い値であるほど2つの組み合わせの値の相関が弱いことを示す。
制御装置200は、複数の種類の各組み合わせのうち、算出した情報が示す相関の強さが所定の強さ以上である組み合わせを特定する。所定の強さについては、予め制御装置200の設計者や制御装置200のユーザによって設定されることとする。相関の強さを示す情報が相関係数の場合、制御装置200は、複数の種類の各組み合わせのうち、算出された相関係数の絶対値が所定値以上である組み合わせを特定する。図2に示す特徴量Xと特徴量Yとについての相関係数が閾値以上であるとする。
制御装置200は、複数の種類から、特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。これにより、分類精度を維持しつつ、最小限の種類の特徴量によって分類を行わせることができる。
また、制御装置200は、特定された組み合わせに含まれる各種類のうち、特定された組み合わせに含まれる種類の特徴量のばらつき度合いが大きい方の種類を特定する。図2の例では、制御装置200は、各種類方向に対して各分布範囲の長さを計測する。制御装置200は、種類ごとに計測した長さの合計値を算出する。図2の例では、特徴量Xについてのばらつき度合いは、dx21とdx22とdx23との合計値であり、特徴量Yについてのばらつき度合いは、dy21とdy22とdy23との合計値である。ここでは、算出した合計値をばらつき度合いとし、制御装置200は、合計値が大きい方の種類をばらつき度合いが大きい方の種類として特定する。図2の例では、縦方向の種類である特徴量Yの合計値の方が横方向の種類である特徴量Xの合計値よりも大きいため、制御装置200は、特徴量Yを特定する。
そして、制御装置200は、複数の種類から、特定された種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置102によって分類させる制御を行ってもよい。図2の例では、制御装置200は、特徴量Xに応じて所定データを複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。グラフ212では、特徴量Xだけで分類された例を示している。これにより、ばらつきが小さい方の種類の特徴量の方が、ばらつきが大きい方の種類の特徴量よりも分類精度が高いため、最小限の種類の特徴量であり、分類精度が高い種類の特徴量によって分類を行わせることができる。
(制御装置のハードウェア構成例)
図3は、実施の形態にかかる制御装置と分類装置の各々のハードウェア構成例を示すブロック図である。システム100は、制御装置300と、分類装置102と、を有する。ここでは、制御装置300は、図1にて説明した制御装置101と、図2にて説明した制御装置200と、のいずれの機能も有するコンピュータである。図3において、制御装置300は、CPU(Central Processing Unit)301と、記憶装置302と、ネットワークI/F(InterFace)303と、を有する。また、各部はバス304によってそれぞれ接続されている。
ここで、CPU301は、制御装置300の全体の制御を司る。CPU301は、記憶装置302に記憶されている各種プログラムを実行することにより、記憶装置302内のデータを読み出したり、実行結果となるデータを記憶装置302に書き込んだりする。
記憶装置302は、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ、磁気ディスクドライブなどの記憶部である。CPU301のワークエリアになったり、各種プログラムや各種データを記憶したりする。
ネットワークI/F303は、通信回線を通じてLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワークNETに接続され、このネットワークNETを介して分類装置102に接続される。そして、ネットワークI/F303は、ネットワークNETと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワークI/F303には、たとえばモデムやLANアダプタなどを採用することができる。
また、分類装置102は、CPU311と、記憶装置312と、ネットワークI/F313と、入力装置314と、出力装置315と、センサー316と、を有する。また、各部はバス317によってそれぞれ接続されている。
ここで、CPU311は、分類装置102の全体の制御を司る。CPU311は、記憶装置312に記憶されている各種プログラムを実行することにより、記憶装置312内のデータを読み出したり、実行結果となるデータを記憶装置312に書き込んだりする。
記憶装置312は、ROM、RAM、フラッシュメモリ、磁気ディスクドライブなどが挙げられる。CPU311のワークエリアになったり、各種プログラムや各種データを記憶したりする。
ネットワークI/F313は、通信回線を通じてLAN、WAN、インターネットなどのネットワークNETに接続され、このネットワークNETを介して制御装置300に接続される。そして、ネットワークI/F313は、ネットワークNETと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。ネットワークI/F313には、たとえばモデムやLANアダプタなどを採用することができる。
入力装置314は、キーボード、マウス、タッチパネルなどユーザの操作により、各種データの入力を行うインターフェースである。また、入力装置314は、カメラから画像や動画を取り込むこともできる。
出力装置315は、CPU311の指示により、データを出力するインターフェースである。出力装置315には、ディスプレイやプリンタが挙げられる。
センサー316は、たとえば、分類装置102が設置された設置箇所における所定の変位量を検出する。たとえば、センサー316は、音声を検出したり、温度を検出したりできる。
図4は、各クラスタについての複数の種類の各々の特徴量を記憶するデータベースを示す説明図である。ここでは、クラスタを会議の出席者候補としている。データベース400は、出席者候補、および複数種類の特徴量の分布位置のフィールドを有している。各フィールドに情報が設定されることにより、レコード(たとえば、401−1,401−2〜)が記憶される。データベース400は、記憶装置によって実現される。
たとえば、出席者候補のフィールドには、会議の出席者の候補を示す識別情報が登録されている。たとえば、特徴量の分布位置のフィールドには、各出席者候補についての音声に関する特徴量の分布位置に関する情報が登録されている。各音声に関する特徴量の分布位置に関する情報は、たとえば、特徴量が正規化されてデータベース400に登録されていることとし、異なる種類の特徴量であっても、制御装置300によって比較可能とする。
また、たとえば、各種類について、複数の分布位置に関する情報がデータベース400に記憶されていてもよい。または、たとえば、各出席者候補についての各種類の特徴量の分布位置の最小値、および最大値を記憶しておいてもよいし、複数の特徴量の分布位置がモデル化された分布範囲を記憶しておいてもよい。
(分類装置102の機能的構成例)
図5は、分類装置の機能的構成を示すブロック図である。分類装置102は、受信部501と、選択指示部502と、センサー部503と、特徴量計算部504と、クラスタ分析部505と、特徴量記憶部506と、クラスタモデル化部507と、送信部508と、を有する。送信部508と受信部501とは、ネットワークI/F313によって実現される。
選択指示部502からクラスタ分析部505と、クラスタモデル化部507とは、論理積回路であるAND、否定論理回路であるINVERTER、論理和回路であるORや、ラッチ回路であるFF(Flip Flop)などの素子によって形成されてもよい。または、選択指示部502と、センサー部503と、特徴量計算部504と、クラスタ分析部505と、クラスタモデル化部507との処理は、たとえば、CPU311がアクセス可能な記憶装置312に記憶された分類プログラムにコーディングされている。そして、CPU311が記憶装置312から分類プログラムを読み出して、分類プログラムにコーディングされている処理を実行する。これにより、選択指示部502と、センサー部503と、特徴量計算部504と、クラスタ分析部505と、クラスタモデル化部507と、の処理が、実現されてもよい。
センサー部503は、制御装置300における変位量を検出可能である。たとえば、図1で説明したように、変位量としては、音声が挙げられる。たとえば、センサー部503は、音声を検出する。センサー部503は、たとえば、第1〜第mセンサー部503−1〜503−mのように複数のセンサー部503を設け、複数のセンサー部503によって音声を検出してもよい。複数のセンサー部503−1〜503−mのうちいずれのセンサー部503が動作するかについては、選択指示部502によって選択されることとする。
特徴量計算部504は、センサー部503によって検出されたデータから得られる複数の種類の特徴量を計算可能である。たとえば、特徴量計算部504は、複数の種類の各々を計算可能であって、n種類の特徴量の各々を第1〜第n特徴量計算部504−1〜504−nのそれぞれによって算出する。第1〜第n特徴量計算部504−1〜504−nのうちいずれの特徴量計算部504が選択されるかについては、選択指示部502によって指示されることとする。
クラスタ分析部505は、特徴量計算部504によって算出された特徴量に応じてクラスタリングを行う。
図6は、クラスタ分析部によるクラスタリングを示す説明図である。グラフ600では、各データから得られる特徴量Xと特徴量Yとの組み合わせの分布位置によっていずれのクラスタにクラスタリングされるかを示している。たとえば、クラスタごとに各種類の特徴量についての閾値が予め定義されており、クラスタ分析部505は、特徴量計算部504によって算出された特徴量を各閾値以下であるか否かなどを判定することによって、クラスタリングを行う。図6のグラフ600内に記載された斜めの線l1,l2が閾値を示している。たとえば、制御装置300は、グラフ600上において、各データが有する特徴量Xと特徴量Yとの組み合わせがクラスタa〜dのいずれのエリアに含まれるかによってクラスタリングを行う。
特徴量記憶部506は、特徴量計算部504によって計算された一定時間分の特徴量を記憶する。一定時間については、分類装置102の設計者によって設定されることとする。特徴量記憶部506は、記憶装置312によって実現される。
受信部501は、複数の種類のうちいずれの種類の特徴量に応じてクラスタリングを行うかに関する情報を制御装置300から受信する。また、受信部501は、クラスタ分析部505によってクラスタリングされる際に用いられる閾値を制御装置300から受信してもよい。
選択指示部502は、受信部501によって受信された情報に基づいて、センサー部503内のいずれを実行させるかをセンサー部503に指示し、特徴量計算部504内のいずれを実行させるかを特徴量計算部504に指示する。さらに、選択指示部502は、いずれの種類の特徴量によってクラスタリングされるかをクラスタ分析部505に指示する。
クラスタモデル化部507は、一定時間、またはユーザによって指定されたタイミングごとに、特徴量記憶部506に記憶されている直近の一定時間分の指定された各種類の特徴量に応じてモデル化を行う。モデル化の手法としては、たとえば、k−平均法が挙げられる。たとえば、クラスタモデル化部507は、k−平均法によってモデル化することにより、クラスタごとに図1と図2に示した分布範囲を示す情報を生成する。さらに、クラスタモデル化部507は、分布範囲を示す情報について正規化を行っておく。
送信部508は、クラスタモデル化部507によって得られた分布範囲を示す情報を制御装置300へ送信する。または、送信部508は、クラスタ分析部505によって得られる特徴量の分布位置を示す情報を制御装置300へ送信してもよい。ここでは、分類装置102は、特徴量の分布位置を示す情報または特徴量の分布範囲を示す情報を制御装置300へ送信しているが、制御装置300と分類装置102がいずれもアクセス可能な記憶装置に記憶させるとしてもよい。
(制御装置300の機能的構成例)
図7は、制御装置の機能的構成を示すブロック図である。制御装置300は、取得部701と、第1導出部702と、判定部703と、検出部704と、第2導出部705と、抽出部706と、算出部707と、特定部708と、種類特定部709と、制御部710と、を有する。取得部701から制御部710の処理は、具体的には、たとえば、記憶装置303に記憶された制御プログラムにコーディングされている。そして、CPU302が記憶装置303から解析プログラムを読み出して、解析プログラムにコーディングされている処理を実行することにより、取得部701部から制御部710の処理が、実現される。または、CPU302が、ネットワークI/F303を介してネットワークNETから解析プログラムを取得してもよい。図1で説明したように、グループについては、クラスタと称する。
取得部701は、複数のクラスタの各々について、分類装置102によって分類された所定データにおける特徴量の分布位置を示す情報を取得して記憶部に記憶する。図1を用いて説明したように、特徴量の分布位置を示す情報は、特徴量が正規化された値であってもよいし、特徴量の分布範囲を示す情報であってもよい。具体的に、取得部701は、図7に示すように受信部711によって分類装置102から受信してもよいし、制御装置300がアクセス可能な記憶装置から、分類装置102から得られる特徴量の分布位置を示す情報を取得してもよい。または、制御装置300に入力手段が設けられていれば、入力手段を介して分類装置102から得られる特徴量の分布位置を示す情報の入力を受け付けてもよい。
第1導出部702は、取得部701によって取得された特徴量の分布位置を示す情報に基づいて、複数のクラスタの間の特徴量の分布位置の近さを示す情報を導出する。図1を用いて説明したように、たとえば、特徴量の分布位置の近さを示す情報は、分布範囲の重複度合いを示す情報であってもよいし、最も近い分布位置間の距離、平均の分布位置間の距離であってもよい。
判定部703は、第1導出部702によって導出された近さを示す情報が所定条件を満たしたか否かを判定する。制御部710は、判定部703によって所定条件を満たしたと判定された場合、所定データと同種のデータを、各種の特徴量のうちの所定種類と異なる種類の特徴量に応じて複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。具体的には、制御部710は、いずれの種類の特徴量に応じてクラスタリングさせるかを示す情報を分類装置102へ送信することにより、分類装置102を遠隔制御する。
また、制御部710は、判定部703によって所定条件を満たしたと判定された場合、同種のデータを、所定種類と異なる種類との特徴量に応じて複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。
また、検出部704は、データベース400から、判定部703によって近さを示す情報が所定条件を満たしたと判定されたクラスタの組み合わせについて、異なる種類の各々の特徴量の分布位置を検出する。図1で用いた例では、クラスタaとクラスタbとの組み合わせについての近さを示す情報が判定部703によって所定条件を満たしたと判定され、所定種類は、特徴量Xと特徴量Yである。具体的には、検出部704は、データベース400から、クラスタaとクラスタbとの各々について、特徴量Xと特徴量Y以外の種類の特徴量の分布位置を検出する。
第2導出部705は、特定された組み合わせについて、検出部704によって検出された特徴量の分布位置の近さを示す情報を導出する。具体的には、第2導出部705は、特徴量Xと特徴量Y以外の種類の各々について、クラスタaとクラスタbとの間の検出された分布位置の距離を算出する。たとえば、データベース400に記憶されている分布位置に関する情報が特徴量の分布範囲に関する情報である場合、クラスタaとクラスタbとの間の検出された分布位置の距離は、分布範囲のうちの最も近い位置同士の距離であってもよい。この最も近い位置同士の距離が各種類における分類装置102によるクラスタリング能力の限界となる。
または、データベース400に記憶されている分布位置に関する情報が特徴量の分布範囲に関する情報である場合、クラスタaとクラスタbとの間の検出された分布位置の距離は、分布範囲のうちの最も離れた位置同士の距離であってもよい。または、たとえば、データベース400に記憶されている分布位置に関する情報が複数の特徴量の場合、クラスタaとクラスタbとの間の検出された分布位置の距離は、特徴量の分布位置の間の距離のうち最も遠い距離である。
抽出部706は、異なる種類のうち、第2導出部705によって導出された近さを示す情報が所定条件を満たす種類を抽出する。たとえば、導出された近さを示す情報が上述した最も近い位置同士の距離の場合、所定条件は、算出された距離が最も大きいこととしてもよいし、算出された距離が大きい順に所定番目以内としてもよい。最も近い位置同士の距離が遠い種類ほど、クラスタaとクラスタbとの分類精度が高い。図1の例では、特徴量Zが抽出される。
制御部710では、判定部703によって所定条件を満たしたと判定された場合、同種のデータを、抽出部706によって抽出された種類の特徴量に応じて分類装置102によって複数のクラスタのいずれかに分類させる制御を行う。図1の例では、制御部710は、同種のデータを、所定種類の特徴量Xと特徴量Yに加えて特徴量Zに応じて分類装置102によって複数のクラスタのいずれかに分類させる制御を行う。これにより、複数の種類のうち、分類精度が向上すると推定される種類の特徴量によってクラスタリングが行われ、分類精度の向上を図ることができる。
つぎに、図2に示した例について各機能ブロックを用いて説明する。算出部707は、取得部701によって取得された複数の種類の特徴量の分布位置を示す情報に基づいて、複数の種類の各組み合わせについて、組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する。図2を用いて説明したように、相関の強さを示す情報は、たとえば、相関係数である。
特定部708は、複数の種類の各組み合わせのうち、算出部707によって算出された情報が示す相関の強さが所定の強さ以上である組み合わせを特定する。たとえば、特定部708は、相関係数の絶対値が閾値以上である組み合わせを、相関の強さを示す情報が所定の強さ以上である組み合わせとして特定する。所定の強さについては、たとえば、ユーザによって指示された強さであり、予め記憶装置302に記憶されてある。
制御部710は、複数の種類から、特定部708によって特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。
また、種類特定部709は、特定部708によって特定された組み合わせに含まれる各種類のうち、特定された組み合わせに含まれる種類の特徴量のばらつき度合いが大きい方の種類を特定する。図2を用いて説明したように、ばらつき度合いは、各種類方向に対して各分布範囲の長さを、種類ごとに合計した合計値である。種類特定部709は、合計値が大きい方の種類をばらつき度合いが大きい方の種類として特定する。
そして、制御部710は、複数の種類から、種類特定部709によって特定された種類を除いた種類の特徴量に応じて所定データを複数のクラスタのいずれかに分類装置102によって分類させる制御を行う。具体的には、制御部710は、いずれの種類の特徴量に応じてクラスタリングさせるかを示す情報を送信部712によって分類装置102へ送信することにより、分類装置102を遠隔制御してもよい。
(分類装置102によるクラスタリング処理手順)
図8は、分類装置によるクラスタリング処理手順の一例を示すフローチャートである。分類装置102は、種類、閾値の変更を示す情報を受信したか否かを判断する(ステップS801)。分類装置102は、種類、閾値の変更を示す情報を受信した場合(ステップS801:Yes)、各部へ種類の変更や閾値の変更を指示し(ステップS802)、センサーサンプリングを行う(ステップS803)。分類装置102は、種類、閾値の変更を示す情報を受信していない場合(ステップS801:No)、ステップS803へ移行する。
分類装置102は、センサーサンプリングによる検出結果に基づいて、特徴量を計算し(ステップS804)、計算した特徴量に応じてクラスタ分析を行いつつ(ステップS805)、計算した特徴量を記憶装置に記憶する(ステップS806)。ステップS805、ステップS806のつぎに、分類装置102は、以前クラスタモデル化を行った時から一定時間経過したか否かを判断する(ステップS807)。
分類装置102は、一定時間経過したと判断した場合(ステップS807:Yes)、クラスタモデル化を行い(ステップS808)、モデル化結果を制御装置300へ送信し(ステップS809)、ステップS801へ戻る。モデル化結果は、上述したクラスタごとの特徴量の分布範囲を示す情報である。分類装置102は、一定時間経過していないと判断した場合(ステップS807:No)、ステップS801へ戻る。
(制御装置300による制御処理手順)
図9は、制御装置による制御処理手順の一例を示すフローチャートである。制御装置300は、モデル化結果を分類装置102から受信する(ステップS901)。モデル化結果は、上述したようにクラスタごとの特徴量の分布範囲を示す情報である。制御装置300は、分離度を測定しつつ(ステップS902)、モデル化結果に基づいて出席者候補から出席者を確定する(ステップS903)。
制御装置300は、確定した出席者と、測定した分離度に基づいて、特徴量の種類を決定し(ステップS904)、クラスタリングを行う際の閾値を決定する(ステップS905)。そして、制御装置300は、決定結果を分類装置102へ送信し(ステップS906)、一連の処理を終了する。ステップS903、ステップS904についての詳細について、図10、図11を用いて説明する。
図10は、制御装置による詳細な制御処理手順の一の例を示すフローチャートである。制御装置300は、クラスタごとの各種類の特徴量の分布位置に関する情報を取得して記憶部に記憶する(ステップS1001)。記憶部は、たとえば、記憶装置302である。制御装置300は、複数の種類の各組み合わせのうち、未選択の組み合わせがあるか否かを判断する(ステップS1002)。ここでの複数の種類は、取得された分布位置に関する情報をクラスタリング時の特徴量の種類である。
未選択の組み合わせがある場合(ステップS1002:Yes)、制御装置300は、未選択の組み合わせから1つの組み合わせを選択する(ステップS1003)。制御装置300は、選択された組み合わせの相関係数cを算出し(ステップS1004)、|c|<閾値であるか否かを判断する(ステップS1005)。
|c|<閾値でない場合(ステップS1005:No)、制御装置300は、選択された組み合わせを冗長な種類を含む組み合わせとして特定し(ステップS1006)、ステップS1002へ戻る。|c|<閾値である場合(ステップS1005:Yes)、ステップS1002へ戻る。
一方、ステップS1002において、未選択の組み合わせがない場合(ステップS1002:No)、特定した冗長な種類を含む組み合わせのうち、未選択の組み合わせがあるか否かを判断する(ステップS1007)。未選択の組み合わせがある場合(ステップS1007:Yes)、制御装置300は、未選択な冗長な種類を含む組み合わせから1つの組み合わせを選択する(ステップS1008)。そして、制御装置300は、クラスタごとの分布範囲を示す情報に基づいて、選択された組み合わせに含まれる各種類方向の長さを特定する(ステップS1009)。
制御装置300は、特定した長さを組み合わせに含まれる種類ごとに合計値を算出する(ステップS1010)。制御装置300は、選択された組み合わせに含まれる種類のうち、合計値が大きい方の種類をばらつき度合いが大きい冗長な種類として特定し(ステップS1011)、S1007へ戻る。そして、未選択な組み合わせがない場合(ステップS1007:No)、制御装置300は、複数の種類から特定した種類を除いた種類の特徴量に応じてクラスタリングさせる制御を行い(ステップS1012)、一連の処理を終了する。制御装置300は、ステップS1012において分類装置102を制御しているが、分類装置102と制御装置300とが同一装置である場合、単に複数の種類から特定した種類を除いた種類の特徴量に応じてクラスタリングすればよい。
図11は、制御装置による詳細な制御処理手順の他の例を示すフローチャートである。制御装置300は、クラスタごとの各種類の特徴量の分布位置に関する情報を取得して記憶部に記憶し(ステップS1101)、複数のクラスタの各組み合わせのうち、未選択な組み合わせがあるか否かを判断する(ステップS1102)。記憶部は、たとえば、記憶装置302である。複数のクラスタの各組み合わせのうち、未選択な組み合わせがある場合(ステップS1102:Yes)、制御装置300は、未選択の組み合わせから1つの組み合わせを選択する(ステップS1103)。
制御装置300は、選択された組み合わせの各クラスタの分布位置の中心間の線分を検出し(ステップS1104)、検出した線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上であるか否かを判断する(ステップS1105)。所定割合については、たとえば、ユーザによって指示された割合であって、予め記憶装置302に記憶されてある。検出された線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上である場合(ステップS1105:Yes)、ステップS1102へ戻る。検出された線分のうち、いずれのクラスタの分布範囲にも含まれる線の長さが所定割合以上でない場合(ステップS1105:No)、ステップS1106へ移行する。制御装置300は、選択された組み合わせの各クラスタの分布位置との距離が閾値以下の分布位置であるクラスタと選択された組み合わせの各クラスタとを分析候補のクラスタとして検出する(ステップS1106)。
制御装置300は、分析候補のクラスタの各組み合わせについて、未選択の種類の各々の特徴量をデータベースから検出する(ステップS1107)。制御装置300は、分析候補のクラスタの各組み合わせについて、未選択の種類の特徴量についての各々の分布位置間の距離を算出する(ステップS1108)。ここで、未選択の種類とは、データが有する特徴量の複数の種類の中で分類装置102によって予め計算可能な複数の種類のうち、ステップS1101によって取得した分類結果において使用されていない種類を示している。
制御装置300は、未選択の種類の特徴量ごとに算出した距離から最小距離を導出し(ステップS1109)、未選択の種類から、最小距離が最も大きい種類を抽出し(ステップS1110)、ステップS1102へ戻る。
ステップS1102において、未選択な組み合わせがない場合(ステップS1102:No)、制御装置300は、抽出した種類の特徴量を追加して分類装置102にクラスタリングさせる制御を行い(ステップS1111)、一連の処理を終了する。制御装置300は、ステップS1111において分類装置102を制御しているが、分類装置102と制御装置300とが同一装置である場合、単に抽出した種類の特徴量を追加してクラスタリングすればよい。
以上説明したように、制御装置は、音声データ等の所定データを所定種類の特徴量に応じて分類装置が分類した結果を用いて、グループ間の特徴量の分布位置が近ければ、特徴量の種類を変更して以降のデータを分類装置に分類させる制御を行う。これにより、分類精度の向上を図ることができる。
また、制御装置は、グループ間の特徴量の分布位置が近ければ、特徴量の種類を増やして以降のデータを分類装置に分類させる制御を行ってもよい。これにより、分類精度の向上を図ることができる。
また、制御装置は、分布位置が近いグループ間を分類可能であると推定される種類を増やして以降のデータを分類装置に分類させる制御を行ってもよい。これにより、未選択な種類からランダムに選択された種類が追加される場合よりも、分類精度の向上を図ることができる。さらに、追加される種類を最小限に抑制することができるため、分類装置における消費電力の増大を抑制でき、分類装置が制御装置へ特徴量の分布位置を示す情報を送信する際の通信量の低減化を図ることができる。
また、分類装置が、制御装置へ特徴量の分布位置に関する情報として、特徴量の分布範囲に関する情報を送信し、制御装置は、特徴量の分布範囲に関する情報を取得する。これにより、分類装置から制御装置へのデータ送信時の通信量を低減させることができる。
また、制御装置が、グループ間の分布位置の近さを示す情報として、特徴量の分布範囲の重なり度合いを用いる。これにより、制御装置における計算量を低減させることができ、消費電力を低減させることができる。
以上説明したように、制御方法、制御プログラム、および制御装置によれば、複数種類の各組み合わせから、各データにおける複数の種類の特徴量によって相関度が強い組み合わせを特定する。そして、制御装置は、複数の種類から特定した組み合わせに含まれる一方の種類を除いた種類の特徴量に応じて分類装置によってデータを分類させる制御を行う。これにより、分類精度を維持しつつ特徴量の種類を低減させることができる。分類装置による特徴量の計算量を低減させることができるため、分類装置における消費電力を低減させることができる。また、分類装置が制御装置へ特徴量の分布位置を示す情報を送信する際の通信量の低減化を図ることができる。
また、制御装置は、複数の種類から、相関度が強い組み合わせに含まれる種類のうちの特徴量のばらつき度合いが大きい方の種類を除いた種類の特徴量に応じて分類装置によってデータを分類させる制御を行う。
なお、本実施の形態で説明した制御方法や分類方法は、予め用意された制御プログラムや分類プログラムをPC(Personal Computer)、サーバやワークステーション等のコンピュータで実行することにより実現することができる。本制御プログラムと本分類プログラムのそれぞれは、ハードディスク、CD−ROM、DVD、USBメモリ等の可変型記録媒体、フラッシュメモリなどの半導体メモリ、ハードディスクドライブ等のコンピュータで読み取り可能な記録媒体に記録される。そして、コンピュータによって記録媒体から本制御プログラムと本分類プログラムが読み出されることによって実行される。また本制御プログラムや分類プログラムは、インターネット等のネットワークを介して配布してもよい。
また、本実施の形態で説明した制御装置は、スタンダードセルやストラクチャードASIC(Application Specific Integrated Circuit)などの特定用途向けIC(以下、単に「ASIC」と称す。)やFPGAなどのPLD(Programmable Logic Device)によっても実現することができる。具体的には、たとえば、上述した制御装置の機能をHDL記述によって機能定義し、そのHDL記述を論理合成してASICやPLDに与えることにより、制御装置を製造することができる。
また、本実施の形態で説明した分類装置は、スタンダードセルやASICやFPGAなどのPLDによっても実現することができる。具体的には、たとえば、上述した分類装置の機能をHDL記述によって機能定義し、そのHDL記述を論理合成してASICやPLDに与えることにより、分類装置を製造することができる。
また、本実施の形態では、分類装置が分類する対象のデータを音声データとしているが、これに限らない。また、本実施の形態では、クラスタの候補を会議の出席者などの人物にしているが、これに限らない。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。
(付記2)前記分類して前記記憶部に記憶させる処理では、
前記所定条件を満たした場合、前記同種のデータを、前記所定種類と、前記異なる種類と、の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記1に記載の制御方法。
(付記3)前記コンピュータが、
前記複数のグループの各々についての前記各種の特徴量の分布位置を記憶する記憶装置から、前記近さを示す情報が前記所定条件を満たしたグループの組み合わせについて、前記異なる種類の各々の特徴量を検出し、
前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布位置間の近さを示す情報を算出し、
前記異なる種類のうち、算出した前記近さを示す情報が所定条件を満たす種類を抽出する
処理を実行し、
前記分類して記憶させる制御を行う処理では、
前記所定条件を満たしたと判定した場合、前記同種のデータを、抽出した種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記1または2に記載の制御方法。
(付記4)前記特徴量の分布位置を示す情報は、前記特徴量の分布範囲を示す情報であることを特徴とする付記1〜3のいずれか一つに記載の制御方法。
(付記5)前記特徴量の分布位置の近さを示す情報は、前記特徴量の分布範囲の重複度合いであることを特徴とする付記4に記載の制御方法。
(付記6)所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行することを特徴とする制御方法。
(付記7)前記分類して記憶させる制御を行う処理では、
前記複数の種類から、特定した組み合わせに含まれる各種類のうち、取得した情報が示す前記分布位置のばらつき度合いが大きい方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする付記6に記載の制御方法。
(付記8)所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
算出した前記分布位置間の近さを示す情報が所定条件を満たした場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。
(付記9)所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を前記記憶部に書き込み、
書き込んだ前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出し、
前記複数の種類の各組み合わせのうち、算出した情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定し、
前記複数の種類から、特定した組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに分類して前記記憶部に記憶させる
処理を実行させることを特徴とする制御プログラム。
(付記10)所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類する分類装置を制御する制御装置であって、
前記複数のグループの各々について、前記分類装置によって分類された前記所定データにおける特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記特徴量の分布位置を示す情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を導出する導出部と、
前記導出部によって導出された前記近さを示す情報が所定条件を満たしたか否かを判定する判定部と、
前記判定部によって前記所定条件を満たしたと判定された場合、前記所定データと同種のデータを、前記各種の特徴量のうちの前記所定種類と異なる種類の特徴量に応じて前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。
(付記11)所定データが有する複数の種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類可能な分類装置を制御する制御装置であって、
前記所定データと同種の複数のデータの各々における複数の種類の特徴量の分布位置を示す情報を取得して記憶部に記憶する取得部と、
前記取得部によって前記記憶部に記憶された前記複数の種類の特徴量の分布位置を示す情報に基づいて、前記複数の種類の各組み合わせについて、前記組み合わせに含まれる各種類の特徴量の相関の強さを示す情報を算出する算出部と、
前記複数の種類の各組み合わせのうち、前記算出部によって算出された情報が示す前記相関の強さが所定の強さ以上である組み合わせを特定する特定部と、
前記複数の種類から、前記特定部によって特定された組み合わせに含まれる各種類のいずれか一方の種類を除いた種類の特徴量に応じて前記所定データを前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
を有することを特徴とする制御装置。
101,200,300 制御装置
102 分類装置
400 データベース
701 取得部
702 第1導出部
703 判定部
704 検出部
705 第2導出部
706 抽出部
707 算出部
708 特定部
709 種類特定部
710 制御部
ar11,ar12,ar13,ar21,ar22,ar23 分布範囲

Claims (4)

  1. 所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータが、
    前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布範囲に関する情報を前記記憶部に書き込み、
    書き込んだ前記特徴量の分布範囲に関する情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
    前記複数のグループの各々についての前記各種の特徴量の分布範囲に関する情報を記憶する記憶装置から、算出した前記近さを示す情報が所定条件を満たしたグループの組み合わせについて、前記各種の特徴量のうちの前記所定種類と異なる種類の各々の特徴量を検出し、
    前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布範囲のうちの、前記複数のグループの間の分布位置の最も近い位置同士の距離を算出し、
    前記異なる種類のうち、算出した前記距離が大きい順に所定番目以内の種類を抽出し、
    算出した前記近さを示す情報が前記所定条件を満たしたと判定した場合、前記所定データと同種のデータを、抽出した前記種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる、
    処理を実行することを特徴とする制御方法。
  2. 前記分類して前記記憶部に記憶させる処理では、
    算出した前記近さを示す情報が前記所定条件を満たした場合、前記同種のデータを、前記所定種類と、前記異なる種類と、の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させることを特徴とする請求項1に記載の制御方法。
  3. 所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類し、記憶部に記憶させるコンピュータに、
    前記複数のグループの各々について、分類された前記所定データにおける特徴量の分布範囲に関する情報を前記記憶部に書き込み、
    書き込んだ前記特徴量の分布範囲に関する情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を算出し、
    前記複数のグループの各々についての前記各種の特徴量の分布範囲に関する情報を記憶する記憶装置から、算出した前記近さを示す情報が所定条件を満たしたグループの組み合わせについて、前記各種の特徴量のうちの前記所定種類と異なる種類の各々の特徴量を検出し、
    前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布範囲のうちの、前記複数のグループの間の分布位置の最も近い位置同士の距離を算出し、
    前記異なる種類のうち、算出した前記距離が大きい順に所定番目以内の種類を抽出し、
    算出した前記近さを示す情報が前記所定条件を満たしたと判定した場合、前記所定データと同種のデータを、抽出した前記種類の特徴量に応じて前記複数のグループのいずれかに分類して前記記憶部に記憶させる、
    処理を実行させることを特徴とする制御プログラム。
  4. 所定データが有する各種の特徴量のうちの所定種類の特徴量に応じて前記所定データを複数のグループのいずれかに分類する分類装置を制御する制御装置であって、
    前記複数のグループの各々について、分類された前記所定データにおける特徴量の特徴量の分布範囲に関する情報を取得して記憶部に記憶する取得部と、
    前記取得部によって前記記憶部に記憶された前記特徴量の分布範囲に関する情報に基づいて、前記複数のグループの間の前記特徴量の分布位置間の近さを示す情報を導出する第1導出部と、
    前記第1導出部によって導出された前記分布位置間の近さを示す情報が所定条件を満たしたか否かを判定する判定部と、
    前記複数のグループの各々についての前記各種の特徴量の分布範囲に関する情報を記憶する記憶装置から、算出した前記近さを示す情報が前記所定条件を満たしたグループの組み合わせについて、前記各種の特徴量のうちの前記所定種類と異なる種類の各々の特徴量を検出する検出部と、
    前記所定条件を満たしたグループの組み合わせについて、検出した前記特徴量の分布範囲のうちの、複数のグループの間の分布位置の最も近い位置同士の距離を導出する第2導出部と、
    前記異なる種類のうち、算出した前記距離が大きい順に所定番目以内の種類を抽出する抽出部と、
    前記判定部によって前記所定条件を満たしたと判定された場合、前記所定データと同種のデータを、抽出した種類の特徴量に応じて前記複数のグループのいずれかに前記分類装置によって分類させる制御を行う制御部と、
    を有することを特徴とする制御装置。
JP2014556274A 2013-01-10 2013-01-10 制御方法、制御プログラム、および制御装置 Expired - Fee Related JP6274114B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/050340 WO2014109040A1 (ja) 2013-01-10 2013-01-10 制御方法、制御プログラム、および制御装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017130698A Division JP2017191337A (ja) 2017-07-03 2017-07-03 制御方法、制御プログラム、および制御装置

Publications (2)

Publication Number Publication Date
JPWO2014109040A1 JPWO2014109040A1 (ja) 2017-01-19
JP6274114B2 true JP6274114B2 (ja) 2018-02-07

Family

ID=51166709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014556274A Expired - Fee Related JP6274114B2 (ja) 2013-01-10 2013-01-10 制御方法、制御プログラム、および制御装置

Country Status (5)

Country Link
US (1) US20150293951A1 (ja)
JP (1) JP6274114B2 (ja)
CN (1) CN104903957A (ja)
TW (1) TWI533145B (ja)
WO (1) WO2014109040A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10212232B2 (en) * 2016-06-03 2019-02-19 At&T Intellectual Property I, L.P. Method and apparatus for managing data communications using communication thresholds
WO2018131311A1 (ja) 2017-01-10 2018-07-19 日本電気株式会社 センシングシステム、センサノード装置、センサ測定値処理方法及びプログラム
US10860552B2 (en) * 2017-03-10 2020-12-08 Schweitzer Engineering Laboratories, Inc. Distributed resource parallel-operated data sorting systems and methods
JP2018175850A (ja) * 2017-04-14 2018-11-15 株式会社Nttドコモ データ収集装置及びデータ収集方法
TWI798314B (zh) * 2017-12-28 2023-04-11 日商東京威力科創股份有限公司 資料處理裝置、資料處理方法及資料處理程式
CN112291290B (zh) * 2019-07-25 2024-06-11 京东方科技集团股份有限公司 一种设备关联建立方法、装置及电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05101186A (ja) * 1991-10-08 1993-04-23 Sumitomo Cement Co Ltd 光学的パターン識別方法
JP2973805B2 (ja) * 1993-12-10 1999-11-08 日本電気株式会社 標準パターン作成装置
DE60138530D1 (de) * 2000-10-11 2009-06-10 Mitsubishi Electric Corp Verfahren zum vermitteln/erwerben von positionsverbundenen informationen, vermittlungscomputersystem und mobiles endgerät
JP2006258977A (ja) * 2005-03-15 2006-09-28 Advanced Telecommunication Research Institute International 確率モデルを圧縮する方法及びそのためのコンピュータプログラム
CN100530196C (zh) * 2007-11-16 2009-08-19 北京交通大学 一种基于分层匹配的快速音频广告识别方法
CN101620851B (zh) * 2008-07-01 2011-07-27 邹采荣 一种基于改进Fukunage-koontz变换的语音情感识别方法
JP2011043988A (ja) * 2009-08-21 2011-03-03 Kobe Univ パターン認識方法、装置及びプログラム
JP5174068B2 (ja) * 2010-03-11 2013-04-03 株式会社東芝 信号分類装置
WO2012080787A1 (en) * 2010-12-17 2012-06-21 Nokia Corporation Identification of points of interest and positioning based on points of interest
JP5683287B2 (ja) * 2011-01-20 2015-03-11 株式会社日立情報通信エンジニアリング パターン認識装置及びパターン認識方法
US20150302042A1 (en) * 2012-11-20 2015-10-22 Hitachi, Ltd. Data analysis apparatus and data analysis method

Also Published As

Publication number Publication date
JPWO2014109040A1 (ja) 2017-01-19
CN104903957A (zh) 2015-09-09
WO2014109040A1 (ja) 2014-07-17
TWI533145B (zh) 2016-05-11
US20150293951A1 (en) 2015-10-15
TW201435613A (zh) 2014-09-16

Similar Documents

Publication Publication Date Title
JP6274114B2 (ja) 制御方法、制御プログラム、および制御装置
US10242289B2 (en) Method for analysing media content
US10936906B2 (en) Training data acquisition method and device, server and storage medium
JP2018534694A (ja) 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク
US20170232294A1 (en) Systems and methods for using wearable sensors to determine user movements
CN109189991A (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
CN110010156A (zh) 基于对事件子部分的序列的建模的声音事件检测
Heittola et al. The machine learning approach for analysis of sound scenes and events
KR20180112031A (ko) 컨텐츠 선택을 제공하는 시스템들 및 방법들
WO2021087129A1 (en) Automatic reduction of training sets for machine learning programs
JP6039577B2 (ja) 音声処理装置、音声処理方法、プログラムおよび集積回路
US9275483B2 (en) Method and system for analyzing sequential data based on sparsity and sequential adjacency
EP2707808A2 (en) Exploiting query click logs for domain detection in spoken language understanding
Alfaifi et al. Human action prediction with 3D-CNN
CN115455171B (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN110188862A (zh) 用于数据处理的模型超参数的搜索方法、装置、系统
Hou et al. Polyphonic audio tagging with sequentially labelled data using crnn with learnable gated linear units
CN111222051B (zh) 一种趋势预测模型的训练方法及装置
CN116450813B (zh) 文本关键信息提取方法、装置、设备以及计算机存储介质
CN105739882B (zh) 用于字符识别的计算机可读记录介质、方法及设备
Ashraf et al. Audio-based multimedia event detection with DNNs and sparse sampling
WO2022245469A1 (en) Rule-based machine learning classifier creation and tracking platform for feedback text analysis
CN112052724A (zh) 基于深度卷积神经网络的手指指尖定位方法及装置
CN115269786A (zh) 可解释的虚假文本检测方法、装置、存储介质以及终端
CN115349129A (zh) 生成具有不确定性区间的性能预测

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171225

R150 Certificate of patent or registration of utility model

Ref document number: 6274114

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees