JP2005063341A

JP2005063341A - 集合の動的形成システム、集合の動的形成方法及びそのプログラム

Info

Publication number: JP2005063341A
Application number: JP2003295845A
Authority: JP
Inventors: Soichi Kodaira; 荘一小平
Original assignee: NEC Solution Innovators Ltd
Current assignee: NEC Solution Innovators Ltd
Priority date: 2003-08-20
Filing date: 2003-08-20
Publication date: 2005-03-10

Abstract

【課題】要素をその属性に従って集合に分類する場合、１つには適切な領域を持つ集合を予め定義することが難しいという問題がある。要素ベクトルのとる範囲が判っている場合でも、全集合の定義に失敗した場合、再度全集合の定義を行う必要があるためである。
【解決手段】本発明は、各要素の属性情報を用いて、集合の生成および移動、分割、結合、破壊を行う構成を提供するものである。
図３において、属性情報７１〜７ｎは、各要素を属させる集合の生成および各要素が属する集合を決定するため、各要素の持つ特性を記憶する。変化する各要素の属性情報に従い、集合の定義を動的に変化させることで、集合が効率良く各要素を含み、集合間の移動における任意の要素の、近隣属性を持つ要素との分離を防ぐことを可能とする。
【選択図】図１

Description

本発明は、属性を持った要素の集合への分類に関し、特に、ある閾値に従って集合の動的な分割や統合を行う集合の動的形成システム、集合の動的形成方法及びそのプログラムに関する。

構成要素の分類を行う時、監視対象の構成要素の集合を一般化したグループ分けをし、各グループにはグループ別に計算した属性データとグループに属する構成要素データを持たせ、前記構成要素又はその属性の変更に伴い影響を受ける範囲のグループを特定し、影響を受ける範囲のグループのみを再構成すると共に該グループの属性データを再計算することで情報の変更による影響を限定しオペレーションを容易にする内容が特許文献１に記載されている。

特開平１１−２９９０９８（ページ３−６、図１）

従来、前述した特許文献１を含め、集合はシステム構築時に定義され、定期的に要素の属する集合を変更する作業を行っていた。

しかし、この従来技術には、次のような問題点があった。

第１の問題点は、適切な領域を持つ集合を予め定義することが難しいということである。

要素ベクトルのとる範囲が判っている場合でも、全集合の定義に失敗した場合、再度全集合の定義を行う必要があるためである。

第２の問題点は、要素の持つ属性の数が増えると集合を定義する資源が非常に多く必要となるということである。

単純計算で、１つの属性が５段階の値を記憶する場合、２属性で２５集合、３属性で１２５集合、４属性で６２５集合を定義することから、非常に無駄が多くなるためである。

第３の問題点は、属性の変化により要素が属する集合を変更する場合、属する集合の属性が離散的に変化するということである。

構成要素が全く異なる集合への移動により、参照すべき集合自体の属性が急激に変化するためである。また、同一の集合に属する各要素の付帯情報を利用する際、移動後から全く内容の異なるものになってしまうためである。

第４の問題点は、集合の再構築が難しいということである。

集合を再構築する場合、新たな集合を定義した後、全てのデータを再度評価する必要があり、その際に集合の属性が離散的に変化するためである。

本発明は、以上の問題点を解決する集合の動的形成システム、集合の動的形成方法及びそのプログラムを提供する。

本発明の第１の集合の動的形成システムは、コンピュータ上で動作する集合の動的形成システムであって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する分類ルール定義手段と、前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類する要素分類手段と、新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段と、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する集合分割手段と、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する集合統合手段と、指定された要素を集合から取り除く要素削除手段と、を備える。

本発明の第２の集合の動的形成システムは、第１の発明において、前記集合ベクトル値計算手段は、集合に属する要素のベクトル値の平均値を集合のベクトル値とすることを備える。

本発明の第３の集合の動的形成システムは、第１の発明において、前記要素分類手段は、集合と要素とのベクトル値に基づく距離が、該集合の有する第１の閾値以下であると、該要素を該集合が含む要素とすることを備える。

本発明の第４の集合の動的形成システムは、第１の発明において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、すべての集合についてその距離が第１の閾値を超えると、新たな集合を生成して要素Ｐを新たに生成した集合の要素とすることを備える。

本発明の第５の集合の動的形成システムは、第１の発明において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、ある集合において求めた距離が第１の閾値以下の場合、該集合に要素Ｐを分類することを備える。

本発明の第６の集合の動的形成システムは、第１の発明において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、２以上の集合において求めた距離が第１の閾値以下の場合、２以上の集合において求めた距離が最小の集合に要素Ｐを分類することを備える。

本発明の第７の集合の動的形成システムは、第１の発明において、前記集合分割手段は、集合が複数の要素Ｐ１〜Ｐｎを含み、ベクトルＰ１〜Ｐｎの半数程度のベクトルが集中する第１の部分集合のベクトルと第１の部分集合を除くベクトルが集中する第２の部分集合ベクトルを求め、第１の部分集合と第２の部分集合の距離が前記第２の閾値を超えると、該集合を分割し第１の部分集合と第２の部分集合をそれぞれ集合とすることを備える。

本発明の第８の集合の動的形成システムは、第１の発明において、前記集合統合手段は、第１の集合のベクトルと第２の集合のベクトルの距離が、前記第３の閾値より小さい場合、第１の集合と第２の集合とを統合して新たな集合を生成することを備える。

本発明の第９の集合の動的形成システムは、第１の発明において、前記要素分類手段による１又は複数の要素の分類後、前記集合分割手段または前記集合統合手段を実行させることを備える。

本発明の第１０の集合の動的形成システムは、第１の発明において、前記ベクトル値計算手段は、集合に属する要素数の増減に対応して前記第１の閾値を大きくしたり小さくしたりすることを備える。

本発明の第１の集合の動的形成方法は、コンピュータ上で動作する集合の動的形成システムにおける集合の動的形成方法であって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第１のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類したり、指定された要素を集合から取り除く第２のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第３のステップと、
前記第３のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する第４のステップと、
前記第３のステップの実行後必要に応じて起動され、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する第５のステップと、
を備える。

本発明の第１のプログラムは、
コンピュータに、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第１のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類したり、指定された要素を集合から取り除く第２のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第３のステップと、
前記第３のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する第４のステップと、
前記第３のステップの実行後必要に応じて起動され、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する第５のステップと、
を実行させる。

第１の効果は、予め集合を定義する必要が無いことである。

その理由は、要素を追加する際に、既存の集合に属するか、新たな集合を生成して属するかが一意に決定されるためである。

第２の効果は、コンピュータ等における実装上の無駄がないことである。

その理由は、属性情報が広大なベクトル空間を必要とする場合においても、予め集合を定義するためのメモリ等を確保する必要が無いためである。また、集合が必要に応じて生成および破壊され、常に空集合φが存在しないためである。

第３の効果は、集合を分割する際に、近隣属性を持つ要素と分離されないことである。

その理由は、任意の集合Ｇに属する要素Ｐ１〜Ｐｎの要素ベクトルが一定の方向に移動する場合、各要素が隣接する集合Ｇｎに移動するのではなく、集合Ｇの集合ベクトルも同時に移動するためである。また、一部の要素Ｐｉ〜Ｐｊの要素ベクトルが異なる方向に移動する場合、集合Ｇが効率的に集合Ｇ１およびＧ２に分割されるためである。

第４の効果は、各属性に対する重み付けが変化した際、集合の再構築が容易なことである。その理由は、本発明では集合は動的に形成されるため、新たな重み付けを用いて集合を分離および結合するだけで済むためである。

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。

図３を参照すると、本実施の形態は、分類の対象となる要素６１〜６ｎと、各要素が属する集合８１〜８ｍとを含む。

要素６１〜６ｎは、各要素の属性を記憶する属性情報７１〜７ｎを備える。

集合８１〜８ｍは、要素６１〜６ｎにより形成され、要素６１〜６ｎは、集合８１〜８ｍのいずれかに属する。

次に、本発明を実施するための最良の形態の構成について図面を参照して説明する。

図１は、本発明の構成を表したブロック図であり、コンピュータ装置からなる集合演算機構１０と、二次記憶装置からなる演算された集合の状態を記憶する集合記憶機構２０と、要素の入力や削除を指示するキーボード等の入力手段３０と、集合の演算結果を出力する出力手段４０と、要素の入力や削除の情報をネットワークによって取り込む通信機構５０と、から構成されている。

集合演算機構１０上では、分類ルール定義手段１１と、与えられた要素を集合に分類する要素分類手段１２と、新規に新たな要素が加わったり、要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段１３と、集合内の距離の近い要素の部分集合を取り出し集合を分割する集合分割手段１４と、２つの集合の距離が決められた閾値より小さい場合に２つの集合を統合する集合統合手段１５と、指定された要素を集合から取り除く要素削除手段１６と、から構成され、以上の各手段は、ソフトウェアプログラムとして動作する。

次に、図３から図７を参照して本実施の形態の動作について詳細に説明する。

各要素の持つ属性情報Ｐをベクトルで表したものを、ベクトルＰとする。

各要素が属する集合Ｇをベクトルで表したものを、ベクトルＧとする。ベクトルＧは集合Ｇに属するすべての要素６１￣６ｎのベクトルＰについての平均値とする。

各要素を集合に含むための閾値をＧｃｏｎ、集合を分割する閾値をＧｄｉｖ、集合を統合する閾値をＧｃｏｍとする。Ｇｃｏｎ、Ｇｄｉｖは各集合に共通な値であっても、各集合に固有の値であっても構わない。Ｇｃｏｍは各集合に共通の値とする。

初期状態において、要素Ｐおよび集合Ｇは存在しない。初期状態において、Ｇｃｏｎ、Ｇｄｉｖ、Ｇｃｏｍは∞（無限大）とすることもできるし、予め値を設定しておくこともできる。

図３には、集合８１，集合８２，集合８３，・・・集合８ｍがあって、各集合に属する要素６１から要素６ｎは属性情報として属性（Ａｔｔｒｉｂｕｔｅ）Ａ，Ｂ，Ｃの３つを持つ内容が例示されている。この例の場合、各要素の属性情報が３次元であることから、互いに直交する３軸を属性軸とし、各要素の属性値と属する集合を視覚化したものが図４である。

図４では、各集合に属する要素のもつ属性毎の平均値を各集合のもつベクトルの値としている。例えば、集合８１においては、属する要素が要素６１と要素６２であり、それぞれの要素の持つ属性であるＡｔｔｒｉｂｕｔｅＡ，Ｂ，Ｃの値は、ベクトル（６，３，１）とベクトル（７，１，２）であり、集合８１の持つベクトルＧ（８１）はその平均値をとって（６．５、２，１．５）となっている。

図５の（ａ）の場合、集合Ｇ１およびＧ２が存在し、任意の要素Ｐ１を追加する場合、ベクトルＰ１と集合Ｇ１のベクトルＧ１、およびベクトルＰ１と集合Ｇ２のベクトルＧ２との差分（距離）を求め、それぞれ集合Ｇ１の閾値Ｇ１ｃｏｎおよび集合Ｇ２の閾値Ｇ２ｃｏｎと比較する。この結果、それぞれの差分（距離）はＧ１ｃｏｎおよびＧ２ｃｏｎを超えるので、ベクトルＰ１と同一のベクトル値を持つ新たな集合Ｇｎｅｗを生成し、要素Ｐ１は新規の集合Ｇｎｅｗに属するものとする。

図５の（ｂ）の場合、集合Ｇ１およびＧ２が存在し、任意の要素Ｐ２を追加する場合、ベクトルＰ２とベクトルＧ１、およびベクトルＰ２とベクトルＧ２の差分（距離）を求め、それぞれ閾値Ｇ１ｃｏｎおよびＧ２ｃｏｎと比較する。この結果、それぞれの差分（距離）はＧ１ｃｏｎ以下およびＧ２ｃｏｎを超えるため、要素Ｐ２は集合Ｇ１に属することとする。

図５の（ｃ）の場合、集合Ｇ１およびＧ２が存在し、任意の要素Ｐ３を追加する場合、ベクトルＰ３とベクトルＧ１、およびベクトルＰ３とベクトルＧ２の差分（距離）を求め、それぞれ閾値Ｇ１ｃｏｎおよびＧ２ｃｏｎと比較する。この結果、それぞれの差分（距離）はＧ１ｃｏｎ以下およびＧ２ｃｏｎ以下であるが、Ｇ１との差分（距離）がＧ２との差分（距離）より大きいため、要素Ｐ３は集合Ｇ２に属することとする。

図６の場合、集合Ｇに複数の要素Ｐ１〜Ｐｎが含まれ、ベクトルＰ１〜Ｐｎの半数から大半のベクトルが集中すると推定される部分集合のベクトルＧ１および次点のベクトルが集中する部分集合ベクトルＧ２を求め、ベクトルＧ１およびＧ２の差分（距離）とＧｄｉｖとを比較する。

この結果、図６の（ａ）のように差分（距離）がＧｄｉｖ以下の場合は、ベクトルＧ１およびＧ２の平均を集合Ｇの新たなベクトル値とする。これは集合Ｇの移動として現れる。

図６の（ｂ）のように、差分（距離）がＧｄｉｖを超える場合、ベクトルＧ１およびＧ２をベクトル値とする新たな集合Ｇ１およびＧ２を生成し、図５にて説明の手順により要素Ｐ１〜Ｐｎをそれぞれ集合Ｇ１またはＧ２に属させ、集合Ｇを削除する。これは集合Ｇの分割として現れる。

集合Ｇ１およびＧ２に複数の要素Ｐ１〜Ｐｎが含まれる場合、ベクトルＧ１およびＧ２の差分（距離）とＧｃｏｍとを比較する（図７）。この結果、差分（距離）がＧｃｏｍを超える場合は何も行わない。差分（距離）がＧｃｏｍ以下の場合は、ベクトルＧ１およびＧ２の平均をベクトル値とする新たな集合Ｇを生成し、要素Ｐ１〜Ｐｎを集合Ｇに属させ、集合Ｇ１およびＧ２を削除する。これは集合Ｇの結合として現れる。

任意の要素Ｐの削除により、任意の集合Ｇに属する要素が全て無くなる場合、集合Ｇを削除する。これは集合Ｇの破壊として現れる。

図８に、図３の属性情報をｎ次元に拡張した場合を示す。

属性情報がｎ次元の場合でも、同様の方法により、本発明を適用することができる。

次に、図２のフローチャートを参照して本発明の実施例を説明する。

例えば、テレビの放送局等が、視聴者の番組のジャンル別の嗜好程度をアンケートによって調査し今後の番組の選定の参考にしようとしたとする。このとき、番組のジャンルを例えば、ドラマ、ニュース、スポーツに分け、それぞれのジャンルについての嗜好の程度を数値として１から５の５段階の評価値で提供してもらうとする。

ベクトルＰの形式は（ドラマ、ニュース、スポーツ）となる。尚、説明を単純にするため３つのジャンルとするが、特に３つに限定するものではなく、任意の数のジャンルが使用できる。

放送局では、例えば視聴者１００００人に対して電子メールでアンケートを送信して、２週間以内に回答を電子メールの返信として求めるようにしたとする。

分類ルール定義手段１１は、以下のような初期の実行環境キーボード等の入力手段３０からの指示に従って定義する（ステップＳ１）。

この場合、ジャンル別の有意な分類として、次のような８つの分類を想定することは自然である。
（１）ドラマ、ニュース、スポーツがすべて好きである。（５，５，５）がそれを代表する。
（２）ドラマ、ニュースが好きである。（５，５，０）がそれを代表する。
（３）ドラマ、スポーツが好きである。（５，０，５）がそれを代表する。
（４）ニュース、スポーツが好きである。（０，５，５）がそれを代表する。
（５）ドラマは好きである。（５，０，０）がそれを代表する。
（６）ニュースは好きである。（０，５，０）がそれを代表する。
（７）スポーツは好きである。（０，０，５）がそれを代表する。
（８）ドラマ、ニュース、スポーツはすべて好きでない。（０，０，０）がそれを代表する。図９に以上の空間の状態を例示する。

受信したアンケート結果は、（ｘ、ｙ、ｚ）の形式でｘ、ｙ、ｚはそれぞれ０から５の範囲の整数値をとる。そのため生起する（ｘ、ｙ、ｚ）の組み合わせの数は６ｘ６ｘ６＝２１６となる。尚、ｘ、ｙ、ｚがとる空間の大きさは５ｘ５ｘ５＝１２５である
この例の場合、空間の大きさ１２５にたいし１００００個の要素が配置されるので空間の大きさ１についての平均的な要素の散らばり数は８０となる。空間の大きさ１あたりの要素数が８０を超える領域については有意な領域と判断できる。２週間の間に収集されるアンケート結果は、その時点までに収集されたアンケート結果数を全空間の大きさで割った時の空間の大きさ１あたりの平均値を超える空間があれば有意と判断できる。空間の大きさを１として説明したが、ごく小さな領域において要素が過密状態であっても有意と言えないため、ある領域の大きさとその大きさに含まれる要素数から有意を判断する必要が有る。

分類された１つの集合を大きさの等しい８つの球で表現するとその半径ｒは、
４／３πｒ^３＝１２５／８から求めることができ、ｒは約１．５５となる。

Ｇｃｏｎ、Ｇｄｉｖ、Ｇｃｏｍの値を次のように決める。

Ｇｃｏｎのサイズは、その集合が含む要素の数によって決定されるものとし、初期のサイズをもとに、その集合が含む要素の数が増えると拡大し、要素の数が減ると減少するように管理されるものとする。要素数が増えるほどＧｃｏｎは大きくなるがその上限値はｒとする。初期状態では、最初にこの空間に投入された要素を中心点として、例えば１／３ｒのサイズを持つものとする。

Ｇｄｉｖは、例えば各集合についてのＧｃｏｎの１／２のサイズとする。Ｇｃｏｍは、例えばｒとする。

アンケート結果を受信する都度、そのアンケート結果の属する集合を決定して行くわけであるが、集合の分割や統合処理は、例えば１００件目のアンケートを受信すると、分割処理を実行し、２００件目のアンケートを受信すると、統合処理を実行する等、アンケート結果の受信の都度実行する必要は無く、適宜実行するようにするとよい。また、分割処理の実行回数と、統合処理の実行回数も同じ回数とする必要は無い。分割処理回数２に対し、統合処理回数１等としてもよい。

ここでは、集合分割手段１４は、アンケートの受信累積数が１００、３００、５００，・・・のように１００を初期値として、その後は２００回おきとなった段階で実行され、集合統合手段１５は、アンケートの受信累積数が、２００，４００．６００、・・・のように２００を初期値としてその後は２００おきとなった段階で実行されるものとする。

以上のように初期実行環境を定義する。また、集合に分類される各要素には要素を一意に識別するＩＤ（視聴者ＩＤ等）が付与されるものとする。

通信機構５０によって放送局がアンケート結果を電子メールの返信として受信することで要素を取り込む（ステップＳ２）。最初に受信したアンケート結果が、例えば（３，２，３）であったとする。要素分類手段１２は、集合記憶機構２０から初期値として定義された集合の状態を読み込み、以下のようにこのアンケート結果を集合に分類する（ステップＳ３）。

この場合、集合記憶機構２０には集合は未定義のため（３，２，３）を中心とした半径（Ｇｃｏｎ）として１／３ｒの集合が設定される。続いて
（ｘ_１，ｙ_１，ｚ_１）と（ｘ_２，ｙ_２，ｚ_３）との差分（距離）を
√〈（ｘ_１−ｙ_１）^２＋（ｘ_２−ｙ_２）^２＋（ｘ_３−ｙ_３）^２〉として求めるとする。

続いて２番目のアンケート結果が、この空間に投入されると、最初の（３，２，３）を中心とした集合のＧｃｏｎである１／３ｒ内にこの２番目の要素が含まれるか否かが２つの要素間の距離を元に確認される。もし含まれないなら、２番目の要素を中心とした１／３ｒをＧｃｏｎとする第２の集合が決定される。第１の集合に含まれる場合、集合ベクトル値計算手段１３は、第１の集合の第１番目の要素と第２番目の要素の平均値を新たな中心とし、Ｇｃｏｎを（１／３ｒ＋α）と拡大し、２つの要素を含む集合に変更する。以上のように操作した結果は、集合ベクトル値計算手段１３によって集合記憶機構２０に登録される。３番目以降に投入されるアンケート結果についても同様な操作が行われていく。

次に受信したアンケート結果の累積数が１００，３００，・・・かを確認し（ステップＳ５）、その場合、集合分割手段１５を実行する（ステップＳ６）。

さらに受信したアンケート結果の累積数が２００，４００，・・・かを確認し（ステップＳ７）、その場合、集合統合手段１５を実行する（ステップＳ８）。

さらに、アンケート結果の累積数が１００００件となった又は期限の２週間が経過したをチェックする（ステップＳ９）。累積数が１００００未満で期限が来ていない場合は（ステップＳ２）に戻る。累積数が１００００か期限が切れた場合、出力手段４０は、プリンタやディスプレイ等に集合記憶機構２０に記憶された最終的な集合情報を出力する（ステップＳ１０）。

以上の説明においては、集合の数を予め８と想定したが、例えばその倍の１６などと想定しそれに応じたＧｃｏｎ、Ｇｄｉｖ、Ｇｃｏｍを同様に定義して実行することも可能である。またＧｃｏｎのサイズを集合が含む要素の数に応じて変動するようにしたが、必ずしもそのようにする必要はなく固定のままであってもよい。また、Ｇｃｏｍのサイズは、統合処理の回数に応じて少しずつ減少させＧｃｏｎに近づけていったり、Ｇｄｉｖのサイズも分割処理の回数に伴い増加させ、Ｇｃｏｎのサイズに近づけていったりして、分割や統合による全体の集合の変動のバラツキを少なくしていくこともあってよい。

尚、このようにして半年とか１年等に１回の割で継続して同じ視聴者の集団に対してアンケート調査を行うような場合、各視聴者の興味の対象が変化していくのを捉えることができる。すでにある時点でのアンケート調査の結果が存在する時、次のアンケート調査を行ったとしたとする。ある視聴者からのアンケート結果を得た時、すでに同じ視聴者の前回のアンケート結果がある場合、要素削除手段１６は、前回のアンケート結果を削除する。そして新たなアンケート結果の登録を行う。

これにより、ある利用者の持つ属性に近い利用者たちの集合（たとえば、ドラマとニュース番組を視聴する割合が高い集合、スポーツ番組を視聴する割合が高い集合、等）に分割され、自分の趣味／嗜好に近い情報（＝目的の情報）に到達し易くなる。

ドラマとニュース番組を視聴する割合が高い集合に所属している利用者の中から、「どちらかと言えばニュース寄りで、最近はスポーツ番組の視聴割合が高くなってきた」といった部分集合が出てきた場合、Ｇｄｉｖにより、近い属性を持つ利用者同士が情報交換を続けつつ、元の集合から分離することが可能となる。

また、上記の集合が、さらにバラエティ番組の視聴割合が高くなった場合、Ｇｃｏｍにより、既存の「バラエティとスポーツ番組を視聴する割合が高い集合」と結合されるなど、本発明では、利用者の所属する集合の特性が連続的に変化する点が特長となる。

Ｇｃｏｎ、Ｇｄｉｖ、Ｇｃｏｍの具体的な値の決め方については、種々あり、以上の他に、上記の例では、ある特定の集合において、集合への所属利用者数や、１日あたりの書き込み数などが閾値を超えた場合にＧｄｉｖを小さくして分割を促したり、また逆に、集合への所属利用者数や、集合の分割／結合頻度が閾値より低い場合、Ｇｃｏｍを大きくして結合を促すなどを行ってもよい。

例えば、掲示板に書かれた内容の分類、アンケート結果の分類等に使用が可能と思われる。

本発明の実施例の構成を説明するブロック図である。本発明の実施例の動作を説明するフローチャートである。本発明の実施例の集合、要素、属性の関係の説明図である。本発明の実施例の属性が３次元の場合における集合、要素の関係の説明図である。本発明の実施例の要素の集合への分類の説明図である。本発明の実施例の集合を分割する説明図である。本発明の実施例の集合を統合する説明図である。本発明の実施例の属性がｎ次元の場合における集合、要素の関係の説明図である。本発明の実施例の要素の属する空間の説明図である。

符号の説明

１０集合演算機構
１１分類ルール定義手段
１２要素分類手段
１３集合ベクトル値計算手段
１４集合分割手段
１５集合統合手段
１６要素削除手段
２０集合記憶機構
３０入力手段
４０出力手段
５０通信機構
６１〜６ｎ要素
７１〜７ｎ属性情報
８１〜８ｍ集合

Claims

コンピュータ上で動作する集合の動的形成システムであって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する分類ルール定義手段と、前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類する要素分類手段と、新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段と、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する集合分割手段と、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する集合統合手段と、指定された要素を集合から取り除く要素削除手段と、を備えることを特徴とする集合の動的形成システム。
請求項１において、前記集合ベクトル値計算手段は、集合に属する要素のベクトル値の平均値を集合のベクトル値とすることを特徴とする集合の動的形成システム。
請求項１において、前記要素分類手段は、集合と要素とのベクトル値に基づく距離が、該集合の有する第１の閾値以下であると、該要素を該集合が含む要素とすることを特徴とする集合の動的形成システム。
請求項１において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、すべての集合についてその距離が第１の閾値を超えると、新たな集合を生成して要素Ｐを新たに生成した集合の要素とすることを特徴とする集合の動的形成システム。
請求項１において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、ある集合において求めた距離が第１の閾値以下の場合、該集合に要素Ｐを分類することを特徴とする集合の動的形成システム。
請求項１において、前記要素分類手段は、１又は複数の集合が存在する空間に、ある要素Ｐを追加する場合、要素Ｐのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第１の閾値と比較し、２以上の集合において求めた距離が第１の閾値以下の場合、２以上の集合において求めた距離が最小の集合に要素Ｐを分類することを特徴とする集合の動的形成システム。
請求項１において、前記集合分割手段は、集合が複数の要素Ｐ１〜Ｐｎを含み、ベクトルＰ１〜Ｐｎの半数程度のベクトルが集中する第１の部分集合のベクトルと第１の部分集合を除くベクトルが集中する第２の部分集合ベクトルを求め、第１の部分集合と第２の部分集合の距離が前記第２の閾値を超えると、該集合を分割し第１の部分集合と第２の部分集合をそれぞれ集合とすることを特徴とする集合の動的形成システム。
請求項１において、前記集合統合手段は、第１の集合のベクトルと第２の集合のベクトルの距離が、前記第３の閾値より小さい場合、第１の集合と第２の集合とを統合して新たな集合を生成することを特徴とする集合の動的形成システム。
請求項１において、前記要素分類手段による１又は複数の要素の分類後、前記集合分割手段または前記集合統合手段を実行させることを特徴とする集合の動的形成システム。
請求項１において、前記ベクトル値計算手段は、集合に属する要素数の増減に対応して前記第１の閾値を大きくしたり小さくしたりすることを特徴とする集合の動的形成システム。
コンピュータ上で動作する集合の動的形成システムにおける集合の動的形成方法であって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第１のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類したり、指定された要素を集合から取り除く第２のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第３のステップと、
前記第３のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する第４のステップと、
前記第３のステップの実行後必要に応じて起動され、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する第５のステップと、
を備えることを特徴とする集合の動的形成方法。
コンピュータに、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第１のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第１の閾値によって集合に分類したり、指定された要素を集合から取り除く第２のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第３のステップと、
前記第３のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第２の閾値より大きいと前記部分集合を新たに集合として集合を分割する第４のステップと、
前記第３のステップの実行後必要に応じて起動され、２つの集合のベクトル値による距離が第３の閾値より小さい場合に２つの集合を統合する第５のステップと、
を実行させるプログラム。