JP2005063341A - 集合の動的形成システム、集合の動的形成方法及びそのプログラム - Google Patents

集合の動的形成システム、集合の動的形成方法及びそのプログラム Download PDF

Info

Publication number
JP2005063341A
JP2005063341A JP2003295845A JP2003295845A JP2005063341A JP 2005063341 A JP2005063341 A JP 2005063341A JP 2003295845 A JP2003295845 A JP 2003295845A JP 2003295845 A JP2003295845 A JP 2003295845A JP 2005063341 A JP2005063341 A JP 2005063341A
Authority
JP
Japan
Prior art keywords
vector
sets
distance
threshold
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003295845A
Other languages
English (en)
Inventor
Soichi Kodaira
荘一 小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2003295845A priority Critical patent/JP2005063341A/ja
Publication of JP2005063341A publication Critical patent/JP2005063341A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】要素をその属性に従って集合に分類する場合、1つには適切な領域を持つ集合を予め定義することが難しいという問題がある。要素ベクトルのとる範囲が判っている場合でも、全集合の定義に失敗した場合、再度全集合の定義を行う必要があるためである。
【解決手段】本発明は、各要素の属性情報を用いて、集合の生成および移動、分割、結合、破壊を行う構成を提供するものである。
図3において、属性情報71〜7nは、各要素を属させる集合の生成および各要素が属する集合を決定するため、各要素の持つ特性を記憶する。変化する各要素の属性情報に従い、集合の定義を動的に変化させることで、集合が効率良く各要素を含み、集合間の移動における任意の要素の、近隣属性を持つ要素との分離を防ぐことを可能とする。
【選択図】 図1

Description

本発明は、属性を持った要素の集合への分類に関し、特に、ある閾値に従って集合の動的な分割や統合を行う集合の動的形成システム、集合の動的形成方法及びそのプログラムに関する。
構成要素の分類を行う時、監視対象の構成要素の集合を一般化したグループ分けをし、各グループにはグループ別に計算した属性データとグループに属する構成要素データを持たせ、前記構成要素又はその属性の変更に伴い影響を受ける範囲のグループを特定し、影響を受ける範囲のグループのみを再構成すると共に該グループの属性データを再計算することで情報の変更による影響を限定しオペレーションを容易にする内容が特許文献1に記載されている。
特開平11−299098(ページ3−6、図1)
従来、前述した特許文献1を含め、集合はシステム構築時に定義され、定期的に要素の属する集合を変更する作業を行っていた。
しかし、この従来技術には、次のような問題点があった。
第1の問題点は、適切な領域を持つ集合を予め定義することが難しいということである。
要素ベクトルのとる範囲が判っている場合でも、全集合の定義に失敗した場合、再度全集合の定義を行う必要があるためである。
第2の問題点は、要素の持つ属性の数が増えると集合を定義する資源が非常に多く必要となるということである。
単純計算で、1つの属性が5段階の値を記憶する場合、2属性で25集合、3属性で125集合、4属性で625集合を定義することから、非常に無駄が多くなるためである。
第3の問題点は、属性の変化により要素が属する集合を変更する場合、属する集合の属性が離散的に変化するということである。
構成要素が全く異なる集合への移動により、参照すべき集合自体の属性が急激に変化するためである。また、同一の集合に属する各要素の付帯情報を利用する際、移動後から全く内容の異なるものになってしまうためである。
第4の問題点は、集合の再構築が難しいということである。
集合を再構築する場合、新たな集合を定義した後、全てのデータを再度評価する必要があり、その際に集合の属性が離散的に変化するためである。
本発明は、以上の問題点を解決する集合の動的形成システム、集合の動的形成方法及びそのプログラムを提供する。
本発明の第1の集合の動的形成システムは、コンピュータ上で動作する集合の動的形成システムであって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する分類ルール定義手段と、前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類する要素分類手段と、新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段と、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する集合分割手段と、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する集合統合手段と、指定された要素を集合から取り除く要素削除手段と、を備える。
本発明の第2の集合の動的形成システムは、第1の発明において、前記集合ベクトル値計算手段は、集合に属する要素のベクトル値の平均値を集合のベクトル値とすることを備える。
本発明の第3の集合の動的形成システムは、第1の発明において、前記要素分類手段は、集合と要素とのベクトル値に基づく距離が、該集合の有する第1の閾値以下であると、該要素を該集合が含む要素とすることを備える。
本発明の第4の集合の動的形成システムは、第1の発明において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、すべての集合についてその距離が第1の閾値を超えると、新たな集合を生成して要素Pを新たに生成した集合の要素とすることを備える。
本発明の第5の集合の動的形成システムは、第1の発明において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、ある集合において求めた距離が第1の閾値以下の場合、該集合に要素Pを分類することを備える。
本発明の第6の集合の動的形成システムは、第1の発明において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、2以上の集合において求めた距離が第1の閾値以下の場合、2以上の集合において求めた距離が最小の集合に要素Pを分類することを備える。
本発明の第7の集合の動的形成システムは、第1の発明において、前記集合分割手段は、集合が複数の要素P1〜Pnを含み、ベクトルP1〜Pnの半数程度のベクトルが集中する第1の部分集合のベクトルと第1の部分集合を除くベクトルが集中する第2の部分集合ベクトルを求め、第1の部分集合と第2の部分集合の距離が前記第2の閾値を超えると、該集合を分割し第1の部分集合と第2の部分集合をそれぞれ集合とすることを備える。
本発明の第8の集合の動的形成システムは、第1の発明において、前記集合統合手段は、第1の集合のベクトルと第2の集合のベクトルの距離が、前記第3の閾値より小さい場合、第1の集合と第2の集合とを統合して新たな集合を生成することを備える。
本発明の第9の集合の動的形成システムは、第1の発明において、前記要素分類手段による1又は複数の要素の分類後、前記集合分割手段または前記集合統合手段を実行させることを備える。
本発明の第10の集合の動的形成システムは、第1の発明において、前記ベクトル値計算手段は、集合に属する要素数の増減に対応して前記第1の閾値を大きくしたり小さくしたりすることを備える。
本発明の第1の集合の動的形成方法は、コンピュータ上で動作する集合の動的形成システムにおける集合の動的形成方法であって、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第1のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類したり、指定された要素を集合から取り除く第2のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第3のステップと、
前記第3のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する第4のステップと、
前記第3のステップの実行後必要に応じて起動され、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する第5のステップと、
を備える。
本発明の第1のプログラムは、
コンピュータに、
ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第1のステップと、
前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類したり、指定された要素を集合から取り除く第2のステップと、
新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第3のステップと、
前記第3のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する第4のステップと、
前記第3のステップの実行後必要に応じて起動され、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する第5のステップと、
を実行させる。
第1の効果は、予め集合を定義する必要が無いことである。
その理由は、要素を追加する際に、既存の集合に属するか、新たな集合を生成して属するかが一意に決定されるためである。
第2の効果は、コンピュータ等における実装上の無駄がないことである。
その理由は、属性情報が広大なベクトル空間を必要とする場合においても、予め集合を定義するためのメモリ等を確保する必要が無いためである。また、集合が必要に応じて生成および破壊され、常に空集合φが存在しないためである。
第3の効果は、集合を分割する際に、近隣属性を持つ要素と分離されないことである。
その理由は、任意の集合Gに属する要素P1〜Pnの要素ベクトルが一定の方向に移動する場合、各要素が隣接する集合Gnに移動するのではなく、集合Gの集合ベクトルも同時に移動するためである。また、一部の要素Pi〜Pjの要素ベクトルが異なる方向に移動する場合、集合Gが効率的に集合G1およびG2に分割されるためである。
第4の効果は、各属性に対する重み付けが変化した際、集合の再構築が容易なことである。その理由は、本発明では集合は動的に形成されるため、新たな重み付けを用いて集合を分離および結合するだけで済むためである。
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。
図3を参照すると、本実施の形態は、分類の対象となる要素61〜6nと、各要素が属する集合81〜8mとを含む。
要素61〜6nは、各要素の属性を記憶する属性情報71〜7nを備える。
集合81〜8mは、要素61〜6nにより形成され、要素61〜6nは、集合81〜8mのいずれかに属する。
次に、本発明を実施するための最良の形態の構成について図面を参照して説明する。
図1は、本発明の構成を表したブロック図であり、コンピュータ装置からなる集合演算機構10と、二次記憶装置からなる演算された集合の状態を記憶する集合記憶機構20と、要素の入力や削除を指示するキーボード等の入力手段30と、集合の演算結果を出力する出力手段40と、要素の入力や削除の情報をネットワークによって取り込む通信機構50と、から構成されている。
集合演算機構10上では、分類ルール定義手段11と、与えられた要素を集合に分類する要素分類手段12と、新規に新たな要素が加わったり、要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段13と、集合内の距離の近い要素の部分集合を取り出し集合を分割する集合分割手段14と、2つの集合の距離が決められた閾値より小さい場合に2つの集合を統合する集合統合手段15と、指定された要素を集合から取り除く要素削除手段16と、から構成され、以上の各手段は、ソフトウェアプログラムとして動作する。
次に、図3から図7を参照して本実施の形態の動作について詳細に説明する。
各要素の持つ属性情報Pをベクトルで表したものを、ベクトルPとする。
各要素が属する集合Gをベクトルで表したものを、ベクトルGとする。ベクトルGは集合Gに属するすべての要素61 ̄6nのベクトルPについての平均値とする。
各要素を集合に含むための閾値をGcon、集合を分割する閾値をGdiv、集合を統合する閾値をGcomとする。Gcon、Gdivは各集合に共通な値であっても、各集合に固有の値であっても構わない。Gcomは各集合に共通の値とする。
初期状態において、要素Pおよび集合Gは存在しない。初期状態において、Gcon、Gdiv、Gcomは∞(無限大)とすることもできるし、予め値を設定しておくこともできる。
図3には、集合81,集合82,集合83,・・・集合8mがあって、各集合に属する要素61から要素6nは属性情報として属性(Attribute)A,B,Cの3つを持つ内容が例示されている。この例の場合、各要素の属性情報が3次元であることから、互いに直交する3軸を属性軸とし、各要素の属性値と属する集合を視覚化したものが図4である。
図4では、各集合に属する要素のもつ属性毎の平均値を各集合のもつベクトルの値としている。例えば、集合81においては、属する要素が要素61と要素62であり、それぞれの要素の持つ属性であるAttributeA,B,Cの値は、ベクトル(6,3,1)とベクトル(7,1,2)であり、集合81の持つベクトルG(81)はその平均値をとって(6.5、2,1.5)となっている。
図5の(a)の場合、集合G1およびG2が存在し、任意の要素P1を追加する場合、ベクトルP1と集合G1のベクトルG1、およびベクトルP1と集合G2のベクトルG2との差分(距離)を求め、それぞれ集合G1の閾値G1conおよび集合G2の閾値G2conと比較する。この結果、それぞれの差分(距離)はG1conおよびG2conを超えるので、ベクトルP1と同一のベクトル値を持つ新たな集合Gnewを生成し、要素P1は新規の集合Gnewに属するものとする。
図5の(b)の場合、集合G1およびG2が存在し、任意の要素P2を追加する場合、ベクトルP2とベクトルG1、およびベクトルP2とベクトルG2の差分(距離)を求め、それぞれ閾値G1conおよびG2conと比較する。この結果、それぞれの差分(距離)はG1con以下およびG2conを超えるため、要素P2は集合G1に属することとする。
図5の(c)の場合、集合G1およびG2が存在し、任意の要素P3を追加する場合、ベクトルP3とベクトルG1、およびベクトルP3とベクトルG2の差分(距離)を求め、それぞれ閾値G1conおよびG2conと比較する。この結果、それぞれの差分(距離)はG1con以下およびG2con以下であるが、G1との差分(距離)がG2との差分(距離)より大きいため、要素P3は集合G2に属することとする。
図6の場合、集合Gに複数の要素P1〜Pnが含まれ、ベクトルP1〜Pnの半数から大半のベクトルが集中すると推定される部分集合のベクトルG1および次点のベクトルが集中する部分集合ベクトルG2を求め、ベクトルG1およびG2の差分(距離)とGdivとを比較する。
この結果、図6の(a)のように差分(距離)がGdiv以下の場合は、ベクトルG1およびG2の平均を集合Gの新たなベクトル値とする。これは集合Gの移動として現れる。
図6の(b)のように、差分(距離)がGdivを超える場合、ベクトルG1およびG2をベクトル値とする新たな集合G1およびG2を生成し、図5にて説明の手順により要素P1〜Pnをそれぞれ集合G1またはG2に属させ、集合Gを削除する。これは集合Gの分割として現れる。
集合G1およびG2に複数の要素P1〜Pnが含まれる場合、ベクトルG1およびG2の差分(距離)とGcomとを比較する(図7)。この結果、差分(距離)がGcomを超える場合は何も行わない。差分(距離)がGcom以下の場合は、ベクトルG1およびG2の平均をベクトル値とする新たな集合Gを生成し、要素P1〜Pnを集合Gに属させ、集合G1およびG2を削除する。これは集合Gの結合として現れる。
任意の要素Pの削除により、任意の集合Gに属する要素が全て無くなる場合、集合Gを削除する。これは集合Gの破壊として現れる。
図8に、図3の属性情報をn次元に拡張した場合を示す。
属性情報がn次元の場合でも、同様の方法により、本発明を適用することができる。
次に、図2のフローチャートを参照して本発明の実施例を説明する。
例えば、テレビの放送局等が、視聴者の番組のジャンル別の嗜好程度をアンケートによって調査し今後の番組の選定の参考にしようとしたとする。このとき、番組のジャンルを例えば、ドラマ、ニュース、スポーツに分け、それぞれのジャンルについての嗜好の程度を数値として1から5の5段階の評価値で提供してもらうとする。
ベクトルPの形式は(ドラマ、ニュース、スポーツ)となる。尚、説明を単純にするため3つのジャンルとするが、特に3つに限定するものではなく、任意の数のジャンルが使用できる。
放送局では、例えば視聴者10000人に対して電子メールでアンケートを送信して、2週間以内に回答を電子メールの返信として求めるようにしたとする。
分類ルール定義手段11は、以下のような初期の実行環境キーボード等の入力手段30からの指示に従って定義する(ステップS1)。
この場合、ジャンル別の有意な分類として、次のような8つの分類を想定することは自然である。
(1)ドラマ、ニュース、スポーツがすべて好きである。(5,5,5)がそれを代表する。
(2)ドラマ、ニュースが好きである。(5,5,0)がそれを代表する。
(3)ドラマ、スポーツが好きである。(5,0,5)がそれを代表する。
(4)ニュース、スポーツが好きである。(0,5,5)がそれを代表する。
(5)ドラマは好きである。(5,0,0)がそれを代表する。
(6)ニュースは好きである。(0,5,0)がそれを代表する。
(7)スポーツは好きである。(0,0,5)がそれを代表する。
(8)ドラマ、ニュース、スポーツはすべて好きでない。(0,0,0)がそれを代表する。図9に以上の空間の状態を例示する。
受信したアンケート結果は、(x、y、z)の形式でx、y、zはそれぞれ0から5の範囲の整数値をとる。そのため生起する(x、y、z)の組み合わせの数は6x6x6=216となる。尚、x、y、zがとる空間の大きさは5x5x5=125である
この例の場合、空間の大きさ125にたいし10000個の要素が配置されるので空間の大きさ1についての平均的な要素の散らばり数は80となる。空間の大きさ1あたりの要素数が80を超える領域については有意な領域と判断できる。2週間の間に収集されるアンケート結果は、その時点までに収集されたアンケート結果数を全空間の大きさで割った時の空間の大きさ1あたりの平均値を超える空間があれば有意と判断できる。空間の大きさを1として説明したが、ごく小さな領域において要素が過密状態であっても有意と言えないため、ある領域の大きさとその大きさに含まれる要素数から有意を判断する必要が有る。
分類された1つの集合を大きさの等しい8つの球で表現するとその半径rは、
4/3πr=125/8から求めることができ、rは約1.55となる。
Gcon、Gdiv、Gcomの値を次のように決める。
Gconのサイズは、その集合が含む要素の数によって決定されるものとし、初期のサイズをもとに、その集合が含む要素の数が増えると拡大し、要素の数が減ると減少するように管理されるものとする。要素数が増えるほどGconは大きくなるがその上限値はrとする。初期状態では、最初にこの空間に投入された要素を中心点として、例えば1/3rのサイズを持つものとする。
Gdivは、例えば各集合についてのGconの1/2のサイズとする。Gcomは、例えばrとする。
アンケート結果を受信する都度、そのアンケート結果の属する集合を決定して行くわけであるが、集合の分割や統合処理は、例えば100件目のアンケートを受信すると、分割処理を実行し、200件目のアンケートを受信すると、統合処理を実行する等、アンケート結果の受信の都度実行する必要は無く、適宜実行するようにするとよい。また、分割処理の実行回数と、統合処理の実行回数も同じ回数とする必要は無い。分割処理回数2に対し、統合処理回数1等としてもよい。
ここでは、集合分割手段14は、アンケートの受信累積数が100、300、500,・・・のように100を初期値として、その後は200回おきとなった段階で実行され、集合統合手段15は、アンケートの受信累積数が、200,400.600、・・・のように200を初期値としてその後は200おきとなった段階で実行されるものとする。
以上のように初期実行環境を定義する。また、集合に分類される各要素には要素を一意に識別するID(視聴者ID等)が付与されるものとする。
通信機構50によって放送局がアンケート結果を電子メールの返信として受信することで要素を取り込む(ステップS2)。最初に受信したアンケート結果が、例えば(3,2,3)であったとする。要素分類手段12は、集合記憶機構20から初期値として定義された集合の状態を読み込み、以下のようにこのアンケート結果を集合に分類する(ステップS3)。
この場合、集合記憶機構20には集合は未定義のため(3,2,3)を中心とした半径(Gcon)として1/3rの集合が設定される。続いて
(x,y,z)と(x,y,z)との差分(距離)を
√〈(x−y+(x−y+(x−y〉として求めるとする。
続いて2番目のアンケート結果が、この空間に投入されると、最初の(3,2,3)を中心とした集合のGconである1/3r内にこの2番目の要素が含まれるか否かが2つの要素間の距離を元に確認される。もし含まれないなら、2番目の要素を中心とした1/3rをGconとする第2の集合が決定される。第1の集合に含まれる場合、集合ベクトル値計算手段13は、第1の集合の第1番目の要素と第2番目の要素の平均値を新たな中心とし、Gconを(1/3r+α)と拡大し、2つの要素を含む集合に変更する。以上のように操作した結果は、集合ベクトル値計算手段13によって集合記憶機構20に登録される。3番目以降に投入されるアンケート結果についても同様な操作が行われていく。
次に受信したアンケート結果の累積数が100,300,・・・かを確認し(ステップS5)、その場合、集合分割手段15を実行する(ステップS6)。
さらに受信したアンケート結果の累積数が200,400,・・・かを確認し(ステップS7)、その場合、集合統合手段15を実行する(ステップS8)。
さらに、アンケート結果の累積数が10000件となった又は期限の2週間が経過したをチェックする(ステップS9)。累積数が10000未満で期限が来ていない場合は(ステップS2)に戻る。累積数が10000か期限が切れた場合、出力手段40は、プリンタやディスプレイ等に集合記憶機構20に記憶された最終的な集合情報を出力する(ステップS10)。
以上の説明においては、集合の数を予め8と想定したが、例えばその倍の16などと想定しそれに応じたGcon、Gdiv、Gcomを同様に定義して実行することも可能である。またGconのサイズを集合が含む要素の数に応じて変動するようにしたが、必ずしもそのようにする必要はなく固定のままであってもよい。また、Gcomのサイズは、統合処理の回数に応じて少しずつ減少させGconに近づけていったり、Gdivのサイズも分割処理の回数に伴い増加させ、Gconのサイズに近づけていったりして、分割や統合による全体の集合の変動のバラツキを少なくしていくこともあってよい。
尚、このようにして半年とか1年等に1回の割で継続して同じ視聴者の集団に対してアンケート調査を行うような場合、各視聴者の興味の対象が変化していくのを捉えることができる。すでにある時点でのアンケート調査の結果が存在する時、次のアンケート調査を行ったとしたとする。ある視聴者からのアンケート結果を得た時、すでに同じ視聴者の前回のアンケート結果がある場合、要素削除手段16は、前回のアンケート結果を削除する。そして新たなアンケート結果の登録を行う。
これにより、ある利用者の持つ属性に近い利用者たちの集合 ( たとえば、ドラマとニュース番組を視聴する割合が高い集合、スポーツ番組を視聴する割合が高い集合、等 ) に分割され、自分の趣味/嗜好に近い情報 ( = 目的の情報 )に到達し易くなる。
ドラマとニュース番組を視聴する割合が高い集合に所属している利用者の中から、「どちらかと言えばニュース寄りで、最近はスポーツ番組の視聴割合が高くなってきた」といった部分集合が出てきた場合、Gdiv により、近い属性を持つ利用者同士が情報交換を続けつつ、元の集合から分離することが可能となる。
また、上記の集合が、さらにバラエティ番組の視聴割合が高くなった場合、Gcomにより、既存の「バラエティとスポーツ番組を視聴する割合が高い集合」と結合されるなど、本発明では、利用者の所属する集合の特性が連続的に変化する点が特長となる。
Gcon、Gdiv、Gcomの具体的な値の決め方については、種々あり、以上の他に、上記の例では、ある特定の集合において、集合への所属利用者数や、1日あたりの書き込み数などが閾値を超えた場合に Gdivを小さくして分割を促したり、また逆に、集合への所属利用者数や、集合の分割/結合頻度が閾値より低い場合、Gcomを大きくして結合を促すなどを行ってもよい。
例えば、掲示板に書かれた内容の分類、アンケート結果の分類等に使用が可能と思われる。
本発明の実施例の構成を説明するブロック図である。 本発明の実施例の動作を説明するフローチャートである。 本発明の実施例の集合、要素、属性の関係の説明図である。 本発明の実施例の属性が3次元の場合における集合、要素の関係の説明図である。 本発明の実施例の要素の集合への分類の説明図である。 本発明の実施例の集合を分割する説明図である。 本発明の実施例の集合を統合する説明図である。 本発明の実施例の属性がn次元の場合における集合、要素の関係の説明図である。 本発明の実施例の要素の属する空間の説明図である。
符号の説明
10 集合演算機構
11 分類ルール定義手段
12 要素分類手段
13 集合ベクトル値計算手段
14 集合分割手段
15 集合統合手段
16 要素削除手段
20 集合記憶機構
30 入力手段
40 出力手段
50 通信機構
61〜6n 要素
71〜7n 属性情報
81〜8m 集合

Claims (12)

  1. コンピュータ上で動作する集合の動的形成システムであって、
    ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する分類ルール定義手段と、前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類する要素分類手段と、新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする集合ベクトル値計算手段と、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する集合分割手段と、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する集合統合手段と、指定された要素を集合から取り除く要素削除手段と、を備えることを特徴とする集合の動的形成システム。
  2. 請求項1において、前記集合ベクトル値計算手段は、集合に属する要素のベクトル値の平均値を集合のベクトル値とすることを特徴とする集合の動的形成システム。
  3. 請求項1において、前記要素分類手段は、集合と要素とのベクトル値に基づく距離が、該集合の有する第1の閾値以下であると、該要素を該集合が含む要素とすることを特徴とする集合の動的形成システム。
  4. 請求項1において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、すべての集合についてその距離が第1の閾値を超えると、新たな集合を生成して要素Pを新たに生成した集合の要素とすることを特徴とする集合の動的形成システム。
  5. 請求項1において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、ある集合において求めた距離が第1の閾値以下の場合、該集合に要素Pを分類することを特徴とする集合の動的形成システム。
  6. 請求項1において、前記要素分類手段は、1又は複数の集合が存在する空間に、ある要素Pを追加する場合、要素Pのベクトルと各集合のベクトルとの距離を求め、求めた距離と集合の有する第1の閾値と比較し、2以上の集合において求めた距離が第1の閾値以下の場合、2以上の集合において求めた距離が最小の集合に要素Pを分類することを特徴とする集合の動的形成システム。
  7. 請求項1において、前記集合分割手段は、集合が複数の要素P1〜Pnを含み、ベクトルP1〜Pnの半数程度のベクトルが集中する第1の部分集合のベクトルと第1の部分集合を除くベクトルが集中する第2の部分集合ベクトルを求め、第1の部分集合と第2の部分集合の距離が前記第2の閾値を超えると、該集合を分割し第1の部分集合と第2の部分集合をそれぞれ集合とすることを特徴とする集合の動的形成システム。
  8. 請求項1において、前記集合統合手段は、第1の集合のベクトルと第2の集合のベクトルの距離が、前記第3の閾値より小さい場合、第1の集合と第2の集合とを統合して新たな集合を生成することを特徴とする集合の動的形成システム。
  9. 請求項1において、前記要素分類手段による1又は複数の要素の分類後、前記集合分割手段または前記集合統合手段を実行させることを特徴とする集合の動的形成システム。
  10. 請求項1において、前記ベクトル値計算手段は、集合に属する要素数の増減に対応して前記第1の閾値を大きくしたり小さくしたりすることを特徴とする集合の動的形成システム。
  11. コンピュータ上で動作する集合の動的形成システムにおける集合の動的形成方法であって、
    ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第1のステップと、
    前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類したり、指定された要素を集合から取り除く第2のステップと、
    新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第3のステップと、
    前記第3のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する第4のステップと、
    前記第3のステップの実行後必要に応じて起動され、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する第5のステップと、
    を備えることを特徴とする集合の動的形成方法。
  12. コンピュータに、
    ベクトル値で表現された要素を集合に分類するための前提となる条件を設定する第1のステップと、
    前記条件に従い与えられた要素をベクトル値をもとに各集合の有する第1の閾値によって集合に分類したり、指定された要素を集合から取り除く第2のステップと、
    新規に要素が加わったり要素が削除された場合にその集合のベクトル値の再計算をする第3のステップと、
    前記第3のステップの実行後必要に応じて起動され、集合内の部分集合間のベクトル値による距離が第2の閾値より大きいと前記部分集合を新たに集合として集合を分割する第4のステップと、
    前記第3のステップの実行後必要に応じて起動され、2つの集合のベクトル値による距離が第3の閾値より小さい場合に2つの集合を統合する第5のステップと、
    を実行させるプログラム。
JP2003295845A 2003-08-20 2003-08-20 集合の動的形成システム、集合の動的形成方法及びそのプログラム Pending JP2005063341A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003295845A JP2005063341A (ja) 2003-08-20 2003-08-20 集合の動的形成システム、集合の動的形成方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003295845A JP2005063341A (ja) 2003-08-20 2003-08-20 集合の動的形成システム、集合の動的形成方法及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2005063341A true JP2005063341A (ja) 2005-03-10

Family

ID=34371933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003295845A Pending JP2005063341A (ja) 2003-08-20 2003-08-20 集合の動的形成システム、集合の動的形成方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2005063341A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186256A (ja) * 2009-02-10 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> 逐次クラスタリング装置とその方法及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329106A (ja) * 1995-05-31 1996-12-13 Mitsubishi Electric Corp 辞書生成方法、単語集合構造化方法、文書集合構造化方法およびそれらの方法を用いた発想支援システム
JPH11203415A (ja) * 1998-01-16 1999-07-30 Fuji Xerox Co Ltd 類似パターンカテゴリ識別辞書作成装置および方法
JP2000259712A (ja) * 1999-03-04 2000-09-22 Mitsubishi Electric Corp 介護計画作成支援装置および介護計画作成支援装置における介護計画作成方法
JP2001229362A (ja) * 2000-02-17 2001-08-24 Nippon Telegr & Teleph Corp <Ntt> 情報クラスタリング装置および情報クラスタリングプログラムを記録した記録媒体
JP2002117046A (ja) * 2000-10-05 2002-04-19 Just Syst Corp 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002269120A (ja) * 2001-03-14 2002-09-20 Ricoh Co Ltd 文書分類装置、文書分類方法及び該文書分類方法を実行するプログラム記録媒体
JP2004503849A (ja) * 2000-07-07 2004-02-05 ライオン バイオサイエンス アクチェンゲゼルシャフト 電子データを整理する方法および装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329106A (ja) * 1995-05-31 1996-12-13 Mitsubishi Electric Corp 辞書生成方法、単語集合構造化方法、文書集合構造化方法およびそれらの方法を用いた発想支援システム
JPH11203415A (ja) * 1998-01-16 1999-07-30 Fuji Xerox Co Ltd 類似パターンカテゴリ識別辞書作成装置および方法
JP2000259712A (ja) * 1999-03-04 2000-09-22 Mitsubishi Electric Corp 介護計画作成支援装置および介護計画作成支援装置における介護計画作成方法
JP2001229362A (ja) * 2000-02-17 2001-08-24 Nippon Telegr & Teleph Corp <Ntt> 情報クラスタリング装置および情報クラスタリングプログラムを記録した記録媒体
JP2004503849A (ja) * 2000-07-07 2004-02-05 ライオン バイオサイエンス アクチェンゲゼルシャフト 電子データを整理する方法および装置
JP2002117046A (ja) * 2000-10-05 2002-04-19 Just Syst Corp 文書分類装置、文書分類方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002269120A (ja) * 2001-03-14 2002-09-20 Ricoh Co Ltd 文書分類装置、文書分類方法及び該文書分類方法を実行するプログラム記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANDERBERG M.R., クラスター分析とその応用, vol. 第2版, JPN6008010793, 20 December 1995 (1995-12-20), JP, pages 201 - 227, ISSN: 0000994465 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010186256A (ja) * 2009-02-10 2010-08-26 Nippon Telegr & Teleph Corp <Ntt> 逐次クラスタリング装置とその方法及びプログラム

Similar Documents

Publication Publication Date Title
CN102446220B (zh) 用于可视化数据的自适应树结构
CN106326391B (zh) 多媒体资源推荐方法及装置
US11537857B2 (en) Pooling processing method and system applied to convolutional neural network
CN104053023B (zh) 一种确定视频相似度的方法及装置
He et al. Graph coloring based surveillance video synopsis
US9996391B2 (en) Parallel computer system, method of controlling parallel computer system, and recording medium
CN104113784A (zh) 智能电视系统及其方法
CN109275012A (zh) 一种直播弹幕显示方法及装置
CN105320702A (zh) 一种用户行为数据的分析方法、装置及智能电视
US10762122B2 (en) Method and device for assessing quality of multimedia resource
CN113515672A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN111506823A (zh) 信息推荐方法、装置及计算机设备
US20140325405A1 (en) Auto-completion of partial line pattern
US10146659B2 (en) Large event log replay method and system
CN114692007B (zh) 表示信息的确定方法、装置、设备及存储介质
Szwabe et al. Semantically enhanced collaborative filtering based on RSVD
CN104954824A (zh) 一种用于进行视频设置的方法、设备与系统
US20140172556A1 (en) Method and apparatus to provide advertisement data based on device information and operational information of apparatuses
US20120136911A1 (en) Information processing apparatus, information processing method and information processing program
CN105956061A (zh) 一种用户间相似度确定方法及装置
CN105550334A (zh) 一种视频推荐方法及装置
JP2005063341A (ja) 集合の動的形成システム、集合の動的形成方法及びそのプログラム
CN113312563B (zh) 信息推荐方法、装置、设备及存储介质
CN104834728A (zh) 一种订阅视频的推送方法及装置
CN115564578B (zh) 欺诈识别模型生成方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050315

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080613

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080708