JP5265656B2 - クラスタリング装置及びクラスタリング方法 - Google Patents
クラスタリング装置及びクラスタリング方法 Download PDFInfo
- Publication number
- JP5265656B2 JP5265656B2 JP2010289242A JP2010289242A JP5265656B2 JP 5265656 B2 JP5265656 B2 JP 5265656B2 JP 2010289242 A JP2010289242 A JP 2010289242A JP 2010289242 A JP2010289242 A JP 2010289242A JP 5265656 B2 JP5265656 B2 JP 5265656B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- cluster
- data point
- new
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 50
- 238000004590 computer program Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
データの特徴を表すデータ点をクラスタリングするためのクラスタリング装置であって、
木構造インデックスが格納されたインデックスDBと、
入力された新規データ点を受け付けるデータ点受付部と、
前記新規データ点が属すべきクラスタを、前記木構造インデックスを用いて検索するクラスタ検索部と、
前記新規データ点と、検索された前記クラスタの中心点との距離が固定値未満である場合に、前記新規データ点を、前記クラスタに属させ、前記固定値以上である場合に、新たなクラスタを生成して、その新たに生成したクラスタに前記新規データ点を属させるデータ追加部と
を備える、データ点のクラスタリング装置。
前記データ追加部は、前記新たなクラスタを、検索された前記クラスタの下層に生成する構成となっている、項目1に記載のクラスタリング装置。
前記データ追加部は、前記新たなクラスタを、検索された前記クラスタと並列に生成する構成となっている、項目1に記載のクラスタリング装置。
前記データ点は、画像データの特徴を示す特徴ベクトルである、項目1〜3のいずれか1項に記載のクラスタリング装置。
処理部と記憶部とを用いて、データの特徴を表すデータ点をクラスタリングするためのクラスタリング方法であって、
入力されたデータ点を受け付けて前記記憶部に格納するステップと、
前記新規データ点が属すべきクラスタを、前記処理部により、木構造インデックスを用いて検索するステップと、
前記新規データ点と、検索された前記クラスタの中心点との距離が固定値未満である場合に、前記新規データ点を、前記処理部により、前記クラスタに属させ、前記固定値以上である場合に、前記処理部により、新たなクラスタを生成して、その新たに生成したクラスタに前記新規データ点を属させるステップと
を備える、データ点のクラスタリング方法。
項目5に記載の各ステップをコンピュータで実行させるためのコンピュータプログラム。
本発明の第1実施形態に係るクラスタリング装置の構成を、図1に基づいて説明する。このクラスタリング装置1は、サーバとして実装されており、ネットワーク2に接続されている。ネットワーク2には、クライアント端末3がさらに接続されている。
次に、図2〜図7をさらに参照して、本実施形態におけるクラスタリング手法を詳しく説明する。
まず、クラスタリング装置1は、木構造インデックスの起点となるルートノードを生成して、インデックスDB11に格納する。この明細書では、ルートノード自体も木構造インデックスという概念に含まれるものとする。
つぎに、まず、データ点受付部12が、クライアント端末3から入力された初回のデータ点D0を受け付けた場合の動作を説明する。データ点D0を受け付けた場合、データ点受付部12は、データ点D0をインデックスDB(記憶部)に格納し、さらに、ステップSA−2−1において、初回のデータかどうかを確認する。ルートノードが空である場合、初回のデータ受付であると判定できる。
ついで、クラスタ検索部(処理部に対応)13により、新規データ点D1が属すべきクラスタを、木構造インデックスを用いて検索する。この検索の手順を、図5をさらに参照しながら説明する。
まず、ターゲットノード(初期状態ではルートノード)が内部ノードかどうかを判定する。内部ノードとは、子ノードを持つノードである。
ターゲットノードが内部ノードでなければ、当該ターゲットノードをリーフノードとして特定する。その後の動作はステップSA−4に進む(後述)。初回の検索では、ルートノードは内部ノードではないので、ルートノードがリーフノードとして特定される。
ターゲットノードが内部ノードであれば、当該内部ノードに属する各子ノードの中心点と、入力データ点との距離を計算する。
ついで、入力データ点に最も近い子ノードをターゲットノードとし、ステップSB−1に戻る。これにより、入力データ点に最も近い中心点を持つリーフノードを検索することができる。
ついで、検索されたリーフノード(つまりクラスタ)の中心点と、入力データ点との距離が、既定の固定値未満であるかどうかを、データ追加部(処理部に対応)14により判断する。
検索されたリーフノードの中心点と、入力データ点との距離が、既定の固定値未満であれば、新規データ点D1を、データ追加部(処理部に相当)14により、検索されたクラスタに属させる。ノードN1に新規データ点D1を追加した状態を図3(b)に示す。さらに、ノードN1に対応するクラスタにデータ点D1を追加した状態を図4(b)に示す。
検索されたリーフノードの中心点と、入力データ点との距離が、既定の固定値以上である場合(つまり、ステップSA−4での判断がNoのとき)は、データ追加部(処理部に相当)14により、新たなクラスタを生成して、その新たに生成したクラスタに新規データ点を属させる。新たなクラスタ生成の具体例は後述する。
他の新たな入力データ点を取得したときは、ステップSA−3に戻り、そうでないときはクラスタリング生成を終了する。
ステップSA−7で新規データ点D2を新たに取得すると、前記した処理を繰り返すことにより、図3(c)に示す新規データ点D2をノードN1にさらに属させることができる。
まず、検索されたリーフノードが属する内部ノードに含まれる全リーフノードの個数を数える。ただし、検索されたリーフノードがルートノードである場合はこのステップは省略し、ステップSC−3に移行する。
ステップSC−1で数えたリーフノードの個数が規定値(例えば3)未満であれば、検索されたリーフノードと並列に、新たなクラスタを生成して、新規ノードをこの新たなクラスタに属させる。
前記した新規データ点D3の場合、検索されたリーフノードがルートノードなので、以下のように処理する。すなわち、検索されたリーフノードN1を包含する内部ノードを新たに生成する。この明細書では、新たに生成された内部ノード(図示の例ではルートノード)をN1と称し、検索されたリーフノード(元のリーフノードN1)をN2と称することにする。この新たな内部ノードN1の中心点は、元のリーフノードN1の中心点であったD0とする。検索されたリーフノードN2は新たな内部ノードN1に属する。この作業は、実質的に、検索されたリーフノードN1の下に新たにリーフノードN2を生成して、リーフノードN1を内部ノードとし、リーフノードN1の内容を新たなリーフノードN2の内容とすることに相当する。
さらに、生成された新たな内部ノードN1に、リーフノードN2との兄弟ノードであるリーフノードN3を新たに生成し、そして、新規データ点D3をこのリーフノードN3に属させる。この状態を図3(d)に示す。このように、本実施形態では、検索されたリーフノードN1の下に新たにリーフノードN3を生成して、このリーフノードN3に新規データ点を属させることができる。
前記の処理により生成された木構造インデックスを用いたクラスタ識別処理は、以下のように実行出来る。
(1)ルートノードをターゲットノードとする。
(2)ターゲットノードが内部ノードならば、子ノードの中心点との距離を算出して、最も近い子ノードをターゲットノードとして(2)に戻る。
(3)ターゲットノードがリーフノードならば当該のリーフノードが識別されたクラスタとなる。
2 ネットワーク
3 クライアント端末
11 インデックスDB
12 データ点受付部
13 クラスタ検索部
14 データ追加部
Claims (6)
- データの特徴を表すデータ点をクラスタリングするためのクラスタリング装置であって、
木構造インデックスが格納されるインデックスDBと、
入力された新規データ点を受け付けるデータ点受付部と、
前記木構造インデックスを、前記ルートノードから、クラスタに対応するリーフノードへ辿ることによって、前記新規データ点が属すべきクラスタを検索するクラスタ検索部と、
前記新規データ点と、検索された前記リーフノードに対応する前記クラスタの中心点との距離が固定値未満である場合に、前記新規データ点を、前記クラスタに属させ、前記固定値以上である場合に、新たなクラスタを生成して、その新たに生成したクラスタに前記新規データ点を属させるデータ追加部と
を備えており、
さらに、前記データ追加部は、
前記木構造インデックスを辿ることによって検索されたリーフノードが属する内部ノードに含まれる全リーフノードの個数を数える処理と、
前記全リーフノードの個数が規定値未満であれば、検索された前記リーフノードと並列に、前記新たなクラスタに対応するリーフノードを生成する処理と、
前記全リーフノードの個数が規定値以上であれば、検索された前記リーフノードの下層に、前記新たなクラスタに対応するリーフノードを生成する処理と
を行う構成となっている、データ点のクラスタリング装置。 - 前記データ点受付部は、
受け付けた一つの前記新規データ点が初回のデータか否かを判定する処理と、
前記新規データ点が初回のデータであった場合には、前記木構造インデックスにおけるルートノードに、当該一つの新規データ点を属させる処理と
を行う構成となっている請求項1に記載のクラスタリング装置。 - 前記データ追加部は、
前記クラスタ検索部によって前記ルートノードから前記リーフノードに向けて辿る過程で取得されたターゲットノードが内部ノードであるか否かを判定する処理と、
前記ターゲットノードが内部ノードであった場合に、当該内部ノードに属する各子ノードの中心点と前記新規データ点との距離を計算し、前記新規データ点にもっとも近い中心点を持つ子ノードに向けて辿り、ついでこの子ノードをターゲットノードとしてこのターゲットノードが内部ノードであるか否かを再び判定する処理と
を行う構成となっている請求項1又は2に記載のクラスタリング装置。 - 前記データ点は、画像データの局所的な特徴を示す局所特徴量である、請求項1〜3のいずれか1項に記載のクラスタリング装置。
- 処理部と記憶部とを用いて、データの特徴を表すデータ点をクラスタリングするためのクラスタリング方法であって、
入力されたデータ点を受け付けて前記記憶部に格納するステップと、
前記木構造インデックスを、前記ルートノードから、クラスタに対応するリーフノードへ辿ることによって、前記新規データ点が属すべきクラスタを、前記処理部により検索するステップと、
前記新規データ点と、検索された前記リーフノードに対応する前記クラスタの中心点との距離が固定値未満である場合に、前記新規データ点を、前記処理部により、前記クラスタに属させ、前記固定値以上である場合に、前記処理部により、新たなクラスタを生成して、その新たに生成したクラスタに前記新規データ点を属させるステップと
を備えており、
さらに、前記処理部は、
前記木構造インデックスを辿ることによって検索されたリーフノードが属する内部ノードに含まれる全リーフノードの個数を数えるステップと、
前記全リーフノードの個数が規定値未満であれば、検索された前記リーフノードと並列に、前記新たなクラスタに対応するリーフノードを生成するステップと、
前記全リーフノードの個数が規定値以上であれば、検索された前記リーフノードの下層に、前記新たなクラスタに対応するリーフノードを生成するステップと
を行う構成となっている、データ点のクラスタリング方法。 - 請求項5に記載の各ステップをコンピュータで実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010289242A JP5265656B2 (ja) | 2010-12-27 | 2010-12-27 | クラスタリング装置及びクラスタリング方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010289242A JP5265656B2 (ja) | 2010-12-27 | 2010-12-27 | クラスタリング装置及びクラスタリング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012137908A JP2012137908A (ja) | 2012-07-19 |
JP5265656B2 true JP5265656B2 (ja) | 2013-08-14 |
Family
ID=46675277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010289242A Active JP5265656B2 (ja) | 2010-12-27 | 2010-12-27 | クラスタリング装置及びクラスタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5265656B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8514185B2 (en) | 2006-07-06 | 2013-08-20 | Apple Inc. | Mutual capacitance touch sensing device |
US8537132B2 (en) | 2005-12-30 | 2013-09-17 | Apple Inc. | Illuminated touchpad |
US8552990B2 (en) | 2003-11-25 | 2013-10-08 | Apple Inc. | Touch pad for handheld device |
US8743060B2 (en) | 2006-07-06 | 2014-06-03 | Apple Inc. | Mutual capacitance touch sensing device |
US8749493B2 (en) | 2003-08-18 | 2014-06-10 | Apple Inc. | Movable touch pad with added functionality |
US8816967B2 (en) | 2008-09-25 | 2014-08-26 | Apple Inc. | Capacitive sensor having electrodes arranged on the substrate and the flex circuit |
US8820133B2 (en) | 2008-02-01 | 2014-09-02 | Apple Inc. | Co-extruded materials and methods |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6012814B1 (ja) * | 2015-05-22 | 2016-10-25 | 日本電信電話株式会社 | 逐次クラスタリング装置、方法、及びプログラム |
JP6623564B2 (ja) * | 2015-06-02 | 2019-12-25 | 富士通株式会社 | データ分類装置、データ分類プログラム及びデータ分類方法 |
JP6678445B2 (ja) * | 2015-12-18 | 2020-04-08 | ヤフー株式会社 | 量子化装置及び量子化装置の動作方法 |
CN107391674B (zh) * | 2017-07-21 | 2020-04-10 | 中科鼎富(北京)科技发展有限公司 | 一种新类挖掘方法及装置 |
JP2018125019A (ja) * | 2018-03-27 | 2018-08-09 | エルピクセル株式会社 | 画像処理装置及び画像処理方法 |
JP7353737B2 (ja) * | 2018-08-17 | 2023-10-02 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN110728320B (zh) * | 2019-10-11 | 2023-12-01 | 福建工程学院 | 一种基于自编码和聚类结合的水质监测预警方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316819A (ja) * | 2002-04-22 | 2003-11-07 | Shinkichi Himeno | オブジェクト分類検索装置及びそれを実行するためのプログラム |
JP4999886B2 (ja) * | 2009-06-09 | 2012-08-15 | ヤフー株式会社 | 画像検索装置 |
-
2010
- 2010-12-27 JP JP2010289242A patent/JP5265656B2/ja active Active
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8749493B2 (en) | 2003-08-18 | 2014-06-10 | Apple Inc. | Movable touch pad with added functionality |
US8552990B2 (en) | 2003-11-25 | 2013-10-08 | Apple Inc. | Touch pad for handheld device |
US8537132B2 (en) | 2005-12-30 | 2013-09-17 | Apple Inc. | Illuminated touchpad |
US8514185B2 (en) | 2006-07-06 | 2013-08-20 | Apple Inc. | Mutual capacitance touch sensing device |
US8743060B2 (en) | 2006-07-06 | 2014-06-03 | Apple Inc. | Mutual capacitance touch sensing device |
US8820133B2 (en) | 2008-02-01 | 2014-09-02 | Apple Inc. | Co-extruded materials and methods |
US8816967B2 (en) | 2008-09-25 | 2014-08-26 | Apple Inc. | Capacitive sensor having electrodes arranged on the substrate and the flex circuit |
Also Published As
Publication number | Publication date |
---|---|
JP2012137908A (ja) | 2012-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5265656B2 (ja) | クラスタリング装置及びクラスタリング方法 | |
US10042911B2 (en) | Discovery of related entities in a master data management system | |
CN110162695A (zh) | 一种信息推送的方法及设备 | |
US11100073B2 (en) | Method and system for data assignment in a distributed system | |
WO2010129063A1 (en) | Method and system for search engine indexing and searching using the index | |
JP2010218181A (ja) | 画像検索装置 | |
CN111966633A (zh) | 用于查询目录下子节点的方法、装置、电子设备及介质 | |
CN115918110A (zh) | 使用键值存储库的空间搜索 | |
JP5061147B2 (ja) | 画像検索装置 | |
CN115827280A (zh) | 消息处理方法、装置、电子设备及存储介质 | |
JP5383776B2 (ja) | グラフインデックス更新装置 | |
JP5061137B2 (ja) | 画像検索装置 | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
US10372694B2 (en) | Structured information differentiation in naming | |
CN113901278A (zh) | 一种基于全局多探测和适应性终止的数据搜索方法和装置 | |
CN113312895A (zh) | 自治系统as的组织机构映射方法、装置及电子设备 | |
JP6333306B2 (ja) | 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム | |
CN111695031A (zh) | 基于标签的搜索方法、装置、服务器及存储介质 | |
CN112307272A (zh) | 确定对象之间关系信息的方法、装置、计算设备及存储介质 | |
CN114490095B (zh) | 请求结果的确定方法和装置、存储介质及电子装置 | |
JP6300982B2 (ja) | 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム | |
JP2019194815A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP5646664B2 (ja) | 画像照合装置及び画像照合方法 | |
CN113597605B (zh) | 多级数据沿袭视图 | |
JP2013196205A (ja) | データモデル変換プログラム、データモデル変換方法およびデータモデル変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130321 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130501 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5265656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |