JP5539066B2 - クラスタリング処理装置、クラスタリング処理方法 - Google Patents
クラスタリング処理装置、クラスタリング処理方法 Download PDFInfo
- Publication number
- JP5539066B2 JP5539066B2 JP2010148027A JP2010148027A JP5539066B2 JP 5539066 B2 JP5539066 B2 JP 5539066B2 JP 2010148027 A JP2010148027 A JP 2010148027A JP 2010148027 A JP2010148027 A JP 2010148027A JP 5539066 B2 JP5539066 B2 JP 5539066B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- information
- clustering
- clusters
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23211—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
複数のサンプルからなるデータをクラスタに分類するクラスタリング処理装置であって、
前記データを分割したN個のデータブロックそれぞれについて、データブロックに含まれるサンプルを該データブロックごとのクラスタに分類するN個のクラスタリング手段であって、各クラスタリング手段は第一の記憶手段を有し、前記データブロックに含まれるサンプルに順次着目してクラスタに分類し、当該分類されたデータブロックごとのクラスタの識別情報を含むクラスタ情報を前記第一の記憶手段に記憶するとともに前記着目サンプルが属するクラスタを示すサンプル帰属情報を第二の記憶手段に記憶するN個のクラスタリング手段と、
前記データブロックそれぞれについて、所定の条件が満たされた場合、前記第一の記憶手段に記憶されたクラスタ情報のうちから統合対象とするクラスタのクラスタ情報を選択し、選択されたクラスタ情報を前記第一の記憶手段から第三の記憶手段に移動するクラスタ情報移動手段と、
前記第三の記憶手段に記憶された前記クラスタ情報が示すクラスタを統合し、前記第二の記憶手段に記憶されたサンプル帰属情報を更新して、統合されたクラスタを統合後のクラスタに変更する更新手段とを備える。
本発明に関る実施形態1のクラスタリング処理装置について、図1を用いて説明する。図1は、本実施形態のクラスタリング処理装置の構成を表す図である。本実施形態のクラスタリング処理装置は、画像データを構成する複数の画素の各々をクラスタリング処理対象のサンプルとし、画素の色情報を特徴ベクトルとするクラスタリング処理を行う。本実施形態のクラスタリング処理装置は、データ分割部100、クラスタ帰属処理部111〜113、クラスタ情報メモリ121〜123、クラスタ情報移動部131〜133、クラスタ統合部141、クラスタ番号メモリ151から構成される。クラスタ情報メモリ121〜123は、夫々クラスタ帰属処理部111〜113とクラスタ情報移動部131〜133に接続されている。以下、図1を参照して本実施形態のクラスタリング処理装置の動作を説明する。
以下、図2を参照して、クラスタ帰属処理部111〜113の処理フローを説明する。なお、クラスタ帰属処理部111〜113のいずれも処理フローは同一であるため、クラスタ帰属処理部とクラスタ情報メモリについては符号を省略する。
次に、クラスタ情報移動部131〜133の動作を、図3を用いて説明する。図3は、クラスタ情報移動部131〜133の動作を表すフローチャートである。なお、クラスタ情報移動部131〜133のいずれも処理フローは同一であるため、符号を省略する。
次に、クラスタ統合部141について説明する。クラスタ統合部141は、クラスタ情報移動部131〜133から各々移動されたクラスタ情報を受け取り、該受け取ったクラスタ情報に対応するクラスタが所定の統合条件を満たせば統合する。図7は、クラスタ統合部141の詳細な構成を表すブロック図である。クラスタ統合部141は、FIFO1411〜1413、調停部1415、統合部1416、クラスタ番号出力部1417、クラスタ統合メモリ1418を有する。FIFO1411〜1413は、それぞれ図1のクラスタ情報移動部131〜133に接続されている。クラスタ番号出力部1417は図1のクラスタ番号メモリ151に接続されている。以下、図7を参照して、クラスタ統合部141の動作を説明する。
なお、本実施形態においては、クラスタ情報移動部は帰属先候補クラスタ数が帰属先候補クラスタ数閾値を超えると判定したとき(ステップS202でYES)、統合対象のクラスタを選択するが、本発明はこれに限定されない。図4のステップS302に示すように、クラスタ帰属処理部が所定のサンプル数を処理する毎に、統合対象のクラスタを選択してもよい。例えば、画像データをクラスタリングする場合、クラスタ帰属処理部が1ラインあるいは2ライン処理する毎に統合対象のクラスタを選択してもよい。この場合、クラスタ情報メモリには、クラスタ帰属処理部が処理したサンプル数が格納される。クラスタ情報移動部は該サンプル数を基にステップS302の判定を行う。
本発明に関る実施形態2のクラスタリング処理装置について、図11を用いて説明する。図11は、本実施形態のクラスタリング処理装置の構成を表す図である。本実施形態のクラスタリング処理装置は、メモリ300、クラスタ帰属処理プロセッサ301〜303、全体制御/クラスタ統合プロセッサ304、キャッシュメモリ311〜314、バス305、データ入出力I/F306から構成される。各プロセサは独立したコンピュータであってもよい。クラスタ帰属処理プロセッサ301〜303、全体制御/クラスタ統合プロセッサ304、メモリ300とデータ入出力I/F306は、バス305を介して接続される。キャッシュメモリ311〜313は各々クラスタ帰属処理プロセッサ301〜303に付属し、キャッシュメモリ314は全体制御/クラスタ統合プロセッサ304に付属する。本実施形態のクラスタリング処理装置は、画像データを構成する各画素をクラスタリング処理対象のサンプルとし、画素の色情報を特徴ベクトルとして処理を行う。以下、図11を用いて本実施形態のクラスタリング処理装置の動作を説明する。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (10)
- 複数のサンプルからなるデータをクラスタに分類するクラスタリング処理装置であって、
前記データを分割したN個のデータブロックそれぞれについて、データブロックに含まれるサンプルを該データブロックごとのクラスタに分類するN個のクラスタリング手段であって、各クラスタリング手段は第一の記憶手段を有し、前記データブロックに含まれるサンプルに順次着目してクラスタに分類し、当該分類されたデータブロックごとのクラスタの識別情報を含むクラスタ情報を前記第一の記憶手段に記憶するとともに前記着目したサンプルが属するクラスタを示すサンプル帰属情報を第二の記憶手段に記憶するN個のクラスタリング手段と、
前記データブロックそれぞれについて、所定の条件が満たされた場合、前記第一の記憶手段に記憶されたクラスタ情報のうちから統合対象とするクラスタのクラスタ情報を選択し、選択されたクラスタ情報を前記第一の記憶手段から第三の記憶手段に移動するクラスタ情報移動手段と、
前記第三の記憶手段に記憶された前記クラスタ情報が示す選択されたクラスタを統合し、前記第二の記憶手段に記憶されたサンプル帰属情報を、統合後のクラスタの識別情報で更新する更新手段と
を備えることを特徴とするクラスタリング処理装置。 - 前記クラスタリング手段は、着目したサンプルを分類できるクラスタがなければ新たなクラスタを生成し、
前記所定の条件は、前記クラスタリング手段で生成されたクラスタ数が閾値を超えたときに満たされることを特徴とする請求項1に記載のクラスタリング処理装置。 - 前記所定の条件は、前記クラスタリング手段が処理したサンプル数が所定の数を超えた毎に満たされることを特徴とする請求項1に記載のクラスタリング処理装置。
- 前記クラスタ情報には、各クラスタに分類されたサンプルのうち最新のサンプルを特定するサンプル特定情報が更に含まれており、
前記クラスタ情報移動手段は、前記所定の条件が満たされたデータブロックのクラスタに分類されたサンプルのうち最新のサンプルに着目した順番が最も古いクラスタのクラスタ情報を選択することを特徴とする請求項1に記載のクラスタリング処理装置。 - 前記クラスタ情報移動手段は、帰属するサンプル数が最も少ないクラスタのクラスタ情報を選択することを特徴とする請求項1に記載のクラスタリング処理装置。
- 前記クラスタ情報移動手段により前記第三の記憶手段に移動され、かつ、前記更新手段により統合されていないクラスタの数が閾値を超えている間、前記クラスタ情報移動手段はクラスタを選択しないことを特徴とする請求項1に記載のクラスタリング処理装置。
- 前記クラスタ情報移動手段により前記第三の記憶手段に移動され、かつ、前記更新手段により統合されていないクラスタの数が閾値を超えている間、前記クラスタリング手段はクラスタリング処理を停止することを特徴とする請求項1に記載のクラスタリング処理装置。
- 前記サンプルは画素値を表す特徴ベクトルであり、
前記クラスタ情報は、クラスタに属する画素の特徴ベクトルの平均値を代表特徴ベクトルとして更に有し、
前記クラスタリング手段は、既存のクラスタのうち、着目したサンプルの特徴ベクトルとの距離が最も近くかつ当該距離が閾値より小さなクラスタがあれば前記着目したサンプルを当該クラスタに分類して当該クラスタの代表特徴ベクトルを更新し、該当するクラスタがなければ新たなクラスタを生成して前記着目したサンプルの特徴ベクトルを前記クラスタの代表特徴ベクトルとすることを特徴とする請求項1に記載のクラスタリング処理装置。 - 複数のサンプルからなるデータを、サンプルの特徴ベクトルに基づいてクラスタに分類するクラスタリング処理装置としてコンピュータを機能させるためのプログラムであって、
前記データを分割したN個のデータブロックそれぞれについて、データブロックに含まれるサンプルを該データブロックごとのクラスタに分類するN個のクラスタリング手段であって、各クラスタリング手段は第一の記憶手段を有し、前記データブロックに含まれるサンプルに順次着目してクラスタに分類し、当該分類されたデータブロックごとのクラスタの識別情報を含むクラスタ情報を前記第一の記憶手段に記憶するとともに前記着目したサンプルが属するクラスタを示すサンプル帰属情報を第二の記憶手段に記憶するN個のクラスタリング手段と、
前記データブロックそれぞれについて、所定の条件が満たされた場合、前記第一の記憶手段に記憶されたクラスタ情報のうちから統合対象とするクラスタのクラスタ情報を選択し、選択されたクラスタ情報を前記第一の記憶手段から第三の記憶手段に移動するクラスタ情報移動手段と、
前記第三の記憶手段に記憶された前記クラスタ情報が示す選択されたクラスタを統合し、前記第二の記憶手段に記憶されたサンプル帰属情報を、統合後のクラスタの識別情報で更新する更新手段と
をしてコンピュータを機能させるためのプログラム。 - 複数のサンプルからなるデータを、サンプルの特徴ベクトルに基づいてクラスタに分類するクラスタリング処理方法であって、
前記データを分割したN個のデータブロックそれぞれについて、N個のクラスタリング手段それぞれが、データブロックに含まれるサンプルを該データブロックごとのクラスタに分類するクラスタリング工程であって、各クラスタリング手段は第一の記憶手段を有し、前記データブロックに含まれるサンプルに順次着目してクラスタに分類し、当該分類されたデータブロックごとのクラスタの識別情報を含むクラスタ情報を前記第一の記憶手段に記憶するとともに前記着目したサンプルが属するクラスタを示すサンプル帰属情報を第二の記憶手段に記憶するクラスタリング工程と、
クラスタ情報移動手段が、前記データブロックそれぞれについて、所定の条件が満たされた場合、前記第一の記憶手段に記憶されたクラスタ情報のうちから統合対象とするクラスタのクラスタ情報を選択し、選択されたクラスタ情報を前記第一の記憶手段から第三の記憶手段に移動するクラスタ情報移動工程と、
更新手段が、前記第三の記憶手段に記憶された前記クラスタ情報が示す選択されたクラスタを統合し、前記第二の記憶手段に記憶されたサンプル帰属情報を、統合後のクラスタの識別情報で更新する更新工程と
を有することを特徴とするクラスタリング処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010148027A JP5539066B2 (ja) | 2010-06-29 | 2010-06-29 | クラスタリング処理装置、クラスタリング処理方法 |
US13/160,946 US8553991B2 (en) | 2010-06-29 | 2011-06-15 | Clustering processing apparatus and clustering processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010148027A JP5539066B2 (ja) | 2010-06-29 | 2010-06-29 | クラスタリング処理装置、クラスタリング処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012014269A JP2012014269A (ja) | 2012-01-19 |
JP5539066B2 true JP5539066B2 (ja) | 2014-07-02 |
Family
ID=45352618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010148027A Expired - Fee Related JP5539066B2 (ja) | 2010-06-29 | 2010-06-29 | クラスタリング処理装置、クラスタリング処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8553991B2 (ja) |
JP (1) | JP5539066B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5539066B2 (ja) * | 2010-06-29 | 2014-07-02 | キヤノン株式会社 | クラスタリング処理装置、クラスタリング処理方法 |
US20160093069A1 (en) * | 2014-09-26 | 2016-03-31 | Subramaniam Maiyuran | Method and apparatus for pixel hashing |
CN106874936B (zh) * | 2017-01-17 | 2023-07-11 | 腾讯科技(上海)有限公司 | 图像传播监测方法及装置 |
CN108898432B (zh) * | 2018-06-25 | 2022-05-13 | 武汉斗鱼网络科技有限公司 | 一种广告投放效果评估方法、装置及电子设备 |
CN108985694B (zh) * | 2018-07-17 | 2022-04-22 | 北京百度网讯科技有限公司 | 用于确定配送中心地址的方法和装置 |
KR102632588B1 (ko) * | 2021-01-29 | 2024-02-01 | 네이버 주식회사 | 평균-피쳐를 이용한 클러스터링 방법, 장치 및 컴퓨터 프로그램 |
CN115130581B (zh) * | 2022-04-02 | 2023-06-23 | 北京百度网讯科技有限公司 | 样本生成方法、训练方法、数据处理方法以及电子设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2966084B2 (ja) * | 1990-11-29 | 1999-10-25 | 本田技研工業株式会社 | 画像処理における局所的領域分割方法 |
US5850475A (en) | 1994-05-10 | 1998-12-15 | Fuji Xerox Co., Ltd. | Method and apparatus for dividing image area |
JPH0830787A (ja) | 1994-05-10 | 1996-02-02 | Fuji Xerox Co Ltd | 画像領域分割方法及び画像領域統合方法 |
US6904420B2 (en) * | 2001-05-17 | 2005-06-07 | Honeywell International Inc. | Neuro/fuzzy hybrid approach to clustering data |
JP4199170B2 (ja) * | 2004-07-20 | 2008-12-17 | 株式会社東芝 | 高次元テクスチャマッピング装置、方法及びプログラム |
JP4632443B2 (ja) | 2005-12-05 | 2011-02-16 | キヤノン株式会社 | 画像処理装置及び画像処理方法並びにプログラム |
US7623712B2 (en) | 2005-06-09 | 2009-11-24 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US20070031043A1 (en) * | 2005-08-02 | 2007-02-08 | Perz Cynthia B | System for and method of intelligently directed segmentation analysis for automated microscope systems |
US7937269B2 (en) * | 2005-08-22 | 2011-05-03 | International Business Machines Corporation | Systems and methods for providing real-time classification of continuous data streams |
US20080021649A1 (en) * | 2006-06-16 | 2008-01-24 | Kua Seng Choy | Color sample clustering |
JP4531733B2 (ja) * | 2006-09-14 | 2010-08-25 | シャープ株式会社 | 薄型画像表示装置の装飾品固定構造 |
JP2008147712A (ja) * | 2006-12-05 | 2008-06-26 | Canon Inc | 画像処理装置および画像処理方法 |
EP2216749B1 (en) * | 2007-12-03 | 2017-11-08 | National University Corporation Hokkaido University | Image classification device and image classification program |
US8581927B2 (en) * | 2008-11-04 | 2013-11-12 | Beckman Coulter, Inc. | Multidimensional particle analysis data cluster reconstruction |
JP5377148B2 (ja) * | 2009-08-03 | 2013-12-25 | キヤノン株式会社 | クラスタリング処理方法、クラスタリング処理装置、およびプログラム |
JP5539066B2 (ja) * | 2010-06-29 | 2014-07-02 | キヤノン株式会社 | クラスタリング処理装置、クラスタリング処理方法 |
-
2010
- 2010-06-29 JP JP2010148027A patent/JP5539066B2/ja not_active Expired - Fee Related
-
2011
- 2011-06-15 US US13/160,946 patent/US8553991B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012014269A (ja) | 2012-01-19 |
US20110317927A1 (en) | 2011-12-29 |
US8553991B2 (en) | 2013-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539066B2 (ja) | クラスタリング処理装置、クラスタリング処理方法 | |
JP4859025B2 (ja) | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 | |
US10769473B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
JP6188976B2 (ja) | 画像に含まれるテキストを検出する方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP5455038B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2001256244A (ja) | 画像データ分類装置および画像データ分類方法 | |
JP2005182730A (ja) | ドキュメントの自動分離 | |
EP2804115B1 (en) | Index scan device and index scan method | |
JP5276541B2 (ja) | 画像処理方法及び画像処理装置及びプログラム | |
US8175407B2 (en) | Image processing method, image processing apparatus, and program for clustering data | |
CN106649420B (zh) | 图像处理设备和图像处理方法 | |
JP5377148B2 (ja) | クラスタリング処理方法、クラスタリング処理装置、およびプログラム | |
JP2017182480A (ja) | 画像処理装置および画像処理方法 | |
JP6442152B2 (ja) | 画像処理装置、画像処理方法 | |
JP4967045B2 (ja) | 背景判別装置、方法及びプログラム | |
EP2075741A2 (en) | Image comparing method, apparatus and program | |
JP6546385B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5127738B2 (ja) | 画像処理方法および画像処理装置およびプログラム | |
JP5127739B2 (ja) | 画像処理方法および画像処理装置およびプログラム | |
US11238295B2 (en) | Distributed processing of a digital image | |
JP2002185782A (ja) | 文字抽出装置、文字抽出方法および記録媒体 | |
JP2020027365A (ja) | 局所特徴量抽出装置、局所特徴量抽出プログラム、状態判定装置、及び状態判定プログラム | |
US20170193342A1 (en) | Printing apparatus, printing method, and medium | |
JP2011076575A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2009122841A (ja) | 画像一覧イメージ構築装置、記録媒体及び画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140331 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5539066 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140430 |
|
LAPS | Cancellation because of no payment of annual fees |