JP2012523621A - スケーラブルなクラスタリング - Google Patents
スケーラブルなクラスタリング Download PDFInfo
- Publication number
- JP2012523621A JP2012523621A JP2012504721A JP2012504721A JP2012523621A JP 2012523621 A JP2012523621 A JP 2012523621A JP 2012504721 A JP2012504721 A JP 2012504721A JP 2012504721 A JP2012504721 A JP 2012504721A JP 2012523621 A JP2012523621 A JP 2012523621A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- data structure
- feature
- keywords
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 98
- 238000004138 cluster model Methods 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 32
- 238000009826 distribution Methods 0.000 claims description 90
- 238000012549 training Methods 0.000 claims description 43
- 239000000203 mixture Substances 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 18
- 230000009257 reactivity Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004043 responsiveness Effects 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 235000008452 baby food Nutrition 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005054 agglomeration Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 108091071247 Beta family Proteins 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013476 bayesian approach Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Fuzzy Systems (AREA)
- Primary Health Care (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioethics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
ADFステップの間メッセージを格納する必要はないが、およそD×Kの周辺分布の順序でのみ格納することに留意されたい。
Claims (15)
- 項目をクラスタ化するコンピュータ実行方法であって、各項目は、少なくとも1つの関連する特徴を有し、前記方法は、
データ構造をメモリに格納するステップであって、前記データ構造は、
複数のクラスタ(201)と、
各項目に対し1または複数の関連する特徴(202)と、
各クラスタに対し、前記項目のうちのいずれかがそのクラスタのメンバであるかどうかについての信念を表す事前確率分布に関係する少なくとも1つのクラスタメンバシップパラメータ(200)と、
クラスタと特徴との組み合わせのそれぞれに対し、そのクラスタ内の項目のうちのいずれかがその特徴と関連付けられているかどうかについての信念を表す事前確率分布に関係する少なくとも1つの特徴パラメータ(203)と
を保持する、ステップと、
観測された関連する特徴を有する観測された項目を備える入力を受信して格納するステップと(302)、
受信された入力に基づいておよびベイズ更新プロセスを使用して、前記データ構造内の複数のパラメータを更新するステップと(304)、
そのような入力の複数を受信するステップおよび更新するステップを繰り返すステップと、
を備えることを特徴とする方法。 - 前記データ構造内の複数のパラメータを更新するステップに続いて、前記格納された入力を削除するステップと、この削除するステップを前記他の繰り返されるステップと共に繰り返すステップと
をさらに備えることを特徴とする請求項1に記載の方法。 - 前記データ構造は、それが、ベルヌーイ分布の産物であるベルヌーイプロファイルの混合に基づいたクラスタモデル(102)を保持するように格納されることを特徴とする請求項1または請求項2に記載の方法。
- 前記データ構造は、それが、因子グラフを使用してクラスタモデル(102)を保持するように格納されることを特徴とする請求項1乃至3のいずれかに記載の方法。
- 前記データ構造は、それが、ツリー構造としての前記因子グラフを保持するように格納されることを特徴とする請求項4に記載の方法。
- 前記データ構造は、各クラスタのメンバシップパラメータがディリクレ分布に関係するように格納されることを特徴とする請求項1乃至5のいずれかに記載の方法。
- 前記データ構造は、各特徴パラメータがベータ分布に関係するように格納されることを特徴とする請求項1乃至6のいずれかに記載の方法。
- すべてのクラスタを通じて同様の特徴パラメータを有する特徴を特定するステップ(1000)と、その特徴パラメータに対して同じデフォルト値を使用するステップ(1001)とをさらに備えることを特徴とする請求項1に記載の方法。
- クラスタ内で、デフォルト値を用いて特徴パラメータを置き換えるかどうかをチェックすること(1101)は、クラスタリング方法の結果を著しく変更し、および著しい変更がなければ、その特徴パラメータに対して前記デフォルト値を使用すること(1103)をさらに備えることを特徴とする請求項1乃至8のいずれかに記載の方法。
- 指定された閾値以下の項目の数を有するクラスタを特定するステップ(1200)と、その特定されたクラスタを単一のクラスタに吸収するステップ(1201)とをさらに備えることを特徴とする請求項1乃至9のいずれかに記載の方法。
- 訓練データを使用して前記データ構造を直列的に訓練すること、前記データ構造の複数の子コピーを生成して格納すること(1303)、さらなる訓練データのセットにアクセスしてその訓練データを複数のバッチに形成すること、各子コピーに対して異なるバッチを使用して前記データ構造の前記子コピーを並列に訓練すること、前記訓練された子コピーを使用して前記データ構造を更新すること、前記更新されたデータ構造を使用して新しい子コピーを生成すること、以前に使用されていないバッチを使用して前記新しい子コピーを訓練し、前記データ構造を更新すること、およびこのプロセスを繰り返すことをさらに備えることを特徴とする請求項1に記載の方法。
- 複数の契約キーワードを有する広告に基づいて、広告主に提案する付加的なキーワードを特定するコンピュータ実行方法であって、
前記方法は、
複数の契約キーワードを有する広告を受信するステップ(1400)と、
契約キーワードを有する複数の広告を備えるデータセット上で訓練される確率的クラスタモデル(102)を保持するデータ構造と、前記データセット内でモデルの不確実性を調整されるそのクラスタモデルとを備えるクラスタリングシステム(101)にアクセスするステップと、
前記クラスタリングシステムを使用して、受信された広告に基づいてキーワードおよび関連する確率を生成するステップ(1403)と、
前記生成されたキーワードを前記広告主への提案として出力するステップと
を備えることを特徴とする方法。 - 関連する確率の推定値を使用してランク付されて生成されたキーワードの少なくともいくつかのリストを備えることを特徴とする請求項12に記載の方法。
- 前記生成されたキーワードの少なくともいくつかについてのユーザフィードバックを受信するステップと、キーワード生成プロセスを修正するために前記ユーザフィードバックを使用するステップとをさらに備えることを特徴とする請求項12に記載の方法。
- 特徴と関連する複数の文書を備えるデータセット上で訓練される確率的クラスタモデルおよび前記データセット内で不確実性をモデル化するように調整されるそのクラスタモデルを保持するデータ構造(102)を格納するメモリ(1602)と、
その文書の特徴を備える情報をクラスタ化するための文書についての情報(100)を受信するように調整される入力と、
前記文書のクラスタについての情報(104)を提供するように調整される出力と
を備えることを特徴とするクラスタリングシステム(101)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/421,853 | 2009-04-10 | ||
US12/421,853 US8204838B2 (en) | 2009-04-10 | 2009-04-10 | Scalable clustering |
PCT/US2010/029715 WO2010117889A2 (en) | 2009-04-10 | 2010-04-01 | Scalable clustering |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012523621A true JP2012523621A (ja) | 2012-10-04 |
JP2012523621A5 JP2012523621A5 (ja) | 2013-05-09 |
JP5442846B2 JP5442846B2 (ja) | 2014-03-12 |
Family
ID=42935152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012504721A Active JP5442846B2 (ja) | 2009-04-10 | 2010-04-01 | スケーラブルなクラスタリング |
Country Status (7)
Country | Link |
---|---|
US (1) | US8204838B2 (ja) |
EP (1) | EP2417538A4 (ja) |
JP (1) | JP5442846B2 (ja) |
KR (1) | KR101644667B1 (ja) |
CN (1) | CN102388382B (ja) |
CA (1) | CA2757703C (ja) |
WO (1) | WO2010117889A2 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9065727B1 (en) | 2012-08-31 | 2015-06-23 | Google Inc. | Device identifier similarity models derived from online event signals |
US8458154B2 (en) * | 2009-08-14 | 2013-06-04 | Buzzmetrics, Ltd. | Methods and apparatus to classify text communications |
US8990105B1 (en) * | 2010-01-07 | 2015-03-24 | Magnetic Media Online, Inc. | Systems, methods, and media for targeting advertisements based on user search information |
WO2012064893A2 (en) * | 2010-11-10 | 2012-05-18 | Google Inc. | Automated product attribute selection |
US8473437B2 (en) | 2010-12-17 | 2013-06-25 | Microsoft Corporation | Information propagation probability for a social network |
US9104765B2 (en) * | 2011-06-17 | 2015-08-11 | Robert Osann, Jr. | Automatic webpage characterization and search results annotation |
JP5153925B2 (ja) * | 2011-07-12 | 2013-02-27 | ヤフー株式会社 | 入札対象推薦装置、システム及び方法 |
US20130110992A1 (en) * | 2011-10-28 | 2013-05-02 | Research In Motion Limited | Electronic device management using interdomain profile-based inferences |
WO2013059904A1 (en) | 2011-10-28 | 2013-05-02 | Research In Motion Limited | Factor-graph based matching systems and methods |
US9377998B2 (en) | 2011-11-08 | 2016-06-28 | The Mathworks, Inc. | Code generation for control design |
US20130116989A1 (en) | 2011-11-08 | 2013-05-09 | Fu Zhang | Parameter tuning |
US8914262B2 (en) | 2011-11-08 | 2014-12-16 | The Mathworks, Inc. | Visualization of data dependency in graphical models |
US8935137B1 (en) * | 2011-11-08 | 2015-01-13 | The Mathworks, Inc. | Graphic theoretic linearization of sensitivity analysis |
US9354846B2 (en) | 2011-11-08 | 2016-05-31 | The Mathworks, Inc. | Bidomain simulator |
US20130116988A1 (en) | 2011-11-08 | 2013-05-09 | Fu Zhang | Automatic solver selection |
US20130159254A1 (en) * | 2011-12-14 | 2013-06-20 | Yahoo! Inc. | System and methods for providing content via the internet |
JP5425941B2 (ja) * | 2012-02-07 | 2014-02-26 | ヤフー株式会社 | 広告評価装置、広告評価方法およびプログラム |
JP5485311B2 (ja) * | 2012-02-07 | 2014-05-07 | ヤフー株式会社 | 広告評価装置、広告評価方法およびプログラム |
US8880438B1 (en) | 2012-02-15 | 2014-11-04 | Google Inc. | Determining content relevance |
US9053185B1 (en) | 2012-04-30 | 2015-06-09 | Google Inc. | Generating a representative model for a plurality of models identified by similar feature data |
US20150242906A1 (en) * | 2012-05-02 | 2015-08-27 | Google Inc. | Generating a set of recommended network user identifiers from a first set of network user identifiers and advertiser bid data |
US8914500B1 (en) | 2012-05-21 | 2014-12-16 | Google Inc. | Creating a classifier model to determine whether a network user should be added to a list |
EP2973095B1 (en) | 2013-03-15 | 2018-05-09 | Animas Corporation | Insulin time-action model |
US10319035B2 (en) | 2013-10-11 | 2019-06-11 | Ccc Information Services | Image capturing and automatic labeling system |
US9697475B1 (en) | 2013-12-12 | 2017-07-04 | Google Inc. | Additive context model for entity resolution |
US10452992B2 (en) | 2014-06-30 | 2019-10-22 | Amazon Technologies, Inc. | Interactive interfaces for machine learning model evaluations |
US11100420B2 (en) | 2014-06-30 | 2021-08-24 | Amazon Technologies, Inc. | Input processing for machine learning |
US10339465B2 (en) | 2014-06-30 | 2019-07-02 | Amazon Technologies, Inc. | Optimized decision tree based models |
US9886670B2 (en) | 2014-06-30 | 2018-02-06 | Amazon Technologies, Inc. | Feature processing recipes for machine learning |
US9672474B2 (en) * | 2014-06-30 | 2017-06-06 | Amazon Technologies, Inc. | Concurrent binning of machine learning data |
US10318882B2 (en) | 2014-09-11 | 2019-06-11 | Amazon Technologies, Inc. | Optimized training of linear machine learning models |
US10102480B2 (en) | 2014-06-30 | 2018-10-16 | Amazon Technologies, Inc. | Machine learning service |
US10540606B2 (en) | 2014-06-30 | 2020-01-21 | Amazon Technologies, Inc. | Consistent filtering of machine learning data |
US10963810B2 (en) | 2014-06-30 | 2021-03-30 | Amazon Technologies, Inc. | Efficient duplicate detection for machine learning data sets |
US10169715B2 (en) * | 2014-06-30 | 2019-01-01 | Amazon Technologies, Inc. | Feature processing tradeoff management |
US9984159B1 (en) | 2014-08-12 | 2018-05-29 | Google Llc | Providing information about content distribution |
US11182691B1 (en) | 2014-08-14 | 2021-11-23 | Amazon Technologies, Inc. | Category-based sampling of machine learning data |
US20160055495A1 (en) * | 2014-08-22 | 2016-02-25 | Wal-Mart Stores, Inc. | Systems and methods for estimating demand |
US9971683B1 (en) * | 2014-10-20 | 2018-05-15 | Sprint Communications Company L.P. | Automatic computer memory management coordination across a group of servers |
WO2016145379A1 (en) * | 2015-03-12 | 2016-09-15 | William Marsh Rice University | Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification |
US10257275B1 (en) | 2015-10-26 | 2019-04-09 | Amazon Technologies, Inc. | Tuning software execution environments using Bayesian models |
WO2018093935A1 (en) * | 2016-11-15 | 2018-05-24 | Google Llc | Training neural networks using a clustering loss |
KR102005420B1 (ko) * | 2018-01-11 | 2019-07-30 | 국방과학연구소 | 전자메일 저자 분류 방법 및 장치 |
US10929110B2 (en) | 2019-06-15 | 2021-02-23 | International Business Machines Corporation | AI-assisted UX design evaluation |
CN111813910B (zh) * | 2020-06-24 | 2024-05-31 | 平安科技(深圳)有限公司 | 客服问题的更新方法、系统、终端设备及计算机存储介质 |
CN116127346A (zh) * | 2021-01-20 | 2023-05-16 | 国义招标股份有限公司 | 一种不依赖历史信息的密度聚类处理方法、设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265787A (ja) * | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類方法、およびその分類方法を記述したプログラムを記録している記録媒体 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6807537B1 (en) * | 1997-12-04 | 2004-10-19 | Microsoft Corporation | Mixtures of Bayesian networks |
US6581058B1 (en) | 1998-05-22 | 2003-06-17 | Microsoft Corporation | Scalable system for clustering of large databases having mixed data attributes |
US6564197B2 (en) | 1999-05-03 | 2003-05-13 | E.Piphany, Inc. | Method and apparatus for scalable probabilistic clustering using decision trees |
GB9922221D0 (en) * | 1999-09-20 | 1999-11-17 | Ncr Int Inc | Classsifying data in a database |
IL159332A0 (en) * | 1999-10-31 | 2004-06-01 | Insyst Ltd | A knowledge-engineering protocol-suite |
WO2002057946A1 (en) * | 2001-01-18 | 2002-07-25 | The Board Of Trustees Of The University Of Illinois | Method for optimizing a solution set |
US6952700B2 (en) * | 2001-03-22 | 2005-10-04 | International Business Machines Corporation | Feature weighting in κ-means clustering |
US7246125B2 (en) * | 2001-06-21 | 2007-07-17 | Microsoft Corporation | Clustering of databases having mixed data attributes |
US20020169730A1 (en) * | 2001-08-29 | 2002-11-14 | Emmanuel Lazaridis | Methods for classifying objects and identifying latent classes |
US7231393B1 (en) | 2003-09-30 | 2007-06-12 | Google, Inc. | Method and apparatus for learning a probabilistic generative model for text |
EP1565877A1 (en) * | 2002-10-24 | 2005-08-24 | Duke University | Binary prediction tree modeling with many predictors |
US7480640B1 (en) * | 2003-12-16 | 2009-01-20 | Quantum Leap Research, Inc. | Automated method and system for generating models from data |
US8117203B2 (en) | 2005-07-15 | 2012-02-14 | Fetch Technologies, Inc. | Method and system for automatically extracting data from web sites |
US7739314B2 (en) | 2005-08-15 | 2010-06-15 | Google Inc. | Scalable user clustering based on set similarity |
US8341158B2 (en) | 2005-11-21 | 2012-12-25 | Sony Corporation | User's preference prediction from collective rating data |
US7647289B2 (en) | 2006-06-02 | 2010-01-12 | Microsoft Corporation | Learning belief distributions for game moves |
US7788264B2 (en) * | 2006-11-29 | 2010-08-31 | Nec Laboratories America, Inc. | Systems and methods for classifying content using matrix factorization |
CN100578500C (zh) * | 2006-12-20 | 2010-01-06 | 腾讯科技(深圳)有限公司 | 一种网页分类方法及装置 |
US20100034102A1 (en) * | 2008-08-05 | 2010-02-11 | At&T Intellectual Property I, Lp | Measurement-Based Validation of a Simple Model for Panoramic Profiling of Subnet-Level Network Data Traffic |
-
2009
- 2009-04-10 US US12/421,853 patent/US8204838B2/en not_active Expired - Fee Related
-
2010
- 2010-04-01 EP EP10762238.3A patent/EP2417538A4/en not_active Ceased
- 2010-04-01 CA CA2757703A patent/CA2757703C/en not_active Expired - Fee Related
- 2010-04-01 CN CN201080016627.6A patent/CN102388382B/zh active Active
- 2010-04-01 WO PCT/US2010/029715 patent/WO2010117889A2/en active Application Filing
- 2010-04-01 KR KR1020117023622A patent/KR101644667B1/ko active IP Right Grant
- 2010-04-01 JP JP2012504721A patent/JP5442846B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265787A (ja) * | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書分類方法、およびその分類方法を記述したプログラムを記録している記録媒体 |
Non-Patent Citations (9)
Title |
---|
CSNG200501059004; 泉祐介、外1名: 'クラスターBPの実装の改良' 電子情報通信学会技術研究報告(NC2004-69〜82) 第104巻,第349号, 20041012, p.33-37, 社団法人電子情報通信学会 * |
CSNG200700829002; 正田備也、外2名: '混合ディレクレ分布を用いた文書分類の精度について' 情報処理学会論文誌 第48巻,第SIG11(TOD34)号, 20070615, p.14-26, 社団法人情報処理学会 * |
CSNG200701085015; 上田修功、外2名: 'ディリクレ混合過程モデルに基づく半教師有り学習' 電子情報通信学会技術研究報告(DE2007-1〜21) 第107巻,第114号, 20070621, p.87-92, 社団法人電子情報通信学会 * |
JPN6013056622; 上田修功、外2名: 'ディリクレ混合過程モデルに基づく半教師有り学習' 電子情報通信学会技術研究報告(DE2007-1〜21) 第107巻,第114号, 20070621, p.87-92, 社団法人電子情報通信学会 * |
JPN6013056624; 正田備也、外2名: '混合ディレクレ分布を用いた文書分類の精度について' 情報処理学会論文誌 第48巻,第SIG11(TOD34)号, 20070615, p.14-26, 社団法人情報処理学会 * |
JPN6013056627; 泉祐介、外1名: 'クラスターBPの実装の改良' 電子情報通信学会技術研究報告(NC2004-69〜82) 第104巻,第349号, 20041012, p.33-37, 社団法人電子情報通信学会 * |
JPN7013004170; Xiangdong Zhou、外4名: 'Automatic Image Annotation By An Iterative Approach: Incorporating Keyword Correlations And Region M' CIVR'07 Proceedings of the 6th ACM international conference on Image and video retrieval [ONLINE] , 20070711, p.25-32, ACM * |
JPN7013004171; Yifan Chen、外2名: 'Advertising Keyword Suggestion Based on Concept hierarchy' WSDM'08 Proceedings of the 2008 International Conference on Web Search and Data Mining [ONLINE] , 20080212, p.251-260, ACM * |
JPN7013004172; Anton Schwaighofer、外4名: 'Scalabe Clustering and Keyword Suggestion for Online Advertisements' ADKDD'09 Proceedings of the Third International Workshop on Data Mining and Audience Intelligence fo , 20090628, p.27-36, ACM * |
Also Published As
Publication number | Publication date |
---|---|
EP2417538A2 (en) | 2012-02-15 |
CN102388382B (zh) | 2015-11-25 |
US20100262568A1 (en) | 2010-10-14 |
KR101644667B1 (ko) | 2016-08-01 |
JP5442846B2 (ja) | 2014-03-12 |
CA2757703C (en) | 2017-01-17 |
EP2417538A4 (en) | 2016-08-31 |
CN102388382A (zh) | 2012-03-21 |
KR20110138229A (ko) | 2011-12-26 |
WO2010117889A2 (en) | 2010-10-14 |
US8204838B2 (en) | 2012-06-19 |
CA2757703A1 (en) | 2010-10-14 |
WO2010117889A3 (en) | 2011-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5442846B2 (ja) | スケーラブルなクラスタリング | |
US8589317B2 (en) | Human-assisted training of automated classifiers | |
US8498950B2 (en) | System for training classifiers in multiple categories through active learning | |
Gartrell et al. | Bayesian low-rank determinantal point processes | |
Agarwal et al. | Statistical methods for recommender systems | |
US9087332B2 (en) | Adaptive targeting for finding look-alike users | |
US8719192B2 (en) | Transfer of learning for query classification | |
JP5921536B2 (ja) | コンピュータ化エージェントのシステムとユーザ指図セマンティックネットワーキング | |
EP2860672A2 (en) | Scalable cross domain recommendation system | |
US20070214140A1 (en) | Assigning into one set of categories information that has been assigned to other sets of categories | |
CN110321291A (zh) | 测试案例智能提取系统及方法 | |
CN112989213B (zh) | 内容推荐方法、装置、系统、电子设备及存储介质 | |
Loni et al. | Top-N recommendation with multi-channel positive feedback using factorization machines | |
Du et al. | Privileged matrix factorization for collaborative filtering | |
Borrajo et al. | TCBR-HMM: An HMM-based text classifier with a CBR system | |
Girase et al. | Role of matrix factorization model in collaborative filtering algorithm: a survey | |
US11392751B1 (en) | Artificial intelligence system for optimizing informational content presentation | |
Shanahan et al. | Digital advertising: An information scientist’s perspective | |
Boutemedjet et al. | Long-term relevance feedback and feature selection for adaptive content based image suggestion | |
Feng et al. | Forest-based deep recommender | |
Li et al. | AutoOpt: Automatic hyperparameter scheduling and optimization for deep click-through rate prediction | |
Ishikawa et al. | Dynamic collaborative filtering Thompson Sampling for cross-domain advertisements recommendation | |
US20240135413A1 (en) | Processing of Queries using a Consolidated Matching Architecture | |
Liu et al. | A Joint Dynamic Ranking System with DNN and Vector-based Clustering Bandit | |
CN117112906A (zh) | 一种基于人工智能的信息推送方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130319 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130319 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130712 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130719 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5442846 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |