JPWO2010061537A1 - 検索装置、検索方法、及びプログラム - Google Patents
検索装置、検索方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2010061537A1 JPWO2010061537A1 JP2010540323A JP2010540323A JPWO2010061537A1 JP WO2010061537 A1 JPWO2010061537 A1 JP WO2010061537A1 JP 2010540323 A JP2010540323 A JP 2010540323A JP 2010540323 A JP2010540323 A JP 2010540323A JP WO2010061537 A1 JPWO2010061537 A1 JP WO2010061537A1
- Authority
- JP
- Japan
- Prior art keywords
- word
- document
- frequency
- area
- upper limit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
要約マトリクス記憶部と、領域上限算出部と、単語頻度算出部と、文書頻度参照部とを備え、
前記要約マトリクス記憶部は、
単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶し、
前記領域上限算出部は、
前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出し、
前記単語頻度算出部は、
前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定し、
前記文書頻度参照部は、
前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力する、
ことを特徴とする。
(a)単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶するステップと、
(b)前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出するステップと、
(c)前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定するステップと、
(d)前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力するステップとを、有することを特徴とする。
前記コンピュータに、
(a)単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶するステップと、
(b)前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出するステップと、
(c)前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定するステップと、
(d)前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力するステップとを、実行させることを特徴とする。
以下、本発明の実施の形態1における検索装置、検索方法及びプログラムについて、図4〜図24を参照しながら説明する。最初に、本実施の形態1における検索装置の構成について図4〜図12を用いて説明する。図4は、本発明の実施の形態1における検索装置の構成を示すブロック図である。
[関連技術2]W.Xu, X.Liu and Y.Gong著「Document clustering based on non-negative matrix factorization」、In Proceedings of ACM SIGIR International Conference on pages 267-273、 2003.
[関連技術3]T.Hofmann著「Probabilistic Latent Semantic Analysis」、In Proceedings of Conference on Uncertainty in Artificial Intelligence on pages 289-296、 1999.
次に本発明の実施の形態2における検索装置、検索方法、およびプログラムについて、図25及び図26を参照しながら説明する。最初に、本実施の形態2における検索装置の構成について図25を用いて説明する。図25は、本発明の実施の形態2における検索装置の構成を示すブロック図である。
2 領域上限算出部
3 単語頻度算出部
4 文書頻度参照部
5 クラスタ作成部
6 領域要約作成部
7 単語文書マトリクス記憶部
8 クラスタ処理展開部
9 クラスタ処理選択部
10 クラスタ処理部
Claims (15)
- 単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶する要約マトリクス記憶手段と、
前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出する領域上限算出手段と、
前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定する単語頻度算出手段と、
前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力する文書頻度参照手段と、
を備える検索装置。 - 前記単語集合と前記文書集合との間の共起関係を特定するマトリクスを入力として、単語と文書に対するクラスタリング処理を行い、これによって、前記マトリクスを構成する単語集合と前記部分集合とを、それぞれ複数の部分集合に分割して、前記複数の領域を生成し、更に、その結果を前記領域要約作成手段に出力するクラスタ作成手段と、
前記クラスタリング処理による分割によって生成された前記複数の領域から、前記要約マトリクス記憶手段によって記憶される前記要約情報を作成する領域要約作成手段と、
を更に備える請求項1記載の検索装置。 - 前記領域要約作成手段が、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内に含まれる単語の当該領域における頻度を求め、更に、求めた前記頻度の最大値を特定し、特定した前記最大値を前記要約情報とし、
前記領域上限算出手段が、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、当該領域に含まれている、前記部分集合を構成する文書の数を求め、求めた前記文書の数と、当該領域についての前記頻度の最大値とを比較し、比較結果に基づいて、前記頻度の上限を算出する、請求項2に記載の検索装置。 - 前記領域要約作成手段が、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内の文書において当該領域内の単語が含まれるか否かを表すビット列を求め、求めた前記ビット列を前記要約情報とし、
前記領域上限算出手段が、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、前記部分集合を構成する文書が、当該領域に含まれているか否かを表すビット列を求め、当該領域上限算出手段によって求められたビット列と、前記領域要約作成手段によって求められたビット列とのAND演算を実行し、演算結果に基づいて、前記頻度の上限を算出する、請求項2に記載の検索装置。 - 複数のクラスタ処理手段と、クラスタ処理展開手段と、クラスタ処理選択手段とを更に備え、
前記クラスタ作成手段、前記領域要約作成手段、前記要約マトリクス記憶手段、前記領域上限算出手段、前記単語頻度算出手段、及び前記文書頻度参照手段は、前記複数のクラスタ処理手段それぞれに毎に備えられ、
前記複数のクラスタ処理手段それぞれにおいて、前記クラスタ作成手段それぞれは、互いに異なるクラスタリング処理を行い、
前記クラスタ処理展開手段は、前記部分集合を表す情報が入力されると、入力された情報を、前記複数のクラスタ処理手段それぞれの前記領域上限算出手段に入力し、
前記クラスタ処理選択手段は、前記複数のクラスタ処理手段それぞれの前記単語頻度算出手段が設定した、前記単語が共通する領域毎の単語の頻度の上限を受け取り、受け取った前記各単語の頻度の上限の分布に基づいて、前記複数のクラスタ処理手段のうちの少なくとも一つを選択し、選択した前記クラスタ処理手段の前記文書頻度参照手段のみに、処理を行わせる、請求項2に記載の検索装置。 - (a)単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶し、
(b)前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出し、
(c)前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定し、
(d)前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力する、ことを特徴とする検索方法。 - (e)前記単語集合と前記文書集合との間の共起関係を特定するマトリクスを入力として、単語と文書に対するクラスタリング処理を行い、これによって、前記マトリクスを構成する単語集合と前記部分集合とを、それぞれ複数の部分集合に分割して、前記複数の領域を生成し、
(f)前記(e)のクラスタリング処理による分割によって生成された前記複数の領域から、前記(a)のステップで記憶される前記要約情報を作成する、請求項6に記載の検索方法。 - 前記(f)の作成において、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内に含まれる単語の当該領域における頻度を求め、更に、求めた前記頻度の最大値を特定し、特定した前記最大値を前記要約情報とし、
前記(c)の設定において、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、当該領域に含まれている、前記部分集合を構成する文書の数を求め、求めた前記文書の数と、当該領域についての前記頻度の最大値とを比較し、比較結果に基づいて、前記頻度の上限を算出する、請求項7に記載の検索方法。 - 前記(f)の作成において、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内の文書において当該領域内の単語が含まれるか否かを表すビット列を求め、求めた前記ビット列を前記要約情報とし、
前記(c)の設定において、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、前記部分集合を構成する文書が、当該領域に含まれているか否かを表すビット列を求め、求められたビット列と、前記(f)の作成によって求められたビット列とのAND演算を実行し、演算結果に基づいて、前記頻度の上限を算出する、請求項7に記載の検索方法。 - 前記(e)の生成が、前記クラスタリング処理の種類を変えて複数回実行され、
前記(f)の作成と、前記(a)〜前記(c)とが、前記(e)の生成が実行される度に実行される場合において、
各(e)の生成に対応する前記(c)で設定された、前記単語が共通する領域毎の単語の頻度の上限から、それぞれの上限の分布に基づいて、少なくとも一つの、前記単語が共通する領域毎の単語の頻度の上限を選択し、選択した上限を用いて、前記(d)の出力を実行させる、請求項7に記載の検索方法。 - (a)単語集合と文書集合との間の共起関係を表現するマトリクスを分割して得られた複数の領域から作成され、且つ、文書集合に含まれる部分集合を表す情報が与えられた場合に、前記複数の領域それぞれにおける単語の頻度の算出又は予測を可能にする情報を、要約情報として記憶する処理と、
(b)前記部分集合を表す情報が入力されると、前記部分集合を表す情報と前記複数の領域との関係を調べ、得られた結果から、前記複数の領域それぞれに対する前記要約情報を参照して、前記複数の領域それぞれについて、それぞれに含まれる単語の、前記部分集合に対する頻度の上限を算出する処理と、
(c)前記複数の領域それぞれについての前記頻度の上限を、前記単語が共通する領域毎に和算し、得られた和算値を、前記単語が共通する領域毎の単語の頻度の上限に設定する処理と、
(d)前記単語が共通する領域毎の単語の頻度の上限に基づいて、検索対象となる領域を求め、更に、求めた前記検索対象となる領域に基づいて、設定された数の単語を頻度が高い順に特定し、特定した単語を前記部分集合に特徴的な単語として出力する処理とを、コンピュータに実行させるためのプログラムが格納された記録媒体。 - (e)前記単語集合と前記文書集合との間の共起関係を特定するマトリクスを入力として、単語と文書に対するクラスタリング処理を行い、これによって、前記マトリクスを構成する単語集合と前記部分集合とを、それぞれ複数の部分集合に分割して、前記複数の領域を生成する処理と、
(f)前記(e)の処理におけるクラスタリング処理による分割によって生成された前記複数の領域から、前記(a)の処理で記憶される前記要約情報を作成する、処理とを、更に前記コンピュータに実行させる、請求項11に記載のプログラムが格納された記録媒体。 - 前記(f)の処理において、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内に含まれる単語の当該領域における頻度を求め、更に、求めた前記頻度の最大値を特定し、特定した前記最大値を前記要約情報とし、
前記(c)の処理において、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、当該領域に含まれている、前記部分集合を構成する文書の数を求め、求めた前記文書の数と、当該領域についての前記頻度の最大値とを比較し、比較結果に基づいて、前記頻度の上限を算出する、請求項12に記載のプログラムが格納された記録媒体。 - 前記(f)の処理において、前記クラスタリング処理による分割によって生成された前記複数の領域それぞれについて、少なくとも、各領域内の文書において当該領域内の単語が含まれるか否かを表すビット列を求め、求めた前記ビット列を前記要約情報とし、
前記(c)の処理において、前記部分集合を表す情報と前記複数の領域との関係として、前記複数の領域それぞれ毎に、前記部分集合を構成する文書が、当該領域に含まれているか否かを表すビット列を求め、求められたビット列と、前記(f)の処理によって求められたビット列とのAND演算を実行し、演算結果に基づいて、前記頻度の上限を算出する、請求項12に記載のプログラムが格納された記録媒体。 - 前記(e)の処理が、前記クラスタリング処理の種類を変えて複数回実行され、
前記(f)の処理と、前記(a)〜前記(c)の処理とが、前記(e)の処理が実行される度に実行される場合において、
各(e)の処理に対応する前記(c)の処理で設定された、前記単語が共通する領域毎の単語の頻度の上限から、それぞれの上限の分布に基づいて、少なくとも一つの、前記単語が共通する領域毎の単語の頻度の上限を選択し、選択した上限を用いて、前記(d)の処理を実行させる、処理を更に前記コンピュータに実行させる、請求項12に記載のプログラムが格納された記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010540323A JP5594145B2 (ja) | 2008-11-26 | 2009-11-06 | 検索装置、検索方法、及びプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008300793 | 2008-11-26 | ||
JP2008300793 | 2008-11-26 | ||
PCT/JP2009/005907 WO2010061537A1 (ja) | 2008-11-26 | 2009-11-06 | 検索装置、検索方法、及びプログラムが格納された記録媒体 |
JP2010540323A JP5594145B2 (ja) | 2008-11-26 | 2009-11-06 | 検索装置、検索方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010061537A1 true JPWO2010061537A1 (ja) | 2012-04-19 |
JP5594145B2 JP5594145B2 (ja) | 2014-09-24 |
Family
ID=42225427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010540323A Active JP5594145B2 (ja) | 2008-11-26 | 2009-11-06 | 検索装置、検索方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8892574B2 (ja) |
JP (1) | JP5594145B2 (ja) |
WO (1) | WO2010061537A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9607076B2 (en) * | 2013-06-11 | 2017-03-28 | Konica Minolta, Inc. | Device and method for determining interest, and computer-readable storage medium for computer program |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102023989B (zh) * | 2009-09-23 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 一种信息检索方法及其系统 |
JP5657338B2 (ja) * | 2010-10-19 | 2015-01-21 | 株式会社中電シーティーアイ | 入力情報分析装置 |
US9323753B2 (en) * | 2011-02-23 | 2016-04-26 | Samsung Electronics Co., Ltd. | Method and device for representing digital documents for search applications |
CN103970910B (zh) * | 2014-05-27 | 2017-02-15 | 南京大学 | 一种基于篇章文档的自适应输入法 |
US11461533B2 (en) * | 2014-10-15 | 2022-10-04 | International Business Machines Corporation | Generating a document preview |
US11392568B2 (en) * | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US10599700B2 (en) * | 2015-08-24 | 2020-03-24 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for narrative detection and frame detection using generalized concepts and relations |
US11741145B1 (en) * | 2018-09-30 | 2023-08-29 | Veritas Technologies Llc | Method and system for classification of unstructured data items |
JP2020154395A (ja) * | 2019-03-18 | 2020-09-24 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
US20230136726A1 (en) * | 2021-10-29 | 2023-05-04 | Peter A. Chew | Identifying Fringe Beliefs from Text |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274541A (ja) | 1993-03-17 | 1994-09-30 | Nippon Steel Corp | 文献検索システム |
US5675819A (en) * | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5926812A (en) * | 1996-06-20 | 1999-07-20 | Mantra Technologies, Inc. | Document extraction and comparison method with applications to automatic personalized database searching |
JP3614618B2 (ja) * | 1996-07-05 | 2005-01-26 | 株式会社日立製作所 | 文献検索支援方法及び装置およびこれを用いた文献検索サービス |
US6484168B1 (en) * | 1996-09-13 | 2002-11-19 | Battelle Memorial Institute | System for information discovery |
JP3607462B2 (ja) | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
JP2001014341A (ja) | 1999-07-02 | 2001-01-19 | Ricoh Co Ltd | データベース作成装置および関連文書/関連語検索装置、データベース作成方法および関連文書/関連語検索方法ならびに記憶媒体 |
US6772141B1 (en) * | 1999-12-14 | 2004-08-03 | Novell, Inc. | Method and apparatus for organizing and using indexes utilizing a search decision table |
JP2002032394A (ja) | 2000-07-18 | 2002-01-31 | Ricoh Co Ltd | 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体 |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
JP2003248686A (ja) * | 2002-02-22 | 2003-09-05 | Ricoh Co Ltd | 文書群ラベル生成装置、文書群ラベル生成方法及び記録媒体 |
US6847966B1 (en) * | 2002-04-24 | 2005-01-25 | Engenium Corporation | Method and system for optimally searching a document database using a representative semantic space |
JP4116329B2 (ja) | 2002-05-27 | 2008-07-09 | 株式会社日立製作所 | 文書情報表示システム、文書情報表示方法及び文書検索方法 |
US7003516B2 (en) * | 2002-07-03 | 2006-02-21 | Word Data Corp. | Text representation and method |
JP2004164036A (ja) * | 2002-11-08 | 2004-06-10 | Hewlett Packard Co <Hp> | 文書の共通性評価方法 |
US7630980B2 (en) * | 2005-01-21 | 2009-12-08 | Prashant Parikh | Automatic dynamic contextual data entry completion system |
JP4886266B2 (ja) | 2005-10-11 | 2012-02-29 | 株式会社東芝 | 文献調査方法、文献調査システムおよび文献調査プログラム |
JP4848317B2 (ja) * | 2007-06-19 | 2011-12-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベースのインデックス作成システム、方法及びプログラム |
JPWO2009001696A1 (ja) * | 2007-06-22 | 2010-08-26 | 株式会社パテント・リザルト | 情報処理装置、プログラム、情報処理方法 |
JP5078674B2 (ja) * | 2008-02-29 | 2012-11-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 分析システム、情報処理装置、アクティビティ分析方法、およびプログラム |
-
2009
- 2009-11-06 WO PCT/JP2009/005907 patent/WO2010061537A1/ja active Application Filing
- 2009-11-06 US US13/129,342 patent/US8892574B2/en active Active
- 2009-11-06 JP JP2010540323A patent/JP5594145B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9607076B2 (en) * | 2013-06-11 | 2017-03-28 | Konica Minolta, Inc. | Device and method for determining interest, and computer-readable storage medium for computer program |
Also Published As
Publication number | Publication date |
---|---|
JP5594145B2 (ja) | 2014-09-24 |
WO2010061537A1 (ja) | 2010-06-03 |
US8892574B2 (en) | 2014-11-18 |
US20110219000A1 (en) | 2011-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5594145B2 (ja) | 検索装置、検索方法、及びプログラム | |
JP5531395B2 (ja) | 単語親和度による単語クラスタの識別 | |
US8171029B2 (en) | Automatic generation of ontologies using word affinities | |
JP6782858B2 (ja) | 文献分類装置 | |
JP5621773B2 (ja) | 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム | |
WO2017097231A1 (zh) | 话题处理方法及装置 | |
KR100706389B1 (ko) | 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치 | |
CN112579155A (zh) | 代码相似性检测方法、装置以及存储介质 | |
US9552415B2 (en) | Category classification processing device and method | |
CN113961528A (zh) | 基于知识图谱的文件语义关联存储系统及方法 | |
KR20180129001A (ko) | 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템 | |
CN111752955A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
KR101472451B1 (ko) | 디지털 콘텐츠 관리 시스템 및 방법 | |
CN113434639A (zh) | 审计数据处理方法及装置 | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
CN111143400A (zh) | 一种全栈式检索方法、系统、引擎及电子设备 | |
JP5324677B2 (ja) | 類似文書検索支援装置及び類似文書検索支援プログラム | |
JP2013130965A (ja) | データ分析装置、データ分析方法及びプログラム | |
CN111090743B (zh) | 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置 | |
CN107577690A (zh) | 海量信息数据的推荐方法及推荐装置 | |
JP4175001B2 (ja) | 文書データ検索装置 | |
Do Van et al. | Classify high dimensional datasets using discriminant positive negative association rules | |
CN117688140B (zh) | 文档查询方法、装置、计算机设备和存储介质 | |
CN111694948B (zh) | 文本的分类方法及系统、电子设备、存储介质 | |
JP5416680B2 (ja) | 文書分割検索装置及び方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121010 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140721 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5594145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |