JP5213742B2 - 概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 - Google Patents
概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 Download PDFInfo
- Publication number
- JP5213742B2 JP5213742B2 JP2009024157A JP2009024157A JP5213742B2 JP 5213742 B2 JP5213742 B2 JP 5213742B2 JP 2009024157 A JP2009024157 A JP 2009024157A JP 2009024157 A JP2009024157 A JP 2009024157A JP 5213742 B2 JP5213742 B2 JP 5213742B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- search
- concept
- vectors
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索ベクトル入力手段が、検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力ステップ(ステップ1)と、
検索条件ベクトル入力手段が、検索ベクトルに対するOR条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力ステップ(ステップ2)と、
被検索ベクトル取得手段が、検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得ステップ(ステップ3)と、
距離計算手段が、検索ベクトルとN個の検索条件ベクトルとが成すN次元平面と、被検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算ステップ(ステップ4)と、からなる。
検索ベクトル入力手段が、検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力ステップと、
検索条件ベクトル入力手段が、検索ベクトルに対するNOT条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力ステップと、
被検索ベクトル取得手段が、検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得ステップと、
距離計算手段が、被検索ベクトルとN個の検索条件ベクトルとによるN次元平面と、検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算ステップと、からなる。
検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力手段101と、
検索ベクトルに対するOR条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力手段102と、
検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段103から被検索ベクトルを取得する被検索ベクトル取得手段104と、
検索ベクトルとN個の検索条件ベクトルとが成すN次元平面と、被検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段107に格納する距離計算手段105と、を有する。
本発明(請求項4)は、単語または文書の概念を概念ベクトルとして数値化し、ベクトル間の距離に基づいて、単語間または文書間または単語−文書間の類似性を判定する概念検索装置であって、
検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力手段と、
前記検索ベクトルに対するNOT条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力手段と、
検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得手段と、
前記被検索ベクトルと前記N個の検索条件ベクトルとによるN次元平面と、前記検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算手段と、
を有する。
検索条件が「単語Aを含むか、単語Bを含むか、単語Cを含むか」である場合は、
検索ベクトル:単語Aの概念ベクトル;
検索条件ベクトル:単語Bの概念ベクトル、及び単語Cの概念ベクトル;
被検索ベクトル:検索対象の各文書の概念ベクトル;
となる。
検索条件が「単語Aを含み、且つ単語Bを含まない、且つ単語Cを含まない」である場合は、
検索ベクトル:単語Aの概念ベクトル;
検索条件ベクトル:単語Bの概念ベクトル、及び単語Cの概念ベクトル;
被検索ベクトル:検索対象の各文書の概念ベクトル;
となる。
次に、NOT検索の場合の距離計算方法を図6に従って説明する。
OR検索及びNOT検索を同時に適用する場合の距離計算方法を図7に従って説明する。
図8は、NOT検索条件が複数ある場合を示している。この場合、OR検索条件が指定されないため、OR→=OP→であるから、距離
図9に、OR検索条件、NOT検索条件がそれぞれ複数ある場合を示した。この場合、距離
102 検索条件ベクトル入力手段、検索条件ベクトル入力部
103 概念ベクトル蓄積手段、概念ベクトル蓄積部
104 被検索ベクトル取得手段、被検索ベクトル取得部
105 距離計算手段、距離計算部
106 結果出力部
107 距離計算結果記憶手段、距離計算結果記憶部
Claims (6)
- 単語または文書の概念を概念ベクトルとして数値化し、ベクトル間の距離に基づいて、単語間または文書間または単語−文書間の類似性を判定する概念検索方法において、
検索ベクトル入力手段が、検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力ステップと、
検索条件ベクトル入力手段が、前記検索ベクトルに対するOR条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力ステップと、
被検索ベクトル取得手段が、検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得ステップと、
距離計算手段が、前記検索ベクトルと前記N個の検索条件ベクトルとが成すN次元平面と、前記被検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算ステップと、
からなることを特徴とする概念検索方法。 - 単語または文書の概念を概念ベクトルとして数値化し、ベクトル間の距離に基づいて、単語間または文書間または単語−文書間の類似性を判定する概念検索方法において、
検索ベクトル入力手段が、検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力ステップと、
検索条件ベクトル入力手段が、前記検索ベクトルに対するNOT条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力ステップと、
被検索ベクトル取得手段が、検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得ステップと、
距離計算手段が、前記被検索ベクトルと前記N個の検索条件ベクトルとによるN次元平面と、前記検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算ステップと、
からなることを特徴とする概念検索方法。 - 単語または文書の概念を概念ベクトルとして数値化し、ベクトル間の距離に基づいて、単語間または文書間または単語−文書間の類似性を判定する概念検索装置であって、
検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力手段と、
前記検索ベクトルに対するOR条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力手段と、
検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得手段と、
前記検索ベクトルと前記N個の検索条件ベクトルとが成すN次元平面と、前記被検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算手段と、
を有することを特徴とする概念検索装置。 - 単語または文書の概念を概念ベクトルとして数値化し、ベクトル間の距離に基づいて、単語間または文書間または単語−文書間の類似性を判定する概念検索装置であって、
検索語または検索文書の概念ベクトル(検索ベクトル)を1つ取得する検索ベクトル入力手段と、
前記検索ベクトルに対するNOT条件となるN個の、単語または文書の概念ベクトル(検索条件ベクトル)を取得する検索条件ベクトル入力手段と、
検索される複数の単語または複数の文書の概念ベクトル(被検索ベクトル)が格納された概念ベクトル蓄積手段から被検索ベクトルを取得する被検索ベクトル取得手段と、
前記被検索ベクトルと前記N個の検索条件ベクトルとによるN次元平面と、前記検索条件ベクトルとの距離を計算し、ベクトル距離計算記憶手段に格納する距離計算手段と、
を有することを特徴とする概念検索装置。 - 請求項1または2のいずれか1項記載の概念検索方法の各ステップを実行するコンピュータを機能させるための概念検索プログラム。
- 請求項5記載の概念検索プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009024157A JP5213742B2 (ja) | 2009-02-04 | 2009-02-04 | 概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009024157A JP5213742B2 (ja) | 2009-02-04 | 2009-02-04 | 概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010182041A JP2010182041A (ja) | 2010-08-19 |
JP5213742B2 true JP5213742B2 (ja) | 2013-06-19 |
Family
ID=42763597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009024157A Expired - Fee Related JP5213742B2 (ja) | 2009-02-04 | 2009-02-04 | 概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5213742B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112017006785B4 (de) * | 2017-02-14 | 2023-01-19 | Mitsubishi Electric Corporation | Datenanalysator und Datenanalyseverfahren |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3948090B2 (ja) * | 1998-01-22 | 2007-07-25 | 富士ゼロックス株式会社 | 情報検索装置、情報検索方法および情報検索プログラムを記録した記憶媒体 |
JP3862059B2 (ja) * | 2001-01-22 | 2006-12-27 | Kddi株式会社 | 検索式拡張方法および検索システム |
JP3875510B2 (ja) * | 2001-05-10 | 2007-01-31 | 日本電信電話株式会社 | 情報検索装置、その方法、そのプログラム及びそのプログラムが記録された記録媒体 |
GB2395808A (en) * | 2002-11-27 | 2004-06-02 | Sony Uk Ltd | Information retrieval |
JP5061870B2 (ja) * | 2006-12-06 | 2012-10-31 | 幸生 陳 | コンテンツ検索システム、コンテンツ検索方法及びコンテンツ検索プログラム |
JP2007220144A (ja) * | 2007-05-18 | 2007-08-30 | Seiko Epson Corp | 特許検索装置、特許検索装置の制御方法および制御プログラム |
-
2009
- 2009-02-04 JP JP2009024157A patent/JP5213742B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010182041A (ja) | 2010-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11682226B2 (en) | Method and system for assessing similarity of documents | |
US8341112B2 (en) | Annotation by search | |
WO2020143184A1 (zh) | 知识融合方法、装置、计算机设备和存储介质 | |
JP5661813B2 (ja) | セマンティックオブジェクトの特徴付けおよび検索 | |
JP6176017B2 (ja) | 検索装置、検索方法、およびプログラム | |
JP2020500371A (ja) | 意味的検索のための装置および方法 | |
US20090300006A1 (en) | Techniques for computing similarity measurements between segments representative of documents | |
JP2007328311A (ja) | マルチメディアデータ管理方法とその装置 | |
JP2011248596A (ja) | 画像入り文書の検索システム及び検索方法 | |
JP2016018286A (ja) | 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム | |
CN116561388A (zh) | 一种获取标签的数据处理系统 | |
CN106933824A (zh) | 在多个文档中确定与目标文档相似的文档集合的方法和装置 | |
JP4325370B2 (ja) | 文書関連語彙獲得装置及びプログラム | |
JP5869948B2 (ja) | パッセージ分割方法、装置、及びプログラム | |
JP2009277099A (ja) | 類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP5213742B2 (ja) | 概念検索方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP2021144348A (ja) | 情報処理装置及び情報処理方法 | |
Dinov et al. | Natural language processing/text mining | |
JP5533272B2 (ja) | データ出力装置、データ出力方法およびデータ出力プログラム | |
JP5164876B2 (ja) | 代表語抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
WO2018150453A1 (ja) | データ分析装置およびデータ分析方法 | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP4813312B2 (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
Dhar et al. | Mathematical document retrieval system based on signature hashing | |
Dhumal et al. | Retrieval and extraction of unique patterns from compressed text data using the SVD technique on Hadoop Apache MAHOUT framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5213742 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |