JP2010009577A - 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 - Google Patents
情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP2010009577A JP2010009577A JP2009077243A JP2009077243A JP2010009577A JP 2010009577 A JP2010009577 A JP 2010009577A JP 2009077243 A JP2009077243 A JP 2009077243A JP 2009077243 A JP2009077243 A JP 2009077243A JP 2010009577 A JP2010009577 A JP 2010009577A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- clustering
- documents
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000010365 information processing Effects 0.000 title claims abstract description 50
- 230000008569 process Effects 0.000 claims abstract description 31
- 239000013598 vector Substances 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000000877 morphologic effect Effects 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 abstract 3
- 238000004364 calculation method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012553 document review Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明に係る情報処理装置1は、文書の全文検索を行なって検索条件に該当する検索文書を検索する文書検索手段301と、検索条件との適合度を表す適合度スコアによって検索文書を順序付ける文書スコアリング手段302と、文書識別子と特徴語と当重み値とが対応付けられて登録された特徴語ファイルデータベース307と、検索文書に対してクラスタリング処理を行う文書クラスタリング手段304とを有し、検索結果一覧を作成する情報処理装置1において、適合度スコアに基づいて、検索文書をグループ化する文書グループ化手段303を有し、文書クラスタリング手段304は、グループ化されたグループごとに、そのグループ内の検索文書に対してクラスタリング処理を行う。
【選択図】図3
Description
されたキーワードと検索にヒットした文書との適合率をスコアという数値に表し、スコア
の大きなものから順番に、検索結果一覧に表示している(例えば、非特許文献1参照)。一般にスコアとは、入力されたキーワードに対するヒットした文書の適合度を表す。ここで、適合度は、キーワードの出現頻度に基づく値である。
はじめに、具体的な発明の内容を説明する前に、本発明を実施するにあたってのネットワーク構成について説明する。図1は、本発明による情報処理装置1、文書保管装置2及び端末3がネットワーク5を介して接続されているネットワーク図である。情報処理装置1は、本発明に係る全文検索サーバである。文書保管装置2は、検索対象となる文書を保管する。端末3は、情報処理装置1を利用するクライアント端末である。端末3は、ネットワーク5を介して情報処理装置1にアクセスする。情報処理装置1は、端末3の要求に応じて文書保管装置2に保管される複数の文書から検索語により目的文書の検索を行なう。これらいわゆる全文検索システムである。ネットワーク5は、有線、無線を含むネットワークである。なお、図1は本発明の一実施形態を説明するにあたっての構成を示したものであり、例えば、文書保管装置2及び端末3は複数あってもよいし、情報処理装置1に文書保管機能を持たせれば文書保管装置2を省略する構成とすることもできる。
図2は、本発明による情報処理装置1の一実施形態の主要構成を示すハードウェア構成図である。情報処理装置1のハードウェア構成について簡単に説明しておく。情報処理装置1は、主要な構成として、CPU201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、補助記憶装置204、記憶媒体読取装置205、入力装置206、表示装置207、及び通信装置208を含む構成である。
図3は、本発明の実施形態に係る情報処理装置1の一実施形態の主要機能を示す機能ブロック図である。情報処理装置1は、主要な機能として、文書検索部301、文書スコアリング部302、第1文書クラスタリング部303、第2文書クラスタリング部304、出力部305、索引ファイルデータベース306、及び特徴語ファイルデータベース307を含む構成である。
本実施例による情報処理装置1の一使用形態について説明する。まず、本発明の内容理解を容易にするため、本発明実施の全体の流れについて説明する。図4は、索引ファイル及び特徴語ファイルが作成されるまでの流れについて説明するフローチャートである。この段階はいわば検索準備段階である。また、図5は、検索条件(検索語)の入力によって行なわれる文書検索処理の流れについて説明するフローチャートである。この段階はいわば検索段階である。以下、図4、5を参照しつつ説明を行う。
図4を参照して、索引ファイル及び特徴語ファイルが作成されるまでの流れを説明する。ステップS401で、入力された文書の全文データから、N-gram方式や形態素解析方式などにより単語が抽出される。ステップS402で、この単語を検索単位として検索できるよう、例えば、転置索引が作成される。また、文書のテキスト情報が登録される際には文書識別子(文書ID)を割り当てられ、この文書識別子とテキスト情報が対応付けて登録される。作成された索引ファイルは索引ファイルデータベース306に登録される。
次に図5を参照して、検索条件(検索語)の入力によって行なわれる文書検索処理の流れについて説明する。ステップS501で、検索語が入力されると索引ファイルから索引され、文書が特定されて検索文書が取得される。
まず、索引ファイルが利用されて検索条件に該当する検索文書が検索される処理について詳しく説明する。なお、この処理はステップS501に相当する。
次に、検索文書に対する文書スコアリングの処理について詳しく説明する。なお、この処理はステップS502に相当する。
次に、検索文書に対する第1のクラスタリング処理について詳しく説明する。なお、この処理はステップS503に相当する。
次に、検索文書に対する第2のクラスタリング処理について詳しく説明する。なお、この処理はステップS504に相当する。
d1 = (1, 1, 1, 1, 0, 0)
d3 = (1, 1, 0, 0, 1, 1)
となる。そして、余弦s(d1,d3)を求めると、0.5となる。
d1 = (1, 1, 1, 1, 0)
d10 = (1, 1, 1, 0, 1)
となる。その余弦s(d1,d10)は0.75となる。同様にして、文書番号1と5の余弦s(d1,d5)は0.5となる。
出力部305は、適合度スコア及びクラスタリングの観点から、検索結果(検索文書のリスト)を出力する。図13を参照して説明するに、上述した第1、2のクラスタリングにより各検索文書(文書ID1−10)はクラスタ番号が付されてグループ化された。
最後に特徴語の抽出について説明する。特徴語はその重みとともに特徴語ファイルに登録されている。また第2のクラスタリングにおいて、特徴語ファイルが用いられ登録される特徴語及びその重み(重み値)に基づいて検索文書のクラスタリング(判断)が行なわれることは上述した。とすると文書において如何なる単語を特徴語とするかは、クラスタリング結果(そのクラスタリング精度)に影響することになる。よってここでは、より精度の高いクラスタリング(第2のクラスタリングに相当)を行なうため特徴語の抽出方法について簡単に説明する。
1、TFIDF値がある閾値以上であるものすべて
2、TFIDF値がある閾値以上であるもののうち上位N件
とする。
1. 重み値がある閾値以上であるものすべて
2. 重み値がある閾値以上であるもののうち上位N件
とする。
本実施例による情報処理装置1の一使用形態について説明する。実施例1において、本発明による情報処理装置1は、適合度スコアによって検索文書に対する第1のクラスタリング処理を行い、その後、各クラスタ内で検索文書に対する第2のクラスタリング処理を行うことを説明した。ところで、適合度スコアは、検索条件との適合度であって、クラスタリングを行う文書間の距離とは別の次元のものである。従って、適合度スコアが近いものは似ている文書となる可能性は高いが、適合度スコアが必ずしも近くなくても類似する文書が存在する場合がある。例えば、図12を再び参照すると、文書ID「6」の文書と、文書ID「3」及び「5」の文書とは、特徴語及び重みが同じ(又は類似)であるにもかかわらず、図13の第2のクラスタリング結果においては、異なるクラスタ番号としてクラスタリングが行われている。即ち、文書ID「6」の文書はクラスタ番号「4」に、文書ID「3」及び「5」の文書はクラスタ番号「5」にクラスタリングされている。これは、適合度スコアによる第1のクラスタリング処理により、文書ID「6」の文書と、文書ID「3」及び「5」の文書とが、別のクラスタとして処理されたことに起因しているのである。そこで実施例2においては、このように適合度スコアが必ずしも近くなくても類似する文書が存在する場合の対処として、第2のクラスタリングの結果に対しさらにクラスタ間のマージ処理を行う。
図16は、本発明の実施例に係る情報処理装置1の一実施形態の主要機能を示す機能ブロック図である。情報処理装置1は、主要な機能として、文書検索部301、文書スコアリング部302、第1文書クラスタリング部303、第2文書クラスタリング部304、出力部305、索引ファイルデータベース306、特徴語ファイルデータベース307、及びクラスタマージ部308を含む構成である。
次に、クラスタ間のマージ処理について詳しく説明する。図17は、クラスタ間のマージ処理を説明するフローチャートである。以下、図を参照しつつ具体的に説明を行う。なお、図中ステップS501〜S505(図5)は上述した通りであるので説明を省略する。図中のステップS505では、第2のクラスタリング処理がなされて検索文書にクラスタ番号が付与されている。例えば、図13を参照すると、第2のクラスタリングの結果によって、クラスタは1〜4つのクラスタ(番号)に分類されており、以下クラスタ間のマージ処理について説明する。
100 × 99 / 2 = 4950
となってしまい、その計算量は膨大になる。従って、マージ対象のクラスタは、そのクラスタ自身から順に、例えば5つ先のクラスタまでと上限を決めておく。すると、一のクラスタ内の代表文書と、順に5つ先のクラスタ内の代表文書との距離を算出していくことになり、その計算数は、
(100 - 5) x 5 + 4 + 3 + 2 = 484
となる。このように各クラスタ内の代表文書間の距離の算出において、その対象とする代表文書の上限を決めておくことで、その計算量を4950から484へと大きく減少することができる。
2 文書管理装置
3 端末
5 ネットワーク
201 CPU
202 ROM
203 RAM
204 補助記憶装置
205 記憶媒体読取装置
206 入力装置
207 表示装置
208 通信装置
301 文書検索部
302 文書スコアリング部
303 第1文書クラスタリング部
304 第2文書クラスタリング部
305 出力部
306 索引ファイルデータベース
307 特徴語ファイルデータベース
308 クラスタマージ部
Claims (9)
- 文書の全文検索を行なって検索条件に該当する検索文書を検索する文書検索手段と、
前記検索条件との適合度を表す適合度スコアによって前記検索文書を順序付ける文書スコアリング手段と、
前記文書を識別するための文書識別子と、前記文書の全文データから抽出された特徴語と、当該特徴語の重みを表す重み値とが対応付けられて登録された特徴語ファイルデータベースと、
前記検索文書の前記文書識別子をキーとして、前記特徴語ファイルデータベースから取得した前記特徴語と当該特徴語の重み値とに基づいて、前記検索文書に対してクラスタリング処理を行う文書クラスタリング手段とを有し、
検索結果一覧を作成する情報処理装置であって、
前記適合度スコアに基づいて前記検索文書をグループ化する文書グループ化手段を有し、
前記文書クラスタリング手段は、前記文書グループ化手段によりグループ化されたグループごとに、そのグループ内の前記検索文書に対してクラスタリング処理を行うこと、
を特徴とする情報処理装置。 - 前記文書グループ化手段は、前記適合度スコアの平均変化率に基づいて、前記検索文書をグループ化すること、
を特徴とする請求項1に記載の情報処理装置。 - 前記文書クラスタリング手段は、前記特徴語をベクトル表現し、当該ベクトルの成す角度の余弦の値に基づいて、前記検索文書のクラスタリング処理を行うこと、
を特徴とする請求項1又は2に記載の情報処理装置。 - 前記特徴語は、前記全文データから得られる単語の出現頻度を表すTF値と、コーパスから得られる単語の出現頻度を表すDF値とに基づいて抽出されること、
を特徴とする請求項1ないし3いずれか一項に記載の情報処理装置。 - 前記特徴語は、前記全文データから得られる単語の出現頻度を表すTF値と、形態素解析の際に得られる出現頻度を表す生起コスト値とに基づいて抽出されること、
を特徴とする請求項1ないし3いずれか一項に記載の情報処理装置。 - 前記クラスタリング処理手段によりクラスタリング処理された各クラスタ内の検索文書の特徴語をベクトル表現し、当該ベクトルの成す角度の余弦の値に基づいて、当該検索文書の距離が所定閾値より近いクラスタ間のマージを行うクラスタマージ手段を有すること、
を特徴とする請求項1から5いずれか一項に記載の情報処理装置。 - 文書の全文検索を行なって検索条件に該当する検索文書を検索する文書検索手段と、
前記検索条件との適合度を表す適合度スコアによって前記検索文書を順序付ける文書スコアリング手段と、
前記文書の全文データから抽出される前記文書の特徴語と当該特徴語の重みを表す重み値とに基づいて、前記検索文書に対してクラスタリング処理を行う文書クラスタリング手段とを有し、検索結果一覧を作成する情報処理装置における全文検索方法であって、
前記適合度スコアに基づいて、前記検索文書をグループ化する文書グループ化手順を有し、
前記文書クラスタリング手段は、前記文書グループ化手順によりグループ化されたグループごとに、そのグループ内の前記検索文書に対してクラスタリング処理を行うこと、
を特徴とする全文検索方法。 - 請求項7に記載の全文検索方法をコンピュータに実行させるためのプログラム。
- 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009077243A JP5316158B2 (ja) | 2008-05-28 | 2009-03-26 | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 |
US12/473,616 US8180781B2 (en) | 2008-05-28 | 2009-05-28 | Information processing apparatus , method, and computer-readable recording medium for performing full text retrieval of documents |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008139762 | 2008-05-28 | ||
JP2008139762 | 2008-05-28 | ||
JP2009077243A JP5316158B2 (ja) | 2008-05-28 | 2009-03-26 | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009577A true JP2010009577A (ja) | 2010-01-14 |
JP5316158B2 JP5316158B2 (ja) | 2013-10-16 |
Family
ID=41381050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009077243A Active JP5316158B2 (ja) | 2008-05-28 | 2009-03-26 | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8180781B2 (ja) |
JP (1) | JP5316158B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013109606A (ja) * | 2011-11-22 | 2013-06-06 | Ricoh Co Ltd | 情報処理装置およびプログラム |
JP2015507299A (ja) * | 2012-02-10 | 2015-03-05 | グーグル・インコーポレーテッド | 検索結果分類 |
JPWO2015040860A1 (ja) * | 2013-09-18 | 2017-03-02 | 日本電気株式会社 | 分類辞書生成装置、分類辞書生成方法及びプログラム |
JP2021077256A (ja) * | 2019-11-13 | 2021-05-20 | 株式会社Fronteo | 文書処理装置、文書レビューシステム、文書処理装置の制御方法、文書レビューサービスを提供する方法、および制御プログラム |
JP2023054506A (ja) * | 2021-10-04 | 2023-04-14 | 株式会社ラック | 情報検索システム、情報検索方法およびプログラム |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996215B (zh) | 2009-08-27 | 2013-07-24 | 阿里巴巴集团控股有限公司 | 一种应用于电子商务网站的信息匹配方法和系统 |
JP5025782B2 (ja) * | 2010-02-17 | 2012-09-12 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
US7933859B1 (en) | 2010-05-25 | 2011-04-26 | Recommind, Inc. | Systems and methods for predictive coding |
CN102298576B (zh) * | 2010-06-25 | 2014-07-02 | 株式会社理光 | 文档关键词生成方法和装置 |
US9443008B2 (en) * | 2010-07-14 | 2016-09-13 | Yahoo! Inc. | Clustering of search results |
US8762300B2 (en) * | 2011-10-18 | 2014-06-24 | Ming Chuan University | Method and system for document classification |
US9311650B2 (en) | 2012-02-22 | 2016-04-12 | Alibaba Group Holding Limited | Determining search result rankings based on trust level values associated with sellers |
JP5567049B2 (ja) * | 2012-02-29 | 2014-08-06 | 株式会社Ubic | 文書分別システム及び文書分別方法並びに文書分別プログラム |
US8832108B1 (en) | 2012-03-28 | 2014-09-09 | Emc Corporation | Method and system for classifying documents that have different scales |
US9069768B1 (en) | 2012-03-28 | 2015-06-30 | Emc Corporation | Method and system for creating subgroups of documents using optical character recognition data |
US8843494B1 (en) * | 2012-03-28 | 2014-09-23 | Emc Corporation | Method and system for using keywords to merge document clusters |
US9396540B1 (en) | 2012-03-28 | 2016-07-19 | Emc Corporation | Method and system for identifying anchors for fields using optical character recognition data |
US8533148B1 (en) * | 2012-10-01 | 2013-09-10 | Recommind, Inc. | Document relevancy analysis within machine learning systems including determining closest cosine distances of training examples |
JP5526209B2 (ja) * | 2012-10-09 | 2014-06-18 | 株式会社Ubic | フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム |
CN104063387B (zh) * | 2013-03-19 | 2017-07-28 | 三星电子(中国)研发中心 | 在文本中抽取关键词的装置和方法 |
CN104239300B (zh) * | 2013-06-06 | 2017-10-20 | 富士通株式会社 | 从文本中挖掘语义关键词的方法和设备 |
CN104572719A (zh) * | 2013-10-21 | 2015-04-29 | 中兴通讯股份有限公司 | 信息收集方法及装置 |
CN104572736A (zh) * | 2013-10-23 | 2015-04-29 | 北大方正集团有限公司 | 基于社交网络的关键词提取方法及装置 |
US20170116180A1 (en) * | 2015-10-23 | 2017-04-27 | J. Edward Varallo | Document analysis system |
US10943312B2 (en) | 2015-10-28 | 2021-03-09 | MyFitnessPal, Inc. | Restaurant matching and filtering for use in a health tracking system |
US20170286639A1 (en) * | 2016-03-31 | 2017-10-05 | Under Armour, Inc. | Health tracking system with verification of nutrition information |
JP6662169B2 (ja) * | 2016-04-18 | 2020-03-11 | 富士通株式会社 | 符号化プログラム、符号化方法、符号化装置、検索プログラム、検索方法および検索装置 |
US9645999B1 (en) * | 2016-08-02 | 2017-05-09 | Quid, Inc. | Adjustment of document relationship graphs |
CN107704763A (zh) * | 2017-09-04 | 2018-02-16 | 中国移动通信集团广东有限公司 | 多源异构漏洞情报去重方法、分级方法及装置 |
US11163811B2 (en) | 2017-10-30 | 2021-11-02 | International Business Machines Corporation | Ranking of documents based on their semantic richness |
US10909148B2 (en) * | 2018-04-23 | 2021-02-02 | Laserlike, Inc. | Web crawling intake processing enhancements |
CN109255022B (zh) * | 2018-08-08 | 2021-11-23 | 宜人恒业科技发展(北京)有限公司 | 一种用于网络文章的摘要自动提取方法 |
US11176198B2 (en) * | 2019-09-25 | 2021-11-16 | Open Text Holdings, Inc. | System and method for pre-indexing filtering and correction of documents in search systems |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1185765A (ja) * | 1997-09-08 | 1999-03-30 | Toshiba Corp | タグ付文書検索システム |
JPH11213000A (ja) * | 1998-01-29 | 1999-08-06 | Nippon Telegr & Teleph Corp <Ntt> | インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体 |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
JP2005519396A (ja) * | 2002-03-07 | 2005-06-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 情報検索要求に応じて検索結果を提供する方法及び装置 |
JP2007164633A (ja) * | 2005-12-15 | 2007-06-28 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索方法及び装置及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US7284191B2 (en) * | 2001-08-13 | 2007-10-16 | Xerox Corporation | Meta-document management system with document identifiers |
JP2006031209A (ja) | 2004-07-14 | 2006-02-02 | Ricoh Co Ltd | 全文検索システム、全文検索方法、プログラムおよび記録媒体 |
JP4825544B2 (ja) * | 2005-04-01 | 2011-11-30 | 株式会社リコー | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 |
US8280719B2 (en) * | 2005-05-05 | 2012-10-02 | Ramp, Inc. | Methods and systems relating to information extraction |
JP2006331117A (ja) | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP4807984B2 (ja) * | 2005-08-23 | 2011-11-02 | 株式会社リコー | 文書管理システム、文書管理システムの設定方法、プログラム及びコンピュータに読み取り可能な記録媒体 |
US8046363B2 (en) * | 2006-04-13 | 2011-10-25 | Lg Electronics Inc. | System and method for clustering documents |
JP4709723B2 (ja) * | 2006-10-27 | 2011-06-22 | 株式会社東芝 | 姿勢推定装置及びその方法 |
-
2009
- 2009-03-26 JP JP2009077243A patent/JP5316158B2/ja active Active
- 2009-05-28 US US12/473,616 patent/US8180781B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1185765A (ja) * | 1997-09-08 | 1999-03-30 | Toshiba Corp | タグ付文書検索システム |
JPH11213000A (ja) * | 1998-01-29 | 1999-08-06 | Nippon Telegr & Teleph Corp <Ntt> | インタラクティブ情報検索方法及び装置及びインタラクティブ情報検索プログラムを格納した記憶媒体 |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
JP2005519396A (ja) * | 2002-03-07 | 2005-06-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 情報検索要求に応じて検索結果を提供する方法及び装置 |
JP2007164633A (ja) * | 2005-12-15 | 2007-06-28 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索方法及び装置及びプログラム |
Non-Patent Citations (4)
Title |
---|
CSND200200606005; 風間 一洋、外2名: 'サーチエンジンの検索結果のマルチレベル・グルーピングの評価' コンピュータソフトウェア 第17巻,第4号, 20000717, p.58-69, 日本ソフトウェア科学会 * |
CSNG200900266127; 村松 亮介、外2名: '分類階層を利用した検索エンジンの検索結果の構造化とその提示方法の改良' 電子情報通信学会 第19回データ工学ワークショップ論文集 , 20090625, p.1-6, 電子情報通信学会データ工学研究専門委員会 * |
JPN6013027467; 村松 亮介、外2名: '分類階層を利用した検索エンジンの検索結果の構造化とその提示方法の改良' 電子情報通信学会 第19回データ工学ワークショップ論文集 , 20090625, p.1-6, 電子情報通信学会データ工学研究専門委員会 * |
JPN6013027469; 風間 一洋、外2名: 'サーチエンジンの検索結果のマルチレベル・グルーピングの評価' コンピュータソフトウェア 第17巻,第4号, 20000717, p.58-69, 日本ソフトウェア科学会 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013109606A (ja) * | 2011-11-22 | 2013-06-06 | Ricoh Co Ltd | 情報処理装置およびプログラム |
JP2015507299A (ja) * | 2012-02-10 | 2015-03-05 | グーグル・インコーポレーテッド | 検索結果分類 |
JPWO2015040860A1 (ja) * | 2013-09-18 | 2017-03-02 | 日本電気株式会社 | 分類辞書生成装置、分類辞書生成方法及びプログラム |
JP2021077256A (ja) * | 2019-11-13 | 2021-05-20 | 株式会社Fronteo | 文書処理装置、文書レビューシステム、文書処理装置の制御方法、文書レビューサービスを提供する方法、および制御プログラム |
JP2023054506A (ja) * | 2021-10-04 | 2023-04-14 | 株式会社ラック | 情報検索システム、情報検索方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20090300007A1 (en) | 2009-12-03 |
JP5316158B2 (ja) | 2013-10-16 |
US8180781B2 (en) | 2012-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5316158B2 (ja) | 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体 | |
US7769771B2 (en) | Searching a document using relevance feedback | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
JP6299596B2 (ja) | クエリ類似度評価システム、評価方法、及びプログラム | |
US20040230570A1 (en) | Search processing method and apparatus | |
US8316032B1 (en) | Book content item search | |
JP5159772B2 (ja) | 文書検索装置及び文書検索方法 | |
JP2009238115A (ja) | 情報推薦装置および情報推薦方法 | |
JP2009003888A (ja) | キーワード提示のための装置、方法、及びプログラム | |
US20070179984A1 (en) | Information element processing method and apparatus | |
CN114116997A (zh) | 知识问答方法、装置、电子设备及存储介质 | |
JPH11102377A (ja) | データベースからドキュメントを検索する方法および装置 | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
JP2013222418A (ja) | パッセージ分割方法、装置、及びプログラム | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
JP6733481B2 (ja) | 検索手段選択プログラム、検索手段選択方法及び検索手段選択装置 | |
WO2018084226A1 (ja) | 文書検索方法及び装置 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2003271648A (ja) | 検索装置、検索方法、ならびに、プログラム | |
JP2007188134A (ja) | 索引ファイルを用いた文書検索の方法 | |
JP2017208047A (ja) | 情報検索方法、情報検索装置、及びプログラム | |
JP5199968B2 (ja) | キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム | |
JP5541014B2 (ja) | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130624 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5316158 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |