JP4574186B2 - 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 - Google Patents
重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 Download PDFInfo
- Publication number
- JP4574186B2 JP4574186B2 JP2004040181A JP2004040181A JP4574186B2 JP 4574186 B2 JP4574186 B2 JP 4574186B2 JP 2004040181 A JP2004040181 A JP 2004040181A JP 2004040181 A JP2004040181 A JP 2004040181A JP 4574186 B2 JP4574186 B2 JP 4574186B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- words
- language identification
- search word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
まず、本発明の実施の形態にかかる重要言語識別装置のハードウェア構成について説明する。図1は、この重要言語識別装置のハードウェア構成を示す図である。この重要言語識別装置100は、CPU101、ROM102、RAM103、ハードディスク104、入力手段105、表示手段106、記憶媒体読取手段107、および通信インターフェース(I/F)108が、バス109によって接続され構成されている。
次に、この重要言語識別装置を含むネットワーク構成を説明する。図2は、この重要言語識別装置を含むネットワーク構成を示す概略図である。図1に示したように、重要言語識別装置100は、ネットワーク200に接続可能な通信インターフェース108を備えている。そこで、図2に示すように、複数の重要言語識別装置100をネットワーク200に接続することで、ネットワーク200に接続されているサーバ201を仲介した各重要言語識別装置100間でのデータの送受信が可能になる。
続いて、この重要言語識別装置の機能的構成について説明する。図3は、この重要言語識別装置の機能的構成を示すブロック図である。重要言語識別装置100は、検索条件受付部301、検索語選出部302、および単語重要度算定部303を含み構成される。検索条件受付部301は、ユーザが入力手段105から入力した検索条件を受け付ける。検索語選出部302は、検索条件受付部301が受け付けた検索条件を形態素解析によって単語に分割する。そして、分割された単語群から助詞等検索に不適な単語を不要語として取り除き、残った単語を検索語候補として抽出する。単語重要度算定部303は、検索語選出部302で抽出された検索語候補の重要度(どの程度ユーザの検索意図が反映されているか)を算定する。そして、検索語選出部302は、単語重要度算定部303が算定した各検索語候補の重要度に基づいて、適切な検索語を選出する。
次に、本発明の重要言語識別装置を用いた重要言語識別処理の手順について説明する。図4は、この重要言語識別処理の手順を示すフローチャートである。
次に、本発明の重要言語識別装置を備えた文書検索装置について説明する。図5は、この文書検索装置の機能的構成の一例を示すブロック図である。この文書検出装置は、重要言語識別装置100、文書検索部501、および文書データベース502を含み構成される。そして、文書データベース502に格納されている文書データに対して、前述したような処理を経て重要言語識別装置100で選出された検索語をもとに公知の方法により文書検索を行う。このように、重要言語識別装置100で選出された検索語に基づいた文書検索を行うことで、よりユーザの検索意図に合致した文書検索が可能になる。
続いて、本発明の重要言語識別装置を備えたキーワード抽出装置について説明する。図7は、このキーワード抽出装置の機能的構成の一例を示すブロック図である。このキーワード抽出装置は、重要言語識別装置100、入力文書受付部701、およびキーワード抽出部702を含み構成される。このキーワード抽出装置は、文書を検索するのではなく、入力された文章からキーワードを抽出するところが、図5および図6に示した文書検索装置とは異なる。このキーワード抽出装置では、まず、入力文書受付部701において、入力文章から形態素解析によりキーワード候補となる単語を抽出する。そして、キーワード抽出部702において、重要言語識別装置100によって算定された単語の重要度を参照して、前記キーワード候補として抽出された各単語の重要度を算定し、重要度の高い単語をキーワードとして抽出する。このようにすることで、よりユーザの意図に合致したキーワード抽出が可能になる。
101 CPU
102 ROM
103 RAM
104 ハードディスク
105 入力手段
106 表示手段
107 記憶媒体読取手段
108 通信インターフェース(I/F)
109 バス
110 CD/DVDディスク
200 ネットワーク
201 サーバ
301 検索条件受付部
302 検索語選出部
303 単語重要度算定部
501 文書検索部
502 文書データベース
601 関連語選出部
701 入力文書受付部
702 キーワード抽出部
Claims (3)
- 検索語候補の単語から重要言語を識別する重要言語識別装置であって、
ユーザが入力した単語を含む検索条件を受け付ける検索条件受付手段と、
前記検索条件受付手段で受け付けられた検索条件から検索語候補の単語を抽出する検索語候補抽出手段と、
前記検索語候補抽出手段で抽出された前記検索語候補の単語が出現する出現頻度の累積値を記憶する記憶手段と、
前記検索語候補抽出手段で抽出された前記検索語候補の単語の重要度を算定する単語重要度算定手段と、
を有し、
前記抽出された前記検索語候補の単語の数が所定数以下の場合は、
前記単語重要度算定手段が、前記検索語候補の単語を重要語とし、
前記記憶手段が、前記検索語候補の単語に対応して前記検索語候補の単語の前記検索条件で出現した出現頻度を前記記憶手段に記憶されている前記累積値に加算した値を新たな累積値として記憶し、
前記抽出された前記検索語候補の単語の数が所定数を超える場合は、
前記単語重要度算定手段が、
前記抽出された検索語候補の単語の前記出現頻度と、前記記憶手段に記憶されている前記検索語候補の単語に対応する前記累積値とを用いて所定の演算を行い、前記検索語候補の単語の重要度を算定することを特徴とする重要言語識別装置。
- 検索語候補の単語から重要言語を識別する重要言語識別方法であって、
重要言語識別装置が、前記検索語候補の単語が出現する出現頻度の累積値を記憶する記憶手段を備え、
前記重要言語識別方法は、
前記重要言語識別装置が、
ユーザが入力した単語を含む検索条件を受け付ける検索条件受付工程と、
前記検索条件受付工程で受け付けられた検索条件から検索語候補の単語を抽出する検索語候補抽出工程と、
前記検索語候補抽出工程で抽出された前記検索語候補の単語が出現する出現頻度の累積値を記憶する記憶工程と、
前記検索語候補抽出工程で抽出された前記検索語候補の単語の重要度を算定する単語重要度算定工程と、
を含み、
前記抽出された前記検索語候補の単語の数が所定数以下の場合は、
前記単語重要度算定工程で、前記検索語候補の単語を重要語とし、
前記記憶工程で、前記検索語候補の単語に対応して前記検索語候補の単語の前記検索条件で出現した出現頻度を前記記憶手段に記憶されている前記累積値に加算した値を新たな累積値として記憶し、
前記抽出された前記検索語候補の単語の数が所定数を超える場合は、
前記単語重要度算定工程で、
前記抽出された検索語候補の単語の前記出現頻度と、前記記憶手段に記憶されている前記検索語候補の単語に対応する前記累積値とを用いて所定の演算を行い、前記検索語候補の単語の重要度を算定することを特徴とする重要言語識別方法。
- 請求項2に記載の重要言語識別方法をコンピュータに実行させることを特徴とする重要言語識別プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004040181A JP4574186B2 (ja) | 2004-02-17 | 2004-02-17 | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004040181A JP4574186B2 (ja) | 2004-02-17 | 2004-02-17 | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234688A JP2005234688A (ja) | 2005-09-02 |
JP4574186B2 true JP4574186B2 (ja) | 2010-11-04 |
Family
ID=35017608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004040181A Expired - Fee Related JP4574186B2 (ja) | 2004-02-17 | 2004-02-17 | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4574186B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080096005A (ko) * | 2007-04-26 | 2008-10-30 | 엔에이치엔(주) | 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템 |
JP5403696B2 (ja) * | 2010-10-12 | 2014-01-29 | 株式会社Nec情報システムズ | 言語モデル生成装置、その方法及びそのプログラム |
KR101850886B1 (ko) | 2010-12-23 | 2018-04-23 | 네이버 주식회사 | 감소 질의를 추천하는 검색 시스템 및 방법 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208588A (ja) * | 1992-08-14 | 1994-07-26 | Ricoh Co Ltd | 文書検索方式 |
JPH08314964A (ja) * | 1995-05-19 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 索引型式作成装置 |
JPH1173419A (ja) * | 1997-08-28 | 1999-03-16 | N T T Data:Kk | 電子文書の検索方法及び装置 |
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2002099573A (ja) * | 2000-09-25 | 2002-04-05 | Toshiba Corp | 類似文書検索装置、類似文書検索方法及び記録媒体 |
JP2002140357A (ja) * | 2000-11-06 | 2002-05-17 | Ricoh Co Ltd | 文書検索装置及び文書検索方法 |
JP2002189734A (ja) * | 2000-12-21 | 2002-07-05 | Ricoh Co Ltd | 検索語抽出装置および検索語抽出方法 |
JP2002245062A (ja) * | 2001-02-14 | 2002-08-30 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
JP2003162531A (ja) * | 2001-11-27 | 2003-06-06 | Matsushita Electric Works Ltd | 文書検索システムおよび文書検索方法 |
JP2003208433A (ja) * | 2002-01-10 | 2003-07-25 | Mitsubishi Electric Corp | 電子ファイリングシステム及びその検索インデックス作成方法 |
-
2004
- 2004-02-17 JP JP2004040181A patent/JP4574186B2/ja not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208588A (ja) * | 1992-08-14 | 1994-07-26 | Ricoh Co Ltd | 文書検索方式 |
JPH08314964A (ja) * | 1995-05-19 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 索引型式作成装置 |
JPH1173419A (ja) * | 1997-08-28 | 1999-03-16 | N T T Data:Kk | 電子文書の検索方法及び装置 |
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2002099573A (ja) * | 2000-09-25 | 2002-04-05 | Toshiba Corp | 類似文書検索装置、類似文書検索方法及び記録媒体 |
JP2002140357A (ja) * | 2000-11-06 | 2002-05-17 | Ricoh Co Ltd | 文書検索装置及び文書検索方法 |
JP2002189734A (ja) * | 2000-12-21 | 2002-07-05 | Ricoh Co Ltd | 検索語抽出装置および検索語抽出方法 |
JP2002245062A (ja) * | 2001-02-14 | 2002-08-30 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
JP2003162531A (ja) * | 2001-11-27 | 2003-06-06 | Matsushita Electric Works Ltd | 文書検索システムおよび文書検索方法 |
JP2003208433A (ja) * | 2002-01-10 | 2003-07-25 | Mitsubishi Electric Corp | 電子ファイリングシステム及びその検索インデックス作成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005234688A (ja) | 2005-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3820242B2 (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
US20080021891A1 (en) | Searching a document using relevance feedback | |
KR20110102358A (ko) | 오역의 검출을 지원하는 장치 및 방법 | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
JP4935243B2 (ja) | 検索プログラム、情報検索装置及び情報検索方法 | |
JP4969209B2 (ja) | 検索システム | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2006178599A (ja) | 文書検索装置および方法 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
JP7256357B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP4574186B2 (ja) | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 | |
JP2009080806A (ja) | Webページにリンクを挿入する方法 | |
JP4796527B2 (ja) | ドキュメント絞り込み検索装置、方法及びプログラム | |
JP5189413B2 (ja) | 音声データ検索システム | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP5285491B2 (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
JP2004348239A (ja) | テキスト分類プログラム | |
JP4985096B2 (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP2007148630A (ja) | 特許分析装置、特許分析システム、特許分析方法およびプログラム | |
CN109710844A (zh) | 基于搜索引擎的快速准确定位文件的方法和设备 | |
JP4135467B2 (ja) | 情報処理装置、システムおよびプログラム | |
JP2002099573A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070105 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100316 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100810 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130827 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |