JP6152711B2 - 情報検索装置および情報検索方法 - Google Patents
情報検索装置および情報検索方法 Download PDFInfo
- Publication number
- JP6152711B2 JP6152711B2 JP2013118248A JP2013118248A JP6152711B2 JP 6152711 B2 JP6152711 B2 JP 6152711B2 JP 2013118248 A JP2013118248 A JP 2013118248A JP 2013118248 A JP2013118248 A JP 2013118248A JP 6152711 B2 JP6152711 B2 JP 6152711B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- sentence
- unit
- semantic
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
Description
以下、図面を参照しながら、第1の実施の形態による情報検索装置1について説明する。図1は、情報検索装置1の構成の一例を示すブロック図である。情報検索装置1は、クエリとして、少なくとも一つの単語、または文を入力することにより検索を行うシステムである。情報検索装置1は、対象文書Data Base(DB)11、検索用インデックス13、評価値テーブル15、評価値計算部39、ランキング部41を有している。また、情報検索装置1は、クエリ入力部23、キーワード入力部25、キーワード変換部27、検索キー生成部29、文章入力部31、意味解析部33、意味最小単位生成部35、検索部37、出力部43、辞書51、記憶部53を有している。検索部37は、キーワード検索部45、および自然文検索部47を備えている。
idf=log(総文書数/当該意味最小単位を含む文書数)・・・(式1)
(a)アークが2つのノードをつないでいる場合には、意味最小単位として、それぞれのアークに対して、(始点ノード、終点ノード、アークの名前)を出力する。
(b)始点ノードがない場合には、意味最小単位として、(「NIL」、終点ノード、アークの名前)を出力する。
(c)終点ノードがない場合には、意味最小単位として、(始点ノード、「NIL」、アークの名前)を出力する。
文nの評価値Sn=(クエリの意味最小単位の集合(K1、K2、・・・Ki、・・・)のうち、(文nに出現するKiのidf値×文nにおけるKiの出現回数)の総和)
×M2
ただし、Mは、文nにおいて検索キーとして特定された意味最小単位の種類数
・・・(式2)
文書の評価値(D)=文nの評価値(Sn)の総計・・・(式3)
このように、評価値計算部39は、文書に含まれる文の評価値を合算する。
評価値(Sm)=(2×1+2×1+2×1+2×1+2×1+2×1)×62
=432.0・・・(式4)
上記評価値は、クエリ21に応じた意味最小単位が多く含まれる文ほど、高評価となる。
以下、図21から図26を参照しながら、変形例1について説明する。本変形例1は、検索結果の表示における変形例である。図21から図26は、検索結果の表示例を示す図である。本変形例1では、「低気圧を観測することにより、日本の気象を予測する」という文書を探したいとする。ユーザは、例えば「低気圧 観測 日本 気象 予測」というキーワードを入力する。
以下、図27から図35を参照しながら、他言語に本発明を適用した例について説明する。本変形例2では、英語を例にして説明する。変形例2による情報検索装置1の構成および動作については、上記一実施の形態および変形例1と同様であるので、重複説明を省略する。
もよい。
(付記1)
複数の検索用単語を含む情報の入力を受け付ける入力部と、
前記複数の検索用単語を含む情報から2つの検索用単語を分離し、検索対象文に含まれる複数の単語および前記複数の単語と他の単語間の前記検索対象文における関係を示す意味情報を前記検索対象文と関連付けて記憶した記憶部から、前記2つの検索用単語と対応する2つの単語とその意味情報を検索して抽出する演算処理部と、
抽出された前記意味情報を出力する出力部と、
を有することを特徴とする情報検索装置。
(付記2)
前記意味情報は、前記2つの単語のそれぞれに対応する意味記号を含み、
前記演算処理部は、
分離した前記検索用単語を意味記号に変換し、変換された前記意味記号のうちの2つを検索キーとし、前記検索キーを含む前記意味情報を前記記憶部において検索することを特徴とする付記1に記載の情報検索装置。
(付記3)
前記出力部は、前記意味情報を表層文字列に変換して出力することを特徴とする付記1または付記2のいずれかに記載の情報検索装置。
(付記4)
前記演算処理部は、
前記記憶部に前記意味情報と関連付けて記憶された前記検索対象文において、前記意味情報に含まれる前記2つの単語の少なくともいずれかが出現する出現位置を参照し、前記出現位置に基づき前記文の少なくとも一部を抽出し、
前記出力部は、
抽出された前記検索対象文の少なくとも一部を出力する
ことを特徴とする付記1から付記3に記載の情報検索装置。
(付記5)
前記入力部は、抽出された前記意味情報を絞り込むための指示を受け付け、
前記出力部は、前記入力部により受け付けられた指示に応じて絞り込まれた前記意味情報のみを出力することを特徴とする付記4に記載の情報検索装置。
(付記6)
前記入力部は、2つの検索用単語を含む情報、または少なくとも一つの文の入力を受付け、
前記演算処理部は、前記入力部が受け付けた入力が前記文の場合には、前記文を意味解析することにより意味情報を生成し、前記記憶部から前記意味情報と関連付けて記憶された文を検索する
ことを特徴とする付記1から付記5に記載の情報検索装置。
(付記7)
検索対象文に含まれる複数の単語および前記複数の単語と他の単語間の前記検索対象文における関係を示す意味情報を前記検索対象文と関連付けて記憶した前記記憶部、
をさらに有し、
前記演算処理部は、入力された文を意味解析することにより、前記記憶部に、前記意味情報と前記文とを関連付けて記憶することを特徴とする付記1から付記6に記載の情報検索装置。
(付記8)
情報検索装置が、
複数の検索用単語を含む情報の入力を受け付け、
前記複数の検索用単語を含む情報から前記2つの検索用単語を分離し、
検索対象文に含まれる複数の単語および前記複数の単語と他の単語間の前記検索対象文における関係を示す意味情報を前記検索対象文と関連付けて記憶した記憶部から、前記2つの検索用単語と対応する2つの単語とその意味情報を検索して抽出し、
抽出された前記意味情報を出力する、
を有することを特徴とする情報検索方法。
(付記9)
さらに、
前記意味情報は、前記2つの単語のそれぞれに対応する意味記号を含み、
分離した前記検索用単語を意味記号に変換し、
変換された前記意味記号のうちの2つを検索キーとし、
前記検索キーを含む前記意味情報を前記記憶部において検索する
ことを特徴とする付記8に記載の情報検索方法。
(付記10)
さらに、
前記意味情報を表層文字列に変換して出力する、
ことを特徴とする付記8または付記9に記載の情報検索方法。
(付記11)
さらに、
前記記憶部に、前記意味情報と関連付けて記憶された前記検索対象文において、前記意味情報に含まれる前記2つの単語の少なくともいずれかが出現する出現位置を参照し、前記出現位置に基づき前記文の少なくとも一部を抽出し、抽出された前記検索対象文の少なくとも一部を出力する
ことを特徴とする付記8または付記9に記載の情報検索方法。
(付記12)
さらに、
抽出された前記意味情報を絞り込むための指示を受け付け、
受け付けた前記指示に応じて絞り込まれた前記意味情報のみを出力する
ことを特徴とする付記11に記載の情報検索方法。
(付記13)
さらに、
2つの検索用単語を含む情報、または少なくとも一つの文の入力を受付け、
受け付けた入力が前記文の場合には、前記文を意味解析することにより意味情報を生成し、
前記記憶部から前記意味情報と関連付けて記憶された文を検索する
ことを特徴とする付記8から付記12に記載の情報検索方法。
(付記14)
さらに、
入力された文を意味解析し、前記意味解析により得られる前記文に含まれる複数の単語および前記複数の単語と他の単語間の前記文における関係を示す意味情報を前記文と関連付けて前記記憶部に記憶する
ことを特徴とする付記8から付記13に記載の情報検索方法。
11 検索対象文書DB
13 検索用インデックス
15 評価値テーブル
21 クエリ
23 クエリ入力部
25 キーワード入力部
27 キーワード変換部
29 検索キー生成部
31 文章入力部
33 意味解析部
35 意味最小単位生成部
37 検索部
39 評価値計算部
41 ランキング部
43 出力部
45 キーワード検索部
47 自然文検索部
51 辞書
53 記憶部
71 原文
73 有向グラフ
75 意味最小単位
76 解析例
77 解析例
78 文字オフセット例
79 意味記号
81 インデックステーブル
83 意味最小単位
85 文書ID
87 文ID
89 始点ノード位置
91 始点ノード文字列長
93 終点ノード位置
95 終点ノード文字列長
Claims (7)
- 複数の検索用単語を含む情報の入力を受け付ける入力部と、
前記複数の検索用単語を含む情報から2つの検索用単語を分離し、検索対象文に含まれる複数の単語および前記複数の単語と他の単語間の前記検索対象文における関係を示す意味情報を前記検索対象文と関連付けて記憶した記憶部から、前記2つの検索用単語と対応する2つの単語とその意味情報を検索して抽出する演算処理部と、
抽出された前記意味情報を出力する出力部と、
を有し、
前記入力部は、少なくとも一つの文の入力の受け付けも行い、
前記入力部が受け付けた入力が前記文の場合には、前記演算処理部は、前記文を意味解析することにより意味情報を生成し、前記記憶部から前記意味情報と関連付けて記憶された文を検索する
ことを特徴とする情報検索装置。 - 前記意味情報は、前記2つの単語のそれぞれに対応する意味記号を含み、
前記演算処理部は、
分離した前記検索用単語を意味記号に変換し、変換された前記意味記号のうちの2つを検索キーとし、前記検索キーを含む前記意味情報を前記記憶部において検索することを特徴とする請求項1に記載の情報検索装置。 - 前記出力部は、前記意味情報を表層文字列に変換して出力することを特徴とする請求項1または請求項2のいずれかに記載の情報検索装置。
- 前記演算処理部は、
前記記憶部に前記意味情報と関連付けて記憶された前記検索対象文において、前記意味情報に含まれる前記2つの単語の少なくともいずれかが出現する出現位置を参照し、前記出現位置に基づき前記文の少なくとも一部を抽出し、
前記出力部は、
抽出された前記検索対象文の少なくとも一部を出力する
ことを特徴とする請求項1から請求項3のいずれかに記載の情報検索装置。 - 前記入力部は、抽出された前記意味情報を絞り込むための指示を受け付け、
前記出力部は、前記入力部により受け付けられた指示に応じて絞り込まれた前記意味情報のみを出力することを特徴とする請求項4に記載の情報検索装置。 - 前記演算処理部は、入力された文を意味解析することにより、前記記憶部に、前記意味情報と前記文とを関連付けて記憶させることを特徴とする請求項1から請求項5のいずれかに記載の情報検索装置。
- 情報検索装置が、
複数の検索用単語を含む情報の入力を受け付け、
前記複数の検索用単語を含む情報から前記2つの検索用単語を分離し、
検索対象文に含まれる複数の単語および前記複数の単語と他の単語間の前記検索対象文における関係を示す意味情報を前記検索対象文と関連付けて記憶した記憶部から、前記2つの検索用単語と対応する2つの単語とその意味情報を検索して抽出し、
抽出された前記意味情報を出力し、
前記複数の検索用単語を含む情報の入力の受け付けでは、少なくとも一つの文の入力の受け付けも行い、
前記受け付けた入力が前記文の場合には、前記文を意味解析することにより意味情報を生成し、前記記憶部から前記意味情報と関連付けて記憶された文を検索する
ことを特徴とする情報検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013118248A JP6152711B2 (ja) | 2013-06-04 | 2013-06-04 | 情報検索装置および情報検索方法 |
US14/286,434 US20140358522A1 (en) | 2013-06-04 | 2014-05-23 | Information search apparatus and information search method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013118248A JP6152711B2 (ja) | 2013-06-04 | 2013-06-04 | 情報検索装置および情報検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014235664A JP2014235664A (ja) | 2014-12-15 |
JP6152711B2 true JP6152711B2 (ja) | 2017-06-28 |
Family
ID=51986105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013118248A Active JP6152711B2 (ja) | 2013-06-04 | 2013-06-04 | 情報検索装置および情報検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140358522A1 (ja) |
JP (1) | JP6152711B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6447161B2 (ja) * | 2015-01-20 | 2019-01-09 | 富士通株式会社 | 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法 |
JP6638480B2 (ja) * | 2016-03-09 | 2020-01-29 | 富士通株式会社 | 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法 |
JP7176233B2 (ja) * | 2018-06-04 | 2022-11-22 | 富士通株式会社 | 検索方法、検索プログラムおよび検索装置 |
JP7326920B2 (ja) * | 2019-06-25 | 2023-08-16 | 富士フイルムビジネスイノベーション株式会社 | 検索装置、検索システム、及び検索プログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0610760B1 (en) * | 1993-01-28 | 2003-05-02 | Kabushiki Kaisha Toshiba | Document detection system with improved document detection efficiency |
US6026388A (en) * | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5966686A (en) * | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees |
JP3579204B2 (ja) * | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
JP3531468B2 (ja) * | 1998-03-30 | 2004-05-31 | 株式会社日立製作所 | 文書処理装置及び方法 |
US6108619A (en) * | 1998-07-02 | 2000-08-22 | Novell, Inc. | Method and apparatus for semantic characterization of general content streams and repositories |
JP4115048B2 (ja) * | 1999-08-17 | 2008-07-09 | 株式会社リコー | 文書検索システム |
JP2003091541A (ja) * | 2001-07-13 | 2003-03-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報蓄積装置、そのプログラム及びそのプログラムを記録した媒体、並びに情報検索装置、そのプログラム及びそのプログラムを記録した媒体 |
JP4200834B2 (ja) * | 2003-07-02 | 2008-12-24 | 沖電気工業株式会社 | 情報検索システム、情報検索方法及び情報検索プログラム |
US8612208B2 (en) * | 2004-04-07 | 2013-12-17 | Oracle Otc Subsidiary Llc | Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query |
US20060167930A1 (en) * | 2004-10-08 | 2006-07-27 | George Witwer | Self-organized concept search and data storage method |
JP4650072B2 (ja) * | 2005-04-12 | 2011-03-16 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
US20070106499A1 (en) * | 2005-08-09 | 2007-05-10 | Kathleen Dahlgren | Natural language search system |
US20070073533A1 (en) * | 2005-09-23 | 2007-03-29 | Fuji Xerox Co., Ltd. | Systems and methods for structural indexing of natural language text |
US20070260450A1 (en) * | 2006-05-05 | 2007-11-08 | Yudong Sun | Indexing parsed natural language texts for advanced search |
US8959012B2 (en) * | 2007-04-04 | 2015-02-17 | Orville E. Easterly | System and method for the automatic generation of patient-specific and grammatically correct electronic medical records |
US8909654B2 (en) * | 2007-11-19 | 2014-12-09 | Nippon Telegraph And Telephone Corporation | Information search method, apparatus, program and computer readable recording medium |
JP2009199280A (ja) * | 2008-02-21 | 2009-09-03 | Hitachi Ltd | 部分構文木プロファイルを用いた類似性検索システム |
JP5493779B2 (ja) * | 2009-11-30 | 2014-05-14 | 富士ゼロックス株式会社 | 情報検索プログラム及び情報検索装置 |
-
2013
- 2013-06-04 JP JP2013118248A patent/JP6152711B2/ja active Active
-
2014
- 2014-05-23 US US14/286,434 patent/US20140358522A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2014235664A (ja) | 2014-12-15 |
US20140358522A1 (en) | 2014-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8533203B2 (en) | Identifying synonyms of entities using a document collection | |
JP5138046B2 (ja) | 検索システム、検索方法およびプログラム | |
JP5010885B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
WO2007049792A1 (en) | Apparatus, method, and storage medium storing program for determining naturalness of array of words | |
JP6152711B2 (ja) | 情報検索装置および情報検索方法 | |
JP2010128677A (ja) | テキスト要約装置、その方法およびプログラム | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
JP2016018286A (ja) | 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム | |
CN111373386A (zh) | 相似度指标值计算装置、相似检索装置及相似度指标值计算用程序 | |
JP2002132811A (ja) | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 | |
JPWO2010109594A1 (ja) | 文書検索装置、文書検索システム、文書検索プログラム、および文書検索方法 | |
JP5915274B2 (ja) | 情報検索方法、プログラムおよび情報検索装置 | |
JP4945015B2 (ja) | 文書検索システム、文書検索プログラム、および文書検索方法 | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2005010848A (ja) | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 | |
JP2004046438A (ja) | テキスト検索方法及び装置及びテキスト検索プログラム及びテキスト検索プログラムを格納した記憶媒体 | |
JPWO2014002212A1 (ja) | 文書関連付け方法および文書検索方法、文書関連付け装置および文書検索装置、並びにそのためのプログラム | |
JPH1185794A (ja) | 検索語入力装置および検索語入力プログラムを記録した記録媒体 | |
JP2519129B2 (ja) | マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置 | |
JP2732661B2 (ja) | テキスト型データベース装置 | |
JP4573358B2 (ja) | 評判情報検索装置、その方法およびプログラム | |
Malallah et al. | Multi-document text summarization using fuzzy logic and association rule mining | |
JP2007026116A (ja) | 概念検索システム及び概念検索方法 | |
JP2004133510A (ja) | 技術文献検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161227 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170502 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6152711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |