JP7016237B2 - 情報検索装置、検索処理方法、およびプログラム - Google Patents
情報検索装置、検索処理方法、およびプログラム Download PDFInfo
- Publication number
- JP7016237B2 JP7016237B2 JP2017201556A JP2017201556A JP7016237B2 JP 7016237 B2 JP7016237 B2 JP 7016237B2 JP 2017201556 A JP2017201556 A JP 2017201556A JP 2017201556 A JP2017201556 A JP 2017201556A JP 7016237 B2 JP7016237 B2 JP 7016237B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- similar
- words
- phrases
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
を含む。
以下、第1の実施形態に係る情報検索装置について、図1~図5を参照しながら説明する。
図1は、第1の実施形態に係る情報検索装置1の機能構成を示す図である。情報検索装置1は、テキスト検索機能を提供する装置であり、予め「意味関係」または「オントロジー」と呼ばれる語句同士の類似性を示す情報を構築する。情報検索装置1は、所定の検索語についての検索処理を行う際に、検索語による検索処理に加えて、またはそれと独立して、構築した「意味関係」に基づく類似語句によって検索処理を行う。従って、文書中に検索語そのものが欠落していても、検索語に近しい意味を有する語句を検索結果として返却することを可能とする。情報検索装置1は、例えばデータサーバ等のコンピューティングデバイスであることが想定されるが、ラップトップコンピュータ、ノートブックコンピュータ、タブレット、スマートフォン等として実装されてもよく、実施の態様は限定されない。
図3は、第1の実施形態における検索処理フローを示す図である。また、図4は、例示的な語句同士について、コサイン類似度が如何に算出されるかを示す図である。また、図5は、第1の実施形態に係る意味関係記憶部201が記憶する語句同士の意味関係のデータ構造を示す図である。
以上、第1の実施形態に係る情報検索装置1によれば、ユーザが入力する語句そのものを用いたキーワード検索のみならず、ユーザが意図する分野において近しい意味を有する語句によっても検索することが可能であり、このような構成により、より柔軟な検索処理を提供することができる。
20 記憶部
101 意味関係構築処理部
102 検索対象文書群登録処理部
103 文書検索処理部
104 類似語句抽出部
201 意味関係記憶部
202 文書記憶部
Claims (9)
- 1つまたは複数の文書を受け付けて、当該1つまたは複数の文書に含まれる語句同士の意味的な類似度を示す意味関係を構築する意味関係構築処理部と、
検索語の入力を受け付けて、検索対象とする文書群について前記検索語を用いて検索処理を行う文書検索処理部と、
前記意味関係から、前記検索語と所定の閾値よりも高い類似度を有する語句を類似語句として抽出する類似語句抽出部と、
を備え、
前記文書検索処理部は、さらに、前記類似語句を用いて前記文書群について検索処理を行い、
前記類似語句抽出部は、前記類似語句を用いた検索処理により検索結果が得られない場合に、前記閾値を下げて類似語句を抽出し、
前記文書検索処理部は、前記抽出された類似語句の中で類似度が高い類似語句から順に、前記検索処理を設定された回数行う、
情報検索装置。 - 前記検索対象とする文書群を取得し、検索処理のために記憶装置に記憶する検索対象文書群登録処理部をさらに備える、請求項1に記載の情報検索装置。
- 前記意味関係構築処理部が、前記1つまたは複数の文書に含まれる語句を、数値ベクトルとして定量化し、前記数値ベクトル同士のコサイン類似度に基づき、前記1つまたは複数の文書に含まれる語句同士の類似度を算出する、請求項1に記載の情報検索装置。
- 前記文書検索処理部は、前記検索語を用いた検索処理により検索結果が得られない場合に、前記類似語句を用いて前記文書群について検索処理を行う、請求項1に記載の情報検索装置。
- 前記類似語句抽出部が、さらに、前記意味関係から、前記抽出された類似語句と所定の値よりも高い類似度を有する語句を第2の類似語句として抽出し、
前記文書検索処理部が、さらに、前記第2の類似語句を用いて前記文書群について検索処理を行う、請求項1に記載の情報検索装置。 - 前記文書検索処理部は、
前記検索語を用いた検索処理により検索結果が得られない場合に、前記類似語句を用いて前記文書群について検索処理を行い、
前記類似語句を用いた検索処理により検索結果が得られない場合に、第2の類似語句を用いて前記文書群について検索処理を行う、請求項5に記載の情報検索装置。 - 前記文書検索処理部は、
前記抽出された類似語句の中で類似度が高い類似語句から順に検索処理を行い、所定の検索結果が得られるまで、前記設定された回数を上限として前記検索処理を継続する、請求項1に記載の情報検索装置。 - 情報検索装置によって実行される検索処理方法であって、
1つまたは複数の文書を受け付けて、当該1つまたは複数の文書に含まれる語句同士の意味的な類似度を示す意味関係を構築するステップと、
検索語の入力を受け付けて、検索対象とする文書群について前記検索語を用いて検索処理を行うステップと、
前記意味関係から、前記検索語と所定の閾値よりも高い類似度を有する語句を類似語句として抽出するステップと、
前記類似語句を用いて前記文書群について検索処理を行うステップと、
前記類似語句を用いた検索処理により検索結果が得られない場合に、前記閾値を下げて類似語句を抽出するステップと
を含み、
前記検索処理を行うステップは、前記抽出された類似語句の中で類似度が高い類似語句から順に、前記検索処理を設定された回数行う、
検索処理方法。 - コンピュータに、請求項8に記載の方法を実行させるための命令を含むプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017201556A JP7016237B2 (ja) | 2017-10-18 | 2017-10-18 | 情報検索装置、検索処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017201556A JP7016237B2 (ja) | 2017-10-18 | 2017-10-18 | 情報検索装置、検索処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019074982A JP2019074982A (ja) | 2019-05-16 |
JP7016237B2 true JP7016237B2 (ja) | 2022-02-04 |
Family
ID=66544150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017201556A Active JP7016237B2 (ja) | 2017-10-18 | 2017-10-18 | 情報検索装置、検索処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7016237B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110807239B (zh) * | 2019-09-16 | 2021-11-16 | 北京理工大学 | 一种基于装配语义的快速装配仿真方法、装置及系统 |
CN117076652B (zh) * | 2023-10-17 | 2023-12-29 | 天启黑马信息科技(北京)有限公司 | 一种用于中短句的语义文本检索方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043236A (ja) | 1999-07-30 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 類似語抽出方法、文書検索方法及びこれらに用いる装置 |
JP2002108912A (ja) | 2000-09-30 | 2002-04-12 | Keyence Corp | 検索システムおよび検索方法 |
JP2004192374A (ja) | 2002-12-12 | 2004-07-08 | Ricoh Co Ltd | 文書検索装置、プログラムおよび記録媒体 |
JP2005173847A (ja) | 2003-12-10 | 2005-06-30 | Fujitsu Ltd | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
JP2017152042A (ja) | 2017-05-10 | 2017-08-31 | アイマトリックス株式会社 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04152468A (ja) * | 1990-10-17 | 1992-05-26 | Hitachi Ltd | 文書検索装置 |
JP3172706B2 (ja) * | 1998-04-17 | 2001-06-04 | 松下電器産業株式会社 | 反射型液晶表示素子 |
-
2017
- 2017-10-18 JP JP2017201556A patent/JP7016237B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043236A (ja) | 1999-07-30 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 類似語抽出方法、文書検索方法及びこれらに用いる装置 |
JP2002108912A (ja) | 2000-09-30 | 2002-04-12 | Keyence Corp | 検索システムおよび検索方法 |
JP2004192374A (ja) | 2002-12-12 | 2004-07-08 | Ricoh Co Ltd | 文書検索装置、プログラムおよび記録媒体 |
JP2005173847A (ja) | 2003-12-10 | 2005-06-30 | Fujitsu Ltd | 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体 |
JP2017152042A (ja) | 2017-05-10 | 2017-08-31 | アイマトリックス株式会社 | グラフ理論を用いた解析方法、解析プログラムおよび解析システム |
Also Published As
Publication number | Publication date |
---|---|
JP2019074982A (ja) | 2019-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108319627B (zh) | 关键词提取方法以及关键词提取装置 | |
CN108334490B (zh) | 关键词提取方法以及关键词提取装置 | |
WO2015135455A1 (en) | Natural language question answering method and apparatus | |
US10176228B2 (en) | Identification and evaluation of lexical answer type conditions in a question to generate correct answers | |
US10108602B2 (en) | Dynamic portmanteau word semantic identification | |
US20180039911A1 (en) | Method and system of selecting training features for a machine learning algorithm | |
US11556573B2 (en) | Semantic cluster formation in deep learning intelligent assistants | |
CN111159343A (zh) | 基于文本嵌入的文本相似性搜索方法、装置、设备和介质 | |
KR20230075052A (ko) | 언어 모델을 이용하여 도메인에 특화된 대화를 제공하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 | |
US10592542B2 (en) | Document ranking by contextual vectors from natural language query | |
US10474747B2 (en) | Adjusting time dependent terminology in a question and answer system | |
CN104462085A (zh) | 检索关键词纠错方法及装置 | |
US10083398B2 (en) | Framework for annotated-text search using indexed parallel fields | |
KR102059743B1 (ko) | 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템 | |
US20200372117A1 (en) | Proximity information retrieval boost method for medical knowledge question answering systems | |
CN112214584A (zh) | 使用知识图利用实体关系来发现答案 | |
CN112214583A (zh) | 使用外部数据源扩展知识图 | |
EP3404553A1 (en) | Open information extraction method and system for extracting reified ternary relationship | |
JP7016237B2 (ja) | 情報検索装置、検索処理方法、およびプログラム | |
CN117076636A (zh) | 一种智能客服的信息查询方法、系统和设备 | |
US9904674B2 (en) | Augmented text search with syntactic information | |
KR102053419B1 (ko) | 개체명 연결 방법, 장치, 시스템 및 컴퓨터 프로그램 | |
US9946765B2 (en) | Building a domain knowledge and term identity using crowd sourcing | |
JP2010267047A (ja) | 類義語辞書構築装置及び方法、コンピュータプログラム | |
US12073299B2 (en) | Systems and methods for using contrastive pre-training to generate text and code embeddings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200720 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220125 |