JPWO2018097091A1 - モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム - Google Patents
モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム Download PDFInfo
- Publication number
- JPWO2018097091A1 JPWO2018097091A1 JP2018552565A JP2018552565A JPWO2018097091A1 JP WO2018097091 A1 JPWO2018097091 A1 JP WO2018097091A1 JP 2018552565 A JP2018552565 A JP 2018552565A JP 2018552565 A JP2018552565 A JP 2018552565A JP WO2018097091 A1 JPWO2018097091 A1 JP WO2018097091A1
- Authority
- JP
- Japan
- Prior art keywords
- text
- search
- query
- pair
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
12、22、42 言語解析部
14、24 単語重み計算部
16 拡張クエリ作成部
16a 単語並び替え部
16b 単語フィルタリング部
18 モデル学習部
20 クエリ拡張モデル記憶部
26 検索用インデックス作成部
28 第1テキスト検索用インデックス記憶部
30 第2テキスト検索用インデックス記憶部
40 テキスト検索装置
43 テキストペア検索部
44 第1テキスト検索スコア算出部
46 拡張クエリ作成部
48 第2テキスト検索スコア算出部
50 検索スコア統合結果出力部
Claims (10)
- 学習用の第1テキストと、前記学習用の第1テキストを質問としたときの回答となる学習用の第2テキストとのペアからなる学習用テキストペア群を入力として、クエリとなるテキストに対して、拡張クエリとなるテキストを作成するクエリ拡張モデルを学習するモデル学習部
を含むモデル作成装置。 - 検索対象の第1テキストと、前記検索対象の第1テキストを質問としたときの回答となる検索対象の第2テキストとのペアからなる検索対象テキストペア群に基づいて、前記検索対象の第1テキストについての検索用インデックス、及び前記検索対象の第2テキストについての検索用インデックスを作成する検索インデックス作成部
を更に含む請求項1記載のモデル作成装置。 - 検索対象の第1テキストと、前記検索対象の第1テキストを質問としたときの回答となる検索対象の第2テキストとのペアからなる検索対象テキストペア群に含まれる各単語からなる検索対象テキスト単語リストを用いて、前記学習用テキストペア群から、前記検索対象テキスト単語リストに含まれない単語を除去する単語フィルタリング部を更に含み、
前記モデル学習部は、前記単語フィルタリング部によって前記検索対象テキスト単語リストに含まれない単語を除去された前記学習用テキストペア群に基づいて、前記クエリ拡張モデルを学習する
請求項1又は2記載のモデル作成装置。 - 検索対象の第1テキストと、前記検索対象の第1テキストを質問としたときの回答となる検索対象の第2テキストとのペアからなる検索対象テキストペア群から、入力クエリに対応する、第1テキスト及び第2テキストのペアを検索するテキスト検索装置であって、
前記入力クエリに対して、拡張クエリを作成するためのクエリ拡張モデルに基づいて、前記第2テキストを検索するための拡張クエリを作成する拡張クエリ作成部と、
前記入力クエリと前記拡張クエリとに基づいて、前記第1テキスト及び前記第2テキストのペアを検索するテキストペア検索部と、
を含むテキスト検索装置。 - 前記テキストペア検索部は、前記第1テキストについての検索用インデックスと、前記入力クエリと、前記第2テキストについての検索用インデックスと、前記拡張クエリとに基づいて、前記第1テキスト及び前記第2テキストのペアを検索する
請求項4記載のテキスト検索装置。 - 前記テキストペア検索部は、
前記第1テキストについての検索用インデックスと、前記入力クエリとに基づいて、前記第1テキストの各々について、第1テキスト検索スコアを算出する第1テキスト検索スコア算出部と、
前記第2テキストについての検索用インデックスと、前記拡張クエリとに基づいて、前記第2テキストの各々について、第2テキスト検索スコアを算出する第2テキスト検索スコア算出部と、
前記第1テキスト及び前記第2テキストのペアの各々について、前記第1テキスト検索スコアと第2テキスト検索スコアとを統合し、前記第1テキスト及び前記第2テキストのペアを検索する検索スコア統合結果出力部と、
を含む請求項5記載のテキスト検索装置。 - 検索対象の第1テキストと、前記検索対象の第1テキストを質問としたときの回答となる検索対象の第2テキストとのペアからなる検索対象テキストペア群から、入力クエリに対応する、第1テキスト及び前記第2テキストのペアを検索するテキスト検索装置で用いるためのデータ構造であって、
学習用の第1テキストと、前記学習用の第1テキストを質問としたときの回答となる学習用の第2テキストとのペアからなる学習用テキストペア群、及び前記検索対象テキストペア群を入力として得られる、
クエリとなるテキストに対して、拡張クエリとなるテキストを作成するクエリ拡張モデルと、
前記検索対象の第1テキスト及び第2テキストについての検索用インデックスと、
を含むデータ構造。 - モデル学習部を含んだモデル作成装置におけるモデル作成方法であって、
前記モデル学習部が、学習用の第1テキストと、前記学習用の第1テキストを質問としたときの回答となる学習用の第2テキストとのペアからなる学習用テキストペア群、及び検索対象の第1テキストと、前記検索対象の第1テキストを質問としたときの回答となる検索対象の第2テキストとのペアからなる検索対象テキストペア群を入力として、クエリとなるテキストに対して、拡張クエリとなるテキストを作成するクエリ拡張モデルを学習するステップ
を含むモデル作成方法。 - 拡張クエリ作成部、及びテキストペア検索部を含み、第1テキストと、前記第1テキストを質問としたときの回答となる第2テキストとのペアからなる検索対象テキストペア群から、入力クエリに対応する、第1テキスト及び前記第2テキストのペアを検索するテキスト検索装置におけるテキスト検索方法であって、
前記拡張クエリ作成部が、前記入力クエリに対して、拡張クエリを作成するための予め学習されたクエリ拡張モデルに基づいて、前記第2テキストを検索するための拡張クエリを作成するステップと、
前記テキストペア検索部が、前記入力クエリと前記拡張クエリとに基づいて、前記第1テキスト及び前記第2テキストのペアを検索するステップと、
を含むテキスト検索方法。 - コンピュータを、請求項1〜請求項3の何れか1項記載のモデル作成装置の各部、又は請求項4〜請求項6の何れか1項記載のテキスト検索装置の各部として機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016229072 | 2016-11-25 | ||
JP2016229072 | 2016-11-25 | ||
PCT/JP2017/041630 WO2018097091A1 (ja) | 2016-11-25 | 2017-11-20 | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018097091A1 true JPWO2018097091A1 (ja) | 2019-10-17 |
JP6813591B2 JP6813591B2 (ja) | 2021-01-13 |
Family
ID=62195017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018552565A Active JP6813591B2 (ja) | 2016-11-25 | 2017-11-20 | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11182435B2 (ja) |
JP (1) | JP6813591B2 (ja) |
WO (1) | WO2018097091A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018097091A1 (ja) * | 2016-11-25 | 2018-05-31 | 日本電信電話株式会社 | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム |
CN110574021B (zh) | 2017-04-29 | 2023-10-13 | 谷歌有限责任公司 | 使用经过训练的生成模型生成查询变体 |
WO2019167282A1 (ja) * | 2018-03-02 | 2019-09-06 | 富士通株式会社 | 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム |
JP7087938B2 (ja) * | 2018-06-07 | 2022-06-21 | 日本電信電話株式会社 | 質問生成装置、質問生成方法及びプログラム |
WO2019235103A1 (ja) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | 質問生成装置、質問生成方法及びプログラム |
JP7032650B2 (ja) * | 2018-06-28 | 2022-03-09 | 富士通株式会社 | 類似テキスト検索方法、類似テキスト検索装置および類似テキスト検索プログラム |
US11755659B2 (en) * | 2018-10-04 | 2023-09-12 | Resonac Corporation | Document search device, document search program, and document search method |
CN109460473B (zh) * | 2018-11-21 | 2021-11-02 | 中南大学 | 基于症状提取和特征表示的电子病历多标签分类方法 |
CN109977215B (zh) * | 2019-03-29 | 2021-06-18 | 百度在线网络技术(北京)有限公司 | 基于关联兴趣点的语句推荐方法和装置 |
JP7388926B2 (ja) * | 2020-01-09 | 2023-11-29 | 株式会社日立製作所 | 対話システム |
WO2021146388A1 (en) * | 2020-01-14 | 2021-07-22 | RELX Inc. | Systems and methods for providing answers to a query |
KR102418953B1 (ko) * | 2020-05-11 | 2022-07-11 | 네이버 주식회사 | 쇼핑 검색 결과 확장 방법 및 시스템 |
CN111930918B (zh) * | 2020-09-29 | 2020-12-18 | 湖南大学 | 一种跨模态的双边个性化人机社交对话生成方法及系统 |
US20220138170A1 (en) * | 2020-10-29 | 2022-05-05 | Yext, Inc. | Vector-based search result generation |
US20220284174A1 (en) * | 2021-03-03 | 2022-09-08 | Oracle International Corporation | Correcting content generated by deep learning |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000339314A (ja) * | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体 |
JP2007304793A (ja) * | 2006-05-10 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置 |
US20080040114A1 (en) * | 2006-08-11 | 2008-02-14 | Microsoft Corporation | Reranking QA answers using language modeling |
US20090287678A1 (en) * | 2008-05-14 | 2009-11-19 | International Business Machines Corporation | System and method for providing answers to questions |
US20140222743A1 (en) * | 2013-02-06 | 2014-08-07 | International Business Machines Corporation | Natural language question expansion and extraction |
JP2016066232A (ja) * | 2014-09-24 | 2016-04-28 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
US20160147775A1 (en) * | 2014-11-20 | 2016-05-26 | Oracle International Corporation | Automatic generation of contextual search string synonyms |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7287025B2 (en) * | 2003-02-12 | 2007-10-23 | Microsoft Corporation | Systems and methods for query expansion |
JP4650072B2 (ja) * | 2005-04-12 | 2011-03-16 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
CN101563682A (zh) * | 2006-12-22 | 2009-10-21 | 日本电气株式会社 | 语句改述方法、程序以及系统 |
JP5436152B2 (ja) | 2009-11-10 | 2014-03-05 | 日本電信電話株式会社 | 質問応答装置、質問応答方法、質問応答プログラム |
US20130060769A1 (en) * | 2011-09-01 | 2013-03-07 | Oren Pereg | System and method for identifying social media interactions |
JP5903370B2 (ja) | 2012-11-14 | 2016-04-13 | 日本電信電話株式会社 | 情報検索装置、情報検索方法、及びプログラム |
US10509814B2 (en) * | 2014-12-19 | 2019-12-17 | Universidad Nacional De Educacion A Distancia (Uned) | System and method for the indexing and retrieval of semantically annotated data using an ontology-based information retrieval model |
WO2018097091A1 (ja) * | 2016-11-25 | 2018-05-31 | 日本電信電話株式会社 | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム |
-
2017
- 2017-11-20 WO PCT/JP2017/041630 patent/WO2018097091A1/ja active Application Filing
- 2017-11-20 US US16/461,201 patent/US11182435B2/en active Active
- 2017-11-20 JP JP2018552565A patent/JP6813591B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000339314A (ja) * | 1999-05-25 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 自動応答方法及び対話解析方法並びに応答文生成方法、その装置、そのプログラムを記録した媒体 |
JP2007304793A (ja) * | 2006-05-10 | 2007-11-22 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置 |
US20080040114A1 (en) * | 2006-08-11 | 2008-02-14 | Microsoft Corporation | Reranking QA answers using language modeling |
US20090287678A1 (en) * | 2008-05-14 | 2009-11-19 | International Business Machines Corporation | System and method for providing answers to questions |
US20140222743A1 (en) * | 2013-02-06 | 2014-08-07 | International Business Machines Corporation | Natural language question expansion and extraction |
JP2016066232A (ja) * | 2014-09-24 | 2016-04-28 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
US20160147775A1 (en) * | 2014-11-20 | 2016-05-26 | Oracle International Corporation | Automatic generation of contextual search string synonyms |
Also Published As
Publication number | Publication date |
---|---|
JP6813591B2 (ja) | 2021-01-13 |
US20190278812A1 (en) | 2019-09-12 |
US11182435B2 (en) | 2021-11-23 |
WO2018097091A1 (ja) | 2018-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018097091A1 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム | |
CN108304375B (zh) | 一种信息识别方法及其设备、存储介质、终端 | |
EP1927927A2 (en) | Speech recognition training method for audio and video file indexing on a search engine | |
US20030046078A1 (en) | Supervised automatic text generation based on word classes for language modeling | |
KR101353521B1 (ko) | 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치 | |
CN101952824A (zh) | 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统 | |
WO2008107305A2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
JP2004133880A (ja) | インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法 | |
Chen et al. | Automatic key term extraction from spoken course lectures using branching entropy and prosodic/semantic features | |
KR101410601B1 (ko) | 유머 발화를 이용하는 음성 대화 시스템 및 그 방법 | |
CN112185361B (zh) | 一种语音识别模型训练方法、装置、电子设备及存储介质 | |
KR101988165B1 (ko) | 청각 장애 학생들을 위한 전문 자료 텍스트 분석 기반 음성인식 기술 정확도 향상 방법 및 시스템 | |
JP4466334B2 (ja) | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
Tapsai et al. | Thai Natural Language Processing: Word Segmentation, Semantic Analysis, and Application | |
KR101333485B1 (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
CN115017870A (zh) | 一种闭环的话术扩写方法、装置、计算机设备及存储介质 | |
Kong et al. | Improved spoken document summarization using probabilistic latent semantic analysis (plsa) | |
CN116595970A (zh) | 语句同义改写方法、装置和电子设备 | |
CN107818078B (zh) | 汉语自然语言对话的语义关联与匹配方法 | |
KR101069534B1 (ko) | 미등록어를 포함한 환경에서 오디오 및 비디오의 음성 데이터 검색 방법 및 장치 | |
KR20200073524A (ko) | 특허 문서의 키프레이즈 추출 장치 및 방법 | |
JP4153843B2 (ja) | 自然文検索装置、自然文検索方法、自然文検索プログラム及び自然文検索プログラム記憶媒体 | |
CN113590768B (zh) | 一种文本关联度模型的训练方法及装置、问答方法及装置 | |
CN114154496A (zh) | 基于深度学习bert模型的煤监类案对比方法及装置 | |
Grishman | Information extraction and speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6813591 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |