JP7378103B2 - 自然語モデルに基づいた質問-応答ペア生成方法およびこのような方法を遂行する装置 - Google Patents
自然語モデルに基づいた質問-応答ペア生成方法およびこのような方法を遂行する装置 Download PDFInfo
- Publication number
- JP7378103B2 JP7378103B2 JP2022087930A JP2022087930A JP7378103B2 JP 7378103 B2 JP7378103 B2 JP 7378103B2 JP 2022087930 A JP2022087930 A JP 2022087930A JP 2022087930 A JP2022087930 A JP 2022087930A JP 7378103 B2 JP7378103 B2 JP 7378103B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- context
- solution
- sentences
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000004044 response Effects 0.000 claims description 28
- 238000000926 separation method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 102100033814 Alanine aminotransferase 2 Human genes 0.000 description 3
- 101710096000 Alanine aminotransferase 2 Proteins 0.000 description 3
- 241000393496 Electra Species 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
Description
Claims (6)
- 自然語モデルに基づいた質問-応答ペア生成方法は、
文書転換部が原文上でテキストを抽出する段階、
コンテクスト分離部が前記テキストでコンテクストを決定する段階、および
質問-応答ペア生成部が前記コンテクストで候補質問-応答ペアを生成する段階を含み、
質問-応答ペア生成部は前記コンテクストで解を決定し、前記解に対応する質問を決定して前記候補質問-応答ペアを生成し、
ウォーカー部は前記候補質問-応答ペアに対して追加的な判断を通じて最終的に質問-応答ペアを決定し、
前記質問-応答ペアのうち、前記解を決定するために、前記コンテクストに含まれる単語のうち前記解に設定可能な品詞に対応する1次候補解が抽出され、前記1次候補解の抽出後、前記1次候補解の分布頻度に基づいて2次候補解が決定され、前記2次候補解の決定後、前記コンテクスト上の位置を考慮して解として設定される優先順位が決定され、前記コンテクスト上の位置は、前記コンテクストを構成するセンテンスのうち前記2次候補解を含むセンテンスの位置を考慮して決定され、
前記2次候補解の優先順位は、前記コンテクスト内の前記2次候補解を含むターゲットセンテンス分布が相対的に広いほどが高く設定され、
前記ターゲットセンテンス分布は、全体センテンスのうち前記ターゲットセンテンス間の距離を基準として判断される
ことを特徴とする、方法。 - 前記質問は、質問ターゲットセンテンスのうち最も優先順位が高い質問ターゲットセンテンスを基準として決定され、
前記質問ターゲットセンテンスは、前記ターゲットセンテンスに対する分析に基づいて、前記ターゲットセンテンスのうち質問として生成が容易な優先順位を基準として決定され、
前記質問ターゲットセンテンスの優先順位は、前記ターゲットセンテンスのうち長さが相対的に長いほど相対的に高く設定され、前記ターゲットセンテンスで含まれる単語のうち他のターゲットセンテンスに含まれる単語と重複する単語が相対的に多いほど相対的に高く設定される、請求項1に記載の方法。 - 前記コンテクスト分離部は自然語推論および文章類似度測定に基づいて前記テキスト内の文章間の関係を決定し、
前記コンテクスト分離部はディープラーニングモデルに基づいて前記文章でキーワードを抽出して前記コンテクストを決定することを特徴とする、請求項2に記載の方法。 - 自然語モデルに基づいた質問-応答ペア生成器は、
原文上でテキストを抽出するように具現される文書転換部、
前記テキストでコンテクストを決定するように具現されるコンテクスト分離部、および
前記コンテクストで候補質問-応答ペアを生成するように具現される質問-応答ペア生成部を含み、
質問-応答ペア生成部は前記コンテクストで解を決定し、前記解に対応する質問を決定して前記候補質問-応答ペアを生成し、
ウォーカー部は前記候補質問-応答ペアに対して追加的な判断を通じて最終的に質問-応答ペアを決定し、
前記質問-応答ペアのうち、前記解を決定するために、前記コンテクストに含まれる単語のうち前記解に設定可能な品詞に対応する1次候補解が抽出され、前記1次候補解の抽出後、前記1次候補解の分布頻度に基づいて2次候補解が決定され、前記2次候補解の決定後、前記コンテクスト上の位置を考慮して解として設定される優先順位が決定され、前記コンテクスト上の位置は、前記コンテクストを構成するセンテンスのうち前記2次候補解を含むセンテンスの位置を考慮して決定され、
前記2次候補解の優先順位は、前記コンテクスト内の前記2次候補解を含むターゲットセンテンス分布が相対的に広いほどが高く設定され、
前記ターゲットセンテンス分布は、全体センテンスのうち前記ターゲットセンテンス間の距離を基準として判断される
ことを特徴とする、質問-応答ペア生成器。 - 前記質問は、質問ターゲットセンテンスのうち最も優先順位が高い質問ターゲットセンテンスを基準として決定され、
前記質問ターゲットセンテンスは、前記ターゲットセンテンスに対する分析に基づいて、前記ターゲットセンテンスのうち質問として生成が容易な優先順位を基準として決定され、
前記質問ターゲットセンテンスの優先順位は、前記ターゲットセンテンスのうち長さが相対的に長いほど相対的に高く設定され、前記ターゲットセンテンスで含まれる単語のうち他のターゲットセンテンスに含まれる単語と重複する単語が相対的に多いほど相対的に高く設定される、請求項4に記載の質問-応答ペア生成器。 - 前記コンテクスト分離部は自然語推論および文章類似度測定に基づいて前記テキスト内の文章間の関係を決定し、
前記コンテクスト分離部はディープラーニングモデルに基づいて前記文章でキーワードを抽出して前記コンテクストを決定することを特徴とする、請求項5に記載の質問-応答ペア生成器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0106247 | 2021-08-11 | ||
KR1020210106247A KR102410068B1 (ko) | 2021-08-11 | 2021-08-11 | 자연어 모델을 기반으로 한 질의-응답 페어 생성 방법 및 이러한 방법을 수행하는 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023026316A JP2023026316A (ja) | 2023-02-24 |
JP7378103B2 true JP7378103B2 (ja) | 2023-11-13 |
Family
ID=82216622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022087930A Active JP7378103B2 (ja) | 2021-08-11 | 2022-05-30 | 自然語モデルに基づいた質問-応答ペア生成方法およびこのような方法を遂行する装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7378103B2 (ja) |
KR (1) | KR102410068B1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016045652A (ja) | 2014-08-21 | 2016-04-04 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
JP2020135456A (ja) | 2019-02-20 | 2020-08-31 | 日本電信電話株式会社 | 生成装置、学習装置、生成方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100546743B1 (ko) * | 2003-10-02 | 2006-01-26 | 한국전자통신연구원 | 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템 |
JP7163143B2 (ja) * | 2018-11-13 | 2022-10-31 | 株式会社日立製作所 | 質問応答データ生成装置および質問応答データ生成方法 |
KR102230372B1 (ko) * | 2020-06-10 | 2021-03-22 | 한국전자통신연구원 | 자동 질문 생성을 이용한 챗봇 장치 및 그 동작방법 |
-
2021
- 2021-08-11 KR KR1020210106247A patent/KR102410068B1/ko active IP Right Grant
-
2022
- 2022-05-30 JP JP2022087930A patent/JP7378103B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016045652A (ja) | 2014-08-21 | 2016-04-04 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
JP2020135456A (ja) | 2019-02-20 | 2020-08-31 | 日本電信電話株式会社 | 生成装置、学習装置、生成方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
DU, Xinya et al.,Harvesting Paragraph-Level Question-Answer Pairs from Wikipedia [online],2018年05月15日,[検索日:2020.03.03], Internet<URL:https://arxiv.org/abs/1805.05942> |
Also Published As
Publication number | Publication date |
---|---|
KR102410068B1 (ko) | 2022-06-22 |
JP2023026316A (ja) | 2023-02-24 |
KR102410068B9 (ko) | 2023-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3862889A1 (en) | Responding to user queries by context-based intelligent agents | |
US20200034424A1 (en) | Architecture and processes for computer learning and understanding | |
JP6618735B2 (ja) | 質問応答システムの訓練装置及びそのためのコンピュータプログラム | |
US20200183928A1 (en) | System and Method for Rule-Based Conversational User Interface | |
US20230394247A1 (en) | Human-machine collaborative conversation interaction system and method | |
US11556573B2 (en) | Semantic cluster formation in deep learning intelligent assistants | |
CN112149427B (zh) | 动词短语蕴含图谱的构建方法及相关设备 | |
CN110390049B (zh) | 一种面向软件开发问题的答案自动生成方法 | |
CN117648429B (zh) | 基于多模态自适应检索式增强大模型的问答方法及系统 | |
CN112069295A (zh) | 相似题推荐方法、装置、电子设备和存储介质 | |
Bateman et al. | Systemic Functional Linguistics and computation: New directions, new challenges | |
CN109271524A (zh) | 知识库问答系统中的实体链接方法 | |
US20220147719A1 (en) | Dialogue management | |
El Janati et al. | Adaptive e-learning AI-powered chatbot based on multimedia indexing | |
CN112951207B (zh) | 口语评测方法、装置及相关产品 | |
CN112599211B (zh) | 一种医疗实体关系抽取方法及装置 | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
CN107562907B (zh) | 一种智能律师专家案件应答装置 | |
CN117828024A (zh) | 一种插件检索方法、装置、存储介质及设备 | |
JP7378103B2 (ja) | 自然語モデルに基づいた質問-応答ペア生成方法およびこのような方法を遂行する装置 | |
CN117235347A (zh) | 一种基于大语言模型的青少年算法代码辅助学习系统及方法 | |
Karpagam et al. | Deep learning approaches for answer selection in question answering system for conversation agents | |
Su et al. | Automatic ontology population using deep learning for triple extraction | |
CN115114453A (zh) | 基于知识图谱的智能客服实现方法和装置 | |
CN114417880A (zh) | 一种基于电网实训问答知识库的交互式智能问答方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231023 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7378103 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |