CN108960319A - 一种面向全局的机器阅读理解建模中的候选答案筛选方法 - Google Patents
一种面向全局的机器阅读理解建模中的候选答案筛选方法 Download PDFInfo
- Publication number
- CN108960319A CN108960319A CN201810700571.4A CN201810700571A CN108960319A CN 108960319 A CN108960319 A CN 108960319A CN 201810700571 A CN201810700571 A CN 201810700571A CN 108960319 A CN108960319 A CN 108960319A
- Authority
- CN
- China
- Prior art keywords
- candidate answer
- paragraph
- paragraphs
- segment
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012216 screening Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000012634 fragment Substances 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims description 39
- 238000007477 logistic regression Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013136 deep learning model Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000001303 quality assessment method Methods 0.000 claims 1
- 238000013519 translation Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810700571.4A CN108960319B (zh) | 2018-06-29 | 2018-06-29 | 一种面向全局的机器阅读理解建模中的候选答案筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810700571.4A CN108960319B (zh) | 2018-06-29 | 2018-06-29 | 一种面向全局的机器阅读理解建模中的候选答案筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108960319A true CN108960319A (zh) | 2018-12-07 |
CN108960319B CN108960319B (zh) | 2019-12-03 |
Family
ID=64484215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810700571.4A Active CN108960319B (zh) | 2018-06-29 | 2018-06-29 | 一种面向全局的机器阅读理解建模中的候选答案筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108960319B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918487A (zh) * | 2019-01-28 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于网络百科全书的智能问答方法和系统 |
CN110096699A (zh) * | 2019-03-20 | 2019-08-06 | 华南师范大学 | 基于语义的机器阅读理解的候选答案筛选方法和系统 |
CN110134946A (zh) * | 2019-04-15 | 2019-08-16 | 深圳智能思创科技有限公司 | 一种针对复杂数据的机器阅读理解方法 |
CN110457710A (zh) * | 2019-08-19 | 2019-11-15 | 电子科技大学 | 一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端 |
CN110633730A (zh) * | 2019-08-07 | 2019-12-31 | 中山大学 | 一种基于课程学习的深度学习机器阅读理解训练方法 |
CN111159340A (zh) * | 2019-12-24 | 2020-05-15 | 重庆兆光科技股份有限公司 | 基于随机优化预测的机器阅读理解的答案匹配方法及系统 |
CN111680158A (zh) * | 2020-06-10 | 2020-09-18 | 创新奇智(青岛)科技有限公司 | 开放领域的短文本分类方法、装置、设备及存储介质 |
CN111737443A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 答案文本的处理方法和装置、关键文本的确定方法 |
CN111858878A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 从自然语言文本中自动提取答案的方法、系统及存储介质 |
CN111858879A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 一种基于机器阅读理解的问答方法及系统、存储介质、计算机设备 |
CN112163079A (zh) * | 2020-09-30 | 2021-01-01 | 民生科技有限责任公司 | 一种基于阅读理解模型的智能对话方法及系统 |
CN112269868A (zh) * | 2020-12-21 | 2021-01-26 | 中南大学 | 一种基于多任务联合训练的机器阅读理解模型的使用方法 |
CN113553402A (zh) * | 2021-07-28 | 2021-10-26 | 山西大学 | 一种基于图神经网络的考试阅读理解自动问答方法 |
CN113627152A (zh) * | 2021-07-16 | 2021-11-09 | 中国科学院软件研究所 | 一种基于自监督学习的无监督机器阅读理解训练方法 |
CN113779203A (zh) * | 2020-06-09 | 2021-12-10 | 北京金山数字娱乐科技有限公司 | 生成段落集的方法和装置、推理方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09160477A (ja) * | 1995-12-13 | 1997-06-20 | Nippon Telegr & Teleph Corp <Ntt> | 単語読解能力測定方法ならびに装置 |
CN103229120A (zh) * | 2010-09-28 | 2013-07-31 | 国际商业机器公司 | 使用假设剪枝提供问题答案 |
US8764455B1 (en) * | 2005-05-09 | 2014-07-01 | Altis Avante Corp. | Comprehension instruction system and method |
US20150324349A1 (en) * | 2014-05-12 | 2015-11-12 | Google Inc. | Automated reading comprehension |
CN105930452A (zh) * | 2016-04-21 | 2016-09-07 | 北京紫平方信息技术股份有限公司 | 一种识别自然语言的智能应答方法 |
EP3101597A2 (en) * | 2015-06-05 | 2016-12-07 | Google, Inc. | Reading comprehension neural networks |
CN107301226A (zh) * | 2017-06-20 | 2017-10-27 | 哈尔滨工业大学 | 一种问答系统中检索自模块的自动评价方法 |
CN107818085A (zh) * | 2017-11-08 | 2018-03-20 | 山西大学 | 阅读机器人进行阅读理解的答案选择方法及系统 |
CN107832295A (zh) * | 2017-11-08 | 2018-03-23 | 山西大学 | 阅读机器人的标题选择方法及系统 |
CN107967318A (zh) * | 2017-11-23 | 2018-04-27 | 北京师范大学 | 一种采用lstm神经网络的中文短文本主观题自动评分方法和系统 |
-
2018
- 2018-06-29 CN CN201810700571.4A patent/CN108960319B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09160477A (ja) * | 1995-12-13 | 1997-06-20 | Nippon Telegr & Teleph Corp <Ntt> | 単語読解能力測定方法ならびに装置 |
US8764455B1 (en) * | 2005-05-09 | 2014-07-01 | Altis Avante Corp. | Comprehension instruction system and method |
CN103229120A (zh) * | 2010-09-28 | 2013-07-31 | 国际商业机器公司 | 使用假设剪枝提供问题答案 |
US20150324349A1 (en) * | 2014-05-12 | 2015-11-12 | Google Inc. | Automated reading comprehension |
CN106462607A (zh) * | 2014-05-12 | 2017-02-22 | 谷歌公司 | 自动化阅读理解 |
EP3101597A2 (en) * | 2015-06-05 | 2016-12-07 | Google, Inc. | Reading comprehension neural networks |
CN105930452A (zh) * | 2016-04-21 | 2016-09-07 | 北京紫平方信息技术股份有限公司 | 一种识别自然语言的智能应答方法 |
CN107301226A (zh) * | 2017-06-20 | 2017-10-27 | 哈尔滨工业大学 | 一种问答系统中检索自模块的自动评价方法 |
CN107818085A (zh) * | 2017-11-08 | 2018-03-20 | 山西大学 | 阅读机器人进行阅读理解的答案选择方法及系统 |
CN107832295A (zh) * | 2017-11-08 | 2018-03-23 | 山西大学 | 阅读机器人的标题选择方法及系统 |
CN107967318A (zh) * | 2017-11-23 | 2018-04-27 | 北京师范大学 | 一种采用lstm神经网络的中文短文本主观题自动评分方法和系统 |
Non-Patent Citations (4)
Title |
---|
RICHARDSON M ET AL: "《Mctest:A challenge dataset for the open-domain machine comprehension of text》", 《PROC OF THE 2013 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》 * |
刘海静: "《机器阅读理解软件中答案相关句的抽取算法研究》", 《软件工程》 * |
刘红霞: "《面向慢性病海量数据问答系统智能摘要算法的研究与实现》", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
张可培: "《基于阅读理解模式的中文问答系统研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918487A (zh) * | 2019-01-28 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于网络百科全书的智能问答方法和系统 |
CN110096699A (zh) * | 2019-03-20 | 2019-08-06 | 华南师范大学 | 基于语义的机器阅读理解的候选答案筛选方法和系统 |
CN110096699B (zh) * | 2019-03-20 | 2023-06-09 | 华南师范大学 | 基于语义的机器阅读理解的候选答案筛选方法和系统 |
CN110134946A (zh) * | 2019-04-15 | 2019-08-16 | 深圳智能思创科技有限公司 | 一种针对复杂数据的机器阅读理解方法 |
CN110633730A (zh) * | 2019-08-07 | 2019-12-31 | 中山大学 | 一种基于课程学习的深度学习机器阅读理解训练方法 |
CN110633730B (zh) * | 2019-08-07 | 2023-05-23 | 中山大学 | 一种基于课程学习的深度学习机器阅读理解训练方法 |
CN110457710A (zh) * | 2019-08-19 | 2019-11-15 | 电子科技大学 | 一种基于动态路由机制的机器阅读理解网络模型、方法、存储介质及终端 |
CN110457710B (zh) * | 2019-08-19 | 2022-08-02 | 电子科技大学 | 一种基于动态路由机制的机器阅读理解网络模型的建立方法、方法、存储介质及终端 |
CN111159340A (zh) * | 2019-12-24 | 2020-05-15 | 重庆兆光科技股份有限公司 | 基于随机优化预测的机器阅读理解的答案匹配方法及系统 |
CN111159340B (zh) * | 2019-12-24 | 2023-11-03 | 重庆兆光科技股份有限公司 | 基于随机优化预测的机器阅读理解的答案匹配方法及系统 |
CN113779203A (zh) * | 2020-06-09 | 2021-12-10 | 北京金山数字娱乐科技有限公司 | 生成段落集的方法和装置、推理方法和装置 |
CN113779203B (zh) * | 2020-06-09 | 2024-09-17 | 北京金山数字娱乐科技有限公司 | 生成段落集的方法和装置、推理方法和装置 |
CN111680158A (zh) * | 2020-06-10 | 2020-09-18 | 创新奇智(青岛)科技有限公司 | 开放领域的短文本分类方法、装置、设备及存储介质 |
CN111858879B (zh) * | 2020-06-18 | 2024-04-05 | 达观数据有限公司 | 一种基于机器阅读理解的问答方法及系统、存储介质、计算机设备 |
CN111858879A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 一种基于机器阅读理解的问答方法及系统、存储介质、计算机设备 |
CN111858878A (zh) * | 2020-06-18 | 2020-10-30 | 达而观信息科技(上海)有限公司 | 从自然语言文本中自动提取答案的方法、系统及存储介质 |
CN111858878B (zh) * | 2020-06-18 | 2023-12-22 | 达观数据有限公司 | 从自然语言文本中自动提取答案的方法、系统及存储介质 |
CN111737443B (zh) * | 2020-08-14 | 2020-11-20 | 支付宝(杭州)信息技术有限公司 | 答案文本的处理方法和装置、关键文本的确定方法 |
CN111737443A (zh) * | 2020-08-14 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 答案文本的处理方法和装置、关键文本的确定方法 |
CN112163079A (zh) * | 2020-09-30 | 2021-01-01 | 民生科技有限责任公司 | 一种基于阅读理解模型的智能对话方法及系统 |
CN112163079B (zh) * | 2020-09-30 | 2024-02-20 | 民生科技有限责任公司 | 一种基于阅读理解模型的智能对话方法及系统 |
CN112269868A (zh) * | 2020-12-21 | 2021-01-26 | 中南大学 | 一种基于多任务联合训练的机器阅读理解模型的使用方法 |
CN113627152B (zh) * | 2021-07-16 | 2023-05-16 | 中国科学院软件研究所 | 一种基于自监督学习的无监督机器阅读理解训练方法 |
CN113627152A (zh) * | 2021-07-16 | 2021-11-09 | 中国科学院软件研究所 | 一种基于自监督学习的无监督机器阅读理解训练方法 |
CN113553402B (zh) * | 2021-07-28 | 2022-09-20 | 山西大学 | 一种基于图神经网络的考试阅读理解自动问答方法 |
CN113553402A (zh) * | 2021-07-28 | 2021-10-26 | 山西大学 | 一种基于图神经网络的考试阅读理解自动问答方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108960319B (zh) | 2019-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108960319B (zh) | 一种面向全局的机器阅读理解建模中的候选答案筛选方法 | |
Tian et al. | Towards predicting the best answers in community-based question-answering services | |
CN107729468B (zh) | 基于深度学习的答案抽取方法及系统 | |
CN108376131A (zh) | 基于seq2seq深度神经网络模型的关键词抽取方法 | |
CN112417105B (zh) | 问答处理方法、装置、存储介质和电子设备 | |
CN109299271A (zh) | 训练样本生成、文本数据、舆情事件分类方法及相关设备 | |
CN1637744A (zh) | 为在大量电子文档中搜索而确定文档相关性的机器学习方法 | |
CN112784013B (zh) | 一种基于上下文语义的多粒度文本推荐方法 | |
CN112001484A (zh) | 一种基于多任务深度学习的安全缺陷报告预测方法 | |
Ljubešić et al. | Kas-term: Extracting slovene terms from doctoral theses via supervised machine learning | |
CN104615910A (zh) | 基于随机森林预测α跨膜蛋白的螺旋相互作用关系的方法 | |
Munggaran et al. | Sentiment analysis of twitter users’ opinion data regarding the use of chatgpt in education | |
Byun et al. | Elicit: Language models as research tools | |
Dotan et al. | Effect of tokenization on transformers for biological sequences | |
CN112488188A (zh) | 一种基于深度强化学习的特征选择方法 | |
CN114999566B (zh) | 基于词向量表征和注意力机制的药物重定位方法及系统 | |
CN112507082B (zh) | 一种智能识别不当文本交互的方法、装置和电子设备 | |
Kazm et al. | Transformer Encoder with Protein Language Model for Protein Secondary Structure Prediction | |
CA3215520A1 (en) | Efficient voxelization for deep learning | |
Gomes et al. | Effort estimation in named entity tagging tasks | |
CN111753084A (zh) | 一种短文本特征提取与分类方法 | |
CN110334353A (zh) | 词序识别性能的分析方法、装置、设备及存储介质 | |
Hu et al. | Prediction of the positive psychology of college students using LightGBM algorithm based on SMOTE and Bayesian optimization | |
CN114496115B (zh) | 实体关系的标注自动生成方法和系统 | |
Martínez-Murillo et al. | Team GPLSI at AuTexTification Shared Task: Determining the Authorship of a Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210118 Address after: Building 9, accelerator, 14955 Zhongyuan Avenue, Songbei District, Harbin City, Heilongjiang Province Patentee after: INDUSTRIAL TECHNOLOGY Research Institute OF HEILONGJIANG PROVINCE Address before: 150001 No.92 xidazhi street, Nangang District, Harbin City, Heilongjiang Province Patentee before: HARBIN INSTITUTE OF TECHNOLOGY |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230315 Address after: 150027 Room 412, Unit 1, No. 14955, Zhongyuan Avenue, Building 9, Innovation and Entrepreneurship Plaza, Science and Technology Innovation City, Harbin Hi tech Industrial Development Zone, Heilongjiang Province Patentee after: Heilongjiang Industrial Technology Research Institute Asset Management Co.,Ltd. Address before: Building 9, accelerator, 14955 Zhongyuan Avenue, Songbei District, Harbin City, Heilongjiang Province Patentee before: INDUSTRIAL TECHNOLOGY Research Institute OF HEILONGJIANG PROVINCE |
|
TR01 | Transfer of patent right |