CN111753521B - 基于人工智能的阅读理解方法及相关设备 - Google Patents

基于人工智能的阅读理解方法及相关设备 Download PDF

Info

Publication number
CN111753521B
CN111753521B CN202010601480.2A CN202010601480A CN111753521B CN 111753521 B CN111753521 B CN 111753521B CN 202010601480 A CN202010601480 A CN 202010601480A CN 111753521 B CN111753521 B CN 111753521B
Authority
CN
China
Prior art keywords
target
question
reading understanding
length
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010601480.2A
Other languages
English (en)
Other versions
CN111753521A (zh
Inventor
刘康龙
徐国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202010601480.2A priority Critical patent/CN111753521B/zh
Publication of CN111753521A publication Critical patent/CN111753521A/zh
Application granted granted Critical
Publication of CN111753521B publication Critical patent/CN111753521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于人工智能的阅读理解方法,包括:获取需要进行阅读理解的目标文档以及与目标文档匹配的目标问题;判断目标文档和目标问题的第一总长度是否超过阅读理解模型的最大输入长度;若是,从目标文档中确定与目标问题相关的至少一个片段;将目标问题以及预设标记,分别与每个片段进行组合,获得至少一个问题片段组合;依次将至少一个问题片段组合输入至阅读理解模型中,获得多个输出位置;将每个输出位置所指向的片段内容进行组合,获得最终答案。本发明还提供一种基于人工智能的阅读理解装置、电子设备及存储介质。本发明能提高模型预测的准确度。另外,本发明还涉及区块链,同时本发明还可应用智慧教育领域,从而推动智慧城市的建设。

Description

基于人工智能的阅读理解方法及相关设备
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的阅读理解方法及相关设备。
背景技术
近年来,随着人工智能技术的发展,自然语言模型得到了广泛应用。在文档阅读领域,可以使用机器阅读理解模型来阅读给定的文档,进而回答与之相关的问题。
然而,现有的模型主要是一个问题匹配一个短段落,聚焦于从短段落中提取答案,而不是通过阅读整个内容页面找到合适的上下文,最后导致预测的答案并不能够很好的反映问题,预测的准确度比较低。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的阅读理解方法及相关设备,能够提高模型预测的准确度。
本发明的第一方面提供一种基于人工智能的阅读理解方法,所述基于人工智能的阅读理解方法包括:
获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
在一种可能的实现方式中,所述基于人工智能的阅读理解方法还包括:
获取通用数据集上的第一预设文档以及第一预设问题;
采用所述第一预设文档和所述第一预设问题对初始模型进行训练,以最大化所述初始模型的条件概率,并将条件概率最大化时的初始模型确定为待调整模型;
获取非通用数据集上的第二预设文档以及第二预设问题;
采用所述第二预设文档和所述第二预设问题对所述待调整模型进行训练,以最大化所述待调整模型的条件概率,并将条件概率最大化时的待调整模型确定为阅读理解模型。
在一种可能的实现方式中,,所述结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
使用预设分词算法,对所述目标问题进行分词,获得多个关键词;
结合所述目标文档的上下文,将所述多个关键词与所述目标文档进行匹配,并确定包含有所述关键词的目标段落;
统计所有所述目标段落和所述目标问题的第二总长度;
判断所述第二总长度是否超过所述最大输入长度;
若所述第二总长度不超过所述最大输入长度,将所有所述目标段落按照文档先后顺序进行衔接,以确定与所述目标问题相关的至少一个片段。
在一种可能的实现方式中,所述结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
使用预设分词算法,对所述目标问题进行分词,获得多个关键词;
结合所述目标文档的上下文,将所述多个关键词分别与所述目标文档中的每个段落进行匹配,获得匹配度;
将匹配度高于预设匹配度阈值的段落确定为目标段落;
根据所述最大输入长度以及所述多个关键词,对每个所述目标段落进行长度处理,获得与所述目标问题相关的的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度。
在一种可能的实现方式中,所述依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置包括:
获取每个所述问题片段组合的组合长度;
判断每个所述组合长度是否超过所述阅读理解模型的最大输入长度;
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,依次将每个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;或
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,根据每个组合长度,对所述多个问题片段组合进行分组,获得分组后的问题片段组合,其中,每个分组的问题片段组合的总长度均不超过所述最大输入长度;
按照分组,将每组的至少一个问题片段组合输入至所述阅读理解模型中,获得多个输出位置。
在一种可能的实现方式中,所述依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置之后,所述基于人工智能的阅读理解方法还包括:
判断每个所述输出位置是否指向预设标记;
若每个所述输出位置均不指向预设标记,则触发所述将每个所述输出位置所指向的片段内容进行组合,获得最终答案的步骤。
在一种可能的实现方式中,所述基于人工智能的阅读理解方法还包括:
若每个所述输出位置均指向预设标记,确定所述目标问题无答案。
本发明的第二方面提供一种基于人工智能的阅读理解装置,所述基于人工智能的阅读理解装置包括:
获取模块,用于获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断模块,用于判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
确定模块,用于若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
组合模块,用于将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
输入模块,用于依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
所述组合模块,还用于将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于人工智能的阅读理解方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的阅读理解方法。
由以上技术方案,本发明中,当文档和问题的总长度大于阅读理解模型的最大输入长度的情况下,通过分段策略对文档进行划分,获得与问题相关的片段,进而缩小文档长度,降低错误预测答案的总体风险,同时,在输入时增加了预设标记,当阅读理解模型的输出位置指向该预设标记而没有指向任何属于文档的内容时,该问题会被认为是无答案,从而能够提高阅读理解模型对无答案问题的预测精度。
附图说明
图1是本发明公开的一种基于人工智能的阅读理解方法的较佳实施例的流程图。
图2是本发明公开的一种基于人工智能的阅读理解装置的较佳实施例的功能模块图。
图3是本发明实现基于人工智能的阅读理解方法的较佳实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、嵌入式设备等。可以包括但不限于网络服务器、个人计算机、平板电脑、智能手机、个人数字助理PDA等。
图1是本发明公开的一种基于人工智能的阅读理解方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S11、获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题。
S12、判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度。
其中,最大输入长度,比如500个字。
可选的,步骤S11之前,所述方法还包括:
获取通用数据集上的第一预设文档以及第一预设问题;
采用所述第一预设文档和所述第一预设问题对初始模型进行训练,以最大化所述初始模型的条件概率,并将条件概率最大化时的初始模型确定为待调整模型;
获取非通用数据集上的第二预设文档以及第二预设问题;
采用所述第二预设文档和所述第二预设问题对所述待调整模型进行训练,以最大化所述待调整模型的条件概率,并将条件概率最大化时的待调整模型确定为阅读理解模型。
其中,通用数据集上的数据,通常是比较多的,通用领域的数据,比如新闻报道数据,非通用数据集上的数据,通常是比较少,非通用领域的数据,比如金融领域的数据。
该实施例中,通过利用充足的通用领域的数据来进行训练,获得待调整模型,在采用数据比较少的非通用领域的数据进行微调,最大化模型输出的条件概率,获得训练好的阅读理解模型,从而能够提高阅读理解模型在非通用领域的模型预测效果。通常,模型在训练时,会根据训练的结果输出一个条件概率,该条件概率的数值会随着模型的训练而发生变化,当模型收敛时,该条件概率也就是最大值。
其中,可以采用平均指标F1score来对模型训练的效果进行评价,F1score用于表示预设答案与真实答案之间的重叠程度,F1score越高,表示模型预测的越准确。
S13、若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度。
该步骤S13是从整个目标文档中找到与目标问题相关的至少一个片段,而不是聚焦于某个短段落。也即综合上下文匹配查找,不局限于某个短段落,同时,还确保每个片段长度满足阅读理解模型的最大输入长度。
具体的,所述结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
使用预设分词算法,对所述目标问题进行分词,获得多个关键词;
结合所述目标文档的上下文,将所述多个关键词与所述目标文档进行匹配,并确定包含有所述关键词的目标段落;
统计所有所述目标段落和所述目标问题的第二总长度;
判断所述第二总长度是否超过所述最大输入长度;
若所述第二总长度不超过所述最大输入长度,将所有所述目标段落按照文档先后顺序进行衔接,以确定与所述目标问题相关的至少一个片段。
在该实施方式中,将所述多个关键词与每个段落进行匹配,可以获得包括所关键词的目标段落,其中,每个目标段落包含至少一个关键词。如果所有所述目标段落和所述目标问题的第二总长度不超过最大输入长度,则可以将所有所述目标段落按照文档先后顺序进行衔接,其中,文档先后顺序是指目标文档的原始段落的先后顺序。衔接后的所有目标段落就可以构成一个新的片段,该新的片段与所述目标问题相关。
可选的,如果所有所述目标段落和所述目标问题的第二总长度不超过最大输入长度,将所有所述目标段落按照文档先后顺序进行衔接,构建中间文档,并根据最大输入长度,对所述中间文档进行划分,获得与所述目标问题相关的至少一个片段。其中,划分后的每个片段的长度均小于最大输入长度。
通过上述方式,可以确保阅读理解模型能够承受输入的长度,同时确保模型输出结果的准确度。
可选的,所述结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
使用预设分词算法,对所述目标问题进行分词,获得多个关键词;
结合所述目标文档的上下文,将所述多个关键词分别与所述目标文档中的每个段落进行匹配,获得匹配度;
将匹配度高于预设匹配度阈值的段落确定为目标段落;
根据所述最大输入长度以及所述多个关键词,对每个所述目标段落进行长度处理,获得与所述目标问题相关的的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度。
在该实施方式中,预先设置一个预设匹配度阈值,比如80%,将所述多个关键词与每个段落进行匹配,计算匹配度,比如:5个关键词中只有3个能匹配到段落内容,则可以确定匹配度为60%,在每个段落都匹配结束后,就可以进行筛选,将匹配度高于80%的段落确定为目标段落。
其中,可选的,当段落中包含某个关键词时可以认为匹配,或者,可选的,可以结合语义分析,如果某个段落中存在语义与关键词的语义相同的内容,则可以认为匹配。其中,语义即词语的含义。
其中,每个目标段落的长度不一样,有可能会出现目标段落的长度超过最大输入长度,有可能出现目标段落的长度小于最大输入长度。本发明,根据最大输入长度,对每个所述目标段落进行长度处理,对于长度大于最大输入长度的目标段落可以进行文字删减,但必须保留关键词所在的语句。而长度不超过最大输入长度的目标段落,不需要进行任何处理。
通过上述方式,可以确保阅读理解模型能够承受输入的长度,同时确保模型输出结果的准确度。
S14、将所述目标问题、预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题。
其中,所述预设标记为预先设置的,该预设标记既不属于目标问题也不属于目标文档,当最后输出位置指示该预设标记时,可以认为目标问题无答案。
其中,假设有5个片段(ABCDE)、目标问题X以及预设标记Y,则目标问题、预设标记与每个片段分别组合,可以得到AXY,BXY,CXY,DXY,EXY等5个问题片段组合。
传统方法中,通常是一个问题匹配一个短段落,相比较于传统方法,本案中,通过上述方式,可以实现一个问题,分别匹配多个相关联的片段,而且,在组合时,还添加了预设标记用于指示无答案问题,即可以获得携带有预设标记的至少一个问题片段组合。后续在进行预测时,可以增加预测的准确率。
S15、依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置。
其中,预设标记可以插在目标文档的后面,构成一篇文档。将预设标记看作一个字符,目标文档的文字也看做字符,该篇文档是由一个个的字符组成,可以按照字符在文档中的位置来标记字符,比如文档中的第一个字符的位置标识为1,第二个字符的位置标识为2……以此类推,直至标记完最后一个预设标记。输入至阅读理解模型后,可以获得多个输出位置,即位置标识,比如1、2……。每个位置标识代表文档相应位置的字符。
具体的,所述依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置包括:
获取每个所述问题片段组合的组合长度;
判断每个所述组合长度是否超过所述阅读理解模型的最大输入长度;
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,依次将每个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;或
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,根据每个组合长度,对所述多个问题片段组合进行分组,获得分组后的问题片段组合,其中,每个分组的问题片段组合的总长度均不超过所述最大输入长度;
按照分组,将每组的至少一个问题片段组合输入至所述阅读理解模型中,获得多个输出位置。
其中,假设所述阅读理解模型的最大输入长度为500字的长度,如果每个所述组合长度均不超过所述阅读理解模型的最大输入长度,可以直接一个一个地依次输入至所述阅读理解模型中,获得多个输出位置。
可选的,由于每个组合长度不同,有的与最大输入长度比较接近,有的与最大输入长度相差很远,针对那些与最大输入长度相差很远的组合长度对应的问题片段组合,可以将他们分到一组,同时确保分组后的总长度不超过最大输入长度。进行分组后,有的分组只有一个问题片段组合,有的分组有多个问题片段组合。之后,在按照分组,将每组的一个或多个问题片段组合输入至阅读理解模型中,这样可以减少输入次数,提高阅读理解的效率。
S16、将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
通常情况下,阅读理解模型的输出位置都会指向目标文档的内容,只有在没有答案的情况下,才会指向其他位置,比如预设标记。
具体的,阅读理解模型针对每个答案(即片段内容),都会有个最大化的条件概率,该条件概率越大,表示答案越精确,可以按照条件概率的从大到小的顺序,将对应的片段内容进行组合,获得最终答案。
本发明中,至少一个所述问题片段组合被输入至所述阅读理解模型中,阅读理解模型可以依次对每个问题片段组合进行预测,获得每个问题片段组合对应的输出位置,即多个输出位置,进而对多个输出位置进行分析,获得最终答案,实现了通过阅读整个文档找到上下文,使得预测得到的最终答案能够很好的反映问题,预测的准确率也较高。
其中,本发明还可以涉及区块链技术,可选的,还可以将最终答案上传至区块链中,从而可以确保数据的私密性和安全性。
步骤S15之后,所述方法还包括:
判断每个所述输出位置是否指向预设标记;
若每个所述输出位置均不指向预设标记,将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
所述方法还包括:
若每个所述输出位置均指向预设标记,确定所述目标问题无答案。
其中,当最后输出位置指向该预设标记时,可以认为目标问题无答案。
当最后输出位置指向目标文档的片段时,可以认为目标问题有答案,该答案具体由输出位置所指向的目标文档的内容组成。
可选的,本发明还可以应用于智慧教育等场景,从而可以推动智慧城市的建设。
在图1所描述的方法流程中,当文档和问题的总长度大于阅读理解模型的最大输入长度的情况下,通过分段策略对文档进行划分,获得与问题相关的片段,进而缩小文档长度,降低错误预测答案的总体风险,同时,在输入时增加了预设标记,当阅读理解模型的输出位置指向该预设标记而没有指向任何属于文档的内容时,该问题会被认为是无答案,从而能够提高阅读理解模型对无答案问题的预测精度。
以上所述,仅是本发明的具体实施方式,但本发明的保护范围并不局限于此,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。
图2是本发明公开的一种基于人工智能的阅读理解装置的较佳实施例的功能模块图。
在一些实施例中,所述基于人工智能的阅读理解装置运行于电子设备中。所述基于人工智能的阅读理解装置可以包括多个由程序代码段所组成的功能模块。所述基于人工智能的阅读理解装置中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行图1所描述的基于人工智能的阅读理解方法中的部分或全部步骤,具体请参照图1中的相关描述,在此不再赘述。
本实施例中,所述基于人工智能的阅读理解装置根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、判断模块202、确定模块203、组合模块204及输入模块205。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。
获取模块201,用于获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断模块202,用于判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
确定模块203,用于若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
组合模块204,用于将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
输入模块205,用于依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
所述组合模块204,还用于将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
在图2所描述的基于人工智能的阅读理解装置中,当文档和问题的总长度大于阅读理解模型的最大输入长度的情况下,通过分段策略对文档进行划分,获得与问题相关的片段,进而缩小文档长度,降低错误预测答案的总体风险,同时,在输入时增加了预设标记,当阅读理解模型的输出位置指向该预设标记而没有指向任何属于文档的内容时,该问题会被认为是无答案,从而能够提高阅读理解模型对无答案问题的预测精度。
图3是本发明实现基于人工智能的阅读理解方法的较佳实施例的电子设备的结构示意图。所述电子设备3包括存储器31、至少一个处理器32、存储在所述存储器31中并可在所述至少一个处理器32上运行的计算机程序33及至少一条通讯总线34。
本领域技术人员可以理解,图3所示的示意图仅仅是所述电子设备3的示例,并不构成对所述电子设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备3还可以包括输入输出设备、网络接入设备等。
所述至少一个处理器32可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。该处理器32可以是微处理器或者该处理器32也可以是任何常规的处理器等,所述处理器32是所述电子设备3的控制中心,利用各种接口和线路连接整个电子设备3的各个部分。
所述存储器31可用于存储所述计算机程序33和/或模块/单元,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块/单元,以及调用存储在存储器31内的数据,实现所述电子设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备3的使用所创建的数据(比如音频数据)等。此外,存储器31可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
结合图1,所述电子设备3中的所述存储器31存储多个指令以实现一种基于人工智能的阅读理解方法,所述处理器32可执行所述多个指令从而实现:
获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
将每个所述输出位置所指向的片段内容进行组合,获得最终答案。
具体地,所述处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在图3所描述的电子设备3中,当文档和问题的总长度大于阅读理解模型的最大输入长度的情况下,通过分段策略对文档进行划分,获得与问题相关的片段,进而缩小文档长度,降低错误预测答案的总体风险,同时,在输入时增加了预设标记,当阅读理解模型的输出位置指向该预设标记而没有指向任何属于文档的内容时,该问题会被认为是无答案,从而能够提高阅读理解模型对无答案问题的预测精度。
所述电子设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器以及只读存储器(ROM,Read-Only Memory)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于人工智能的阅读理解方法,其特征在于,所述基于人工智能的阅读理解方法包括:
获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,包括:使用预设分词算法,对所述目标问题进行分词,获得多个关键词;结合所述目标文档的上下文,将所述多个关键词分别与所述目标文档中的每个段落进行匹配;根据匹配的结果,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
根据所述多个输出位置所指向的片段内容的条件概率从大到小的顺序,将所述多个输出位置所指向的片段内容进行组合,获得最终答案。
2.根据权利要求1所述的基于人工智能的阅读理解方法,其特征在于,所述基于人工智能的阅读理解方法还包括:
获取通用数据集上的第一预设文档以及第一预设问题;
采用所述第一预设文档和所述第一预设问题对初始模型进行训练,以最大化所述初始模型的条件概率,并将条件概率最大化时的初始模型确定为待调整模型;
获取非通用数据集上的第二预设文档以及第二预设问题;
采用所述第二预设文档和所述第二预设问题对所述待调整模型进行训练,以最大化所述待调整模型的条件概率,并将条件概率最大化时的待调整模型确定为阅读理解模型。
3.根据权利要求1所述的基于人工智能的阅读理解方法,其特征在于,所述根据匹配的结果,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
根据匹配的结果,确定包含有所述关键词的目标段落;
统计所有所述目标段落和所述目标问题的第二总长度;
判断所述第二总长度是否超过所述最大输入长度;
若所述第二总长度不超过所述最大输入长度,将所有所述目标段落按照文档先后顺序进行衔接,以确定与所述目标问题相关的至少一个片段。
4.根据权利要求1所述的基于人工智能的阅读理解方法,其特征在于,所述根据匹配的结果,从所述目标文档中确定与所述目标问题相关的至少一个片段包括:
根据匹配的结果,获得每个所述段落的匹配度;
将匹配度高于预设匹配度阈值的段落确定为目标段落;
根据所述最大输入长度以及所述多个关键词,对每个所述目标段落进行长度处理,获得与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度。
5.根据权利要求1所述的基于人工智能的阅读理解方法,其特征在于,所述依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置包括:
获取每个所述问题片段组合的组合长度;
判断每个所述组合长度是否超过所述阅读理解模型的最大输入长度;
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,依次将每个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;或
若每个所述组合长度均不超过所述阅读理解模型的最大输入长度,根据每个组合长度,对多个问题片段组合进行分组,获得分组后的问题片段组合,其中,每个分组的问题片段组合的总长度均不超过所述最大输入长度;
按照分组,将每组的至少一个问题片段组合输入至所述阅读理解模型中,获得多个输出位置。
6.根据权利要求1所述的基于人工智能的阅读理解方法,其特征在于,所述依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置之后,所述基于人工智能的阅读理解方法还包括:
判断每个所述输出位置是否指向预设标记;
若每个所述输出位置均不指向预设标记,则触发所述将每个所述输出位置所指向的片段内容进行组合,获得最终答案的步骤。
7.根据权利要求6所述的基于人工智能的阅读理解方法,其特征在于,所述基于人工智能的阅读理解方法还包括:
若每个所述输出位置均指向预设标记,确定所述目标问题无答案。
8.一种基于人工智能的阅读理解装置,其特征在于,所述基于人工智能的阅读理解装置包括:
获取模块,用于获取需要进行阅读理解的目标文档以及与所述目标文档匹配的目标问题;
判断模块,用于判断所述目标文档和所述目标问题的第一总长度是否超过阅读理解模型的最大输入长度;
确定模块,用于若所述目标文档和所述目标问题的第一总长度超过阅读理解模型的最大输入长度,结合所述目标文档的上下文,从所述目标文档中确定与所述目标问题相关的至少一个片段,包括:使用预设分词算法,对所述目标问题进行分词,获得多个关键词;结合所述目标文档的上下文,将所述多个关键词分别与所述目标文档中的每个段落进行匹配;根据匹配的结果,从所述目标文档中确定与所述目标问题相关的至少一个片段,其中,每个所述片段的长度均不超过所述最大输入长度;
组合模块,用于将所述目标问题以及预设标记,分别与每个所述片段进行组合,获得至少一个问题片段组合,其中,所述预设标记用于指示无答案问题;
输入模块,用于依次将至少一个所述问题片段组合输入至所述阅读理解模型中,获得多个输出位置;
所述组合模块,还用于根据所述多个输出位置所指向的片段内容的条件概率从大到小的顺序,将所述多个输出位置所指向的片段内容进行组合,获得最终答案。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至7中任意一项所述的基于人工智能的阅读理解方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的基于人工智能的阅读理解方法。
CN202010601480.2A 2020-06-28 2020-06-28 基于人工智能的阅读理解方法及相关设备 Active CN111753521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010601480.2A CN111753521B (zh) 2020-06-28 2020-06-28 基于人工智能的阅读理解方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010601480.2A CN111753521B (zh) 2020-06-28 2020-06-28 基于人工智能的阅读理解方法及相关设备

Publications (2)

Publication Number Publication Date
CN111753521A CN111753521A (zh) 2020-10-09
CN111753521B true CN111753521B (zh) 2023-03-28

Family

ID=72677733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010601480.2A Active CN111753521B (zh) 2020-06-28 2020-06-28 基于人工智能的阅读理解方法及相关设备

Country Status (1)

Country Link
CN (1) CN111753521B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019242297A1 (zh) * 2018-06-21 2019-12-26 深圳壹账通智能科技有限公司 基于机器阅读理解的智能对话方法、装置、终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10372821B2 (en) * 2017-03-17 2019-08-06 Adobe Inc. Identification of reading order text segments with a probabilistic language model
CN110020009B (zh) * 2017-09-29 2023-03-21 阿里巴巴集团控股有限公司 在线问答方法、装置及系统
CN110647629B (zh) * 2019-09-20 2021-11-02 北京理工大学 一种多粒度答案排序的多文档机器阅读理解方法
CN111046158B (zh) * 2019-12-13 2020-12-15 腾讯科技(深圳)有限公司 问答匹配方法及模型训练方法、装置、设备、存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019242297A1 (zh) * 2018-06-21 2019-12-26 深圳壹账通智能科技有限公司 基于机器阅读理解的智能对话方法、装置、终端

Also Published As

Publication number Publication date
CN111753521A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN111695033B (zh) 企业舆情分析方法、装置、电子设备及介质
CN107798136B (zh) 基于深度学习的实体关系抽取方法、装置及服务器
CN108170792B (zh) 基于人工智能的问答引导方法、装置和计算机设备
CN109815487B (zh) 文本质检方法、电子装置、计算机设备及存储介质
CN112686036B (zh) 风险文本识别方法、装置、计算机设备及存储介质
CN111737499A (zh) 基于自然语言处理的数据搜索方法及相关设备
CN111061867B (zh) 基于质量感知的文本生成方法、设备、存储介质及装置
CN112257413B (zh) 地址参数处理方法及相关设备
CN111597309A (zh) 相似企业推荐方法、装置、电子设备及介质
CN112287069A (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN110321560B (zh) 一种从文本信息中确定位置信息的方法、装置及电子设备
CN111552800A (zh) 摘要生成方法、装置、电子设备及介质
CN107203265A (zh) 信息交互方法和装置
CN111190946A (zh) 报告生成方法、装置、计算机设备和存储介质
CN111639500A (zh) 语义角色标注方法、装置、计算机设备及存储介质
CN115100739B (zh) 人机行为检测方法、系统、终端设备及存储介质
CN110263345B (zh) 关键词提取方法、装置及存储介质
CN116719997A (zh) 政策信息推送方法、装置及电子设备
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN113535925B (zh) 语音播报方法、装置、设备及存储介质
CN113010785B (zh) 用户推荐方法及设备
CN113434631A (zh) 基于事件的情感分析方法、装置、计算机设备及存储介质
CN112199954A (zh) 基于语音语义的疾病实体匹配方法、装置及计算机设备
CN111753521B (zh) 基于人工智能的阅读理解方法及相关设备
CN113486169B (zh) 基于bert模型的同义语句生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant