CN106547742A - 基于人工智能的语义解析结果处理方法和装置 - Google Patents

基于人工智能的语义解析结果处理方法和装置 Download PDF

Info

Publication number
CN106547742A
CN106547742A CN201611089872.5A CN201611089872A CN106547742A CN 106547742 A CN106547742 A CN 106547742A CN 201611089872 A CN201611089872 A CN 201611089872A CN 106547742 A CN106547742 A CN 106547742A
Authority
CN
China
Prior art keywords
analysis result
parsing
analysis
semantic
weighted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611089872.5A
Other languages
English (en)
Other versions
CN106547742B (zh
Inventor
胡泽进
姚树杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201611089872.5A priority Critical patent/CN106547742B/zh
Publication of CN106547742A publication Critical patent/CN106547742A/zh
Priority to US15/637,419 priority patent/US10191900B2/en
Application granted granted Critical
Publication of CN106547742B publication Critical patent/CN106547742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能的语义解析结果处理方法和装置,其中,方法包括:根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;应用模式匹配算法检测解析结果的语义置信度;应用第一分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度;根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。该方法提高了评估语义解析结果质量的准确度。

Description

基于人工智能的语义解析结果处理方法和装置
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于人工智能的语义解析结果处理方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
随着作为自然语言处理核心技术的语义解析技术被广泛使用,语义解析结果的准确度越来越重要,它直接影响为用户提供的功能服务的质量,比如,在导航应用程序中,语义解析结果的准确率将会直接影响导航的准确度。
因此,如何有效提高评估语义解析结果的准确率,以便提供与解析文本匹配度高的语义解析结果,成为亟待解决的问题。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的语义解析结果处理方法,该方法提高了评估语义解析结果质量的准确度。
本发明的第二个目的在于提出一种基于人工智能的语义解析结果处理装置。
本发明的第三个目的在于提出另一种基于人工智能的语义解析结果处理装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为了实现上述目的,本发明第一方面实施例提出了一种基于人工智能的语义解析结果处理方法,包括以下步骤:
根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
应用模式匹配算法检测所述解析结果的语义置信度;
应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
本发明实施例的基于人工智能的语义解析结果处理方法,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,应用模式匹配算法检测解析结果的语义置信度,并应用相关分类模型确定解析文本的解析类型以及解析结果与解析文本对应的领域匹配置信度,进而根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。由此,在对解析结果质量进行评估时,综合考量权重值、语义置信度、解析类型和领域匹配置信度,提高了评估语义解析结果质量的准确度。
另外,本发明实施例的基于人工智能的语义解析结果处理方法,还具有如下附加的技术特征:
在本发明的一个实施例中,所述根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,包括:
获取所述解析文本的领域类型;
应用预设的与所述领域类型对应的权重配置信息确定所述解析文本在对应解析结果中的权重值。
在本发明的一个实施例中,所述根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据,包括:
应用预设的函数模型分别对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行归一化处理;
对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度的归一化处理结果求和,获取所述解析结果的解析质量数据。
在本发明的一个实施例中,所述根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据,包括:
应用预设的加权计算模型对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行加权计算,获取所述解析结果的解析质量数据。
在本发明的一个实施例中,本发明还包括将多个解析结果的解析质量数据与预设的质量门限值进行比较,删除不满足所述质量门限值的解析结果;
将满足所述质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
为了实现上述目的,本发明第二方面实施例提出了一种语义解析结果处理装置,包括:
第一确定模块,用于根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
检测模块,用于应用模式匹配算法检测所述解析结果的语义置信度;
第二确定模块,用于应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
获取模块,用于根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
本发明实施例的基于人工智能的语义解析结果处理装置,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,应用模式匹配算法检测解析结果的语义置信度,并应用相关分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度,进而根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。由此,在对解析结果质量进行评估时,综合考量权重值、语义置信度、解析类型和领域匹配置信度,提高了评估语义解析结果质量的准确度。
另外,本发明实施例的基于人工智能的语义解析结果处理,还具有如下附加的技术特征:
在本发明的一个实施例中,所述第一确定模块包括:
第一获取单元,用于获取所述解析文本的领域类型;
确定单元,用于应用预设的与所述领域类型对应的权重配置信息确定所述解析文本在对应解析结果中的权重值。
在本发明的一个实施例中,所述获取模块包括:
处理单元,用于应用预设的函数模型分别对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行归一化处理;
第二获取单元,用于对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度的归一化处理结果求和,获取所述解析结果的解析质量数据。
在本发明的一个实施例中,所述获取模块用于:
应用预设的加权计算模型对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行加权计算,获取所述解析结果的解析质量数据。
在本发明的一个实施例中,所述装置还包括:
比较模块,用于将多个解析结果的解析质量数据与预设的质量门限值进行比较;
处理模块,用于删除不满足所述质量门限值的解析结果;
所述处理模块还用于将满足所述质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
为了实现上述目的,本发明第三方面实施例提出了另一种基于人工智能的语义解析结果处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
应用模式匹配算法检测所述解析结果的语义置信度;
应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器被执行时,使得移动终端能够执行一种基于人工智能的语义解析结果处理方法,所述方法包括:
根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
应用模式匹配算法检测所述解析结果的语义置信度;
应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的语义解析结果处理方法,所述方法包括:
根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
应用模式匹配算法检测所述解析结果的语义置信度;
应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于人工智能的语义解析结果处理方法的流程图;
图2是根据本发明另一个实施例的基于人工智能的语义解析结果处理方法的流程图;
图3是根据本发明一个实施例的基于人工智能的语义解析结果处理装置的结构示意图;
图4是根据本发明另一个实施例的基于人工智能的语义解析结果处理装置的结构示意图;
图5是根据本发明又一个实施例的基于人工智能的语义解析结果处理装置的结构示意图;以及
图6是根据本发明再一个实施例的基于人工智能的语义解析结果处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的语义解析结果处理方法和装置。
通常,为了提高评估语义解析结果的准确率,采用匹配长度算法或者TF-IDF技术对语义解析结果进行质量评估。
其中,采用匹配长度算法对解析结果进行质量评估时,从解析结果左侧开始,不断匹配最长长度的词,直到将语义解析结果划分完成,进而通过划分完成的词与输入文本包含词之间的匹配度,评估解析结果的准确度,划分完成的词与输入文本包含词的匹配度越高,解析结果的准确率越高。
然而,采用匹配长度算法对解析结果进行质量评估的方式中,仅仅根据划分完成的词与输入文本包含词之间的匹配度,评估解析结果的准确度,没有考虑不同的划分词对语义的贡献程度,导致解析结果的准确率不高。
比如,当解析结果中划分完成的词包含“2016年”、“苹果”、“购买”、“数量”、“多少”时,与输入文本“2016年苹果手机购买的数量大约是多少”之间的相似度,虽然大于划分完成的词包含“2016年”、“苹果”、“手机”、“数量”时,与输入文本之间的相似度,但是由于“手机”对语义的贡献度较大,显然划分完成的词包含“2016年”、“苹果”、“手机”、“数量”的解析结果与输入文本更吻合。
另外,采用IF-IDF算法评估解析结果的准确率时,基于相关词出现的频率进行识别,无法有效区分噪音和无语义文本信息,对于误匹配的情况不能有效区分。
比如,针对输入文本“你好意思就意思这一点吗,你意思是就意思这一点吗,啥呀,你好歹多意思一点嘛”,解析结果为“你好意思就意思这么一点吗,你意思是就意思这一点吗,你啥意思呀你”,即使解析结果中词频较高的关键词“意思”,与输入文本中词频较高的关键词“意思”一致,但是显然解析结果所表达的语义,与输入文本的语义不一致。
为了解决上述评估解析结果的准确率不高的问题,本发明提出了一种基于人工智能的语义解析结果处理方法,基于多个方面考察语义解析结果与输入文本是否匹配,具体如下:
图1是根据本发明一个实施例的基于人工智能的语义解析结果处理方法的流程图。
如图1所示,该基于人工智能的语义解析结果处理方法可包括:
S101,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值。
可以理解,在实际应用中,即使有些解析文本的出现频率不高,但是其对于整个解析结果的主题思想的表达,作用较大,或者即使有些解析文本的出现频率较高,但是其对于整个解析结果的主题思想的表达,作用不大,或者有些解析文本的出现频率相近,但是对整个解析结果的主题思想的表达,作用也不同等。
比如,在解析结果“苹果手机在2016年的销售额是多少,它在2016年的手机销售额总量中的占比是多少,2016年的销量相较于2016年的之前的十年,是怎样的变化趋势”,虽然“2016”的频率高于“苹果手机”和“销售额”的频率,但是“苹果手机”和“销售额”,对解析结果的主题思想表达的贡献率较高。
其中,解析文本可以包括解析结果中的词、短语、长句等,根据具体应用需求的不同,提取解析文本的方式不同,比如,可以通过词性划分的方式,根据词性提取出对应的解析文本,又比如,可以通过专有名词识别的方式提取出对应的解析文本。
因而,为了准确分析解析结果,需要考虑解析文本在解析结果中的权重值。即根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,其中,预设的权重配置信息用以标注解析文本在解析结果中的权重,可以是预先根据大量实验训练的统计模型,或者是预先训练的确定权重的算法等。
需要说明的是,根据具体应用场景的不同,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值的方式不同,举例说明如下:
第一种示例,由于同一个解析文本,其所在领域类型不同,其对应的权重也不同,比如,对于解析文本“7”,其在属于手机领域中的解析结果:“苹果7的价位一般为多少”中的权重,相较于其在新闻领域中的解析结果:“预测2017年的双摄像头技术的发展”中的权重不同。
因而,可根据解析文本的领域类型确定权重,在实际执行过程中,可获取解析文本的领域类型,并应用预设的与领域类型对应的权重配置信息,确定解析文本在对应解析结果中的权重值。
其中,上述预设的权重配置信息是根据领域类型设置的、可标注解析文本权重的统计模型或预设算法等,该预设的权重配置信息中根据领域类型存储大量解析文本的权重值。
应当理解的是,在不同的应用场景中,获取解析文本类型的方式不同,比如,可预先根据大量实验训练解析文本分类模型,从而可通过将解析文本输入该分类模型获取解析文本类型。
第二种示例,对于解析文本,其所对应的词性类型不同,对应的权重也不同,比如,在解析文本“苹果7的价位一般为多少”中,名词性解析文本“苹果7”和“价位”的权重,和形容词性解析文本“一般”的权重明显不同。
因而,可根据解析文本的词性类型确定权重,在实际执行过程中,可获取解析文本的词性类型,并应用预设的与词性类型对应的权重配置信息,确定解析文本在对应解析结果中的权重值。
其中,上述预设的权重配置信息是根据词性类型设置的、可标注解析文本权重的统计模型、或预设算法等,该预设的权重配置信息中根据词性类型存储大量解析文本的权重值。
S102,应用模式匹配算法检测解析结果的语义置信度。
在实际应用中,解析结果中可能会出现大量没有语义的词,比如,出现“你好啊”等闲聊词等,因而为了准确分析解析结果,需要对解析结果的语义置信度进行检测。
具体而言,应用模式匹配算法检测解析结果的语义置信度。其中,模式匹配算法用以判断当前解析结果是否具有明显的语义及其可信度。
其中,根据具体应用需求的不同,应用模式匹配算法可包括不同内容,因而应用模式匹配算法检测解析结果的方式不同,举例说明如下:
作为一种示例,模式匹配算法中包括具有语义的白名单以及没有语义的黑白名单,从而将解析文本与上述白名单和黑名单进行匹配,并根据解析文本与黑名单和白名单的匹配数量和匹配度计算解析结果的语义置信度。
在本示例中,解析文本与白名单的匹配数量越高、匹配度越高,则语义解析结果的语义置信度越高,解析文本与黑名单的匹配数量越高、匹配度越高,则语义解析结果的语义置信度越低。
S103,应用第一分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度。
具体地,对解析结果分析的准确度,与解析文本对应的解析类型和领域(文体领域、数码领域、计算机领域等)相关,其中,解析类型包括解析结果全句匹配,部分解析文本匹配和全部解析文本匹配等,参与分析的解析结果占解析结果的占比越高,对解析结果分析的准确率越高。
具体而言,预先根据大量的样本数据,分别训练解析类型和领域的第一分类模型和第二分类模型,其中上述分类模型可包括判别分析模型、聚类分析模型等,从而应用第一分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度。
需要说明的是,上述应用第一分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度,可由现有技术实现,在此不再细述。
S104,根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。
具体地,综合考量权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的质量数据,其中,解析结果的质量数据可包括当前解析结果的准确度等,从而得到的解析结果质量数据可准确反映解析结果质量。
需要说明的是,根据具体应用场景的不同,根据权重值、语义置信度、解析类型和领域匹配置信度,获取解析结果的解析质量数据的方式不同,举例而言如下:
第一种示例,将权重值、语义置信度、解析类型和领域匹配置信度进行归一化处理,处理为统一格式或同一类别(比如百分制类别)的数据,进而对归一化处理后的数据进行相应的数学运算,以得到解析结果的解析质量数据。
在本示例中,对权重值、语义置信度、解析类型和领域匹配置信度的归一化处理结果求和,以获取解析结果的解析质量数据。
第二种示例,由于在实际操作过程中,权重值、语义置信度、解析类型和领域匹配置信度,对解析结果的解析质量的影响力不同,即针对评估解析质量的权重不同。
因而,在本示例中,根据大量实验数据训练加权计算模型,该加权计算模型中包括,分别针对权重值、语义置信度、解析类型和领域匹配置信度的权重值等,从而根据加权计算模型对权重值、语义置信度、解析类型和领域匹配置信度进行加权计算,获取解析结果的解析质量数据。
举例而言,在某个训练的加权计算模型中,针对权重值、语义置信度、解析类型和领域匹配置信度的权重值分别为α、β、γ和δ,该加权计算模型针对解析结果的解析质量数据采用以下加权运算公式得到:
score=α*p(term)+β*p(semantic)+γ*p(domain)+δ*p(pattern)+b
其中,p(term)表示被解析文本的权重值之和,p(semantic)表示语义置信度,p(domain)和p(pattern)表示解析类型和领域匹配置信度,b为修定解析质量数据的偏置。
综上所述,本发明实施例的基于人工智能的语义解析结果处理方法,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,应用模式匹配算法检测解析结果的语义置信度,并应用相关分类模型确定解析文本的解析类型,以及确定解析结果与解析文本对应的解析类型和领域匹配置信度,进而根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。由此,在对解析结果质量进行评估时,综合考量权重值、语义置信度、解析类型和领域匹配置信度,提高了评估语义解析结果质量的准确度。
基于以上实施例,应当理解的是,在实际应用中,针对一个应用场景的解析结果往往为多个,因而,需要根据得到的解析结果的解析质量数据,基于推荐最优原则,为用户反馈解析结果。
根据具体应用场景的不同,在得到多个解析结果的解析质量数据后,可采用多种方式向用户反馈解析结果,比如向用户反馈最优解析结果,向用户反馈解析质量前三位的解析结果,或者按照解析质量从高到底,向用户反馈解析质量较高多个解析结果。
为了更加清楚的说明,在得到多个解析结果的解析质量数据后,如何为用户反馈解析结果,下面以按照解析质量从高到底,向用户反馈解析质量较高的多个解析结果进行举例说明,说明如下:
图2是根据本发明另一个实施例的基于人工智能的语义解析结果处理方法的流程图,如图所示,在上述步骤S104之后,该方法包括:
S201,将多个解析结果的解析质量数据与预设的质量门限值进行比较,删除不满足质量门限值的解析结果。
可以理解,预先根据大量实验数据设置质量门限值,该质量门限值用以评估解析结果的解析质量,将多个解析结果的解析质量数据与预设的质量门限值进行比较,以评估解析结果的解析质量,从而删除不满足质量门限值的解析结果。
比如,当解析结果的解析质量数据大于等于该预设的质量门限值时,则表明该解析结果的解析质量较好,当解析结果的解析质量数据小于该预设的质量门限值时,则表明该解析结果的解析质量较差,删除该不满足质量门限值的解析结果。
S202,将满足质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
具体地,将满足质量门限值得多个解析结果进行排序,按照解析结果的解析质量从高到低进行排序,并按照排序结果向用户反馈多个解析结果,从而用户从上到下的阅读习惯,可直观的观看到解析质量较好的解析结果。
举例而言,根据解析结果的解析质量数据,与预设的质量门限值的差值的大小进行排序,解析质量数据越大于预设的质量门限值,差值越大,排序越靠前,解析质量越高,从而,用户可在反馈的多个解析结果中,直观的观看到解析质量较好的解析结果。
综上所述,本发明实施例的基于人工智能的语义解析结果处理方法,将多个解析结果的解析质量数据与预设的质量门限值进行比较,删除不满足质量门限值的解析结果,并将满足质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。由此,便于用户直观的观看到解析质量较好的解析结果,提高了语义解析的性能。
为了实现上述实施例,本发明还提出了一种基于人工智能的语义解析结果处理装置,图3是根据本发明一个实施例的基于人工智能的语义解析结果处理装置的结构示意图,如图3所示,该基于人工智能的语义解析结果处理装置包括:第一确定模块10、检测模块20、第二确定模块30和获取模块40。
其中,第一确定模块10,用于根据预设的权重配置信息确定解析文本在对应解析结果中的权重值。
在本发明的一个实施例中,图4是根据本发明另一个实施例的语义解析结果处理装置的结构示意图,如图4所示,在如图3所示的基础上,第一确定模块10包括第一获取单元11和确定单元12。
其中,第一获取单元11,用于获取解析文本的领域类型。
确定单元12,用于应用预设的与领域类型对应的权重配置信息确定解析文本在对应解析结果中的权重值。
检测模块20,用于应用模式匹配算法检测解析结果的语义置信度。
第二确定模块30,用于应用第一分类模型确定解析文本的解析类型,以及应用第二分类模型确定解析结果与解析文本对应的领域匹配置信度。
获取模块40,用于根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。
在本发明的一个实施例中,获取模块40应用预设的加权计算模型对权重值、语义置信度、解析类型和领域匹配置信度进行加权计算,获取解析结果的解析质量数据。
图5是根据本发明又一个实施例的语义解析结果处理装置的结构示意图,如图5所示,在如图3所示的基础上,获取模块40包括处理单元41和第二获取单元42。
其中,处理单元41,用于应用预设的函数模型分别对权重值、语义置信度、解析类型和领域匹配置信度进行归一化处理。
第二获取单元42,用于对权重值、语义置信度、解析类型和领域匹配置信度的归一化处理结果求和,获取解析结果的解析质量数据。
需要说明的是,前述对基于人工智能的语义解析结果处理方法的解释说明,也适用于本发明实施例的基于人工智能的语义解析结果处理装置,本发明基于人工智能的语义解析结果处理装置实施例中未披露的细节,在此不再赘述。
综上所述,本发明实施例的基于人工智能的语义解析结果处理装置,根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,应用模式匹配算法检测解析结果的语义置信度,并应用相关分类模型确定解析结果的解析类型,以及解析结果与解析文本对应的领域匹配置信度,进而根据权重值、语义置信度、解析类型和领域匹配置信度获取解析结果的解析质量数据。由此,在对解析结果质量进行评估时,综合考量权重值、语义置信度、解析类型和领域匹配置信度,提高了评估语义解析结果质量的准确度。
图6是根据本发明再一个实施例的基于人工智能的语义解析结果处理装置的结构示意图,如图6所示,在如图3所示的基础上,该基于人工智能的语义解析结果处理装置还包括比较模块50和处理模块60。
其中,比较模块50,用于将多个解析结果的解析质量数据与预设的质量门限值进行比较。
处理模块60,用于删除不满足质量门限值的解析结果。
在本发明的一个实施例中,处理模块60还用于将满足质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
需要说明的是,前述对基于人工智能的语义解析结果处理方法的解释说明,也适用于本发明实施例的基于人工智能的语义解析结果处理装置,本发明基于人工智能的语义解析结果处理装置实施例中未披露的细节,在此不再赘述。
综上所述,本发明实施例的基于人工智能的语义解析结果处理装置,将多个解析结果的解析质量数据与预设的质量门限值进行比较,删除不满足质量门限值的解析结果,并将满足质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。由此,便于用户直观的观看到解析质量较好的解析结果,提高了语义解析的性能。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于人工智能的语义解析结果处理方法,其特征在于,包括以下步骤:
根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
应用模式匹配算法检测所述解析结果的语义置信度;
应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
2.如权利要求1所述的方法,其特征在于,所述根据预设的权重配置信息确定解析文本在对应解析结果中的权重值,包括:
获取所述解析文本的领域类型;
应用预设的与所述领域类型对应的权重配置信息确定所述解析文本在对应解析结果中的权重值。
3.如权利要求1所述的方法,其特征在于,所述根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据,包括:
应用预设的函数模型分别对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行归一化处理;
对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度的归一化处理结果求和,获取所述解析结果的解析质量数据。
4.如权利要求1所述的方法,其特征在于,所述根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据,包括:
应用预设的加权计算模型对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行加权计算,获取所述解析结果的解析质量数据。
5.如权利要求1-4任一所述的方法,其特征在于,还包括:
将多个解析结果的解析质量数据与预设的质量门限值进行比较,删除不满足所述质量门限值的解析结果;
将满足所述质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
6.一种基于人工智能的语义解析结果处理装置,其特征在于,包括:
第一确定模块,用于根据预设的权重配置信息确定解析文本在对应解析结果中的权重值;
检测模块,用于应用模式匹配算法检测所述解析结果的语义置信度;
第二确定模块,用于应用第一分类模型确定所述解析文本的解析类型,以及应用第二分类模型确定所述解析结果与所述解析文本对应的领域匹配置信度;
获取模块,用于根据所述权重值、所述语义置信度、所述解析类型和领域匹配置信度获取所述解析结果的解析质量数据。
7.如权利要求6所述的装置,其特征在于,所述第一确定模块包括:
第一获取单元,用于获取所述解析文本的领域类型;
确定单元,用于应用预设的与所述领域类型对应的权重配置信息确定所述解析文本在对应解析结果中的权重值。
8.如权利要求6所述的装置,其特征在于,所述获取模块包括:
处理单元,用于应用预设的函数模型分别对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行归一化处理;
第二获取单元,用于对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度的归一化处理结果求和,获取所述解析结果的解析质量数据。
9.如权利要求6所述的装置,其特征在于,所述获取模块用于:
应用预设的加权计算模型对所述权重值、所述语义置信度、所述解析类型和领域匹配置信度进行加权计算,获取所述解析结果的解析质量数据。
10.如权利要求6-9任一所述的装置,其特征在于,还包括:
比较模块,用于将多个解析结果的解析质量数据与预设的质量门限值进行比较;
处理模块,用于删除不满足所述质量门限值的解析结果;
所述处理模块还用于将满足所述质量门限值的多个解析结果进行排序,按照排序结果向用户反馈多个解析结果。
CN201611089872.5A 2016-11-30 2016-11-30 基于人工智能的语义解析结果处理方法和装置 Active CN106547742B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201611089872.5A CN106547742B (zh) 2016-11-30 2016-11-30 基于人工智能的语义解析结果处理方法和装置
US15/637,419 US10191900B2 (en) 2016-11-30 2017-06-29 Method and apparatus for processing semantic analysis result based on artificial intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611089872.5A CN106547742B (zh) 2016-11-30 2016-11-30 基于人工智能的语义解析结果处理方法和装置

Publications (2)

Publication Number Publication Date
CN106547742A true CN106547742A (zh) 2017-03-29
CN106547742B CN106547742B (zh) 2019-05-03

Family

ID=58396193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611089872.5A Active CN106547742B (zh) 2016-11-30 2016-11-30 基于人工智能的语义解析结果处理方法和装置

Country Status (2)

Country Link
US (1) US10191900B2 (zh)
CN (1) CN106547742B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052686A (zh) * 2018-01-26 2018-05-18 腾讯科技(深圳)有限公司 一种摘要提取方法及相关设备
CN109190116A (zh) * 2018-08-15 2019-01-11 苏州思必驰信息科技有限公司 语义解析方法、系统、电子设备及存储介质
CN109615266A (zh) * 2018-12-26 2019-04-12 贵州电网有限责任公司 基于数据挖掘的电网异常信息的文本分析决策方法
CN112528705A (zh) * 2019-09-17 2021-03-19 同方威视技术股份有限公司 基于语义的图像识别系统及其方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10579628B2 (en) * 2015-12-17 2020-03-03 The Nielsen Company (Us), Llc Media names matching and normalization
CN110444193B (zh) * 2018-01-31 2021-12-14 腾讯科技(深圳)有限公司 语音关键词的识别方法和装置
CN109410069A (zh) * 2018-09-03 2019-03-01 平安医疗健康管理股份有限公司 结算数据处理方法、装置、计算机设备和存储介质
US20210319098A1 (en) * 2018-12-31 2021-10-14 Intel Corporation Securing systems employing artificial intelligence
CN109918645B (zh) * 2019-01-28 2022-12-02 平安科技(深圳)有限公司 深度分析文本的方法、装置、计算机设备和存储介质
CN109871446B (zh) * 2019-01-31 2023-06-06 平安科技(深圳)有限公司 意图识别中的拒识方法、电子装置及存储介质
CN111325024B (zh) * 2020-01-21 2023-05-16 南方电网能源发展研究院有限责任公司 一种风险项目统计方法
US20230289854A1 (en) * 2022-03-11 2023-09-14 Tredence Inc. Multi-channel feedback analytics for presentation generation
CN115221893B (zh) * 2022-09-21 2023-01-13 中国电子信息产业集团有限公司 基于规则与语义分析的质检规则自动化配置方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464898A (zh) * 2009-01-12 2009-06-24 腾讯科技(深圳)有限公司 一种提取文本主题词的方法
CN102043843A (zh) * 2010-12-08 2011-05-04 百度在线网络技术(北京)有限公司 一种用于基于目标应用获取目标词条的方法与获取设备
CN103793434A (zh) * 2012-11-02 2014-05-14 北京百度网讯科技有限公司 一种基于内容的图片搜索方法和装置
CN104268160A (zh) * 2014-09-05 2015-01-07 北京理工大学 一种基于领域词典和语义角色的评价对象抽取方法
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及系统
CN104731918A (zh) * 2015-03-25 2015-06-24 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
US20160148612A1 (en) * 2014-11-26 2016-05-26 Voicebox Technologies Corporation System and Method of Determining a Domain and/or an Action Related to a Natural Language Input
CN105786793A (zh) * 2015-12-23 2016-07-20 百度在线网络技术(北京)有限公司 解析口语文本信息的语义的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5799276A (en) * 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US6965900B2 (en) * 2001-12-19 2005-11-15 X-Labs Holdings, Llc Method and apparatus for electronically extracting application specific multidimensional information from documents selected from a set of documents electronically extracted from a library of electronically searchable documents
US6886010B2 (en) * 2002-09-30 2005-04-26 The United States Of America As Represented By The Secretary Of The Navy Method for data and text mining and literature-based discovery
US8468244B2 (en) * 2007-01-05 2013-06-18 Digital Doors, Inc. Digital information infrastructure and method for security designated data and with granular data stores
US8385971B2 (en) * 2008-08-19 2013-02-26 Digimarc Corporation Methods and systems for content processing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464898A (zh) * 2009-01-12 2009-06-24 腾讯科技(深圳)有限公司 一种提取文本主题词的方法
CN102043843A (zh) * 2010-12-08 2011-05-04 百度在线网络技术(北京)有限公司 一种用于基于目标应用获取目标词条的方法与获取设备
CN103793434A (zh) * 2012-11-02 2014-05-14 北京百度网讯科技有限公司 一种基于内容的图片搜索方法和装置
CN104268160A (zh) * 2014-09-05 2015-01-07 北京理工大学 一种基于领域词典和语义角色的评价对象抽取方法
US20160148612A1 (en) * 2014-11-26 2016-05-26 Voicebox Technologies Corporation System and Method of Determining a Domain and/or an Action Related to a Natural Language Input
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及系统
CN104731918A (zh) * 2015-03-25 2015-06-24 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN105786793A (zh) * 2015-12-23 2016-07-20 百度在线网络技术(北京)有限公司 解析口语文本信息的语义的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052686A (zh) * 2018-01-26 2018-05-18 腾讯科技(深圳)有限公司 一种摘要提取方法及相关设备
CN109190116A (zh) * 2018-08-15 2019-01-11 苏州思必驰信息科技有限公司 语义解析方法、系统、电子设备及存储介质
CN109190116B (zh) * 2018-08-15 2023-10-24 思必驰科技股份有限公司 语义解析方法、系统、电子设备及存储介质
CN109615266A (zh) * 2018-12-26 2019-04-12 贵州电网有限责任公司 基于数据挖掘的电网异常信息的文本分析决策方法
CN109615266B (zh) * 2018-12-26 2022-11-04 贵州电网有限责任公司 基于数据挖掘的电网异常信息的文本分析决策方法
CN112528705A (zh) * 2019-09-17 2021-03-19 同方威视技术股份有限公司 基于语义的图像识别系统及其方法

Also Published As

Publication number Publication date
US10191900B2 (en) 2019-01-29
US20180150455A1 (en) 2018-05-31
CN106547742B (zh) 2019-05-03

Similar Documents

Publication Publication Date Title
CN106547742A (zh) 基于人工智能的语义解析结果处理方法和装置
CN112270196B (zh) 实体关系的识别方法、装置及电子设备
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN105893478B (zh) 一种标签提取方法及设备
US11138250B2 (en) Method and device for extracting core word of commodity short text
CN110348214B (zh) 对恶意代码检测的方法及系统
CN107391575A (zh) 一种基于词向量模型的隐式特征识别方法
CN108628868B (zh) 文本分类方法和装置
CN106897559A (zh) 一种面向多数据源的症状体征类实体识别方法及装置
CN110309114A (zh) 媒体信息的处理方法、装置、存储介质和电子装置
CN110895568B (zh) 处理庭审记录的方法和系统
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN106649276B (zh) 标题中核心产品词的识别方法以及装置
CN110955750A (zh) 评论区域和情感极性的联合识别方法、装置、电子设备
CN110472040A (zh) 评价信息的提取方法及装置、存储介质、计算机设备
CN106528538A (zh) 智能识别情绪的方法及装置
CN109766419A (zh) 基于语音分析的产品推荐方法、装置、设备及存储介质
CN109816438A (zh) 信息推送方法及装置
CN110377739A (zh) 文本情感分类方法、可读存储介质和电子设备
CN113010657A (zh) 基于解答文本的答案处理方法和答案推荐方法
CN112463922A (zh) 一种风险用户识别方法及存储介质
CN107622042A (zh) 一种文书生成方法、装置、存储介质和电子设备
CN112767386A (zh) 基于主题特征和评分分布的图像美学质量评价方法及系统
CN114418320A (zh) 客服服务质量评估方法、装置、设备、介质和程序产品
CN109753646B (zh) 一种文章属性识别方法以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant