CN111460118B - 一种人工智能冲突语义识别方法及装置 - Google Patents

一种人工智能冲突语义识别方法及装置 Download PDF

Info

Publication number
CN111460118B
CN111460118B CN202010224374.7A CN202010224374A CN111460118B CN 111460118 B CN111460118 B CN 111460118B CN 202010224374 A CN202010224374 A CN 202010224374A CN 111460118 B CN111460118 B CN 111460118B
Authority
CN
China
Prior art keywords
semantic
text
conflict
vector
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010224374.7A
Other languages
English (en)
Other versions
CN111460118A (zh
Inventor
蔡効谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juhaokan Technology Co Ltd
Original Assignee
Juhaokan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juhaokan Technology Co Ltd filed Critical Juhaokan Technology Co Ltd
Priority to CN202010224374.7A priority Critical patent/CN111460118B/zh
Publication of CN111460118A publication Critical patent/CN111460118A/zh
Application granted granted Critical
Publication of CN111460118B publication Critical patent/CN111460118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种人工智能冲突语义识别方法及装置,识别人机交互时产生的语义文本,获得发生语义冲突的语义对应的多个候选类别;利用预训练语言模型分别对语义文本和每个候选类别进行计算,得到冲突文本语义向量和每个分类语义向量,计算冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;将多个候选类别按照类别优先顺序标注在语义文本中发生语义冲突的语义上。可见,本发明提供的方法及装置,通过比较语义向量相似度,将冲突语义归纳成大众共识的意图类型,并产生大众共识的通用标注,使得利用预训练语言模型可以对一个词或一句话进行自动归类,保证机器可以准确识别人类的意图,得到准确的交互结果。

Description

一种人工智能冲突语义识别方法及装置
技术领域
本申请涉及人工智能在自然语义处理领域,尤其涉及一种人工智能冲突语义识别方法及装置。
背景技术
人工智能(英语:Artificial Intelligence,缩写为AI),指由人制造出来的机器所表现出来的智能,通常人工智能是指通过普通计算机程序来呈现人类智能的技术。人工智能包括交互式人工智能(Conversational AI,CoAI),即人与机器通过对话、交互(人机交互)体现出来的智能行为,通常采用人工智能技术的智能系统通过与用户或环境进行交互,并在交互中实现学习与建模。人机交互是人工智能最具挑战性、最综合性的技术,涵盖语义理解、知识表示、语言生成、逻辑与推理等各个方面。
交互式人工智能主要包括但不限于以下几个方面的研究:泛问答系统,包括自动问答、阅读理解等;任务或目标型的对话系统;开放领域的闲聊系统和搜索应用等。在进行人机交互时,通常人对机器进行提问或提出诉求,由机器基于人提出的问题进行回答,如提供答案、搜索结果等。但是,由于人机交互时产生的语义文本可能会对应多种不同的意图,使得人类与机器对话存在语义冲突的情况。由于机器并没有人类的常识,无法进行语义修正或排序,无法在多种意图中选出人类想询问的那一个,导致机器无法对人类提出的问题给出人类感兴趣的回答。
例如,人机交互的语义文本为“我要看周星驰的电影”,则产生的意图类型包括(1)周星驰是导演的电影,(2)周星驰是演员的电影;再例如,人机交互的语义文本为“我要看三生三世十里桃花”,则产生的意图类型包括(1)三生三世十里桃花是电视剧,(2)三生三世十里桃花是电影。可见,在同一语义文本中,不同的意图类型会产生不同的交互结果。为了识别不同的意图类型来得到准确的交互结果,在目前运行的各种AI应用中,通常采用标注意图类型的方法区分不同意图。
以“我要看周星驰的电影”为例,标注方法在不同AI应用的场景包括:(一)命名实体识别:由于将“周星驰”标注成导演还是演员,因人而异,因此标注成泛化的人名。但是,该方法只能判断出周星驰是人名,无法细化。(二)搜索应用:将“周星驰”作为导演与演员对应的作品都进行搜索。但是搜索没有优先权的概念,导致搜索结果过多,无法确定人类感兴趣的那一个。(三)问答系统:使用多轮问答,确认用户意图,以确定搜索“演员”还是“导演”,即提供选项让用户选择,要搜索演员还是导演,但是交互过程较为复杂,体验不好。
可见,在进行人机交互时,由于机器不具备常识,在人类对应的语义文本存在冲突语义时,机器无法识别模糊意图,导致在采用标注方法进行区分意图类型时,无法进行准确的识别。
发明内容
本申请提供了一种人工智能冲突语义识别方法及装置,以解决现有的人工智能机器在语义存在冲突时无法进行准确识别的问题。
第一方面,本申请提供了一种人工智能冲突语义识别方法,包括以下步骤:
获取人机交互时产生的语义文本;
识别所述语义文本,获得所述语义文本中发生语义冲突的语义对应的多个候选类别;
利用预训练语言模型分别对所述语义文本和每个候选类别进行计算,得到所述语义文本对应的冲突文本语义向量和每个候选类别对应的分类语义向量,所述预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量;
计算所述冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;
将多个候选类别按照所述类别优先顺序标注在所述语义文本中发生语义冲突的语义上,以按照所述类别优先顺序获得与所述语义文本对应的交互结果。
进一步地,所述识别语义文本,获得所述语义文本发生语义冲突时对应的多个候选类别,包括:
获取所述语义文本的语义;
判断每个语义是否存在意图冲突,将所述语义中产生意图冲突的语义作为冲突语义,所述冲突语义是指产生多种意图的语义;
利用文本分类模型对所述冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
进一步地,所述利用预训练语言模型对每个候选类别进行计算,得到每个分类语义向量,包括:
在所述分类词典中,选取同一候选类别对应的多个语义名称;
将多个所述语义名称输入所述预训练语言模型进行计算,得到多个名称语义向量,一个所述语义名称对应一个名称语义向量;
计算多个所述名称语义向量的向量均值,将所述向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
进一步地,所述利用预训练语言模型对每个候选类别进行计算,得到每个分类语义向量,包括:
获取每个所述候选类别对应的文本,所述候选类别与所述文本一一对应;
将指定文本输入所述预训练语言模型中,输出所述指定文本对应的分类语义向量。
进一步地,所述计算所述冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序,包括:
计算所述冲突文本语义向量分别与每个分类语义向量的相似度,确定多个语义相似度;
将多个所述语义相似度按照由高到底进行排序,得到类别优先顺序。
第二方面,本申请提供一种人工智能冲突语义识别装置,包括:
语义文本获取模块,用于获取人机交互时产生的语义文本;
候选类别确定模块,用于识别所述语义文本,获得所述语义文本中发生语义冲突的语义对应的多个候选类别;
语义向量计算模块,用于利用预训练语言模型分别对所述语义文本和每个候选类别进行计算,得到所述语义文本对应的冲突文本语义向量和每个候选类别对应的分类语义向量,所述预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量;
类别优先顺序确定模块,用于计算所述冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;
冲突语义标注模块,用于将多个候选类别按照所述类别优先顺序标注在所述语义文本中发生语义冲突的语义上,以按照所述类别优先顺序获得与所述语义文本对应的交互结果。
进一步地,所述候选类别确定模块,包括:
语义获取单元,用于获取所述语义文本的语义;
冲突语义确定单元,用于判断每个语义是否存在意图冲突,将所述语义中产生意图冲突的语义作为冲突语义,所述冲突语义是指产生多种意图的语义;
候选类别确定单元,用于利用文本分类模型对所述冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
进一步地,所述语义向量计算模块,包括:
语义名称选取单元,用于在所述分类词典中,选取同一候选类别对应的多个语义名称;
名称语义向量确定单元,用于将多个所述语义名称输入所述预训练语言模型进行计算,得到多个名称语义向量,一个所述语义名称对应一个名称语义向量;
第一语义向量计算单元,用于计算多个所述名称语义向量的向量均值,将所述向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
进一步地,其特征在于,所述语义向量计算模块,包括:
文本获取单元,用于获取每个所述候选类别对应的文本,所述候选类别与所述文本一一对应;
第二语义向量计算单元,用于将指定文本输入所述预训练语言模型中,输出所述指定文本对应的分类语义向量。
进一步地,所述类别优先顺序确定模块,包括:
相似度计算单元,用于计算所述冲突文本语义向量分别与每个分类语义向量的相似度,确定多个语义相似度;
类别优先顺序确定单元,用于将多个所述语义相似度按照由高到底进行排序,得到类别优先顺序。
由以上技术方案可知,本发明实施例提供的一种人工智能冲突语义识别方法及装置,识别人机交互时产生的语义文本,获得语义文本中发生语义冲突的语义对应的多个候选类别;利用预训练语言模型分别对语义文本和每个候选类别进行计算,得到冲突文本语义向量和每个分类语义向量,计算冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;将多个候选类别按照类别优先顺序标注在语义文本中发生语义冲突的语义上,以按照类别优先顺序获得交互结果。可见,本发明实施例提供的方法及装置,通过比较语义向量距离远近(相似度)的方式,将冲突语义自动归纳成大众共识的那一个意图类型,并对冲突语义产生大众会有共识的通用标注,符合大众习惯,使得利用预训练语言模型可以对一个词或一句话进行自动归类,以倾向人类的需求,进而保证机器可以准确识别人类的意图,得到准确的交互结果。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据示例性实施例中人工智能冲突语义识别方法的流程图;
图2中示例性示出了根据示例性实施例中获得候选类别的方法流程图;
图3中示例性示出了根据示例性实施例中计算候选类别语义向量的一种方法流程图;
图4中示例性示出了根据示例性实施例中计算候选类别语义向量的一种示意图;
图5中示例性示出了根据示例性实施例中计算候选类别语义向量的另一种方法流程图;
图6中示例性示出了根据示例性实施例中计算候选类别语义向量的另一种示意图;
图7中示例性示出了根据示例性实施例中确定类别优先顺序的方法流程图;
图8中示例性示出了根据示例性实施例中人工智能冲突语义识别装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
同一语义文本可能会产生不同的意图,但依据人类的生活和常识,可以联想到人类更倾向的那个意图。例如,如果从人类的角度来看,周星驰的电影,会优先想到周星驰演的电影,而周星驰导的电影意图较弱。三生三世十里桃花,会优先想到电视剧,较不会联想到电影。这是因为人类具备生活以及语言的常识,我们常常接触的语言文字,较多的是周星驰演的作品,三生三世十里桃花的电视剧。因此,即使人与人对话中的语义意图不明,我们也能优先联想到一般人认为的意图类型。
但在人类与人工智能机器进行交互时,由于机器没有人类的常识,因此无法分辨出人类最感兴趣的那个意图,产生语义冲突现象。而人工智能的好坏,取决于人工整理多少训练数据,如果整理的训练数据过少,以及机器不具有人类的常识,使得机器在语义理解时缺乏标准数据,无法获得准确的理解结果。
因此,为了解决机器不具备常识,无法识别模糊意图的现况。本发明提供一种人工智能冲突语义识别方法,使用基于人类语言使用习惯产生的预训练语言模型(Pre-trainedLanguage Model),建立出意图分类的语义向量。当由用户语言提供的语义不明确时,使用产生用户意图冲突的冲突文本语义向量与分类语义向量的相似度,进行人类常识的确认,使得机器可以根据预训练语言模型的常识进行多语义的决策。使人工智能机器具备常识,在不同的AI应用中,可以识别出用户问答或搜索的意图,使AI语音问答,以及视频搜索结果更准确。
预训练语言模型是使用大量的人类文章,预先训练的一个机器学习语言模型,使相同语义的文本,可产生相近的语义向量。利用此语义向量,可使自然语言理解的各种任务,具备较好的语义理解效果。
预训练语言模型的训练方法有多种,以Bidirectional Encoder Representationfrom Transformers(BERT)为例子,BERT学习千万条百科全书的语言习惯,使得同样语义的输入,具有相似的语义表示向量。语义表示向量,是以一系列的浮点数,作为语言的语义。将人类的语言转换成一系列的浮点数,作为语义,使得语义可被计算。相同语义的文字,具备相似的浮点数序列。
BERT预训练语言模型基础版本,会将每个字(Token),转换成长度为768的浮点数,作为一个字的语义,使得语义可被计算。若一句话有10个字,则使用768×10个浮点数,作为一句话的语义。预训练语言模型产生的语义,可用来作为后续AI语义理解模型(文本分类,命名实体识别,序列标注模型等)的语义输入。
但是,预训练语言模型只能确认两个词是否语义上接近,无法分辨从语义向量直接反转成人类的语言。举例:周星驰三个字,可换成语义向量:[0.23,-1.23,3.23…,2.123],但无法将[0.23,-1.23,3.23…,2.123]转换成周星驰的同义词。
为解决预训练语言模型无法直接输出分类标注结果的现况,本发明实施例提供的一种人工智能冲突语义识别方法,在利用预训练语言模型进行冲突语义的标注时,通过比较语义向量距离远近的方式,将文本数据自动归纳成大众共识的方法,使得利用预训练语言模型可以对一个词,或一句话,进行自动归类,以倾向人类的需求,得到准确的交互结果。可见,本发明实施例提供的方法,当训练数据标注有冲突,或有争议时,可自动的产生一般大众会有共识的通用标注,符合大众习惯。例如,周星驰,可自动标注成演员,而非导演。谢霆锋,由于最近在网络上的语言习惯,较接近厨师,因此会自动识别为厨师。
图1中示例性示出了根据示例性实施例中人工智能冲突语义识别方法的流程图。具体地,参见图1,本发明实施例提供的一种人工智能冲突语义识别方法,由人工智能机器执行,包括以下步骤:
S1、获取人机交互时产生的语义文本。
人类在与人工智能机器进行交互时,人类会利用语言的方式与机器进行交互,机器接收到人类的语言后,转换为语义文本,以进行语义理解,并给出与语义文本对应的交互结果。
S2、识别语义文本,获得语义文本中发生语义冲突的语义对应的多个候选类别。
为使机器理解的语义文本更符合人类大众的常识,本实施例中,可先对语义文本进行语义冲突识别,以对语义文本进行归类,符合大众习惯,进而确定出产生语义冲突的不同候选类别。候选类别是指同一语义产生不同的意图所对应的类别,一个意图对应一个类别。
机器在对语义文本进行语义理解时,语义文本中会存在产生多个意图的语义,使得机器发生意图的决策冲突,此时,为使机器能够准确地对语义文本进行理解,可先取得产生语义冲突的语义对应的候选类别。
图2中示例性示出了根据示例性实施例中获得候选类别的方法流程图。本实施例中,参见图2,识别语义文本,获得语义文本发生语义冲突时对应的多个候选类别,包括:
S21、获取语义文本的语义。
每个语义文本可由多个语义组成,例如,语义文本“我要看周星驰的电影”中,可以得到语义“周星驰”和“电影”等。
S22、判断每个语义是否存在意图冲突,将语义中产生意图冲突的语义作为冲突语义,冲突语义是指产生多种意图的语义。
由于在语义发生冲突时,机器无法进行准确的语义理解。因此,机器先根据语义文本中的不同语义进行判断,判断每一个语义是否存在意图冲突。判断语义是否存在意图冲突就是判断同一个语义中是否存在不同的理解,将产生不同理解的语义确定为冲突语义。
例如,用户与人工智能机器交互时产生的语义文本“双12我要买苹果”,其中的语义“苹果”可能是手机品牌或者水果。由于对“苹果”可以产生两种理解,即两种意图,即可确定语义“苹果”产生意图冲突,将“苹果”作为冲突语义。
S23、利用文本分类模型对冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
一个冲突语义会存在至少两个意图类型,利用文本分类模型对冲突语义的不同意图进行识别,即可确定每个意图的候选类别。文本分类模型可为数据库、分类模型或命名实体识别模型,文本分类模型中存储有大量的类别,每个类别对应一个意图。
范例一:用户说,“双12我要买苹果”,冲突语义为“苹果”,此时机器可利用数据库搜索或分类模型识别出,“苹果”可能产生两个理解,即两个意图,分别为[手机,水果]两类。因此,确定冲突语义为“苹果”的候选类别即为[手机,水果]两类,“手机”为一类,“水果”为一类。
范例二:用户说,“我要看周星驰的电影”,冲突语义为“周星驰”,此时机器可利用数据库搜索或文本分类模型或命名实体识别模型识别出,“周星驰”可能产生三个理解,即三个意图,分别为[演员,导演,编剧]。因此,确定冲突语义为“周星驰”的候选类别即为[演员,导演,编剧]三类,“演员”为一类,“导演”为一类,“编剧”为一类。
对冲突语义的不同意图进行分类,即为一个词或一句话的分类。以“周星驰的电影”为例,假设应用需区分周星驰是[演员,导演,编剧],则决策分类为[演员,导演,编剧]三类,确定候选类别为[演员,导演,编剧]三类。
S3、利用预训练语言模型分别对语义文本和每个候选类别进行计算,得到语义文本对应的冲突文本语义向量和每个候选类别对应的分类语义向量,预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量。
为了对发生意图冲突的语义进行准确标注,以使机器能够进行准确识别并获得准确的交互结果,本实施例中,利用预训练语言模型对每个候选类别进行语义向量的计算,通过比较语义向量距离远近(相似度)的方式,将冲突语义自动归纳成大众共识的那一个意图。
预训练语言模型是一个使用互联网大量文本所训练出来的语言模型,输入为文本,输出为语义表示向量。为实现语义向量的比较,由预训练语言模型对语义文本和冲突语义的每个候选类别分别进行计算,得到冲突文本语义向量和分类语义向量。
例如,由预训练语言模型计算每个决策分类的语义向量,即计算出[演员,导演,编剧]三个分类各自的语义表示向量,得到三个分类语义向量,分别对应演员、导演和编剧。
由于人类的语言使用习惯,会随时代而改变。周星驰的作品,是指导演还是演员,也会随时代改变。而本发明使用语言模型,来源是人的语言使用习惯,因此可随不同时代语言的习惯,改变常识,即预训练模型会随时代而改变,不断学习新的人类语言使用习惯,形成符合最新时代大众常识的新预训练语言模型。
由于预训练语言模型是多数人的共有文字训练出来的语义习惯,因此语义向量表示距离较近的数据,代表是社会大众的语言共识。因此本实施例提供的预训练语言模型,可以产生自动标注语义类型,具备大众的共识,且可随大众常识的改变而更新,解决自然语言处理的训练数据标注,因人而异,难以训练的现况。
具体地,本实施例在计算人机交互产生的语义文本的冲突文本语义向量时,可直接将发生语义冲突的语义文本输入到预训练语言模型中,直接输出冲突文本语义向量。
例如,以我要看周星驰的电影为例,将语义文本“我要看周星驰的电影”输入到预训练语言模型,产生向量Vc,为了简化说明,假设Vc=[0.28,-1.22,0.92,-1.11]。
图3中示例性示出了根据示例性实施例中计算候选类别语义向量的一种方法流程图;图4中示例性示出了根据示例性实施例中计算候选类别语义向量的一种示意图。本实施例提供两种由预训练语言模型计算候选类别的分类语义向量的方法,具体还可根据实际情况采用其他方法,本实施例不做具体限定。
在其中一种可行的具体实施方式中,参见图3,本实施例中,利用预训练语言模型对每个候选类别进行计算,得到每个分类语义向量,包括:
S311、在分类词典中,选取同一候选类别对应的多个语义名称。
S312、将多个语义名称输入预训练语言模型进行计算,得到多个名称语义向量,一个语义名称对应一个名称语义向量。
S313、计算多个名称语义向量的向量均值,将向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
在确定某个候选类别的分类语义向量,可由同属于该候选类别的其他语义进行确定,具体地,在分类词典中,确定该候选类别中的多个语义名称,选出的多个语义名称中包括基于语义文本的冲突语义名称。分类词典内存储有多个不同候选类别的不同语义名称,同一候选类别对应多个不同的语义名称。
本实施例提供的计算方法是使用分类词典的K个词,产生K个分类语义向量;再计算K个分类语义向量的均值或是向量的中心,作为该分类的代表向量,即该候选类别的分类语义向量。
将每个语义名称对应的文本分别输入预训练语言模型,输出对应的名称语义向量,语义名称与名称语义向量一一对应,将计算得到的多个名称语义向量的向量均值作为该候选类别的分类语义向量。
例如,如图4所示,以候选类别“导演”为例,在分类词典中,选出K个语义名称,即导演名称“成龙、周星驰、陈思诚……李安”。将K个导演名称对应的文本作为输入,由预训练语言模型计算产生K个语义表示向量,作为名称语义向量。计算出K个名称语义向量的均值,或是向量的中心,作为此候选类别“导演”的分类语义向量。
图5中示例性示出了根据示例性实施例中计算候选类别语义向量的另一种方法流程图;图6中示例性示出了根据示例性实施例中计算候选类别语义向量的另一种示意图。在另一种可行的具体实施方式中,参见图5和图6,本实施例中,利用预训练语言模型对每个候选类别进行计算,得到每个分类语义向量,包括:
S321、获取每个候选类别对应的文本,候选类别与文本一一对应。
S322、将指定文本输入预训练语言模型中,输出指定文本对应的分类语义向量。
本实施例在计算每个候选类别的分类语义向量时,可直接将候选类别的文本输入到预训练语言模型中,直接输出每个候选类别的分类语义向量。
以候选类别“演员”为例:先获取到分类演员的文本[演员],直接将指定文本演员二字输入至预训练语言模型,产生一组代表指定文本[演员]的语义表示向量[0.28,-1.22,……,0.92,-1.11],作为候选类别“演员”的分类语义向量。
在计算每个候选类别的分类语义向量的步骤中,可采用上述两种方法进行实时计算,还可以事先离线计算完每个分类语义向量后,存放至数据库或缓存中,以重复使用。
S4、计算冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序。
在比较语义向量的距离远近时,本实施例采用的方法是计算冲突文本语义向量与每个分类语义向量的语义相似度。将冲突文本语义向量与每一个分类语义向量一一进行距离对比,如果某个分类语义向量与冲突文本语义向量的距离较近,说明该分类语义向量对应的候选类别越与语义文本相接近,即可说明该候选类别为人机交互时人类最感兴趣的意图类型。
根据计算出的每一个语义相似度,即可确定出冲突语义文本对应的所有候选类别的类别优先顺序,类别优先顺序可代表每个候选类别在冲突语义上的标注顺序,即人类感兴趣的意图类型顺序。通过比较语义向量距离远近(相似度)的方式,将冲突语义自动归纳成大众共识的那一个意图,为了对发生意图冲突的语义进行准确标注,以使机器能够进行准确识别并获得准确的交互结果。
图7中示例性示出了根据示例性实施例中确定类别优先顺序的方法流程图。具体地,参见图7,本实施例中,计算冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序,包括:
S41、计算冲突文本语义向量分别与每个分类语义向量的相似度,确定多个语义相似度。
S42、将多个语义相似度按照由高到底进行排序,得到类别优先顺序。
相似度计算的方法很多,本实施例以Cosine Similarity(余弦相似度),余弦相似度计算方法的原理:多维空间两点与所设定的点形成夹角的余弦值。余弦相似度的范围:[-1,1],值越大,说明夹角越大,两点相距就越远,相似度就越小。计算相似度的方法还可采用其他方法,本实施例不做具体限定,仅以余弦相似度计算方法为例进行说明。
余弦相似度计算公式如下:
式中,在本实施例中,T(x,y)为语义相似度数值。x,y分别代表需要计算相似度的两个向量,例如,如果x为冲突文本语义向量,则y为分类语义向量。i为相应向量的序号。
利用余弦相似度计算方法分别计算冲突文本语义向量分别与每一个分类语义向量的距离,将计算出的距离作为对应的相似度,以此可得到数个语义相似度。一个语义相似度对应一个分类语义向量。
每个语义相似度的数值并不相同,以此来说明每个分类语义向量与冲突文本语义向量的相似情况,即每一个候选类别与语义文本的相似情况。将数个语义相似度按从高到底排序,确定类别优先顺序,以标准每个候选类别与语义文本的远近程度。
例如,语义文本“我要看周星驰的电影”的冲突文本语义向量Vc=[0.28,-1.22,0.92,-1.11]。
冲突语义“周星驰”对应的候选类别:[演员,导演,编剧],由预训练语言模型计算得到的分类语义向量,为了简化说明,简化成维度为4的向量说明:
演员Va:[0.27,-1.21,0.91,-1.12]。
导演Vd:[0.18,-1.06,0.58,-1.45]。
编剧Vw:[0.17,-0.08,0.12,-0.98]。
Va为候选类别“演员”的分类语义向量,Vd为候选类别“导演”的分类语义向量,Vw为候选类别“编剧”的分类语义向量。
利用余弦相似度计算方法,分别计算冲突文本语义向量Vc与各分类语义向量(Va、Vd、Vw)的语义相似度:
T(x1,y1)=Similarity(Vc,V1)=CosineSimilarity(Vc,Va)=0.999。
T(x1,y2)=Similarity(Vc,V2)=CosineSimilarity(Vc,Vd)=0.963。
T(x1,y3)=Similarity(Vc,V3)=CosineSimilarity(Vc,Vw)=0.700。
由此可确定,“演员”与语义文本的语义相似度为0.999,“导演”与语义文本的语义相似度为0.963,“编剧”与语义文本的语义相似度为0.700。三个语义相似度按由低到高排序,得到的类别优先顺序为演员、导演、编剧。即语义文本“我要看周星驰的电影”,与其语义相似度高到低排序为:[演员,导演,编剧]。
由于预训练语言模型的语言,是从大量的互联网语言中训练出来的。因此,基于计算相似度并得到的类别优先顺序,可以说明代表大众的语言共识是:周星驰的电影,优先应提到演员,其次是导演,最后是编剧。若周星驰的导演相关讨论在互联网上的相关讨论在未来持续增多,同样一句话,「我要看周星驰的电影」在未来,算出与导演相似度也会较高。因此,此范例计算出的结果仅是举例,实际结果可能随时间演进而不同。
S5、将多个候选类别按照类别优先顺序标注在语义文本中发生语义冲突的语义上,以按照类别优先顺序获得与语义文本对应的交互结果。
类别优先顺序对应的候选类别可代表人机交互时,人类感兴趣的程度,因此,将每个候选类别按照类别优先顺序标注在冲突语义上,使得机器在对冲突语义进行理解时,可按照类别优先顺序识别交互结果,以更准确地为人类提供与语义文本对应的交互结果。
例如,输入语义文本范例:我要看周星驰的电影,可获得的冲突语义“周星驰”对应的类别优先顺序为:[演员,导演,编剧]。
若AI应用为,产生命名实体识别的训练数据,可将语义“周星驰”识别成[演员,导演,编剧],则按照类别优先顺序,可将周星驰优先标注为演员。
若AI应用为媒体搜索,则按照类别优先顺序,可优先搜索演员。或将所有周星驰的媒体搜索后,以[演员,导演,编剧]的顺序进行排序。
若AI应用为问答机器人或智能助手,则可按照类别优先顺序,优先回答或播放周星驰是演员的作品。
可见,本发明实施例提供的方法,可使人工智能机器在应用时,如作为搜索与问答机器人应用时,可具有大众常识,识别自然语言意图的优先顺序,识别出大众认可的正确语义。
由以上技术方案可知,本发明实施例提供的一种人工智能冲突语义识别方法,识别人机交互时产生的语义文本,获得语义文本中发生语义冲突的语义对应的多个候选类别;利用预训练语言模型分别对语义文本和每个候选类别进行计算,得到冲突文本语义向量和每个分类语义向量,计算冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;将多个候选类别按照类别优先顺序标注在语义文本中发生语义冲突的语义上,以按照类别优先顺序获得交互结果。可见,本发明实施例提供的方法,通过比较语义向量距离远近(相似度)的方式,将冲突语义自动归纳成大众共识的那一个意图类型,并对冲突语义产生大众会有共识的通用标注,符合大众习惯,使得利用预训练语言模型可以对一个词或一句话进行自动归类,以倾向人类的需求,进而保证机器可以准确识别人类的意图,得到准确的交互结果。
图8中示例性示出了根据示例性实施例中人工智能冲突语义识别装置的结构框图。参见图8,本发明实施例提供的一种人工智能冲突语义识别装置,用于执行图1所示的人工智能冲突语义识别方法的相关步骤,该装置包括:语义文本获取模块10,用于获取人机交互时产生的语义文本;候选类别确定模块20,用于识别所述语义文本,获得所述语义文本中发生语义冲突的语义对应的多个候选类别;语义向量计算模块30,用于利用预训练语言模型分别对所述语义文本和每个候选类别进行计算,得到所述语义文本对应的冲突文本语义向量和每个候选类别对应的分类语义向量,所述预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量;类别优先顺序确定模块40,用于计算所述冲突文本语义向量与每个分类语义向量的语义相似度,取得类别优先顺序;冲突语义标注模块50,用于将多个候选类别按照所述类别优先顺序标注在所述语义文本中发生语义冲突的语义上,以按照所述类别优先顺序获得与所述语义文本对应的交互结果。
进一步地,所述候选类别确定模块20,包括:语义获取单元,用于获取所述语义文本的语义;冲突语义确定单元,用于判断每个语义是否存在意图冲突,将所述语义中产生意图冲突的语义作为冲突语义,所述冲突语义是指产生多种意图的语义;候选类别确定单元,用于利用文本分类模型对所述冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
进一步地,所述语义向量计算模块30,包括:语义名称选取单元,用于在所述分类词典中,选取同一候选类别对应的多个语义名称;名称语义向量确定单元,用于将多个所述语义名称输入所述预训练语言模型进行计算,得到多个名称语义向量,一个所述语义名称对应一个名称语义向量;第一语义向量计算单元,用于计算多个所述名称语义向量的向量均值,将所述向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
进一步地,其特征在于,所述语义向量计算模块30,包括:文本获取单元,用于获取每个所述候选类别对应的文本,所述候选类别与所述文本一一对应;第二语义向量计算单元,用于将指定文本输入所述预训练语言模型中,输出所述指定文本对应的分类语义向量。
进一步地,所述类别优先顺序确定模块40,包括:相似度计算单元,用于计算所述冲突文本语义向量分别与每个分类语义向量的相似度,确定多个语义相似度;类别优先顺序确定单元,用于将多个所述语义相似度按照由高到底进行排序,得到类别优先顺序。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于人工智能冲突语义识别方法装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (10)

1.一种人工智能冲突语义识别方法,其特征在于,包括以下步骤:
获取人机交互时产生的语义文本;
识别所述语义文本,获得所述语义文本中发生语义冲突的语义对应的多个候选类别;
将所述语义文本中产生语义冲突的冲突文本输入预训练语言模型,得到冲突文本语义向量,所述预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量;
将所述冲突文本语义向量与数据库中的每个分类语义向量一一进行距离对比,取得类别优先顺序,其中,某一分类语义向量与所述冲突文本语义向量的距离越近,所述某一分类语义向量对应的候选类别与所述语义文本的类别越接近;所述数据库中的每个分类语义向量是利用所述预训练语言模型对每个候选类别进行计算,得到的每个候选类别对应的分类语义向量;
将多个候选类别按照所述类别优先顺序标注在所述语义文本中发生语义冲突的语义上,以按照所述类别优先顺序获得与所述语义文本对应的交互结果。
2.根据权利要求1所述的方法,其特征在于,所述识别语义文本,获得所述语义文本发生语义冲突时对应的多个候选类别,包括:
获取所述语义文本的语义;
判断每个语义是否存在意图冲突,将所述语义中产生意图冲突的语义作为冲突语义,所述冲突语义是指产生多种意图的语义;
利用文本分类模型对所述冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
3.根据权利要求1所述的方法,其特征在于,所述利用所述预训练语言模型对每个候选类别进行计算,得到的每个候选类别对应的分类语义向量,包括:
在所述分类词典中,选取同一候选类别对应的多个语义名称;
将多个所述语义名称输入所述预训练语言模型进行计算,得到多个名称语义向量,一个所述语义名称对应一个名称语义向量;
计算多个所述名称语义向量的向量均值,将所述向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
4.根据权利要求1所述的方法,其特征在于,所述利用所述预训练语言模型对每个候选类别进行计算,得到的每个候选类别对应的分类语义向量,包括:
获取每个所述候选类别对应的文本,所述候选类别与所述文本一一对应;
将指定文本输入所述预训练语言模型中,输出所述指定文本对应的分类语义向量。
5.根据权利要求1所述的方法,其特征在于,所述将所述冲突文本语义向量与数据库中的每个分类语义向量一一进行距离对比,取得类别优先顺序,包括:
计算所述冲突文本语义向量分别与每个分类语义向量的距离值,确定多个语义相似度;
将多个所述语义相似度按照由高到底进行排序,得到类别优先顺序。
6.一种人工智能冲突语义识别装置,其特征在于,包括:
语义文本获取模块,用于获取人机交互时产生的语义文本;
候选类别确定模块,用于识别所述语义文本,获得所述语义文本中发生语义冲突的语义对应的多个候选类别;
语义向量计算模块,将所述语义文本中产生语义冲突的冲突文本输入预训练语言模型,得到冲突文本语义向量,所述预训练语言模型是指基于人类语言习惯经过训练而成的语言模型,用于生成语义向量;
类别优先顺序确定模块,用于将所述冲突文本语义向量与数据库中的每个分类语义向量一一进行距离对比,取得类别优先顺序,其中,某一分类语义向量与所述冲突文本语义向量的距离越近,所述某一分类语义向量对应的候选类别与所述语义文本的类别越接近;所述数据库中的每个分类语义向量是利用所述预训练语言模型对每个候选类别进行计算,得到的每个候选类别对应的分类语义向量;
冲突语义标注模块,用于将多个候选类别按照所述类别优先顺序标注在所述语义文本中发生语义冲突的语义上,以按照所述类别优先顺序获得与所述语义文本对应的交互结果。
7.根据权利要求6所述的装置,其特征在于,所述候选类别确定模块,包括:
语义获取单元,用于获取所述语义文本的语义;
冲突语义确定单元,用于判断每个语义是否存在意图冲突,将所述语义中产生意图冲突的语义作为冲突语义,所述冲突语义是指产生多种意图的语义;
候选类别确定单元,用于利用文本分类模型对所述冲突语义进行识别,确定每个冲突语义对应的不同意图的候选类别。
8.根据权利要求6所述的装置,其特征在于,所述语义向量计算模块,包括:
语义名称选取单元,用于在所述分类词典中,选取同一候选类别对应的多个语义名称;
名称语义向量确定单元,用于将多个所述语义名称输入所述预训练语言模型进行计算,得到多个名称语义向量,一个所述语义名称对应一个名称语义向量;
第一语义向量计算单元,用于计算多个所述名称语义向量的向量均值,将所述向量均值作为多个名称语义对应的同一候选类别的分类语义向量。
9.根据权利要求6所述的装置,其特征在于,所述语义向量计算模块,包括:
文本获取单元,用于获取每个所述候选类别对应的文本,所述候选类别与所述文本一一对应;
第二语义向量计算单元,用于将指定文本输入所述预训练语言模型中,输出所述指定文本对应的分类语义向量。
10.根据权利要求6所述的装置,其特征在于,所述类别优先顺序确定模块,包括:
相似度计算单元,用于计算所述冲突文本语义向量分别与每个分类语义向量的距离值,确定多个语义相似度;
类别优先顺序确定单元,用于将多个所述语义相似度按照由高到底进行排序,得到类别优先顺序。
CN202010224374.7A 2020-03-26 2020-03-26 一种人工智能冲突语义识别方法及装置 Active CN111460118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010224374.7A CN111460118B (zh) 2020-03-26 2020-03-26 一种人工智能冲突语义识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010224374.7A CN111460118B (zh) 2020-03-26 2020-03-26 一种人工智能冲突语义识别方法及装置

Publications (2)

Publication Number Publication Date
CN111460118A CN111460118A (zh) 2020-07-28
CN111460118B true CN111460118B (zh) 2023-10-20

Family

ID=71683257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010224374.7A Active CN111460118B (zh) 2020-03-26 2020-03-26 一种人工智能冲突语义识别方法及装置

Country Status (1)

Country Link
CN (1) CN111460118B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435182B (zh) * 2021-07-21 2024-10-18 唯品会(广州)软件有限公司 自然语言处理中分类标注的冲突检测方法、装置和设备
CN113688243B (zh) * 2021-08-31 2024-02-13 中国平安人寿保险股份有限公司 语句中实体的标注方法、装置、设备以及存储介质
CN113961705B (zh) * 2021-10-29 2024-08-27 聚好看科技股份有限公司 一种文本分类方法及服务器

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123054A (ja) * 2006-11-08 2008-05-29 Yafoo Japan Corp 質問文の自動生成システム
JP2014191777A (ja) * 2013-03-28 2014-10-06 Nippon Hoso Kyokai <Nhk> 語義解析装置、及びプログラム
WO2014169857A1 (zh) * 2013-04-19 2014-10-23 富士通株式会社 数据处理装置、数据处理方法以及电子设备
CN109189936A (zh) * 2018-08-13 2019-01-11 天津科技大学 一种基于网络结构和语义相关性度量的标签语义学习方法
CN109597993A (zh) * 2018-11-30 2019-04-09 深圳前海微众银行股份有限公司 语句分析处理方法、装置、设备以及计算机可读存储介质
CN109697282A (zh) * 2017-10-20 2019-04-30 阿里巴巴集团控股有限公司 一种语句的用户意图识别方法和装置
CN110189752A (zh) * 2019-03-12 2019-08-30 广东小天才科技有限公司 一种多意图的识别方法及装置、终端设备
CN110209791A (zh) * 2019-06-12 2019-09-06 百融云创科技股份有限公司 一种多轮对话智能语音交互系统及装置
CN110765235A (zh) * 2019-09-09 2020-02-07 深圳市人马互动科技有限公司 训练数据的生成方法、装置、终端及可读介质
CN110781686A (zh) * 2019-10-30 2020-02-11 普信恒业科技发展(北京)有限公司 一种语句相似度计算方法、装置及计算机设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150370787A1 (en) * 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems
CN105653738B (zh) * 2016-03-01 2020-05-22 北京百度网讯科技有限公司 基于人工智能的搜索结果播报方法和装置
US10606952B2 (en) * 2016-06-24 2020-03-31 Elemental Cognition Llc Architecture and processes for computer learning and understanding
US10755051B2 (en) * 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10984198B2 (en) * 2018-08-30 2021-04-20 International Business Machines Corporation Automated testing of dialog systems

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123054A (ja) * 2006-11-08 2008-05-29 Yafoo Japan Corp 質問文の自動生成システム
JP2014191777A (ja) * 2013-03-28 2014-10-06 Nippon Hoso Kyokai <Nhk> 語義解析装置、及びプログラム
WO2014169857A1 (zh) * 2013-04-19 2014-10-23 富士通株式会社 数据处理装置、数据处理方法以及电子设备
CN109697282A (zh) * 2017-10-20 2019-04-30 阿里巴巴集团控股有限公司 一种语句的用户意图识别方法和装置
CN109189936A (zh) * 2018-08-13 2019-01-11 天津科技大学 一种基于网络结构和语义相关性度量的标签语义学习方法
CN109597993A (zh) * 2018-11-30 2019-04-09 深圳前海微众银行股份有限公司 语句分析处理方法、装置、设备以及计算机可读存储介质
CN110189752A (zh) * 2019-03-12 2019-08-30 广东小天才科技有限公司 一种多意图的识别方法及装置、终端设备
CN110209791A (zh) * 2019-06-12 2019-09-06 百融云创科技股份有限公司 一种多轮对话智能语音交互系统及装置
CN110765235A (zh) * 2019-09-09 2020-02-07 深圳市人马互动科技有限公司 训练数据的生成方法、装置、终端及可读介质
CN110781686A (zh) * 2019-10-30 2020-02-11 普信恒业科技发展(北京)有限公司 一种语句相似度计算方法、装置及计算机设备

Also Published As

Publication number Publication date
CN111460118A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN110188202B (zh) 语义关系识别模型的训练方法、装置及终端
CN111460118B (zh) 一种人工智能冲突语义识别方法及装置
CN111708873A (zh) 智能问答方法、装置、计算机设备和存储介质
Tang et al. Video understanding with large language models: A survey
CN112434142B (zh) 一种标记训练样本的方法、服务器、计算设备及存储介质
Tan et al. Drill-down: Interactive retrieval of complex scenes using natural language queries
CN107451230A (zh) 一种问答方法以及问答系统
CN110245253B (zh) 一种基于环境信息的语义交互方法及系统
Aafaq et al. Dense video captioning with early linguistic information fusion
Rafiq et al. Video description: A comprehensive survey of deep learning approaches
CN118093936B (zh) 视频标签处理方法、装置、计算机设备和存储介质
CN118035945B (zh) 一种标签识别模型的处理方法和相关装置
Wen Intelligent English translation mobile platform and recognition system based on support vector machine
Olaleye et al. Attention-based keyword localisation in speech using visual grounding
CN114626386A (zh) 问答系统中的问题推荐方法、装置、电子设备及存储介质
CN116743692B (zh) 一种历史消息折叠方法和系统
Moradizeyveh Intent recognition in conversational recommender systems
CN116757195A (zh) 一种基于提示学习的隐性情感识别方法
CN116401364A (zh) 语言模型的训练方法、电子设备、存储介质及产品
US11797610B1 (en) Knowledge acquisition tool
Zhao et al. Toward Label-Efficient Emotion and Sentiment Analysis This article introduces label-efficient emotion and sentiment analysis from the computational perspective, focusing on state-of-the-art methodologies, promising applications, and potential outlooks.
Caron et al. TacticalGPT: uncovering the potential of LLMs for predicting tactical decisions in professional football
Hattimare et al. Maruna Bot: An extensible retrieval-focused framework for task-oriented dialogues
Biswas et al. Automatic judgement of neural network-generated image captions
Mangalika Object Recognition to Content Based Image Retrieval: A Study of the Developments and Applications of Computer Vision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant