CN108388638B - 语义解析方法、装置、设备及存储介质 - Google Patents

语义解析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108388638B
CN108388638B CN201810159585.XA CN201810159585A CN108388638B CN 108388638 B CN108388638 B CN 108388638B CN 201810159585 A CN201810159585 A CN 201810159585A CN 108388638 B CN108388638 B CN 108388638B
Authority
CN
China
Prior art keywords
semantic
semantics
analyzed
data
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810159585.XA
Other languages
English (en)
Other versions
CN108388638A (zh
Inventor
王晓雪
吴世伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Innovation Technology Co., Ltd
Volkswagen China Investment Co Ltd
Original Assignee
Mobvoi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mobvoi Information Technology Co Ltd filed Critical Mobvoi Information Technology Co Ltd
Priority to CN201810159585.XA priority Critical patent/CN108388638B/zh
Publication of CN108388638A publication Critical patent/CN108388638A/zh
Application granted granted Critical
Publication of CN108388638B publication Critical patent/CN108388638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语义解析方法、装置、设备及存储介质。所述方法包括:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。本发明实施例优化现有的对话系统的语义解析方法,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户的体验。

Description

语义解析方法、装置、设备及存储介质
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种语义解析方法、装置、设备及存储介质。
背景技术
随着科技的高速发展,语音识别在技术上的进步实现了用户与智能设备语音交互,并使得用户与智能设备的口语沟通变得自然和方便。
目前智能设备上的对话系统中已经引入了动作语义理解技术,从而自然语言对话系统已成为人们普遍使用的一种沟通工具。其中,实现自然语言对话系统的基本技术可以分为两大类,基于规则的方法和基于统计的方法。其中,基于规则的方法是指根据定义的语法规则、词性和构词与构句规则等,使用计算机语言进行描述;基于统计的方法是指采用深度学习和大数据,构建单轮对话系统,并自动生成对话。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:对话系统中可支持的语义种类少,同时大部分语义是基于规则的方法来实现的。更具体的,现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气、查路线。在这种语义较少的情况下,基于规则的方法可以实现高效自然语言处理并实现生成对话。而实际上,人们在生活中需求场景并非是这样简单且单一的,而是多样化且复杂的。而且,当用户的对话任务是并非是简单的单轮对话而是多轮对话时,对话系统由于只能构建单轮对话,导致出现答非所问或者重复回答的情况,使得对话系统的构建对话的内容太过局限和死板,用户体验不高。
发明内容
本发明实施例提供一种语义解析方法、装置、设备及存储介质,优化了现有的对话系统的语义解析方法,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户的体验。
第一方面,本发明实施例提供了一种语义解析方法,包括:
获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;
将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;
将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
第二方面,本发明实施例还提供了一种语义解析装置,包括:
当前解析数据获取模块,用于获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的至少一个历史对话轮次下的历史语义;
语义解析模块,用于将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;
语义整合模块,用于将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
第三方面,本发明实施例还提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的语义解析方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的语义解析方法。
本发明实施例通过获取并将当前对话轮次的待解析数据以及历史对话轮次的历史语义输入到不同的语义分析器,确定语义,解决了现有技术中基于规则的对话系统解析出的语义类别单一,以及不能顺利完成多轮对话任务的问题,能够支持多轮对话任务,提高语义的多样性,提高对话系统的灵活性,提高用户体验。
附图说明
图1是本发明实施例一提供的一种语义解析方法的流程图;
图2是本发明实施例二提供的一种语义解析装置的结构图;
图3是本发明实施例三提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种语义解析方法的流程图,本实施例可适用于语音交互,尤其是多轮语音交互的情况,该方法可以由本发明实施例提供的语义解析装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在具备对话系统的终端设备中,例如,PC机、平板电脑、手机和车载设备等。具体包括如下步骤:
S110,获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义。
典型的,所述获取在当前对话轮次下的待解析数据具体可以是:获取用户端在当前对话轮次下的待解析数据。
其中,当前对话轮次,具体可以是指在一问一答(用户端提出问题,机器端返回与该问题对应的答案)的语音交互场景下,获取到用户实时输入的提问的对话轮次,所述待解析数据具体是指获取的实时提问中包括的能够用来帮助进行语义解析的内容。所述语义解析,具体是指将用户端提供的自然语音翻译为机器端可以理解的数据,进而可以实现机器端与用户端之间的有效对话。
在本实施例中,待解析数据一般是文本数据,用于作为解析语义的对象。可选的,如果用户端通过文本输入的方式与机器端进行对话,可以直接根据用户输入的文本内容,生成该待解析数据(例如,将文本内容经过一定的预处理);如果用户端通过语音输入的方式与机器端进行对话,可以首先将用户输入的语音内容转化为文字内容后,生成该解析数据。
当前对话轮次关联的历史对话轮次,具体是指,在当前对话轮次之前已经完成的一问一答的对话轮次。
在本实施例中,发明人考虑到与当前对话轮次相邻的一个或者多个历史对话轮次中,可能包含有与当前对话轮次中待解析数据对应的语义相同或者相近的语义(也可以称为语义动作)。因此,通过在获取当前对话轮次下的待解析数据的同时,获取在所述当前对话轮次关联的至少一个历史对话轮次下的历史语义,其中,历史语义可以包括机器端和/或用户端的历史语义,可以用来准确或者快速确定与待解析数据对应的语义。
其中,在历史对话轮次下,机器端的历史语义可以是与对话系统生成历史答案对应的语义;用户端的历史语义可以是根据用户输入的历史问题解析出的语义。语义具体是可以被机器端理解并处理的信息,更详细的,如果用户端输入的内容为早上好,则通过语义理解后,得到可以被机器端理解的语义为打招呼。相应的,机器端则可以根据打招呼的语义,向用户反馈相应的机器交互内容(也即,前文所述的一问一答中的答案)。
获取历史对话轮次的语义以及与该语义对应的解析数据,并将其作为当前对话轮次的语义解析的依据,即基于前文对话轮次的语义确定当前对话轮次中用户端的语义,进而可以生成的相应的交互内容,以实现在对话交互中联系前文的对话内容,提高对话交互的灵活性,以及交互内容对用户需求的命中率,以提高用户体验。
在一个具体的例子中,当前对话轮次下用户端的交互内容是:推荐附近吃晚饭的餐厅。
与当前对话轮次相关联的前两个相邻历史对话轮次下的交互内容可以是:
用户端:中午吃的有点咸。
机器端:可以喝点爽口的饮料,并推荐了最近的茶饮店(如在用户所处的当前位置西北200米处)。
用户端:外面的看起来很热。
机器端:室外的温度是31℃,外出注意防晒。
对应的,当前对话轮次下,可以最终确定用户期望获取一个口味清淡,进餐环境凉爽的餐厅。
在本实施例的另一个可选的实施方式中,获取用户端在当前对话轮次下的待解析数据可以包括:获取在当前对话轮次下输入的交互语音,使用语音转文本技术,得到与所述交互语音对应的交互文本;采用至少一项文本预处理技术,对所述交互文本进行处理,得到所述待解析数据;其中,所述文本预处理技术包括下述至少一项:分词技术、实体识别技术以及槽信息标注技术。
具体的,用户端可以通过麦克风采集用户发出的声音,通过语义识别技术将语音信号转换为文本数据,获取交互文本,并将交互文本进行处理。
其中,分词技术是指将一整句文本分成多个词,且彼此之间耦合性较低。
实体识别技术是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,实体识别技术通常包括两部分:(1)实体边界(接口、菜单)识别;(2)确定实体类别(人名、地名、机构名或其他)。
槽信息标注技术是指判定每个词的含义范畴,确定每个词的类型并加以标注的过程。具体可以是预先设置多个信息槽,例如菜、衣服和电子设备等,同时针对每个信息槽设置多个槽值,例如,信息槽为菜的槽值可以包括湘菜、粤菜、东北菜和川菜等。将进行分词后的交互文本中的每个词均进行标注的过程即为槽信息标注,例如,交互文本中包含川菜,则对川菜标注的信息槽为菜,其槽值为川菜。
具体的,进行分词的方法、进行实体识别的方法以及进行槽信息标注的方法均可分为三大类:基于规则和词典的方法、基于统计(机器学习)的方法、基于二者综合的方法等。
通过将交互语音转换为交互文本并进行预处理,并将预处理后的交互文本作为待解析数据,有助于后续解析数据,提高语义解析的准确率。
需要说明的是,实体识别以及信息槽标注为不同的数据分析方法,因此,其两者可能对一个或者多个相同的词句同时进行识别或者标注,这里并不进行限制。
S120,将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义,其中,不同类型的语义分析器用于解析不同类型的语义。
在本实施例中,语义分析器可以是一个根据历史语义和解析数据预先训练的数据模型。将不同类型的语义和与语义匹配的解析数据进行预先训练,可以获取不同类型的语义分析器。通过设置不同类型的语义分析器,并同时输入历史语义以及待解析数据,可以获取不同类型以及与前文相关的语义,避免单一、死板的分析待解析数据,从而实现灵活解析交互语音。
在本实施例中,可选的,所述语义的类型包括:与信息槽的类型、信息槽的槽值或者实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,第一类语义对应第一类语义分析器、第二类语义对应第二类语义分析器、第三类语义对应第三类语义分析器以及第四类语义对应第四类语义分析器。
具体的,信息槽的类型,可以是词的类型,例如可以是衣服,信息槽的槽值可以是一类词的包含具体实例,例如,若信息槽为衣服,槽值可以是正装、休闲服或运动服等。实体的属性可以是名词对应的属性,例如名词是菜馆,对应的属性可以是电话、位置等信息。
其中,第一类语义可以是与信息槽的类型、信息槽的槽值或者实体的属性均不关联的语义,例如,用户端交互内容为:“你好”,则该用户端实际的语义是打招呼(“hello”)。
第二类语义具体是指与信息槽的类型以及信息槽的槽值均关联的语义,例如,用户端交互内容为:“我想吃川菜,不想吃粤菜。”,则该用户端实际的语义是:“信息槽为菜,对应的槽值为川菜的用户意图为Yes;信息槽为菜,对应槽值为粤菜的用户意图为No”。
第三类语义具体是指仅与信息槽的类型关联的语义,例如,用户端的交互内容为“我想听歌曲”,即确定用户的实际需求是想听歌曲,或者说用户的实际需求仅与信息槽的类型相关联,则该用户端实际的语义是“获取满足信息槽的类型为歌曲的信息”。
第四类语义具体是指仅与实体的属性关联的语义,例如,用户端交互内容为“游泳馆的开馆时间和地址”,即确定了用户想要知道游泳馆这一实体的开馆的时间信息和游泳馆的位置信息。则该用户端实际的语义是“获取游泳馆实体中的开馆时间以及位置这两个属性信息”。
通过将语义分为四个类型,并获取与四个类型语义对应的语义分析器,可以支持对多种语义的准确解析,并以不同类型的分析器解析数据,避免单一分析待解析数据,增加解析出的语义的种类,以提高语义的多样性,从而提高对话交互的灵活性。
在本实施例的一个可选的实施方式中,所述第一类语义分析器、所述第三类语义分析器以及所述第四类语义分析器使用卷积神经网络分析器训练得到,所述第二类语义分析器使用长短期记忆网络分析器训练得到。
具体的,第一类语义分析器是针对第一类语义训练的语义分析器,对交互文本中的语义做多标签分类,确定交互文本中包含的语义类型,而且所述用户端的语义都需要经过该第一类语义分析器获取用户端数据中包含的语义类型;第二类语义分析器是针对第二类语义训练的语义分析器,对交互文本中和语义有关的信息槽及其信息槽对应的槽值进行标注,需要预测出和语义相关联的信息槽的类别以及信息槽对应的槽值;第三类语义分析器是针对第三类语义训练的语义分析器,对交互文本中和语义有关的信息槽做多标签分类,预测出语义,以及和语义相关联的信息槽的类别;第四类语义分析器是针对第四类语义训练的语义分析器,对交互文本中和语义相关的属性做多标签分类,预测与语义相关联的实体的属性。其中,只有第二类语义分析器需要对信息槽和槽值进行标注,从而选择采用长短期记忆网络方法训练得到,其他语义分析器均可以采用分类的方式获取语义,从而选择采用卷积神经网络方法训练得到。
通过基于获取语义的方法,选择采用对应的方法训练得到语义分析器,可以针对性的生成语义分析器,从而针对性的解析语义,增加可解析语义的种类,实现提高语义解析的灵活性。
在本实施例的一个可选的实施方式中,可以将所述历史语义以及所述待解析数据作为一个整体,分别输入到上述四个语义分析器中,并分别获取四个语义分析器解析出的语义。
S130,将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
在本实施例的一个可选的实施方式中,将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义,包括:对各所述语义分析器解析出的语义取并集,并将取并集结果作为与所述待解析数据对应的语义。
具体的,分别根据所有的语义分析器进行语义解析,并将所有解析出的语义作为语义结果保留。例如,第一类语义分析器解析出的语义为:打招呼(“hello”);第二类语义分析器解析出的语义为:“信息槽为菜,对应的槽值为川菜的用户意图为Yes”;第三类语义分析器解析出的语义为:“获取周围环境中信息槽类型为餐厅的信息”;第四类语义分析器解析出的语义为:“获取实体为餐厅的地址”,最终整合得到的语义为:“打招呼(“hello”)”、“信息槽为菜,对应的槽值为川菜的用户意图为Yes”、“获取周围环境中信息槽类型为餐厅的信息”以及“获取实体为餐厅的地址”。通过最大程度的保留所有语义分析器的结果,增加解析的语义的多样性,能够对应生成准确、多样的对话内容,从而提高对话交互的灵活性。
在本实施例的另一个可选的实施方式中,将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义,包括:根据各所述语义分析器的优先级等级,对各所述语义分析器解析出的语义进行排序;根据排序结果获取设定数量的语义作为与所述待解析数据对应的语义。
也即:如果获取了多个语义分析器解析出的多个语义,则可以根据语义分析器的优先级获取重要的一个或者多个语义作为与所述待解析数据对应的语义。
例如,通过前述四个语义分析器获取了分别解析得到了4个语义,也即:语义A、语义B、语义C以及语义D。根据语义分析器的优先级顺序,可以选取优先级排在前两位的语义分析器解析出的语义A以及语义B作为与所述待解析数据对应的语义。
通过设置语义分析器的优先级,并按照优先级对应获取语义分析器解析出的语义,生成待解析数据对应的语义,可以针对性的解析数据,灵活设置语义的关注点,从而提高对话交互的灵活性。
在本实施例的另一个可选的实施方式中,在获取在当前对话轮次下的待解析数据之前,还包括:获取多条与设定类型的语义匹配的解析样本数据,并对各条所述解析样本数据中包括的与语义关联的数据进行标注;使用标注后的所述解析样本数据,以及与所述解析样本数据关联的历史语义对设定类型的分析器进行训练,得到与语义类型匹配的语义分析器。
通过训练与设定类型语义相关联、且和历史语义相关联的分析器,能够联系前文确定用户的需求,从而生成与前文相关联的对话,实现智能理解用户的对话,加强对话交互的灵活性和智能化,提高用户体验。
本发明实施例通过获取并将当前对话轮次的待解析数据以及历史对话轮次的历史语义输入到不同的语义分析器,确定语义,解决了现有技术中基于规则的对话系统解析出的语义类别单一,以及不能顺利完成多轮对话任务的问题,实现机器端支持多轮对话任务,增加解析出的语义的多样性,提高对话互动的灵活性,提高用户体验。
进一步的,在将整合结果作为与所述待解析数据对应的语义之后,分别获取与多个语义分别对应的机器端局部交互内容,并将上述机器端局部交互内容进行一定的组合;或者根据一个或者多个语义,对一个或者多个语义对应的机器端局部交互内容进行筛选,以最终得到当前对话轮次下,机器端的交互内容提供给用户。
在一个具体例子中,针对用户端的交互内容:“你好,XX餐厅的地址在哪”,通过本发明实施例的方法,最终得到由两个语义共同构成的整合结果,也即:“打招呼”以及“获取XX餐厅这一实体的地址信息”,与“打招呼”这一语义对应的机器端局部交互内容为“你好”,与“获取XX餐厅这一实体的地址信息”这一语义对应的机器端局部交互内容为“XX餐厅的地址为XX路XX号”,相应的,最终得到的在当前对话轮次下,与“你好,XX餐厅的地址在哪”对应的机器端交互内容为:“你好,XX餐厅的地址为XX路XX号”。
在另一个具体例子中,针对用户端的交互内容:“你好,请推荐附近的餐厅,我爱吃川菜,不爱吃粤菜”,通过本发明实施例的方法,最终得到由三个语义共同构成的整合结果,也即:“打招呼”、“获取周围环境中信息槽类型为餐厅的信息”以及“信息槽为菜,对应的槽值为川菜的用户意图为Yes;信息槽为菜,对应槽值为粤菜的用户意图为No”,与“打招呼”这一语义对应的机器端局部交互内容为“你好”,与“获取周围环境中信息槽类型为餐厅的信息”这一语义对应的机器端局部交互内容为“周围环境中有餐厅A、餐厅B以及餐厅C”,通过“信息槽为菜,对应的槽值为川菜的用户意图为Yes;信息槽为菜,对应槽值为粤菜的用户意图为No”,筛选出主营川菜的餐厅A后,最终得到的在当前对话轮次下,与“你好,请推荐附近的餐厅,我爱吃川菜,不爱吃粤菜”对应的机器端交互内容为:“你好,附近有主营川菜的餐厅A”。
实施例二
图2为本发明实施例二提供的一种语义解析装置的结构示意图。如图2所示,所述装置包括:
当前解析数据获取模块210,用于获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;
语义解析模块220,用于将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义,其中,不同类型的语义分析器用于解析不同类型的语义;
语义整合模块230,用于将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
本发明实施例通过获取并将当前对话轮次的待解析数据以及历史对话轮次的历史语义输入到不同的语义分析器,确定语义,解决了现有技术中基于规则的对话系统解析出的语义类别单一,以及不能顺利完成多轮对话任务的问题,能够支持多轮对话任务,提高语义的多样性,提高对话系统的灵活性,提高用户体验。
进一步的,所述当前解析数据获取模块210,用于获取在当前对话轮次下输入的交互语音,使用语音转文本技术,得到与所述交互语音对应的交互文本;采用至少一项文本预处理技术,对所述交互文本进行处理,得到所述待解析数据;其中,所述文本预处理技术包括下述至少一项:分词技术、实体识别技术以及槽信息标注技术。
进一步的,所述语义解析模块220,包括:所述语义的类型包括:与信息槽的类型、信息槽的槽值或者实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,第一类语义对应第一类语义分析器、第二类语义对应第二类语义分析器、第三类语义对应第三类语义分析器以及第四类语义对应第四类语义分析器。
进一步的,所述语义解析模块220,包括:所述第一类语义分析器、所述第三类语义分析器以及所述第四类语义分析器使用卷积神经网络分析器训练得到,所述第二类语义分析器使用长短期记忆网络分析器训练得到。
进一步的,所述语义整合模块230,用于对各所述语义分析器解析出的语义取并集,并将取并集结果作为与所述待解析数据对应的语义。
进一步的,所述语义整合模块230,用于根据各所述语义分析器的优先级等级,对各所述语义分析器解析出的语义进行排序;根据排序结果获取设定数量的语义作为与所述待解析数据对应的语义。
进一步的,所述装置还包括:语义分析器训练模块240,用于获取多条与设定类型的语义匹配的解析样本数据,并对各条所述解析样本数据中包括的与语义关联的数据进行标注;使用标注后的所述解析样本数据,以及与所述解析样本数据关联的历史语义对设定类型的分析器进行训练,得到与语义类型匹配的语义分析器。
本发明实施例所提供的语义解析装置可执行本发明任意实施例所提供的语义解析方法,具备执行语义解析方法相应的功能模块和有益效果。
实施例三
图3为本发明实施例三提供的一种设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性设备301的框图。图3显示的设备301仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,设备301以通用计算设备的形式表现。设备301的组件可以包括但不限于:一个或者多个处理器或者处理单元302,系统存储器303,连接不同系统组件(包括系统存储器303和处理单元302)的总线304。
总线304表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
设备301典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备301访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器303可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)305和/或高速缓存存储器306。设备301可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统307可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线304相连。存储器303可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块308的程序/实用工具309,可以存储在例如存储器303中,这样的程序模块308包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块308通常执行本发明所描述的实施例中的功能和/或方法。
设备301也可以与一个或多个外部设备310(例如键盘、指向设备、显示器311等)通信,还可与一个或者多个使得用户能与该设备301交互的设备通信,和/或与使得该设备301能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口312进行。并且,设备301还可以通过网络适配器313与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(WideArea Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器313通过总线304与设备301的其它模块通信。应当明白,尽管图3中未示出,可以结合设备301使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理单元302通过运行存储在系统存储器303中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种语义解析方法。
也即,所述处理单元执行所述程序时实现:获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义,其中,不同类型的语义分析器用于解析不同类型的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
实施例四
本发明实施例四还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的语义解析方法:
获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义,其中,不同类型的语义分析器用于解析不同类型的语义;将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、只读存储器(Read OnlyMemory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、无线电频率(RadioFrequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括LAN或WAN——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种语义解析方法,其特征在于,包括:
获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;
将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;
将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义;
语义的类型包括:与信息槽的类型、信息槽的槽值以及实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,所述第一类语义对应第一类语义分析器、所述第二类语义对应第二类语义分析器、所述第三类语义对应第三类语义分析器以及所述第四类语义对应第四类语义分析器。
2.根据权利要求1所述的方法,其特征在于,所述获取在当前对话轮次下的待解析数据,包括:
获取在当前对话轮次下输入的交互语音,使用语音转文本技术,得到与所述交互语音对应的交互文本;
采用至少一项文本预处理技术,对所述交互文本进行处理,得到所述待解析数据;
其中,所述文本预处理技术包括下述至少一项:分词技术、实体识别技术以及槽信息标注技术。
3.根据权利要求1所述的方法,其特征在于,所述第一类语义分析器、所述第三类语义分析器以及所述第四类语义分析器使用卷积神经网络分析器训练得到,所述第二类语义分析器使用长短期记忆网络分析器训练得到。
4.根据权利要求1-3任一项所述的方法,其特征在于,在获取在当前对话轮次下的待解析数据之前,还包括:
获取多条与设定类型的语义匹配的解析样本数据,并对各条所述解析样本数据中包括的与语义关联的数据进行标注;
使用标注后的所述解析样本数据,以及与所述解析样本数据关联的历史语义对设定类型的分析器进行训练,得到与语义类型匹配的语义分析器。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义,包括:
对各所述语义分析器解析出的语义取并集,并将取并集结果作为与所述待解析数据对应的语义。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义,包括:
根据各所述语义分析器的优先级等级,对各所述语义分析器解析出的语义进行排序;
根据排序结果获取设定数量的语义作为与所述待解析数据对应的语义。
7.一种语义解析装置,其特征在于,包括:
当前解析数据获取模块,用于获取在当前对话轮次下的待解析数据,以及在所述当前对话轮次关联的历史对话轮次下的历史语义;
语义解析模块,用于将所述历史语义以及所述待解析数据作为一个整体,分别输入到至少两类语义分析器中,并获取各所述语义分析器解析出的语义;
语义整合模块,用于将获取的各所述语义分析器解析出的语义进行整合,并将整合结果作为与所述待解析数据对应的语义;
语义的类型包括:与信息槽的类型、信息槽的槽值以及实体的属性均不关联的第一类语义;同时与信息槽的类型以及信息槽的槽值关联的第二类语义;仅与信息槽的类型关联的第三类语义;以及仅与实体的属性关联的第四类语义;其中,所述第一类语义对应第一类语义分析器、所述第二类语义对应第二类语义分析器、所述第三类语义对应第三类语义分析器以及所述第四类语义对应第四类语义分析器。
8.一种语义解析设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的语义解析方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的语义解析方法。
CN201810159585.XA 2018-02-26 2018-02-26 语义解析方法、装置、设备及存储介质 Active CN108388638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810159585.XA CN108388638B (zh) 2018-02-26 2018-02-26 语义解析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810159585.XA CN108388638B (zh) 2018-02-26 2018-02-26 语义解析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108388638A CN108388638A (zh) 2018-08-10
CN108388638B true CN108388638B (zh) 2020-09-18

Family

ID=63069263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810159585.XA Active CN108388638B (zh) 2018-02-26 2018-02-26 语义解析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108388638B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241524B (zh) * 2018-08-13 2022-12-20 腾讯科技(深圳)有限公司 语义解析方法及装置、计算机可读存储介质、电子设备
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
CN110874401B (zh) * 2018-08-31 2023-12-15 阿里巴巴集团控股有限公司 信息处理方法、模型训练方法、装置、终端及计算设备
CN111429895B (zh) * 2018-12-21 2023-05-05 广东美的白色家电技术创新中心有限公司 多轮交互的语义理解方法、装置及计算机存储介质
CN109559748B (zh) * 2018-12-21 2019-09-24 出门问问信息科技有限公司 一种语义识别方法、装置、智能设备及存储介质
CN109657046B (zh) * 2018-12-24 2021-11-16 上海仁静信息技术有限公司 内容分析处理方法、装置、电子设备及存储介质
CN111400463B (zh) * 2019-01-03 2023-06-06 百度在线网络技术(北京)有限公司 对话响应方法、装置、设备和介质
CN111831795B (zh) * 2019-04-11 2023-10-27 北京猎户星空科技有限公司 多轮对话处理方法、装置、电子设备及存储介质
CN110377908B (zh) * 2019-07-19 2023-05-30 科大讯飞股份有限公司 语义理解方法、装置、设备及可读存储介质
CN110765270B (zh) * 2019-11-04 2022-07-01 思必驰科技股份有限公司 用于口语交互的文本分类模型的训练方法及系统
CN111159546B (zh) * 2019-12-24 2023-10-24 深圳市雅阅科技有限公司 事件推送方法、装置、计算机可读存储介质和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354835A (zh) * 2016-08-31 2017-01-25 上海交通大学 基于上下文语义理解的人工对话辅助系统
CN106503156A (zh) * 2016-10-24 2017-03-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法及装置
CN107330011A (zh) * 2017-06-14 2017-11-07 北京神州泰岳软件股份有限公司 多策略融合的命名实体的识别方法及装置
CN107526723A (zh) * 2017-08-21 2017-12-29 百度在线网络技术(北京)有限公司 一种语义消歧的方法、装置、服务器和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873654B2 (en) * 2005-01-24 2011-01-18 The Intellection Group, Inc. Multimodal natural language query system for processing and analyzing voice and proximity-based queries

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354835A (zh) * 2016-08-31 2017-01-25 上海交通大学 基于上下文语义理解的人工对话辅助系统
CN106503156A (zh) * 2016-10-24 2017-03-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法及装置
CN107330011A (zh) * 2017-06-14 2017-11-07 北京神州泰岳软件股份有限公司 多策略融合的命名实体的识别方法及装置
CN107526723A (zh) * 2017-08-21 2017-12-29 百度在线网络技术(北京)有限公司 一种语义消歧的方法、装置、服务器和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Bi-LSTM-CRF网络的语义槽识别;徐梓翔; 车万翔; 刘挺;《智能计算机与应用》;20171230;第91-94页 *

Also Published As

Publication number Publication date
CN108388638A (zh) 2018-08-10

Similar Documents

Publication Publication Date Title
CN108388638B (zh) 语义解析方法、装置、设备及存储介质
KR101909807B1 (ko) 메시지 입력 방법 및 장치
CN108428446B (zh) 语音识别方法和装置
CN107657017B (zh) 用于提供语音服务的方法和装置
US11494161B2 (en) Coding system and coding method using voice recognition
CN109325091B (zh) 兴趣点属性信息的更新方法、装置、设备及介质
US20190221208A1 (en) Method, user interface, and device for audio-based emoji input
CN108847214B (zh) 语音处理方法、客户端、装置、终端、服务器和存储介质
CN109145104B (zh) 用于对话交互的方法和装置
CN110459210A (zh) 基于语音分析的问答方法、装置、设备及存储介质
CN106406806A (zh) 一种用于智能设备的控制方法及装置
CN109949071A (zh) 基于语音情绪分析的产品推荐方法、装置、设备和介质
CN105869640B (zh) 识别针对当前页面中的实体的语音控制指令的方法和装置
CN109801648B (zh) 消息弹窗语音编辑方法、装置、计算机设备及存储介质
CN105931644A (zh) 一种语音识别方法及移动终端
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
CN107943914A (zh) 语音信息处理方法和装置
CN107463700A (zh) 用于获取信息的方法、装置及设备
CN111243595B (zh) 信息处理方法和装置
CN110956955B (zh) 一种语音交互的方法和装置
CN105810205A (zh) 一种语音处理方法及装置
CN109710949A (zh) 一种翻译方法及翻译机
CN106205622A (zh) 信息处理方法及电子设备
CN108628813A (zh) 处理方法和装置、用于处理的装置
CN110162675A (zh) 应答语句的生成方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211115

Address after: 210034 floor 8, building D11, Hongfeng Science Park, Nanjing Economic and Technological Development Zone, Jiangsu Province

Patentee after: China Innovation Technology Co., Ltd

Patentee after: Volkswagen (China) Investment Co., Ltd

Address before: Room 1602, 16th floor, No. 3, Suzhou street, Haidian District, Beijing 100080

Patentee before: Information Technology Co., Ltd

TR01 Transfer of patent right