CN114004234A - 一种语义识别方法、存储介质及终端设备 - Google Patents

一种语义识别方法、存储介质及终端设备 Download PDF

Info

Publication number
CN114004234A
CN114004234A CN202010740011.9A CN202010740011A CN114004234A CN 114004234 A CN114004234 A CN 114004234A CN 202010740011 A CN202010740011 A CN 202010740011A CN 114004234 A CN114004234 A CN 114004234A
Authority
CN
China
Prior art keywords
information
request information
inputting
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010740011.9A
Other languages
English (en)
Inventor
盛佳琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL Digital Technology Co Ltd
Original Assignee
Shenzhen TCL Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL Digital Technology Co Ltd filed Critical Shenzhen TCL Digital Technology Co Ltd
Priority to CN202010740011.9A priority Critical patent/CN114004234A/zh
Publication of CN114004234A publication Critical patent/CN114004234A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语义识别方法、存储介质及终端设备,所述方法包括获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据;基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息,其中,所述语义信息包括槽位信息、意图信息以及领域信息。本发明通过将请求信息划分为第一分词数据和第二分词数据,并基于第一分词数据和第二分词数据可以同时获取到槽位信息、意图信息以及领域信息,简化了槽位信息、意图信息以及领域信息识别流程,从而提高人机交互的反应速度。

Description

一种语义识别方法、存储介质及终端设备
技术领域
本发明涉及人机交互技术领域,特别涉及一种语义识别方法、存储介质及终端设备。
背景技术
在人机交互过程中,当接到用户请求(Query)时,语音响应设备需要先了解用户请求所在的领域后判断用户意图,在确定用户意图后基于用户请求中关键词信息确定反馈操作(例如,反馈语音,反馈行动等)。然而,在现有人机交互过程中,需要繁琐流程来确定用户请求的领域、意图和关键信息,进而影响了用户请求的响应速度。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种语义识别方法、存储介质及终端设备。
为了解决上述技术问题,本发明实施例第一方面提供了一种语义识别方法,所述方法包括:
获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据;
基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息,其中,所述语义信息包括槽位信息、意图信息以及领域信息。
所述语义识别方法,其中,所述获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据具体包括:
获取待识别的请求信息;
基于预设的第一分词方式对所述请求信息进行分词,以得到所述请求信息对应的第一分词数据;
基于预设的第二分词方式对所述请求信息进行分词,以得到所述请求信息对应的第二分词数据,其中,所述第一分词方式与所述第二分词方式不同。
所述语义识别方法,其中,所述基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息具体为:
将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息。
所述语义识别方法,其中,所述语义识别模型包括第一分类模块、第二分类模块以及第三分类单元;所述将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息具体包括:
将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及槽位信息;
将所述第一目标特征向量以及所述槽位信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量;
将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息。
所述语义识别方法,其中,所述第一分类模块包括卷积单元、第一特征提取单元以及第一分类单元;所述将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及槽位信息具体包括:
将所述第一分词数据输入所述卷积单元,通过所述卷积单元输出若干第一特征向量;
将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出第一目标特征向量;
将所述第一目标特征向量输入第一分类单元,通过第一分类单元输出槽位信息,以得到所述请求信息对应槽位信息。
所述语义识别方法,其中,所述第一特征提取单元包括高速公路网络子单元以及循环网络子单元;所述将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出目标特征向量具体包括:
将所述若干第一特征向量输入所述高速公路网络子单元,通过所述高速公路网络子单元输出第二特征向量;
将所述第二特征向量以及所述第二分词数据输入所述循环网络子单元,通过所述循环网络子单元输出所述第一目标特征向量。
所述语义识别方法,其中,所述若干第一特征向量中的每个第一特征向量的向量维度不同。
所述语义识别方法,其中,所述第二分类模块包括第二特征提取单元、注意力单元以及第二分类单元;所述将所述第一目标特征向量以及所述槽位信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量具体包括:
将所述第一目标特征向量以及所述槽位信息输入第二特征提取单元,通过第二特征提取单元输出第三特征向量;
将所述第三特征向量输入注意力单元,通过注意力单元输出注意力特征向量;
将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量。
所述语义识别方法,其中,所述第二分类单元包括全连接子单元以及分类子单元;所述将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量具体包括:
将所述注意力特征向量输入所述全连接子单元,通过所述全连接子单元输出第二目标特征向量;
将所述第二目标特征向量输入所述分类子单元,通过所述分类子单元输出领域信息。
所述语义识别方法,其中,所述第三分类单元包括转换单元和第三分类单元;所述将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息具体包括:
将所述领域信息输入所述转换单元,通过所述转换单元输出意图特征向量;
将所述意图特征向量以及第二目标特征向量输入所述第三分类单元,通过所述第三分类单元输出意图信息,以得到所述请求信息对应的语义信息。
本发明实施例第二方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的语义识别方法中的步骤。
本发明实施例第三方面提供了一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如上任一所述的语义识别方法中的步骤。
有益效果:与现有技术相比,本发明提供了一种语义识别方法、存储介质及终端设备,所述方法包括获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据;基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息,其中,所述语义信息包括槽位信息、意图信息以及领域信息。本发明通过将请求信息划分为第一分词数据和第二分词数据,并基于第一分词数据和第二分词数据可以同时获取到槽位信息、意图信息以及领域信息,简化了槽位信息、意图信息以及领域信息识别流程,从而提高人机交互的反应速度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,在不符创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的语义识别方法的流程图。
图2为本发明提供的语义识别方法中的步骤S10的流程图。
图3为本发明提供的语义识别方法中的步骤S20的流程图。
图4为本发明提供的语义识别方法中的语义识别模型的模型结构原理图。
图5为本发明提供的语义识别方法中的转换矩阵的示意图。
图6为本发明提供的终端设备的结构原理图。
具体实施方式
本发明提供一种语义识别方法、存储介质及终端设备,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
发明人经过研究发现,在人机交互过程中,当接到用户请求(Query)时,语音响应设备需要先了解用户请求所在的领域后判断用户意图,在确定用户意图后基于用户请求中关键词信息确定反馈操作(例如,反馈语音,反馈行动等)。然而,在现有人机交互过程中,需要将用户请求Query按顺序依次进行领域、意图以及标签识别,并且在对领域、意图以及标签进行识别时,领域、意图以及标签分别对应有识别过程,需要将用户请求输入至领域、意图以及标签各自对应的识别过程,进行单独识别。例如,领域、意图以及标签分别对应有识别模型,并且对于每个领域,该领域均会对应独立的意图识别模型以及标签识别模型,如,领域包括200个领域类别,那么需要有200个意图识别模型和标签识别模型。这样在对用户请求进行识别时,需要先确定用户领域,之后在确定领域对应的意图识别模型和标签识别模型,造成用户请求的领域、意图和槽位信息识别的流程繁琐,进而影响了用户请求的响应速度。
为了解决上述问题,在本发明实施例中,在获取到待识别的请求信息后,获取所述请求信息对应的第一分词数据和第二分词数据;基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息,其中,所述语义信息包括槽位信息、意图信息以及领域信息。本实施例通过将请求信息划分为第一分词数据和第二分词数据,并基于第一分词数据和第二分词数据可以同时获取到槽位信息、意图信息以及领域信息,简化了槽位信息、意图信息以及领域信息识别流程,从而提高人机交互的反应速度。
本实施例提供的一种语义识别方法的流程示意图。该方法可以由系统升级装置来执行,所述装置可以由软件实现,应用于诸如智能手机、平板电脑或个人数字助理、机器人以及无人机等之类的电子设备上。参见图1,本实施例提供的语义识别方法具体包括:
下面结合附图,通过对实施例的描述,对发明内容作进一步说明。
本实施提供了一种语义识别方法,如图1所示,所述方法包括:
S10、获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据。
具体地,所述请求信息用于反映用户意图,例如,所述请求信息为我想看对象A的电影,那么请求信息反映的用户意图为播放对象A的电影。所述请求信息可以是用户输入的,也可以是外部设备发送的,还可以是通过从后台服务端(例如,云端)获取的。所述请求信息可以语音形式的请求信息,也可以为文本形成的请求信息等,并且当所述请求信息为语音形式的请求信息,可以对所述请求信息进行语音识别,以将所述语音形式的请求信息转换为文本形式的请求信息。
在本实施例的一个实现方式中,所述获取待识别的请求信息具体可以包括:
接收候选请求信息,并判断所述候选请求信息的类型;
若所述类型为语音类型,则对所述候选请求信息进行语音识别,以得到所述请求信息对应的文本信息,并将识别得到的文本信息作为待识别的请求信息;
若所述类型为文本类型,则将所述候选请求信息作为待识别的请求信息。
具体地,所述文本信息包括所述请求信息中的语音内容,可理解的是,对候选请求信息进行语音识别指的是识别所述请求信息对应的语音内容,并将所述语音内容作为请求信息对应的文本内容。例如,所述请求信息的语音内容为“我想看对象A的电影”,那么对所述请求信息进行语音识别可以得到“我想看对象A的电影”,并且将识别到“我想看对象A的电影”作为待识别的请求信息。
进一步,所述第一分词数据和所述第二分词数据均是通过对待识别的请求信息进行分词得到,并第一分词数据对应的分词方式与第二分词数据对应的分词方式不同。可以理解的是,将待识别的请求信息按照一分词方式进行分词,可以得到第一分词数据,按照另一分词方式进行分词,可以得到第二分词数据。基于此,如图2所示,所述获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据具体包括:
S11、获取待识别的请求信息;
S12、基于预设的第一分词方式对所述请求信息进行分词,以得到所述请求信息对应的第一分词数据;
S13、基于预设的第二分词方式对所述请求信息进行分词,以得到所述请求信息对应的第二分词数据,其中,所述第一分词方式与所述第二分词方式不同。
具体地,所述第一分词方式和所述第二分词方式均为预先设定,用于对所述请求信息进行分词的方式,并重新组成词语序列。可以理解的是,第一分词数据为将请求信息按照第一分词方式进行分割,并将分割得到的各词语重组得到词语序列;第二词数据为将请求信息按照第二分词方式进行分割,并将分割得到的各词语重组得到词语序列。其中,第一分词数据包括若干第一词语,若干第一词语中的每个第一词语均包含于待识别的请求信息,并且若干第一词语构成所述待识别的请求信息。所述第二分词数据包括若干第二词语,若干第二词语中的每个第二词语均包含于待识别的请求信息,并且若干第二词语构成所述待识别的请求信息。
在本实施例的一个实现方式中,所述第二分词方式可以为结巴分词方式,在获取到请求信息后,基于所述结巴分词方式将所述请求信息划分为若干第二词语,并且所述若干第二词语构成所述第二分词数据。例如,请求信息为“我想看对象A的电影”,按照结巴分词方式将请求信息可以划分为“我||想看||对象A||的||电影”。
在本实施例的一个实现方式中,所述第一分词方式为遍历预设词典,通过将请求信息与预设词典中的词语进行匹配,当存在匹配成功的词语时,基于匹配成功的词语在请求信息中设置分割符,以分割所述请求信息,其中,对于每个匹配成功的词语,该词语对应的分割符位于该匹配成功的词语前和该匹配成功的词语后,并且分割符与该词语相邻。例如,请求信息为“我想看对象A的电影”,按照第一分词方式中,将“我想看对象A的电影”中的每个词语与预设词典进行匹配,假设“对象A”和“电影”在预设词典中匹配成功,那么在“对象A”前、“对象A”后、“电影”前以及“电影”后插入分割符,得到“我想看||对象A||的||电影”,并将“我想看||对象A||的||电影”作为请求“我想看对象A的电影”对应的第一分词文本。
进一步,所述预设词典为预先建立,所述预设词典中包括若干词语;所述若干词语中的每个词语均可以为表示人、事物或地点的词语。例如,若干词语中的每个词语均为名称。在一个具体实现方式中,所述预测词典的建立过程可以为:获取包括若干语料的语料库,对于每个语料,选取该语料中的名词,将选取的所有名词进行去重处理,并将去重处理后的所有名词所形成的词语集作为预设词典。此外,所述预设词典中每个词语均配置有至少一个标签,当请求信息中的词语与预设词典中的词语匹配成功时,获取该匹配成功的词语在预设词典中的标签。
基于此,所述第一分词数据包括请求信息对应的分词词语构成的分词数据,通过还可以包括各词语对应的标签构成的标签数据。其中,所述标签数据包括若干标签,若干标签与分词数据中的各第一词语一一对应,每个标签为其对应的词语的标签。此外,第一分词数据对应的分词数据中的各词语对应的标签的获取过程可以为:对于分词数据中每个词语,若该词语存在于预设词典中,获取预设词典中该词语对应的标签,并将获取到标签作为该词语的标签;若该词语未存在于预设词典中,将该词语的标签设置为默认标签,其中,默认标签为预先设置的,例如,O等。
举例说明:请求信息为“我想看对象A的电影”,其中,“对象A”和“电影”在预设词典中匹配成功,在预设词典中“对象A”对应的标签包括演员Actor和歌手Singer歌手,那么“对象A”的标签为Actor&Singer;“电影”对应的标签为类型Type,那么“电影”的标签为Type,其他词语不在预设词典内,那么其他词语的标签为O。由此,请求信息“我想看对象A的电影”对应的第一分词数据包括分词数据“我想看||对象A||的||电影”,以分词数据对应的标签数据“O||Actor&Singer||O||Type”。
S20、基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息。
具体地,所述语义信息为所述请求信息对应的语句意图,其中,所述语音信息包括槽位信息、意图信息以及领域信息,其中,所述领域信息用于反映请求信息所处领域,例如,出行领域、视频观看领域等;所述意图信息用于反映请求信息对应的意图,其中,意图为在人机对话过程中,用户在一次话语权(即在人机对话过程中,用户说话之后,机器人针对该次用户说话进行答复)中所形成的话语的目的,即用户希望在对话场景中获取到的信息是什么,例如用户对人工智能助手说,“帮我定个闹钟”,用户的意图就是“定闹钟”。准确理解用户意图是人机对话顺畅进行的基本要求。所述槽位信息用于反映请求信息中各词语的语义标签,语义标签为人机对话系统中预先定义的对话服务中的服务要素。例如,在定闹钟这个对话服务中,对话服务中的服务要素可以包括需要闹钟的时间、是否重复等槽位。
进一步,所述领域信息包括领域类别概率集,领域类别概率集包括若干领域类别概率,若干领域类别概率包括语义识别模型预先配置的所有领域类别中的每个领域类别对应的类别概率,其中,所述领域类别概率用于表示请求信息属于该领域类别的几率,并且领域类别概率越大,请求信息对应的领域为该领域类别的几率越大,反之,领域类别概率越小,请求信息对应的领域为该领域类别的几率越小,若干领域类别概率的和等于1。例如,语义识别模型预先配置:领域Domain1、领域Domain2以及领域Domain3,那么请求信息对应的领域类别概率集包括领域Domain1对应的概率、领域Domain2对应的概率以及领域Domain3对应的概率,如,领域Domain1:0.77,领域Domain2:0.13,领域Domain3,0.1。
所述意图信息包括意图类别概率集,意图类别概率集包括若干意图类别概率,若干意图类别概率中的每个意图类别概率对应的意图类别均为领域类别概率集中概率最大的领域类别所包含的意图类别。所述意图类别概率用于表示请求信息属于该意图类别的几率,并且意图类别概率越大,请求信息对应的意图为该意图类别的几率越大,反之,领域类别概率越小,请求信息对应的意图为该意图类别的几率越小,若干领域类别概率的和等于1。例如,领域类别概率集包括领域Domain1:0.77,领域Domain2:0.13,领域Domain3,0.1,那么意图类别概率集包括领域Domain1包含的所有意图类别对应的意图类别概率,若领域Domain1包括意图Intent1,意图Intent2以及意图Intent3,那么意图类别概率集包括意图Intent1,意图Intent2以及意图Intent3各自对应的类别概率,如,意图Intent1:0.82,意图Intent2:0.12,意图Intent3:0.06。
所述槽位信息包括请求信息中每个词语对应的标签,其中,每个词语对应的各标签中最大概率的标签。例如,分词数据“我想看||对象A||的||电影”,以分词数据对应的标签数据“O||Actor&Singer||O||Type”中,“对象A”对应的标签Actor和标签Singer中,标签Actor的概率为0.8,标签Singer的概率为0.2,则槽位信息中“对象A”对应的标签为Actor。
在本实施例的一个实现方式中,如图3和图4所示,所述基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息具体为:
将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息。
具体地,所述语义识别模型为经过训练的神经网络模型,通过所述语义模块可以确定所述请求信息对应的语义信息。可以理解的是,所述语义识别模型的输入项为第一分词数据和第二分词数据,所述语义识别模型的输出项为语义信息,所述语义信息包括槽位信息、意图信息以及领域信息。换句话说,当将所述第一分词数据和第二分词数据输入所述语义识别模型后,所述语义识别模型可以同时输入所述槽位信息、意图信息以及领域信息,这样通过该语义识别模型可以快速确定请求信息对应的槽位信息、意图信息以及领域信息,提高了请求信息的语义识别效率,从而可以提高请求信息的响应速度。
在本实施例的一个实现方式中,在将所述第一分词数据和第二分词数据输入所述语义识别模型时,可以将所述第一分词数据转换为第一词向量,将所述第二分词数据转换为第二词向量,并将所述第一词向量和第二词向量作为语音识别模型的输入项。所述第一分词数据转换为第一词向量可以基于预设的第一词向量模型生成,所述第一词向量模型为基于采用第一分词方式得到的语料训练库对预设词向量模型进行训练得到;所述第二分词数据转换为第二词向量可以基于预设的第二词向量模型生成,第二词向量模型为基于采用第二分词方式得到的语料训练库训对预设词向量模型进行训练得到。其中,所述预设词向量模型包括但不局限于Word2Vec,Glove和Bert。此外,在实际应用中,当请求信息包括为存在语料库中的词语时,可以随机为该词语生成词向量。
在本实施例的一个实现方式中,所述语义识别模型包括第一分类模块、第二分类模块以及第三分类单元;所述将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息具体包括:
S21、将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及槽位信息;
S22、将所述第一目标特征向量以及所述槽位信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量;
S23、将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息。
具体地,在步骤S21中,所述第一分类模块的输入项为第一分词数据和第二分词数据,所述第一分类模块基于第一分词数据和第二分词数据可以确定请求信息对应的第一目标特征向量,并且基于第一目标特征向量可以确定所述请求信息对应的槽位信息。在本实施例的一个实现方式中,所述第一分类模块包括卷积单元、第一特征提取单元以及第一分类单元;所述卷积单元与所述第一特征提取单元相连接,所述第一特征提取单元与所述第一分类单元相连接;所述卷积单元的输入项为第一分词数据,所述第一特征提取单元的输入项为卷积单元的输出项和第二分词数据,所述第一特征提取单元的输出项为第一目标特征向量,所述第一分类单元的输入项为第一目标特征向量,第一分类单元的输出项为槽位信息。
基于此,在本实施例的一个实现方式中,所述将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及标签信息具体包括:
将所述第一分词数据输入所述卷积单元,通过所述卷积单元输出若干第一特征向量;
将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出第一目标特征向量;
将所述第一目标特征向量输入第一分类单元,通过第一分类单元输出标签信息,以得到所述请求信息对应槽位信息。
具体地,若干第一特征向量中各第一特征向量的维度不同,例如,若干第一特征向量包括第一特征向量A和第一特征向量B,第一特征向量A的维度为1*100,第一特征向量B的维度为1*200。所述卷积单元包括若干卷积单元,若干卷积单元与若干第一特征向量一一对应,并且各第一特征向量为其对应的卷积单元的输出项,其中,若干卷积单元中的每个卷积单元均可以包括卷积层和最大池化层,并且各卷积单元中的卷积层的卷积核尺寸不同。此外,若干卷积单元可以依次级联,相邻两个级联卷积单元中前一个卷积单元的输出项为后一个卷积单元的输入项,并每个卷积单元的输出项均为一个第一特征向量;或者是,若干卷积单元相互独立布置,每个卷积单元的输入项均为第一分词数据,输出项为第一特征向量。此外,所述第一分类单元可以为随机条件场CRF模型,通过随机条件场模型可以基于第一目标特征向量确定请求信息对应的槽位信息。
进一步,在本实施例的一个实现方式中,所述第一特征提取单元包括高速公路网络子单元以及循环网络子单元,所述将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出目标特征向量具体包括:
将所述若干第一特征向量输入所述高速公路网络子单元,通过所述高速公路网络子单元输出第二特征向量;
将所述第二特征向量以及所述第二分词数据输入所述循环网络子单元,通过所述循环网络子单元输出所述第一目标特征向量。
具体地,所述高速公路网络子单元包括高速公路网络Highway Network,通过所述高速公路网络可以加深神经网络深度以提高准确率,同时在通过高速公路网络来获取第一特征向量对应的深度特征信息时,可以对第一特征向量中的部分特征进行深度特征提取,部分特征保持不变,这样可以提高深度特征的提取速度,从而提高语义信息识别的速度。此外,在若干第一特征向量输入所述高速公路网络子单元之前,需要将若干第一特征向量拼接,并将拼接得到的拼接特征向量输入高速公路网络子单元。例如,若干第一特征向量包括第一特征向量A和第一特征向量B,第一特征向量A为(1,1,1),第一特征向量B为(2,1,2,1),那么第一特征向量A和第一特征向量B拼接得到的拼接特征向量为(1,1,1,2,1,2,1)。
此外,在将第二特征向量与第二分词数据输入循环网络子单元之前,需要将第二特征向量与第二分词数据进行拼接,其中,第二分词数据为词向量形式。由此,可以将第二特征向量和第二分词数据按照维度方向拼接,并将拼接得到特征向量输入至循环网络子单元,其中,拼接得到特征向量的向量维度等于第二特征向量的向量维度与第二分词数据的向量维度的和。
进一步,在所述步骤S22中,所述第二分类模块包括第二特征提取单元、注意力单元以及第二分类单元;所述将所述特征向量以及所述标签信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量具体包括:
将所述第一目标特征向量以及所述槽位信息输入第二特征提取单元,通过第二特征提取单元输出第三特征向量;
将所述第三特征向量输入注意力单元,通过注意力单元输出注意力特征向量;
将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量。
具体地,所述第二特征提取单元分别与第一特征提取单元和第一分类单元相连接,所述第一特征提取单元输出的第一目标特征图相邻以及所述第一分类单元输出的槽位信息分别输入第二特征提取单元,所述第二特征提取单元与注意力单元相连接,所述注意力单元与所述第二分类单元相连接。在本实施例中,所述第二特征提取单元可以采用双向门循环网络,所述注意力单元可以采用自注意力网络。
进一步,在本实施例的一个实现方式中,所述第二分类单元包括全连接子单元以及分类子单元;所述将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量具体包括:
将所述注意力特征向量输入所述全连接子单元,通过所述全连接子单元输出第二目标特征向量;
将所述第二目标特征向量输入所述分类子单元,通过所述分类子单元输出领域信息。
具体地,所述全连接子单元包括全连接层和激活层,所述分类子单元可以包括Softmax层,通过全连接子单元确定第二目标特征向量,并且将全连接子单元输出的第二目标特征向量输入Softmax层,通过Softmax层输出领域信息。其中,全连接子单元中的激活层可以采用ReLU激活函数。
进一步,在步骤S23中,所述第三分类单元包括转换单元和第三分类单元;所述将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息具体包括:
将所述领域信息输入所述转换单元,通过所述转换单元输出意图特征向量;
将所述意图特征向量以及第二目标特征向量输入所述第三分类单元,通过所述第三分类单元输出意图信息,以得到所述请求信息对应的语义信息。
具体地,所述转换单元用于将领域转换为意图,其中,所述转换单元配置有领域到意图的转移矩阵,通过领域到意图的转移矩阵可以将领域信息转换为意图矩阵。在领域到意图的转移矩阵每行表示一个领域对应的各意图,每列表示一个意图所对应的各领域,其中,对于每个意图,该意图所在列与包含该意图的领域所在行的交汇点对应的元素值为1,该意图所在列与未包含该意图的领域所在行的交汇点对应的元素值为1。可以理解的是,在领域到意图的转移矩阵中,矩阵行坐标表示领域,矩阵列坐标表示意图,每个元素值表示其所处列对应的意图与其所处行对应的领域的包含关系,当该元素值为1时,表示该元素所处列对应的意图包含于该元素所处行对应的领域;当该元素值为0时,表示该元素所处列对应的意图不包含于该元素所处行对应的领域的包含。
举例说明:领域包括Domain1、Domain2、Domain3以及Domain4,意图包括Intent1、Intent2、Intent3、Intent4、Intent5以及Intent6,其中,Intent1和Intent2包含于Domain1,Intent3包含于Domain2,Intent4包含于Domain3,Intent5和Intent6包含于Domain4,那么将Domain1对应第一行,Domain2对应第二行、Domain3对应第三行,Intent1对应第一列、Intent2对应第二列、Intent3对应第三列、Intent4对应第四列、Intent5对应第五列,Intent6对应第六列,那么将领域转换为意图的转换矩阵可以如图5所示。
基于此,在将领域信息输入转换单元后,将领域信息与所述转换单元中的领域到意图的转移矩阵进行乘积,得到领域信息对应的意图特征向量;在基于意图特征向量以及第二目标特征向量,通过第三分类单元可以确定请求信息对应的意图信息,这样可以通过领域信息对所述意图信息进行约束,提高了意图信息的准确性。其中,所述第三分类单元可以包括Softmax层,通过Softmax层确定意图信息。
基于上述语义识别方法,本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述实施例所述的语义识别方法中的步骤。
基于上述语义识别方法,本发明还提供了一种终端设备,如图6所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(Communic对象Ations Interf对象Ace)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。
此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Re对象Ad-Only Memory,ROM)、随机存取存储器(R对象Andom对象AccessMemory,R对象AM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
此外,上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种语义识别方法,其特征在于,所述方法包括:
获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据;
基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息,其中,所述语义信息包括槽位信息、意图信息以及领域信息。
2.根据权利要求1所述语义识别方法,其特征在于,所述获取待识别的请求信息,并获取所述请求信息对应的第一分词数据和第二分词数据具体包括:
获取待识别的请求信息;
基于预设的第一分词方式对所述请求信息进行分词,以得到所述请求信息对应的第一分词数据;
基于预设的第二分词方式对所述请求信息进行分词,以得到所述请求信息对应的第二分词数据,其中,所述第一分词方式与所述第二分词方式不同。
3.根据权利要求1所述语义识别方法,其特征在于,所述基于所述第一分词数据以及所述第二分词数据,确定所述请求信息对应的语义信息具体为:
将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息。
4.根据权利要求3所述语义识别方法,其特征在于,所述语义识别模型包括第一分类模块、第二分类模块以及第三分类单元;所述将第一分词数据以及第二分词数据输入经过训练的语义识别模型,通过所述语义识别模型确定所述请求信息对应的语义信息具体包括:
将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及槽位信息;
将所述第一目标特征向量以及所述槽位信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量;
将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息。
5.根据权利要求4所述语义识别方法,其特征在于,所述第一分类模块包括卷积单元、第一特征提取单元以及第一分类单元;所述将所述第一分词数据以及所述第二分词数据输入第一分类模块,通过所述第一分类模块确定所述请求信息对应的第一目标特征向量以及槽位信息具体包括:
将所述第一分词数据输入所述卷积单元,通过所述卷积单元输出若干第一特征向量;
将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出第一目标特征向量;
将所述第一目标特征向量输入第一分类单元,通过第一分类单元输出槽位信息,以得到所述请求信息对应槽位信息。
6.根据权利要求5所述语义识别方法,其特征在于,所述第一特征提取单元包括高速公路网络子单元以及循环网络子单元;所述将若干第一特征向量以及所述第二分词数据输入所述第一特征提取单元,通过所述第一特征提取单元输出目标特征向量具体包括:
将所述若干第一特征向量输入所述高速公路网络子单元,通过所述高速公路网络子单元输出第二特征向量;
将所述第二特征向量以及所述第二分词数据输入所述循环网络子单元,通过所述循环网络子单元输出所述第一目标特征向量。
7.根据权利要求5或6所述语义识别方法,其特征在于,所述若干第一特征向量中的每个第一特征向量的向量维度不同。
8.根据权利要求4所述语义识别方法,其特征在于,所述第二分类模块包括第二特征提取单元、注意力单元以及第二分类单元;所述将所述第一目标特征向量以及所述槽位信息输入第二分类模块,通过第二分类模块确定所述请求信息对应的领域信息以及第二目标特征向量具体包括:
将所述第一目标特征向量以及所述槽位信息输入第二特征提取单元,通过第二特征提取单元输出第三特征向量;
将所述第三特征向量输入注意力单元,通过注意力单元输出注意力特征向量;
将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量。
9.根据权利要求8所述语义识别方法,其特征在于,所述第二分类单元包括全连接子单元以及分类子单元;所述将所述注意力特征向量模块输入第二分类单元,通过第二分类单元输出领域信息以及第二目标特征向量具体包括:
将所述注意力特征向量输入所述全连接子单元,通过所述全连接子单元输出第二目标特征向量;
将所述第二目标特征向量输入所述分类子单元,通过所述分类子单元输出领域信息。
10.根据权利要求4所述语义识别方法,其特征在于,所述第三分类单元包括转换单元和第三分类单元;所述将所述领域信息以及第二目标特征向量输入第三分类单元,通过所述第三分类单元确定所述请求信息对应的意图信息,以得到所述请求信息对应的语义信息具体包括:
将所述领域信息输入所述转换单元,通过所述转换单元输出意图特征向量;
将所述意图特征向量以及第二目标特征向量输入所述第三分类单元,通过所述第三分类单元输出意图信息,以得到所述请求信息对应的语义信息。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1~10任意一项所述的语义识别方法中的步骤。
12.一种终端设备,其特征在于,包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如权利要求1-10任意一项所述的语义识别方法中的步骤。
CN202010740011.9A 2020-07-28 2020-07-28 一种语义识别方法、存储介质及终端设备 Pending CN114004234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010740011.9A CN114004234A (zh) 2020-07-28 2020-07-28 一种语义识别方法、存储介质及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010740011.9A CN114004234A (zh) 2020-07-28 2020-07-28 一种语义识别方法、存储介质及终端设备

Publications (1)

Publication Number Publication Date
CN114004234A true CN114004234A (zh) 2022-02-01

Family

ID=79920584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010740011.9A Pending CN114004234A (zh) 2020-07-28 2020-07-28 一种语义识别方法、存储介质及终端设备

Country Status (1)

Country Link
CN (1) CN114004234A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134940A (zh) * 2019-02-27 2019-08-16 中国科学院电工研究所 一种训练文本识别模型、文本连贯性的方法及装置
CN110232914A (zh) * 2019-05-20 2019-09-13 平安普惠企业管理有限公司 一种语义识别方法、装置以及相关设备
CN110348022A (zh) * 2019-07-18 2019-10-18 北京香侬慧语科技有限责任公司 一种相似度分析的方法、装置、存储介质及电子设备
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN110825949A (zh) * 2019-09-19 2020-02-21 平安科技(深圳)有限公司 基于卷积神经网络的信息检索方法、及其相关设备
CN111143561A (zh) * 2019-12-26 2020-05-12 北京百度网讯科技有限公司 意图识别模型训练方法、装置及电子设备
CN111241839A (zh) * 2020-01-16 2020-06-05 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读存储介质和计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN110134940A (zh) * 2019-02-27 2019-08-16 中国科学院电工研究所 一种训练文本识别模型、文本连贯性的方法及装置
CN110232914A (zh) * 2019-05-20 2019-09-13 平安普惠企业管理有限公司 一种语义识别方法、装置以及相关设备
CN110348022A (zh) * 2019-07-18 2019-10-18 北京香侬慧语科技有限责任公司 一种相似度分析的方法、装置、存储介质及电子设备
CN110825949A (zh) * 2019-09-19 2020-02-21 平安科技(深圳)有限公司 基于卷积神经网络的信息检索方法、及其相关设备
CN111143561A (zh) * 2019-12-26 2020-05-12 北京百度网讯科技有限公司 意图识别模型训练方法、装置及电子设备
CN111241839A (zh) * 2020-01-16 2020-06-05 腾讯科技(深圳)有限公司 实体识别方法、装置、计算机可读存储介质和计算机设备

Similar Documents

Publication Publication Date Title
CN112329465B (zh) 一种命名实体识别方法、装置及计算机可读存储介质
CN108959246B (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
CN112685565A (zh) 基于多模态信息融合的文本分类方法、及其相关设备
KR102046486B1 (ko) 정보 입력 방법
WO2020244475A1 (zh) 用于语言序列标注的方法、装置、存储介质及计算设备
WO2020233131A1 (zh) 问答处理方法、装置、计算机设备和存储介质
CN110795541B (zh) 文本查询方法、装置、电子设备及计算机可读存储介质
CN109858045B (zh) 机器翻译方法和装置
CN111459977B (zh) 自然语言查询的转换
CN114861889B (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN112860919B (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN113449489B (zh) 标点符号标注方法、装置、计算机设备和存储介质
CN110263218B (zh) 视频描述文本生成方法、装置、设备和介质
US20240220730A1 (en) Text data processing method, neural-network training method, and related device
CN112836521A (zh) 问答匹配方法、装置、计算机设备及存储介质
CN114218945A (zh) 实体识别方法、装置、服务器及存储介质
CN117332112A (zh) 多模态检索模型训练以及多模态检索方法、电子设备及存储介质
CN111538817B (zh) 人机交互方法和装置
CN112949320B (zh) 基于条件随机场的序列标注方法、装置、设备及介质
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质
CN116522905B (zh) 文本纠错方法、装置、设备、可读存储介质及程序产品
CN113761923A (zh) 命名实体识别方法、装置、电子设备及存储介质
CN116796730A (zh) 基于人工智能的文本纠错方法、装置、设备及存储介质
CN116049370A (zh) 信息查询方法和信息生成模型的训练方法、装置
CN114742058B (zh) 一种命名实体抽取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination