CN112700769A - 一种语义理解方法、装置、设备以及计算机可读存储介质 - Google Patents

一种语义理解方法、装置、设备以及计算机可读存储介质 Download PDF

Info

Publication number
CN112700769A
CN112700769A CN202011569220.8A CN202011569220A CN112700769A CN 112700769 A CN112700769 A CN 112700769A CN 202011569220 A CN202011569220 A CN 202011569220A CN 112700769 A CN112700769 A CN 112700769A
Authority
CN
China
Prior art keywords
text
recognized
text segment
understood
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011569220.8A
Other languages
English (en)
Inventor
梅林海
陈志刚
刘权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202011569220.8A priority Critical patent/CN112700769A/zh
Publication of CN112700769A publication Critical patent/CN112700769A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。

Description

一种语义理解方法、装置、设备以及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种语义理解方法、装置、设备以及计算机可读存储介质。
背景技术
随着自然语言处理(Natural Language Processing,NLP)技术的发展,语义理解技术成为人机交互过程中的重要技术。
在人机交互应用场景(例如,智能家居等)中,人机交互设备可以对用户语音进行语义理解得到语义信息,以便后续能够根据该语义信息向该用户进行相应地反馈。
然而,因人机交互设备中语义理解的实时性较差,导致该人机交互设备无法针对用户语音进行及时反馈。
发明内容
本申请实施例的主要目的在于提供一种语义理解方法、装置、设备以及计算机可读存储介质,能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
本申请实施例提供了一种语义理解方法,所述方法包括:
获取当前语音段;
对所述当前语音段进行语音识别,得到当前文本段;
根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段;其中,所述当前文本段对应的未识别文本段的生成时间早于所述当前文本段的生成时间;
若确定所述待识别文本段包括完整性语句,则对所述待识别文本段进行语义理解。
本申请实施例还提供了一种语义理解装置,所述装置包括:
语音获取单元,用于获取当前语音段;
语音识别单元,用于对所述当前语音段进行语音识别,得到当前文本段;
文本生成单元,用于根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段;其中,所述当前文本段对应的未识别文本段的生成时间早于所述当前文本段的生成时间;
语义理解单元,用于若确定所述待识别文本段包括完整性语句,则对所述待识别文本段进行语义理解。
本申请实施例还提供了一种语义理解设备,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的语义理解方法的任一实施方式。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行本申请实施例提供的语义理解方法的任一实施方式。
基于上述技术方案,本申请具有以下有益效果:
本申请提供的语义理解方法中,在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。
其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
另外,因当前文本段对应的未识别文本段的生成时间早于该当前文本段的生成时间,使得该当前文本段对应的未识别文本段能够描述该当前文本段的上文信息(也就是,在当前时刻之前录制的用户语音所携带的信息),从而使得根据当前文本段和该当前文本段对应的未识别文本段生成的待识别文本段能够更准确地表征出该用户在当前时刻下表述的语义信息,从而使得在根据该待识别文本段进行的语义理解时能够更准确地获取到该用户在当前时刻下表述的语义信息,如此能够提高语义理解的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用于终端设备的语义理解方法的应用场景示意图;
图2为本申请实施例提供的应用于服务器的语义理解方法的应用场景示意图;
图3为本申请实施例提供的一种语义理解方法的流程图;
图4为本申请实施例提供的用户语音的录制示意图;
图5为本申请实施例提供的用户语音的语音识别结果示意图;
图6为本申请实施例提供的待识别文本段的标签信息示意图;
图7为本申请实施例提供的延迟文本的结构示意图;
图8为本申请实施例提供的语义特征提取的示意图;
图9为本申请实施例提供的一种实时语义理解过程的示意图;
图10为本申请实施例提供的一种语义理解装置的结构示意图。
具体实施方式
发明人在对语义理解的研究中发现,在相关技术中,人机交互设备可以实时采集用户语音,以便在该人机交互设备确定用户结束说话之后,该人机交互设备才会对刚录制的全部用户语音进行语义理解。可见,若用户持续说话时间越长,则导致人机交互设备录制用户语音的时长越长,从而导致该人机交互设备对用户语音进行语义理解的延迟时长越长,如此导致人机交互设备中语义理解的实时性越差,从而导致该人机交互设备针对用户语音进行反馈的延迟越长。
为了解决背景技术部分的技术问题以及上述相关技术的缺陷,本申请实施例提供了一种语义理解方法,该方法包括:获取当前语音段;对该当前语音段进行语音识别,得到当前文本段;根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段;若确定该待识别文本段包括完整性语句,则对该待识别文本段进行语义理解。
可见,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。另外,因当前文本段对应的未识别文本段的生成时间早于该当前文本段的生成时间,使得该当前文本段对应的未识别文本段能够描述该当前文本段的上文信息(也就是,在当前时刻之前录制的用户语音所携带的信息),从而使得根据当前文本段和该当前文本段对应的未识别文本段生成的待识别文本段能够更准确地表征出该用户在当前时刻下表述的语义信息,从而使得在根据该待识别文本段进行的语义理解时能够更准确地获取到该用户在当前时刻下表述的语义信息,如此能够提高语义理解的准确性。
此外,本申请实施例不限定语义理解方法的执行主体,例如,本申请实施例提供的语义理解方法可以应用于终端设备或服务器等数据处理设备。其中,终端设备可以为智能手机、计算机、个人数字助理(Personal Digital Assitant,PDA)或平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。
为了便于理解本申请实施例提供的技术方案,下面分别结合图1和图2对本申请实施例提供的语义理解方法的应用场景进行示例性介绍。其中,图1为本申请实施例提供的应用于终端设备的语义理解方法的应用场景示意图;图2为本申请实施例提供的应用于服务器的语义理解方法的应用场景示意图。
在图1所示的应用场景中,当用户101在终端设备102上触发语义理解请求时,终端设备102接收该语义理解请求,并通过执行本申请实施例提供的语义理解方法的任一实施方式对当前时刻下接收到的当前语音段进行语义理解,以便后续该终端设备102能够根据语义理解结果向用户101进行及时地反馈(例如,将该语义理解结果显示给用户101;和/或,根据该语义理解结果生成回复内容,并将该回复内容显示给用户101。)。
在图2所示的应用场景中,当用户201在终端设备202上触发语义理解请求时,终端设备202接收该语义理解请求,并将该语义理解请求转发给服务器203,以使服务器203通过执行本申请实施例提供的语义理解方法的任一实施方式对当前时刻下接收到的当前语音段进行语义理解,以便后续服务器203能够根据语义理解结果向用户201进行及时地反馈(例如,服务器203将语义理解结果反馈给终端设备202,以便该终端设备202能够根据该语义理解结果向用户201进行及时地反馈等)。
需要说明的是,上述语义理解请求用于请求对当前时刻下实时采集的当前语音段进行语义理解,而且本申请实施例不限定语义理解请求的触发方式。
另外,因服务器203中的语义理解过程与终端设备102中的语义理解过程类似,故为了便于理解上述两个应用场景下的语义理解过程,下面结合示例进行说明。
以图2所示的语义理解过程为示例,服务器203中的语义理解过程具体可以为:服务器203在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。
需要说明的是,本申请实施例提供的语义理解方法不仅能够应用于图1或图2所示的应用场景中,还可以应用于其他需要针对用户语音进行实时语义理解的应用场景中,本申请实施例对此不做具体限定。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例
参见图3,该图为本申请实施例提供的一种语义理解方法的流程图。
本申请实施例提供的语义理解方法,包括S1-S4:
S1:获取当前语音段。
当前语音段是指语义理解设备在当前时刻下接收的由语音采集设备发送的用户语音。其中,语义理解设备用于执行本申请实施例提供的语义理解方法的任一实施方式。语音采集设备用于实时采集用户语音,并实时地将采集到的用户语音发送给语义理解设备。
需要说明的是,本申请实施例不限定语音采集设备,可以是现有的或者未来出现的任一种能够进行语音采集的设备(如,麦克风等)。
本申请实施例中,当用户持续说话时,语音采集设备可以实时采集用户语音,并将实时采集的用户语音实时地发送给语义理解设备,以使该语义理解设备能够实时地接收到该语音采集设备发送的用户语音,以便该语义理解设备能够针对实时接收的用户语音进行语义理解。例如,对于图4所示的语义理解设备接收的多段用户语言来说,若当前时刻为第T时刻,则当前语音段为第一语音片段;若当前时刻为第T+1时刻,则当前语音段为第二语音片段;……,依次类推。另外,语音采集设备和语义理解设备可以独立设置,也可以集成一体。
S2:对当前语音段进行语音识别,得到当前文本段。
其中,当前文本段用于描述用户在当前时刻下表述的语音内容。
另外,本申请实施例不限定S2的实施方式,可以采用现有的或未来出现的任一种能够将连续语音转换为连续文本的语音识别方法进行实施。例如,S2可以采用流式语音识别方法(如,seq2seq)进行实施。
基于上述内容可知,在获取到当前语音段之后,可以即刻对该当前语音进行语音识别(例如,流式语音识别),得到当前文本段,以使该当前文本段能够描述该当前语音段携带的语音内容,从而使得该当前文本段能够描述语义理解设备在当前时刻下接收到的用户语音内容,以便后续能够基于该当前文本段进行语音理解。例如,对于图4所示的用户语音以及图5所示的该用户语音的语音识别结果来说,若当前时刻为第T时刻,则当前语音段为第一语音片段,且当前文本段为“明天”;若当前时刻为第T+1时刻,则当前语音段为第二语音片段,且当前文本段为“去北”;……
S3:根据当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段。
其中,当前文本段对应的未识别文本段用于描述语义理解设备在当前时刻之前接收到的用户语音内容;而且该当前文本段对应的未识别文本段可以作为该当前文本段的上文信息,以使该当前文本段对应的未识别文本段能够辅助理解当前文本段携带的语义信息。
需要说明的是,本申请实施例不限定当前文本段对应的未识别文本段,例如,当前文本段对应的未识别文本段可以包括在当前时刻下仍未进行语义理解的至少一个历史文本段。其中,历史文本段是通过对历史语音段进行语音识别得到的。历史语音段是指语义理解设备在当前时刻之前接收到的用户语音。
在一些情况下,为了提高语义理解的准确性,通常会对完整性语句(也就是具有完整语义的语句)进行语义理解,故可以将一些不具有完整语义的文本段进行拼接得到一个具有完整语义的语句。基于此可知,当前文本段对应的未识别文本段可以包括在当前时刻之前生成的未进行语义理解的文本段。例如,如图5所示,若当前时刻为第T+2时刻,则当前语音段为第三语音片段,当前文本段为“京”,且该当前文本段对应的未识别文本段可以包括第一语音片段对应的文本段“明天”和第二语音片段对应的文本段“去北”,以使该当前文本段对应的未识别文本段可以为“明天去北”。
需要说明的是,若当前时刻之前不存在未进行语义理解的文本段,则该当前文本段对应的未识别文本段可以为预设文本(例如,空)。另外,本申请实施例不限定当前文本段对应的未识别文本段的获取方式,可以根据在当前时刻之前采集的用户语音对应的语音识别结果进行获取。
待识别文本段携带有用户在当前时刻下表述的语义信息;而且本申请实施例不限定待识别文本段的获取方式。例如,在一种可能的实施方式中,待识别文本段的获取过程可以为:将当前文本段和该当前文本段对应的未识别文本段进行拼接,得到待识别文本段。
需要说明的是,本申请实施例不限定上述拼接方式,可以按照生成时间顺序进行拼接。例如,当当前文本段为“京”,该当前文本段对应的未识别文本段可以为“明天去北”,且“京”的生成时间晚于“明天去北”的生成时间时,可以将“明天去北”和“京”按照生成时间顺序进行拼接,得到的待识别文本段可以为“明天去北京”。
另外,为了进一步提高语义理解准确性,本申请实施例还提供了获取待识别文本段的另一种可能的实施方式,其具体可以为:先对当前文本段和该当前文本段对应的未识别文本段分别进行文本预处理,得到预处理后当前文本段和预处理后未识别文本段;再将预处理后当前文本段和预处理后未识别文本段进行拼接,得到待识别文本段。
其中,文本预处理可以预先设定,而且本申请实施例不限定文本预处理,例如,文本预处理可以用于对预处理对象(如,当前文本段或者该当前文本段对应的未识别文本段)进行字词纠错处理,以使预处理对象中不存在错误字词。
预处理后当前文本段是指对当前文本段进行文本预处理之后得到的文本段。
预处理后未识别文本段是指对当前文本段对应的未识别文本段进行文本预处理之后得到的文本段。
基于上述S3的相关内容可知,在获取到当前文本段之后,可以根据当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段(例如,按照生成时间顺序将当前文本段和该当前文本段对应的未识别文本段进行拼接,得到待识别文本段),以使该待识别文本段能够更准确地表征出用户在当前时刻下表述的语义信息。
S4:若确定待识别文本段包括完整性语句,则对该待识别文本段进行语义理解。其中,完整性语句是指具有完整语义的语句。
实际上,针对非完整性语句(也就是,不具有完整语义的语句)进行语义理解得到的结果通常不准确,故为了提高语义理解的效率以及准确性,可以针对完整性语句进行语义理解。基于此可知,一旦确定待识别文本段包括完整性语句时,可以确定语义理解设备已经接收到一句具有完整语义的语句,此时为了提高语义理解的实时性,可以即刻针对该待识别文本段中的完整性语句进行语义理解。
可见,本申请实施例中,在获取到待识别文本段之后,可以先判断该待识别文本段是否包括完整性语句,再在确定该待识别文本段包括完整性语句后,对该待识别文本段进行语义理解。需要说明的是,本申请实施例不限定在确定该待识别文本段不包括完整性语句时的执行动作,例如,在确定该待识别文本段不包括完整性语句后,可以结束当前轮的语义识别过程。
另外,本申请实施例不限定判断该待识别文本段是否包括完整性语句的实施方式,例如,在一种可能的实施方式下,其具体可以包括步骤11-步骤12:
步骤11:确定待识别文本段的完整性概率。
其中,待识别文本段的完整性概率用于表征待识别文本段中存在完整性语句的可能性。另外,若该待识别文本段的完整性概率越高,则表示该待识别文本段中存在完整性语句的可能性越大;若该待识别文本段的完整性概率越低,则表示该待识别文本段中存在完整性语句的可能性越小。
另外,本申请实施例不限定确定待识别文本段的完整性概率(也就是步骤11)的实施方式,例如,在一种可能的实施方式下,步骤11可以为:将待识别文本段输入到预先构建的完整语义识别模型,得到该完整语义识别模型输出的待识别文本段的完整性概率。
其中,完整语义识别模型用于对语句文本(例如,待识别文本段)进行完整语义识别。
另外,本申请实施例不限定完整语义识别模型,可以采用现有的或者未来出现的任一种能够根据语句文本进行完整语义识别的模型进行实施。
此外,完整语义识别模型可以根据第一语句样本和该第一语句样本的实际完整性标签进行训练。其中,若第一语句样本为具有完整语义的语句,则该第一语句样本的实际完整性标签表示该第一语句样本具有完整语义;而且若第一语句样本为具有不完整语义的语句,则该第一语句样本的实际完整性标签表示该第一语句样本具有不完整语义。需要说明的是,本申请实施例不限定完整语义识别模型的训练过程。
基于上述步骤11的一种可能的实施方式的相关内容可知,在获取到待识别文本段之后,可以直接利用预先构建的完整语义识别模型对该待识别文本段进行完整语义识别,得到并输出该待识别文本段的完整性概率,以使该完整性概率能够准确地表征该待识别文本段中存在完整性语句的可能性。
在一些情况下,为了提高完整性概率的准确性,可以参考待识别文本中字词的标签信息(例如,词汇“周杰伦”的标签可以为歌手),确定该待识别文本段的完整性概率。基于此,本申请实施例还提供了步骤11的另一种可能的实施方式,其具体可以包括步骤111-步骤113:
步骤111:生成待识别文本段的文本向量和待识别文本段的标签向量。
其中,待识别文本段的文本向量用于表征该待识别文本携带的文本内容;而且本申请实施例不限定待识别文本段的文本向量的生成方式,可以采用现有的或未来出现的任一种能够将文本进行向量化转换的方法(如,word2vec等词嵌入方法)进行实施。
待识别文本段的标签向量用于表征该待识别文本段中待处理对象具有的相关信息;而且该待处理对象可以是字和/或词。其中,待处理对象的相关信息用于表征该待处理对象携带的知识信息(例如,与该待处理对象具有强相关性的信息等)。例如,因众所周知周杰伦是一个歌手,使得“周杰伦”与“歌手”之间具有强相关性,从而使得“歌手”可以作为词汇“周杰伦”的相关信息。
另外,本申请实施例不限定待处理对象的相关信息,例如,为了提高语义理解的普适性,待处理对象的相关信息可以包括通用信息,以使该待处理对象的相关信息不涉及应用领域信息,从而使得该待处理对象的相关信息适用于任一领域下,如此有利于提高本申请实施例提供的语义理解方法的普适性。
此外,本申请实施例也不限定待识别文本段的标签向量的生成方式,例如,在一种可能的实施方式中,该待识别文本段的标签向量的生成过程可以包括步骤21-步骤22:
步骤21:对待识别文本段进行标签标注,确定待使用标签。
其中,待使用标签包括待识别文本段中待处理对象的相关信息;而且该待处理对象可以是字和/或词。例如,如图6所示,当待识别文本段为“明天去北京”,词“明天”对应的相关信息为时间,字“去”对应的相关信息为动作,词“北京”对应的相关信息为地点时,则该待识别文本段对应的待使用标签可以是集合{时间,时间,动作,地点,地点}。
另外,本申请实施例不限定待使用标签的获取方法,可以采用现有的或者未来出现的任一种能够针对字和/或词进行标签标注的方法进行实施。
基于上述步骤21的相关内容可知,在获取到待识别文本段之后,可以对该待识别文本段中字和/或词进行标签标注(例如,通用标签标注),得到该待识别文本段对应的待使用标签,以使该待使用标签能够准确地表示出该待识别文本段中字和/或词所表征的知识信息。
步骤22:对待使用标签进行向量化,得到待识别文本段的标签向量。
本申请实施例中,在获取到待识别文本段对应的待使用标签之后,可以对该待使用标签进行向量化处理,得到该待识别文本段的标签向量。需要说明的是,本申请实施例不限定上述向量化处理的实施方式,可以采用现有的或未来出现的任一种能够进行字和/或词向量化处理的方法(如,word2vec等词嵌入方法)进行实施。
基于上述步骤21至步骤22的相关内容可知,在获取到待识别文本段之后,先对该待识别文本段中字和/或词进行标签标注,得到待使用标签,以使该待使用标签能够准确地描述该待识别文本段携带的知识信息;再根据该待使用标签生成该待识别文本段的标签向量,以使该标签向量能够准确地表征该待识别文本段携带的知识信息。
基于上述步骤111的相关内容可知,在获取到待识别文本段之后,可以依据该待识别文本段分别生成该待识别文本段的文本向量和该待识别文本段的标签向量,以便后续能够基于该待识别文本段的文本向量以及标签向量生成该待识别文本段的语义特征。
步骤112:根据待识别文本段的文本向量和待识别文本段的标签向量,生成待识别文本段的语义特征。
其中,待识别文本段的语义特征用于表征该待识别文本段携带的语义信息。
另外,本申请实施例不限定步骤112的实施方式。例如,在一种可能的实施方式中,步骤112具体可以为:可以将待识别文本段的文本向量和待识别文本段的标签向量进行拼接,得到待识别文本段的语义特征。又如,在另一种可能的实施方式中,步骤112具体可以为:将待识别文本段的文本向量和该待识别文本段的标签向量输入预先构建的语义特征抽取器,得到该语义特征抽取器输出的该待识别文本段的语义特征。其中,语义特征抽取器用于进行语义特征抽取;而且本申请实施例不限定语义特征抽取器,可以是现有的或者未来出现的任一种能够进行语义特征抽取的模型(例如,Transform等基于上下文交叉的特征提取模型)进行实施。
基于上述步骤112的相关内容可知,在获取到待识别文本段的文本向量以及标签向量之后,可以根据该待识别文本段的文本向量以及标签向量,生成该待识别文本段的语义特征,以使该语义特征能够准确地表征该待识别文本段携带的语义信息。
步骤113:根据待识别文本段的语义特征进行完整性识别,确定待识别文本段的完整性概率。
本申请实施例不限定步骤113的实施方式,可以采用现有的或者未来出现的任一种基于语义特征进行完整语义识别的方法进行实施。为了便于理解,下面结合两种情况进行说明。
在第一种情况下,可以针对待识别文本段进行无延迟的完整性语句识别。基于此,本申请实施例提供步骤113的一种可能的实施方式,其具体可以为:将待识别文本段的语义特征输入预先训练的完整性识别模型,得到该完整性识别模型输出的该待识别文本段的完整性概率。其中,完整性识别模型用于进行无延迟地完整语义识别。
另外,完整性识别模型可以根据第二语句样本的语义特征和该第二语句样本的实际标签进行训练得到。其中,第二语句样本可以为完整性语句或非完整性语句。其中,若第二语句样本为完整性语句,则该第二语句样本的实际标签表示该第二语句样本具有完整语义;若第二语句样本为非完整性语句,则该第二语句样本的实际标签表示该第二语句样本不具有完整语义。
在第二种情况下,为了进一步提高完整性识别的准确性,可以参考一个文本段的下文文本(也就是,位于该文本段之后的至少一个字词)来确定该文本段是否具有完整语义,以实现针对该文本段进行有延迟的完整性识别。基于此,本申请实施例提供步骤113的另一种可能的实施方式,其具体可以为:
将待识别文本段的语义特征输入预先训练的延迟识别模型,得到该延迟识别模型输出的待识别文本段的完整性概率。其中,延迟识别模型用于进行具有延迟地完整语义识别;而且该延迟识别模型是根据待训练样本的语义特征和待训练样本的实际标签进行训练得到的。
另外,待训练样本可以为延迟文本或非延迟文本。其中,延迟文本包括具有完整语义的语句和预设延迟个数的字符(如图7所示),而且该预设延迟个数的字符的文本位置比该完整语义的语句的文本位置靠后。非延迟文本为不具有延迟文本结构的语句,使得该非延迟文本中除了位于文本尾部的预设延迟个数的字符以外的其他字符无法构成完整性语句。
此外,若待训练样本为延迟文本,则该待训练样本的实际标签表示该待训练样本具有完整语义;若待训练样本为非延迟文本,则该待训练样本的实际标签表示该待训练样本不具有完整语义。
需要说明的是,本申请实施例不限定预设延迟个数,而且该预设延迟个数可以预先设定。例如,如图7所示,若预设延迟个数为2,则图7中延迟文本的预设延迟个数的字符包括一个空格符和一个字“太”。另外,本申请实施例不限定上文字符,该字符可以是任一种符号(例如,空格、标点符号、字等)。另外,因预设延迟个数越大则表示语义理解的延迟时长越大,故在一些情况下,可以结合预先设定的语义理解准确率以及语义理解实时性要求,设定预设延迟个数。
基于上述第二种情况的相关内容可知,在利用延迟识别模型针对待识别文本段进行语义完整性预测时,该延迟识别模型会按照预设延迟个数进行延迟判断,以使该延迟识别模型可以参考该待识别文本段中位于文本尾部的预设延迟个数的字符,判断该待识别文本段中除了位于文本尾部的预设延迟个数的字符以外的其他字符构成的语句是否具有完整语义。例如,若预设延迟个数为2,则在将语句“明天去北京太”输入到延迟识别模型时该延迟识别模型可以参考“太”判断“明天去北京”是否具有完整语义。可见,延迟识别模型针对输入数据输出的完整性概率实际用于表征该输入数据中除了最后预设延迟个数字符以外的其他字符构成的语句是否具有完整语义。
基于上述步骤111至步骤113的相关内容可知,在获取到待识别文本段之后,可以先依据该待识别文本段,生成该待识别文本段的文本向量以及标签向量;再依据该待识别文本段的文本向量以及标签向量,生成该待识别文本段的语义特征,以使该语义特征能够更准确地表征出该待识别文本段携带的语义信息;最后,基于该待识别文本段的语义特征进行完整语义识别,得到该待识别文本段的完整性概率,以使该完整性概率能够准确地表示出该待识别文本段中是否存在具有完整语义的语句。
步骤12:根据待识别文本段的完整性概率和预设阈值,判断待识别文本段是否包括完整性语句。
其中,预设阈值可以预先设定,而且本申请实施例不限定预设阈值,例如,预设阈值可以为0.5。
本申请实施例中,在获取到待识别文本段的完整性概率之后,可以依据该待识别文本段的完整性概率和预设阈值,判断该待识别文本段是否包括完整性语句;而且该判断过程具体可以为:判断待识别文本段的完整性概率是否高于预设阈值;若待识别文本段的完整性概率高于预设阈值,则确定待识别文本段包括完整性语句;若待识别文本段的完整性概率不高于预设阈值,则确定待识别文本段不包括完整性语句。
基于上述步骤11至步骤12的相关内容可知,在获取到待识别文本段之后,可以先计算该待识别文本段的完整性概率,以使该完整性概率能够准确地表示出该待识别文本段中是否存在语义完整的语句;再将该待识别文本段的完整性概率与预设阈值进行比对,得到比对结果,以使该比对结果表示待识别文本段的完整性概率与预设阈值之间的相对大小;最后,根据该比对结果,确定待识别文本段是否包括完整性语句。
实际上,S4中的“语义理解”可以是指针对待识别文本段中携带的完整性语义进行语义理解;而且本申请实施例不限定S4中的“语义理解”的实施方式,可以采用现有的或者未来出现的任一种语义理解方法进行实施。
在一些情况下,待识别文本段携带的词性信息以及依存关系能够影响该待识别文本段的语义理解,故为了提高语义理解的准确性,本申请实施例还提供了“对待识别文本段进行语义理解”的一种可能的实施方式,其具体可以包括步骤31-步骤34:
步骤31:根据待识别文本段,确定待理解文本。
其中,待理解文本是指具有完整语义的语句;而且本申请实施例不限定待理解文本的获取方式(也就是步骤31的实施方式)。为了便于理解,下面结合两个示例进行说明。
示例1,若待识别文本段的完整性概率是通过上文完整性识别模型确定的,则步骤31具体可以为:将待识别文本段确定为待理解文本。
可见,若待识别文本段的完整性概率是通过上文完整性识别模型确定的,则该完整性概率实际用于描述待识别文本段是否具有完整语义,故在根据该完整性概率确定出该待识别文本段包括完整性语句之后,可以确定该待识别文本段具有完整语义,故可以直接将该待识别文本段确定为待理解文本。
示例2,若待识别文本段的完整性概率是通过上文延迟识别模型确定的,则步骤31具体可以为:按照预设延迟个数对待识别文本段进行截取,得到待理解文本。
可见,若待识别文本段的完整性概率是通过上文延迟识别模型确定的,则该完整性概率实际用于描述待识别文本段中除了最后预设延迟个数字符以外的其他字符构成的语句是否具有完整语义,故在根据该完整性概率确定出该待识别文本段包括完整性语句之后,可以确定该待识别文本段中除了最后预设延迟个数字符以外的其他字符构成的语句具有完整语义,故可以按照预设延迟个数对待识别文本段进行截取,得到待理解文本,以使该待理解文本为待识别文本段中除了最后预设延迟个数字符以外的其他字符构成的语句。
基于上述步骤31的相关内容可知,在确定待识别文本段包括完整性语句之后,可以将该待识别文本段中的完整性语句,确定为待理解文本,以使该待理解文本具有完整语义。
步骤32:对待理解文本进行词性标注,得到待使用词性。
其中,待使用词性包括待理解文本中待处理对象的词性;而且待处理对象可以为字和/或词。另外,本申请实施例不限定待处理对象的词性,例如,待处理对象的词性可以根据预先设定的通用词性(如,人名(N)、地名(L)、名词(M)、时间(D)、动词(V)、量词(S)、补语(B)等等)和/或预先设定的技术领域专用词性进行标注。
需要说明的是,本申请实施例不限定待使用词性的表示方式,可以采用现有的或者未来出现的任一种文本的词性表示方式进行表示。另外,本申请实施例也不限定待使用词性的获取方式,可以采用现有的或者未来出现的任一种针对文本进行词性标注方法(如,序列标注)进行实施。
在一些情况下,为了提高词性识别准确性,可以参考待理解文本的上文文本携带的语义信息进行词性标注。基于此,本申请实施例还提供了步骤32的一种可能的实施方式,其具体可以包括步骤321-步骤322:
步骤321:获取待理解文本的语义特征和待理解文本的上文特征。
其中,待理解文本的语义特征用于表征该待理解文本携带的语义信息。另外,本申请实施例不限定待理解文本的语义特征的获取过程,可以采用现有的或者未来出现的任一种语义特征的提取方法进行实施。例如,待理解文本的语义特征的获取过程可以采用上文获取待识别文本段的语义特征的任一实施方式进行实施,只需将上文获取待识别文本段的语义特征的任一实施方式中的“待识别文本段”替换为“待理解文本”即可。
需要说明的是,为了节省成本,待理解文本的语义特征的提取过程以及待识别文本段的语义特征的提取过程可以共用一个语义特征提取器(如图8所示)。
待理解文本的上文特征用于表征待理解文本的上文文本携带的语义信息;而且该待理解文本的上文文本携带有该待理解文本的上文语义信息。其中,待理解文本的上文文本包括生成时间早于该待理解文本的用户语句。
另外,本申请实施例不限定待理解文本的上文特征的获取过程。为了便于理解,下面以两种可能的实施方式进行说明。
在第一种可能的实施方式中,待理解文本的上文特征的获取过程具体可以为:先获取待理解文本的上文文本;再基于待理解文本的上文文本,生成待理解文本的上文特征。
需要说明的是,本申请实施例不限定待理解文本的上文文本的获取方式。另外,本申请实施例也不限定根据待理解文本的上文文本,生成待理解文本的上文特征的实施方式,可以采用现有的或者未来出现的任一种针对文本进行语义特征提取的方法进行实施,例如,其具体可以采用上文获取待识别文本段的语义特征的任一实施方式进行实施,只需将上文获取待识别文本段的语义特征的任一实施方式中的“待识别文本段”替换为“待理解文本的上文文本”即可。
需要说明的是,为了节省成本,待理解文本的语义特征的提取过程、待识别文本段的语义特征的提取过程、以及待理解文本的上文特征的提取过程均可以共用一个语义特征提取器。
可见,本申请实施例中,可以先根据待理解文本,获取该待理解文本的上文文本;在对该待理解文本的上文文本进行语义特征提取,得到该待理解文本的上文特征,以使该上文特征能够准确地表征该待理解文本的上文文本携带的语义信息。
在第二种可能的实施方式下,待理解文本的上文特征的获取过程具体可以包括步骤41-步骤42:
步骤41:获取待理解文本的上文语义。
其中,待理解文本的上文语义用于描述待理解文本的上文文本携带的语义信息。另外,本申请实施例不限定待理解文本的上文语义的获取方式,例如,待理解文本的上文语义可以是在历史时间段内利用本申请实施例提供的语义理解方法的任一实施方式针对待理解文本的上文文本进行语义理解得到的。
步骤42:对待理解文本的上文语义进行向量化,得到待理解文本的上文特征。
需要说明的是,本申请实施例不限定步骤42中向量化的实施方式,例如,可以采用现有的或未来出现的任一种能够将语义信息进行向量化转换的方法(如,word2vec等词嵌入方法)进行实施。
基于上述步骤41至步骤42的相关内容可知,在获取到待理解文本的上文语义之后,可以直接将该待理解文本的上文语义进行向量化处理,得到该待理解文本的上文特征,以使该上文特征能够准确地表征该待理解文本的上文文本携带的语义信息。
基于上述步骤321的相关内容可知,在获取到待理解文本之后,可以根据该待处理文本分别获取该待理解文本的语义特征以及上文特征,以使该语义特征能够准确地表示出该待理解文本携带的语义信息,并使得该上文特征能够准确地表征该待理解文本的上文文本携带的语义信息。
步骤322:根据待理解文本的语义特征和待理解文本的上文特征进行词性标注,得到待使用词性。
需要说明的是,本申请实施例不限定步骤322中“待使用词性”的获取过程,可以采用现有的或者未来出现的任一种能够根据待理解文本的语义特征以及上文特征进行词性标注的方法进行实施。
基于上述步骤321至步骤322的相关内容可知,在获取到待理解文本之后,可以先根据该待理解文本,确定该待理解文本的语义特征以及上文特征;再根据该待理解文本的语义特征以及上文特征进行词性标注,得到待使用词性,以使该待使用词性能够准确地表示出该待理解文本中字和/或词的词性。
步骤33:对待理解文本进行依存关系识别,得到待使用依存关系。
待使用依存关系包括待理解文本中待处理对象对(也就是,不同待处理对象)之间的依存关系;而且待处理对象可以为字和/或词。另外,本申请实施例不限定待处理对象对的依存关系,例如,待处理对象对之间的依存关系可以根据预先设定的通用依存关系(如,主谓、动宾、并列、动补等等)和/或预先设定的技术领域专用依存关系进行标注。
需要说明的是,本申请实施例不限定待使用依存关系的表示方式,可以采用现有的或者未来出现的任一种文本的依存关系表示方式进行表示。另外,本申请实施例也不限定待使用依存关系的获取方式,可以采用现有的或者未来出现的任一种针对文本进行依存关系识别方法进行实施。
在一些情况下,为了提高依存关系的识别准确性,可以参考待理解文本的上文文本携带的语义信息进行依存关系识别。基于此,本申请实施例还提供了步骤33的一种可能的实施方式,其具体可以包括步骤331-步骤332:
步骤331:获取待理解文本的语义特征和待理解文本的上文特征。
需要说明的是,步骤331的相关内容请参见上文步骤321。
步骤332:根据待理解文本的语义特征和待理解文本的上文特征,确定待使用词性和待使用依存关系。
需要说明的是,本申请实施例也不限定步骤332中“待使用依存关系”的获取过程,可以采用现有的或者未来出现的任一种能够根据待理解文本的语义特征以及上文特征进行依存关系识别的方法进行实施。
基于上述步骤331至步骤332的相关内容可知,在获取到待理解文本之后,可以先根据该待理解文本,确定该待理解文本的语义特征以及上文特征;再根据该待理解文本的语义特征以及上文特征进行依存关系识别,得到待使用依存关系,以使该待使用依存关系能够准确地表示出该待理解文本中不同待处理对象之间的依存关系。
步骤33:根据待理解文本、待使用词性和待使用依存关系,确定待理解文本的语义信息。
其中,待理解文本的语义信息用于描述该待理解文本携带的语义信息;而且,本申请实施例不限定待理解文本的语义信息的表示方式,例如,待理解文本的语义信息可以包括意图和槽位。
另外,本申请实施例不限定步骤33的实施方式,可以采用现有的或未来出现的任一种能够根据待理解文本、待使用词性和待使用依存关系进行语义理解的方法进行实施。
在一些情况下,一个技术领域中可以包括N个业务场景,而且同一个语句在不同业务场景下携带的语义信息不同,故为了提高语义信息的识别准确性,可以分别利用各个业务场景下专用的语义理解模型对待理解文本进行语义理解,以得到该待理解文本在各个业务场景下携带的语义信息。
基于此,本申请实施例提供了步骤33的一种可能的实施方式,在该实施方式中,当待理解文本的语义信息包括N个场景语义信息时,步骤33具体可以包括:根据待理解文本、待使用词性、待使用依存关系和预先构建的第i个场景语义理解模型,确定第i个场景语义信息,以使该第i个场景语义信息表征该待理解文本在第i个业务场景下所携带的语义信息。其中,i为正整数,i≤N,且N为应用场景总数。
其中,第i个场景语义理解模型专用于进行第i个业务场景下的语义理解,而且第i个场景语义理解模型是根据第i个场景训练数据进行构建的。
第i个场景训练数据是指第i个业务场景下的训练数据。另外,本申请实施例不限定第i个场景训练数据,例如,第i个场景训练数据可以包括第三语句样本、该第三语句样本对应的词性、该第三语句样本对应的依存关系和该第三语句样本的实际语义。第三语句样本对应的词性包括该第三语句样本中待处理对象的词性。第三语句样本对应的依存关系包括该第三语句样本中待处理对象对之间的依存关系。第三语句样本的实际语义用于描述该第三语句样本实际携带的语义信息。其中,第三语句样本在第i个场景语义理解模型中充当该第i个场景语义理解模型的输入数据;而且该第三语句样本的实际语义信息在第i个场景语义理解模型中充当该第i个场景语义理解模型的标签数据,以使该第三语句样本的实际语义信息用于指导该第i个场景语义理解模型的更新过程。
另外,本申请实施例不限定第i个场景语义信息的获取过程,例如,在一种可能的实施方式下,第i个场景语义信息的获取过程具体可以为:将待理解文本、待使用词性和待使用依存关系输入第i个场景语义理解模型,得到该第i个场景语义理解模型输出的第i个场景语义信息。
在一些情况下,待理解文本可能会存在一些影响语义理解的结构(如,并列结构等)和/或内容(如,指代词、缺失词、逻辑搭配错误的词等),故为了提高语义理解的准确性,可以在第i个场景语义信息进行校正处理(如,并列拆分,共指消解,缺失补齐,逻辑校验等)。基于此,本申请实施例提供了获取第i个场景语义信息的两种可能的实施方式,下面分别进行介绍。
在一些情况下,可以对待理解文本先进行校正再进行语义理解。基于此,本申请实施例提供了获取第i个场景语义信息的一种可能的实施方式,其具体可以包括步骤51-步骤52:
步骤51:根据待使用词性、待使用依存关系和第i个场景知识库,对待理解文本进行第二校正处理,得到待使用文本。
其中,第i个场景知识库用于记录第i个业务场景下的业务知识。另外,本申请实施例不限定业务知识,例如,该业务知识可以包括结构化的三元组<实体,属性,值>(例如,三元组<5元流量套餐,流量限制,10GB>可以表示出5元流量套餐的流量限制是10GB的业务知识)。又如,该业务知识也可以包括词汇搭配逻辑,以使该词汇搭配逻辑用于描述不同词汇之间的合理搭配(如,名词“电视”可以与动词“看”进行搭配,但是不能与动词“吃”进行搭配)。
第二校正处理用于对语句文本(例如,待理解文本)进行校正处理;而且本申请实施例不限定第二校正处理。例如,第二校正处理可以包括并列拆分、共指消解、缺失补齐和逻辑校验中的至少一个。
并列拆分是指将语句文本中具有并列关系的多个对象(例如,该对象可以是字、词或语句等)进行拆分。例如,对于语句文本”打开空调和电灯”来说,因对象“空调”和对象“电灯”之间存在并列关系,故可以将语句文本”打开空调和电灯”拆分成两个语句文本“打开空调”和“打开电灯”,以便后续能够从该两个语句文本中准确地识别出语义信息。
可见,并列拆分是针对存在并列关系的语句文本进行校正的,故为了提高校正效率,在待理解文本的校正过程中,可以先根据待使用依存关系判断该待理解文本中是否存在并列关系,再在确定待理解文本中存在并列关系时执行并列拆分过程,并在确定待理解文本中不存在并列关系时不执行并列拆分过程。需要说明的是,本申请实施例不限定并列拆分的实施方式,可以采用现有的或者未来出现的任一种能够实现并列拆分的方法进行实施。
共指消解是指当语句文本中的至少一个对象(如,他、她、它、这、那等)指代了该语句文本的上文文本中一些信息时需要对这些对象进行指代消解;而且本申请实施例不限定这些对象的词性,例如,这些对象可以是主语、宾语等。例如,对于文本内容“订一张周六去北京的机票,看一下那边的天气”来说,当语句文本为“看一下那边的天气”,且该语句文本的上文文本为“订一张周六去北京的机票”时,该语句文本中的指代词“那边”用于修饰“天气”,而且该指代词“那边”用于指代一个地点;其中,因在该语句文本的上文文本中提到“北京”这一个地点,故可以确定指代词“那边”具体用于指代“北京”这一地点,从而可以将语句文本“看一下那边的天气”进行指代消解,得到校正后文本“看一下北京的天气”。
可见,共指消解是针对语句文本中的指代词进行校正的,故为了提高校正效率,在待理解文本的校正过程中,可以先判断该待理解文本中是否存在指代词,再在确定该待理解文本中存在指代词时对该待理解文本进行共指消解,并在确定该待理解文本中不存在指代词时不对该待理解文本进行共指消解。需要说明的是,本申请实施例不限定共指消解的实施方式,可以采用现有的或者未来出现的任一种能够实现共指消解的方法进行实施。
缺失补齐是指将语句文本中省略的字和/或词进行补齐,而且本申请实施例不限定上述字和/或词的词性,例如,上述字和/或词可以是主语、宾语等。例如,对于文本内容来“打开空调,温度调至20度”说,当语句文本为“温度调至20度”,且该语句文本的上文文本为“打开空调”时,可以根据依存关系、词性、业务知识以及该语句文本的上文文本,确定出语句文本“温度调至20度”中省略了被控制设备“空调”,故可以对语句文本“温度调至20度”进行缺失补齐,得到校正后文本“空调的温度调至20度”。
可见,缺失补齐是针对存在省略字和/或词的语句文本进行校正的,故为了提高校正效率,在待理解文本的校正过程中,可以先判断待理解文本中是否存在省略字和/或词现象,再在确定出该待理解文本中存在省略字和/或词现象时,根据待使用词性、待使用依存关系、业务知识以及该待理解文本的上文文本对该待理解文本进行缺失补齐,并在确定待理解文本中不存在省略字和/或词现象时不对该待理解文本进行缺失补齐。需要说明的是,本申请实施例不限定缺失补齐的实施方式,可以采用现有的或者未来出现的任一种能够实现缺失补齐的方法进行实施。
逻辑校验是指针对语句文本中不同对象(例如,字和/或词)之间的搭配逻辑进行校验,并针对该语句文本中搭配逻辑不合理的对象对进行校正或删除。例如,对于语句文本“把电视调高三度”来说,根据业务知识可知,因电视没有温度控制的功能,使得对象“电视”和对象“三度”之间的搭配逻辑存在问题,从而使得该语句文本存在搭配逻辑不合理的对象对,故可以根据该语句文本的上文内容(例如,“电视声音太低了”)对语句文本“把电视调高三度”进行逻辑校验,得到校正后的语句文本“把电视调高三个音量”。
可见,逻辑校验是针对存在逻辑搭配错误的语句文本进行校正的,故为了提高校正效率,在待理解文本的校正过程中,可以先根据待使用词性、待使用依存关系以及业务知识,判断该待理解文本中是否存在逻辑搭配错误;再在确定待理解文本中存在逻辑搭配错误时对该待理解文本进行逻辑校验,并在确定待理解文本中不存在逻辑搭配错误时不对该待理解文本进行逻辑校验。需要说明的是,本申请实施例不限定逻辑校验的实施方式,可以采用现有的或者未来出现的任一种能够实现逻辑校验的方法进行实施。
待使用文本是指对待理解文本进行第二校正处理之后得到的校正后的文本。
基于上述步骤51的相关内容可知,在获取到待理解文本、待使用词性、以及待使用依存关系之后,先根据该待使用词性、该待使用依存关系和第i个场景知识库,确定该待理解文本是否需要进行校正处理(例如,是否需要进行并列拆分、共指消解、缺失补齐和逻辑校验中的至少一个);再在确定该待理解文本需要校正处理时,根据待使用词性、待使用依存关系和第i个场景知识库,对待理解文本进行第二校正处理,得到待使用文本,以使该待使用文本更易于进行语义理解,如此有利于提高语义理解准确性;另外,在确定该待理解文本不需要校正处理时,可以直接将待理解文本确定为待使用文本。
步骤52:将待使用文本、待使用词性和待使用依存关系输入第i个场景语义理解模型,得到该第i个场景语义理解模型输出的第i个场景语义信息。
本申请实施例中,在获取到待使用文本之后,可以将待使用文本、待使用词性和待使用依存关系输入第i个场景语义理解模型,以使该第i个场景语义理解模型能够针对该待使用文本进行语义理解,得到并输出第i个场景语义信息,以使该第i个场景语义信息能够准确地表示出待使用文本在第i个业务场景下携带的语义信息。
基于上述步骤51至步骤52的相关内容可知,在获取到待理解文本、待使用词性、以及待使用依存关系之后,可以先根据该待使用词性、该待使用依存关系和第i个场景知识库对待理解文本进行第二校正处理,得到待使用文本,以使该待使用文本能够更准确地表示出待理解文本携带的语义信息;再将该待使用文本、该待使用词性和该待使用依存关系输入第i个场景语义理解模型,以使该第i个场景语义理解模型能够针对该待使用文本进行语义理解,得到并输出第i个场景语义信息,以使该第i个场景语义信息能够准确地表示出待理解文本在第i个业务场景下携带的语义信息,如此有利于提高语义理解的准确性。
在一些情况下,也可以对待理解文本先进行语义理解再进行校正。基于此,本申请实施例提供了获取第i个场景语义信息的一种可能的实施方式,其具体可以包括步骤61-步骤62:
步骤61:将待理解文本、待使用词性和待使用依存关系输入第i个场景语义理解模型,得到该第i个场景语义理解模型输出的第i个场景待校正语义。
其中,第i个场景待校正语义是指利用第i个场景语义理解模型对待理解文本进行语义理解得到的语义信息。
步骤62:根据待使用词性、待使用依存关系和第i个场景知识库,对第i个场景待校正语义进行第一校正处理,得到第i个场景语义信息。
其中,第一校正处理用于对语义信息进行校正处理;而且本申请实施例不限定第一校正处理。例如,第一校正处理可以包括并列拆分,共指消解,缺失补齐,逻辑校验中的至少一个。
另外,“第一校正处理”与上文“第二校正处理”的内容相似,只需将上文“第二校正处理”的相关内容中的“语句文本”替换为“语义信息”,以及“待理解文本”替换为“第i个场景待校正语义”即可。
基于上述步骤61至步骤62的相关内容可知,在获取到待理解文本、待使用词性、以及待使用依存关系之后,可以先将待理解文本、待使用词性和待使用依存关系第i个场景语义理解模型,得到该第i个场景语义理解模型输出的第i个场景待校正语义,以使该第i个场景待校正语义能够表示出待理解文本在第i个业务场景下所携带的语义信息;再根据待使用词性、待使用依存关系和第i个场景知识库,对第i个场景待校正语义进行第一校正处理(例如,进行并列拆分、共指消解、缺失补齐和逻辑校验中的至少一个),得到第i个场景语义信息,以使该第i个场景语义信息能够更准确地表示出待理解文本在第i个业务场景下所携带的语义信息。
基于上述步骤33的相关内容可知,若本申请实施例提供的语义理解方法所应用的技术领域中包括N个业务场景,则在获取到待理解文本、待使用词性以及待使用依存关系之后,可以根据待理解文本、待使用词性、待使用依存关系和第1个场景语义理解模型,确定第1个场景语义信息,以使该第1个场景语义信息能够准确地表征出待理解文本在第1个业务场景下所携带的语义信息;根据待理解文本、待使用词性、待使用依存关系和第2个场景语义理解模型,确定第2个场景语义信息,以使该第2个场景语义信息能够准确地表征出待理解文本在第2个业务场景下所携带的语义信息;……(依次类推);根据待理解文本、待使用词性、待使用依存关系和第N个场景语义理解模型,确定第N个场景语义信息,以使该第N个场景语义信息能够准确地表征出待理解文本在第N个业务场景下所携带的语义信息,如此有利于提高语义信息的识别准确性。
基于上述S4的相关内容可知,在获取到待识别文本段之后,可以先判断该待识别文本段中是否存在完整性语句,若存在,则可以对该待识别文本段中完整性语句进行语义理解,得到该待识别文本段中完整性语句携带的语义信息,以便后续能够基于该语义信息获取到用户在当前时刻先所表述的意图。
另外,在一些情况下,用户可能会在说完半句话(也就是,非完整性语句)之后不再说话,故为了能够更好地理解用户意图,可以对该半句话进行语义理解。基于此,本申请实施例还提供了语义理解方法的一种可能的实施方式,在该实施方式中,该语义理解方法除了可以包括上述S1-S4以外,可以还包括S5:
S5:若确定待识别文本段不包括完整性语句,且确定该待识别文本段在预设时长内未发生变化,则对该待识别文本段进行语义理解。
其中,预设时长可以预先设定。
另外,S5中“对该待识别文本段进行语义理解”可以采用上文S4中“对该待识别文本段进行语义理解”的任一实施方式进行实施。
本申请实施例中,在获取到待识别文本段之后,可以先判断该待识别文本段中是否存在完整性语句,若不存在,则可以确定用户还未说完,此时为了减少语义理解次数,可以不对该待识别文本段进行语义理解,而是等待新的待识别文本段的生成;然而,在确定待识别文本段在预设时长内未发生变化后,可以确定用户在预设时长内未进行说话,从而可以确定用户已经结束说话,此时,为了能够更好地理解用户在当前时刻下的意图,可以对已获取到的待识别文本段进行语义理解,得到该待识别文本段携带的语义信息。
基于上述语义理解方法的任一实施方式的相关内容可知,在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。
其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法(如,图9所示的语义理解过程)能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。另外,因当前文本段对应的未识别文本段的生成时间早于该当前文本段的生成时间,使得该当前文本段对应的未识别文本段能够描述该当前文本段的上文信息(也就是,在当前时刻之前录制的用户语音所携带的信息),从而使得根据当前文本段和该当前文本段对应的未识别文本段生成的待识别文本段能够更准确地表征出该用户在当前时刻下表述的语义信息,从而使得在根据该待识别文本段进行的语义理解时能够更准确地获取到该用户在当前时刻下表述的语义信息,如此能够提高语义理解的准确性。
基于上述方法实施例提供的语义理解方法,本申请实施例还提供了一种语义理解装置,下面结合附图进行解释和说明。
装置实施例
装置实施例对语义理解装置进行介绍,相关内容请参见上述方法实施例。
参见图10,该图为本申请实施例提供的一种语义理解装置的结构示意图。
本申请实施例提供的语义理解装置1000,包括:
语音获取单元1001,用于获取当前语音段;
语音识别单元1002,用于对所述当前语音段进行语音识别,得到当前文本段;
文本生成单元1003,用于根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段;其中,所述当前文本段对应的未识别文本段的生成时间早于所述当前文本段的生成时间;
语义理解单元1004,用于若确定所述待识别文本段包括完整性语句,则对所述待识别文本段进行语义理解。
在一种可能的实施方式下,所述文本生成单元1003,具体用于:将所述当前文本段和所述当前文本段对应的未识别文本段进行拼接,得到所述待识别文本段。
在一种可能的实施方式下,所述语义理解装置1000还包括:
概率确定单元,用于确定所述待识别文本段的完整性概率;其中,所述待识别文本段的完整性概率用于表征所述待识别文本段中存在完整性语句的可能性;
完整性判断单元,用于根据所述待识别文本段的完整性概率和预设阈值,判断所述待识别文本段是否包括完整性语句。
在一种可能的实施方式下,所述概率确定单元,包括:
第一生成子单元,用于生成所述待识别文本段的文本向量和所述待识别文本段的标签向量;
第二生成子单元,用于根据所述待识别文本段的文本向量和所述待识别文本段的标签向量,生成所述待识别文本段的语义特征;
第一确定子单元,用于根据所述待识别文本段的语义特征进行完整性识别,确定所述待识别文本段的完整性概率。
在一种可能的实施方式下,所述待识别文本段的标签向量的生成过程包括:
对所述待识别文本段进行标签标注,得到待使用标签;其中,所述待使用标签包括所述待识别文本段中待处理对象的相关信息;
对所述待使用标签进行向量化,得到所述待识别文本段的标签向量。
在一种可能的实施方式下,所述概率确定单元,具体用于:将所述待识别文本段的语义特征输入预先训练的延迟识别模型,得到所述延迟识别模型输出的所述待识别文本段的完整性概率;其中,所述延迟识别模型是根据待训练样本的语义特征和所述待训练样本的实际标签进行训练得到的;所述待训练样本为延迟文本或非延迟文本;所述延迟文本包括具有完整语义的语句和预设延迟个数的字符。
在一种可能的实施方式下,所述语义理解单元1004,包括:
第二确定子单元,用于根据所述待识别文本段,确定待理解文本;
第三确定子单元,用于对所述待理解文本进行词性标注,得到待使用词性;
第四确定子单元,用于对所述待理解文本进行依存关系识别,得到待使用依存关系;
第五确定子单元,用于根据所述待理解文本、所述待使用词性和所述待使用依存关系,确定所述待理解文本的语义信息。
在一种可能的实施方式下,所述语义理解装置1000,还包括:
特征获取单元,用于获取所述待理解文本的语义特征和所述待理解文本的上文特征;其中,所述待理解文本的上文特征用于表征所述待理解文本的上文文本携带的语义信息;
所述第三确定子单元,具体用于:根据所述待理解文本的语义特征和所述待理解文本的上文特征进行词性标注,得到待使用词性;
第四确定子单元,具体用于根据所述待理解文本的语义特征和所述待理解文本的上文特征进行依存关系识别,得到待使用依存关系。
在一种可能的实施方式下,所述待理解文本的上文特征的获取过程为:
获取所述待理解文本的上文文本;基于所述待理解文本的上文文本,生成所述待理解文本的上文特征;
或者,
获取所述待理解文本的上文语义;对所述待理解文本的上文语义进行向量化,得到所述待理解文本的上文特征。
在一种可能的实施方式下,所述待理解文本的语义信息包括N个场景语义信息;第i个场景语义信息表征所述待理解文本在第i个业务场景下所携带的语义信息;i为正整数,i≤N;
所述第四确定子单元,包括:
第i个场景语义信息确定子单元,用于根据所述待理解文本、所述待使用词性、所述待使用依存关系和预先构建的第i个场景语义理解模型,确定所述第i个场景语义信息;其中,所述第i个场景语义理解模型是根据第i个场景训练数据进行构建的。
在一种可能的实施方式下,所述第i个场景语义信息确定子单元,具体用于:将所述待理解文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的所述第i个场景语义信息;
在一种可能的实施方式下,所述第i个场景语义信息确定子单元,具体用于:将所述待理解文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的第i个场景待校正语义;根据所述待使用词性、所述待使用依存关系和第i个场景知识库,对所述第i个场景待校正语义进行第一校正处理,得到所述第i个场景语义信息;
在一种可能的实施方式下,所述第i个场景语义信息确定子单元,具体用于:根据所述待使用词性、所述待使用依存关系和第i个场景知识库,对所述待理解文本进行第二校正处理,得到待使用文本;将所述待使用文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的所述第i个场景语义信息。
在一种可能的实施方式下,所述语义理解装置1000还包括:
语义确定单元,用于若确定所述待识别文本段不包括完整性语句,且确定所述待识别文本段在预设时长内未发生变化,则对所述待识别文本段进行语义理解。
进一步地,本申请实施例还提供了一种语义理解设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述语义理解方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述语义理解方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行上述语义理解方法的任一种实现方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种语义理解方法,其特征在于,所述方法包括:
获取当前语音段;
对所述当前语音段进行语音识别,得到当前文本段;
根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段;其中,所述当前文本段对应的未识别文本段的生成时间早于所述当前文本段的生成时间;
若确定所述待识别文本段包括完整性语句,则对所述待识别文本段进行语义理解。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段,包括:
将所述当前文本段和所述当前文本段对应的未识别文本段进行拼接,得到所述待识别文本段。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述待识别文本段的完整性概率;其中,所述待识别文本段的完整性概率用于表征所述待识别文本段中存在完整性语句的可能性;
根据所述待识别文本段的完整性概率和预设阈值,判断所述待识别文本段是否包括完整性语句。
4.根据权利要求3所述的方法,其特征在于,所述根据所述待识别文本段,确定所述待识别文本段的完整性概率,包括:
生成所述待识别文本段的文本向量和所述待识别文本段的标签向量;
根据所述待识别文本段的文本向量和所述待识别文本段的标签向量,生成所述待识别文本段的语义特征;
根据所述待识别文本段的语义特征进行完整性识别,确定所述待识别文本段的完整性概率。
5.根据权利要求4所述的方法,其特征在于,所述待识别文本段的标签向量的生成过程包括:
对所述待识别文本段进行标签标注,得到待使用标签;其中,所述待使用标签包括所述待识别文本段中待处理对象的相关信息;
对所述待使用标签进行向量化,得到所述待识别文本段的标签向量。
6.根据权利要求4所述的方法,其特征在于,所述根据所述待识别文本段的语义特征,确定所述待识别文本段的完整性概率,包括:
将所述待识别文本段的语义特征输入预先训练的延迟识别模型,得到所述延迟识别模型输出的所述待识别文本段的完整性概率;其中,所述延迟识别模型是根据待训练样本的语义特征和所述待训练样本的实际标签进行训练得到的;所述待训练样本为延迟文本或非延迟文本;所述延迟文本包括具有完整语义的语句和预设延迟个数的字符。
7.根据权利要求1所述的方法,其特征在于,所述对所述待识别文本段进行语义理解,包括:
根据所述待识别文本段,确定待理解文本;
对所述待理解文本进行词性标注,得到待使用词性;
对所述待理解文本进行依存关系识别,得到待使用依存关系;
根据所述待理解文本、所述待使用词性和所述待使用依存关系,确定所述待理解文本的语义信息。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取所述待理解文本的语义特征和所述待理解文本的上文特征;其中,所述待理解文本的上文特征用于表征所述待理解文本的上文文本携带的语义信息;
所述对所述待理解文本进行词性标注,得到待使用词性,包括:
根据所述待理解文本的语义特征和所述待理解文本的上文特征进行词性标注,得到待使用词性;
所述对所述待理解文本进行依存关系识别,得到待使用依存关系,包括:
根据所述待理解文本的语义特征和所述待理解文本的上文特征进行依存关系识别,得到待使用依存关系。
9.根据权利要求8所述的方法,其特征在于,所述待理解文本的上文特征的获取过程为:
获取所述待理解文本的上文文本;基于所述待理解文本的上文文本,生成所述待理解文本的上文特征;
或者,
获取所述待理解文本的上文语义;对所述待理解文本的上文语义进行向量化,得到所述待理解文本的上文特征。
10.根据权利要求7所述的方法,其特征在于,所述待理解文本的语义信息包括N个场景语义信息;第i个场景语义信息表征所述待理解文本在第i个业务场景下所携带的语义信息;i为正整数,i≤N;
所述第i个场景语义信息的确定过程为:
根据所述待理解文本、所述待使用词性、所述待使用依存关系和预先构建的第i个场景语义理解模型,确定所述第i个场景语义信息;其中,所述第i个场景语义理解模型是根据第i个场景训练数据进行构建的。
11.根据权利要求10所述的方法,其特征在于,所述根据所述待理解文本、所述待使用词性、所述待使用依存关系和预先构建的第i个场景语义理解模型,确定所述第i个场景语义信息,包括:
将所述待理解文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的所述第i个场景语义信息;
或者,
将所述待理解文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的第i个场景待校正语义;根据所述待使用词性、所述待使用依存关系和第i个场景知识库,对所述第i个场景待校正语义进行第一校正处理,得到所述第i个场景语义信息;
或者,
根据所述待使用词性、所述待使用依存关系和第i个场景知识库,对所述待理解文本进行第二校正处理,得到待使用文本;将所述待使用文本、所述待使用词性和所述待使用依存关系输入所述第i个场景语义理解模型,得到所述第i个场景语义理解模型输出的所述第i个场景语义信息。
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若确定所述待识别文本段不包括完整性语句,且确定所述待识别文本段在预设时长内未发生变化,则对所述待识别文本段进行语义理解。
13.一种语义理解装置,其特征在于,所述装置包括:
语音获取单元,用于获取当前语音段;
语音识别单元,用于对所述当前语音段进行语音识别,得到当前文本段;
文本生成单元,用于根据所述当前文本段和所述当前文本段对应的未识别文本段,生成待识别文本段;其中,所述当前文本段对应的未识别文本段的生成时间早于所述当前文本段的生成时间;
语义理解单元,用于若确定所述待识别文本段包括完整性语句,则对所述待识别文本段进行语义理解。
14.一种语义理解设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1-12任一项所述的语义理解方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1至12任一项所述的语义理解方法。
CN202011569220.8A 2020-12-26 2020-12-26 一种语义理解方法、装置、设备以及计算机可读存储介质 Pending CN112700769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011569220.8A CN112700769A (zh) 2020-12-26 2020-12-26 一种语义理解方法、装置、设备以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011569220.8A CN112700769A (zh) 2020-12-26 2020-12-26 一种语义理解方法、装置、设备以及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112700769A true CN112700769A (zh) 2021-04-23

Family

ID=75511064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011569220.8A Pending CN112700769A (zh) 2020-12-26 2020-12-26 一种语义理解方法、装置、设备以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112700769A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113806505A (zh) * 2021-09-09 2021-12-17 科大讯飞股份有限公司 要素比对方法、装置、电子设备和存储介质
CN113903329A (zh) * 2021-09-08 2022-01-07 北京百度网讯科技有限公司 语音处理方法、装置、电子设备及存储介质
CN114078478A (zh) * 2021-11-12 2022-02-22 北京百度网讯科技有限公司 语音交互的方法、装置、电子设备及存储介质
CN114743542A (zh) * 2022-04-29 2022-07-12 青岛海尔科技有限公司 语音处理的方法、装置、存储介质及电子装置
CN115982352A (zh) * 2022-12-12 2023-04-18 北京百度网讯科技有限公司 文本分类方法、装置以及设备

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163631A (ja) * 2004-12-03 2006-06-22 Csk Holdings Corp 自然言語解析装置、自然言語解析方法、及び、自然言語解析プログラム
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text
CN107146602A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音识别方法、装置及电子设备
CN107665706A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 快速语音交互方法及系统
CN107943834A (zh) * 2017-10-25 2018-04-20 百度在线网络技术(北京)有限公司 人机对话的实现方法、装置、设备及存储介质
CN108257616A (zh) * 2017-12-05 2018-07-06 苏州车萝卜汽车电子科技有限公司 人机对话的检测方法以及装置
US20180275817A1 (en) * 2017-03-27 2018-09-27 Tricorn (Beijing) Technology Co., Ltd. Information processing apparatus, information processing method and computer-readable storage medium
CN109086276A (zh) * 2018-08-27 2018-12-25 Oppo广东移动通信有限公司 数据翻译方法、装置、终端及存储介质
CN109473104A (zh) * 2018-11-07 2019-03-15 苏州思必驰信息科技有限公司 语音识别网络延时优化方法及装置
CN110890090A (zh) * 2018-09-11 2020-03-17 涂悦 基于上下文的辅助交互控制方法及系统
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质
CN111292729A (zh) * 2020-02-06 2020-06-16 北京声智科技有限公司 音频数据流的处理方法和装置
CN111402866A (zh) * 2020-03-23 2020-07-10 北京声智科技有限公司 语义识别方法、装置及电子设备
CN111627463A (zh) * 2019-02-28 2020-09-04 百度在线网络技术(北京)有限公司 语音vad尾点确定方法及装置、电子设备和计算机可读介质
CN111627423A (zh) * 2019-02-27 2020-09-04 百度在线网络技术(北京)有限公司 Vad尾点检测方法、装置、服务器和计算机可读介质
WO2020206957A1 (zh) * 2019-04-09 2020-10-15 苏宁云计算有限公司 一种应用于智能客服机器人的意图识别方法及装置
CN111785259A (zh) * 2019-04-04 2020-10-16 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
WO2020211756A1 (zh) * 2019-04-15 2020-10-22 深圳数字生命研究院 语义识别方法、装置、计算机可读存储介质和计算机设备
CN111862980A (zh) * 2020-08-07 2020-10-30 斑马网络技术有限公司 一种增量语义处理方法
US20200365134A1 (en) * 2019-05-14 2020-11-19 Samsung Electronics Co., Ltd. Method, apparatus, electronic device, and computer readable storage medium for voice translation
CN112053687A (zh) * 2020-07-31 2020-12-08 出门问问信息科技有限公司 一种语音处理方法、装置、计算机可读存储介质及设备
CN112101045A (zh) * 2020-11-02 2020-12-18 北京淇瑀信息科技有限公司 一种多模态语义完整性识别方法、装置及电子设备

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163631A (ja) * 2004-12-03 2006-06-22 Csk Holdings Corp 自然言語解析装置、自然言語解析方法、及び、自然言語解析プログラム
US20100128042A1 (en) * 2008-07-10 2010-05-27 Anthony Confrey System and method for creating and displaying an animated flow of text and other media from an input of conventional text
CN107665706A (zh) * 2016-07-29 2018-02-06 科大讯飞股份有限公司 快速语音交互方法及系统
US20180275817A1 (en) * 2017-03-27 2018-09-27 Tricorn (Beijing) Technology Co., Ltd. Information processing apparatus, information processing method and computer-readable storage medium
CN107146602A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种语音识别方法、装置及电子设备
CN107943834A (zh) * 2017-10-25 2018-04-20 百度在线网络技术(北京)有限公司 人机对话的实现方法、装置、设备及存储介质
CN108257616A (zh) * 2017-12-05 2018-07-06 苏州车萝卜汽车电子科技有限公司 人机对话的检测方法以及装置
CN109086276A (zh) * 2018-08-27 2018-12-25 Oppo广东移动通信有限公司 数据翻译方法、装置、终端及存储介质
CN110890090A (zh) * 2018-09-11 2020-03-17 涂悦 基于上下文的辅助交互控制方法及系统
CN109473104A (zh) * 2018-11-07 2019-03-15 苏州思必驰信息科技有限公司 语音识别网络延时优化方法及装置
CN111627423A (zh) * 2019-02-27 2020-09-04 百度在线网络技术(北京)有限公司 Vad尾点检测方法、装置、服务器和计算机可读介质
CN111627463A (zh) * 2019-02-28 2020-09-04 百度在线网络技术(北京)有限公司 语音vad尾点确定方法及装置、电子设备和计算机可读介质
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN111785259A (zh) * 2019-04-04 2020-10-16 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
WO2020206957A1 (zh) * 2019-04-09 2020-10-15 苏宁云计算有限公司 一种应用于智能客服机器人的意图识别方法及装置
WO2020211756A1 (zh) * 2019-04-15 2020-10-22 深圳数字生命研究院 语义识别方法、装置、计算机可读存储介质和计算机设备
US20200365134A1 (en) * 2019-05-14 2020-11-19 Samsung Electronics Co., Ltd. Method, apparatus, electronic device, and computer readable storage medium for voice translation
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质
CN111292729A (zh) * 2020-02-06 2020-06-16 北京声智科技有限公司 音频数据流的处理方法和装置
CN111402866A (zh) * 2020-03-23 2020-07-10 北京声智科技有限公司 语义识别方法、装置及电子设备
CN112053687A (zh) * 2020-07-31 2020-12-08 出门问问信息科技有限公司 一种语音处理方法、装置、计算机可读存储介质及设备
CN111862980A (zh) * 2020-08-07 2020-10-30 斑马网络技术有限公司 一种增量语义处理方法
CN112101045A (zh) * 2020-11-02 2020-12-18 北京淇瑀信息科技有限公司 一种多模态语义完整性识别方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐梓翔;车万翔;刘挺;: "基于Bi-LSTM-CRF网络的语义槽识别", 智能计算机与应用, no. 06, 26 December 2017 (2017-12-26) *
雷景生;钱叶;: "基于ERNIE-BiGRU模型的中文文本分类方法", 上海电力大学学报, no. 04, 15 August 2020 (2020-08-15) *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903329A (zh) * 2021-09-08 2022-01-07 北京百度网讯科技有限公司 语音处理方法、装置、电子设备及存储介质
CN113806505A (zh) * 2021-09-09 2021-12-17 科大讯飞股份有限公司 要素比对方法、装置、电子设备和存储介质
CN113806505B (zh) * 2021-09-09 2024-04-16 科大讯飞股份有限公司 要素比对方法、装置、电子设备和存储介质
CN114078478A (zh) * 2021-11-12 2022-02-22 北京百度网讯科技有限公司 语音交互的方法、装置、电子设备及存储介质
CN114743542A (zh) * 2022-04-29 2022-07-12 青岛海尔科技有限公司 语音处理的方法、装置、存储介质及电子装置
CN115982352A (zh) * 2022-12-12 2023-04-18 北京百度网讯科技有限公司 文本分类方法、装置以及设备
CN115982352B (zh) * 2022-12-12 2024-04-02 北京百度网讯科技有限公司 文本分类方法、装置以及设备

Similar Documents

Publication Publication Date Title
CN112700769A (zh) 一种语义理解方法、装置、设备以及计算机可读存储介质
CN109635270B (zh) 双向概率性的自然语言重写和选择
KR101259558B1 (ko) 문장경계 인식 장치 및 방법
CN110020424B (zh) 合同信息的提取方法、装置和文本信息的提取方法
US11217236B2 (en) Method and apparatus for extracting information
US11308937B2 (en) Method and apparatus for identifying key phrase in audio, device and medium
CN109858038B (zh) 一种文本标点确定方法及装置
US20170308526A1 (en) Compcuter Implemented machine translation apparatus and machine translation method
CN111858854B (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN113010638B (zh) 实体识别模型生成方法及装置、实体提取方法及装置
WO2023108994A1 (zh) 一种语句生成方法及电子设备、存储介质
CN111859940B (zh) 一种关键词提取方法、装置、电子设备及存储介质
US20230186033A1 (en) Guided text generation for task-oriented dialogue
CN111881297A (zh) 语音识别文本的校正方法及装置
CN110825840B (zh) 词库扩充方法、装置、设备及存储介质
CN111859950A (zh) 一种自动化生成讲稿的方法
CN111507114A (zh) 基于反向翻译的口语文本增强方法及系统
US8799268B2 (en) Consolidating tags
CN112633007A (zh) 一种语义理解模型构建方法及装置、语义理解方法及装置
CN111324712A (zh) 对话回复方法及服务端
CN110717316A (zh) 字幕对话流的主题分割方法及装置
US11640233B2 (en) Foreign language machine translation of documents in a variety of formats
CN114528851A (zh) 回复语句确定方法、装置、电子设备和存储介质
CN108877781B (zh) 一种智能语音搜索影片的方法及系统
CN114398876B (zh) 一种基于有限状态转换器的文本纠错方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230504

Address after: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96

Applicant after: University of Science and Technology of China

Applicant after: IFLYTEK Co.,Ltd.

Address before: NO.666, Wangjiang West Road, hi tech Zone, Hefei City, Anhui Province

Applicant before: IFLYTEK Co.,Ltd.

TA01 Transfer of patent application right