CN111858865A - 一种语义识别方法、装置、电子设备及计算机可读存储介质 - Google Patents
一种语义识别方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111858865A CN111858865A CN201910364347.7A CN201910364347A CN111858865A CN 111858865 A CN111858865 A CN 111858865A CN 201910364347 A CN201910364347 A CN 201910364347A CN 111858865 A CN111858865 A CN 111858865A
- Authority
- CN
- China
- Prior art keywords
- sentence
- preset
- intended
- similarity
- preset reference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 21
- 239000013598 vector Substances 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 11
- 240000001417 Vigna umbellata Species 0.000 description 9
- 235000011453 Vigna umbellata Nutrition 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种语义识别方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:接收用户针对目标场景输入的意向语句;采用预设相似度算法分别计算意向语句与多个预设基准句之间的相似度;根据相似度确定与意向语句相匹配的预设基准句,并根据与意向语句相匹配的预设基准句获取意向语句的语义属性。本申请通过预设算法计算意向语句与基准句之间的相似度,从而确定意向语句的语义属性,解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,达到减小资源占用的效果。
Description
技术领域
本申请涉及语义识别技术领域,具体而言,涉及一种语义识别方法、装置、电子设备及计算机可读存储介质。
背景技术
一些智能设备(如智能音箱)或智能服务(如机器人客服)会在某些状态下,通过询问来确定用户的意图,用户可以通过语音或文字来回答,以表达肯定或否定。智能设备或服务需要根据意图句判断用户在表达肯定还是否定,以进入不同的处理流程。
现有技术中通常通过文字匹配(如果是语音,则转为文字)收集大量的肯/否定意图句,形成句库。如果用户的意图句匹配上了库中的句子,则判断为相应的类别。在此基础上可扩展为模糊匹配,或通过标注数据来实现二分类器:通过人工标注,搜集大量的肯/否定句作为语料,然后通过某种机器学习算法来在语料上训练,得到一个二分类器。
但是采用现有技术的话,由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源。
发明内容
有鉴于此,本申请的目的在于提供一种语义识别方法、装置、电子设备及计算机可读存储介质,能够通过预设算法计算意向语句与基准句之间的相似度,从而确定意向语句的语义属性,解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,从而达到减小资源占用的效果。
在本申请的第一方面,本申请提供一种语义识别方法,包括:
接收用户针对目标场景输入的意向语句;
采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度;
根据所述相似度确定与所述意向语句相匹配的预设基准句,并根据与所述意向语句相匹配的所述预设基准句获取所述意向语句的语义属性。
可选地,所述采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度之前,还包括:
获取所述目标场景对应的多个所述预设基准句,其中,多个所述预设基准句包括:肯定基准句、否定基准句。
可选地,所述采用预设相似度算法分别计算所述意向句与多个预设基准句之间的相似度,包括:根据预设模型计算所述意向语句对应的意向句向量;采用预设相似度算法分别计算各所述意向句向量与每个所述预设基准句对应的基准句向量之间的相似度。
可选地,所述采用预设相似度算法分别计算所述意向句与多个预设基准句之间的相似度,包括:
根据预设模型计算所述意向语句对应的意向句向量;
采用预设相似度算法分别计算各所述意向句向量与每个所述预设基准句对应的基准句向量之间的相似度。
可选地,所述根据所述相似度确定与所述意向语句相匹配的目标基准句,并根据与所述意向语句相匹配的目标基准句获取所述意向语句的语义属性,包括:
选择与所述意向语句相似度最高的预设基准句为所述目标基准句;
将所述目标基准句的语义属性作为所述意向语句的语义属性。
可选地,所述根据所述相似度确定与所述意向语句相匹配的目标基准句,并根据与所述意向语句相匹配的目标基准句获取所述意向语句的语义属性之后,还包括:
获取所述意向语句的语义属性对应的准确性信息。
可选地,所述获取所述意向语句的语义属性对应的准确性信息之后,还包括:
若所述准确性信息不满足预设要求,接收预设基准句更新信息,所述预设基准句更新信息包含所述目标场景对应的新的预设基准句。
进一步地,所述预设相似度算法为下述任一项:欧氏距离算法、余弦距离算法、内积算法。
在本申请的第二方面,本申请还提供了一种语义识别装置,该装置包括:接收模块、计算模块、确定模块,其中:
所述接收模块,用于接收用户针对目标场景输入的意向语句;
所述计算模块,用于采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度;
所述确定模块,用于根据所述相似度确定与所述意向语句相匹配的预设基准句,并根据与所述意向语句相匹配的所述预设基准句获取所述意向语句的语义属性。
可选地,还包括第一获取模块;所述第一获取模块,用于获取所述目标场景对应的多个所述预设基准句,其中,多个所述预设基准句包括:肯定基准句、否定基准句。
可选地,所述计算模块,具体用于根据预设模型计算所述意向语句对应的意向句向量;
采用预设相似度算法分别计算各所述意向句向量与每个所述预设基准句对应的基准句向量之间的相似度。
可选地,所述确定模块,具体用于选择与所述意向语句相似度最高的预设基准句为所述目标基准句;
将所述目标基准句的语义属性作为所述意向语句的语义属性。
可选地,所述装置还包括第二获取模块;所述第二获取模块,用于获取所述意向语句的语义属性对应的准确性信息。
可选地,还包括更新模块,所述更新模块,用于若所述准确性信息不满足预设要求,接收预设基准句更新信息,所述预设基准句更新信息包含所述目标场景对应的新的预设基准句。
可选地,所述预设相似度算法为下述任一项:欧氏距离算法、余弦距离算法、内积算法。
在本申请的第三方面,提供一种电子设备,处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述第一方面任一所述方法的步骤。在本申请的第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
基于上述任一方面,可以根据预设算法计算意向语句与基准句之间的相似度,从而确定意向语句的语义属性,并且不需要大量的语料库,从未解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,达到减小资源占用的效果。
另外,在一些实施例中,基准句可以根据意向语句确定语义属性的反馈结果,对基准句进行更新和调整,进一步保证判断的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请一实施例提供的一种语义识别系统的架构示意图;
图2示出了本申请一实施例提供的一种语义识别方法的流程示意图;
图3示出了本申请另一实施例提供的一种语义识别方法的流程示意图;
图4示出了本申请另一实施例提供的一种语义识别方法的流程示意图;
图5示出了本申请一实施例提供的一种语义识别装置的结构示意图;
图6示出了本申请另一实施例提供的一种语义识别装置的结构示意图;
图7示出了本申请另一实施例提供的一种语义识别装置的结构示意图;
图8示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“打车”或是“听歌”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕打车或是听歌进行描述,但是应该理解,这仅是一个示例性实施例,本申请可以应用于各种需要进行语义识别、语义分类的场景中。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请的一个方面涉及一种语义识别系统。该系统可以通过预设算法计算意向语句与基准句之间的相似度,从而确定意向语句的语义属性,其中语义属性可以用来表示意向语句的分类,例如肯定句、否定句、疑问句等,在此不作限制。
值得注意的是,在本申请提出申请之前,现有技术通常通过文字匹配收集大量的肯/否定意图句,形成句库。如果用户的意图句匹配上了库中的句子,则判断为相应的类别。在此基础上可扩展为模糊匹配,或通过标注数据来实现二分类器:通过人工标注,搜集大量的肯/否定句作为语料,然后通过某种机器学习算法来在语料上训练,得到一个二分类器。然而,但是采用现有技术的话,由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源。
本申请提供的语义识别方法可以通过预设算法计算意向语句与基准句之间的相似度,从而确定意向语句的语义属性。其中,基准句可以是所属分类中比较具有代表性的语句,因此,通过本申请提出的方案,可以不需要大量的语料库,从而解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,达到减小资源占用的效果。
图1是本申请实施例提供的一种语义识别系统100的架构示意图。例如,语义识别系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、或班车服务之类的运输服务、或是家庭、语音客服等任何涉及智能设备或只能服务的任意平台或场景。语义识别系统100可以包括服务器110、网络120、服务终端130、和数据库140中的一种或多种。
在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务终端130获得的服务请求来用户意图。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
在一些实施例中,服务终端130对应的设备类型可以是移动设备,比如可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,也可以是平板计算机、膝上型计算机、或机动车辆中的内置智能设备等。以“听歌”场景为例,服务终端130可以是用户的手机,用户通过手机开启听歌的客户端,服务器向听歌的客户端推送问题,例如“您现在想听歌吗?”用户可以通过客户端的回复功能进行回复,客户端根据用户回复的意向语句来识别意向语句的语义属性。
在一些实施例中,数据库140可以连接到网络120以与语义识别系统100中的一个或多个组件(例如,服务器110,服务终端130,服务提供端140等)通信。语义识别系统100中的一个或多个组件可以经由网络120访问存储在数据库140中的数据或指令。在一些实施例中,数据库140可以直接连接到语义识别系统100中的一个或多个组件,或者,数据库140也可以是服务器110的一部分。
下面结合上述图1示出的语义识别系统100中描述的内容,对本申请实施例提供的语义识别方法进行详细说明,下述语义识别方法应用与上述系统之中,执行主体可以为服务终端或者服务器,预设场景可以根据用户需要设计和调整,任何涉及智能终端或是智能服务的场景均可使用,并不以实施例给出的两个场景为限。
参照图2所示,为本申请一实施例提供的一种语义识别方法的流程示意图,该方法可以由语义是被系统100中的服务器110或服务终端来执行,包括:
S101:接收用户针对目标场景输入的意向语句。
需要说明的是,目标场景可以为服务器预设的各种交互场景,例如服务器推送的场景语句。
一些智能设备(如智能音箱、智能盒子、智能手机等)或智能服务(如机器人客服等)会在某些状态下,通过询问并接收用户的意向语句,来确定用户的真实意图,并根据用户的真实意图做出相关回答或是完成相关用户下达的命令。例如一个目标场景是用户打开约车客户端之后,客户端发出语音提示“您现在是要呼叫快车吗?”。
其中,智能设备或是智能服务的询问方式可以为语音询问或是文字询问,具体询问方式可以灵活调整,在此并不做任何限制。
其中,用户意向语句的输入方式可以为手动输入文字,也可以为语音输入,具体输入方式根据用户需要设置或切换,在此并不做任何限制。
另外需要说明的是,如果执行主体是终端,那么就直接通过输入设备接收意向语句,如果执行主体是服务器,则是终端向服务器发送接收到的意向语句。
S102:采用预设相似度算法分别计算意向语句与多个预设基准句之间的相似度。
其中,预设基准句可以是预先根据不同的目标场景配置的,也预先标注好每个预设基准句对应的语义属性。
需要说明的是,可以采用向量距离度量意向语句与预设基准句之间的相似度。
例如,预设相似度算法可以为下述任一项:欧氏距离算法(距离越小相似度越大)、余弦距离算法(距离越小相似度越大)、内积算法(内积越大相似度越大),具体算法的选择根据需要设计,在此并不做任何限制。
S103:根据相似度确定与意向语句相匹配的预设基准句,并根据与意向语句相匹配的预设基准句获取意向语句的语义属性。
需要说明的是,智能设备或智能服务需要根据意图语句与预设基准句之间的相似度来判断用户的语义属性。
其中,判断依据为:根据相似度确定与意向语句匹配的预设基准句,即意向语句与某一预设基准句的相似度最高时,该基准句即为与意向语句匹配的预设基准句,根据该预设基准句确定并获取意向语句的语义属性,进而智能设备或智能服务根据意向语句不同的语义属性,进入不同的处理流程。
采用本申请实施例提供的语义识别方法,可以根据预设算法计算意向语句与预设基准句之间的相似度,从而确定意向语句的语义属性,其中,针对不同场景预设基准句可以是少量的典型语句,不再需要大量的语料库,从而解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,达到减小资源占用的效果。
图3为本申请另一实施例提供的语义识别方法的流程示意图,如图3所示,步骤S102之前,还包括:
S104:获取目标场景对应的多个预设基准句。
其中,多个预设基准句包括:肯定基准句、否定基准句。
需要说明的是,在本申请的一个实施例中,一个目标场景下对应的预设基准句的数量为两个,分别为肯定基准句和否定基准句,在该实施例中,语义识别较简单省事,成本较低。
另一个目标场景下对应的预设基准句数量也可以为多个,且数量没有上限,可以提升语义识别的准确性,其中,预设基准句的数量具体根据用户需要设计,在此并不做任何限制。可选地,基于需要肯定基准句和否定基准句的场景,可以预设两组基准句,其中一组包括多个肯定基准句、另一组包括多个否定基准句,但不以此为限。例如有的场景中,语义属性的分类可以更多,包括疑问句、感叹句等,在此不作限制。
可选地,肯定基准句的基本结构为:肯定词+场景词;否定基准句的基本结构为:否定词+场景词。举例说明:
场景1:智能设备或智能服务询问“请问您是要听《红豆》这首歌吗?”。
肯定基准句:要听红豆。
否定基准句:不听红豆。
其中,肯定词为“要”,否定词为“不”,场景词为“听红豆”。
场景2:智能设备或智能服务询问“您要打车吗?”。
肯定基准句:要打车。
否定基准句:不要打车。
其中,肯定词为“要”,否定词为“不要”,场景词为“打车”。
S105:根据预设模型计算每个预设基准句对应的基准句向量。
需要说明的是,得到目标场景下的所有预设基准句后,通过预设模型计算每个预设基准句各自对应的基准句向量。
其中,预设模型为训练好的具有较好语义提取性能的句向量模型,例如:Bert,OpenAI GPT,ELMo,Quick-Thought等,具体预设模型的选择根据用户需要设置,在此并不做任何限制。
需要说明的是,S104、S105也可以在S101之前执行,例如在预先配置预设基准句时,就获取每个预设基准句对应的基准句向量。
进一步地,步骤S102包括:
根据预设模型计算意向语句对应的意向句向量;采用预设相似度算法分别计算各意向句向量与每个预设基准句对应的基准句向量之间的相似度。
需要说明的是,获取用户的意图语句之后,通过预设模型计算该意图语句对应的意向句向量,并根据意向句向量和多个基准句向量,采用预设相似度算法分别计算意向句向量与每个的基准句向量之间的相似度。
进一步地,步骤S103还包括:
选择与意向语句相似度最高的预设基准句为目标基准句;将目标基准句的语义属性作为意向语句的语义属性。
如果意向句向量与某一肯定基准句向量的相似度更高,则可判断该意向语句为肯定句,否则判断该意向语句为否定句。
具体实现过程中,假设记量相似度的度量函数可以为Dist(…,…),则意向语句的语义属性判断规则为:
若Dist(意向向量,肯定基准句向量)<=Dist(意向向量,否定基准句向量),则判断该意向语句的语义属性为肯定句,否则判断该意向语句的语义属性为否定句。
图4为本申请另一实施例提供的语义识别方法的流程示意图,如图4所示,步骤S103之后,还包括:
S106:获取意向语句的语义属性对应的准确性信息。
进一步地,步骤S106之后,还包括:
S107:若准确性信息不满足预设要求,接收预设基准句更新信息,预设基准句更新信息包含目标场景对应的新的预设基准句。
如果准确性信息不满足预设要求,则对该场景对应的预设基准句进行调整并更新。
举例说明:上述场景1,询问“请问您是要听《红豆》这首歌吗?”,一开始设定的基准句为:
肯定基准句:要听红豆。
否定基准句:不听红豆。
假设用户的意图语句“就这首”被错误判断成了否定,那么可以将基准句调整为:
肯定基准句:就要听红豆这首歌。
否定基准句:不听红豆这首歌。
即将判断错误的句子中的某些关键字样补充到基准句中,并以新的基准句作为预设基准句,或将新的基准句加入至预设基准句中。如果再次发现新的错误情况,可以继续迭代。这样就可以不断提升意向语句的语义属性的判断准确率。
基于同一发明构思,本申请实施例中还提供了与语义识别方法对应的语义识别装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述语义识别方法相似,因此装置的实施可以参见方法的实施,有益效果的重复之处不再赘述。
参照图5所示,为本申请一实施例提供的一种语义识别装置的结构示意图,如图5所示,该装置包括:接收模块201、计算模块202、确定模块203;其中:
接收模块201,用于接收用户针对目标场景输入的意向语句。
计算模块202,用于采用预设相似度算法分别计算意向语句与多个预设基准句之间的相似度。
确定模块203,用于根据相似度确定与意向语句相匹配的预设基准句,并根据与意向语句相匹配的预设基准句获取意向语句的语义属性。
参照图6所示,为本申请一实施例提供的一种语义识别装置的结构示意图,如图6所示,该装置还包括:获取模块204,用于获取目标场景对应的多个预设基准句,其中,多个预设基准句包括:肯定基准句、否定基准句。
进一步地,计算模块202,具体用于根据预设模型计算意向语句对应的意向句向量;采用预设相似度算法分别计算各意向句向量与每个预设基准句对应的基准句向量之间的相似度。
进一步地,确定模块203,具体用于选择与意向语句相似度最高的预设基准句为目标基准句;将目标基准句的语义属性作为意向语句的语义属性。
参照图7所示,为本申请一实施例提供的一种语义识别装置的结构示意图,如图7所示,该装置还包括:第二获取模块205、更新模块206,其中:
第二获取模块205,用于获取意向语句的语义属性对应的准确性信息。
更新模块206,用于若准确性信息不满足预设要求,接收预设基准句更新信息,预设基准句更新信息包含目标场景对应的新的预设基准句。
如图8所示,为本申请一实施例提供的一种电子设备的结构示意图,该电子设备可以是上述服务器或服务终端。其中,电子设备600包括:处理器601、存储器602、和总线603。
电子设备600可以包括一个或多个处理器601、总线603和存储器602,所述存储器602存储有所述处理器601可执行的机器可读指令,当电子设备600运行时,所述处理器601与所述存储器602之间通过总线603通信,所述机器可读指令被所述处理器601执行时执行如下处理:
接收用户针对目标场景输入的意向语句;
采用预设相似度算法分别计算意向语句与多个预设基准句之间的相似度;
根据相似度确定与意向语句相匹配的预设基准句,并根据与意向语句相匹配的预设基准句获取意向语句的语义属性。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述语义识别方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述语义识别方法,从而,解决现有技术中存在的由于语言表达组合形式多种多样,大量信息会导致句库规模过大,占用过多的资源的问题,进而达到减小资源占用的效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种语义识别方法,其特征在于,包括:
接收用户针对目标场景输入的意向语句;
采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度;
根据所述相似度确定与所述意向语句相匹配的预设基准句,并根据与所述意向语句相匹配的所述预设基准句获取所述意向语句的语义属性。
2.如权利要求1所述的方法,其特征在于,所述采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度之前,还包括:
获取所述目标场景对应的多个所述预设基准句,其中,多个所述预设基准句包括:肯定基准句、否定基准句;
根据预设模型计算每个所述预设基准句对应的基准句向量。
3.如权利要求1所述的方法,其特征在于,所述采用预设相似度算法分别计算所述意向句与多个预设基准句之间的相似度,包括:
根据预设模型计算所述意向语句对应的意向句向量;
采用预设相似度算法分别计算各所述意向句向量与每个所述预设基准句对应的基准句向量之间的相似度。
4.如权利要求1-3任一项所述的方法,其特征在于,所述根据所述相似度确定与所述意向语句相匹配的目标基准句,并根据与所述意向语句相匹配的目标基准句获取所述意向语句的语义属性,包括:
选择与所述意向语句相似度最高的预设基准句为所述目标基准句;
将所述目标基准句的语义属性作为所述意向语句的语义属性。
5.如权利要求1所述的方法,其特征在于,所述根据所述相似度确定与所述意向语句相匹配的目标基准句,并根据与所述意向语句相匹配的目标基准句获取所述意向语句的语义属性之后,还包括:
获取所述意向语句的语义属性对应的准确性信息。
6.如权利要求5所述的方法,其特征在于,所述获取所述意向语句的语义属性对应的准确性信息之后,还包括:
若所述准确性信息不满足预设要求,接收预设基准句更新信息,所述预设基准句更新信息包含所述目标场景对应的新的预设基准句。
7.一种语义识别装置,其特征在于,包括:接收模块、计算模块、确定模块,其中:
所述接收模块,用于接收用户针对目标场景输入的意向语句;
所述计算模块,用于采用预设相似度算法分别计算所述意向语句与多个预设基准句之间的相似度;
所述确定模块,用于根据所述相似度确定与所述意向语句相匹配的预设基准句,并根据与所述意向语句相匹配的所述预设基准句获取所述意向语句的语义属性。
8.如权利要求7所述的装置,其特征在于,还包括第一获取模块;
所述第一获取模块,用于获取所述目标场景对应的多个所述预设基准句,其中,多个所述预设基准句包括:肯定基准句、否定基准句。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至6任一所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910364347.7A CN111858865A (zh) | 2019-04-30 | 2019-04-30 | 一种语义识别方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910364347.7A CN111858865A (zh) | 2019-04-30 | 2019-04-30 | 一种语义识别方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111858865A true CN111858865A (zh) | 2020-10-30 |
Family
ID=72965763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910364347.7A Pending CN111858865A (zh) | 2019-04-30 | 2019-04-30 | 一种语义识别方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858865A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357973A (zh) * | 2021-12-10 | 2022-04-15 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN114580426A (zh) * | 2020-12-01 | 2022-06-03 | 阿里巴巴集团控股有限公司 | 用户意图识别方法、交互方法、装置、系统、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897263A (zh) * | 2016-12-29 | 2017-06-27 | 北京光年无限科技有限公司 | 基于深度学习的机器人对话交互方法及装置 |
CN107329949A (zh) * | 2017-05-24 | 2017-11-07 | 北京捷通华声科技股份有限公司 | 一种语义匹配方法和系统 |
CN109102809A (zh) * | 2018-06-22 | 2018-12-28 | 北京光年无限科技有限公司 | 一种用于智能机器人的对话方法及系统 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
-
2019
- 2019-04-30 CN CN201910364347.7A patent/CN111858865A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897263A (zh) * | 2016-12-29 | 2017-06-27 | 北京光年无限科技有限公司 | 基于深度学习的机器人对话交互方法及装置 |
CN107329949A (zh) * | 2017-05-24 | 2017-11-07 | 北京捷通华声科技股份有限公司 | 一种语义匹配方法和系统 |
CN109102809A (zh) * | 2018-06-22 | 2018-12-28 | 北京光年无限科技有限公司 | 一种用于智能机器人的对话方法及系统 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114580426A (zh) * | 2020-12-01 | 2022-06-03 | 阿里巴巴集团控股有限公司 | 用户意图识别方法、交互方法、装置、系统、设备和介质 |
CN114357973A (zh) * | 2021-12-10 | 2022-04-15 | 马上消费金融股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107656996B (zh) | 基于人工智能的人机交互方法和装置 | |
CN111898643B (zh) | 一种语义匹配方法及装置 | |
CN106997342B (zh) | 基于多轮交互的意图识别方法和装置 | |
CN107967110A (zh) | 播放方法、播放装置、电子设备及计算机可读存储介质 | |
WO2021135455A1 (zh) | 语义召回方法、装置、计算机设备及存储介质 | |
CN115357704B (zh) | 语音互动小说中异构剧情节点的处理方法及相关装置 | |
CN110209809B (zh) | 文本聚类方法和装置、存储介质及电子装置 | |
JP2020004382A (ja) | 音声対話方法及び装置 | |
CN113837669B (zh) | 一种标签体系的评价指标构建方法和相关装置 | |
CN105893351B (zh) | 语音识别方法及装置 | |
CN107958059B (zh) | 智能问答方法、装置、终端和计算机可读存储介质 | |
CA3059929A1 (en) | Text searching method, apparatus, and non-transitory computer-readable storage medium | |
CN112214576B (zh) | 舆情分析方法、装置、终端设备及计算机可读存储介质 | |
CN113836303A (zh) | 一种文本类别识别方法、装置、计算机设备及介质 | |
CN112507139A (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN113505272A (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN111858865A (zh) | 一种语义识别方法、装置、电子设备及计算机可读存储介质 | |
CN112686051A (zh) | 语义识别模型训练方法、识别方法、电子设备、存储介质 | |
CN111444321B (zh) | 问答方法、装置、电子设备和存储介质 | |
CN111402864A (zh) | 语音处理方法及电子设备 | |
CN107680598B (zh) | 基于好友声纹通讯录的信息交互方法、装置及其设备 | |
CN111949793B (zh) | 用户意图识别方法、装置及终端设备 | |
CN115658875B (zh) | 基于聊天服务的数据处理方法及相关产品 | |
CN112860860A (zh) | 一种答复问题的方法和装置 | |
CN110751510A (zh) | 一种确定推广名单的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |