CN111414764A - 对话文本的技能领域确定方法及系统 - Google Patents

对话文本的技能领域确定方法及系统 Download PDF

Info

Publication number
CN111414764A
CN111414764A CN202010193878.7A CN202010193878A CN111414764A CN 111414764 A CN111414764 A CN 111414764A CN 202010193878 A CN202010193878 A CN 202010193878A CN 111414764 A CN111414764 A CN 111414764A
Authority
CN
China
Prior art keywords
skill
field
semantic slot
knowledge base
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010193878.7A
Other languages
English (en)
Inventor
朱成亚
樊帅
李春
石韡斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN202010193878.7A priority Critical patent/CN111414764A/zh
Publication of CN111414764A publication Critical patent/CN111414764A/zh
Priority to US17/912,112 priority patent/US20230133146A1/en
Priority to PCT/CN2020/129342 priority patent/WO2021184794A1/zh
Priority to JP2022555166A priority patent/JP7481475B2/ja
Priority to EP20925821.9A priority patent/EP4123497A4/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种对话文本的技能领域确定方法。该方法包括:确定用户输入的对话文本命中的技能领域,以及技能领域下的名称语义槽和人物语义槽;当对话文本命中的技能领域为第一技能领域时,根据第一技能领域的知识库判断名称语义槽和人物语义槽是否匹配;若在第一技能领域的知识库下名称语义槽和人物语义槽不匹配,进一步根据第二技能领域的知识库判断名称语义槽和人物语义槽是否匹配;若在第二技能领域的知识库下名称语义槽和人物语义槽匹配,将第二技能领域确定为对话文本的技能领域。本发明实施例还提供一种对话文本的技能领域确定系统。本发明实施例降低了领域分类的错误率,让用户的语音对话命中的技能领域更加准确。

Description

对话文本的技能领域确定方法及系统
技术领域
本发明涉及智能语音领域,尤其涉及一种对话文本的技能领域确定方法及系统。
背景技术
在智能语音交互时,为了确保准确答复用户的对话,会确定用户对话命中的相应技能,从而进入相应的技能领域来向用户答复。在确定技能领域时,通常会使用基于正则的匹配方法。在做技能领域分类时,例如,电视语音产品中包含电影技能,使用的规则通常为“播放***的***”,例如,“播放刘德华的爱你一万年”,任务型技能解析如下,电影人:刘德华,片名:爱你一万年;“播放邓丽君的甜蜜蜜”,任务型技能影视解析如下,电影人:邓丽君,片名:甜蜜蜜。
然而“播放***的***”的这种规则同样适用于音乐技能,“播放刘德华的爱你一万年”,任务型技能音乐解析如下,歌曲名:爱你一万年,歌手名:刘德华;“播放邓丽君的甜蜜蜜”,任务型技能音乐解析如下,歌曲名:甜蜜蜜,歌手名:邓丽君。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
如果对于同一句话,两个技能解析置信度相同的情况下,会使用默认优先的技能向用户答复。例如,电视语音产品中,影视技能的优先级会高于音乐技能。对于“播放邓丽君的甜蜜蜜”这种对话时,电视语音产品会优先选择电影技能,如果在“电影人”词库中没有邓丽君或者“片名”词库中没有甜蜜蜜的话,会重新选择音乐技能,然而解析出的语义槽的内容“邓丽君”、“甜蜜蜜”分别在“电影人”,“片名”词库中都存在,但是对应的语义槽却没有联系,导致技能领域命中错误,将本应落入音乐技能的对话落入到影视技能中,无法找到邓丽君出演的甜蜜蜜的电影,用户体验较差。
发明内容
为了至少解决现有技术中语义槽之间没有联系,使得技能领域命中错误的问题。
第一方面,本发明实施例提供一种对话文本的技能领域确定方法,包括:
确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
第二方面,本发明实施例提供一种对话文本的技能领域确定系统,包括:
信息确定程序模块,确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
第一匹配程序模块,用于当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
第二匹配程序模块,用于若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
技能领域确定程序模块,用于若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的对话文本的技能领域确定方法的步骤。
第四方面,本发明实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明任一实施例的对话文本的技能领域确定方法的步骤。
本发明实施例的有益效果在于:建立语义槽之间的关联,降低了领域分类的错误率,让用户的语音对话命中的技能领域更加准确,提高用户的使用效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种对话文本的技能领域确定方法的流程图;
图2是本发明一实施例提供的一种对话文本的技能领域确定系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明一实施例提供的一种对话文本的技能领域确定方法的流程图,包括如下步骤:
S11:确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
S12:当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
S13:若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
S14:若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
在本实施方式中,虽然直接删除影视技能中“片名”或“电影人”词库中对应的说法,但这样会导致在真正说指定“片名”或“电影人”时,语义解析失败。
为了解决这些缺陷,预先建立影视领域知识库以及音乐领域知识库,例如,影视领域知识库可以通过“片名”查找所有对应的“电影人”,例如,电影片名《甜蜜蜜》,对应的电影人有:陈可辛、张曼玉、黎明、曾志伟。在电影人中,不但可以包含演员的信息,还可以包含导演的信息。
同样的,音乐领域知识库,可以通过“歌曲名”查找所有对应的“歌手名”列表,例如,歌曲名《甜蜜蜜》,对应的歌手名有邓丽君、麻吉弟弟、薛凯琪。
对于步骤S11,例如智能电视通常会搭载电视语音产品,电视语音产品中包含电影技能和音乐技能,但影视技能优先级高于音乐技能,在两个技能解析置信度相同的情况下,优先影视技能。
如果是智能手机通常会搭载智能对话语音产品,智能对话语音产品中也包含了电影技能和音乐技能,但音乐技能优先级高于影视技能,在两个技能解析置信度相同的情况下,优先音乐技能。
下面以智能电视为例,用户对智能电视说“播放邓丽君的甜蜜蜜”,平行调度任务型技能语义服务和知识型技能服务。通过任务型技能语义服务确定用户这句话会命中哪些技能领域,例如,可以命中“影视领域”和“音乐领域”。确定出“影视领域”下影视名称语义槽“甜蜜蜜”和电影人语义槽“邓丽君”;“音乐领域”下音乐名称语义槽“甜蜜蜜”和歌手名语义槽“邓丽君”。知识型技能服务包括影视领域知识库以及音乐领域知识库。
对于步骤S12,由于是智能电视,影视技能为第一技能,音乐技能为第二技能。当“播放邓丽君的甜蜜蜜”优先命中的技能为影视技能领域,会根据影视领域知识库来判断“甜蜜蜜”和“邓丽君”是否匹配。在上文中,影视领域知识库中电影片名《甜蜜蜜》,对应的电影人有:陈可辛、张曼玉、黎明、曾志伟。因此,在影视领域下的名称语义槽和所述人物语义槽不匹配。
对于步骤S13,在步骤S12中确定的影视领域下的名称语义槽和所述人物语义槽不匹配,在影视领域知识库中电影片名《甜蜜蜜》,对应的电影人中并没有“邓丽君”。进一步地根据“音乐技能”领域的知识库来判断“邓丽君”和“甜蜜蜜”是否匹配。
对于步骤S14,在音乐技能领域中,“邓丽君”和“甜蜜蜜”匹配,进而将音乐技能领域确定为“播放邓丽君的甜蜜蜜”的技能领域。进而调用音乐技能向用户播放邓丽君的甜蜜蜜。
为了进行校验,随机获取影视数据共计2001条,原badcase 69条,错误率3.4%,引入上面策略后,可以有效解决36条case,错误率降低到1.64%,错误率降低52.17%。
通过该实施方式可以看出,降低了领域分类的错误率,让用户的语音对话命中的技能领域更加准确,提高用户的使用效果。
作为一种实施方式,在本实施例中,当所述第一技能领域为影视领域时,所述第二技能领域为音乐领域;当所述第一技能领域为音乐领域,所述第二技能领域为影视领域。
在本实施方式中,如果是智能手机为例,音乐技能优先级高于影视技能,在两个技能解析置信度相同的情况下,优先音乐技能。当第一技能领域为音乐领域,第二技能领域为影视领域。
通过该实施方式可以看出,根据不同的语音产品预先配置不同技能的优先级,可以自由调整,对于智能手机,可以避免本应落入影视技能的对话落入到语音技能中。进一步提高语音对话命中技能领域的准确率。
作为一种实施方式,在本实施例中,若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第一技能领域确定为所述对话文本的技能领域。
在本实施方式中,智能电视为例,第一技能领域为影视领域时,第二技能领域为音乐领域;“播放甄子丹的叶问”。如果影视领域的知识库下所述名称语义槽和所述人物语义槽匹配。那么直接将影视领域确定为“播放甄子丹的叶问”的技能领域。
作为一种实施方式,在所述将所述第二技能领域确定为所述对话文本的技能领域之后,所述方法还包括:
当用户再次输入所述对话文本时,优先将所述第二技能领域确定为所述对话文本的技能领域。
在本实施方式中,智能电视为例,如果用户首次输入“播放邓丽君的甜蜜蜜”,会进行上述方法的判断,确定音乐技能。当用户第二次再次输入“播放邓丽君的甜蜜蜜”时,此时无需判断,直接将音乐技能领域确定为“播放邓丽君的甜蜜蜜”的技能领域。进而调用音乐技能向用户播放邓丽君的甜蜜蜜。
通过该实施方式可以看出,对重复输入的对话,直接使用历史确定的技能领域对用户进行答复,提高交互效率。
如图2所示为本发明一实施例提供的一种对话文本的技能领域确定系统的结构示意图,该系统可执行上述任意实施例所述的对话文本的技能领域确定方法,并配置在终端中。
本实施例提供的一种对话文本的技能领域确定系统包括:信息确定程序模块11,第一匹配程序模块12,第二匹配程序模块13和技能领域确定程序模块14。
其中,信息确定程序模块11确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;第一匹配程序模块12用于当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;第二匹配程序模块13用于若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;技能领域确定程序模块14用于若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
进一步地,所述系统还用于:
预先建立影视领域知识库以及音乐领域知识库,其中,所述影视领域知识库中存储有影视名称与电影人之间的关联信息,所述音乐领域知识库中存储有音乐名称与歌手名之间的关联信息。
进一步地,当所述第一技能领域为影视领域时,所述第二技能领域为音乐领域;当所述第一技能领域为音乐领域,所述第二技能领域为影视领域。
进一步地,若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第一技能领域确定为所述对话文本的技能领域。
进一步地,所述系统还用于:
当用户再次输入所述对话文本时,优先将所述第二技能领域确定为所述对话文本的技能领域。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的对话文本的技能领域确定方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的对话文本的技能领域确定方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的对话文本的技能领域确定方法的步骤。
本申请实施例的客户端以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如平板电脑。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有语音交互的电子装置。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种对话文本的技能领域确定方法,包括:
确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
2.根据权利要求1所述的方法,其中,所述方法还包括:
预先建立影视领域知识库以及音乐领域知识库,其中,所述影视领域知识库中存储有影视名称与电影人之间的关联信息,所述音乐领域知识库中存储有音乐名称与歌手名之间的关联信息。
3.根据权利要求1所述的方法,其中,当所述第一技能领域为影视领域时,所述第二技能领域为音乐领域;当所述第一技能领域为音乐领域,所述第二技能领域为影视领域。
4.根据权利要求1所述的方法,其中,若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第一技能领域确定为所述对话文本的技能领域。
5.根据权利要求1所述的方法,其中,在所述将所述第二技能领域确定为所述对话文本的技能领域之后,所述方法还包括:
当用户再次输入所述对话文本时,优先将所述第二技能领域确定为所述对话文本的技能领域。
6.一种对话文本的技能领域确定系统,包括:
信息确定程序模块,确定用户输入的对话文本命中的技能领域,以及所述技能领域下的名称语义槽和人物语义槽;
第一匹配程序模块,用于当所述对话文本命中的技能领域为第一技能领域时,根据所述第一技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
第二匹配程序模块,用于若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽不匹配,进一步根据第二技能领域的知识库判断所述名称语义槽和所述人物语义槽是否匹配;
技能领域确定程序模块,用于若在所述第二技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第二技能领域确定为所述对话文本的技能领域。
7.根据权利要求6所述的系统,其中,所述系统还用于:
预先建立影视领域知识库以及音乐领域知识库,其中,所述影视领域知识库中存储有影视名称与电影人之间的关联信息,所述音乐领域知识库中存储有音乐名称与歌手名之间的关联信息。
8.根据权利要求6所述的系统,其中,当所述第一技能领域为影视领域时,所述第二技能领域为音乐领域;当所述第一技能领域为音乐领域,所述第二技能领域为影视领域。
9.根据权利要求6所述的系统,其中,若在所述第一技能领域的知识库下所述名称语义槽和所述人物语义槽匹配,将所述第一技能领域确定为所述对话文本的技能领域。
10.根据权利要求6所述的系统,其中,所述系统还用于:
当用户再次输入所述对话文本时,优先将所述第二技能领域确定为所述对话文本的技能领域。
CN202010193878.7A 2020-03-18 2020-03-18 对话文本的技能领域确定方法及系统 Pending CN111414764A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010193878.7A CN111414764A (zh) 2020-03-18 2020-03-18 对话文本的技能领域确定方法及系统
US17/912,112 US20230133146A1 (en) 2020-03-18 2020-11-17 Method and apparatus for determining skill field of dialogue text
PCT/CN2020/129342 WO2021184794A1 (zh) 2020-03-18 2020-11-17 对话文本的技能领域确定方法及装置
JP2022555166A JP7481475B2 (ja) 2020-03-18 2020-11-17 対話テキストの機能領域確定方法及び装置
EP20925821.9A EP4123497A4 (en) 2020-03-18 2020-11-17 METHOD AND APPARATUS FOR DETERMINING DIALOGUE TEXT SKILLS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010193878.7A CN111414764A (zh) 2020-03-18 2020-03-18 对话文本的技能领域确定方法及系统

Publications (1)

Publication Number Publication Date
CN111414764A true CN111414764A (zh) 2020-07-14

Family

ID=71493106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010193878.7A Pending CN111414764A (zh) 2020-03-18 2020-03-18 对话文本的技能领域确定方法及系统

Country Status (5)

Country Link
US (1) US20230133146A1 (zh)
EP (1) EP4123497A4 (zh)
JP (1) JP7481475B2 (zh)
CN (1) CN111414764A (zh)
WO (1) WO2021184794A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581954A (zh) * 2020-12-01 2021-03-30 杭州九阳小家电有限公司 一种高匹配性语音交互方法和智能设备
WO2021184794A1 (zh) * 2020-03-18 2021-09-23 思必驰科技股份有限公司 对话文本的技能领域确定方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547283A (zh) * 2022-02-25 2022-05-27 广域铭岛数字科技有限公司 基于语义理解的对话质量分析方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177079A (zh) * 2013-02-06 2013-06-26 北京小米科技有限责任公司 一种主题更新的检测方法、终端和服务器
CN106126503A (zh) * 2016-07-12 2016-11-16 海信集团有限公司 业务领域定位方法及终端
CN107943793A (zh) * 2018-01-10 2018-04-20 威盛电子股份有限公司 自然语言的语义解析方法
CN108932278A (zh) * 2018-04-28 2018-12-04 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN109063152A (zh) * 2018-08-08 2018-12-21 鲸数科技(北京)有限公司 智能问答方法、装置及智能终端
CN109190116A (zh) * 2018-08-15 2019-01-11 苏州思必驰信息科技有限公司 语义解析方法、系统、电子设备及存储介质
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020047A (zh) * 2012-12-31 2013-04-03 威盛电子股份有限公司 修正语音应答的方法及自然语言对话系统
JP2017224155A (ja) 2016-06-15 2017-12-21 パナソニックIpマネジメント株式会社 対話処理方法、対話処理システム、及びプログラム
US10453117B1 (en) * 2016-06-29 2019-10-22 Amazon Technologies, Inc. Determining domains for natural language understanding
CN107871500B (zh) * 2017-11-16 2021-07-20 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
CN108920497B (zh) * 2018-05-23 2021-10-15 北京奇艺世纪科技有限公司 一种人机交互方法及装置
CN109783735A (zh) 2019-01-18 2019-05-21 广东小天才科技有限公司 一种基于用户语料获取内容的方法和装置
CN110008314B (zh) * 2019-04-12 2022-07-26 广东小天才科技有限公司 一种意图解析方法及装置
CN110543633B (zh) * 2019-08-29 2021-06-29 腾讯科技(深圳)有限公司 语句意图识别方法、装置
CN111414764A (zh) * 2020-03-18 2020-07-14 苏州思必驰信息科技有限公司 对话文本的技能领域确定方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177079A (zh) * 2013-02-06 2013-06-26 北京小米科技有限责任公司 一种主题更新的检测方法、终端和服务器
CN106126503A (zh) * 2016-07-12 2016-11-16 海信集团有限公司 业务领域定位方法及终端
CN107943793A (zh) * 2018-01-10 2018-04-20 威盛电子股份有限公司 自然语言的语义解析方法
CN108932278A (zh) * 2018-04-28 2018-12-04 厦门快商通信息技术有限公司 基于语义框架的人机对话方法及系统
CN109063152A (zh) * 2018-08-08 2018-12-21 鲸数科技(北京)有限公司 智能问答方法、装置及智能终端
CN109190116A (zh) * 2018-08-15 2019-01-11 苏州思必驰信息科技有限公司 语义解析方法、系统、电子设备及存储介质
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021184794A1 (zh) * 2020-03-18 2021-09-23 思必驰科技股份有限公司 对话文本的技能领域确定方法及装置
CN112581954A (zh) * 2020-12-01 2021-03-30 杭州九阳小家电有限公司 一种高匹配性语音交互方法和智能设备
CN112581954B (zh) * 2020-12-01 2023-08-04 杭州九阳小家电有限公司 一种高匹配性语音交互方法和智能设备

Also Published As

Publication number Publication date
WO2021184794A1 (zh) 2021-09-23
EP4123497A1 (en) 2023-01-25
US20230133146A1 (en) 2023-05-04
JP2023517363A (ja) 2023-04-25
JP7481475B2 (ja) 2024-05-10
EP4123497A4 (en) 2023-08-09

Similar Documents

Publication Publication Date Title
CN108962233B (zh) 用于语音对话平台的语音对话处理方法及系统
US20230161799A1 (en) Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface
US10379712B2 (en) Conversation user interface
CN111414764A (zh) 对话文本的技能领域确定方法及系统
CN110223692B (zh) 用于语音对话平台跨技能的多轮对话方法及系统
CN107526761B (zh) 用于识别并为用户呈现多语言媒体内容项目的方法、系统和介质
CN109460503B (zh) 答案输入方法、装置、存储介质及电子设备
CN115329206B (zh) 语音外呼处理方法及相关装置
CN111488443B (zh) 技能选择方法及装置
CN108900612A (zh) 用于推送信息的方法和装置
CN110765270A (zh) 用于口语交互的文本分类模型的训练方法及系统
CN108831444B (zh) 用于语音对话平台的语义资源训练方法及系统
CN112364143A (zh) 智能的多轮交互方法及系统
JP2021096847A (ja) ユーザの発言に基づくマルチメディア推奨
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN111507114A (zh) 基于反向翻译的口语文本增强方法及系统
CN109273004B (zh) 基于大数据的预测性语音识别方法及装置
CN110381359B (zh) 一种视频处理方法、装置、计算机设备及存储介质
CN115048517A (zh) 对话流程的质检方法及电子设备和存储介质
US20210373670A1 (en) Vibration control method and system for computer device
CN109726267B (zh) 用于故事机的故事推荐方法和装置
CN112786031B (zh) 人机对话方法及系统
CN114141250A (zh) 歌词识别方法、装置、电子设备及可读存储介质
CN113707179A (zh) 一种音频识别方法、装置、设备及介质
CN112687265B (zh) 逆文本标准化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20200714

RJ01 Rejection of invention patent application after publication