CN111737423B - 领域识别方法、装置、电子设备及存储介质 - Google Patents
领域识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111737423B CN111737423B CN202010867146.1A CN202010867146A CN111737423B CN 111737423 B CN111737423 B CN 111737423B CN 202010867146 A CN202010867146 A CN 202010867146A CN 111737423 B CN111737423 B CN 111737423B
- Authority
- CN
- China
- Prior art keywords
- alternative
- input information
- intention
- field
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000015654 memory Effects 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 8
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 description 20
- 230000011218 segmentation Effects 0.000 description 17
- 235000014676 Phragmites communis Nutrition 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 241000209094 Oryza Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开提供了一种领域识别方法、装置、电子设备及存储介质,属于自然语言处理领域。方法包括:根据输入信息,确定输入信息匹配的至少两个备选领域;获取输入信息在每个备选领域中的备选意图;根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率;根据输入信息属于每个备选意图的概率,分别获取输入信息属于每个备选领域的概率;根据输入信息属于每个备选领域的概率,选取输入信息所属的目标领域,输入信息属于目标领域的概率大于输入信息属于其他备选领域的概率,上述方法可以提高领域识别的准确率。
Description
技术领域
本公开涉及自然语言处理领域,特别涉及一种领域识别方法、装置、电子设备及存储介质。
背景技术
随着互联网的普及和自然语言处理技术的发展,多种领域的信息广泛传播,例如,天气领域、音频领域、视频领域等。通常在进行信息处理之前,需要先识别信息所属的领域,才能准确理解信息的含义,从而提高处理信息的准确度。
相关技术中确定输入信息所属领域的方法一般是:调用神经网络模型获取该输入信息属于多个领域的概率,然后选择最大概率的领域,将该最大概率的领域作为该输入信息所属的目标领域。
相关技术存在的问题是,在输入信息存在歧义的情况下,确定的目标领域极有可能是错误的,因此领域识别的准确率低。
发明内容
本公开实施例提供了一种领域识别方法、装置、电子设备及存储介质,能够提高领域识别的准确率。所述技术方案如下。
第一方面,提供了一种领域识别方法,所述方法包括:
根据输入信息,确定所述输入信息匹配的至少两个备选领域;
获取所述输入信息在每个备选领域中的备选意图;
根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率;
根据所述输入信息属于所述每个备选意图的概率,分别获取所述输入信息属于所述每个备选领域的概率;
根据所述输入信息属于所述每个备选领域的概率,选取所述输入信息所属的目标领域,所述输入信息属于所述目标领域的概率大于所述输入信息属于其他备选领域的概率。
在一种可能的实现方式中,所述获取所述输入信息在每个备选领域中的备选意图,包括:
对于确定的任一备选领域,确定获取所述备选领域中备选意图的多种方式,所述多种方式具有优先级;
按照所述多种方式的优先级从高到低的顺序,采用优先级最高的方式获取所述输入信息的备选意图;或者,采用优先级最高的方式无法获取所述输入信息的备选意图,则采用下一个方式获取所述输入信息的备选意图,直至获取到所述输入信息的备选意图。
在另一种可能的实现方式中,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
根据所述至少两个备选意图的获取方式的优先级,获取所述输入信息属于每个备选意图的概率,获取方式的优先级越高,所述输入信息属于对应备选意图的概率越高。
在另一种可能的实现方式中,所述获取所述输入信息在每个备选领域中的备选意图,包括:
对于任一备选领域,获取所述备选领域的至少一个意图对应的句法规则,响应于所述输入信息满足第一句法规则,将所述第一句法规则对应的意图作为所述输入信息在所述备选领域中的备选意图;或者,
对于任一备选领域,调用所述备选领域的意图识别模型,对所述输入信息进行意图识别,得到所述输入信息在所述备选领域中的备选意图。
在另一种可能的实现方式中,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
获取所述输入信息对应的用户标识;
根据所述用户标识对应的领域,确定所述至少两个备选领域的优先级,所述用户标识对应的领域包括所述用户标识的历史输入信息所属的领域或所述用户标识的注册应用所属的领域中的至少一个;
根据所述至少两个备选领域的优先级和所述至少两个备选意图所属的备选领域,获取所述输入信息属于每个备选意图的概率,备选领域的优先级越高,所述输入信息属于对应备选领域中的备选意图的概率越高。
在另一种可能的实现方式中,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
对于获取的任一备选意图,获取所述输入信息中与所述备选意图对应的至少一个关键信息;
在所述备选意图对应的信息数据库中,查询所述至少一个关键信息对应的目标信息;
根据每个关键信息的查询结果,获取所述每个关键信息的分数,所述查询结果包括查询成功或查询失败;
根据所述每个关键信息的分数,获取所述输入信息属于所述备选意图的概率。
在另一种可能的实现方式中,所述根据每个关键信息的查询结果,获取所述每个关键信息的分数,包括以下至少一项:
将查询成功的关键信息所属的信息类型对应的分数,作为所述查询成功的关键信息的分数;
将查询失败的关键信息的分数设置为预设分数。
在另一种可能的实现方式中,所述根据输入信息,确定所述输入信息匹配的至少两个备选领域,包括:
从所述输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定所述输入信息匹配的至少两个备选领域。
在另一种可能的实现方式中,所述方法还包括:
将所述输入信息在所述目标领域中的备选意图作为目标意图,根据所述目标意图执行所述输入信息对应的操作。
第二方面,提供了一种领域识别装置,所述装置包括:
备选领域确定模块,被配置为根据输入信息,确定所述输入信息匹配的至少两个备选领域;
备选意图获取模块,被配置为获取所述输入信息在每个备选领域中的备选意图;
概率获取模块,被配置为根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率;
所述概率获取模块,还被配置为根据所述输入信息属于所述每个备选意图的概率,分别获取所述输入信息属于所述每个备选领域的概率;
目标领域选取模块,被配置为根据所述输入信息属于所述每个备选领域的概率,选取所述输入信息所属的目标领域,所述输入信息属于所述目标领域的概率大于所述输入信息属于其他备选领域的概率。
在一种可能的实现方式中,所述备选意图获取模块,还被配置为对于确定的任一备选领域,确定获取所述备选领域中备选意图的多种方式,所述多种方式具有优先级;按照所述多种方式的优先级从高到低的顺序,采用优先级最高的方式获取所述输入信息的备选意图;或者,采用优先级最高的方式无法获取所述输入信息的备选意图,则采用下一个方式获取所述输入信息的备选意图,直至获取到所述输入信息的备选意图。
在另一种可能的实现方式中,所述概率获取模块,还被配置为根据所述至少两个备选意图的获取方式的优先级,获取所述输入信息属于每个备选意图的概率,获取方式的优先级越高,所述输入信息属于对应备选意图的概率越高。
在另一种可能的实现方式中,所述备选意图获取模块,还被配置为对于任一备选领域,获取所述备选领域的至少一个意图对应的句法规则,响应于所述输入信息满足第一句法规则,将所述第一句法规则对应的意图作为所述输入信息在所述备选领域中的备选意图;或者,对于任一备选领域,调用所述备选领域的意图识别模型,对所述输入信息进行意图识别,得到所述输入信息在所述备选领域中的备选意图。
在另一种可能的实现方式中,所述概率获取模块,还被配置为获取所述输入信息对应的用户标识;根据所述用户标识对应的领域,确定所述至少两个备选领域的优先级,所述用户标识对应的领域包括所述用户标识的历史输入信息所属的领域或所述用户标识的注册应用所属的领域中的至少一个;根据所述至少两个备选领域的优先级和所述至少两个备选意图所属的备选领域,获取所述输入信息属于每个备选意图的概率,备选领域的优先级越高,所述输入信息属于对应备选领域中的备选意图的概率越高。
在另一种可能的实现方式中,所述概率获取模块,还被配置为对于获取的任一备选意图,获取所述输入信息中与所述备选意图对应的至少一个关键信息;在所述备选意图对应的信息数据库中,查询所述至少一个关键信息对应的目标信息;根据每个关键信息的查询结果,获取所述每个关键信息的分数,所述查询结果包括查询成功或查询失败;根据所述每个关键信息的分数,获取所述输入信息属于所述备选意图的概率。
在另一种可能的实现方式中,所述概率获取模块,还被配置为将查询成功的关键信息所属的信息类型对应的分数,作为所述查询成功的关键信息的分数;或者,将查询失败的关键信息的分数设置为预设分数。
在另一种可能的实现方式中,所述备选领域确定模块,还被配置为从所述输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定所述输入信息匹配的至少两个备选领域。
在另一种可能的实现方式中,所述装置还包括:
操作执行模块,被配置为将所述输入信息在所述目标领域中的备选意图作为目标意图,根据所述目标意图执行所述输入信息对应的操作。
第三方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现上述任一种可能实现方式中的领域识别方法中所执行的操作。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述任一种可能实现方式中的领域识别方法中所执行的操作。
第五方面,提供了一种计算机程序,所述计算机程序中存储有至少一条指令,所述指令由处理器加载并执行以实现上述任一种可能实现方式中的领域识别方法中所执行的操作。
本公开实施例提供的技术方案带来的有益效果至少包括:
本公开实施例考虑到一个领域下具有多种意图,输入信息是否属于某一领域,取决于输入信息是否属于该领域下的某种意图,因此以领域下的意图为单位,先获取输入信息属于备选意图的概率,再获取输入信息属于备选领域的概率,由于输入信息属于备选领域的概率是根据输入信息属于该备选领域中备选意图的概率来获取的,因而能够客观准确地体现输入信息与备选领域的匹配程度。在此基础上,利用多个备选领域的概率来进行领域识别,由于考虑了多个备选领域和多个备选领域中的备选意图,即使输入信息存在歧义的情况下也能从多个备选领域中准确识别输入信息所属的目标领域,提高了领域识别的准确率,提升了领域识别方法的健壮性。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种实施环境的示意图;
图2是本公开实施例提供的一种领域识别方法的流程图;
图3是本公开实施例提供的一种领域识别方法的流程图;
图4是本公开实施例提供的一种语义理解引擎的结构示意图;
图5是本公开实施例提供的一种音频机器人的结构示意图;
图6是本公开实施例提供的一种领域识别装置的框图;
图7是本公开实施例提供的一种电子设备的结构示意图;
图8是本公开实施例提供的一种服务器的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
图1是本公开实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。并且,终端101上安装由服务器102提供服务的目标应用,终端101可以通过该目标应用实现例如数据传输、消息交互等功能。
终端101可以为电脑、手机、平板电脑、智能音箱、智能家居、智能玩具或者其他终端。目标应用可以为终端101上安装的任一应用;并且,目标应用可以为终端101操作系统中的目标应用,还可以为第三方提供的目标应用。例如,目标应用可以为音乐应用、社交应用、视频应用、语音交互应用等。服务器102可以为该目标应用对应的后台服务器,相应的,服务器102可以为音乐服务器、社交应用服务器、视频服务器或者语音交互服务器等。
终端101可以通过目标应用接收用户的输入信息,根据输入信息执行相应的操作。终端101在执行相应的操作前,需要先识别输入信息所属的目标领域,根据目标领域确定输入信息的目标意图,然后根据输入信息的目标意图执行输入信息对应的操作。终端101也可以将输入信息发送给服务器102,由服务器102识别输入信息所属的目标领域后,将该目标领域发送给终端101。
需要说明的一点是,本公开实施例所示的领域识别方法的执行主体可以是电子设备,电子设备可以为上述终端101或者服务器102,还可以包括上述终端101和服务器102。
本公开实施例提供的领域识别方法,可以应用于多种场景下。
例如,在语音控制设备的场景下,用户在终端上输入语音信息,终端获取该语音信息,采用本公开实施例提供的领域识别方法,识别出该语音信息所属的目标领域,之后识别出该语音信息在目标领域中的目标意图,从而根据该目标意图执行与该语音信息对应的控制操作,以对该终端进行控制。
或者,在智能对话的场景下,用户在终端的对话系统中输入文本信息,终端获取该文本信息,采用本公开实施例提供的领域识别方法,识别出该文本信息所属的目标领域,在该目标领域的信息库中查询该文本信息对应的回复信息,并展示该回复信息,实现了与用户之间的智能对话。
图2是本公开实施例提供的一种领域识别方法的流程图。参见图2,该实施例包括以下步骤。
步骤201:根据输入信息,确定输入信息匹配的至少两个备选领域。
步骤202:获取输入信息在每个备选领域中的备选意图。
步骤203:根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率。
步骤204:根据输入信息属于每个备选意图的概率,分别获取输入信息属于每个备选领域的概率。
步骤205:根据输入信息属于每个备选领域的概率,选取输入信息所属的目标领域,输入信息属于目标领域的概率大于输入信息属于其他备选领域的概率。
本公开实施例考虑到一个领域下具有多种意图,输入信息是否属于某一领域,取决于输入信息是否属于该领域下的某种意图,因此以领域下的意图为单位,先获取输入信息属于备选意图的概率,再获取输入信息属于备选领域的概率,由于输入信息属于备选领域的概率是根据输入信息属于该备选领域中备选意图的概率来获取的,因而能够客观准确地体现输入信息与备选领域的匹配程度。在此基础上,利用多个备选领域的概率来进行领域识别,由于考虑了多个备选领域和多个备选领域中的备选意图,即使输入信息存在歧义的情况下也能从多个备选领域中准确识别输入信息所属的目标领域,提高了领域识别的准确率,提升了领域识别方法的健壮性。
在一种可能的实现方式中,获取输入信息在每个备选领域中的备选意图,包括:
对于确定的任一备选领域,确定获取备选领域中备选意图的多种方式,多种方式具有优先级;
按照多种方式的优先级从高到低的顺序,采用优先级最高的方式获取输入信息的备选意图;或者,采用优先级最高的方式无法获取输入信息的备选意图,则采用下一个方式获取输入信息的备选意图,直至获取到输入信息的备选意图。
在另一种可能的实现方式中,根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率,包括:
根据至少两个备选意图的获取方式的优先级,获取输入信息属于每个备选意图的概率,获取方式的优先级越高,输入信息属于对应备选意图的概率越高。
在另一种可能的实现方式中,获取输入信息在每个备选领域中的备选意图,包括:
对于任一备选领域,获取备选领域的至少一个意图对应的句法规则,响应于输入信息满足第一句法规则,将第一句法规则对应的意图作为输入信息在备选领域中的备选意图;或者,
对于任一备选领域,调用备选领域的意图识别模型,对输入信息进行意图识别,得到输入信息在备选领域中的备选意图。
在另一种可能的实现方式中,根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率,包括:
获取输入信息对应的用户标识;
根据用户标识对应的领域,确定至少两个备选领域的优先级,用户标识对应的领域包括用户标识的历史输入信息所属的领域或用户标识的注册应用所属的领域中的至少一个;
根据至少两个备选领域的优先级和至少两个备选意图所属的备选领域,获取输入信息属于每个备选意图的概率,备选领域的优先级越高,输入信息属于对应备选领域中的备选意图的概率越高。
在另一种可能的实现方式中,根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率,包括:
对于获取的任一备选意图,获取输入信息中与备选意图对应的至少一个关键信息;
在备选意图对应的信息数据库中,查询至少一个关键信息对应的目标信息;
根据每个关键信息的查询结果,获取每个关键信息的分数,查询结果包括查询成功或查询失败;
根据每个关键信息的分数,获取输入信息属于备选意图的概率。
在另一种可能的实现方式中,根据每个关键信息的查询结果,获取每个关键信息的分数,包括以下至少一项:
将查询成功的关键信息所属的信息类型对应的分数,作为查询成功的关键信息的分数;
将查询失败的关键信息的分数设置为预设分数。
在另一种可能的实现方式中,根据输入信息,确定输入信息匹配的至少两个备选领域,包括:
从输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域。
在另一种可能的实现方式中,方法还包括:
将输入信息在目标领域中的备选意图作为目标意图,根据目标意图执行输入信息对应的操作。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图3是本公开实施例提供的一种领域识别方法的流程图。在本公开实施例中,以执行主体为终端为例对领域识别方法进行说明。参见图3,该实施例包括以下步骤。
步骤301:终端根据输入信息,确定输入信息匹配的至少两个备选领域。
其中,从输入信息的输入方式来说,输入信息可以为用户输入至终端的信息,也可以为终端从服务器下载的信息,或者终端查询到的信息等。从输入信息的格式来说,输入信息可以为语音信息,也可以为文本信息,从输入信息的含义来说,该输入信息可以为天气信息、视频信息、音频信息等,本公开对此不做限制。
另外,输入信息可以为原始的输入信息,还可以是对原始输入信息进行知识推理后的输入信息,其中,知识推理是指将输入信息中需要推理的复杂信息替换为可以识别的简单信息的过程。例如,输入信息为“播放用户1老公的稻香”,其中需要推理的信息为“用户1老公”,则对该输入信息进行知识推理,可得到结果“播放用户2的稻香”,其中用户2为用户1的老公。终端对原始输入信息进行知识推理的实现方式可以为:终端对原始输入信息进行信息识别,识别该原始输入信息中需要知识推理的信息,从知识库中查询该信息对应的推理信息,用该推理信息替换原始输入信息中的需要知识推理的信息,得到知识推理后的输入信息。
其中,知识库中包括大量知识,这些知识可以以知识图谱的形式存储在知识库中。知识图谱又称为知识领域映射地图,知识图谱以可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及知识之间的相互联系。
信息所属的领域可以包括多种,如天气领域、视频领域、音频领域等,终端可以预先确定多个领域,后续从该多个领域中识别输入信息所属的目标领域。
本公开实施例中,为了提高识别准确率,并没有直接根据输入信息确定输入信息所属的一个领域,而是先确定输入信息匹配的至少两个备选领域。其中,至少两个备选领域是从终端预先确定的多个领域中选取的,且输入信息与备选领域匹配是指:输入信息具有属于该备选领域的可能性。
在一种可能的实现方式中,终端根据输入信息,确定输入信息匹配的至少两个备选领域的实现方式为:终端从输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域。
其中,终端中可以预设多个领域,每个领域中可以设置领域关键词,当输入信息包括某个领域的领域关键词时,认为输入信息可能属于该领域。领域关键词可以为对应的领域中具有代表性的词语,例如,视频领域的领域关键词可以包括“播放”、“视频”、“电视剧”、“电影”、“我要看”等,音频领域的领域关键词可以包括“播放”、“音乐”、“歌曲”、“我要听”等,天气领域的领域关键词可以包括“天气”、“气温”、“温度”、“风”等,闹钟领域的领域关键词可以包括“提醒”、“8点”等,上述领域关键词只是示例性说明,本公开对此不做限制。并且,由于不同领域之间有些词语可以共用,因此不同领域中可以设置相同的领域关键词。例如,视频领域的领域关键词和音频领域的领域关键词都可以包括“播放”。
在本公开实施例中,终端通过从输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域,由于以词语为单位区分各个领域,领域划分的力度较细,从而确定出的备选领域的准确率较高。
终端从输入信息中提取至少一个领域关键词的实现方式可以为:终端对输入信息进行分词处理,得到输入信息中的至少一个分词,将该至少一个分词与每个领域的领域关键词进行匹配,将匹配到的至少一个领域关键词作为从输入信息中提取的领域关键词。
其中,终端对输入信息进行分词处理的实现可以为:终端通过分词工具对输入信息进行分词处理,分词工具可以分词模型,相应的,该步骤的实现方式为:终端将输入信息输入到分词模型,得到分词模型输出的输入信息中的至少一个分词。其中,该分词模型可以为结巴分词、简易中文分词系统(Simple Chinese Words Segmentation,SCWS)、盘古分词或者其他分词模型,本公开对此不做限制。
例如,终端对输入信息“播放用户3的琅琊榜”进行分词处理,得到的分词可以包括:“播放”、“用户3”、“的”、“琅琊榜”。
终端从输入信息中提取至少一个领域关键词后,还要确定每个领域关键词所属的领域,然后再根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域。终端可以存储每个领域和领域关键词的对应关系,根据该对应关系可以确定任一领域的领域关键词,以及任一领域关键词所属的领域。该对应关系可以如下表1所示。
表1
天气领域 | 天气、气温、温度、风 |
视频领域 | 播放、视频、电视剧、电影、我要看 |
音频领域 | 播放、音乐、歌曲、我要听 |
… … | … … |
相应的,终端确定每个领域关键词所属的领域的实现方式为:对于任一领域关键词,终端从每个领域和领域关键词的对应关系中确定该领域关键词所属的领域。
终端根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域的实现方式为:终端直接将每个关键词所属的领域,作为与输入信息匹配的至少两个备选领域。
例如,输入信息为“播放用户3的琅琊榜”,该输入信息中的领域关键词包括“播放”,“播放”所属的领域包括视频领域和音频领域,则终端将“播放”所属的视频领域和音频领域作为备选领域。
在另一种可能的实现方式中,终端根据输入信息,确定输入信息匹配的至少两个备选领域的实现方式可以为:终端调用领域识别模型,对该输入信息进行领域识别,得到与该输入信息匹配的至少两个备选领域。
终端可以将该输入信息输入到领域识别模型中,领域识别模型对输入信息进行领域识别,输出与该输入信息匹配的至少两个领域以及每个领域的概率,终端按照概率从高到低的顺序,选取至少两个领域作为备选领域。
领域识别模型可以根据样本输入信息及样本输入信息所属的领域训练得到,通过一次或多次训练,领域识别模型可以学习到输入信息所属的领域与输入信息之间的关系,从而具备根据输入信息确定所属领域的能力,提高了模型的准确率,则通过调用领域识别模型,直接对该输入信息进行领域识别,得到与该输入信息匹配的至少两个备选领域,方法简单,效率高。
领域识别模型可以是由该终端训练得到的,也可以是由服务器训练后由该终端从服务器获取的,还可以是其他终端训练后将领域识别模型上传到服务器,由该终端从服务器获取的,本公开对此不做限制。
步骤302:终端获取输入信息在每个备选领域中的备选意图。
每个领域中包括至少一个意图,意图即输入信息的目的,终端可以根据意图确定输入信息对应的操作。例如,音乐领域包括意图“播放音乐”,天气领域包括意图“查询天气”,闹钟领域包括意图“设置提醒”、“取消提醒”等。
本公开中的备选领域中包括至少一个意图,终端要在备选领域中的至少一个意图中选择一个与输入信息匹配的意图,作为备选意图,且输入信息与意图匹配是指输入信息具有属于该意图的可能性。
对于任一备选领域,终端获取输入信息在该备选领域中的备选意图的实现方式至少包括以下两种。
第一种,终端通过句法规则获取输入信息在备选领域中的备选意图,实现方式可以为:终端获取备选领域的至少一个意图对应的句法规则,响应于输入信息满足第一句法规则,将第一句法规则对应的意图作为输入信息在该备选领域中的备选意图。
备选领域包括至少一个意图,且每个意图可以对应一条或者多条句法规则,输入信息满足句法规则,即表示输入信息具有属于该句法规则对应的意图的可能性。
终端可以获取备选领域中的每个意图对应的句法规则,将输入信息与每个句法规则进行匹配,将与输入信息匹配的句法规则作为输入信息满足的第一句法规则,然后将该第一句法规则对应的意图作为输入信息在备选领域中的备选意图。
其中,终端中可以预设备选领域的意图和意图对应的句法规则,例如,音频领域的意图可以包括播放音乐,播放音乐对应的句法规则可以为“我要听{歌名}”、“播放{作者}的{歌名}”等,视频领域的意图可以包括播放视频,播放视频对应的句法规则可以为“我要看电影{电影名}”、“播放电视剧{电视剧名}”等,天气领域的意图可以包括查询天气,查询天气对应的句法规则可以为“查询{城市}{日期}的天气”,上述备选领域中包括的意图和意图对应的句法规则只是示例性说明,本公开对此不做限制。
假设输入信息为“播放用户3的琅琊榜”,与该输入信息匹配的备选领域包括音频领域和视频领域,对于音频领域,终端通过句法规则获取输入信息在备选领域中的备选意图的实现方式为:终端将输入信息“播放用户3的琅琊榜”与音频领域中的每个意图对应的句法规则进行匹配,确定该输入信息满足的句法规则为“播放{作者}的{歌名}”,将该句法规则对应的意图“播放音乐”作为该输入信息的意图。对于视频领域,终端通过句法规则获取输入信息在备选领域中的备选意图的实现方式为与此同理,此处不再赘述。
在本公开实施例中,终端通过句法规则获取输入信息在备选领域中的备选意图,由于句法规则是用户描述相应意图的习惯用语,因此获取的备选意图准确率高。
第二种,终端通过意图识别模型获取输入信息在备选领域中的备选意图,实现方式可以为:终端调用备选领域的意图识别模型,对输入信息进行意图识别,得到输入信息在备选领域中的备选意图。
进一步的,终端可以将输入信息输入到该备选领域的意图识别模型,意图识别模型对输入信息进行意图识别,输出与该输入信息匹配的意图以及该意图的分类置信度,其中,分类置信度用于表明输入信息与该意图的匹配程度,分类置信度越大,匹配程度越高,终端响应于该分类置信度大于预设阈值,将该意图作为输入信息在该备选领域中的备选意图。
在本公开实施例中,终端通过意图识别模型直接获取输入信息在备选领域中的备选意图,由于意图识别模型的识别效率高,从而获取备选意图的效率高。
需要说明的一点是,终端可以预设第一种方式和第二种方式的优先级,例如,终端可以预设第一种方式的优先级高于第二种方式的优先级,由于第一种方式获取的备选意图更加准确,则终端预设第一种方式的优先级高于第二种方式的优先级,可以提高获取的备选意图的准确率。
除上述两种方法外,终端还可以采用其他方法获取输入信息在备选领域终端备选意图,本公开对此不做限制。并且,多种获取输入信息在备选领域中备选意图的方法可以以任意形式结合。
例如,在一种可能的实现方式中,终端获取输入信息在每个备选领域中的备选意图的实现方式为:对于确定的任一备选领域,终端确定获取备选领域中备选意图的多种方式,多种方式具有优先级;终端按照多种方式的优先级从高到低的顺序,终端采用优先级最高的方式获取输入信息的备选意图;或者,采用优先级最高的方式无法获取输入信息的备选意图,则采用下一个方式获取输入信息的备选意图,直至获取到输入信息的备选意图。
例如,获取备选领域中备选意图的方式有两种,分别为通过句法规则获取和通过意图识别模型获取,且通过句法规则获取的优先级高于通过意图识别模型获取的优先级,该步骤的实现方式为:终端通过句法规则获取输入信息在备选领域中的备选意图,若获取到,就将获取的意图作为输入信息在该备选领域中的备选意图,若获取不到,就通过意图识别模型获取输入信息在备选领域中的备选意图,将通过意图识别模型获取到的意图作为输入信息在备选领域中的备选意图。
需要说明的一点是,备选意图的获取方式的优先级是预设在终端中的,且不同获取方式可以对应不同的优先级,通过优先级高的获取方式获取的备选意图的准确率高于通过优先级低的获取方式获取的备选意图的准确率,从而终端按照多种方式的优先级从高到低的顺序,优先采用优先级高的获取方式获取输入信息的备选意图,获取备选意图的准确率高。
步骤303:终端根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率。
该步骤的实现方式包括以下三种。
第一种,终端根据至少两个备选意图的获取方式的优先级,获取输入信息属于每个备选意图的概率,获取方式的优先级越高,输入信息属于对应备选意图的概率越高。
终端中可以预设获取方式的优先级与概率的对应关系,并且,优先级越高,概率越大,相应的,该步骤的实现方式为:终端根据至少两个备选意图的获取方式的优先级,从获取方式的优先级与概率的对应关系中,获取输入信息属于每个备选意图的概率。
假设备选意图包括播放音乐,该备选意图是通过句法规则获取的,且句法规则获取方式的优先级为1,终端则将优先级为1对应的概率作为输入信息属于该备选意图的概率。
需要说明的一点是,本公开实施例中的概率可以通过分数表示,例如,获取方式的优先级为1,对应的分数为1分,获取方式的优先级为2,对应的分数为0.8分,并且,分数可以根据实际情况设置,本公开对此不做限制。
在本公开实施例中,由于优先级高的获取方式获取的备选意图更加准确,终端通过根据至少两个备选意图的获取方式的优先级,获取输入信息属于每个备选意图的概率,且获取方式的优先级越高,输入信息属于对应备选意图的概率越高,则获取的每个备选意图的概率可以客观地体现出输入信息与备选意图的匹配程度,获取的备选意图的概率的准确度高,从而后续根据备选意图的概率获取的目标领域准确度高。
第二种实现方式包括以下步骤(1)-(3)。
(1)终端获取输入信息对应的用户标识。
其中,用户标识用于确定输入信息对应的用户身份,用户标识可以为用户的账号、头像、手机号码、身份证号等,本公开对此不做限制。
(2)终端根据用户标识对应的领域,确定至少两个备选领域的优先级,用户标识对应的领域包括用户标识的历史输入信息所属的领域或用户标识的注册应用所属的领域中的至少一个。
在一种可能的实现方式中,终端根据用户标识的历史输入信息所属的领域,确定至少两个备选领域的优先级,实现方式为:终端根据用户标识从历史记录中获取该用户标识对应的至少一条历史输入信息,其中,历史记录中包括多个用户标识对应的历史输入信息,对于任一个备选领域,终端根据该至少一条历史输入信息,确定属于该备选领域的历史输入信息的条数,终端根据每个备选领域对应的历史输入信息的条数确定至少两个备选领域的优先级,历史输入信息的条数越多,对应的备选领域的优先级越高。
假设备选领域包括音频领域和视频领域,音频领域对应的历史输入信息的条数为5,视频领域对应的历史输入信息的条数为3,则将音频领域的优先级设置为1,将视频领域的优先级设置为2。
在本公开实施例中,由于用户标识的历史输入信息可以反映出该用户标识的输入信息的特点,从而反映出用户感兴趣的领域,表示用户输入的信息属于该领域的可能性较大,所以终端根据用户标识的历史输入信息所属的领域,确定至少两个备选领域的优先级,使得用户感兴趣的领域或者与用户感兴趣的领域相近的领域确定的优先级较高,其他领域的优先级较低,确定的备选领域的优先级具有客观性和准确性。
在另一种可能的实现方式中,终端根据用户标识的注册应用所属的领域,确定至少两个备选领域的优先级,实现方式为:终端根据用户标识确定该用户标识的注册应用,根据该注册应用所属的领域确定至少两个备选领域的优先级,与注册应用所属的领域相同的备选领域的优先级高于其他备选领域的优先级。
其中,终端中可以存储用户标识和注册应用的对应关系,以及注册应用和领域的对应关系。示例性的,存储方式可以为“用户标识1-注册应用1-领域1”,其中,注册应用可以为任意应用,例如,注册应用可以为音频应用、视频应用、查询应用等,本公开对此不做限制。
假设备选领域包括音频领域和视频领域,根据用户标识确定的注册应用为音频应用,音频应用对应的领域为音频领域,则终端将音频领域的优先级设置为1,将视频领域的优先级设置为2。
在本公开实施例中,由于用户标识的注册应用可以反映出该用户标识的输入信息的特点,该注册应用所属的领域很可能是用户感兴趣的领域,表示用户输入信息属于该领域的可能性较大,所以终端根据用户标识确定该用户标识的注册应用,根据该注册应用所属的领域确定至少两个备选领域的优先级,使得用户感兴趣的领域或者与用户感兴趣的领域相近的领域确定的优先级高,其他领域的优先级低,确定的备选领域的优先级具有客观性和准确性。
(3)终端根据至少两个备选领域的优先级和至少两个备选意图所属的备选领域,获取输入信息属于每个备选意图的概率,备选领域的优先级越高,输入信息属于对应备选领域中的备选意图的概率越高。
终端中可以预设备选领域的优先级与概率的对应关系,并且,优先级越高,概率越大,相应的,该步骤的实现方式为:终端根据每个备选意图所在的备选领域的优先级,从备选领域的优先级与概率的对应关系中,获取输入信息属于每个备选意图的概率。
假设备选意图包括播放音乐,该备选意图所在的备选领域为音频领域,音频领域的优先级为1,终端则将优先级为1对应的概率作为输入信息属于该备选意图的概率。
在本公开实施例中,终端通过获取输入信息对应的用户标识,根据用户标识对应的领域,确定至少两个备选领域的优先级,由于优先级高的备选领域的备选意图更加准确,终端通过根据至少两个备选领域的优先级和至少两个备选意图所属的备选领域,获取输入信息属于每个备选意图的概率,且备选领域的优先级越高,输入信息属于对应备选领域中的备选意图的概率越高,则获取的备选意图的概率可以客观的体现出输入信息与备选意图的匹配程度,从而获取的备选意图的概率的准确度高,进而后续根据备选意图的概率获取的目标领域准确度高。
第三种实现方式包括以下步骤(A)-(D)。
(A)对于获取的任一备选意图,终端获取输入信息中与备选意图对应的至少一个关键信息。
对于每种意图来说,用于实现该意图的信息中可以包括多个类型的信息,每个类型的信息在实现该意图时扮演不同的角色,其中类型可以称为槽位,与类型匹配的信息即可称为槽位信息,则对于任一备选意图来说,可以获取该备选意图对应的至少一个类型,从输入信息中获取该至少一个类型匹配的信息,作为关键信息。
例如,输入信息为“播放用户3的琅琊榜”,备选意图为播放音乐,意图“播放音乐”对应的类型包括作者(artist)、歌名(title)、专辑(album)、曲风和年代,该输入信息中“用户3”与类型“作者”匹配,“琅琊榜”与类型“歌名”匹配,则该输入信息中与该备选意图的类型匹配的关键信息包括“用户3”和“琅琊榜”。
在一种可能的实现方式中,备选意图是通过句法规则获取的,相应的,终端获取输入信息中与备选意图对应的至少一个关键信息的实现方式为:终端根据获取该备选意图所用的句法规则,从输入信息中获取与该备选意图的类型匹配的至少一个关键信息。
例如,输入信息为“播放用户3的琅琊榜”,获取备选意图“播放音乐”所用的句法规则为“播放{作者}的{歌名}”,则终端从该输入信息中获取与类型“作者”匹配的关键信息“用户3”和与类型“歌名”匹配的关键信息“琅琊榜”。
在本公开实施例中,通过根据获取备选意图所用的句法规则,从输入信息中获取与该备选意图的类型匹配的至少一个关键信息,由于通过句法规则匹配输入信息中的关键信息较为严格,从而得到的关键信息准确度高。
在另一种可能的实现方式中,备选意图是通过意图识别模型获取的,相应的,终端获取输入信息中与备选意图对应的至少一个关键信息的实现方式为:终端调用该备选意图对应的序列标注模型,对该输入信息进行关键信息识别,得到该输入信息中与该备选意图匹配的至少一个关键信息,其中,序列标注模型用于标注出输入信息中的关键信息。
序列标注模型可以是与意图对应的,一个意图可以对应一个序列标注模型,用于标注属于该意图的输入信息中的关键信息。序列标注模型可以根据对应意图的样本输入信息及样本输入信息中的关键信息训练得到,通过一次或多次训练,序列标注模型可以学习到输入信息中的关键信息与输入信息之间的关系,从而具备根据输入信息确定其中关键信息的能力,提高了模型的准确率,则通过调用序列标注模型,直接对该输入信息进行关键信息识别,得到输入信息中与该意图匹配的至少一个关键信息,方法简单,效率高。
序列标注模型可以是由该终端训练得到的,也可以是由服务器训练后由该终端从服务器获取的,还可以是其他终端训练后将序列标注模型上传到服务器,然后该终端从服务器获取的,本公开对此不做限制。
(B)终端在备选意图对应的信息数据库中,查询至少一个关键信息对应的目标信息。
其中,信息数据库用于存储备选意图对应的信息,例如,备选意图为查询天气,则该意图对应的信息数据库用于存储天气相关的信息,例如,“4月20日-北京-晴天-25摄氏度”、“4月22日-河北-石家庄-小雨-18摄氏度”等。又如,备选意图为播放音乐,则该意图对应的信息数据库用于存储音乐相关的信息,例如,“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)”、“作品(稻香)-作者(用户2)-专辑(魔杰座)-曲风(民谣)-年代(2008)”。
目标信息为与输入信息中的关键信息匹配的信息,例如,关键信息包括“用户3”,则该关键信息对应的目标信息为与用户3匹配的信息。
终端在备选意图对应的信息数据库中,查询至少一个关键信息对应的目标信息的实现方式为:终端在备选意图对应的信息数据库中,对至少一个关键信息对应的目标信息进行联合查询或者单独查询中的至少一种。
终端进行联合查询的方式可以为:终端将至少一个关键信息组成联合搜索词,在备选意图对应的信息数据库中,查询该联合搜索词对应的目标信息。以备选意图为播放音乐,关键信息包括“用户3”和“琅琊榜”为例,终端进行联合查询的方式为:终端将“用户3”和“琅琊榜”组成联合搜索词“用户3和琅琊榜”,从意图“播放音乐”对应的信息数据库中查询“用户3和琅琊榜”对应的目标信息。
终端进行单独查询的方式可以为:终端将至少一个关键信息中的每个关键信息作为单独搜索词,在备选意图对应的信息数据库中,查询每个单独搜索词对应的目标信息。以备选意图为播放音乐,关键信息包括“用户3”和“琅琊榜”为例,终端进行单独查询的方式为:终端以“用户3”作为单独搜索词,从意图“播放音乐”对应的信息数据库中查询“用户3”对应的目标信息,以“琅琊榜”作为单独搜索词,从意图“播放音乐”对应的信息数据库中查询“琅琊榜”对应的目标信息。
(C)终端根据每个关键信息的查询结果,获取每个关键信息的分数,查询结果包括查询成功或查询失败。
终端获取每个关键信息的分数前,先要确定每个关键信息的查询结果,实现方式为:终端响应于在进行联合查询时,在备选意图对应的信息数据库中,查询到联合搜索词对应的目标信息,确定联合搜索词中包括的每个关键信息查询成功,终端响应于在进行单独查询时,在备选意图对应的信息数据库中,查询到单独搜索词对应的目标信息,确定该单独搜索词对应的关键信息查询成功。
终端根据每个关键信息的查询结果,获取每个关键信息的分数,包括以下至少一项:终端将查询成功的关键信息所属的信息类型对应的分数,作为查询成功的关键信息的分数;将查询失败的关键信息的分数设置为预设分数。
由于有些类型的关键信息对实现意图的影响较大,可以作为主要类型,有些类型的关键信息对实现意图的影响较小,可以作为次要类型,不同类型对应不同的分数,因此终端在获取每个关键信息的分数前,要先确定每个关键信息的信息类型,信息类型包括主要类型和次要类型。
终端中可以预设意图的每个类型所属的信息类型。例如,意图“播放音乐”对应的类型包括作者、歌名、专辑、曲风和年代,其中,作者、歌名和专辑为主要类型,曲风和年代为次要类型,上述信息类型只是示例性说明,本公开对此不做限制。相应的,终端确定每个关键信息的信息类型的实现方式为:对于任一个关键信息,终端确定该关键信息对应的类型,将该类型所属的信息类型作为该关键信息的信息类型。
以关键信息包括“用户3”和“琅琊榜”为例,终端确定关键信息的信息类型的实现方式包括:终端确定“用户3”对应的类型“作者”,将“作者”所属的信息类型“主要类型”作为“用户3”的信息类型,确定“琅琊榜”对应的类型“歌名”,将“歌名”所属的信息类型“主要类型”作为“歌名”的信息类型。
需要说明的一点是,终端中可以预设关键信息的信息类型对应的分数以及查讯失败的关键信息的预设分数,其中,主要类型对应的分数比次要类型对应的分数高,并且,查讯失败的关键信息的预设分数要低于信息类型对应的分数。例如,主要类型对应的分数可以为1,次要类型对应的分数可以为0.8,查讯失败的关键信息的预设分数可以为0。另外,终端中也可以预设基准分数和每种信息类型对应的权重,相应的,终端可以通过基准分数和信息类型对应的权重获取信息类型对应的分数,例如,基准分数为1,主要类型对应的权重为1,次要类型对应的权重为0.75,则获取的主要类型对应的分数为1,次要类型对应的分数为0.75,上述分数和权重只是示例性说明,本公开对此不做限制。
(D)终端根据每个关键信息的分数,获取输入信息属于备选意图的概率。
在一种可能的实现方式中,该步骤的实现方式为:终端将每个关键信息的分数的平均值,作为输入信息属于备选意图的概率。
上述方法可通过下述公式(1)实现。
在本公开实施例中,对于获取的任一备选意图,终端获取输入信息中与备选意图对应的至少一个关键信息,在备选意图对应的信息数据库中,查询至少一个关键信息对应的目标信息,由于关键信息是输入信息中与备选意图匹配的信息,关键信息的查询结果可以客观地体现输入信息与备选意图的匹配程度,所以,终端通过根据每个关键信息的查询结果,获取每个关键信息的分数,根据每个关键信息的分数,获取输入信息属于备选意图的概率,则获取的备选意图的概率可以客观地体现出输入信息与备选意图的匹配程度,从而获取的备选意图的概率的准确度高,进而后续根据备选意图的概率获取的目标领域准确度高。
需要说明的一点是,上述三种获取输入信息属于每个备选意图的概率的方法可以通过任意形式进行结合,当然,也可以采用上述任意两种方法通过任意形式进行结合,本公开对此不做限制。
例如,可以将第一种方法和第三种方法结合来获取输入信息属于每个备选意图的概率,实现方式为:对于任一个备选意图,终端分别为通过第一种方法和第三种方法获取的该备选意图的概率设置权重,根据这两个权重,对这两个概率进行统计处理,将得到的统计值作为输入信息属于该备选意图的最终的概率,其中,统计处理的方式可以包括加权平均或加权求和。
在本公开实施例中,由于第一种方法和第三种方法获取的备选意图的概率可以从不同层面体现出输入信息与备选意图的匹配程度,终端通过结合第一种方法和第三种方法获取输入信息属于每个备选意图的概率,进一步提高了该概率的客观性和准确性。
步骤304:终端根据输入信息属于每个备选意图的概率,分别获取输入信息属于每个备选领域的概率。
在一种可能的实现方式中,该步骤的实现方式为:对于任一备选领域,终端将输入信息属于该备选领域中的备选意图的概率,作为输入信息属于该备选领域的概率,方法简单,且由于该备选意图属于该备选领域,所以该方法获取的输入信息属于备选领域的概率可以很好地体现输入信息与备选领域的匹配程度,获取的概率的准确性高。
在另一种可能的实现方式中,终端可以将通过领域识别模型得到的、输入信息属于每个备选领域的概率和输入信息属于每个备选意图的概率结合,来获取输入信息属于每个备选领域的概率,实现方式为:终端调用领域识别模型,对该输入信息进行领域识别,得到输入信息属于每个备选领域的概率,对于任一备选领域,终端为输入信息属于该备选领域中备选意图的概率设置第一权重,为通过领域识别模型得到的该备选领域的概率设置第二权重,根据第一权重和第二权重,对这两个概率进行统计处理,将得到的统计值作为输入信息属于该备选领域的最终的概率。其中,统计处理的方式可以包括加权平均或加权求和。
在本公开实施例中,由于通过领域识别模型得到的输入信息属于每个备选领域的概率和输入信息属于每个备选意图的概率,可以从不同层面体现输入信息与备选领域的匹配程度,从而将这两个概率结合,来获取输入信息最终属于每个备选领域的概率,可以进一步提高获取的输入信息属于每个备选领域的概率的准确性。
步骤305:终端根据输入信息属于每个备选领域的概率,选取输入信息所属的目标领域,输入信息属于目标领域的概率大于输入信息属于其他备选领域的概率。
该步骤的实现方式为:终端按照输入信息属于每个备选领域的概率从高到低的顺序,选取预设数目的备选领域,作为目标领域;或者,终端从至少两个备选领域中,选取概率大于预设阈值的备选领域,作为目标领域。
其中,预设数目可以根据需要设置,例如设置为1,本公开对此不做限制。预设阈值也可以根据需要设置,本公开对此不做限制。
步骤306:终端将输入信息在目标领域中的备选意图作为目标意图,根据目标意图执行输入信息对应的操作。
输入信息对应操作可以为任意操作,例如,查询操作、订购操作、播放操作、控制操作等,并且,输入信息对应的操作是在目标意图下的操作,用于实现该目标意图。例如,输入信息为“播放用户3的琅琊榜”,该输入信息所属的目标意图为播放音乐,则该输入信息对应的操作可以为播放操作,例如,播放“琅琊榜”。又如,输入信息为“北京明天天气如何”,该输入信息所属的目标意图为查询天气,则该输入信息对应的操作可以为查询操作,例如,查询北京明天的天气。
在一种可能的实现方式中,终端根据目标意图执行输入信息对应的操作的实现方式可以为:终端从目标意图的关键信息对应的至少一个目标信息中选取预设数目个目标信息,输出该预设数目个目标信息。
例如,输入信息为“播放用户3的琅琊榜”,目标意图为播放音乐,关键信息包括“用户3”和“琅琊榜”,关键信息“用户3”和“琅琊榜”对应的目标信息包括“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(录音室版)”和“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(现场版)”等多个目标信息,则终端可以从这多个目标信息中选取预设数目个目标信息,输出该预设数目个目标信息。
需要说明的一点是,在目标意图的关键信息对应的目标信息的数目少于预设数目的情况下,终端可以根据目标信息的数目,从该目标意图对应的信息数据库中获取相应数目的推荐信息,然后输出目标信息和推荐信息,其中,目标信息的数目与推荐信息的数目之和可以等于预设数目。上述方法在输入信息对应的目标信息数目较少、甚至没有目标信息的情况下,照样能够输出预设数目个信息,即完成与用户的交互,从而可以提高用户粘性。
在另一种可能的实现方式中,终端根据目标意图执行输入信息对应的操作的实现方式可以为:终端从目标意图的关键信息对应的至少一个目标信息中选取一个目标信息,根据该目标信息,执行输入信息对应的操作。
例如,输入信息为“播放用户3的琅琊榜”,目标意图为播放音乐,关键信息包括“用户3”和“琅琊榜”,关键信息“用户3”和“琅琊榜”对应的目标信息包括“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(录音室版)”和“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(现场版)”等多个目标信息,终端可以从这多个目标信息中选择一个目标信息,例如,“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(录音室版)”,播放该目标信息的音乐“琅琊榜”。
该终端可以包括交互模型,交互模型包括语义理解模块和技能服务(SkillServer)模块,语义理解模块和技能服务模块连接。
其中语义理解模块用于确定与输入信息匹配的至少两个备选领域;获取输入信息在每个备选领域中的备选意图;根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率;根据输入信息属于每个备选领域的概率,选取输入信息所属的目标领域,输入信息属于目标领域的概率大于输入信息属于其他备选领域的概率。
语义理解模块还用于将输入信息在目标领域中的备选意图作为目标意图,技能服务模块用于根据目标意图执行输入信息对应的操作。
在一种可能的实现方式中,语义理解模块还用于获取输入信息中与目标意图对应的至少一个关键信息,将该至少一个关键信息发送给与该目标意图对应的技能服务模块,该技能服务模块还用于根据该至少一个关键信息执行输入信息对应的操作。
例如,终端获取的输入信息为“播放用户3的琅琊榜”,通过交互模型中的语义理解模块获取的目标意图为播放音乐,关键信息包括“用户3”和“琅琊榜”,则语义理解模块将“用户3”和“琅琊榜”作为参数输入到意图“播放音乐”对应的技能服务模块,该技能服务模块根据“用户3”和“琅琊榜”执行对应的播放操作。
在另一种可能的实现方式中,语义理解模块还用于获取目标意图的关键信息对应的至少一个目标信息,将该至少一个目标信息发送给技能服务模块,技能服务模块还用于根据该至少一个目标信息执行输入信息对应的操作。
例如,终端获取的输入信息为“播放用户3的琅琊榜”,通过交互模型中的语义理解模块获取的目标意图为播放音乐,关键信息包括“用户3”和“琅琊榜”,关键信息“用户3”和“琅琊榜”对应的目标信息包括“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(录音室版)”和“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(现场版)”等多个目标信息,则技能服务模块可以从这多个目标信息中选取预设数目个目标信息,输出该预设数目个目标信息。或者,技能服务器模块可以从这多个目标信息中选择一个目标信息,例如,“作品(琅琊榜)-作者(用户3)-专辑(琅琊榜)-曲风(中国风)-年代(2015)-类型(录音室版)”,播放该目标信息的音乐“琅琊榜”。
参考图4,为一种语义理解引擎的结构示意图,该语义理解引擎包括多个不同领域的机器人,用于处理不同领域的输入信息,例如,视频领域机器人(VideoBot),用于处理视频领域的输入信息,音频领域机器人(MusicBot),用于处理音频领域的输入信息,天气领域机器人,用于处理天气领域的输入信息。当然,还可以包括其他领域机器人,本公开实施例对此不做限制。每个领域机器人包括语义识别模块、查询模块、推荐模块和知识推理模块。以音频机器人为例,语义识别模块用于识别输入信息在该领域中的意图和对应的关键信息,查询模块用于从该意图对应的媒资库(信息数据库)中查询关键信息对应的目标信息(音乐),推荐模块用于在查询模块查询不到目标信息,或者查询到的目标信息的数目较少时,从该意图对应的媒资库中获取推荐的信息,即推荐的音乐,知识推理模块用于在输入信息中存在复杂的待推理的信息时,根据知识库中的知识对输入信息中待推理的信息进行推理,然后将知识推理得到的结果交由语义识别模块处理,例如,输入信息为“播放用户1老公的稻香”,其中待推理的信息为“用户1老公”,则知识推理模块对该输入信息进行知识推理,可得到结果“播放用户2的稻香”,其中,用户2为用户1的老公。
继续参考图4,在本公开实施例中,语义理解引擎在接收到输入信息后,可根据输入信息从多个领域机器人中选择至少两个备选领域机器人,然后该至少两个领域机器人对该输入信息进行并行处理,每个备选领域机器人根据获取的输入信息的意图确定输入信息属于对应领域的概率,输出对应领域中查询到的目标信息以及输入信息属于该领域的概率。语义理解引擎可以根据每个备选领域机器人返回的输入信息属于对应领域的概率,确定输入信息所属的目标领域,如此可以避免在还未获取输入信息对应的意图时,先确定输入信息所属的目标领域而导致领域识别错误的情况,提高了领域识别的准确性,从而提高了用户粘性。
参考图5,为一种音频机器人的结构示意图,该音频机器人包括语义识别模块,语义识别模块中包括规则引擎(rule engine)和模型引擎(model engine),其中,规则引擎用于通过句法规则获取输入信息的意图,以及获取与意图对应的关键信息,模型引擎用于通过意图识别模型获取输入信息的意图,以及通过与该意图识别模型对应的序列标注模型获取意图对应的关键信息。如果语义识别模块未能获取到输入信息的意图,则音频机器人确定不能处理该输入信息,即输入信息不属于音频领域,其中,语义识别模块未能获取到输入信息的意图的情况包括:规则引擎未能获取到输入信息对应的意图和模型引擎识别出的意图的分类置信度小于预设阈值。如果语义识别模块获取到输入信息的意图和意图对应的关键信息,则通过查询模块从音频机器人的媒资库中查询关键信息对应的目标信息,即音乐。如果查询模块查询不到目标信息或者查询到的目标信息较少,则通过推荐模块从该媒资库中获取推荐的音乐。然后,音频机器人将根据意图获取的输入信息属于音频领域的概率、查询到的音乐以及推荐的音乐返回给语义理解引擎。
本公开实施例考虑到一个领域下具有多种意图,输入信息是否属于某一领域,取决于输入信息是否属于该领域下的某种意图,因此以领域下的意图为单位,先获取输入信息属于备选意图的概率,再获取输入信息属于备选领域的概率,由于输入信息属于备选领域的概率是根据输入信息属于该备选领域中备选意图的概率来获取的,因而能够客观准确地体现输入信息与备选领域的匹配程度。在此基础上,利用多个备选领域的概率来进行领域识别,由于考虑了多个备选领域和多个备选领域中的备选意图,即使输入信息存在歧义的情况下也能从多个备选领域中准确识别输入信息所属的目标领域,提高了领域识别的准确率,提升了领域识别方法的健壮性。
在本公开实施例中,以词语为单位区别各个领域,领域划分的力度较细,从而确定出的备选领域的准确率较高。并且,通过句法规则获取输入信息在备选领域中的备选意图,由于句法规则是用户描述相应意图的习惯用语,因此获取的备选意图准确率高。并且,通过意图识别模型直接获取备选意图,由于意图识别模型的识别效率高,从而获取备选意图的效率高。
在本公开实施例中,由于优先级高的获取方式获取的备选意图更加准确,获取方式的优先级越高,输入信息属于对应备选意图的概率越高,则获取的每个备选意图的概率可以客观地体现出输入信息与备选意图的匹配程度,获取的备选意图的概率的准确度高,因此获取的目标领域准确度高。
在本公开实施例中,由于用户标识的历史输入信息可以反映出该用户标识的输入信息的特点,从而反映出用户感兴趣的领域,用户感兴趣的领域或者与用户感兴趣的领域相近的领域确定的优先级较高,其他领域的优先级较低,可以保证确定的备选领域的优先级具有客观性和准确性。
在本公开实施例中,由于用户标识的注册应用可以反映出该用户标识的输入信息的特点,该注册应用所属的领域很可能是用户感兴趣的领域,用户感兴趣的领域或者与用户感兴趣的领域相近的领域确定的优先级高,其他领域的优先级低,可以保证确定的备选领域的优先级具有客观性和准确性。
在本公开实施例中,根据用户标识对应的领域,确定至少两个备选领域的优先级,备选领域的优先级越高,输入信息属于对应备选领域中的备选意图的概率越高,则获取的备选意图的概率可以客观地体现出输入信息与备选意图的匹配程度,从而获取的备选意图的概率的准确度高,因此获取的目标领域准确度高。
在本公开实施例中,由于关键信息是输入信息中与备选意图匹配的信息,关键信息的查询结果可以客观地体现输入信息与备选意图的匹配程度,根据每个关键信息的查询结果,获取每个关键信息的分数,从而获取输入信息属于备选意图的概率,则获取的备选意图的概率可以客观的体现出输入信息与备选意图的匹配的程度,从而获取的备选意图的概率的准确度高,因此获取的目标领域准确度高。
图6是本公开实施例提供的一种领域识别装置的框图。参见图6,该装置包括:
备选领域确定模块601,被配置为根据输入信息,确定输入信息匹配的至少两个备选领域;
备选意图获取模块602,被配置为获取输入信息在每个备选领域中的备选意图;
概率获取模块603,被配置为根据获取的至少两个备选意图,获取输入信息属于每个备选意图的概率;
概率获取模块603,还被配置为根据输入信息属于每个备选意图的概率,分别获取输入信息属于每个备选领域的概率;
目标领域选取模块604,被配置为根据输入信息属于每个备选领域的概率,选取输入信息所属的目标领域,输入信息属于目标领域的概率大于输入信息属于其他备选领域的概率。
本公开实施例考虑到一个领域下具有多种意图,输入信息是否属于某一领域,取决于输入信息是否属于该领域下的某种意图,因此以领域下的意图为单位,先获取输入信息属于备选意图的概率,再获取输入信息属于备选领域的概率,由于输入信息属于备选领域的概率是根据输入信息属于该备选领域中备选意图的概率来获取的,因而能够客观准确地体现输入信息与备选领域的匹配程度。在此基础上,利用多个备选领域的概率来进行领域识别,由于考虑了多个备选领域和多个备选领域中的备选意图,即使输入信息存在歧义的情况下也能从多个备选领域中准确识别输入信息所属的目标领域,提高了领域识别的准确率,提升了领域识别方法的健壮性。
在一种可能的实现方式中,备选意图获取模块602,还被配置为对于确定的任一备选领域,确定获取备选领域中备选意图的多种方式,多种方式具有优先级;按照多种方式的优先级从高到低的顺序,采用优先级最高的方式获取输入信息的备选意图;或者,采用优先级最高的方式无法获取输入信息的备选意图,则采用下一个方式获取输入信息的备选意图,直至获取到输入信息的备选意图。
在另一种可能的实现方式中,概率获取模块603,还被配置为根据至少两个备选意图的获取方式的优先级,获取输入信息属于每个备选意图的概率,获取方式的优先级越高,输入信息属于对应备选意图的概率越高。
在另一种可能的实现方式中,备选意图获取模块602,还被配置为对于任一备选领域,获取备选领域的至少一个意图对应的句法规则,响应于输入信息满足第一句法规则,将第一句法规则对应的意图作为输入信息在备选领域中的备选意图;或者,对于任一备选领域,调用备选领域的意图识别模型,对输入信息进行意图识别,得到输入信息在备选领域中的备选意图。
在另一种可能的实现方式中,概率获取模块603,还被配置为获取输入信息对应的用户标识;根据用户标识对应的领域,确定至少两个备选领域的优先级,用户标识对应的领域包括用户标识的历史输入信息所属的领域或用户标识的注册应用所属的领域中的至少一个;根据至少两个备选领域的优先级和至少两个备选意图所属的备选领域,获取输入信息属于每个备选意图的概率,备选领域的优先级越高,输入信息属于对应备选领域中的备选意图的概率越高。
在另一种可能的实现方式中,概率获取模块603,还被配置为对于获取的任一备选意图,获取输入信息中与备选意图对应的至少一个关键信息;在备选意图对应的信息数据库中,查询至少一个关键信息对应的目标信息;根据每个关键信息的查询结果,获取每个关键信息的分数,查询结果包括查询成功或查询失败;根据每个关键信息的分数,获取输入信息属于备选意图的概率。
在另一种可能的实现方式中,概率获取模块603,还被配置为将查询成功的关键信息所属的信息类型对应的分数,作为查询成功的关键信息的分数;或者,将查询失败的关键信息的分数设置为预设分数。
在另一种可能的实现方式中,备选领域确定模块601,还被配置为从输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定输入信息匹配的至少两个备选领域。
在另一种可能的实现方式中,装置还包括:
操作执行模块,被配置为将输入信息在目标领域中的备选意图作为目标意图,根据目标意图执行输入信息对应的操作。
需要说明的是:上述实施例提供的领域识别装置在进行领域识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将电子设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的领域识别装置与领域识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7示出了本公开一个示例性实施例提供的电子设备700的结构框图。该电子设备700可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备700还可能被称为用户设备、便携式电子设备、膝上型电子设备、台式电子设备等其他名称。
通常,电子设备700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以集成有GPU(Graphics Processing Unit,图像处理器), GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的领域识别方法。
在一些实施例中,电子设备700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、显示屏705、摄像头组件706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它电子设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置电子设备700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在电子设备700的不同表面或呈折叠设计;在另一些实施例中,显示屏705可以是柔性显示屏,设置在电子设备700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在电子设备的前面板,后置摄像头设置在电子设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位电子设备700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源709用于为电子设备700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以电子设备700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测电子设备700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对电子设备700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在电子设备700的侧边框和/或显示屏705的下层。当压力传感器713设置在电子设备700的侧边框时,可以检测用户对电子设备700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在显示屏705的下层时,由处理器701根据用户对显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置电子设备700的正面、背面或侧面。当电子设备700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制显示屏705的显示亮度。具体地,当环境光强度较高时,调高显示屏705的显示亮度;当环境光强度较低时,调低显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在电子设备700的前面板。接近传感器716用于采集用户与电子设备700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变小时,由处理器701控制显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变大时,由处理器701控制显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对电子设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是本公开实施例提供的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)801和一个或一个以上的存储器802,其中,所述存储器802中存储有至少一条指令,所述至少一条指令由所述处理器801加载并执行以实现上述各个方法实施例提供的领域识别方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,该至少一条指令由处理器加载并执行,以实现上述实施例的领域识别方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例还提供了一种电子设备,该电子设备包括处理器和存储器,存储器中存储有至少一条指令,该至少一条指令由处理器加载并执行,以实现上述实施例的领域识别方法中所执行的操作。
本公开实施例还提供了一种计算机程序,该计算机程序中存储有至少一条指令,该指令由处理器加载并执行,以实现上述实施例的领域识别方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本公开的可选实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (11)
1.一种领域识别方法,其特征在于,所述方法包括:
根据输入信息,确定所述输入信息匹配的至少两个备选领域;
获取所述输入信息在每个备选领域中的备选意图;
根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率;
根据所述输入信息属于所述每个备选意图的概率,分别获取所述输入信息属于所述每个备选领域的概率;
根据所述输入信息属于所述每个备选领域的概率,选取所述输入信息所属的目标领域,所述输入信息属于所述目标领域的概率大于所述输入信息属于其他备选领域的概率;
其中,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
对于获取的任一备选意图,获取所述输入信息中与所述备选意图对应的至少一个关键信息;
在所述备选意图对应的信息数据库中,查询所述至少一个关键信息对应的目标信息;
根据每个关键信息的查询结果,获取所述每个关键信息的分数,所述查询结果包括查询成功或查询失败;
根据所述每个关键信息的分数,获取所述输入信息属于所述备选意图的概率。
2.根据权利要求1所述的方法,其特征在于,所述获取所述输入信息在每个备选领域中的备选意图,包括:
对于确定的任一备选领域,确定获取所述备选领域中备选意图的多种方式,所述多种方式具有优先级;
按照所述多种方式的优先级从高到低的顺序,采用优先级最高的方式获取所述输入信息的备选意图;或者,采用优先级最高的方式无法获取所述输入信息的备选意图,则采用下一个方式获取所述输入信息的备选意图,直至获取到所述输入信息的备选意图。
3.根据权利要求2所述的方法,其特征在于,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
根据所述至少两个备选意图的获取方式的优先级,获取所述输入信息属于每个备选意图的概率,获取方式的优先级越高,所述输入信息属于对应备选意图的概率越高。
4.根据权利要求1所述的方法,其特征在于,所述获取所述输入信息在每个备选领域中的备选意图,包括:
对于任一备选领域,获取所述备选领域的至少一个意图对应的句法规则,响应于所述输入信息满足第一句法规则,将所述第一句法规则对应的意图作为所述输入信息在所述备选领域中的备选意图;或者,
对于任一备选领域,调用所述备选领域的意图识别模型,对所述输入信息进行意图识别,得到所述输入信息在所述备选领域中的备选意图。
5.根据权利要求1所述的方法,其特征在于,所述根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率,包括:
获取所述输入信息对应的用户标识;
根据所述用户标识对应的领域,确定所述至少两个备选领域的优先级,所述用户标识对应的领域包括所述用户标识的历史输入信息所属的领域或所述用户标识的注册应用所属的领域中的至少一个;
根据所述至少两个备选领域的优先级和所述至少两个备选意图所属的备选领域,获取所述输入信息属于每个备选意图的概率,备选领域的优先级越高,所述输入信息属于对应备选领域中的备选意图的概率越高。
6.根据权利要求1所述的方法,其特征在于,所述根据每个关键信息的查询结果,获取所述每个关键信息的分数,包括以下至少一项:
将查询成功的关键信息所属的信息类型对应的分数,作为所述查询成功的关键信息的分数;
将查询失败的关键信息的分数设置为预设分数。
7.根据权利要求1所述的方法,其特征在于,所述根据输入信息,确定所述输入信息匹配的至少两个备选领域,包括:
从所述输入信息中提取至少一个领域关键词,根据每个领域关键词所属的领域,确定所述输入信息匹配的至少两个备选领域。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述输入信息在所述目标领域中的备选意图作为目标意图,根据所述目标意图执行所述输入信息对应的操作。
9.一种领域识别装置,其特征在于,所述装置包括:
备选领域确定模块,被配置为根据输入信息,确定所述输入信息匹配的至少两个备选领域;
备选意图获取模块,被配置为获取所述输入信息在每个备选领域中的备选意图;
概率获取模块,被配置为根据获取的至少两个备选意图,获取所述输入信息属于每个备选意图的概率;
所述概率获取模块,还被配置为根据所述输入信息属于所述每个备选意图的概率,分别获取所述输入信息属于所述每个备选领域的概率;
目标领域选取模块,被配置为根据所述输入信息属于所述每个备选领域的概率,选取所述输入信息所属的目标领域,所述输入信息属于所述目标领域的概率大于所述输入信息属于其他备选领域的概率;
其中,所述概率获取模块,还被配置为对于获取的任一备选意图,获取所述输入信息中与所述备选意图对应的至少一个关键信息;在所述备选意图对应的信息数据库中,查询所述至少一个关键信息对应的目标信息;根据每个关键信息的查询结果,获取所述每个关键信息的分数,所述查询结果包括查询成功或查询失败;根据所述每个关键信息的分数,获取所述输入信息属于所述备选意图的概率。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至权利要求8任一项所述的领域识别方法所执行的操作。
11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如权利要求1至权利要求8任一项所述的领域识别方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010867146.1A CN111737423B (zh) | 2020-08-26 | 2020-08-26 | 领域识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010867146.1A CN111737423B (zh) | 2020-08-26 | 2020-08-26 | 领域识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111737423A CN111737423A (zh) | 2020-10-02 |
CN111737423B true CN111737423B (zh) | 2021-01-01 |
Family
ID=72658885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010867146.1A Active CN111737423B (zh) | 2020-08-26 | 2020-08-26 | 领域识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737423B (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077407B (zh) * | 2014-07-10 | 2017-06-16 | 中国工商银行股份有限公司 | 一种智能数据搜索系统及方法 |
CN107688614B (zh) * | 2017-08-04 | 2018-08-10 | 平安科技(深圳)有限公司 | 意图获取方法、电子装置及计算机可读存储介质 |
US10747954B2 (en) * | 2017-10-31 | 2020-08-18 | Baidu Usa Llc | System and method for performing tasks based on user inputs using natural language processing |
CN109344395B (zh) * | 2018-08-30 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、服务器及存储介质 |
CN109241265B (zh) * | 2018-09-17 | 2022-06-03 | 四川长虹电器股份有限公司 | 一种面向多轮查询的领域识别方法及系统 |
CN109272999B (zh) * | 2018-09-19 | 2019-08-16 | 三角兽(北京)科技有限公司 | 信息处理装置、其人机对话方法及存储介质 |
CN109670035B (zh) * | 2018-12-03 | 2021-03-23 | 科大讯飞股份有限公司 | 一种文本摘要生成方法 |
CN110059193A (zh) * | 2019-06-21 | 2019-07-26 | 南京擎盾信息科技有限公司 | 基于法律语义件与文书大数据统计分析的法律咨询系统 |
-
2020
- 2020-08-26 CN CN202010867146.1A patent/CN111737423B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111737423A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109040297B (zh) | 用户画像生成方法及装置 | |
CN110556127B (zh) | 语音识别结果的检测方法、装置、设备及介质 | |
CN108717432B (zh) | 资源查询方法及装置 | |
CN110572716B (zh) | 多媒体数据播放方法、装置及存储介质 | |
CN111782950B (zh) | 样本数据集获取方法、装置、设备及存储介质 | |
CN111858971A (zh) | 多媒体资源推荐方法、装置、终端及服务器 | |
CN111104980A (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN112052354A (zh) | 视频推荐方法、视频展示方法、装置及计算机设备 | |
CN111935516B (zh) | 音频文件的播放方法、装置、终端、服务器及存储介质 | |
CN112148899A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN110837557B (zh) | 摘要生成方法、装置、设备及介质 | |
CN113190307A (zh) | 控件添加方法、装置、设备及存储介质 | |
CN109547847B (zh) | 添加视频信息的方法、装置及计算机可读存储介质 | |
CN109189978B (zh) | 基于语音消息进行音频搜索的方法、装置及存储介质 | |
CN110929137A (zh) | 文章推荐方法、装置、设备及存储介质 | |
CN112069350A (zh) | 歌曲推荐方法、装置、设备以及计算机存储介质 | |
CN112764600A (zh) | 资源处理方法、装置、存储介质及计算机设备 | |
CN110990728A (zh) | 兴趣点信息的管理方法、装置、设备及存储介质 | |
CN111737423B (zh) | 领域识别方法、装置、电子设备及存储介质 | |
CN114996573A (zh) | 内容项处理方法、装置、设备及存储介质 | |
CN114817709A (zh) | 排序方法、装置、设备及计算机可读存储介质 | |
CN109635153B (zh) | 迁移路径生成方法、装置及存储介质 | |
CN115905374A (zh) | 应用功能的展示方法、装置、终端及存储介质 | |
CN113377271A (zh) | 文本获取方法、装置、计算机设备及介质 | |
CN111640432A (zh) | 语音控制方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |