CN115688743B - 一种短信解析的方法及相关电子设备 - Google Patents

一种短信解析的方法及相关电子设备 Download PDF

Info

Publication number
CN115688743B
CN115688743B CN202310001313.8A CN202310001313A CN115688743B CN 115688743 B CN115688743 B CN 115688743B CN 202310001313 A CN202310001313 A CN 202310001313A CN 115688743 B CN115688743 B CN 115688743B
Authority
CN
China
Prior art keywords
slot
keyword
characters
vector
intent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310001313.8A
Other languages
English (en)
Other versions
CN115688743A (zh
Inventor
詹长静
张云柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202310001313.8A priority Critical patent/CN115688743B/zh
Publication of CN115688743A publication Critical patent/CN115688743A/zh
Application granted granted Critical
Publication of CN115688743B publication Critical patent/CN115688743B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种短信解析的方法及相关电子设备,该方法通过在短信解析模型中加入关键词的特征向量以及字符的权重信息,使得短信解析模型输出更加聚焦输入文本中关键词的信息。由于关键词的信息与短信解析模型输出的文本信息的意图标识和槽位标识的准确性相关。通过上述方式,能够提高短信解析模型输出输入文本的意图标识和槽位标识的准确性。

Description

一种短信解析的方法及相关电子设备
技术领域
本申请涉及短信解析领域,尤其涉及一种短信解析的方法及相关电子设备。
背景技术
随着电子设备技术的不断发展,电子设备的功能越来越全面。电子设备在接收到短信后,可以生成该短信对应的任务卡片,并将该任务卡片显示在电子设备的主界面上,提示用户待完成的事项。这极大地避免了用户遗忘重要事项,提升了用户的使用体验。
发明内容
本申请实施例提供了一种短信解析方法,解决了电子设备解析短信后,输出的短信的意图标识和槽位标识不准确的问题。
第一方面,本申请实施例提供了一种短信解析方法,包括:接收文本信息,所述文本信息中包括N个字符;根据所述N个字符得到第一向量矩阵H,在所述H中包括N个隐藏向量h,所述N个h与所述N个字符一一对应;根据所述N个h得到第一文本向量h',所述h'包括所述N个字符的向量信息;基于所述h'和第一权重向量得到第二意图融合向量Intent_value;所述Intent_value中的关键词信息数量大于所述h'中的关键词信息数量,所述第一权重向量包括N个第一权重值,所述N个第一权重值与所述N个字符一一对应,对应字符的第一权重值用于表征所述文本信息中,每个字符的向量信息占整个文本信息的向量信息的比重;根据所述h'和所述Intent_value输出所述文本信息的意图标识,所述意图标识用于表征所述文本信息的意图。
在上述实施例中,在对短信文本进行处理识别的过程中,增加融合短信中关键词信息和字符位置信息的融合机制来增强对文本信息中关键词的关注能力,从而提高区分文本信息中易混淆文本的能力。此外,根据文本信息中“关键词位置越靠前,重要性程度越高”的特点,在解析文本信息的过程中加入文本信息中字符的位置信息,提高电子设备识别有效关键词信息的能力。同时,建立了信息感知门控机制来平衡关键词信息的融入,从而避免无效关键词带来的干扰影响。通过上述方式,提升了电子设备识别文本信息的意图类别以及文本信息中每个字符的槽位标识的准确性。
结合第一方面,在一种可能实现的方式中,根据所述N个字符得到第一向量矩阵H,具体包括:将这N个字符进行预处理,得到N个Embedding向量;这N个Embedding向量与N个字符一一对应;将该N个Embedding向量和关键词的Embedding向量进行融合编码,得到H。这样,将文本信息转换为电子设备能够处理的计算机语言。通过给输入关键词的词嵌入向量e0,使得上下文编码模块能够根据e0中的关键词信息识别文本中关键词的向量信息,从而提高识别短信文本中关键词的准确性,进而有利于电子设备基于准确性高的关键词,通过意图识别算法输出准确率高的意图标识。
结合第一方面,在一种可能实现的方式中,基于所述h'和第一权重向量得到第二意图融合向量Intent_value之前,还包括:计算所述第一权重向量;其中,所述计算所述第一权重向量,具体包括:根据公式Wip=(N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;通过公式KPWi=Wik*Wip计算所述文本信息中,每个字符的第一权重值,所述Wik为所述N个字符中,第i个字符的关键词频率,所述KPWi为所述N个字符中,第i个字符的第一权重值,所述KPWi为所述第一权重向量中的元素。这样,对于短信文本中的字符,尤其是关键词的字符,其位置在短信文本中越靠前,电子设备赋予的第一权重向量中对应的位置权重越大。
结合第一方面,在一种可能实现的方式中,基于所述h'和第一权重向量得到第二意图融合向量Intent_value,具体包括:根据公式R=Softmax((h'HT*Keyword_mask)+KPW)H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;所述KPW为所述第一权重向量;根据所述R得到所述Intent_value。这样,电子设备通过上述方式计算到的第一意图融合向量R包括了整个文本字符的向量信息,且相较于h',更加关注短信文本中关键词的信息(尤其是位置靠前的有效关键词的信息)。
结合第一方面,在一种可能实现的方式中,基于所述h'和第一权重向量得到第二意图融合向量Intent_value,具体包括:根据公式R=Softmax((h'HT*Keyword_mask)+KPW)H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Softmax为归一化函数;所述KPW为所述第一权重向量;根据所述R得到所述Intent_value
结合第一方面,在一种可能实现的方式中,根据所述R得到所述Intent_value,具体包括:根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;根据公式Intent_value=(1-Ai)*h' +Ai*R得到所述Intent_value
结合第一方面,在一种可能实现的方式中,根据R得到所述ntent_value,具体包括:根据公式Intent_value=(1-m)*h'+m*R得到Intent_value,所述m为融合系数,所述m可以根据历史值得到,还可以根据实验数据得到;优选的,所述m可以为0.5。
结合第一方面,在一种可能实现的方式中,根据所述Intent_value输出所述文本信息的意图标识,包括:根据公式Z=Argmax(Softmax(K1 Intent_value+B1))输出所述意图标识;其中,所述Z为所述意图标识,所述K1和所述B1为超参数。
结合第一方面,在一种可能实现的方式中,还可以基于非线性的方式,通过h' 和Intent_value输出文本信息的意图标识。
结合第一方面,在一种可能实现的方式中,根据N个字符得到第一向量矩阵H之后,还包括:基于H和第二权重向量得到第二槽位融合向量Slot_value;所述Slot_value用于表征N个字符的槽位信息,第二权重向量包括N个第二权重值,N个第二权重值与N个字符一一对应,对应字符的第二权重值用于表征该文本信息中,对应字符为槽位字符的可靠程度;根据H和所述Slot_value输出这N个字符的槽位标识。
结合第一方面,在一种可能实现的方式中,基于H和第二权重向量得到第二槽位融合向量Slot_value之前,还包括:计算第二权重向量;其中,计算所述第二权重向量,具体包括:根据公式Wip=(N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;通过公式SPWi=Wis*Wip计算所述文本信息中,每个字符的第二权重值,所述Wis为所述N个字符中,第i个字符的槽位频率,所述SPWi为所述N个字符中,第i个字符的第二权重值,所述SPWi为所述第二权重向量中的元素。
结合第一方面,在一种可能实现的方式中,基于H和第二权重向量得到第二槽位融合向量Slot_value,具体包括:根据公式P=Softmax((HHT*Keyword_mask)+SPW) H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;根据所述P得到所述Slot_value
结合第一方面,在一种可能实现的方式中,基于H和第二权重向量得到第二槽位融合向量Slot_value,具体包括:根据公式P=Softmax((HHT+SPW) H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,所述SPW为第二权重向量;根据所述P得到所述Slot_value
结合第一方面,在一种可能实现的方式中,根据P得到Slot_value,具体包括:根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;根据公式Slot_value=(1-As)*H +As*P得到所述Slot_value
结合第一方面,在一种可能实现的方式中,根据P得到Slot_value,具体包括:根据公式Slot_value=(1-n)*H+n*P得到Slot_value;所述n为融合系数,所述n可以根据历史值得到,还可以根据实验数据得到;优选的,所述n可以为0.5。
结合第一方面,在一种可能实现的方式中,根据H和Slot_value输出这N个字符的槽位标识,具体包括:根据公式Y=Argmax(Softmax(Slot_valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
结合第一方面,在一种可能实现的方式中,还可以基于非线性的方式,通过H和Slot_value输出这N个字符的槽位标识。
结合第一方面,在一种可能实现的方式中,该方法应用于电子设备,在电子设备中包括词嵌入表示模块、上下文编码模块,根据这N个字符得到第一向量矩阵H,具体包括:词嵌入表示模块将这N个字符进行预处理,得到N个Embedding向量;词嵌入表示模块将这N个Embedding向量发送给上下文编码模块;上下文编码模块将这N个Embedding向量和关键词的Embedding向量进行融合编码,得到H。
结合第一方面,在一种可能实现的方式中,该电子设备还包括意图关键词融合模块、意图关键词门控模块以及意图标识解码器,根据所述h'和所述Intent_value输出所述文本信息的意图标识,具体包括:意图关键词融合模块根据公式R=Softmax((h'HT*Keyword_mask)+KPW)H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;意图关键词融合模块将R发送给意图关键词门控模块;意图关键词门控模块根据R得到Intent_value;意图关键词门控模块将Intent_value发送给意图标识解码器;意图标识解码器根据Intent_value输出意图标识。
结合第一方面,在一种可能实现的方式中,意图关键词门控模块根据R得到Intent_value,包括:意图关键词门控模块根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;意图关键词门控模块根据公式Intent_ value=(1-Ai)*h' +Ai*R得到所述Intent_value
结合第一方面,在一种可能实现的方式中,意图标识解码器根据Intent_value输出意图标识,包括:意图标识解码器根据公式Z=Argmax(Softmax(K1 Intent_value+B1))输出所述意图标识;其中,所述Z为所述意图标识,所述K1和所述B1为超参数。
结合第一方面,在一种可能实现的方式中,该电子设备还包括槽位关键词融合模块、槽位关键词门控模块、槽位标识解码器,上下文编码模块将所述N个Embedding向量和关键词的Embedding向量进行融合编码,得到H之后,还包括:槽位关键词融合模块根据公式P=Softmax((HHT*Keyword_mask)+SPW) H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;槽位关键词融合模块将P发送给槽位关键词门控模块;槽位关键词门控模块根据P得到第二槽位融合向量Slot_valueSlot_value用于表征这N个字符的槽位信息,第二权重向量包括N个第二权重值,N个第二权重值与这N个字符一一对应,对应字符的第二权重值用于表征该文本信息中,对应字符为槽位字符的可靠程度;槽位关键词门控模块将Slot_value发送给槽位标识解码器;槽位标识解码器根据Slot_value输出这N个字符的槽位标识。
结合第一方面,在一种可能实现的方式中,槽位关键词门控模块根据P得到第二槽位融合向量Slot_value,具体包括:槽位关键词门控模块根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;槽位关键词门控模块根据公式Slot_value=(1-As)*H+As*P得到所述Slot_value
结合第一方面,在一种可能实现的方式中,槽位标识解码器根据Slot_value输出N个字符的槽位标识,具体包括:槽位标识解码器根据公式Y=Argmax(Softmax(Slot_valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
第二方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器、显示屏和存储器;该存储器与该一个或多个处理器耦合,该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据电子设备接收的文本信息中,根据N个字符得到第一向量矩阵H,在H中包括N个隐藏向量h,N个h与N个字符一一对应;根据所述N个h得到第一文本向量h',所述h'包括所述N个字符的向量信息;基于所述h'和第一权重向量得到第二意图融合向量Intent_value;所述Intent_value中的关键词信息数量大于所述h'中的关键词信息数量,所述第一权重向量包括N个第一权重值,所述N个第一权重值与所述N个字符一一对应,对应字符的第一权重值用于表征所述文本信息中,每个字符的向量信息占整个文本信息的向量信息的比重;根据所述h'和所述Intent_value输出所述文本信息的意图标识,所述意图标识用于表征所述文本信息的意图。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:将这N个字符进行预处理,得到N个Embedding向量;这N个Embedding向量与N个字符一一对应;将该N个Embedding向量和关键词的Embedding向量进行融合编码,得到H。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:计算所述第一权重向量;其中,所述计算所述第一权重向量,具体包括:根据公式Wip=(N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;通过公式KPWi=Wik*Wip计算所述文本信息中,每个字符的第一权重值,所述Wik为所述N个字符中,第i个字符的关键词频率,所述KPWi为所述N个字符中,第i个字符的第一权重值,所述KPWi为所述第一权重向量中的元素。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式R=Softmax((h'HT*Keyword_mask)+KPW)H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;所述KPW为所述第一权重向量;根据所述R得到所述Intent_ value。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;根据公式Intent_value=(1-Ai)*h'+Ai*R得到所述Intent_ value。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式Z=Argmax(Softmax(K1 Intent_value+B1))输出所述意图标识;其中,所述Z为所述意图标识,所述K1和所述B1为超参数。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:基于H和第二权重向量得到第二槽位融合向量Slot_value;所述Slot_value用于表征N个字符的槽位信息,第二权重向量包括N个第二权重值,N个第二权重值与N个字符一一对应,对应字符的第二权重值用于表征该文本信息中,对应字符为槽位字符的可靠程度;根据H和所述Slot_value输出这N个字符的槽位标识。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式Wip=(N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;通过公式SPWi=Wis*Wip计算所述文本信息中,每个字符的第二权重值,所述Wis为所述N个字符中,第i个字符的槽位频率,所述SPWi为所述N个字符中,第i个字符的第二权重值,所述SPWi为所述第二权重向量中的元素。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式P=Softmax((HHT*Keyword_mask)+SPW)H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;根据所述P得到所述Slot_value
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;根据公式Slot_value=(1-As)*H+As*P得到所述Slot_value
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:根据公式Y=Argmax(Softmax(Slot_valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过词嵌入表示模块将这N个字符进行预处理,得到N个Embedding向量;通过词嵌入表示模块将这N个Embedding向量发送给上下文编码模块;通过上下文编码模块将这N个Embedding向量和关键词的Embedding向量进行融合编码,得到H。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过意图关键词融合模块根据公式R=Softmax((h'HT*Keyword_mas k)+KPW)H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;通过意图关键词融合模块将R发送给意图关键词门控模块;通过意图关键词门控模块根据R得到Intent_value;通过意图关键词门控模块将Intent_value发送给意图标识解码器;通过意图标识解码器根据Intent_value输出意图标识。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过意图关键词门控模块根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;通过意图关键词门控模块根据公式Intent_value=(1-Ai)*h' +Ai*R得到所述Intent_value
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过槽位关键词融合模块根据公式P=Softmax((HHT*Keyword_mask)+SPW)H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;通过槽位关键词融合模块将P发送给槽位关键词门控模块;通过槽位关键词门控模块根据P得到第二槽位融合向量Slot_valueSlot_value用于表征这N个字符的槽位信息,第二权重向量包括N个第二权重值,N个第二权重值与这N个字符一一对应,对应字符的第二权重值用于表征该文本信息中,对应字符为槽位字符的可靠程度;通过槽位关键词门控模块将Slot_value发送给槽位标识解码器;通过槽位标识解码器根据Slot_value输出这N个字符的槽位标识。
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过槽位门控模块根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;槽位关键词门控模块根据公式Slot_ value=(1-As)*H+As*P得到所述Slot_value
结合第二方面,在一种可能实现的方式中,该一个或多个处理器调用该计算机指令以使得该电子设备执行:通过槽位标识解码器根据公式Y=Argmax(Softmax(Slot_ valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
第三方面,本申请实施例提供了一种电子设备,包括:触控屏、摄像头、一个或多个处理器和一个或多个存储器;所述一个或多个处理器与所述触控屏、所述摄像头、所述一个或多个存储器耦合,所述一个或多个存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当所述一个或多个处理器执行所述计算机指令时,使得所述电子设备执行如第一方面或第一方面的任意一种可能实现的方式所述的方法。
第四方面,本申请实施例提供了一种芯片系统,该芯片系统应用于电子设备,该芯片系统包括一个或多个处理器,该处理器用于调用计算机指令以使得该电子设备执行如第一方面或第一方面的任意一种可能实现的方式所述的方法。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在电子设备上运行时,使得该电子设备执行如第一方面或第一方面的任意一种可能实现的方式所述的方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,包括指令,当该指令在电子设备上运行时,使得该电子设备执行如第一方面或第一方面的任意一种可能实现的方式所述的方法。
附图说明
图1A-图1B是本申请实施例提供的一组示例性用户界面;
图2A是本申请实施例提供的事项卡片模板的示例图;
图2B是本申请实施例提供的事项卡片示例图;
图3是本申请实施例提供的一种短信解析模型的结构示例图;
图4A是本申请实施例提供的另一种事项卡片模板的示例图;
图4B是本申请实施例提供的另一种事项卡片的示例图;
图5是本申请实施例提供的一种短信解析方法的流程图;
图6是本申请实施例提供的一种短信解析模型的结构示例图;
图7是本申请实施例提供的一种短信样本示例图;
图8是本申请实施例提供的电子设备100的硬件结构示意图;
图9是本申请实施例的电子设备100的软件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或者特性可以包含在本实施例申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是相同的实施例,也不是与其它实施例互斥的独立的或是备选的实施例。本领域技术人员可以显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中术语“第一”、“第二”、“第三”等是区别于不同的对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元,或者可选地,还包括没有列出的步骤或单元,或者可选地还包括这些过程、方法、产品或设备固有的其它步骤或单元。
附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前,应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在本说明书中使用的术语“部件”、“模块”、“系统”、“单元”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件或执行中的软件。例如,单元可以是但不限于在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或分布在两个或多个计算机之间。此外,这些单元可从在上面存储有各种数据结构的各种计算机可读介质执行。单元可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一单元交互的第二单元数据。例如,通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。
下面,结合附图,对本申请实施例提出的一种信息解析方法的应用场景以及要解决的技术问题进行介绍。
如图1A所示,为电子设备的短信界面10,在短信界面10中包括短信文本框101,在短息文本框中包括电子设备100接收的短信的文本。如图1A所示,在短信文本框101中的短信文本为:“[同程旅游]尊敬的旅客,您预订的北京首都T3飞16:20-深圳宝安T3降19:50降厦航ZH9108航班,刘先生0000000000000000已出票,乘机当天请带好证件提前1小时至机场办理登机手续,同城旅游,快乐每一程!”在接收到该短信后,电子设备100可以对该条短信进行识别和解析,生成对应的事项卡片,显示在如图1B所示的电子设备100的用户界面11上。
如图1B所示,在电子设备100的主界面上包括多个应用图标,例如,相机图标、电子邮件图标等。在电子设备100的用户界面11上还包括事项卡片111,事项卡片111可以用于提醒用户完成事项。事项卡片111中的内容可以随着时间或电子设备100所在地点的变化而变化。以事项卡片111的内容随着地点的变化为例,进行说明。当电子设备100检测到当前的地理位置为地铁站时,电子设备100可以在事项卡片111中显示乘车码的应用图标。当电子设备100检测到当前的地理位置为购物商场时,电子设备100可以在事项卡片111中显示支付码的应用图标。这样,用户可以直接通过单击事项卡片中乘车码的应用图标或者支付码的应用图标进行显示乘车码或支付码进行支付,不用打开对应的软件进行刷码,从而节约了用户大量的时间,提升了用户体验。在一些实施例中,电子设备100可以根据时间来改变事项卡片中的内容。例如,当用户有出行行程时,电子设备100在可以在出行前的一段时间(例如,12小时)在事项卡片中显示出行信息。如图1B所示,在事项卡片111中显示用户的航班信息,该航班信息包括:出发机场(北京首都T3)、出发时间(16:20)、降落机场(深圳宝安T3)、降落时间(19:50)、航空公司(厦航)、航班号(ZH9108)、出发日期(1月12日、周一)。
对于不同的短信,对应的事项类型不同,事项类型可以理解为短信的意图。电子设备可以根据短信的文本内容确定短信的意图。示例性的,短信的事项类型可以机票预订成功、航班退票成功、航班改签成功、体检预约成功等。电子设备可以预先从各类的大量样本短信中,挖掘关键词,生成意图类别-关键词映射表。电子设备通过意图识别算法来识别短信的意图类别,从而根据该意图类别确定事项卡片模板。例如,对于机票预订成功类别的短信,在该短信文本中应该有购票成功、订票成功、已出票、航空公司名称(例如,厦门航空、厦航、东方航空、东航等等)……中的一个或多个关键词。又例如,对于体检预约成功的短信,在短信文本中应该有体检、时间、日期、体检须知、注意事项……中的一个或多个关键词。对于每一种意图类别,电子设备可以以唯一的意图标识进行区分。示例性的,对于“机票预订成功”的意图类别,可以用标识号0001与之对应,对于“航班退票成功”的意图类别,可以用标识号0002与之对应,对于“航班改签成功”的意图类别,可以用标识号0003与之对应,对于“体检预约成功的”意图类别,可以用标识号0004与之对应……。此外,电子设备还可以将意图标识与事项卡片模板进行对应。这样,就形成了“短信-意图标识-事项卡片模板”三者的映射关系,电子设备在识别出短信的意图类别后,可以基于上述映射关系确定对应的事项卡片模板。并根据确定的事项卡片模板生成短信对应的事项卡片。示例性的,在上述图1B中所示的事项卡片111为事项卡片模板在填充槽位信息后生成的事项卡片。
如图2A所示为本申请实施例提供的一种事项类型为“机票预订成功”的事项卡片示例图。如图2A所示,在事项卡片中包括多个槽位,分别为槽位1111、槽位1112、槽位1113、槽位1114、槽位1115以及槽位1116。这里的槽位可以理解为待填充的字符位置。在事项卡片中,每个槽位都可以对应槽位标识,该槽位标识用于指示槽位的类别。槽位类别可以为出发时间、起飞机场、降落机场、降落时间、航空公司、航班号等。例如,出发时间对应的槽位标识为001、起飞机场对应的槽位标识为002、降落机场对应的槽位标识为003、降落时间对应的槽位标识为004、航空公司对应的槽位标识为005、航班号对应的槽位标识为006。电子设备在短信中提取与槽位类别对应的槽位字符后,可以将提取的槽位字符填充到事项卡片中的对应槽位中。
示例性的,在上述图2A中,槽位1111对应的槽位标识为001,槽位1112对应的槽位标识为002,槽位1113对应的槽位标识为003,槽位1114对应的槽位标识为004,槽位1115对应的槽位标识为005,槽位1116对应的槽位标识为006。在上述图1A-图1B的实施例中,在电子设备识别到短信中,“北京首都T3”的槽位标识为001,“16:20”的槽位标识为002,“深圳宝安T3”的槽位标识为003,“19:50”的槽位标识为004,“厦航”的槽位标识为005,“ZH9108”的槽位标识为006。因此,“北京首都T3”为“起飞机场”的槽位字符,“16:20”为“出发时间”的槽位字符,“深圳宝安T3”为“降落机场”的槽位字符,“19:50”为“降落时间”的槽位字符,“厦航”为“航空公司”的槽位字符,“ZH9108”为“航班号”的槽位字符。电子设备可以将“北京首都T3”填充到槽位1111中,将“16:20”填充到槽位1112中,将“深圳宝安T3”填充到槽位1113中,将“17:50”填充到槽位1114中,将“厦航”填充到槽位1115中,将“ZH9108”填充到槽位1116中。从而生成如图2B所示的,意图类别为“机票预订成功”的事项卡片。
应当理解的是,事项卡片模板中的槽位是预设的,不同事项卡片具有的槽位其数量和槽位类别可能也有所不同,本申请实施例仅做示例性地说明,上述图2A-图2B中的示例图不应对本申请实施例的保护范围有所限制。通过上述对事项卡片的叙述可知,电子设备要生成短信的事项卡片一般要经过两个步骤:第一是要确定短信的意图类别,以便匹配该短信对应的事项卡片模板;第二是要在短信中提取与选取的事项卡片模板中槽位标识对应的槽位字符,将提取出的槽位字符填充到选择的事项卡片中的对应槽位中去,从而生成该短信的事项卡片。
示例性的,在上述图1A-图1B的实施例中,电子设备通过对短信文本的分析,判断出短信的意图类别为“机票预订成功”(对应的意图类别标识号为0001)。然后,根据这个标识号在电子设备预存的事项卡片的模板库中找到标识号为0001的事项卡片模板。再根据这个事项卡片模板中槽位的槽位标识确定待提取的槽位信息。最后,电子设备在短信文本中提取槽位字符,并将其填充在事项卡片对应的槽位中,从而生成短信的事项卡片。因此,电子设备对短信意图类别判断的准确性以及对短信文本中字符对应的槽位标识识别的准确性,将决定生成的事项卡片与短信的适配程度。如何提高电子设备识别短信的意图类别的准确性以及对短信文本中字符对应的槽位标识识别的准确性,也是技术人员日益关注的问题。
下面,结合图3,对电子设备生成短信的事项卡片的流程进行简单介绍。如图3所示,电子设备包括意图识别模型和槽位识别模型。意图识别模型用与识别短信文本的意图类别,并向槽位识别模型输出短信的意图标识,槽位识别模型基于意图识别模型输出的意图标识选择事项卡片模板,并根据事项卡片模板中槽位的槽位标识从短信文本中提取对应的槽位字符。最后,电子设备将提取的槽位字符填充在模板对应的槽位中,从而生成短信的事项卡片。由此可见,在图3中,意图识别模型和槽位识别模型是采用级联的方式工作的。
为了便于理解,下面,结合具体事例,对意图识别模型和槽位识别模型的工作过程进行示例性介绍。如图3所示,电子设备收到的短信的内容为“【同程旅游】尊敬的旅客,您预订的北京首都T3飞16:20-深圳宝安T3降19:50厦航航班ZH9108航班,刘先生0000000000000000已出票,乘机当天请带好证件提前1小时至机场办理登机手续,同程旅游,快乐每一程!”。在该短信中包括113个字符,电子设备可以将这113个字符作为意图识别模块和槽位识别模块的输入,意图识别模块对这113个字符进行解析后,输出该短信的意图标识。如图3所示,意图识别模块在对短信的113个字符进行处理后,识别到该短信的意图类别为“机票预订成功”。然后,意图识别模块可以将意图标识(假设,“机票预订成功”的意图类别标识为0001)输出给槽位识别模块。槽位识别模块在接收到意图标识后,根据意图标识在事项卡片模板库中寻找意图标识为0001的事项卡片模板(假设,意图标识为0001的事项卡片模板为上述图2A所示的事项卡片模板)。然后,读取选取的事项卡片模板中槽位对应的槽位标识,包括:出发机场(对应槽位1111,对应的槽位标识为001)、出发时间(对应槽位1112,对应的槽位标识为002)、降落机场(对应槽位1113,对应的槽位标识为003)、降落时间(对应槽位1114,对应的槽位标识为004)、航空公司(对应槽位1115,对应的槽位标识为005)以及航班号(对应槽位1116,对应的槽位标识为006)。此外,槽位识别模型也会识别短信文本中的每个字符对应的槽位标识,并输出每个字符的槽位标识。例如,在上述短信文本的113个字符中,对于字符串“北京首都T3”,槽位识别模块给这字符串中的6个字符输出的槽位标识都为001;对于字符串“16:20”,槽位识别模块给这字符串中的5个字符输出的槽位标识为002;对于字符串“深圳宝安T3”,槽位识别模块给这字符串中的6个字符输出的槽位标识都为003;对于字符“19:50”,槽位识别模块给这字符串中的5个字符输出的槽位标识都为004;对于字符串“厦航”,槽位识别模块给这字符串中的2个字符输出的槽位标识都为005;对于字符串“ZH9108”,槽位识别模块给字符串中的6个字符输出的槽位标识都为006。对于短信中的其它字符串,槽位识别模块给字符串中的每个字符输出的槽位标识均为000。然后,将字符的槽位标识与事项卡片模板中槽位对应的槽位标识进行匹配,将匹配成功的字符填充进事项卡片模板对应的槽位中,从而生成事项卡片。例如,在上述图2A中,槽位1111的槽位标识为001,字符串“北京首都T3”中每个字符的槽位标识为001,因此,字符串“北京首都T3”与槽位1111匹配成功。槽位1112的槽位标识为002,字符串“16:20”中每个字符的槽位标识为002,因此,字符串“16:20”与槽位1112匹配成功。槽位1113的槽位标识为003,字符串“深圳宝安T3”中每个字符的槽位标识为003,因此,字符串“深圳宝安T3”与槽位1113匹配成功。槽位1114的槽位标识为004,字符串“19:50”中每个字符的槽位标识为004,因此,字符串“19:50”与槽位1114匹配成功。槽位1115的槽位标识为005,字符串“厦航”中每个字符的槽位标识为005,因此,字符串“厦航”与槽位1115匹配成功。槽位1116的槽位标识为006,字符串“ZH9108”中每个字符的槽位标识为006。因此,字符串“ZH9108”与槽位1116匹配成功。然后,电子设备可以将字符串“北京首都T3”填充进槽位1111中,将字符串“16:20”填充进槽位1112中,将字符串“深圳宝安T3”填充进槽位1113中,将字符串“19:50”填充进槽位1114中,将字符串“厦航”填充进槽位1115中,将字符串“ZH9108”填充进槽位1111中,从而生成上述图1B实施例中所示的事项卡片111。
根据上述图3实施例可知,电子设备生成短信的事项卡片首先要将短信文本中的字符通过意图识别模块进行识别,输出短信对应的意图类别标识后,槽位识别模块才会进行槽位标识的提取输出。因此,如果意图识别模块输出的意图标识的准确性不高和/或槽位识别模型输出的槽位标识的准确性不高时,可能导致生成的任务卡片与短信的适配度不高。
例如,在上述图3实施例中,如果意图识别模块输出的意图标识为0002(假设0002对应的意图类别为“航班改签成功”)。那么,槽位识别模块可能会根据0002寻找如图4A所示的“航班改签成功”的事项卡片模板。在图4A的事项卡片模板中,包括槽位4111(对应的槽位信息为原来机票的起飞机场,槽位4111的槽位标识为001)、槽位4112(对应的槽位信息为原来机票的起飞时间,槽位4112的槽位标识为002)、槽位4113(对应的槽位信息为改签后的机票的起飞机场,槽位4113的槽位标识为007)、槽位4114(对应的槽位信息为改签后的机票的起飞时间,槽位4114的槽位标识为008)、槽位4115(对应的槽位信息为改签后的航空公司,槽位4115的槽位标识为009)、槽位4116(对应的槽位信息为改签后的航班号,槽位4116的槽位标识为010)。此时,为了与上述事项卡片中的槽位相匹配,意图识别模型根据选择的事项卡片中槽位的槽位标识,输出短信每个字符的槽位标识也能也会有所不同。例如,在上述短信文本的113个字符中,对于字符串“北京首都T3”,槽位识别模块给这字符串中的6个字符输出的槽位标识都为001;对于字符串“16:20”,槽位识别模块给这字符串中的5个字符输出的槽位标识为002;对于字符串“深圳宝安T3”,槽位识别模块给这字符串中的6个字符输出的槽位标识都为007;对于字符“19:50”,槽位识别模块给这字符串中的5个字符输出的槽位标识都为008;对于字符串“厦航”,槽位识别模块给这字符串中的2个字符输出的槽位标识都为009;对于字符串“ZH9108”,槽位识别模块给字符串中的6个字符输出的槽位标识都为010。这样,电子设备生成的机票改签成功的事项卡片如图4B所示。这就造成,生成的事项卡片与短信文本的意图不匹配,即:在上述短信中,短信文本的意图是要提醒用户机票预订成功,且提醒用户出发地、出发时间、目的地、到达时间等信息。而生成的事项卡片的意图为提醒用户机票改签成功,提醒用户改签后的机票的起飞机场以及起飞时间。当该事项卡片显示在电子设备的主界面上、用户浏览到该事项卡片时,给用户带来了错误的信息,造成了用户的信息干扰,甚至可能影响用户的出行的等事项,给用户带来极低的使用体验。
因此,为了提高电子设备识别短信意图类别以及短信中每个字符的槽位标识的准确性,从而生成与短信匹配度高的事项卡片,本申请实施例提出了一种信息解析方法。该方法通过对短信解析模型进行改进,并行识别短信文本的意图标识以及短信文本中每个字符的槽位标识,在对短信文本进行处理识别的过程中,增加融合短信中关键词信息和字符位置信息的融合机制来增强短信解析模型对短信中关键词的关注能力,从而提高短信解析模型区分短信中易混淆文本的能力。此外,根据短信文本中“关键词位置越靠前,重要性程度越高”的特点,在短信解析模型中加入短信文本中字符的位置信息,提高短信解析模型识别有效关键词信息的能力。同时,在短信解析模型中建立了信息感知门控机制来平衡关键词信息的融入,从而避免无效关键词带来的干扰影响。通过上述方式,提升了短信解析模型识别短信意图类别以及短信中每个字符的槽位标识的准确性。
下面,结合图5和图6对本申请实施例提供的一种短信解析方法的流程进行介绍。图5是本申请实施例提供的一种短信解析方法的流程图,图6是本申请实施例提供的一种短信解析模型的结构示例图。在电子设备中包括短信解析模型,如图6所示,该短信解析模型包括词嵌入表示模块、上下文编码模块、意图关键词融合模块、槽位关键词融合模块、槽位关键词门控模块、意图关键词门控模块、意图标识解码器、槽位标识解码器。为了便于理解和方便叙述,本申请实施例以输入该短信解析模型中的短信文本为“[同程旅游]尊敬的旅客,您预订的北京首都T3飞16:20-深圳宝安T3降19:50降厦航ZH9108航班,刘先生0000000000000000已出票,乘机当天请带好证件提前1小时至机场办理登机手续,同城旅游,快乐每一程!”为例,进行说明。应当理解的是,图5和图6中的实施例仅是示例性地说明,不应对本申请实施例的保护范围构成限制。短信解析模型处理电子设备输入的短信文本的具体流程如下:
S501:词嵌入表示模块接收输入的文本信息,在所述文本信息中包括N个字符。
具体地,电子设备在接收到短信后,会读取短信文本,并将短信文本中每个字符作为词嵌入表示模块的输入,以便预处理模型对输入的字符进行预处理。其中,文字信息的字符可以为文字字符,也可以为字母字符,还可以为符号字符,本申请实施例对字符的类型不做限制。例如,在本申请实施例中,词嵌入表示模块接收的文本信息中,“北京首都、深圳宝安”等字符为文字字符,“T、Z、H”等字符为字母字符,“3、1、6”等字符为数字字符,“[、]、!”等字符为符号字符。在本申请实施例中,输入的字符的数量为113个。
示例性的,词嵌入标识模块可以为ALBERT。
S502:词嵌入表示模块对所述N个字符进行预处理,得到N个词嵌入向量。
可选地,在一些实施例中,词嵌入表示模块在对输入的字符进行预处理之前,可以先判断输入的字符数量是否满足超过预设的字符数量上限值N1。若输入的字符数量超过N1,词嵌入表示模块可以对输入文本中,前N1个字符进行预处理。若输入的字符数量未超过N1,词嵌入表示模块可以对输入文本中的全部字符进行预处理。示例性的,假设预设的字符数量上限值为500,若输入文本中字符的数量为600,词嵌入表示模块可以对该输入文本中前500个字符进行预处理,剩下100个字符进行丢弃。若输入的文本中的字符的数量为113,词嵌入表示模块可以将这113个字符全部进行预处理。
具体地,由于输入到词嵌入表示模块中的文本信息不是短信解析模型能够处理的向量信息。因此,词嵌入表示模块需要对输入的字符进行预处理,使之转换为短信解析模型能够处理的词嵌入向量,即Embedding向量(为了便于叙述,下文用Embedding向量来表示词嵌入向量)。其中,Embedding向量是一个大小为1×M的一维向量,不同字符的Embedding向量不同。其中,M为每个Embedding向量的长度,M可以为128,也就可以为512,还可以为其他数值。对于不同的词嵌入表示模块,其采用的数据与处理的方法不同,使得Embedding向量的长度也可能不同,本申请实施例以Embedding向量的长度为128为例进行说明。词嵌入表示模块在对输入文本中每个字符进行预处理后,会输出每个字符对应的Embedding向量,即:Embedding向量的数量是与经过预处理的字符数量是一致的。
示例性的,如图6所示,由于短信中的字符数量为113,因此词嵌入表示模块输出的Embedding向量的数量也有113个,分别为e1~e113。在一些实施例中,词嵌入表示模块在对文本中的N个字符进行预处理后,可以输出大小为N×M的Embeding向量矩阵。
S503:词嵌入表示模块将所述N个词嵌入向量发送给上下文编码模块。
具体地,词嵌入表示模块在输出Embedding向量后,可以将这N个Embedding向量发送给上下文编码模块进行融合编码处理。示例性的,上下文编码模块可以为双向长短期记忆网络(Bi-directional Long Short-Term Memory,BILSTM)。
S504:上下文编码模块对所述N个词嵌入向量进行融合编码,得到第一向量矩阵。
具体地,上下文编码模块用于对词嵌入表示模块输出的Embedding向量进行融合编码,输出大小为N×M1的第一向量矩阵H。在H中,包括N个大小为1×M1的隐藏向量hidden(简称h向量),分别为h1~hN,每个h向量与一个Embedding向量相对应。其中,M1为一维向量h的长度,M1可以为128,也就可以为512,还可以为其他数值。对于不同的上下文编码模块,其采用融合编码方法不同,生成的h向量的长度也可能不同,本申请实施例以h向量的长度为128为例进行说明。
在一种可能实现的方式中,短信解析模型还可以将关键词的词嵌入向量e0作为上下文编码模块的输入,上下文编码模块将接收到的N个Embedding向量与e0进行融合编码,从而输出第一向量矩阵H。其中,关键词是电子设备预先设定的,电子设备可以预先在有限的数据集中(例如,各种意图类别短信样本)中根据关键词挖掘方法(例如,TF-IDF)挖掘出所有的关键词。然后,通过“关键词频数/所有关键词总数”来计算挖掘出的每个关键词的频率。然后,使用关键词训练算法(例如,glove算法)训练词向量,得到所有挖掘出的关键词的向量表示。最后,将所有关键词的向量表示进行加权求和,从而得到向量e0。
此外,在挖掘出所有关键词后,电子设备还可以生成对应的关键词词表。如表1所述为本申请实施例提供的一种示例性的关键词词表,表1如下所示:
表1
意图标识 关键词组
001(机票预订成功) 购票成功、订票成功、已出票……
002(机票退票成功) 退票成功、航班已取消、退款成功……
003(机票改签成功) 改签成功、航班变更、延误、改期……
…… ……
在关键词词表中包括意图标识以及关键词组,每个意图标识都对应一个关键词组。例如,在上述表1中,对于“机票预订成功”的意图,对应的关键词组包括:购票成功、订票成功、已出票等词语。对于“机票退票成功”的意图,对应的关键词组包括:退票成功、航班已取消、退款成功等词语。对于“机票改签成功”的意图,对应的关键词组包括:改签成功、航班变更、延误、改期等词语。
这样,通过输入关键词的词嵌入向量e0,使得上下文编码模块能够根据e0中的关键词信息识别文本中关键词的向量信息,从而提高识别短信文本中关键词的准确性,进而有利于短信解析模型基于准确性高的关键词,通过意图识别算法输出准确率高的意图标识。
S505:上下文编码模块将所述第一向量矩阵发送给意图关键词融合模块。
具体地,上下文编码模块在计算出第一向量矩阵后,将第一向量矩阵H发送给意图关键词融合模块。
S506:意图关键词融合模块根据第一权重向量和所述第一向量矩阵计算得到第一意图融合向量。
具体的,第一权重向量KWP是一个大小为1×N的一维向量。在KWP中包括N个KPW值,每个KPW值为输入文本中每个字符的位置权重。为了便于叙述,本申请实施例以输入文本中第i个字符的位置权重是KPWi为例,进行说明。KPWi可以基于输入文本中每个字符的关键词频率Wik和线性权重Wip得到的,KPWi可以通过公式(1)得到,公式(1)如下所示:
KPWi=Wik*Wip(1)
示例性的,在上述图6中,第一权重向量为:KPW=[KPW1 KPW2 KPW3……KPWN]。
其中,电子设备可以预先通过大量的短信样本(加入有N1条短信)计算短信中每个位置上的关键词频率Wik。电子设备可以给每条短信样本中的每个字符的位置进行统一编号,统计计算在这N1条短信中,编号为i的位置出现关键词的字符的次数N2。然后根据公式Wik=N2/N1计算出编号为i的位置的关键词频率Wik。示例性的,如图7所示,假设有8条样本短信,分别为短信1~短信8,其中:
短信1:东方航空已出票,请在重庆江北机场登机。
短信2:尊敬的乘客,您预订的厦航XH106已取消
短信3:尊敬的乘客,您预订的南航NH206已改签
短信4:北京首都T315:54起飞,请提前登机。
短信5:刘先生,您预订的南航MH206订票成功。
短信6:您预订的X康国宾的体检时间为9月20号。
短信7:体检需知:体检前一日不能喝水、进食。
短信8:G8058次列车已出票,座位为8车14号。
每条短信的每个字符都有位置编号,分别为1~20。假设,在上述8条短信中,关键词包括“东方航空”、“已出票”、“江北国际机场”、“厦航”、“XH106”、“已取消”、“南航”、“NH206”、“已改签”、“北京首都T5”、“14:50”、“MH206”、“订票成功”、“体检时间”、“体检需知”、“G8058”、“8车14号”。
对于短信1而言,位置编号为1、2、3、4、5、6、7、13、14、15、16对应位置的字符为关键词的字符。对于短信2而言,位置编号为11、12、13、14、15、16、17、18、19、20对应位置的字符为关键词的字符。对于短信3而言,位置编号为11、12、13、14、15、16、17、18、19、20对应位置的字符为关键词的字符。对于短信4而言,位置编号为1、2、3、4、5、6、7、8、9、10、11对应位置的字符为关键词的字符。对于短信5而言,位置编号为9、10、11、12、13、14、15、16、17、18、19对应位置的字符为关键词的字符。对于短信6而言,位置编号为10、11、12、13对应位置的字符为关键词的字符。对于短信7而言,位置编号为1、2、3、4对应位置的字符为关键词的字符。对于短信8而言,位置编号为1、2、3、4、5、15、16、17、18、19对应位置的字符为关键词的字符。因此,在这8条短信中,位置编号为1~20的位置出现关键词的次数分别为:4、4、4、4、5、2、2、1、2、5、5、4、5、4、6、5、4、4、4、2。根据Wik的计算公式可以得到位置1~位置20的关键词频率W1k~W20k分别为:1/2、1/2、1/2、1/2、5/8、1/4、1/4、1/8、1/4、5/8、5/8、1/2、5/8、1/2、3/4、5/8、1/2、1/2、1/2、1/4。
在一般情况下,在短信文本中,位置越靠前的关键词与短信意图的相关性越大,位置越靠后的关键词与短信意图的相关性就越小。对于与短信意图相关性大的关键词,可以称之为有效关键词,对于与短信意图相关性小的关键词可以称为无效关键词。在短信解析模型使用关键词进行短信意图识别时,有效关键词的信息占比越大,识别出的意图标识的准确性就越高。为了提高短信解析模型输出的意图标识的准确性,可以提高文本中有效关键词信息在整个短信文本信息中的比重。因此,电子设备可以在其接收的短信中,给每个字符赋予一个递减的线性权重Wip。电子设备可以通过公式Wip=(N-i+1)/N计算短信文本中第i个字符的线性权重Wip。其中,i为字符的位置编号。例如,在图6中,有113个字符,那么,这113个字符的字符编号为1~113。在输入文本中,字符1~字符113的线性权重分别为W1p~W113p。根据Wip的计算公式可知,Wip~W113p为:1~1/113。这样,对于短信文本中的字符,尤其是关键词的字符,其位置在短信文本中越靠前,在第一权重向量中对应的位置权重越大。
意图关键词融合模块可以根据公式(2)计算得到第一意图融合向量R,公式(2)如下所示:
R=Softmax((h'HT*Keyword_mask)+KPW) H(2)
其中,R是大小为1xM1的第一意图融合向量,包括短信文本中所有字符的向量信息,Keyword_mask为输入文本的关键词向量。HT为第一向量矩阵的转置矩阵,h'为第一向量矩阵中每个h向量相加之和,Softmax为归一化指数函数。Keyword_mask的大小为1×N,在该关键词向量中,关键词中的字符Token被标记为1,非关键词中的字符Token被标记为0。
在一些实施例中,为了防止Keyword_mask中关键词字符对应的元素过于稀疏,可以采用词语平滑机制,将关键词字符相邻的t个非关键词的字符Token标记为1。
示例性的,在上述图6中,h'是大小为1×128的一维向量,HT是大小为128×113的矩阵。在h'中包括了输入文本中所有字符的向量信息。因此,h'HT是大小为1×113的一维向量。示例性的,h'HT如下所示:
h'HT=[a1a2……a113]
其中,在h'HT中包括了短信文本中全部字符的向量信息,h'HT中的元素与短信文本中的字符一一对应,元素的数值越大,说明该字符的向量信息越多,元素的数值越小,说明该字符的向量信息越小。为了提高短信文本中关键词字符的向量信息的占比,可以引入Keyword_mask筛除掉h'HT中非关键词的字符的向量信息。
Keyword_mask是大小为1×113的一维向量。示例性的,Keyword_mask如下所示:
Keyword_mask=[b1b2……b113]
因此,h'HT*Keyword_mask是一个大小为1×113的一维向量,即:
h'HT*Keyword_mask=[a1b1 a2b2……a113b113]
由于在Keyword_mask中的元素,关键词的字符的元素被标记为1,非关键词的字符的元素被标记为0。因此,在h'HT*Keyword_mask中过滤掉了非关键词的信息,仅保留了关键词的信息。但是,在一些情况下,h'HT中的部分非关键词信息也可能对短信解析模型通过意图识别算法识别短信意图发挥作用,如果将Keyword_mask中定义的非关键词过滤掉,可能也会对短信解析模型识别短信意图的准确性产生影响。因此,意图关键词融合模块可以在h'HT*Keyword_mask中引入第一权重向量KWP,即:(h'HT*Keyword_mask)+KPW。这样,在(h'HT*Keyword_mask)+KPW中包括了一定量的非关键词的向量信息,且提高了短信文本中位置靠前的关键词的字符的向量信息的信息量,即:增加了短信文本中有效关键词的向量信息。
(h'HT*Keyword_mask)+KPW也是一个大小为1×113的一维向量,即:
(h'HT*Keyword_mask)+KPW=[a1b1+KPW1a2b2+KPW2……aNbN+KPWN]
意图关键词融合模块在将(h'HT*Keyword_mask)+KPW通过Softmax函数进行归一化处理后,生成归一化向量L,即:
L=Softmax((h'HT*Keyword_mask)+KPW))= [c1 c2……c113]
其中,c1+c2+……c113=1。其中,在L中,ci为短信文本中,第i个字符的权重值。
由于H是大小为113×128的矩阵,Softmax((h'HT*Keyword_mask)+KPW)是大小为1×113的一维向量。将L与H进行计算,即可将短信文本中每个字符的向量信息按照L中的权重值进行融合,从而得到整个文本的信息向量R,即:第一意图融合向量。其中,第一意图融合向量的大小为1×128。这样,意图关键词融合模块通过上述方式计算到的第一意图融合向量R包括了整个文本字符的向量信息,且相较于h',更加关注短信文本中关键词的信息(尤其是位置靠前的有效关键词的信息)。
S507:意图关键词融合模块向意图关键词门控模块发送所述第一意图融合向量。
具体地,意图关键词融合模块在计算出第一意图融合向量后,意图关键词融合模块向意图关键词门控模块发送所述第一意图融合向量。
S508:意图关键词门控模块根据第一意图融合向量和第一向量矩阵计算得到第二意图融合向量。
具体地,意图关键词门控模块在接收到第一意图融合向量和第一向量矩阵后,意图关键词门控模块可以将第一意图融合向量和第一向量矩阵进行融合,得到第二意图融合向量。
可选地,意图关键词门控模块在对第一意图融合向量和第二意图融合向量进行融合之前,可以获取第一向量矩阵,第一向量矩阵可以是意图关键词融合模块发送给意图关键词门控模块的,也可以由上下文编码模块发送给意图关键词门控模块的,本申请实施例对此不做限制。
可选地,意图关键词门限模块在对第一意图融合向量和第二意图融合向量进行融合之前,就可以计算融合系数,即:第一意图融合向量的第一门控系数Ai,Ai表征了第一意图融合向量的可靠程度。第一意图融合向量的可靠程度越高,Ai越大,第一意图融合向量的可靠程度越低,Ai越小。意图关键词门控模块可以根据公式(3)计算第一门控系数,公式(3)如下所示:
Ai=Sigmoid((h'W1+RW2)V1 T)(3)
其中,W1和W2是意图关键词门控模块生成的、大小为M1×M1的超参数,V1是意图关键词门控模块生成的、大小为1×M1的超参数。Sigmoid为激活函数,用于将(h'W1+RW2)V1 T映射到0~1之间。
示例性的,在上述图6实施例中,h'的大小为1×128,W1和W2的大小均为128×128,R的大小为1×128,V1 T的大小为128×1。因此,h'W1+RW2是大小为1×128的一维向量,(h'W1+RW2)V1 T是大小为1×1的数。所以,Ai为一个数值在0~1范围内的数。
在计算出Ai之后,意图关键词门控模块可以根据公式(4)计算出大小为1×M1的第二意图融合向量Intent_value,公式(4)如下所示:
Intent_value=(1-Ai)*h' +Ai*R(4)
S509:意图关键词门控模块向意图标识解码器发送第二意图融合向量。
具体地,意图关键词门控模块在计算出第二意图融合向量后,可以将第二意图融合向量发送给意图标识解码器。
S510:意图标识解码器对第二意图融合向量进行编码,输出意图标识。
具体地,意图标识解码器在接收到第二意图融合向量后,可以对第二意图融合向量进行编码,然后输出意图标识。
示例性的,意图标识解码器可以通过公式(5)对第二意图融合向量进行编码,从而输出意图标识信息Z,公式(5)如下所示:
Z=Argmax(Softmax(K1 Intent_value+B1))(5)
其中,K1是大小为M1×Q1的参数矩阵,B1是大小为1×Q1的参数向量。K1和B1是意图标识解码器生成的超参数。其中,Q1为全部意图标识种类的数量。
S511:上下文编码模块将所述第一向量矩阵发送给槽位关键词融合模块。
具体地,上下文编码模块在计算出第一向量矩阵后,将第一向量矩阵H发送给槽位关键词融合模块。
S512:槽位关键词融合模块根据第二权重向量和所述第一向量矩阵计算得到第一槽位融合向量。
具体的,第二权重向量SWP是一个大小为1×N的一维向量。在SWP中包括N个SPW值,每个SPW值为输入文本中每个字符的槽位权重。为了便于叙述,本申请实施例以输入文本中第i个字符的槽位权重是SPWi为例,进行说明。SPWi可以基于输入文本中每个字符的槽位频率Wis和线性权重Wip得到的,SPWi可以通过公式(6)得到,公式(6)如下所示:
SPWi=Wis*Wip(6)
示例性的,在上述图6中,第二权重向量为:SPW=[SPW1 SPW2…… SPW113]。
其中,电子设备可以预先通过大量的短信样本(加入有N1条短信)计算短信中每个位置上的槽位频率Wis。电子设备可以给每条短信样本中的每个字符的位置进行统一编号,统计计算在这N1条短信中,编号为i的位置出现槽位字符的次数N3。然后根据公式Wis=N3/N1计算出编号为i的位置的槽位频率Wis。示例性的,如上述图7所示,假设有8条样本短信,分别为短信1~短信8,其中:
短信1:东方航空已出票,请在重庆江北机场登机。
短信2:尊敬的乘客,您预订的厦航XH106已取消
短信5:尊敬的乘客,您预订的南航NH206已改签
短信4:北京首都T515:54起飞,请提前登机。
短信5:刘先生,您预订的南航MH206订票成功。
短信6:您预订的X康国宾的体检时间为9月20号。
短信7:体检需知:体检前一日不能喝水、进食。
短信8:G8058次列车已出票,座位为8车14号。
每条短信的每个字符都有位置编号,分别为1~20。假设,在上述8条短信中,槽位信息包括:航空公司、出发机场、航班号出发时间、体检时间、列车车号、座位号。那么,在上述8条短信中,“东方航空”、“江北国际机场”、“厦航”、“XH106”、“南航”、“NH206”、“北京首都T5”、“15:54”、“MH206”、“9月20号”、“G8058”、“8车14号”为槽位字符。
对于短信1而言,位置编号为1、2、3、4、13、14、15、16对应位置的字符为槽位字符。对于短信2而言,位置编号为9、10、13、14、15、16、17对应位置的字符为槽位字符。对于短信3而言,位置编号为9、10、13、14、15、16、17对应位置的字符为槽位字符。对于短信4而言,位置编号为1、2、3、4、5、6、7、8、9、10、11对应位置的字符为槽位字符。对于短信5而言,位置编号为9、10、11、12、13、14、15对应位置的字符为槽位字符。对于短信6而言,位置编号为15、16、17、18、19对应位置的字符为槽位字符。对于短信8而言,位置编号为1、2、3、4、5、15、16、17、18、19对应位置的字符为槽位字符。因此,在这8条短信中,位置编号为1~20的位置出现槽位字符的次数分别为:3、3、3、3、2、1、1、1、4、4、2、1、4、4、6、5、4、2、2、0。根据Wis的计算公式可以得到位置1~位置20的关键词频率W1s~W20s分别为:3/8、3/8、3/8、3/8、1/4、1/8、1/8、1/8、1/2、1/2、1/4、1/8、1/2、1/2、3/4、5/8、1/2、1/4、1/4、0。
在一般情况下,在短信文本中,位置越靠前且位置的槽位频率越高的字符是槽位字符的可能性就越高,位置越靠后且位置的槽位频率越低的字符是槽位字符的可能性就越低。在短信文本中,成为槽位字符可能性高的字符为有效字符,成为槽位字符可能性低的字符为无效字符。在短信解析模型使用关键词以及H对短信中每个字符的槽位标识进行识别时,有效字符的信息占比越大,识别出的槽位标识的准确性就越高。为了提高短信解析模型输出的槽位标识的准确性,可以提高短信文本中有效字符在整个短信文本信息中的比重。因此,电子设备可以在其接收的短信中,给每个字符赋予一个递减的线性权重Wip。电子设备可以通过公式Wip=(N-i+1)/N计算短信文本中第i个字符的线性权重Wip。其中,i为字符的位置编号。例如,在图6中,有113个字符,那么,这113个字符的字符编号为1~113。在输入文本中,字符1~字符113的线性权重分别为W1p~W113p。根据Wip的计算公式可知,W1p~W113p为:1~1/113。这样,对于短信文本中的字符,尤其是有效字符,其位置在短信文本中越靠前,在第一权重向量中对应的位置权重越大。
槽位关键词融合模块可以根据公式(7)计算得到第一槽位融合向量P,公式(7)如下所示:
P=Softmax((HHT *Keyword_mask)+SPW) H(7)
其中,P是大小为N×M1的第一槽位融合向量,包括短信文本中所有字符的向量信息,Keyword_mask为输入文本的关键词向量。HT为第一向量矩阵的转置矩阵,Softmax为归一化指数函数。Keyword_mask的大小为1×N,在该关键词向量中,关键词中的字符Token被标记为1,非关键词中的字符Token被标记为0。
在一些实施例中,为了防止Keyword_mask中关键词字符对应的元素过于稀疏,可以采用词语平滑机制,将关键词字符相邻的t个非关键词的字符Token标记为1。
示例性的,在上述图6实施例中,H是大小为113×128的向量矩阵,HT是大小为128×113的矩阵。因此,HHT是大小为113×113的向量矩阵。
为了提高短信文本中有效字符的向量信息的占比,可以引入Keyword_mask筛除掉HHT中非有效字符的向量信息。
Keyword_mask是大小为1×113的一维向量。示例性的,Keyword_mask如下所示:
Keyword_mask=[b1b2……b113]
但是,由于HHT是大小为113×113的向量矩阵,因此,Keyword_mask在与HHT计算时,槽位关键词融合模块会将Keyword_mask进行复制,使得Keyword_mask成为大小为113×113的矩阵。因此,在HHT*Keyword_mask中的Keyword_mask,实际上是一个大小为113×113的矩阵,HHT*Keyword_mask是一个大小为113×113的矩阵。同理,由于SPW的大小为1×113。因此,SPW在与HHT*Keyword_mask计算时,槽位关键词融合模块会将SPW进行复制,使得SPW成为大小为113×113的矩阵。因此,在(HHT*Keyword_mask)+SPW中的SPW,实际上是一个大小为113×113的矩阵,(HHT*Keyword_mask)+SPW是一个大小为113×113的矩阵。P是一个大小为113×128的向量矩阵。
这样,槽位关键词融合模块通过上述方式计算到的第一槽位融合向量P包括了整个文本字符的向量信息,且相较于H,更加关注短信文本中有效字符(即:该字符的位置靠前且该字符的位置关键词频率高)的信息。
应当理解的是,S512可以在S506之前执行,也可以在S506之后执行,也可以和S506同时执行,本申请实施例对此不做限制。
S513:槽位关键词融合模块向槽位关键词门控模块发送第一槽位融合向量。
具体地,槽位关键词融合模块在计算出第一槽位融合向量后,槽位关键词融合模块向槽位关键词门控模块发送所述第一槽位融合向量。
S514:槽位关键词门控模块根据第一槽位融合向量和第一向量矩阵计算得到第二槽位融合向量。
具体地,槽位关键词门控模块在接收到第一槽位融合向量和第一向量矩阵后,槽位关键词门控模块可以将第一槽位融合向量和第一向量矩阵进行融合,得到第二槽位融合向量。
可选地,槽位关键词门控模块在对第一槽位融合向量和第二意图融合向量进行融合之前,可以获取第一向量矩阵,第一向量矩阵可以是意图关键词融合模块发送给槽位关键词门控模块的,也可以由上下文编码模块发送给槽位关键词门控模块的,本申请实施例对此不做限制。
可选地,槽位关键词门限模块在对第一槽位融合向量和第二槽位融合向量进行融合之前,就可以计算融合系数,即:第一槽位融合向量的第二门控系数As,As表征了第一槽位融合向量的可靠程度。第一槽位融合向量的可靠程度越高,As越大,第一槽位融合向量的可靠程度越低,As越小。槽位关键词门控模块可以根据公式(8)计算第一门控系数,公式(8)如下所示:
As=Sigmoid((HW3+PW4)V2 T)(8)
其中,W3和W4是槽位关键词门控模块生成的、大小为M1×M1的超参数,V2是槽位关键词门控模块生成的、大小为1×M1的超参数。Sigmoid为激活函数。
示例性的,在上述图6实施例中,H的大小为1×128,W3和W4的大小均为128×128,P的大小为113×128,V2 T的大小为128×1。因此,HW3+PW4是大小为113×128的向量矩阵,(HW3+PW4)V2 T是大小为113×1的一维向量。所以,As为一个大小为113×1的一维向量,且向量中的元素为0或1。
在计算出As之后,槽位关键词门控模块可以根据公式(9)计算出大小为N×M1的第二槽位融合向量Slot_value,公式(9)如下所示:
Slot_value=(1-As)*H+As*P(9)
由于H和P都是大小为113×128的向量矩阵,As是一个大小为113×1的一维向量,1-As也是一个大小为113×1的一维向量。因此,(1-As)和H不能直接计算,As和P也不能直接计算。槽位关键词门控模块可以将(1-As)和As分别进行复制,使其成为大小为113×113的向量矩阵。因此,(1-As)*H+As*P中的(1-As)和As最后实际上均是大小为113×113的向量矩阵。所以,Intent_value是一个大小为113×128的向量矩阵。
S515:槽位关键词门限模块向槽位标识解码器发送第二槽位融合向量。
具体地,槽位关键词门控模块在计算出第二槽位融合向量后,可以将第二槽位融合向量发送给槽位标识解码器。
S516:槽位标识解码器对第二槽位融合向量进行编码,输出输入文本中每个字符的槽位信息。
具体地,槽位标识解码器在接收到第二槽位融合向量后,可以对第二槽位融合向量进行编码,然后输出所述文本信息中每个字符的槽位标识。
示例性的,槽位标识解码器可以通过公式(10)对第二槽位融合向量进行编码,从而输出每个字符的槽位标识Y,公式(10)如下所示:
Y=Argmax(Softmax(Slot_valueK2+B2))(10)
其中,K2是大小为M1×Q2的参数矩阵,B2是大小为N×Q2的参数向量。K2和B2是意图标识解码器生成的超参数。Q2是所有槽位标识类型的数量。
示例性的,假设Q2为100,在上述图6实施例中,K2的大小为128×100,Slot_value的大小为113×128,所以Slot_valueK2的大小为113×100。又由于B2的大小为113×100,所以Softmax(Slot_valueK2+B2)的大小为113×100。因此,Softmax(Slot_valueK2+B2)通过Argmax处理后,输出的是大小为1×113的一维向量Y。示例性的,Y可以为:
Y=[Y1 Y2…… Y113]
在Y中的元素与输入文本中的字符一一对应,且每个元素为对应字符的槽位标识。
在一些实施例中,短信解析模型输出意图标识和槽位标识后,电子设备可以根据意识标识确定事项卡片模板,并读取模板中槽位的槽位标识。然后,将输入文本中,槽位标识与模板中槽位的槽位标识一致的字符填充到槽位中,从而生成输入文本对应的事项卡片。
下面对电子设备100的结构进行介绍。请参阅图8,图8是本申请实施例提供的电子设备100的硬件结构示意图。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图8示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图8示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如Wi-Fi网络),蓝牙(BlueTooth,BT),BLE广播,全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP 用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
NPU为神经网络(neural-network ,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号、降噪、还可以识别声音来源,实现定向录音功能等。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。
图9是本申请实施例的电子设备100的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。如图9所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图9所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如, DVD)、或者半导体介质(例如固态硬盘 SolidState Disk)等。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,也可以进行任意组合,得到不同的实施例,以实现不同的技术效果。通过本申请实施例方法中的步骤进行顺序调整、合并和删减,也可以进行任意组合,得到的不同实施例,也应该本申请说明书的保护范围之内。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
总之,以上所述仅为本发明技术方案的实施例,并非用于限定本发明的保护范围。凡根据本发明的揭露,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (19)

1.一种短信解析方法,其特征在于,所述方法包括:
接收文本信息,所述文本信息中包括N个字符;
根据所述N个字符得到第一向量矩阵H,在所述H中包括N个隐藏向量h,所述N个h与所述N个字符一一对应;
根据所述N个h得到第一文本向量h',所述h'包括所述N个字符的向量信息;
基于所述h'和第一权重向量得到第二意图融合向量Intent_value;所述Intent_value中的关键词信息数量大于所述h'中的关键词信息数量,所述第一权重向量包括N个第一权重值,所述N个第一权重值与所述N个字符一一对应,对应字符的第一权重值用于表征所述文本信息中,每个字符的向量信息占整个文本信息的向量信息的比重;
根据所述h'和所述Intent_value输出所述文本信息的意图标识,所述意图标识用于表征所述文本信息的意图;
其中,所述基于所述h'和第一权重向量得到第二意图融合向量Intent_value,具体包括:
根据公式R=Softmax((h'HT*Keyword_mask)+KPW) H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;所述KPW为所述第一权重向量;
根据所述R得到所述Intent_value
2.如权利要求1所述的方法,其特征在于,所述根据所述N个字符得到第一向量矩阵H,具体包括:
将所述N个字符进行预处理,得到N个Embedding向量;所述N个Embedding向量与所述N个字符一一对应;
将所述N个Embedding向量和关键词的Embedding向量进行融合编码,得到所述H。
3.如权利要求1所述的方法,其特征在于,所述基于所述h'和第一权重向量得到第二意图融合向量Intent_value之前,还包括:
计算所述第一权重向量;
其中,所述计算所述第一权重向量,具体包括:
根据公式Wip=(N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;
通过公式KPWi=Wik*Wip计算所述文本信息中,每个字符的第一权重值,所述Wik为所述N个字符中,第i个字符的关键词频率,所述KPWi为所述N个字符中,第i个字符的第一权重值,所述KPWi为所述第一权重向量中的元素。
4.如权利要求1所述的方法,其特征在于,所述根据所述R得到所述Intent_value,具体包括:
根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;
根据公式Intent_value=(1-Ai)*h' +Ai*R得到所述Intent_value
5.如权利要求1所述的方法,其特征在于,所述根据所述h'和所述Intent_value输出所述文本信息的意图标识,包括:
根据公式Z=Argmax(Softmax(K1 Intent_value+B1))输出所述意图标识;
其中,所述Z为所述意图标识,所述K1和所述B1为超参数。
6.如权利要求1所述的方法,其特征在于,所述根据所述N个字符得到第一向量矩阵H之后,还包括:
基于所述H和第二权重向量得到第二槽位融合向量Slot_value,所述Slot_value用于表征所述N个字符的槽位信息,所述第二权重向量包括N个第二权重值,所述N个第二权重值与所述N个字符一一对应,对应字符的第二权重值用于表征所述文本信息中,对应字符为槽位字符的可靠程度;
根据所述H和所述Slot_value输出所述N个字符的槽位标识。
7.如权利要求6所述的方法,其特征在于,所述基于所述H和第二权重向量得到第二槽位融合向量Slot_value之前,还包括:
计算所述第二权重向量;
其中,所述计算所述第二权重向量,具体包括:
根据公式Wip= (N-i+1)/N计算所述文本信息中,每个字符的线性权重Wip,所述i为第i个字符在所述文本信息中的位置编号,所述Wip为所述第i个字符的线性权重;
通过公式SPWi=Wis*Wip计算所述文本信息中,每个字符的第二权重值,所述Wis为所述N个字符中,第i个字符的槽位频率,所述SPWi为所述N个字符中,第i个字符的第二权重值,所述SPWi为所述第二权重向量中的元素。
8.如权利要求6或7所述的方法,其特征在于,所述基于所述H和第二权重向量得到第二槽位融合向量Slot_value,具体包括:
根据公式P=Softmax((HHT*Keyword_mask)+SPW) H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;
根据所述P得到所述Slot_value
9.如权利要求8所述的方法,其特征在于,所述根据所述P得到所述Slot_value,具体包括:
根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;
根据公式Slot_value=(1-As)*H +As*P得到所述Slot_value
10.如权利要求6所述的方法,其特征在于,所述根据所述H和所述Slot_value输出所述N个字符的槽位标识,具体包括:
根据公式Y=Argmax(Softmax(Slot_valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
11.如权利要求1所述的方法,其特征在于,所述方法应用于电子设备,所述电子设备包括词嵌入表示模块、上下文编码模块,所述根据所述N个字符得到第一向量矩阵H,具体包括:
所述词嵌入表示模块将所述N个字符进行预处理,得到N个Embedding向量;
所述词嵌入表示模块将所述N个Embedding向量发送给所述上下文编码模块;
所述上下文编码模块将所述N个Embedding向量和关键词的Embedding向量进行融合编码,得到所述H。
12.如权利要求11所述的方法,其特征在于,所述电子设备还包括意图关键词融合模块、意图关键词门控模块以及意图标识解码器,所述根据所述h'和所述Intent_value输出所述文本信息的意图标识,具体包括:
所述意图关键词融合模块根据公式R=Softmax((h'HT*Keyword_mask)+KPW) H计算得到第一意图融合向量R,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax为归一化函数;所述KPW为所述第一权重向量;
所述意图关键词融合模块将所述R发送给所述意图关键词门控模块;
所述意图关键词门控模块根据所述R得到所述Intent_value
所述意图关键词门控模块将所述Intent_value发送给所述意图标识解码器;
所述意图标识解码器根据所述Intent_value输出所述意图标识。
13.如权利要求12所述的方法,其特征在于,所述意图关键词门控模块根据所述R得到所述Intent_value,包括:
所述意图关键词门控模块根据公式Ai=Sigmoid((h'W1+RW2)V1 T)计算第一门控系数Ai,所述W1、所述W2以及所述V1为超参数;
所述意图关键词门控模块根据公式Intent_value=(1-Ai)*h' +Ai*R得到所述Intent_ value
14.如权利要求12-13任一项所述的方法,其特征在于,所述意图标识解码器根据所述Intent_value输出所述意图标识,包括:
所述意图标识解码器根据公式Z=Argmax(Softmax(K1 Intent_value+B1))输出所述意图标识;
其中,所述Z为所述意图标识,所述K1和所述B1为超参数。
15.如权利要求11-12任一项所述的方法,其特征在于,所述电子设备还包括槽位关键词融合模块、槽位关键词门控模块、槽位标识解码器,所述上下文编码模块将所述N个Embedding向量和关键词的Embedding向量进行融合编码,得到所述H之后,还包括:
所述槽位关键词融合模块根据公式P=Softmax((HHT*Keyword_mask)+SPW) H计算得到第一槽位融合向量P,所述HT为所述H的转置矩阵,所述Keyword_mask为所述文本信息的关键词向量,在所述Keyword_mask中包括N个元素,所述N个元素分别与所述N个字符一一对应,在所述Keyword_mask中,非关键词的字符对应的元素为0,关键词的字符对应的元素为1,所述Softmax归一化函数,所述SPW为第二权重向量;
所述槽位关键词融合模块将所述P发送给所述槽位关键词门控模块;
所述槽位关键词门控模块根据所述P得到第二槽位融合向量Slot_value,所述Slot_ value用于表征所述N个字符的槽位信息,所述第二权重向量包括N个第二权重值,所述N个第二权重值与所述N个字符一一对应,对应字符的第二权重值用于表征所述文本信息中,对应字符为槽位字符的可靠程度;
所述槽位关键词门控模块将所述Slot_value发送给所述槽位标识解码器;
所述槽位标识解码器根据所述Slot_value输出所述N个字符的槽位标识。
16.如权利要求15所述的方法,其特征在于,所述槽位关键词门控模块根据所述P得到第二槽位融合向量Slot_value,具体包括:
所述槽位关键词门控模块根据公式As=Sigmoid((HW3+PW4)V2 T)计算第二门控系数As,所述W3、所述W4以及所述V2为超参数;
所述槽位关键词门控模块根据公式Slot_value=(1-As)*H +As*P得到所述Slot_value
17.如权利要求15所述的方法,其特征在于,所述槽位标识解码器根据所述Slot_value输出所述N个字符的槽位标识,具体包括:
所述槽位标识解码器根据公式Y=Argmax(Softmax(Slot_valueK2+B2))计算所述N个字符的槽位标识;其中,所述Y为槽位标识向量,在所述Y中包括N个元素,每个元素分别与所述N个字符对应,每个元素为对应字符的槽位标识,所述K2和所述B2为超参数。
18.一种电子设备,其特征在于,包括:存储器、处理器和触控屏;其中:
所述触控屏用于显示内容;
所述存储器,用于存储计算机程序,所述计算机程序包括程序指令;
所述处理器用于调用所述程序指令,使得所述电子设备执行如权利要求1-17任一项所述的方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时,实现如权利要求1-17任意一项所述的方法。
CN202310001313.8A 2023-01-03 2023-01-03 一种短信解析的方法及相关电子设备 Active CN115688743B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310001313.8A CN115688743B (zh) 2023-01-03 2023-01-03 一种短信解析的方法及相关电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310001313.8A CN115688743B (zh) 2023-01-03 2023-01-03 一种短信解析的方法及相关电子设备

Publications (2)

Publication Number Publication Date
CN115688743A CN115688743A (zh) 2023-02-03
CN115688743B true CN115688743B (zh) 2023-05-26

Family

ID=85057337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310001313.8A Active CN115688743B (zh) 2023-01-03 2023-01-03 一种短信解析的方法及相关电子设备

Country Status (1)

Country Link
CN (1) CN115688743B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227629B (zh) * 2023-05-10 2023-10-20 荣耀终端有限公司 一种信息解析方法、模型训练方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691839A (zh) * 2020-12-30 2022-07-01 华为技术有限公司 一种意图槽位识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11138285B2 (en) * 2019-03-07 2021-10-05 Microsoft Technology Licensing, Llc Intent encoder trained using search logs
CN115238691A (zh) * 2022-06-02 2022-10-25 哈尔滨理工大学 基于知识融合的嵌入的多意图识别与槽位填充模型

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691839A (zh) * 2020-12-30 2022-07-01 华为技术有限公司 一种意图槽位识别方法

Also Published As

Publication number Publication date
CN115688743A (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN102893327B (zh) 直觉计算方法和系统
CN113377899A (zh) 意图识别方法及电子设备
CN108595634B (zh) 短信管理方法、装置及电子设备
US20200410732A1 (en) Method and apparatus for generating information
CN109034907A (zh) 广告数据投放方法及装置、电子设备、存储介质
CN115334193B (zh) 基于情境的通知显示方法和装置
CN102741858A (zh) 基于传感器的移动搜索、相关方法和系统
CN108831505A (zh) 用于识别应用的使用场景的方法和装置
CN109643540A (zh) 用于人工智能语音演进的系统和方法
CN115688743B (zh) 一种短信解析的方法及相关电子设备
CN107733722A (zh) 用于配置语音服务的方法和装置
CN112749728A (zh) 学生模型训练方法、装置、计算机设备及存储介质
CN108509904A (zh) 用于生成信息的方法和装置
CN114691839A (zh) 一种意图槽位识别方法
CN113254684A (zh) 一种内容时效的确定方法、相关装置、设备以及存储介质
CN108470179A (zh) 用于检测对象的方法和装置
CN116227629B (zh) 一种信息解析方法、模型训练方法、装置及电子设备
CN109816023A (zh) 用于生成图片标签模型的方法和装置
CN115409458A (zh) 提示方法、图形用户界面及相关装置
CN113806469A (zh) 语句意图识别方法及终端设备
CN116055629B (zh) 一种识别终端状态的方法、电子设备、存储介质和芯片
CN114465975B (zh) 一种内容推送方法、装置、存储介质和芯片系统
CN103297611A (zh) 用于在电子设备上屏蔽消息的方法和系统
CN116956814A (zh) 标点预测方法、装置、设备及存储介质
CN109947526A (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant