CN111767721A - 信息处理方法、装置及设备 - Google Patents
信息处理方法、装置及设备 Download PDFInfo
- Publication number
- CN111767721A CN111767721A CN202010221435.4A CN202010221435A CN111767721A CN 111767721 A CN111767721 A CN 111767721A CN 202010221435 A CN202010221435 A CN 202010221435A CN 111767721 A CN111767721 A CN 111767721A
- Authority
- CN
- China
- Prior art keywords
- text information
- word
- weight
- intention
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 43
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims description 159
- 238000013527 convolutional neural network Methods 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 15
- 230000004044 response Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种信息处理方法、装置及设备,该方法包括:获取第一文本信息和第一文本信息对应的至少一个历史文本信息;分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。用于提高确定用户意图的准确性。
Description
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种信息处理方法、装置及设备。
背景技术
对话系统通常是一种能够根据用户输入的对话生成应答的智能系统。目前,在对话系统生成应答的过程中,需要获取用户输入对话的用户意图,从而根据该用户意图生成应答。
在相关技术中,对话系统获取输入对话的用户意图的方法包括:获取当前对话中距离最近的一句话,对最近的一句话进行意图识别得到用户意图。在上述方法中,对最近的一句话进行意图识别得到用户意图,导致无法准确的得到用户意图。
发明内容
本申请提供一种信息处理方法、装置及设备,用于提高确定用户意图的准确性。
第一方面,本申请提供一种信息处理方法,包括:
获取第一文本信息和第一文本信息对应的至少一个历史文本信息;
分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;
根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。
在一种可能的实施方式中,分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,包括:
分别对第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合;
获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵;
根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重。
在另一种可能的实施方式中,获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵,包括:
若第一词集合和每个第二词集合中的词的个数均不等于预设个数,则分别对第一词集合和每个第二词集合进行填充、或截断处理,得到第一词集合对应的第三词集合和每个第二词集合对应的第四词集合;
根据第三词集合,确定第一词集合对应的第一词矩阵;
根据每个第四词集合,确定每个第二词集合对应的第二词矩阵;
其中,第三词集合和每个第四词集合中的词个数等于预设个数。
在另一种可能的实施方式中,根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重,包括:
通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵;
根据第三词矩阵和会话矩阵,确定第一文本信息的第一权重;
根据每个第四词矩阵和会话矩阵,确定每个历史文本信息的第二权重,其中,会话矩阵为根据会话文本信息得到的,会话文本信息包括第一文本信息和至少一个历史文本信息。
在另一种可能的实施方式中,预设网络模型包括卷积神经网络和长短期记忆网络;通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵,包括:
依次通过卷积神经网络、长短期记忆网络对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵。
在另一种可能的实施方式中,根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图,包括:
根据第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、第一权重和每个第二权重,确定第一文本信息的中间意图;
根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图。
在另一种可能的实施方式中,根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图,包括:
根据中间意图和至少一个预设意图,确定中间意图与每个预设意图的匹配度;
根据每个匹配度,在至少一个预设意图中确定第一文本信息的用户意图。
在另一种可能的实施方式中,根据中间意图和至少一个预设意图,确定中间意图与每个预设意图的匹配度,包括:
通过预设回归模型对中间意图和至少一个预设意图进行处理,得到中间意图与每个预设意图的匹配度。
第二方面,本申请提供一种信息处理装置,包括:获取模块和确定模块,其中,
获取模块用于,获取第一文本信息和第一文本信息对应的至少一个历史文本信息;
确定模块用于,分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;
确定模块还用于,根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。
在一种可能的实施方式中,确定模块具体用于:
分别对第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合;
获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵;
根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重。
在另一种可能的实施方式中,确定模块具体用于:
若第一词集合和每个第二词集合中的词的个数均不等于预设个数,则分别对第一词集合和每个第二词集合进行填充、或截断处理,得到第一词集合对应的第三词集合和每个第二词集合对应的第四词集合;
根据第三词集合,确定第一词集合对应的第一词矩阵;
根据每个第四词集合,确定每个第二词集合对应的第二词矩阵;
其中,第三词集合和每个第四词集合中的词个数等于预设个数。
在另一种可能的实施方式中,确定模块具体用于:
通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵;
根据第三词矩阵和会话矩阵,确定第一文本信息的第一权重;
根据每个第四词矩阵和会话矩阵,确定每个历史文本信息的第二权重,其中,会话矩阵为根据会话文本信息得到的,会话文本信息包括第一文本信息和至少一个历史文本信息。
在另一种可能的实施方式中,预设网络模型包括卷积神经网络和长短期记忆网络;确定模块具体用于:
依次通过卷积神经网络、长短期记忆网络对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵。
在另一种可能的实施方式中,确定模块还具体用于:
根据第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、第一权重和每个第二权重,确定第一文本信息的中间意图;
根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图。
在另一种可能的实施方式中,确定模块还具体用于,根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图,包括:
根据中间意图和至少一个预设意图,确定中间意图与每个预设意图的匹配度;
根据每个匹配度,在至少一个预设意图中确定第一文本信息的用户意图。
在另一种可能的实施方式中,确定模块还具体用于:
通过预设回归模型对中间意图和至少一个预设意图进行处理,得到中间意图与每个预设意图的匹配度。
第三方面,本申请提供一种信息处理设备,包括:至少一个处理器和存储器;
存储器存储计算机执行指令;
至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面任一项的信息处理方法。
第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如第一方面任一项的信息处理方法。
本实施例提供一种信息处理方法、装置及设备,该方法包括:获取第一文本信息和第一文本信息对应的至少一个历史文本信息;分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。在本申请中,据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图,可以提高确定用户意图的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的应用场景示意图;
图2为本申请提供的信息处理方法的流程示意图一;
图3为本申请提供的信息处理方法的流程示意图二;
图4为本申请提供的预设网络模型的结构;
图5为本申请提供的信息处理装置的结构示意图;
图6为本申请提供的信息处理设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请提供的应用场景示意图。如图1所示,包括:智能设备101和服务器102。其中,智能设备101可以通过无线网络与服务器102进行交互。例如,无线网络可以是2G网络、3G网络、4G网络或者5G网络、无线保真(Wireless Fidelity,简称WIFI)网络等。
在智能设备101与服务器102的交互过程中,智能设备101可以将对话用户输入的至少一个文本信息发送给服务器102。服务器102接收到至少一个文本信息之后,可以根据至少一个文本信息确定用户意图,并根据用户意图得到应答信息,进而向智能设备101发送应答信息。
具体的,智能设备101可以为智能手机、电脑等,智能设备101可以显示对话界面103,对话界面103中显示对话用户输入的文本信息和对话机器的应答信息。例如,对话用户输入的文本信息可以依次为“你好”、“我下单已经三天了,怎么还没有收到货啊”、“那就退了吧”。智能设备101可以将文本信息发送给服务器102,服务器102可以根据该文本信息确定用户意图—“配送周期”,根据用户意图确定应答信息—“请稍等,我帮您查看一下配送信息”,并将应答信息发送给智能设备101,以使智能设备101的对话界面103显示“请稍等,我帮您查看一下物流信息”。在上述方法中,服务器102根据多条文本信息确定用户意图,可以提高确定用户意图的准确性。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请提供的信息处理方法的流程示意图一。该信息处理方法的执行主体可以为服务器,也可以为设置在服务器中的信息处理装置,其中,该信息处理装置可以通过软件和/或硬件的结合来实现。如图2所示,该信息处理方法包括:
S201:获取第一文本信息和第一文本信息对应的至少一个历史文本信息。
其中,第一文本信息为会话文本信息中对话用户输入的最近一条信息,如图1所示,第一文本信息为“那就退了吧”。需要说明的是,会话文本信息中包括第一文本信息和第一文本信息对应的至少一个历史文本信息,如图1所示,至少一个历史文本信息包括“你好”、“我下单已经三天了,怎么还没有收到货啊”。
可选地,至少一个历史文本信的个数可以为N,N大于或等于1,具体的,本申请不对N的取值进行限定。
可选地,至少一个历史文本信息中还可以包括对话机器的应答信息。
S202:分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度。
具体的,获取第一文本信息的第一词矩阵和每个历史文本信息的第二词矩阵,通过预设模型对第一词矩阵和每个第二词矩阵进行处理,得到第一权重和每个历史文本信息的第二权重。其中,第一词矩阵为根据第一文本信息中的词确定的矩阵,第二词矩阵为根据历史文本信息中的词确定的矩阵,预设模型包括卷积神经(Convolutional NeuralNetworks,CNN)网络、长短期记忆LSTM(Long Short-Term Memory,LSTM)网络、以及注意力机制(Attention Mechanism)。
进一步地,将第一词矩阵和每个第二词矩阵依次通过CNN网络、LSTM网络和注意力机制处理,得到第一文本信息的第一权重和每个历史文本信息的第二权重。
S203:根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。
具体的,根据第一文本信息的第三词矩阵、每个历史文本信息的第四矩阵、第一权重和每个第二权重,确定第一文本信息的用户意图。其中,第三词矩阵和每个第四矩阵为第一词矩阵和每个第二词矩阵依次通过CNN网络和LSTM网络处理后得到的。
在一种现有技术中,对最近的一句话进行意图识别得到用户意图,导致无法准确的得到用户意图,例如对话用户先输入“我要退货”,再输入“运费谁出”,若根据“运费谁出”,则无法确定对话用户的用户意图是咨询售前运费(商家寄给客户)还是售后运费(客户寄给商家)。在另一种现有技术中,将对话用户所有文本信息进行拼接,根据拼接后的文本信息进行意图识别,可能导致用户意图确定错误,例如,对如图1所示的对话信息进行拼接根据拼接后的文本信息进行意图识别,得到的用户意图可能为“退货”,而实际的用户意图为“配送周期”,导致用户意图确定错误。而在本申请中,根据第一文本信息和每个历史文本信息的权重确定用户意图,可以提高确定用户意图的准确性。
本实施例提供的信息处理方法包括:获取第一文本信息和第一文本信息对应的至少一个历史文本信息;分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。在本申请中,据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图,可以提高确定用户意图的准确性。
在图2的基础上,下面结合图3对本申请中的信息处理方法作进一步地,详细说明。
图3为本申请提供的信息处理方法的流程示意图二。如图3所示,该信息处理方法包括:
S301:获取第一文本信息和第一文本信息对应的至少一个历史文本信息。
具体的,S301的执行方法与S302的执行方法相同,此处,不再赘述,S301的执行过程。
S302:分别对第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合。
具体的,通过预先设定的切词方法对第一文本信息和每个历史文本信息进行切词处理,得到第一词集合和每个第二词集合。可选地,预先设定的切词方法可以为单字切词方法、或词切词方法。
例如,文本信息为“我要退货”,若通过单字切词方法对其进行处理,则得到的词集合为:我、要、退、货;若通过词切词方法对其进行处理,则得到的词集合为:我、要、退货。
S303:获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵。
在一种可能的实施方式中,包括:若第一词集合和每个第二词集合中的词的个数均不等于预设个数,则分别对第一词集合和每个第二词集合进行填充、或截断处理,得到第一词集合对应的第三词集合和每个第二词集合对应的第四词集合;根据第三词集合,确定第一词集合对应的第一词矩阵;根据每个第四词集合,确定每个第二词集合对应的第二词矩阵,其中,第三词集合和每个第四词集合中的词个数等于预设个数。
可选地,预设个数可以20、30、50等,本申请不对预设个数进行限定。
可选地,对词集合进行填充处理包括将预设词插入至词集合中的第一预设位置处,对词集合进行截断处理包括将词集合中第二预设位置处的词删除。
其中,预设词可以为任意预先设定词,例如:0、1、2、%等,第一预设位置可以为起始位置、或者终止位置,第二预设位置可以为中间位置。
例如,会话文本信息中包括第一文本信息“我要退货”和一个历史文本信息“我下单已经三天了,怎么还没收到啊”,若采用词切词方法对第一文本信息进行处理,则得到的第一词集合为:我、要、退货,若采用词切词方法对该历史文本信息进行处理,则得到的第二词集合为:我、下单、已经、三天、了、怎么、还、没、收到、啊。
例如,当预设个数为8、预设词为0、第一预设位置为起始位置、第二预设位置为中间位置时,则对第一词集合进行填充处理之后得到的第三词集合可以为:0、0、0、0、0、我、要、退货,对第二词集合进行截断处理之后得到的第四词集合可以为:我、下单、已经、三天、还、没、收到、啊,其中,第三词集合和第四词集合中均包括8个词。
进一步地,通过预设词矩阵算法,对第三词集合进行处理得到第一词集合对应的第一词矩阵,对每个第四词集合得到每个第二词集合对应的第二词矩阵。其中,预设词矩阵算法可以为word2vector算法。
S304:根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重。
在一种可能的实施方式中,通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵;根据第三词矩阵和会话矩阵,确定第一文本信息的第一权重;根据每个第四词矩阵和会话矩阵,确定每个历史文本信息的第二权重,其中,会话矩阵为根据会话文本信息得到的,会话文本信息包括第一文本信息和至少一个历史文本信息。
具体的,预设网络模型包括卷积神经网络和长短期记忆网络,依次通过卷积神经网络、长短期记忆网络对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵。具体的,请参见图4中对预设网络模型的详细说明。
可选地,可以通过如下可行的公式1和公式2,确定上述权重值:
Ui=tanh(WHi+B) 公式1;
其中,wi为权重,U为会话矩阵,e为自然底数,W和B为长短期记忆网络输出的参数,Hi为权重wi对应的词矩阵,其中,Hi的取值为第三词矩阵和每个历史文本信息的第四词矩阵。
S305:根据第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、第一权重和每个第二权重,确定第一文本信息的中间意图。
具体的,可以通过如下公式3,确定第一文本信息的中间意图:
V=∑iwiHi 公式3;
其中,V为中间意图,wi为权重,Hi为权重wi对应的词矩阵,Hi取值为第三词矩阵和每个历史文本信息的第四词矩阵。
需要说明的是,上述公式1、公式2和公式3为注意力机制中的公式。
S306:根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图。
在一种可能的实施方式中,根据中间意图和至少一个预设意图,确定中间意图与每个预设意图的匹配度;根据每个匹配度,在至少一个预设意图中确定第一文本信息的用户意图。
具体的,通过预设回归模型对中间意图和至少一个预设意图进行处理,得到中间意图与每个预设意图的匹配度。其中,预设回归模型为Softmax回归模型。
进一步地,将匹配度最大时对应的预设意图确定为用户意图。
在本申请中,通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵,实现提取每个文本信息中的有效信息(即第三词矩阵和每个第四词矩阵),进而根据每个文本信息中的有效信息和每个文本信息的重要性(权重),确定用户意图,可以提高确定用户意图的准确性。
本实施例提供的信息处理方法包括:获取第一文本信息和第一文本信息对应的至少一个历史文本信息;分别对第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合;获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵;根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重;根据第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、第一权重和每个第二权重,确定第一文本信息的中间意图;根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图。在上述方法中,根据第一文本信息、每个历史文本信息和权重确定用户意图,可以提高确定用户意图的准确性。
图4为本申请提供的预设网络模型的结构示意图。如图4所示,预设网络模型包括:卷积神经网络和长短期记忆网络,其中,长短期记忆网络包括至少一个处理节点。
可选地,卷积神经网络的个数为M,M大于或等于1,每个卷积神经网络包括卷积层和池化层。
具体的,卷积神经网络和至少一个处理节点的个数相同,至少第一文本信息和至少一个历史文本信息的总个数与至少一个处理节点相同。
例如,至少一个处理节点的个数为M,M大于或等于1,若会话文本信息中包括的文本信息个数大于M,则将第一文本信息和第一文本信息之前的M-1个文本信息确定为至少一个历史文本信息,从而使得第一文本信息和至少一个历史文本信息的总个数为M。
下面,以第一词矩阵为例,对预设网络模型的工作过程进行说明。
通过一卷积神经网络对第一词矩阵进行处理,并向长短期记忆网络中的处理节点(与该卷积神经网络对应)提供该卷积神经网络输出的处理结果。该处理节点对上一处理节点提供的学习信息和该卷积神经网络输出的处理结果进行处理,得到第三词矩阵。
需要说明的是,长短期记忆网络为单向长短期记忆网络。在实际应用中,由于用户意图通常和最近一条信息(第一文本信息)最相关,因此通过单向长短期记忆网络可以使得确定出的用户意图更加准确。
图5为本申请提供的信息处理装置的结构示意图。该信息处理装置10设置在服务器中,如图5所示,该信息处理装置10包括:获取模块11和确定模块12,其中:
获取模块11用于,获取第一文本信息和第一文本信息对应的至少一个历史文本信息;
确定模块12用于,分别确定第一文本信息的第一权重和每个历史文本信息的第二权重,第一权重指示第一文本信息对意图识别的重要程度,第二权重指示历史文本信息对意图识别的重要程度;
确定模块12还用于,根据第一文本信息、每个历史文本信息、第一权重和每个第二权重,确定第一文本信息的用户意图。
本申请提供的信息处理装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方式中,确定模块12具体用于:
分别对第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合;
获取第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵;
根据第一词矩阵和每个第二词矩阵,确定第一文本信息的第一权重和每个历史文本信息的第二权重。
在另一种可能的实施方式中,确定模块12具体用于:
若第一词集合和每个第二词集合中的词的个数均不等于预设个数,则分别对第一词集合和每个第二词集合进行填充、或截断处理,得到第一词集合对应的第三词集合和每个第二词集合对应的第四词集合;
根据第三词集合,确定第一词集合对应的第一词矩阵;
根据每个第四词集合,确定每个第二词集合对应的第二词矩阵;
其中,第三词集合和每个第四词集合中的词个数等于预设个数。
在另一种可能的实施方式中,确定模块12具体用于:
通过预设网络模型对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵;
根据第三词矩阵和会话矩阵,确定第一文本信息的第一权重;
根据每个第四词矩阵和会话矩阵,确定每个历史文本信息的第二权重,其中,会话矩阵为根据会话文本信息得到的,会话文本信息包括第一文本信息和至少一个历史文本信息。
在另一种可能的实施方式中,预设网络模型包括卷积神经网络和长短期记忆网络;确定模块12具体用于:
依次通过卷积神经网络、长短期记忆网络对第一词矩阵和每个第二词矩阵进行处理,得到第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵。
在另一种可能的实施方式中,确定模块12还具体用于:
根据第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、第一权重和每个第二权重,确定第一文本信息的中间意图;
根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图。
在另一种可能的实施方式中,确定模块12还具体用于:
根据中间意图和预先设定的至少一个预设意图,确定第一文本信息的用户意图,包括:
根据中间意图和至少一个预设意图,确定中间意图与每个预设意图的匹配度;
根据每个匹配度,在至少一个预设意图中确定第一文本信息的用户意图。
在另一种可能的实施方式中,确定模块12还具体用于:
通过预设回归模型对中间意图和至少一个预设意图进行处理,得到中间意图与每个预设意图的匹配度。
图6为本申请提供的信息处理设备的硬件结构示意图。如图6所示,信息处理设备20包括:至少一个处理器21和存储器22。其中,处理器21、存储器22通过总线23连接。
在具体实现过程中,至少一个处理器21执行存储器22存储的计算机执行指令,使得至少一个处理器21执行如上的信息处理方法。
处理器21的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。其中,信息处理设备20可以为服务器。
在上述图6所示的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上的信息处理方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个区块链单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者区块链设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (11)
1.一种信息处理方法,其特征在于,包括:
获取第一文本信息和所述第一文本信息对应的至少一个历史文本信息;
分别确定所述第一文本信息的第一权重和每个历史文本信息的第二权重,所述第一权重指示所述第一文本信息对意图识别的重要程度,所述第二权重指示所述历史文本信息对意图识别的重要程度;
根据所述第一文本信息、所述每个历史文本信息、所述第一权重和每个第二权重,确定所述第一文本信息的用户意图。
2.根据权利要求1所述的方法,其特征在于,分别确定所述第一文本信息的第一权重和每个历史文本信息的第二权重,包括:
分别对所述第一文本信息和每个历史文本信息进行切词处理,得到第一文本信息的第一词集合和每个历史文本信息的第二词集合;
获取所述第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵;
根据所述第一词矩阵和每个第二词矩阵,确定所述第一文本信息的第一权重和每个历史文本信息的第二权重。
3.根据权利要求2所述的方法,其特征在于,获取所述第一词集合对应的第一词矩阵和每个第二词集合对应的第二词矩阵,包括:
若所述第一词集合和每个第二词集合中的词的个数均不等于预设个数,则分别对所述第一词集合和每个第二词集合进行填充、或截断处理,得到所述第一词集合对应的第三词集合和每个第二词集合对应的第四词集合;
根据所述第三词集合,确定所述第一词集合对应的第一词矩阵;
根据每个第四词集合,确定每个第二词集合对应的第二词矩阵;
其中,所述第三词集合和每个第四词集合中的词个数等于所述预设个数。
4.根据权利要求2所述的方法,其特征在于,根据所述第一词矩阵和每个第二词矩阵,确定所述第一文本信息的第一权重和每个历史文本信息的第二权重,包括:
通过预设网络模型对所述第一词矩阵和每个第二词矩阵进行处理,得到所述第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵;
根据所述第三词矩阵和会话矩阵,确定所述第一文本信息的第一权重;
根据每个第四词矩阵和所述会话矩阵,确定每个历史文本信息的第二权重,其中,所述会话矩阵为根据会话文本信息得到的,所述会话文本信息包括所述第一文本信息和所述至少一个历史文本信息。
5.根据权利要求4所述的方法,其特征在于,所述预设网络模型包括卷积神经网络和长短期记忆网络;通过预设网络模型对所述第一词矩阵和每个第二词矩阵进行处理,得到所述第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵,包括:
依次通过所述卷积神经网络、所述长短期记忆网络对所述第一词矩阵和每个第二词矩阵进行处理,得到所述第一文本信息的第三词矩阵和每个历史文本信息的第四词矩阵。
6.根据权利要求2至5任一项所述的方法,其特征在于,根据所述第一文本信息、每个历史文本信息、所述第一权重和每个第二权重,确定所述第一文本信息的用户意图,包括:
根据所述第一文本信息的第三词矩阵、每个历史文本信息的第四词矩阵、所述第一权重和每个第二权重,确定所述第一文本信息的中间意图;
根据所述中间意图和预先设定的至少一个预设意图,确定所述第一文本信息的用户意图。
7.根据权利要求6所述的方法,其特征在于,根据所述中间意图和预先设定的至少一个预设意图,确定所述第一文本信息的用户意图,包括:
根据所述中间意图和所述至少一个预设意图,确定所述中间意图与每个预设意图的匹配度;
根据每个匹配度,在所述至少一个预设意图中确定所述第一文本信息的用户意图。
8.根据权利要求7所述的方法,其特征在于,根据所述中间意图和所述至少一个预设意图,确定所述中间意图与每个预设意图的匹配度,包括:
通过预设回归模型对所述中间意图和所述至少一个预设意图进行处理,得到所述中间意图与每个预设意图的匹配度。
9.一种信息处理装置,其特征在于,包括:获取模块和确定模块,其中,
所述获取模块用于,获取第一文本信息和所述第一文本信息对应的至少一个历史文本信息;
所述确定模块用于,分别确定所述第一文本信息的第一权重和每个历史文本信息的第二权重,所述第一权重指示所述第一文本信息对意图识别的重要程度,所述第二权重指示所述历史文本信息对意图识别的重要程度;
所述确定模块还用于,根据所述第一文本信息、所述每个历史文本信息、所述第一权重和每个第二权重,确定所述第一文本信息的用户意图。
10.一种信息处理设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至8任一项所述的信息处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至8任一项所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010221435.4A CN111767721A (zh) | 2020-03-26 | 2020-03-26 | 信息处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010221435.4A CN111767721A (zh) | 2020-03-26 | 2020-03-26 | 信息处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111767721A true CN111767721A (zh) | 2020-10-13 |
Family
ID=72720689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010221435.4A Pending CN111767721A (zh) | 2020-03-26 | 2020-03-26 | 信息处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111767721A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073708A (zh) * | 2017-12-20 | 2018-05-25 | 北京百度网讯科技有限公司 | 信息输出方法和装置 |
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
CN109857848A (zh) * | 2019-01-18 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 交互内容生成方法、装置、计算机设备及存储介质 |
CN110334344A (zh) * | 2019-06-13 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种语义意图识别方法、装置、设备及存储介质 |
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
US20190377793A1 (en) * | 2018-06-07 | 2019-12-12 | Alibaba Group Holding Limited | Method and apparatus for establishing a hierarchical intent system |
-
2020
- 2020-03-26 CN CN202010221435.4A patent/CN111767721A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108073708A (zh) * | 2017-12-20 | 2018-05-25 | 北京百度网讯科技有限公司 | 信息输出方法和装置 |
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
US20190377793A1 (en) * | 2018-06-07 | 2019-12-12 | Alibaba Group Holding Limited | Method and apparatus for establishing a hierarchical intent system |
CN109857848A (zh) * | 2019-01-18 | 2019-06-07 | 深圳壹账通智能科技有限公司 | 交互内容生成方法、装置、计算机设备及存储介质 |
CN110334344A (zh) * | 2019-06-13 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种语义意图识别方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
杨成彪;吕荣荣;吴刚;: "一种基于记忆网络的多轮对话下的意图识别方法", 电子技术与软件工程, no. 10, 23 May 2018 (2018-05-23) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159329A (zh) | 敏感词检测方法、装置、终端设备和计算机可读存储介质 | |
CN109766422A (zh) | 信息处理方法、装置及系统、存储介质、终端 | |
CN115205736A (zh) | 视频数据的识别方法和装置、电子设备和存储介质 | |
CN110674488A (zh) | 基于神经网络的验证码识别方法、系统及计算机设备 | |
CN111767721A (zh) | 信息处理方法、装置及设备 | |
CN110502975B (zh) | 一种行人重识别的批量处理系统 | |
CN112632251A (zh) | 回复内容的生成方法、装置、设备和存储介质 | |
CN116432649A (zh) | 实体识别方法、装置、存储介质及电子装置 | |
CN111680497A (zh) | 会话特征提取方法、会话识别模型训练方法及装置 | |
CN114117051A (zh) | 词性标注模型的训练方法、词性标注方法及电子设备 | |
CN111625628B (zh) | 信息处理方法及装置、存储介质和处理器 | |
CN108509478B (zh) | 规则引擎文件的拆分调用方法、电子装置及存储介质 | |
CN112651753A (zh) | 基于区块链的智能合约生成方法、系统及电子设备 | |
CN112861504A (zh) | 文本交互方法、装置、设备、存储介质及程序产品 | |
CN112070561A (zh) | 电子券推荐方法及装置 | |
CN110728973A (zh) | 视频资源的输出方法和服务器 | |
CN111144973B (zh) | 问题排名方法及计算机可读存储介质 | |
CN116363262B (zh) | 图像生成方法、装置及电子设备 | |
CN111598643A (zh) | 信息处理方法及装置 | |
CN115482422B (zh) | 深度学习模型的训练方法、图像处理方法和装置 | |
CN117852655B (zh) | 利用大模型进行推理的方法和电子设备 | |
CN113239941A (zh) | 模型输入最优尺寸的方法、装置、设备及可读存储介质 | |
CN115455951A (zh) | 文本处理方法、文本处理模型的更新方法及装置 | |
CN116896466A (zh) | 数据外发方法、装置、计算机设备及存储介质 | |
CN115455909A (zh) | 文本处理模型的训练方法、系统及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |