CN111460106A - 一种信息交互方法、装置及设备 - Google Patents
一种信息交互方法、装置及设备 Download PDFInfo
- Publication number
- CN111460106A CN111460106A CN201910001036.4A CN201910001036A CN111460106A CN 111460106 A CN111460106 A CN 111460106A CN 201910001036 A CN201910001036 A CN 201910001036A CN 111460106 A CN111460106 A CN 111460106A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- interaction
- semantic features
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000004044 response Effects 0.000 claims abstract description 56
- 230000002452 interceptive effect Effects 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 15
- 238000007637 random forest analysis Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 230000015654 memory Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 abstract description 14
- 238000001514 detection method Methods 0.000 abstract description 13
- 230000004913 activation Effects 0.000 abstract description 5
- 238000012423 maintenance Methods 0.000 abstract description 5
- 230000008447 perception Effects 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000003066 decision tree Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006403 short-term memory Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 4
- 238000012821 model calculation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种信息交互方法、装置及设备,其中,信息交互方法包括:获取用户的输入轨迹信息;根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;根据所述语义特征,得到应答信息,并进行显示。本方案能够逐层对用户进行引导,收敛客户问题,精确定位用户需求,努力提高用户的使用体验和感知,实现根据用户特征进行多轮交互,很好的解决了现有技术中客服系统无法实现根据用户特征进行多轮交互的问题;并且本方案具有通用、简便、易于维护等优点;支持多节点、多支路的知识路径展示,支持顺序访问和跨级跳转功能;支持多层级入口检测,场景激活条件丰富,交互层级编码实时动态生成。
Description
技术领域
本发明涉及通信技术领域,特别是指一种信息交互方法、装置及设备。
背景技术
随着移动互联网的发展,客服服务系统不单单是通过IVR(互动式语音应答)业务平台就可以满足用户的需求,移动互联网将用户的使用环境和时间切分的更为碎片化,因此客服服务接入入口也变的更加多元化,正在慢慢的从传统的电话语音方式向微信公众服务平台,微博、百度知道等转移。
目前,主要存在以下三种方式:
1.IVR业务平台–IVR业务即自动语音应答业务,是在移动网基本语音业务基础上延伸出来的业务,指通过GSM/CDMA无线网络和语音类增值支撑平台,向用户提供声音服务。目前占主流的是IVR业务。手机用户通过拨打指定号码,可以根据操作提示收听、点送所需语音信息,或者参与聊天、交友等互动式服务。这种是基于事先设定好的用户使用习惯,自由度很低,语音过程中的效率较弱。
2.销售展示类网站的客服平台-该类型客服主要是通过第三方平台的人与人的交互方式,比如通过QQ、百度IM等的第三方插件技术。这类应答在技术层面没有特别的创新点。
3.近年来比较流行的客服应答方法是基于模板加人工的方式,比如支付宝的我的客服,首先罗列出基于大数据的用户问题Top10,基于这些TOP问题将答案标准化,用户可以直接选择查看。如果不是这些问题,用户可以选择转人工服务。对于问题用户可以通过语音和文本两种方式进行提问咨询,继而客服人员进行解答服务等。
从技术层面看,现有客服系统主要基于常见的问题-答案对数据,通过文本检索的方式,计算用户问题和知识库中标准问题的相似度,匹配出最合适的答案返回给用户。该方案简单易扩展,目前在工业界使用广泛。
但是,现有的客户服务的应答方式主要还是通过人力成本来进行,还没有真正的智能化可根据用户特征进行多轮交互的应答方式和客服系统;而且人力的应答方式没有较好的办法保证全天24小时的实时服务,因此会给用户带来不便以及对企业带来不可预见的损失;
并且,智能客服中的多轮人机对话问题,一直是业界的难点之一;比如,中国移动有9亿客户,每个客户都有自己的对话方式和对话习惯;常见的问答系统通常只能通过FAQ一问一答的形式,回答用户的常见简单问题。但是,对于复杂问题,用户的提问往往具有连贯性,并且问题的范围和边界难以仅仅通过一轮提问完全表达。现有的客服系统无法完成解答。
综上,现有技术中的客服系统无法实现根据用户特征进行多轮交互。
发明内容
本发明的目的在于提供一种信息交互方法、装置及设备,解决现有技术中客服系统无法实现根据用户特征进行多轮交互的问题。
为了解决上述技术问题,本发明实施例提供一种信息交互方法,包括:
获取用户的输入轨迹信息;
根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
根据所述语义特征,得到应答信息,并进行显示。
可选的,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
可选的,所述根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征,包括:
利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
可选的,所述根据所述语义特征,得到应答信息,并进行显示,包括:
利用预设模型,根据所述语义特征,得到应答信息,并进行显示;
其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
可选的,对所述应答信息进行显示之前,还包括:
根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
可选的,在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,还包括:
根据交互信息,获取用户的特征信息;
根据所述交互信息和特征信息,形成所述历史记录信息。
本发明实施例还提供了一种信息交互装置,包括:
第一获取模块,用于获取用户的输入轨迹信息;
第一提取模块,用于根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
第一处理模块,用于根据所述语义特征,得到应答信息,并进行显示。
可选的,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
可选的,所述第一提取模块,包括:
第一提取子模块,用于利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
可选的,所述第一处理模块,包括:
第一处理子模块,用于利用预设模型,根据所述语义特征,得到应答信息,并进行显示;
其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
可选的,还包括:
第一调整模块,用于对所述应答信息进行显示之前,根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
可选的,还包括:
第二获取模块,用于在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,根据交互信息,获取用户的特征信息;
第二处理模块,用于根据所述交互信息和特征信息,形成所述历史记录信息。
本发明实施例还提供了一种信息交互设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现上述的信息交互方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的信息交互方法中的步骤。
本发明的上述技术方案的有益效果如下:
上述方案中,所述信息交互方法通过获取用户的输入轨迹信息;根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;根据所述语义特征,得到应答信息,并进行显示;能够逐层对用户进行引导,收敛客户问题,精确定位用户需求,努力提高用户的使用体验和感知,实现根据用户特征进行多轮交互,很好的解决了现有技术中客服系统无法实现根据用户特征进行多轮交互的问题;并且本方案具有通用、简便、易于维护等优点;支持多节点、多支路的知识路径展示,支持顺序访问和跨级跳转功能;支持多层级入口检测,场景激活条件丰富,交互层级编码实时动态生成。
附图说明
图1为本发明实施例的信息交互方法流程示意图;
图2为本发明实施例的信息交互系统示意图;
图3为本发明实施例的前端知识编辑示意图;
图4为本发明实施例的后端识别匹配示意图;
图5为本发明实施例的数据结构示意图;
图6为本发明实施例的条件随机场模型示意图;
图7为本发明实施例的分类算法示意图;
图8为本发明实施例的模型计算流程示意图;
图9为本发明实施例的信息交互装置结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的技术中客服系统无法实现根据用户特征进行多轮交互的问题,提供一种信息交互方法,如图1所示,包括:
步骤11:获取用户的输入轨迹信息;
步骤12:根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
步骤13:根据所述语义特征,得到应答信息,并进行显示。
本发明实施例提供的所述信息交互方法通过获取用户的输入轨迹信息;根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;根据所述语义特征,得到应答信息,并进行显示;能够逐层对用户进行引导,收敛客户问题,精确定位用户需求,努力提高用户的使用体验和感知,实现根据用户特征进行多轮交互,很好的解决了现有技术中客服系统无法实现根据用户特征进行多轮交互的问题;并且本方案具有通用、简便、易于维护等优点;支持多节点、多支路的知识路径展示,支持顺序访问和跨级跳转功能;支持多层级入口检测,场景激活条件丰富,交互层级编码实时动态生成。
其中,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
具体的,所述根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征,包括:利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
本发明实施例中,所述根据所述语义特征,得到应答信息,并进行显示,包括:利用预设模型,根据所述语义特征,得到应答信息,并进行显示;其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
进一步的,在利用预设模型,根据所述语义特征,得到应答信息之前,还包括:利用训练信息,训练所述预设模型。
更进一步的,在利用预设模型,根据所述语义特征,得到应答信息之后,还包括:根据针对所述应答信息的后续的交互信息,更新所述预设模型。
为了进一步满足不同用户的个性化需求,对所述应答信息进行显示之前,还包括:根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
进一步的,在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,还包括:根据交互信息,获取用户的特征信息;根据所述交互信息和特征信息,形成所述历史记录信息。
下面对本发明实施例提供的所述信息交互方法进行进一步说明,应用场景以人机对话场景为例。
针对上述技术问题,本发明实施例提供了一种信息交互方法,主要通过场景建模的方式,在人机交互的过程中,逐层对用户进行引导,收敛客户问题,精确定位用户需求,努力提高用户的使用体验和感知,实现真正的智能化,可根据用户特征进行多轮交互。
本发明实施例提供的方案可采用如图2所示的信息交互系统进行实现,其中涉及对话场景检测、交互菜单生成以及回复内容优化,关于对话场景检测需要用到知识数据库中的数据以及日志数据,而交互菜单生成需要用到短期记忆信息和长期记忆信息,回复内容优化包含针对显示格式以及外观设置等内容的优化。
本发明实施例中可使用文本检索检索和自然语言处理技术,及时捕捉用户的实时输入轨迹,根据用户的个性画像(长期记忆,即长期特征)和问题历史(短期记忆),个性化生成对话列表,逐层递进引导用户。在用户问题边界不清楚或者用户问题复杂无法通过简单一问一答解答的情况下,可自适应的根据用户的提问,逐层引导用户完成对话。
本发明实施例提供的方案涉及前端知识编辑和后端识别匹配两部分:
关于前端知识编辑:
如图3所示,包含知识录入(知识输入,比如问答内容)、知识校验(知识正确与否的检验)和知识入库(知识存储)三个阶段(这三个阶段能够保证系统的完整性),各个环节解耦合,相互配合。
本发明实施例中还可以进行知识点扁平化:服务接口对于知识编写要求进一步简化(比如采用预设的知识编写规则进行知识录入简化),实现知识扁平化管理。
关于后端识别匹配:
如图4所示,包括入口检测,判断是否进入场景检测,若是,进入场景检测,然后多轮交互,最后结束退出;若否,则直接结束退出。
具体的,其中涉及:
一、对话场景检测模块
对话场景检测包含两部分:
1、外部:通过系统意图识别模块,把uq(用户问题)map(匹配)到stq(标准问题)输入(也就是调整用户问题,提取语义特征);
2、内部:通过对redis数据库中数据知识进行语义计算和匹配,获得场景问题以及相应内容(也就是进行决策,得到对应于用户问题的答案)。
二、交互菜单生成模块
此模块主要功能为动态生成交互式菜单,记录用户在交互过程中的行为轨迹、用户个性画像、菜单选项和对应层级问题。
其中,1、redis数据库中的参数,如图5所示,可包含:
身份标识ID(即图5中的D)映射表:表中包含场景信息(CJ1,CJ2,CJ3…)与问题MD5值(问题答案值:A,B,C…)之间的映射关系(即图5中的uid)。
2、redis数据库的数据结构:
内存数据库中redis,以{关键词KEY:答案值VALUE}形式存储,采用过期机制,生命周期内有效,如图5所示。
3、模型计算:
本发明实施例提供的方案在用户聚类画像中,使用word2vec词向量模型进行语义表示;在意图识别和对话列表生成阶段运用条件随机场+随机森林的混合模型进行用户对话历史和系统回复联合建模,从语义层面计算和分析出基于短期记忆和长期记忆的个性化交互菜单(也可以理解为从历史信息得到问答模型)。
其中,条件随机场(conditional random fields,CRF)是一种无向概率图模型,它具有表达元素长距离依赖性和交叠性特征的能力,能方便地在模型中包含多种特征信息。该模型是在给定观察或者输入序列的条件下,计算整个输出序列的联合概率分布。
具体的,该条件随机场模型是在给定观察或输入序列的条件下,计算整个待标记序列或输出序列的联合概率分布。标记序列(Label Sequence)的分布条件属性,可以让CRF很好的拟合中文的真实语言环境。CRF模型的需要解决两个关键问题:一个是参数的估计,另一个就是特征的选择。参数的估计通过对训练数据集的学习,获取每一个特征的权重参数。特征的选择是根据要处理问题的需要,对文本进行预处理筛选出对建立CRF模型有表征意义的特征。
关于CRF模型,如图6所示,设x为表示观测序列的随机变量,y是对应于标注序列的随机变量。x=(x1,x2,…,xn),y=(y1,y2,…,yn),其中yi∈T,(i=1,2,…,n),T是有限的标记集。比如,在浅层句法分析中,x是句子中的词、每个词的词性等;y是相应的句子语法成分,如名词短语、动词短语等。随机变量x和y构成联合分布,根据观察和标记序列构建一个条件概率模型P(y|x)。模型定义如下:
其中,Z(x)表示归一化因子,fk(yi-1,yi,x,i)表示状态转移函数,gk(yi,x,i)表示状态特征函数。λk和μk表示CRF中训练得到的系数参数。
下面通过微信公众号与该本发明实施例提供的系统结合的使用场景进行举例说明:
第一步:微信用户与某公众账号进行绑定后,通过微信的输入框与智能客服系统建立联系,根据用户的输入获得用户的输入轨迹记录:用户的输入轨迹包含用户的点选序列(比如用户针对系统提供的选择题所输入的答案)、用户的输入模式(比如语音模式、文字模式)、用户的跳转记录(比如用户针对系统提供的选择题进行答复的过程中题目的跳转记录)等。
第二步:将用户实时数据传入至个性化系统(该系统中的信息存储比如下表1所示,但并不以此为限)的用户当前状态库中,同时,个性化系统通过用户历史信息库调取用户相关历史数据,通过用户当前状态和历史信息进行用户的特征抽取。
该个性化系统将不同用户的信息区分开存储,其中的历史信息可以是记录下来的,存在后台。
表1个性化系统
进一步的,本发明实施例中使用的语义特征提取的方法可包含:
(1)语言模型Ngram
Ngram是从时序的角度出发给出用户特征的建模。具体就是把N个连续的词作为一个单位进行处理,例如:“John likes to watch movies.Mary likes movies too.”这句话处理为简单词袋模型后的结果为:
["John":1,"likes":2,"to":1,"watch":1,"movies":2,"Mary":1,"too":1]
而处理为bigram(2-gram)后的结果为:
["John likes":1,"likes to":1,"to watch":1,"watch movies":1,"Marylikes":1,"likes movies":1,"movies too":1]
本发明实施例中是以日志预处理模块(这是线下的预处理模块)的结果集{uid:{sq1,sq2,sq3……}}作为训练输入,将每个标准问题看作是最小单元(比如,“38元套餐介绍”就是最小单元),最后训练2-gram模型,给出每两个标准问题共同出现的频次,形式如<sq1-sq2,n>,<sq1-sq3,m>。比如查询输入是sq1,如果n>m,sq1对应交互菜单选项是sq2。
用户历史信息同样可以通过Ngram的方法表示成语义空间的向量表示(向量化的过程)。
用户当前输入的信息也可以表示成语义空间的向量。
(2)词向量模型Word2vec
Word2vec的中心思想是:一个词的特征由它周围的词所决定。
具体来讲,词向量模型使用“周围的词=>当前词”或“当前词=>周围的词”这样的方式构造训练样本,然后使用神经网络来训练模型,训练完成之后,输入词的输入向量表示便成为了该词的向量表示(也就是词向量的表征)。
从词向量的角度来看,“苹果”和“小米”可能会具有更高的相似度,就像“乔布斯”和“雷军”在词向量下的关系一样,所以在词向量中可能会有:“vector(小米)-vector(苹果)+vector(乔布斯)=vector(雷军)”这样的结果。
比如用户U连续问了uq1,uq2,uq3,10086智能客服系统会给出对应的标准问题sq1,sq2,sq3,这些都会通过日志的方式记录下来。本发明将这些数据预处理,将用户一次连续的问题序列对应的标准问题作为一个序列,每个标准问题作为独立的单元不能再被分解,整合成平行空间模型能处理的数据,如下:
U1:[sq1,sq2,sq3,……];
U2:[sq1,sq3,sq5,……];
U3:[sq1,sq3,sq6,……]。
其中U1,U2,U3表示不同的用户,后面的一串表示的是客户问题对应的业务知识点序列。最终去掉第一列,变成下面的样子:
[sq1,sq2,sq3,……];
[sq1,sq3,sq5,……];
[sq1,sq3,sq6,……]。
这样数据就可以作为平行空间模型的输入了。就把这些数据作为平行空间模型的训练数据,假设平行空间模型维度设定为3维(该维度是可以自定义的,优先在100-150维),进行训练,完成后得到下面的输出:
sq1(0.3,-0.5,0.1);
sq2(0.1,0.4,0.2);
sq3(-0.3,0.7,0.8);
……
这样就得到了系统计算所需要的语义向量表示。
第三步:将用户特征抽取的数据(也就是第二步抽取的词向量)传入至模型决策系统,决策系统将数据通过模型计算,将最终的决策结果自动返回到微信公众号,呈现给用户。
其中,目前的决策系统大多采用分类算法,例如逻辑回归(LogisticRegression)。如图7所示(横轴为x,纵轴为y),给定(x,y),对于一个新的x,来预测y的值。这里的x可以是用户的相关信息,包括用户的年龄、手机入网时间、最近时间的移动端搜索记录等。y是系统的预测输出,可以是用户购买某种套餐的概率等。
这种方式的优点是实现简单、操作便捷。但是,由于其天生的线性分类属性,造成决策结果往往不是最优解。在客服系统这种高度强调用户满意度的线上系统中,用户的端的输入变量过多,这种模型并不尽如人意。
对此,本发明实施例提出了一种基于条件随机场+随机森林的决策方案。本发明实施例中把客服系统的个性化菜单生成部分当做一个代理Agent,由它负责处理与用户的交互过程,根据不同用户的特征,实时地生成个性化的对话菜单(也就是采用本发明实施例提供的决策模型来生成个性化的对话菜单)。
其中,决策树模型是一个一个特征进行处理,之前线性模型是所有特征给予权重相加得到一个新的值。决策树与逻辑回归的分类区别也在于此,逻辑回归是将所有特征变换为概率后,通过大于某一概率阈值的划分为一类,小于某一概率阈值的为另一类;而决策树是对每一个特征做一个划分。另外逻辑回归只能找到线性分割,而决策树可以找到非线性分割。
而树形模型更加接近人的思维方式,可以产生可视化的分类规则,产生的模型具有可解释性(可以抽取规则)。树模型拟合出来的函数其实是分区间的阶梯函数。尽管有剪枝等等方法,一棵树的生成肯定还是不如多棵树,因此就有了随机森林,解决决策树泛化能力弱的缺点。随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
本发明实施例提供的方案利用了条件随机场能方便地在模型中包含多种特征信息、具有表达元素长距离依赖性和交叠性特征的能力,以及利用随机森林能处理高维度的非线性数据、抗过拟合能力强的特点,充分融合用户动态轨迹和个性化特征,根据用户的实时选择,动态生成个性化生成对话列表,逐层递进完成对话。
本发明实施例中关于模型计算流程可如图8所示,包括:根据用户当前输入,得到输入轨迹,然后结合短期记忆(用户当前状态)和长期记忆(用户历史信息),进行个性化语义表示,最后进行模型计算。
三、回复内容优化模块
此模块主要功能为对于最终输出给用户的答案进行拼接和优化,对于不同显示终端的格式问题进行适配。例如,控制系统回复中指令的显示与否,控制选项之间的分隔符、换行符等;还可以根据需求,方便的控制最终答案(回复内容)的显示格式和显示顺序,灵活的调整。
由上可知,本发明实施例提供的方案可以与任何客服系统平台对接,将用户数据与智能客服紧密联系在一起;通过场景化建模的方式,可以提供个性化智能化的回复;并且系统具有自学习能力,随着系统和用户交互次数的增加以及大量用户查询数据的积累,系统会自动调节结构参数和回复策略(比如通过日志,形成数据闭环,模型逐步优化更新),提高系统回复的准确率。
也就是,本发明实施例提供了一种基于用户行为的动态自适应方法,把人机对话任务通过场景建模的方式拆分,根据用户的实时提问,及时捕捉用户的意图和问题轨迹;根据用户画像动态生成菜单对话列表,逐层递进引导用户完成对话任务。
本方案具有通用、简便、易于维护等优点;可以自适应交互式菜单:根据用户的实时选择与个人画像动态生成交互式菜单;可配置选项功能:支持阿拉伯数字、英文字母、数字+字母混合排编的选项配置;支持多层级:支持多节点、多支路的知识路径展示,支持顺序访问和跨级跳转功能;包含动态入口检测:支持多层级入口检测,场景激活条件丰富,交互层级编码实时动态生成。
综上,本方案采用一种基于用户行为的动态自适应方法,根据用户的实时提问,及时捕捉用户的意图和问题轨迹;根据用户画像动态生成菜单对话列表,逐层递进引导用户完成对话任务。本方案可使用k-means++进行数据场景挖掘聚类,使用Word2Vec+CRF(条件随机场)+Random Forest(随机森林)进行意图识别和对话列表生成,丰富用户的交互体。本方案可使用文本检索检索和自然语言处理等技术,及时捕捉用户的实时输入轨迹,根据用户的个性画像(长期特征)和问题历史(短期记忆),个性化生成对话列表,逐层递进引导用户。在用户问题边界不清楚的情况下,自适应的(依据用户习惯)根据用户的提问,逐层引导用户完成对话。
本方案中采用基于场景化建模的方式,基于动态轨迹与用户画像智能回复用户提问;基于场景化建模的方式,是一套完整的客服系统和方案,易于扩展和部署;基于场景化建模的方式,采用一种基于用户行为的动态自适应方法,根据用户的实时提问,及时捕捉用户的意图和问题轨迹;根据用户画像动态(个性化)生成菜单对话列表,逐层递进引导用户完成对话任务;很好的解决了现有技术中客服系统无法实现根据用户特征进行多轮交互的问题。
本发明实施例还提供了一种信息交互装置,如图9所示,包括:
第一获取模块91,用于获取用户的输入轨迹信息;
第一提取模块92,用于根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
第一处理模块93,用于根据所述语义特征,得到应答信息,并进行显示。
本发明实施例提供的所述信息交互装置通过获取用户的输入轨迹信息;根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;根据所述语义特征,得到应答信息,并进行显示;能够逐层对用户进行引导,收敛客户问题,精确定位用户需求,努力提高用户的使用体验和感知,实现根据用户特征进行多轮交互,很好的解决了现有技术中客服系统无法实现根据用户特征进行多轮交互的问题;并且本方案具有通用、简便、易于维护等优点;支持多节点、多支路的知识路径展示,支持顺序访问和跨级跳转功能;支持多层级入口检测,场景激活条件丰富,交互层级编码实时动态生成。
其中,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
具体的,所述第一提取模块,包括:第一提取子模块,用于利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
本发明实施例中,所述第一处理模块,包括:第一处理子模块,用于利用预设模型,根据所述语义特征,得到应答信息,并进行显示;其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
为了进一步满足不同用户的个性化需求,所述信息交互装置还包括:第一调整模块,用于对所述应答信息进行显示之前,根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
进一步的,所述信息交互装置还包括:第二获取模块,用于在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,根据交互信息,获取用户的特征信息;第二处理模块,用于根据所述交互信息和特征信息,形成所述历史记录信息。
其中,上述信息交互方法的所述实现实施例均适用于该信息交互装置的实施例中,也能达到相同的技术效果。
本发明实施例还提供了一种信息交互设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现上述的信息交互方法。
其中,上述信息交互方法的所述实现实施例均适用于该信息交互设备的实施例中,也能达到相同的技术效果。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的信息交互方法中的步骤。
其中,上述信息交互方法的所述实现实施例均适用于该计算机可读存储介质的实施例中,也能达到相同的技术效果。
需要说明的是,此说明书中所描述的许多功能部件都被称为模块/子模块,以便更加特别地强调其实现方式的独立性。
本发明实施例中,模块/子模块可以用软件实现,以便由各种类型的处理器执行。举例来说,一个标识的可执行代码模块可以包括计算机指令的一个或多个物理或者逻辑块,举例来说,其可以被构建为对象、过程或函数。尽管如此,所标识模块的可执行代码无需物理地位于一起,而是可以包括存储在不同位里上的不同的指令,当这些指令逻辑上结合在一起时,其构成模块并且实现该模块的规定目的。
实际上,可执行代码模块可以是单条指令或者是许多条指令,并且甚至可以分布在多个不同的代码段上,分布在不同程序当中,以及跨越多个存储器设备分布。同样地,操作数据可以在模块内被识别,并且可以依照任何适当的形式实现并且被组织在任何适当类型的数据结构内。所述操作数据可以作为单个数据集被收集,或者可以分布在不同位置上(包括在不同存储设备上),并且至少部分地可以仅作为电子信号存在于系统或网络上。
在模块可以利用软件实现时,考虑到现有硬件工艺的水平,所以可以以软件实现的模块,在不考虑成本的情况下,本领域技术人员都可以搭建对应的硬件电路来实现对应的功能,所述硬件电路包括常规的超大规模集成(VLSI)电路或者门阵列以及诸如逻辑芯片、晶体管之类的现有半导体或者是其它分立的元件。模块还可以用可编程硬件设备,诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等实现。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述原理前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (14)
1.一种信息交互方法,其特征在于,包括:
获取用户的输入轨迹信息;
根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
根据所述语义特征,得到应答信息,并进行显示。
2.根据权利要求1所述的信息交互方法,其特征在于,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
3.根据权利要求1所述的信息交互方法,其特征在于,所述根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征,包括:
利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
4.根据权利要求1所述的信息交互方法,其特征在于,所述根据所述语义特征,得到应答信息,并进行显示,包括:
利用预设模型,根据所述语义特征,得到应答信息,并进行显示;
其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
5.根据权利要求1所述的信息交互方法,其特征在于,对所述应答信息进行显示之前,还包括:
根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
6.根据权利要求1所述的信息交互方法,其特征在于,在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,还包括:
根据交互信息,获取用户的特征信息;
根据所述交互信息和特征信息,形成所述历史记录信息。
7.一种信息交互装置,其特征在于,包括:
第一获取模块,用于获取用户的输入轨迹信息;
第一提取模块,用于根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征;
第一处理模块,用于根据所述语义特征,得到应答信息,并进行显示。
8.根据权利要求7所述的信息交互装置,其特征在于,所述输入轨迹信息包括点选序列信息、输入方式信息和跳转记录信息中的至少一种。
9.根据权利要求7所述的信息交互装置,其特征在于,所述第一提取模块,包括:
第一提取子模块,用于利用语言模型Ngram或者词向量模型Word2vec,根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征。
10.根据权利要求7所述的信息交互装置,其特征在于,所述第一处理模块,包括:
第一处理子模块,用于利用预设模型,根据所述语义特征,得到应答信息,并进行显示;
其中,所述预设模型包括条件随机场模型和随机森林模型中的至少一种。
11.根据权利要求7所述的信息交互装置,其特征在于,还包括:
第一调整模块,用于对所述应答信息进行显示之前,根据所述输入轨迹信息和所述用户对应的历史记录信息,对所述应答信息的内容和/或格式进行调整。
12.根据权利要求7所述的信息交互装置,其特征在于,还包括:
第二获取模块,用于在根据所述输入轨迹信息和所述用户对应的历史记录信息,提取语义特征之前,根据交互信息,获取用户的特征信息;
第二处理模块,用于根据所述交互信息和特征信息,形成所述历史记录信息。
13.一种信息交互设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的信息交互方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的信息交互方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910001036.4A CN111460106A (zh) | 2019-01-02 | 2019-01-02 | 一种信息交互方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910001036.4A CN111460106A (zh) | 2019-01-02 | 2019-01-02 | 一种信息交互方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111460106A true CN111460106A (zh) | 2020-07-28 |
Family
ID=71679772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910001036.4A Pending CN111460106A (zh) | 2019-01-02 | 2019-01-02 | 一种信息交互方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111460106A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117114695A (zh) * | 2023-10-19 | 2023-11-24 | 本溪钢铁(集团)信息自动化有限责任公司 | 基于钢铁行业智能客服的交互方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202301A (zh) * | 2016-07-01 | 2016-12-07 | 武汉泰迪智慧科技有限公司 | 一种基于深度学习的智能应答系统 |
CN106297789A (zh) * | 2016-08-19 | 2017-01-04 | 北京光年无限科技有限公司 | 智能机器人的个性化交互方法及交互系统 |
CN107665706A (zh) * | 2016-07-29 | 2018-02-06 | 科大讯飞股份有限公司 | 快速语音交互方法及系统 |
-
2019
- 2019-01-02 CN CN201910001036.4A patent/CN111460106A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202301A (zh) * | 2016-07-01 | 2016-12-07 | 武汉泰迪智慧科技有限公司 | 一种基于深度学习的智能应答系统 |
CN107665706A (zh) * | 2016-07-29 | 2018-02-06 | 科大讯飞股份有限公司 | 快速语音交互方法及系统 |
CN106297789A (zh) * | 2016-08-19 | 2017-01-04 | 北京光年无限科技有限公司 | 智能机器人的个性化交互方法及交互系统 |
Non-Patent Citations (1)
Title |
---|
陈敏著: "《群体智能与大数据分析技术》", pages: 124 - 125 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117114695A (zh) * | 2023-10-19 | 2023-11-24 | 本溪钢铁(集团)信息自动化有限责任公司 | 基于钢铁行业智能客服的交互方法及装置 |
CN117114695B (zh) * | 2023-10-19 | 2024-01-26 | 本溪钢铁(集团)信息自动化有限责任公司 | 基于钢铁行业智能客服的交互方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110309283B (zh) | 一种智能问答的答案确定方法及装置 | |
Serban et al. | A deep reinforcement learning chatbot | |
US11645547B2 (en) | Human-machine interactive method and device based on artificial intelligence | |
WO2020147428A1 (zh) | 交互内容生成方法、装置、计算机设备及存储介质 | |
CN111428010B (zh) | 人机智能问答的方法和装置 | |
CN109829052A (zh) | 一种基于人机交互的开放式对话方法和系统 | |
CN112100354A (zh) | 人机对话方法、装置、设备及存储介质 | |
CN103970791B (zh) | 一种从视频库推荐视频的方法、装置 | |
CN111191450A (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
TWI734085B (zh) | 使用意圖偵測集成學習之對話系統及其方法 | |
CN113282737B (zh) | 人机协作的智能客服对话方法及装置 | |
CN116881428B (zh) | 一种语言模型训练方法及装置 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN111399629B (zh) | 一种终端设备的操作引导方法、终端设备及存储介质 | |
CN108345612A (zh) | 一种问题处理方法和装置、一种用于问题处理的装置 | |
CN113342948A (zh) | 一种智能问答方法及装置 | |
CN117056479A (zh) | 基于语义解析引擎的智能问答交互系统 | |
CN117909483B (zh) | 个性化对话方法、系统、设备及介质 | |
CN117453885A (zh) | 提问信息处理方法、装置、设备、存储介质及产品 | |
CN117524202A (zh) | 一种ip电话语音数据检索方法及系统 | |
CN112818096A (zh) | 对话生成方法及其装置 | |
CN117332062A (zh) | 一种数据处理方法和相关装置 | |
CN117131273A (zh) | 资源搜索方法、装置、计算机设备、介质及产品 | |
CN111460106A (zh) | 一种信息交互方法、装置及设备 | |
US20230297603A1 (en) | Cross-lingual meta-transfer learning adaptation to natural language understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200728 |