CN107506426A - 一种智能电视自动智能应答机器人的实现方法 - Google Patents
一种智能电视自动智能应答机器人的实现方法 Download PDFInfo
- Publication number
- CN107506426A CN107506426A CN201710711254.8A CN201710711254A CN107506426A CN 107506426 A CN107506426 A CN 107506426A CN 201710711254 A CN201710711254 A CN 201710711254A CN 107506426 A CN107506426 A CN 107506426A
- Authority
- CN
- China
- Prior art keywords
- user
- content
- implementation method
- intelligent television
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种智能电视自动智能应答机器人的实现方法,涉及人工智能技术领域。该方法包括获取用户的输入,并对历史信息和预回复内容进行匹配度计算,生成相似度矩阵。对用户输入进行特征词向量和语句级的CNN的相似度计算,生成相似度矩阵。把两个矩阵分别作为CNN的通道,利用Max‑Pooling进行特征抽象,形成匹配向量。利用CNN将用户输入的内容和之前产生的回复所计算出的匹配信息进一步融合。利用融合的匹配信息计算最终的匹配得分。将用户输入的信息结合上文历史信息使用TF‑IDF进行筛选,选出Top 5关键词。进行最后的检索,使用Top 5关键词在系统中进行检索,然后用CNN对候选结果打分从而得到回复的内容。最后将回复的内容返回给用户。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种智能电视自动智能应答机器人的实现方法。
背景技术
随着计算机、人工智能等技术领域的不断发展,使用计算机软件程序来代替人工进行文字或语音应答的需求越来越多,毕竟人会疲劳,需要一定的时间休息,而计算机软件程序可以24小时不间断地工作。而且使用计算机软件程序会大大降低业务运营的成本。对于老年人而言,智能电视属于新生事物,有些老年人对智能电视存在一定的抗拒,他们觉得很难学会智能电视的使用。还有一些用户,在使用智能电视时遇到困难,不知道该向谁求助,此时自动智能应答机器人软件程序就能派上用场了。
市面上现有的自动智能应答机器人程序本身尚未具有“智能”功能,或者是“智能”的程序非常低,只能根据用户的输入(包括语音或文字)按照一些既定的逻辑做出简单的回应,比如通过主要关键词索引关联固定的答案,应答机器人程序本身没有做到真正理解用户输入的内容,因此返回给用户的输出就存在着“答非所问”、“乱答一通”之类的情况。
发明内容
本发明的目的是为解决上述的技术问题,提供一种智能电视自动智能应答机器人的实现方法,可以让自动应答机器人具备较高的“智能”,真正方便了智能电视的用户,可以代替人工客服或咨询师,快速简单的服务于用户。
为了达到上述的技术效果,本发明采取以下技术方案:
第一步,获取用户的输入,并对之前的历史信息和预回复的内容进行匹配度计算,生成相似度矩阵A。
所述的获取用户的输入可以是用户通过手机或遥控器使用输入法输入的内容,也可以是用户手机或遥控器使用语音功能输入的内容。针对语音输入的内容,可以采用互联网开放语音识别服务解决方案,比如讯飞开放平台SDK、百度语音API、网易云信SDK等,实现将用户的语音输入转换成文字输出。
所述匹配度计算可以是解决普通模糊匹配冲突问题常用的方法,包括海明距离和指数法,以及基于指数法提出类指数法和绝对值差积法等。
第二步,对用户输入进行特征词汇向量和语句级别的卷积神经网络CNN的相似度计算,生成相似度矩阵B。卷积神经网络即ConvolutionalNeural Network,简称CNN。
所述相似度计算可以是采用最长公共子序列及最长公共子串的方法,也可以是采用余弦相似度算法,以及杰卡德距离(Jaccard Distance)、Simhash算法等方法。
第三步,把A、B两个矩阵分别作为卷积神经网络CNN的一个通道,利用卷积神经网络的最大池化(Max-Pooling)进行特征抽象,形成一个匹配向量。
第四步,利用卷积神经网络CNN将用户输入的内容和根据历史相似问题的回复所计算出的匹配信息进一步融合,得到融合的匹配信息。
第五步,利用第四步融合的匹配信息计算最终的匹配得分。
第六步,将用户输入的信息结合上下文历史信息使用TF-IDF进行筛选,选出五个关键词。
第七步,进行最后的检索,使用第六步产生的五个关键词在系统中进行检索,然后用卷积神经网络对候选结果打分从而得到回复的内容。
第八步,将第七步得到的回复内容返回给用户。
与现有技术相比,本发明的有益效果是,在实际的应用中,基于本发明的智能应答机器人的智能化程度更高,用户的满意度有提升,对互联网业务的发展有较大的促进作用。
附图说明
图1是一种智能电视自动智能应答机器人的实现方法的流程示意图。
具体实施方式
下面结合本发明的实施例对本发明作进一步的阐述和说明。
实施例:
如图1所示,为本发明实施例提供的一种智能电视自动智能应答机器人的实现方法的流程示意图,该方法主要包括以下步骤:
步骤101,获取用户的输入信息,并对之前的历史信息和预回复的内容进行匹配度计算,生成相似度矩阵A。
所述获取用户的输入信息可以是用户通过手机或遥控器使用输入法输入的内容,也可以是用户手机或遥控器使用语音功能输入的内容。针对语音输入的内容,可以采用互联网开放语音识别服务解决方案,比如讯飞开放平台SDK、百度语音API、网易云信SDK等,实现将用户的语音输入转换成文字输出。
所述匹配度计算可以是解决普通模糊匹配冲突问题常用的方法,包括海明距离和指数法,以及基于指数法提出类指数法和绝对值差积法等。
步骤102,对用户输入进行特征词汇向量和语句级别的卷积神经网络CNN的相似度计算,生成相似度矩阵B。卷积神经网络即ConvolutionalNeural Network,简称CNN。
所述相似度计算可以是采用最长公共子序列及最长公共子串的方法,也可以是采用余弦相似度算法,以及杰卡德距离(Jaccard Distance)、Simhash算法等方法。
步骤103,把相似度矩阵A、相似度矩阵B两个矩阵分别作为卷积神经网络CNN的一个通道,利用卷积神经网络的最大池化(Max-Pooling)进行特征抽象,形成一个匹配向量。
神经认知机中包含两类神经元,用来抽取特征的S-cells,还有用来抗形变的C-cells,其中S-cells对应现在主流卷积神经网络中的卷积核滤波操作,而C-cells则对应激活函数、最大池化(Max-Pooling)等操作。通过进行多层的训练进行特征抽象,从而形成一个匹配向量。
步骤104,利用卷积神经网络CNN将用户输入的内容和根据历史相似问题的回复所计算出的匹配信息进一步融合,得到融合的匹配信息。
步骤105,利用步骤104融合的匹配信息计算最终的匹配得分。
在预测时可以使用三种策略,分别是使用卷积神经网络的隐藏层SMN_last,或只使用卷积神经网络的静态加权隐藏层SMN_static,或使用卷积神经网络的动态加权隐藏层SMN_dynamic。
步骤106,将用户输入的信息结合上下文历史信息使用TF-IDF进行筛选,选出五个关键词。
TF-IDF算法可以计算出一个词在一篇文章中的重要程度。这个表示重要程度的数值由两部分相乘而得到。TF,词频,与这个词在当前文章中出现的频率成正比。IDF,逆文档频率,与这个词在文本集中出现的次数成反比。TF与IDF的乘积越大,表示这个词更能体现出内容的主题。
步骤107,进行最后的检索,使用步骤106产生的五个关键词在系统中进行检索,然后用卷积神经网络对候选结果打分从而得到回复的内容。
步骤108,将步骤107得到的回复内容,即产生的输出返回给用户。
本发明提供的方法对于企业或公司在开展互联网业务方面有较大的促进作用,而且通过用计算机软件来代替人工客服,有效地节省了大量的人力资源,可以很好地降低业务运营的成本。在专利实际的实施过程中可以发现,相比于传统的基于关键词索引关联固定答案的解决方案,本实施例的机器客服回答的准确率能提升30%左右,运营成本的降低也很可观。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (5)
1.一种智能电视自动智能应答机器人的实现方法,其步骤依次为:
步骤一:获取用户的输入,并对之前的历史信息和预回复的内容进行匹配度计算,生成相似度矩阵A;
步骤二:对用户的输入进行特征词汇向量和语句级别的卷积神经网络的相似度计算,生成相似度矩阵B;
步骤三:把相似度矩阵A、相似度矩阵B分别作为卷积神经网络的一个通道,利用卷积神经网络的最大池化进行特征抽象,形成一个匹配向量;
步骤四:利用卷积神经网络将用户输入的内容和根据历史相似问题的回复所计算出的匹配信息进一步融合,得到融合的匹配信息;
步骤五:利用步骤四融合的匹配信息计算最终的匹配得分;
步骤六:将用户输入的内容结合上下文历史信息使用TF-IDF进行筛选,选出五个关键词;
步骤七:进行最后的检索,使用第六步产生的五个关键词在系统中进行检索,然后用卷积神经网络对候选结果打分从而得到回复的内容;
步骤八:将步骤七得到的回复内容返回给用户。
2.根据权利要求1所述的一种智能电视自动智能应答机器人的实现方法,其特征在于:所述获取用户的输入是用户通过手机或遥控器使用输入法输入的内容,或用户手机或遥控器使用语音功能输入的内容。
3.根据权利要求2所述的一种智能电视自动智能应答机器人的实现方法,其特征在于:所述语音功能输入的内容,采用互联网开放语音识别服务解决方案,实现将用户的语音输入转换成文字输出。
4.根据权利要求1所述的一种智能电视自动智能应答机器人的实现方法,其特征在于:所述匹配度计算是采用解决普通模糊匹配冲突问题常用方法进行 计算,包括海明距离和指数法,以及基于指数法提出类指数法和绝对值差积法。
5.根据权利要求1所述的一种智能电视自动智能应答机器人的实现方法,其特征在于:所述步骤二中的相似度计算是采用最长公共子序列及最长公共子串的方法,或采用余弦相似度算法,或杰卡德距离算法,或Simhash算法进行计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710711254.8A CN107506426A (zh) | 2017-08-18 | 2017-08-18 | 一种智能电视自动智能应答机器人的实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710711254.8A CN107506426A (zh) | 2017-08-18 | 2017-08-18 | 一种智能电视自动智能应答机器人的实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107506426A true CN107506426A (zh) | 2017-12-22 |
Family
ID=60692003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710711254.8A Pending CN107506426A (zh) | 2017-08-18 | 2017-08-18 | 一种智能电视自动智能应答机器人的实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506426A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573045A (zh) * | 2018-04-18 | 2018-09-25 | 同方知网数字出版技术股份有限公司 | 一种基于多阶指纹的比对矩阵相似度检索方法 |
CN108959588A (zh) * | 2018-07-10 | 2018-12-07 | 四川淘金你我信息技术有限公司 | 基于大数据的文本客服机器人智能学习方法 |
CN109547320A (zh) * | 2018-09-29 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 社交方法、装置及设备 |
CN110033023A (zh) * | 2019-03-11 | 2019-07-19 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN111259668A (zh) * | 2020-05-07 | 2020-06-09 | 腾讯科技(深圳)有限公司 | 阅读任务处理方法、模型训练方法、装置和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160162779A1 (en) * | 2014-12-05 | 2016-06-09 | RealMatch, Inc. | Device, system and method for generating a predictive model by machine learning |
CN106649696A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 信息分类方法及装置 |
CN106919951A (zh) * | 2017-01-24 | 2017-07-04 | 杭州电子科技大学 | 一种基于点击与视觉融合的弱监督双线性深度学习方法 |
CN106856092B (zh) * | 2015-12-09 | 2019-11-15 | 中国科学院声学研究所 | 基于前向神经网络语言模型的汉语语音关键词检索方法 |
-
2017
- 2017-08-18 CN CN201710711254.8A patent/CN107506426A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160162779A1 (en) * | 2014-12-05 | 2016-06-09 | RealMatch, Inc. | Device, system and method for generating a predictive model by machine learning |
CN106856092B (zh) * | 2015-12-09 | 2019-11-15 | 中国科学院声学研究所 | 基于前向神经网络语言模型的汉语语音关键词检索方法 |
CN106649696A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 信息分类方法及装置 |
CN106919951A (zh) * | 2017-01-24 | 2017-07-04 | 杭州电子科技大学 | 一种基于点击与视觉融合的弱监督双线性深度学习方法 |
Non-Patent Citations (2)
Title |
---|
李超: "智能疾病导诊及医疗问答方法研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
邢超: "智能问答系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573045A (zh) * | 2018-04-18 | 2018-09-25 | 同方知网数字出版技术股份有限公司 | 一种基于多阶指纹的比对矩阵相似度检索方法 |
CN108573045B (zh) * | 2018-04-18 | 2021-12-24 | 同方知网数字出版技术股份有限公司 | 一种基于多阶指纹的比对矩阵相似度检索方法 |
CN108959588A (zh) * | 2018-07-10 | 2018-12-07 | 四川淘金你我信息技术有限公司 | 基于大数据的文本客服机器人智能学习方法 |
CN108959588B (zh) * | 2018-07-10 | 2021-10-08 | 四川淘金你我信息技术有限公司 | 基于大数据的文本客服机器人智能学习方法 |
CN109547320A (zh) * | 2018-09-29 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 社交方法、装置及设备 |
CN110033023A (zh) * | 2019-03-11 | 2019-07-19 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN110033023B (zh) * | 2019-03-11 | 2021-06-15 | 北京光年无限科技有限公司 | 一种基于绘本识别的图像数据处理方法及系统 |
CN111259668A (zh) * | 2020-05-07 | 2020-06-09 | 腾讯科技(深圳)有限公司 | 阅读任务处理方法、模型训练方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506426A (zh) | 一种智能电视自动智能应答机器人的实现方法 | |
CN108537624B (zh) | 一种基于深度学习的旅游服务推荐方法 | |
US10264081B2 (en) | Contextual people recommendations | |
CN104615767B (zh) | 搜索排序模型的训练方法、搜索处理方法及装置 | |
CN109145112A (zh) | 一种基于全局信息注意力机制的商品评论分类方法 | |
CN111078844A (zh) | 软件众包的任务型对话系统及方法 | |
CN111159395A (zh) | 基于图神经网络的谣言立场检测方法、装置和电子设备 | |
CN112231584B (zh) | 基于小样本迁移学习的数据推送方法、装置及计算机设备 | |
CN110795542A (zh) | 对话方法及相关装置、设备 | |
CN111428127B (zh) | 融合主题匹配与双向偏好的个性化事件推荐方法及系统 | |
CN111709223B (zh) | 基于bert的句子向量生成方法、装置及电子设备 | |
CN113204618A (zh) | 基于语义增强的信息识别方法、装置、设备及存储介质 | |
CN110597968A (zh) | 一种回复选择方法及装置 | |
CN114693397A (zh) | 一种基于注意力神经网络的多视角多模态商品推荐方法 | |
TW201814556A (zh) | 資訊匹配方法及相關裝置 | |
CN113886531B (zh) | 智能问答话术确定方法、装置、计算机设备和存储介质 | |
CN112256856B (zh) | 机器人对话方法、装置、电子设备及存储介质 | |
CN108595609A (zh) | 基于人物ip的机器人回复生成方法、系统、介质及设备 | |
CN111666400A (zh) | 消息获取方法、装置、计算机设备及存储介质 | |
CN108632137A (zh) | 应答模型训练方法、智能聊天方法、装置、设备及介质 | |
CN114168819B (zh) | 一种基于图神经网络的岗位匹配方法及装置 | |
CN110263232B (zh) | 一种基于广度学习和深度学习的混合推荐方法 | |
CN110502701B (zh) | 引入注意力机制的好友推荐方法、系统和存储介质 | |
CN110069613A (zh) | 一种回复获取方法及装置 | |
CN114265921A (zh) | 问答知识库构建方法及其装置、设备、介质、产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171222 |
|
RJ01 | Rejection of invention patent application after publication |