CN105243143B - 基于即时语音内容检测的推荐方法及系统 - Google Patents

基于即时语音内容检测的推荐方法及系统 Download PDF

Info

Publication number
CN105243143B
CN105243143B CN201510662383.3A CN201510662383A CN105243143B CN 105243143 B CN105243143 B CN 105243143B CN 201510662383 A CN201510662383 A CN 201510662383A CN 105243143 B CN105243143 B CN 105243143B
Authority
CN
China
Prior art keywords
user
model
article
word
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510662383.3A
Other languages
English (en)
Other versions
CN105243143A (zh
Inventor
赵欢
张希翔
谭彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201510662383.3A priority Critical patent/CN105243143B/zh
Publication of CN105243143A publication Critical patent/CN105243143A/zh
Application granted granted Critical
Publication of CN105243143B publication Critical patent/CN105243143B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于即时语音内容检测的推荐方法及系统,方法包括:采集用户的语音信息;转换成文本内容并索引得到索引库;检索推荐物品词典得到即时语音关键词;计算用户兴趣模型;计算用户兴趣模型与预设的各物品模型之间的相似度;生成推荐物品信息库中的候选物品集,选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户;系统包括方法对应的语音采集模块、语音内容分析模块、语音关键词检索模块、用户兴趣推断模块、物品模型相似度计算模块和列表推送模块。本发明能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性,推荐物品的针对性强且准确性高、用户的使用体验好。

Description

基于即时语音内容检测的推荐方法及系统
技术领域
本发明涉及信息推荐系统,具体涉及一种基于即时语音内容检测的推荐方法及系统。
背景技术
推荐系统是一种特殊形式的信息过滤系统,推荐系统在与用户的交互过程中会主动记录用户的历史兴趣信息,对用户的信息需求进行建模,形成关于用户兴趣和偏好的知识模型,并依据该模型实现最终的信息推荐服务。随着大数据多样化的趋势下,在用户即时聊天、观看在线流媒体的过程中,仅利用传统的用户关联、用户行为及反馈、文本知识抽取等方法去挖掘信息,难以使推荐系统关联到用户实时语音聊天内容、观看的影视局台词等语音相关信息上,而用户的聊天内容、观看的影视剧语音台词等语音信息恰恰与用户当前兴趣和将来的购买需求有着极其紧密的联系。现阶段针对语音的推荐系统研究较少,且只是把语音当作推荐系统的用户界面,把原需要鼠标键盘操作的步骤以语音代替而已。因此,面向即时语音检测的推荐模型和方法地推荐最适合用户的产品,以达到使得用户能够更便捷地找寻所需商品的目的,从而大大改善用户的使用体验,具有重要的实用意义和商业价值。
目前的推荐系统普遍是基于文本内容检测,而语音处理技术往往用于各个系统的人机交互界面,即使用语音识别输入替换原先通过键盘或其他设备的输入形式。中国专利申请号为201310740533.9的专利文献公开了一种基于混淆网络的语音中检测关键词的方法,但并没有将这种语音关键词检测方法与推荐方法相结合。中国专利申请号为201410668170.7的专利文献公开了一种可利用用户输入语音信息的推荐系统,将目标用户输入的语音信息通过语音识别转换为对应文本信息,进而进行后继查询及推荐处理,但该推荐方法及系统主要把语音输入当作人机交互界面,并不是对特定应用场景下的语音内容进行相关检测。中国专利申请号为201310446815.8的专利文献公开了一种个性化视频内容推荐方法和系统,通过提取用户观看视频中的演员语音声纹特征,进而寻找声纹匹配相似的其他兴趣演员,启发性地引导和推荐用户到感兴趣的其他视频上,该方法主要是通过检测用户所观看视频中语音声纹特征,并没有对这些语音的内容进行相关检测。因此,如何基于即时语音内容检测来实现内容推荐,已经成为一项亟待解决的技术问题。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性,推荐物品的针对性强且准确性高、用户的使用体验好的基于即时语音内容检测的推荐方法及系统。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于即时语音内容检测的推荐方法,步骤包括:
1)采集用户的语音信息;
2)将语音信息转换成文本内容进行索引得到索引库;
3)根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
4)根据即时语音关键词及用户历史行为数据计算用户兴趣模型;
5)计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
6)根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户。
优选地,所述步骤2)的详细步骤包括:
2.1)将语音信息转换成文本内容并生成词图;
2.2)将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;
2.3)对采用混淆网络方法优化后的词图进行索引标注得到索引库,所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
优选地,所述步骤3)的详细步骤包括:
3.1)采用预设的词项搜索算法,根据所述索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;
3.2)针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
优选地,所述步骤3.2)的详细步骤包括:
3.2.1)预先获取多组步骤3.1)得到的搜索结果列表样本,将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的,把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型,完成机器学习分类模型的训练;
3.2.2)将所述词项的搜索结果列表输入机器学习分类模型,通过机器学习分类模型对搜索结果列表进行重排序,得到重排序后的推荐物品词典中的即时语音关键词。
优选地,所述步骤4)的详细步骤包括:
4.1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示;
uri={w1i,w2i,…,wni},wki∈[0,1] (1)
式(1)中,uri为用户即时兴趣模型,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,且即时兴趣权重wki设置为归一化的词频-逆文档频率TF-IDF;
4.2)根据用户历史行为数据建立用户长期兴趣模型如式(2)所示;
uli={w1i,w2i,…,wni},wki∈[0,1] (2)
式(2)中,uli为用户长期兴趣模型,wki为语音检测窗W内语音关键词中第k个词典主题词tk的长期兴趣权重,长期兴趣权重wki的计算函数表达式如式(3)所示;
式(3)中,Hitik为用户历史行为数据中用户ui对涉及第k个词典主题词tk的点击次数,Hitsumi为用户历史行为数据中用户ui的所有点击数。
4.3)将所述用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算,得到用户兴趣模型。
优选地,所述步骤4.3)中采用的融合算法如式(4)所示;
式(4)中,ui为用户兴趣模型,uri为用户即时兴趣模型,wr为用户即时兴趣模型的权重,uli为用户长期兴趣模型,wl为用户长期兴趣模型的权重。
优选地,所述步骤5)中计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示;
式(5)中,sim(ui,Il)为用户的用户兴趣模型ui与预设的推荐物品信息库中某一个物品的模型Il之间的相似度,wji为用户兴趣模型ui中第j个主题词tj的权重,wjl为预设的推荐物品信息库中某一个物品的模型Il中第j个主题词tj的权重,物品的模型Il如式(6)所示;
Il={w1l,w2l,…,wnl},wkl∈[0,1] (6)
式(6)中,Il为预设的推荐物品信息库中第l个物品的带权向量空间模型,wkl是预设的推荐物品信息库中第l个物品Il中第k个主题词tk的权重,且第k个主题词tk的权重wki设置为归一化的词频-逆文档频率TF-IDF。
本发明还提供一种基于即时语音内容检测的推荐系统,包括:
语音采集模块,用于采集用户的语音信息;
语音内容分析模块,用于将语音信息转换成文本内容进行索引得到索引库;
语音关键词检索模块,用于根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
用户兴趣推断模块,用于根据即时语音关键词计算用户兴趣模型;
物品模型相似度计算模块,用于计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
列表推送模块,用于根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户。
优选地,所述语音内容分析模块包括:
语音关键词转录子模块,用于将语音信息转换成文本内容并生成词图;
词图优化子模块,用于将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;
词图索引子模块,用于对采用混淆网络方法优化后的词图进行索引标注得到索引库,所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
优选地,所述语音关键词检索模块包括:
词项搜索子模块,用于采用预设的词项搜索算法,根据所述索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;
搜索结果重排序子模块,用于针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
本发明基于即时语音内容检测的推荐方法具有下述优点:本发明提供采集用户的语音信息,将语音信息转换成文本内容进行索引得到索引库,根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词,根据即时语音关键词及用户历史行为数据计算用户兴趣模型,计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度,根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户,能够充分挖掘用户在语音聊天通讯软件、观看在线流媒体影视剧等场景下的语音信息,捕获用户在听说渠道下反应出的兴趣关注点,并结合用户的历史兴趣模型,进而推荐满足用户兴趣的商品及其他信息,能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性,具有推荐物品的针对性强且准确性高、用户的使用体验好的优点。
本发明基于即时语音内容检测的推荐系统具有下述优点:本发明基于即时语音内容检测的推荐系统为本发明基于即时语音内容检测的推荐方法完全对应的系统,因此同样也具有本发明基于即时语音内容检测的推荐方法的前述优点,在此不再赘述。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例方法步骤2)的基本原理示意图。
图3为本发明实施例方法步骤3)的基本原理示意图。
图4为本发明实施例方法步骤4)的基本原理示意图。
具体实施方式
如图1所示,本实施例基于即时语音内容检测的推荐方法的详细步骤包括:
1)采集用户的语音信息;
2)将语音信息转换成文本内容进行索引得到索引库;
3)根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
4)根据即时语音关键词及用户历史行为数据计算用户兴趣模型;
5)计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
6)根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户。
本实施例中,步骤1)采集用户的语音信息时,具体是指监听检测目标用户当前在影音播放器、在线流媒体播放平台或即时语音通讯软件等应用下的实时语音信息,将捕获到音频卡的数据流导入系统进行处理。
如图2所示,步骤2)的详细步骤包括:
2.1)将语音信息转换成文本内容并生成词图(Lattice);词图结构是一种有向无环图,节点代表时间,每条弧代表一个时间片内一个语音识别的候选结果,并伴随这个将语音信息转换成文本得到的STT候选结果的声学模型、语言学模型评分;在词图结构中,每个链接弧表示了一个词(也可使用音节、音素),该词在词名、起始时间、结束时间或是前置词三个方面至少有一个方面与其它链接弧不同;
2.2)将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;上述优化只保留评判分较高的大多数弧,节点数和路径数大幅减少,减少了存储空间;正确的候选词可能不在一条路径中,而转换成混淆网络之后,原来不在一条路径上的候选也可以有偏序关系,从而提高了搜索效率;
2.3)对采用混淆网络方法优化后的词图进行索引标注得到索引库,索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。语音关键词检测就是要在有词图索引结构中找到匹配特定内容的局部路径并对该局部路径进行置信测度,每一个匹配的局部路径都是一个潜在的可能结果,利用后验概率值作为置信测度可以对这种可能性的大小进行度量。
如图3所示,步骤3)的详细步骤包括:
3.1)采用预设的词项搜索算法,根据索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;语音关键词检测系统的搜索词项可以分为三种:(1)由推荐物品词典中的单个词构成的词项。(2)由推荐物品词典中的多个词构成的词项。(3)至少包含一个推荐物品词典以外的词的词项。前两种词项为词表内(In Vocabulary,IV)词,第三种词项为词表外(Out-Of Vocabulary,OOV)词。基于词图创建索引,对于第一种词项,只需检索词项的每个节点。对于第二种词项,则需要在词图中寻找一条能与查询词项相匹配的局部路径。对于第三种词项,需要采用不同的检测逻辑,例如可以构建音素索引库,将查询词项表示成音素序列,在音素中查找匹配表示查询词项音素序列的局部路径。语音关键词检测的候选决策阶段是对检测到的关键词的正确与否做出判断的阶段,它舍弃可能性较小的检测结果,保留可能性较大的检测结果;
3.2)针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
本实施例中,步骤3.2)的详细步骤包括:
3.2.1)预先获取多组步骤3.1)得到的搜索结果列表样本,将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的,把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型,完成机器学习分类模型的训练;
3.2.2)将词项的搜索结果列表输入机器学习分类模型,通过机器学习分类模型对搜索结果列表进行重排序,得到重排序后的推荐物品词典中的即时语音关键词。
本实施例步骤3.2.1)、3.2.2)是利用伪相关反馈的二次检索进行结果重排序,能够提高返回推荐词项列表的准确性。伪相关反馈的二次检索基本思路是得到词图的第一次检索结果后,假设得分排在前面的N个结果是相关的,而得分排在倒数的最后N个结果是不相关的。把这些分别作为正面和负面的例子用来训练具体查询的机器学习分类方法,并将训练后的机器学习分类方法用于初步检索的重排序。机器学习分类模型可根据需要采用支持向量机、多层感知等机器学习方法等模型,支持向量机、多层感知等机器学习方法的高区分能力优势可在二次检索中有效提升语音关键词检测性能。
如图4所示,步骤4)的详细步骤包括:
4.1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示;本实施例中,语音检测窗W设置为300s;
uri={w1i,w2i,…,wni},wki∈[0,1] (1)
式(1)中,uri为用户即时兴趣模型,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,且即时兴趣权重wki设置为归一化的词频-逆文档频率TF-IDF;用户即时兴趣模型uri={w1i,w2i,…,wni},wki∈[0,1],检测窗时间内的语音内容即是目标用户及时兴趣关注内容;归一化的词频-逆文档频率TF-IDF的表达式如式(1-1)所示;
式(1-1)中,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,N表示推荐物品Il的描述文档dl的个数,nk表示含有主题词项tk至少一次的描述文档集合的数量;fk表示当前检测窗内主题词项tk的出现频率,maxz fk表示语音检测窗内所有单词tz的频率最大值。
4.2)根据用户历史行为数据建立用户长期兴趣模型如式(2)所示;
uli={w1i,w2i,…,wni},wki∈[0,1] (2)
式(2)中,uli为用户长期兴趣模型,wki为语音检测窗W内语音关键词中第k个词典主题词tk的长期兴趣权重,长期兴趣权重wki的计算函数表达式如式(3)所示;
式(3)中,Hitik为用户历史行为数据中用户ui对语音检测窗W内语音关键词中第k个词典主题词tk的点击次数,Hitsumi为用户历史行为数据中用户ui的所有点击数,如用户ui对推荐物品Il进行了点击,则物品Il关联的所有词典主题词tk点击次数加1。影响用户兴趣的不仅由当前检测到的语音内容决定,还由用户长期的兴趣习惯决定,本实施例中主要考虑用户对推荐广告的历史点击记录。
4.3)将用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算,得到用户兴趣模型。
本实施例中,步骤4.3)中采用的融合算法如式(4)所示;
式(4)中,ui为用户兴趣模型,uri为用户即时兴趣模型,wr为用户即时兴趣模型的权重,uli为用户长期兴趣模型,wl为用户长期兴趣模型的权重。本实施例中,用户即时兴趣模型的权重wr取值为0.7,用户长期兴趣模型的权重wl取值为0.3。
本实施例中,步骤5)中计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示;本实施例中以式(5)所示余弦距离来表示用户兴趣与一项推荐物品的相关度,当相关度越靠近1时,则该推荐物品与当前语音场景下用户兴趣取向越相关;相关度越接近0,则该推荐物品与当前语音场景下用户兴趣取向关联越小。对各个推荐物品的相关度大小进行排列,确定候选推荐物品集合,从候选物品集中选取出若干物品推荐给目标用户;
式(5)中,sim(ui,Il)为用户的用户兴趣模型ui与预设的推荐物品信息库中某一个物品的模型Il之间的相似度,wji为用户兴趣模型ui中第j个主题词tj的权重,wjl为预设的推荐物品信息库中某一个物品的模型Il中第j个主题词tj的权重,物品的模型Il如式(6)所示;
Il={w1l,w2l,…,wnl},wkl∈[0,1] (6)
式(6)中,Il为预设的推荐物品信息库中第l个物品的带权向量空间模型,wkl是预设的推荐物品信息库中第l个物品Il中第k个主题词tk的权重,且第k个主题词tk的权重wki设置为归一化的词频-逆文档频率TF-IDF。为推荐物品库中每件物品建立向量空间描述模型Il,每个推荐物品均有与之对应的描述文档dl,Il可结合词典和TF-IDF方法从该推荐物品描述文档dl中计算得出。Il={w1l,w2l,…,wnl},wkl∈[0,1],wkl是推荐物品Il中各个主题词tk的权重,权重wkl设置为归一化的TF-IDF,其表达式如式(6-1)所示。
式(6-1)中,wkl是推荐物品Il中各个主题词tk的权重,N表示推荐物品描述文档dl的个数,nk表示含有主题词项tk至少一次的描述文档集合的数量;fk表示推荐物品描述文档dl主题词项tk的出现频率,maxz fk,l表示描述文档dl中所有单词tz的频率最大值。
与本实施例本实施例基于即时语音内容检测的推荐方法完全对应的推荐系统包括:
语音采集模块,用于采集用户的语音信息;
语音内容分析模块,用于将语音信息转换成文本内容进行索引得到索引库;
语音关键词检索模块,用于根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
用户兴趣推断模块,用于根据即时语音关键词计算用户兴趣模型;
物品模型相似度计算模块,用于计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
列表推送模块,用于根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户。
优选地,语音内容分析模块包括:
语音关键词转录子模块,用于将语音信息转换成文本内容并生成词图;
词图优化子模块,用于将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;
词图索引子模块,用于对采用混淆网络方法优化后的词图进行索引标注得到索引库,索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
优选地,语音关键词检索模块包括:
词项搜索子模块,用于采用预设的词项搜索算法,根据索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;
搜索结果重排序子模块,用于针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
本实施例中,搜索结果重排序子模块包括:
机器学习分类模型训练二级子模块,用于预先获取多组步骤3.1)得到的搜索结果列表样本,将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的,把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型,完成机器学习分类模型的训练;
机器学习分类二级子模块,用于将词项的搜索结果列表输入机器学习分类模型,通过机器学习分类模型对搜索结果列表进行重排序,得到重排序后的推荐物品词典中的即时语音关键词。
本实施例中,用户兴趣推断模块包括:
用户即时兴趣模型建模子模块,用于根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示;
uri={w1i,w2i,…,wni},wki∈[0,1] (1)
式(1)中,uri为用户即时兴趣模型,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,且即时兴趣权重wki设置为归一化的词频-逆文档频率TF-IDF;
用户长期兴趣模型建模子模块,用于根据用户历史行为数据建立用户长期兴趣模型如式(2)所示;
uli={w1i,w2i,…,wni},wki∈[0,1] (2)
式(2)中,uli为用户长期兴趣模型,wki为语音检测窗W内语音关键词中第k个词典主题词tk的长期兴趣权重,长期兴趣权重wki的计算函数表达式如式(3)所示;
式(3)中,Hitik为用户历史行为数据中用户ui对涉及第k个词典主题词tk的点击次数,Hitsumi为用户历史行为数据中用户ui的所有点击数。
模型融合子模块,用于将用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算,得到用户兴趣模型。
本实施例中,模型融合子模块采用的融合算法如式(4)所示;
式(4)中,ui为用户兴趣模型,uri为用户即时兴趣模型,wr为用户即时兴趣模型的权重,uli为用户长期兴趣模型,wl为用户长期兴趣模型的权重。
本实施例中,物品模型相似度计算模块计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示;
式(5)中,sim(ui,Il)为用户的用户兴趣模型ui与预设的推荐物品信息库中某一个物品的模型Il之间的相似度,wji为用户兴趣模型ui中第j个主题词tj的权重,wjl为预设的推荐物品信息库中某一个物品的模型Il中第j个主题词tj的权重,物品的模型Il如式(6)所示;
Il={w1l,w2l,…,wnl},wkl∈[0,1] (6)
式(6)中,Il为预设的推荐物品信息库中第l个物品的带权向量空间模型,wkl是预设的推荐物品信息库中第l个物品Il中第k个主题词tk的权重,且第k个主题词tk的权重wki设置为归一化的词频-逆文档频率TF-IDF。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于即时语音内容检测的推荐方法,其特征在于步骤包括:
1)采集用户的语音信息;
2)将语音信息转换成文本内容进行索引得到索引库;
3)根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
4)根据即时语音关键词及用户历史行为数据计算用户兴趣模型;
5)计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
6)根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户;
所述步骤4)的详细步骤包括:
4.1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示;
uri={w1i,w2i,…,wni},wki∈[0,1] (1)
式(1)中,uri为用户即时兴趣模型,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,且即时兴趣权重wki设置为归一化的词频-逆文档频率TF-IDF;
4.2)根据用户历史行为数据建立用户长期兴趣模型如式(2)所示;
uli={w1i,w2i,…,wni},wki∈[0,1] (2)
式(2)中,uli为用户长期兴趣模型,wki为语音检测窗W内语音关键词中第k个词典主题词tk的长期兴趣权重,长期兴趣权重wki的计算函数表达式如式(3)所示;
式(3)中,Hitik为用户历史行为数据中用户ui对涉及第k个词典主题词tk的点击次数,Hitsumi为用户历史行为数据中用户ui的所有点击数;
4.3)将所述用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算,得到用户兴趣模型。
2.根据权利要求1所述的基于即时语音内容检测的推荐方法,其特征在于,所述步骤2)的详细步骤包括:
2.1)将语音信息转换成文本内容并生成词图;
2.2)将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;
2.3)对采用混淆网络方法优化后的词图进行索引标注得到索引库,所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
3.根据权利要求2所述的基于即时语音内容检测的推荐方法,其特征在于,所述步骤3)的详细步骤包括:
3.1)采用预设的词项搜索算法,根据所述索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;
3.2)针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
4.根据权利要求3所述的基于即时语音内容检测的推荐方法,其特征在于,所述步骤3.2)的详细步骤包括:
3.2.1)预先获取多组步骤3.1)得到的搜索结果列表样本,将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的,把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型,完成机器学习分类模型的训练;
3.2.2)将所述词项的搜索结果列表输入机器学习分类模型,通过机器学习分类模型对搜索结果列表进行重排序,得到重排序后的推荐物品词典中的即时语音关键词。
5.根据权利要求1所述的基于即时语音内容检测的推荐方法,其特征在于,所述步骤4.3)中采用的融合算法如式(4)所示;
式(4)中,ui为用户兴趣模型,uri为用户即时兴趣模型,wr为用户即时兴趣模型的权重,uli为用户长期兴趣模型,wl为用户长期兴趣模型的权重。
6.根据权利要求5所述的基于即时语音内容检测的推荐方法,其特征在于,所述步骤5)中计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示;
式(5)中,sim(ui,Il)为用户的用户兴趣模型ui与预设的推荐物品信息库中某一个物品的模型Il之间的相似度,wji为用户兴趣模型ui中第j个主题词tj的权重,wjl为预设的推荐物品信息库中某一个物品的模型Il中第j个主题词tj的权重,物品的模型Il如式(6)所示;
Il={w1l,w2l,…,wnl},wkl∈[0,1] (6)
式(6)中,Il为预设的推荐物品信息库中第l个物品的带权向量空间模型,wkl是预设的推荐物品信息库中第l个物品Il中第k个主题词tk的权重,且第k个主题词tk的权重wki设置为归一化的词频-逆文档频率TF-IDF。
7.一种基于即时语音内容检测的推荐系统,其特征在于包括:
语音采集模块,用于采集用户的语音信息;
语音内容分析模块,用于将语音信息转换成文本内容进行索引得到索引库;
语音关键词检索模块,用于根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词;
用户兴趣推断模块,用于根据即时语音关键词计算用户兴趣模型;
物品模型相似度计算模块,用于计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度;
列表推送模块,用于根据相似度进行排序生成推荐物品信息库中的候选物品集,从候选物品集中选取指定数量物品,并把选取的指定数量物品对应的推荐列表推送给目标用户;
所述用户兴趣推断模块包括:
用户即时兴趣模型建模子模块,用于根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示;
uri={w1i,w2i,…,wni},wki∈[0,1] (1)
式(1)中,uri为用户即时兴趣模型,wki是语音检测窗W内语音关键词中第k个词典主题词tk的即时兴趣权重,且即时兴趣权重wki设置为归一化的词频-逆文档频率TF-IDF;
用户长期兴趣模型建模子模块,用于根据用户历史行为数据建立用户长期兴趣模型如式(2)所示;
uli={w1i,w2i,…,wni},wki∈[0,1] (2)
式(2)中,uli为用户长期兴趣模型,wki为语音检测窗W内语音关键词中第k个词典主题词tk的长期兴趣权重,长期兴趣权重wki的计算函数表达式如式(3)所示;
式(3)中,Hitik为用户历史行为数据中用户ui对涉及第k个词典主题词tk的点击次数,Hitsumi为用户历史行为数据中用户ui的所有点击数;
模型融合子模块,用于将用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算,得到用户兴趣模型。
8.根据权利要求7所述的基于即时语音内容检测的推荐系统,其特征在于,所述语音内容分析模块包括:
语音关键词转录子模块,用于将语音信息转换成文本内容并生成词图;
词图优化子模块,用于将词图中的词串进行全局对齐,全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集,通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率,根据每条候选链接弧的后验概率得分进行剪枝,保留后验概率超过预设阈值的候选链接弧,得到采用混淆网络方法优化后的词图;
词图索引子模块,用于对采用混淆网络方法优化后的词图进行索引标注得到索引库,所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。
9.根据权利要求8所述的基于即时语音内容检测的推荐系统,其特征在于,所述语音关键词检索模块包括:
词项搜索子模块,用于采用预设的词项搜索算法,根据所述索引库从预设的推荐物品词典中进行词项搜索,得到搜索结果列表;
搜索结果重排序子模块,用于针对搜索结果列表进行重排序,得到推荐物品词典中的即时语音关键词。
CN201510662383.3A 2015-10-14 2015-10-14 基于即时语音内容检测的推荐方法及系统 Active CN105243143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510662383.3A CN105243143B (zh) 2015-10-14 2015-10-14 基于即时语音内容检测的推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510662383.3A CN105243143B (zh) 2015-10-14 2015-10-14 基于即时语音内容检测的推荐方法及系统

Publications (2)

Publication Number Publication Date
CN105243143A CN105243143A (zh) 2016-01-13
CN105243143B true CN105243143B (zh) 2018-07-24

Family

ID=55040791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510662383.3A Active CN105243143B (zh) 2015-10-14 2015-10-14 基于即时语音内容检测的推荐方法及系统

Country Status (1)

Country Link
CN (1) CN105243143B (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193831A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN105933413B (zh) * 2016-04-21 2019-01-11 深圳大数点科技有限公司 一种基于用户声音交互的个性化实时内容推送系统
WO2018000270A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于用户画像的个性化回答生成方法及系统
CN106250533B (zh) * 2016-08-05 2020-06-02 北京光年无限科技有限公司 一种面向智能机器人的富媒体播放数据处理方法和装置
CN106484760B (zh) * 2016-08-10 2020-06-23 网易传媒科技(北京)有限公司 一种新闻推荐方法和设备
CN107066477A (zh) * 2016-12-13 2017-08-18 合网络技术(北京)有限公司 一种智能推荐视频的方法及装置
CN106601259B (zh) * 2016-12-13 2021-04-06 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN108269110B (zh) * 2016-12-30 2021-10-26 华为技术有限公司 基于社区问答的物品推荐方法、系统及用户设备
CN106709049A (zh) * 2017-01-05 2017-05-24 胡开标 语音文字关键词识别检索系统
CN106952112A (zh) * 2017-03-01 2017-07-14 心触动(武汉)文化传媒有限公司 一种广告精准投放方法及系统
CN106875936B (zh) * 2017-04-18 2021-06-22 广州视源电子科技股份有限公司 语音识别方法及装置
CN107357875B (zh) * 2017-07-04 2021-09-10 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN109670161B (zh) * 2017-10-13 2023-01-31 北京京东尚科信息技术有限公司 商品相似度计算方法及装置、存储介质、电子设备
CN107679246B (zh) * 2017-10-31 2021-09-07 努比亚技术有限公司 一种基于社交应用的礼物推送方法、计算机终端和计算机可读存储介质
CN107918649A (zh) * 2017-11-13 2018-04-17 百度在线网络技术(北京)有限公司 信息推荐和搜索方法、装置、设备及计算机可读介质
CN107844586B (zh) * 2017-11-16 2022-05-06 百度在线网络技术(北京)有限公司 新闻推荐方法和装置
CN108021622A (zh) * 2017-11-21 2018-05-11 北京金山安全软件有限公司 一种信息确定方法、装置、电子设备及存储介质
CN107993134A (zh) * 2018-01-23 2018-05-04 北京知行信科技有限公司 一种基于用户兴趣的智能购物交互方法及系统
CN108537566A (zh) * 2018-01-30 2018-09-14 深圳市阿西莫夫科技有限公司 化妆品货架的商品销售方法、装置和化妆品货架
CN110309274B (zh) * 2018-03-14 2021-09-07 北京三快在线科技有限公司 引导语推荐方法、装置及电子设备
CN109033162A (zh) * 2018-06-19 2018-12-18 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN108920649B (zh) * 2018-06-29 2021-09-17 北京百度网讯科技有限公司 一种信息推荐方法、装置、设备和介质
CN109087110A (zh) * 2018-08-24 2018-12-25 深圳市云之音科技有限公司 一种智能销售方法、装置及终端设备
CN109271501B (zh) * 2018-09-19 2020-12-29 北京容联易通信息技术有限公司 一种音频数据库的管理方法及系统
CN109345307A (zh) * 2018-09-28 2019-02-15 西安Tcl软件开发有限公司 广告推送方法、系统、终端及计算机可读存储介质
CN109919657A (zh) * 2019-01-24 2019-06-21 珠海格力电器股份有限公司 用户需求信息的获取方法、装置、存储介质及语音设备
CN109829117B (zh) * 2019-02-27 2021-04-27 北京字节跳动网络技术有限公司 用于推送信息的方法和装置
CN109785088A (zh) * 2019-03-19 2019-05-21 杭州康诺迪医疗器械有限公司 一种基于商品展示者识别特征进行网络购物的方法
CN109902152B (zh) * 2019-03-21 2021-07-06 北京百度网讯科技有限公司 用于检索信息的方法和装置
JP7252969B2 (ja) * 2019-04-30 2023-04-05 北京字節跳動網絡技術有限公司 対象推薦方法および装置、記憶媒体と端末装置
CN112562675B (zh) * 2019-09-09 2024-05-24 北京小米移动软件有限公司 语音信息处理方法、装置及存储介质
CN110890095A (zh) * 2019-12-26 2020-03-17 北京大米未来科技有限公司 语音检测方法、推荐方法、装置、存储介质和电子设备
CN111626813B (zh) * 2020-04-22 2023-09-29 北京水滴科技集团有限公司 产品推荐方法及其系统
CN111782799B (zh) * 2020-06-30 2023-11-10 湖南大学 基于复制机制和变分神经推理的增强性文本摘要生成方法
CN114817695A (zh) * 2021-01-28 2022-07-29 北京达佳互联信息技术有限公司 信息推荐方法、装置、电子设备及存储介质
CN113377928B (zh) * 2021-08-11 2022-05-27 明品云(北京)数据科技有限公司 一种文本推荐方法、系统、设备及介质
CN113656467B (zh) * 2021-08-20 2023-07-25 北京百度网讯科技有限公司 搜索结果的排序方法、装置和电子设备
CN115659008B (zh) * 2022-09-27 2023-11-17 南京鼎山信息科技有限公司 大数据信息反馈的信息推送系统、方法、电子设备及介质
CN115544362B (zh) * 2022-10-11 2023-06-13 读书郎教育科技有限公司 一种基于ai的内容推荐系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339563A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 面向奇异发现推荐的兴趣模型更新方法
CN103514170A (zh) * 2012-06-20 2014-01-15 中国移动通信集团安徽有限公司 一种语音识别的文本分类方法和装置
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
US9129227B1 (en) * 2012-12-31 2015-09-08 Google Inc. Methods, systems, and media for recommending content items based on topics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339563A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 面向奇异发现推荐的兴趣模型更新方法
CN103514170A (zh) * 2012-06-20 2014-01-15 中国移动通信集团安徽有限公司 一种语音识别的文本分类方法和装置
US9129227B1 (en) * 2012-12-31 2015-09-08 Google Inc. Methods, systems, and media for recommending content items based on topics
CN104836720A (zh) * 2014-02-12 2015-08-12 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置

Also Published As

Publication number Publication date
CN105243143A (zh) 2016-01-13

Similar Documents

Publication Publication Date Title
CN105243143B (zh) 基于即时语音内容检测的推荐方法及系统
CN109284357B (zh) 人机对话方法、装置、电子设备及计算机可读介质
US20190311024A1 (en) Techniques for combining human and machine learning in natural language processing
CN109408622B (zh) 语句处理方法及其装置、设备和存储介质
Marujo et al. Supervised topical key phrase extraction of news stories using crowdsourcing, light filtering and co-reference normalization
Dinkov et al. Predicting the leading political ideology of YouTube channels using acoustic, textual, and metadata information
CN108009297B (zh) 基于自然语言处理的文本情感分析方法与系统
Qin et al. Joint modeling of content and discourse relations in dialogues
CN112182145A (zh) 文本相似度确定方法、装置、设备和存储介质
CN115982473B (zh) 一种基于aigc的舆情分析编排系统
Xu et al. LSDSCC: a large scale domain-specific conversational corpus for response generation with diversity oriented evaluation metrics
TWI734085B (zh) 使用意圖偵測集成學習之對話系統及其方法
Tai et al. Content-based recommendation using machine learning
González et al. Siamese hierarchical attention networks for extractive summarization
Joko et al. Personal entity, concept, and named entity linking in conversations
Satar et al. Semantic role aware correlation transformer for text to video retrieval
CN111460118A (zh) 一种人工智能冲突语义识别方法及装置
Walha et al. A Lexicon approach to multidimensional analysis of tweets opinion
CN116340488A (zh) 面向开放域人机对话的技能推荐系统
Garcia et al. A multimodal movie review corpus for fine-grained opinion mining
Koorathota et al. Editing like humans: a contextual, multimodal framework for automated video editing
Renger et al. VoiSTV: voice-enabled social TV
Ghinassi et al. Lessons learnt from linear text segmentation: a fair comparison of architectural and sentence encoding strategies for successful segmentation
Zhang Named entity recognition for social media text
CN106407181A (zh) 旅游目的地中的数据语义关联分析方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant