CN105243143B

CN105243143B - 基于即时语音内容检测的推荐方法及系统

Info

Publication number: CN105243143B
Application number: CN201510662383.3A
Authority: CN
Inventors: 赵欢; 张希翔; 谭彪
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2015-10-14
Filing date: 2015-10-14
Publication date: 2018-07-24
Anticipated expiration: 2035-10-14
Also published as: CN105243143A

Abstract

本发明公开了一种基于即时语音内容检测的推荐方法及系统，方法包括：采集用户的语音信息；转换成文本内容并索引得到索引库；检索推荐物品词典得到即时语音关键词；计算用户兴趣模型；计算用户兴趣模型与预设的各物品模型之间的相似度；生成推荐物品信息库中的候选物品集，选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户；系统包括方法对应的语音采集模块、语音内容分析模块、语音关键词检索模块、用户兴趣推断模块、物品模型相似度计算模块和列表推送模块。本发明能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性，推荐物品的针对性强且准确性高、用户的使用体验好。

Description

基于即时语音内容检测的推荐方法及系统

技术领域

本发明涉及信息推荐系统，具体涉及一种基于即时语音内容检测的推荐方法及系统。

背景技术

推荐系统是一种特殊形式的信息过滤系统，推荐系统在与用户的交互过程中会主动记录用户的历史兴趣信息，对用户的信息需求进行建模，形成关于用户兴趣和偏好的知识模型，并依据该模型实现最终的信息推荐服务。随着大数据多样化的趋势下，在用户即时聊天、观看在线流媒体的过程中，仅利用传统的用户关联、用户行为及反馈、文本知识抽取等方法去挖掘信息，难以使推荐系统关联到用户实时语音聊天内容、观看的影视局台词等语音相关信息上，而用户的聊天内容、观看的影视剧语音台词等语音信息恰恰与用户当前兴趣和将来的购买需求有着极其紧密的联系。现阶段针对语音的推荐系统研究较少，且只是把语音当作推荐系统的用户界面，把原需要鼠标键盘操作的步骤以语音代替而已。因此，面向即时语音检测的推荐模型和方法地推荐最适合用户的产品，以达到使得用户能够更便捷地找寻所需商品的目的，从而大大改善用户的使用体验，具有重要的实用意义和商业价值。

目前的推荐系统普遍是基于文本内容检测，而语音处理技术往往用于各个系统的人机交互界面，即使用语音识别输入替换原先通过键盘或其他设备的输入形式。中国专利申请号为201310740533.9的专利文献公开了一种基于混淆网络的语音中检测关键词的方法，但并没有将这种语音关键词检测方法与推荐方法相结合。中国专利申请号为201410668170.7的专利文献公开了一种可利用用户输入语音信息的推荐系统，将目标用户输入的语音信息通过语音识别转换为对应文本信息，进而进行后继查询及推荐处理，但该推荐方法及系统主要把语音输入当作人机交互界面，并不是对特定应用场景下的语音内容进行相关检测。中国专利申请号为201310446815.8的专利文献公开了一种个性化视频内容推荐方法和系统，通过提取用户观看视频中的演员语音声纹特征，进而寻找声纹匹配相似的其他兴趣演员，启发性地引导和推荐用户到感兴趣的其他视频上，该方法主要是通过检测用户所观看视频中语音声纹特征，并没有对这些语音的内容进行相关检测。因此，如何基于即时语音内容检测来实现内容推荐，已经成为一项亟待解决的技术问题。

发明内容

本发明要解决的技术问题：针对现有技术的上述问题，提供一种能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性，推荐物品的针对性强且准确性高、用户的使用体验好的基于即时语音内容检测的推荐方法及系统。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于即时语音内容检测的推荐方法，步骤包括：

1)采集用户的语音信息；

2)将语音信息转换成文本内容进行索引得到索引库；

3)根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词；

4)根据即时语音关键词及用户历史行为数据计算用户兴趣模型；

5)计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度；

6)根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户。

优选地，所述步骤2)的详细步骤包括：

2.1)将语音信息转换成文本内容并生成词图；

2.2)将词图中的词串进行全局对齐，全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集，通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率，根据每条候选链接弧的后验概率得分进行剪枝，保留后验概率超过预设阈值的候选链接弧，得到采用混淆网络方法优化后的词图；

2.3)对采用混淆网络方法优化后的词图进行索引标注得到索引库，所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。

优选地，所述步骤3)的详细步骤包括：

3.1)采用预设的词项搜索算法，根据所述索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；

3.2)针对搜索结果列表进行重排序，得到推荐物品词典中的即时语音关键词。

优选地，所述步骤3.2)的详细步骤包括：

3.2.1)预先获取多组步骤3.1)得到的搜索结果列表样本，将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的，把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型，完成机器学习分类模型的训练；

3.2.2)将所述词项的搜索结果列表输入机器学习分类模型，通过机器学习分类模型对搜索结果列表进行重排序，得到重排序后的推荐物品词典中的即时语音关键词。

优选地，所述步骤4)的详细步骤包括：

4.1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示；

ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (1)

式(1)中，ur_i为用户即时兴趣模型，w_ki是语音检测窗W内语音关键词中第k个词典主题词t_k的即时兴趣权重，且即时兴趣权重w_ki设置为归一化的词频-逆文档频率TF-IDF；

4.2)根据用户历史行为数据建立用户长期兴趣模型如式(2)所示；

ul_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (2)

式(2)中，ul_i为用户长期兴趣模型，w_ki为语音检测窗W内语音关键词中第k个词典主题词t_k的长期兴趣权重，长期兴趣权重w_ki的计算函数表达式如式(3)所示；

式(3)中，Hit_ik为用户历史行为数据中用户u_i对涉及第k个词典主题词t_k的点击次数，Hitsum_i为用户历史行为数据中用户u_i的所有点击数。

4.3)将所述用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算，得到用户兴趣模型。

优选地，所述步骤4.3)中采用的融合算法如式(4)所示；

式(4)中，u_i为用户兴趣模型，ur_i为用户即时兴趣模型，wr为用户即时兴趣模型的权重，ul_i为用户长期兴趣模型，wl为用户长期兴趣模型的权重。

优选地，所述步骤5)中计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示；

式(5)中，sim(u_i,I_l)为用户的用户兴趣模型u_i与预设的推荐物品信息库中某一个物品的模型I_l之间的相似度，w_ji为用户兴趣模型u_i中第j个主题词t_j的权重，w_jl为预设的推荐物品信息库中某一个物品的模型I_l中第j个主题词t_j的权重，物品的模型I_l如式(6)所示；

I_l＝{w_1l,w_2l,…,w_nl},w_kl∈[0,1] (6)

式(6)中，I_l为预设的推荐物品信息库中第l个物品的带权向量空间模型，w_kl是预设的推荐物品信息库中第l个物品I_l中第k个主题词t_k的权重，且第k个主题词t_k的权重w_ki设置为归一化的词频-逆文档频率TF-IDF。

本发明还提供一种基于即时语音内容检测的推荐系统，包括：

语音采集模块，用于采集用户的语音信息；

语音内容分析模块，用于将语音信息转换成文本内容进行索引得到索引库；

语音关键词检索模块，用于根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词；

用户兴趣推断模块，用于根据即时语音关键词计算用户兴趣模型；

物品模型相似度计算模块，用于计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度；

列表推送模块，用于根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户。

优选地，所述语音内容分析模块包括：

语音关键词转录子模块，用于将语音信息转换成文本内容并生成词图；

词图优化子模块，用于将词图中的词串进行全局对齐，全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集，通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率，根据每条候选链接弧的后验概率得分进行剪枝，保留后验概率超过预设阈值的候选链接弧，得到采用混淆网络方法优化后的词图；

词图索引子模块，用于对采用混淆网络方法优化后的词图进行索引标注得到索引库，所述索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。

优选地，所述语音关键词检索模块包括：

词项搜索子模块，用于采用预设的词项搜索算法，根据所述索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；

搜索结果重排序子模块，用于针对搜索结果列表进行重排序，得到推荐物品词典中的即时语音关键词。

本发明基于即时语音内容检测的推荐方法具有下述优点：本发明提供采集用户的语音信息，将语音信息转换成文本内容进行索引得到索引库，根据索引库检索预设的推荐物品词典得到推荐物品词典中的即时语音关键词，根据即时语音关键词及用户历史行为数据计算用户兴趣模型，计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度，根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户，能够充分挖掘用户在语音聊天通讯软件、观看在线流媒体影视剧等场景下的语音信息，捕获用户在听说渠道下反应出的兴趣关注点，并结合用户的历史兴趣模型，进而推荐满足用户兴趣的商品及其他信息，能够充分利用用户日常语音通讯聊天、观看的影视剧台词等语音信息与用户当前兴趣的紧密关联性，具有推荐物品的针对性强且准确性高、用户的使用体验好的优点。

本发明基于即时语音内容检测的推荐系统具有下述优点：本发明基于即时语音内容检测的推荐系统为本发明基于即时语音内容检测的推荐方法完全对应的系统，因此同样也具有本发明基于即时语音内容检测的推荐方法的前述优点，在此不再赘述。

附图说明

图1为本发明实施例方法的基本流程示意图。

图2为本发明实施例方法步骤2)的基本原理示意图。

图3为本发明实施例方法步骤3)的基本原理示意图。

图4为本发明实施例方法步骤4)的基本原理示意图。

具体实施方式

如图1所示，本实施例基于即时语音内容检测的推荐方法的详细步骤包括：

1)采集用户的语音信息；

2)将语音信息转换成文本内容进行索引得到索引库；

5)计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度；

本实施例中，步骤1)采集用户的语音信息时，具体是指监听检测目标用户当前在影音播放器、在线流媒体播放平台或即时语音通讯软件等应用下的实时语音信息，将捕获到音频卡的数据流导入系统进行处理。

如图2所示，步骤2)的详细步骤包括：

2.1)将语音信息转换成文本内容并生成词图(Lattice)；词图结构是一种有向无环图，节点代表时间，每条弧代表一个时间片内一个语音识别的候选结果，并伴随这个将语音信息转换成文本得到的STT候选结果的声学模型、语言学模型评分；在词图结构中，每个链接弧表示了一个词(也可使用音节、音素)，该词在词名、起始时间、结束时间或是前置词三个方面至少有一个方面与其它链接弧不同；

2.2)将词图中的词串进行全局对齐，全局对齐后的词图中的圆点是弧的节点、两个节点中间的链接弧成为以拼音为单位的候选集，通过前向-后向算法来计算混淆集中每个候选链接弧的后验概率，根据每条候选链接弧的后验概率得分进行剪枝，保留后验概率超过预设阈值的候选链接弧，得到采用混淆网络方法优化后的词图；上述优化只保留评判分较高的大多数弧，节点数和路径数大幅减少，减少了存储空间；正确的候选词可能不在一条路径中，而转换成混淆网络之后，原来不在一条路径上的候选也可以有偏序关系，从而提高了搜索效率；

2.3)对采用混淆网络方法优化后的词图进行索引标注得到索引库，索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。语音关键词检测就是要在有词图索引结构中找到匹配特定内容的局部路径并对该局部路径进行置信测度，每一个匹配的局部路径都是一个潜在的可能结果，利用后验概率值作为置信测度可以对这种可能性的大小进行度量。

如图3所示，步骤3)的详细步骤包括：

3.1)采用预设的词项搜索算法，根据索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；语音关键词检测系统的搜索词项可以分为三种：(1)由推荐物品词典中的单个词构成的词项。(2)由推荐物品词典中的多个词构成的词项。(3)至少包含一个推荐物品词典以外的词的词项。前两种词项为词表内(In Vocabulary，IV)词，第三种词项为词表外(Out-Of Vocabulary，OOV)词。基于词图创建索引，对于第一种词项，只需检索词项的每个节点。对于第二种词项，则需要在词图中寻找一条能与查询词项相匹配的局部路径。对于第三种词项，需要采用不同的检测逻辑，例如可以构建音素索引库，将查询词项表示成音素序列，在音素中查找匹配表示查询词项音素序列的局部路径。语音关键词检测的候选决策阶段是对检测到的关键词的正确与否做出判断的阶段，它舍弃可能性较小的检测结果，保留可能性较大的检测结果；

本实施例中，步骤3.2)的详细步骤包括：

3.2.2)将词项的搜索结果列表输入机器学习分类模型，通过机器学习分类模型对搜索结果列表进行重排序，得到重排序后的推荐物品词典中的即时语音关键词。

本实施例步骤3.2.1)、3.2.2)是利用伪相关反馈的二次检索进行结果重排序，能够提高返回推荐词项列表的准确性。伪相关反馈的二次检索基本思路是得到词图的第一次检索结果后，假设得分排在前面的N个结果是相关的，而得分排在倒数的最后N个结果是不相关的。把这些分别作为正面和负面的例子用来训练具体查询的机器学习分类方法，并将训练后的机器学习分类方法用于初步检索的重排序。机器学习分类模型可根据需要采用支持向量机、多层感知等机器学习方法等模型，支持向量机、多层感知等机器学习方法的高区分能力优势可在二次检索中有效提升语音关键词检测性能。

如图4所示，步骤4)的详细步骤包括：

4.1)根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示；本实施例中，语音检测窗W设置为300s；

ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (1)

式(1)中，ur_i为用户即时兴趣模型，w_ki是语音检测窗W内语音关键词中第k个词典主题词t_k的即时兴趣权重，且即时兴趣权重w_ki设置为归一化的词频-逆文档频率TF-IDF；用户即时兴趣模型ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1]，检测窗时间内的语音内容即是目标用户及时兴趣关注内容；归一化的词频-逆文档频率TF-IDF的表达式如式(1-1)所示；

式(1-1)中，w_ki是语音检测窗W内语音关键词中第k个词典主题词t_k的即时兴趣权重，N表示推荐物品I_l的描述文档d_l的个数，n_k表示含有主题词项t_k至少一次的描述文档集合的数量；f_k表示当前检测窗内主题词项t_k的出现频率，max_z f_k表示语音检测窗内所有单词t_z的频率最大值。

ul_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (2)

式(3)中，Hit_ik为用户历史行为数据中用户u_i对语音检测窗W内语音关键词中第k个词典主题词t_k的点击次数，Hitsum_i为用户历史行为数据中用户u_i的所有点击数，如用户u_i对推荐物品I_l进行了点击，则物品I_l关联的所有词典主题词t_k点击次数加1。影响用户兴趣的不仅由当前检测到的语音内容决定，还由用户长期的兴趣习惯决定，本实施例中主要考虑用户对推荐广告的历史点击记录。

4.3)将用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算，得到用户兴趣模型。

本实施例中，步骤4.3)中采用的融合算法如式(4)所示；

式(4)中，u_i为用户兴趣模型，ur_i为用户即时兴趣模型，wr为用户即时兴趣模型的权重，ul_i为用户长期兴趣模型，wl为用户长期兴趣模型的权重。本实施例中，用户即时兴趣模型的权重wr取值为0.7，用户长期兴趣模型的权重wl取值为0.3。

本实施例中，步骤5)中计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示；本实施例中以式(5)所示余弦距离来表示用户兴趣与一项推荐物品的相关度，当相关度越靠近1时，则该推荐物品与当前语音场景下用户兴趣取向越相关；相关度越接近0，则该推荐物品与当前语音场景下用户兴趣取向关联越小。对各个推荐物品的相关度大小进行排列，确定候选推荐物品集合，从候选物品集中选取出若干物品推荐给目标用户；

I_l＝{w_1l,w_2l,…,w_nl},w_kl∈[0,1] (6)

式(6)中，I_l为预设的推荐物品信息库中第l个物品的带权向量空间模型，w_kl是预设的推荐物品信息库中第l个物品I_l中第k个主题词t_k的权重，且第k个主题词t_k的权重w_ki设置为归一化的词频-逆文档频率TF-IDF。为推荐物品库中每件物品建立向量空间描述模型I_l，每个推荐物品均有与之对应的描述文档d_l，I_l可结合词典和TF-IDF方法从该推荐物品描述文档d_l中计算得出。I_l＝{w_1l,w_2l,…,w_nl},w_kl∈[0,1]，w_kl是推荐物品I_l中各个主题词t_k的权重，权重w_kl设置为归一化的TF-IDF，其表达式如式(6-1)所示。

式(6-1)中，w_kl是推荐物品I_l中各个主题词t_k的权重，N表示推荐物品描述文档d_l的个数，n_k表示含有主题词项t_k至少一次的描述文档集合的数量；f_k表示推荐物品描述文档d_l主题词项t_k的出现频率，max_z f_k,l表示描述文档d_l中所有单词t_z的频率最大值。

与本实施例本实施例基于即时语音内容检测的推荐方法完全对应的推荐系统包括：

语音采集模块，用于采集用户的语音信息；

物品模型相似度计算模块，用于计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度；

优选地，语音内容分析模块包括：

词图索引子模块，用于对采用混淆网络方法优化后的词图进行索引标注得到索引库，索引标注的信息包括各链接弧的词拼音、起始时间、结束时间、声学模型评分、语言模型评分、前向得分、后向得分、局部路径的后验概率中的至少一种。

优选地，语音关键词检索模块包括：

词项搜索子模块，用于采用预设的词项搜索算法，根据索引库从预设的推荐物品词典中进行词项搜索，得到搜索结果列表；

本实施例中，搜索结果重排序子模块包括：

机器学习分类模型训练二级子模块，用于预先获取多组步骤3.1)得到的搜索结果列表样本，将搜索结果列表样本中得分排在前面的N个搜索结果视为相关的、得分排在倒数的最后N个搜索结果视为不相关的，把相关的N个搜索结果作为正面样本数据、把不相关的N个搜索结果作为负面样本数据来训练机器学习分类模型，完成机器学习分类模型的训练；

机器学习分类二级子模块，用于将词项的搜索结果列表输入机器学习分类模型，通过机器学习分类模型对搜索结果列表进行重排序，得到重排序后的推荐物品词典中的即时语音关键词。

本实施例中，用户兴趣推断模块包括：

用户即时兴趣模型建模子模块，用于根据计算预设的语音检测窗W内的用户即时兴趣模型如式(1)所示；

ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (1)

用户长期兴趣模型建模子模块，用于根据用户历史行为数据建立用户长期兴趣模型如式(2)所示；

ul_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (2)

模型融合子模块，用于将用户即时兴趣模型、用户长期兴趣模型两者采用融合算法进行计算，得到用户兴趣模型。

本实施例中，模型融合子模块采用的融合算法如式(4)所示；

本实施例中，物品模型相似度计算模块计算用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示；

I_l＝{w_1l,w_2l,…,w_nl},w_kl∈[0,1] (6)

以上所述仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于即时语音内容检测的推荐方法，其特征在于步骤包括：

1)采集用户的语音信息；

2)将语音信息转换成文本内容进行索引得到索引库；

6)根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户；

所述步骤4)的详细步骤包括：

ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (1)

ul_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (2)

式(3)中，Hit_ik为用户历史行为数据中用户u_i对涉及第k个词典主题词t_k的点击次数，Hitsum_i为用户历史行为数据中用户u_i的所有点击数；

2.根据权利要求1所述的基于即时语音内容检测的推荐方法，其特征在于，所述步骤2)的详细步骤包括：

2.1)将语音信息转换成文本内容并生成词图；

3.根据权利要求2所述的基于即时语音内容检测的推荐方法，其特征在于，所述步骤3)的详细步骤包括：

4.根据权利要求3所述的基于即时语音内容检测的推荐方法，其特征在于，所述步骤3.2)的详细步骤包括：

5.根据权利要求1所述的基于即时语音内容检测的推荐方法，其特征在于，所述步骤4.3)中采用的融合算法如式(4)所示；

6.根据权利要求5所述的基于即时语音内容检测的推荐方法，其特征在于，所述步骤5)中计算所述用户兴趣模型与预设的推荐物品信息库中各物品模型之间的相似度的函数表达式如式(5)所示；

I_l＝{w_1l,w_2l,…,w_nl},w_kl∈[0,1] (6)

7.一种基于即时语音内容检测的推荐系统，其特征在于包括：

语音采集模块，用于采集用户的语音信息；

列表推送模块，用于根据相似度进行排序生成推荐物品信息库中的候选物品集，从候选物品集中选取指定数量物品，并把选取的指定数量物品对应的推荐列表推送给目标用户；

所述用户兴趣推断模块包括：

ur_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (1)

ul_i＝{w_1i,w_2i,…,w_ni},w_ki∈[0,1] (2)

8.根据权利要求7所述的基于即时语音内容检测的推荐系统，其特征在于，所述语音内容分析模块包括：

9.根据权利要求8所述的基于即时语音内容检测的推荐系统，其特征在于，所述语音关键词检索模块包括：