WO2024045926A1

WO2024045926A1 - 多媒体推荐方法、推荐装置、车机系统和存储介质

Info

Publication number: WO2024045926A1
Application number: PCT/CN2023/107958
Authority: WO
Inventors: 梁帅; 孙晓波; 刘占杰
Original assignee: 浙江极氪智能科技有限公司; 浙江吉利控股集团有限公司
Priority date: 2022-08-29
Filing date: 2023-07-18
Publication date: 2024-03-07
Also published as: CN115422382A

Abstract

一种多媒体推荐方法、推荐装置(1000)、车机系统(2000)和存储介质。多媒体推荐方法包括：(S10)获取查询词；(S20)基于拼写和相似词，修正查询词并得到修正词；(S30)获取与修正词相关的多个多媒体内容；(S40)根据训练的预定模型，计算多个多媒体内容与修正词的匹配分和多个多媒体内容的用户行为分，用户行为分根据媒体内容的历史播放情况确定；(S50)根据匹配分和用户行为分，对多个多媒体内容进行排序并输出推荐结果。

Description

多媒体推荐方法、推荐装置、车机系统和存储介质

技术领域

本申请涉及多媒体内容搜索技术领域，尤其涉及一种多媒体推荐方法、推荐装置、车机系统和存储介质。

背景技术

在车载媒体服务中包含多种媒体来源内容，音乐、听书、新闻的内容聚合。用户通过语音或者车控台进行搜索自己想要找的内容。在相关技术中，车载系统根据用户输入的查询词进行自然语言理解，并针对音乐识别查询词中的歌曲和歌手名称，基于明确的歌手和歌曲名称进行查询输出。但是，在没有明确的歌曲和歌手名称时，只进行模糊匹配搜索，输出准确率较低。

发明内容

本申请提供一种多媒体推荐方法、推荐装置、车机系统和存储介质。

本申请实施方式的多媒体推荐方法包括：

获取查询词；

基于拼写和相似词，修正所述查询词并得到修正词；

获取与所述修正词相关的多个多媒体内容；

根据训练的预定模型，计算多个所述多媒体内容与所述修正词的匹配分和多个所述多媒体内容的用户行为分，所述用户行为分根据所述多媒体内容的历史播放情况确定；

根据所述匹配分和所述用户行为分，对多个所述多媒体内容进行排序并输出推荐结果。

本申请实施方式的多媒体推荐方法通过对用户输入端查询词进行修正得到修正后的多个多媒体内容，然后再根据训练的预定模型计算得到的匹配分和用户行为分排序后输出推荐内容，可以提升用户输入模糊查询词时得到更准确的输出结果并推荐更符合用户的内容。

在某些实施方式中，所述获取查询词包括:

将输入的文本作为所述查询词；和/或，

将输入的语音解析的文本作为所述查询词。

在某些实施方式中，修正所述查询词并得到修正词，包括：

基于读音的拼写，查询词库以确认所述查询词的正确性；

在所述查询词不正确的情况下，修正所述查询词并得到修正词；

基于语义，查询相似词库以确认所述查询词的相似词；

在查询词具有相似词的情况下，将所述相似词作为所述修正词。

在某些实施方式中，所述匹配分的计算包括：

计算所述多媒体内容中的数据长度；

确定需要匹配的文本的长度；

计算所述预定模型输出句子中的目标词的权重；

根据所述数据长度、所述文本的长度和所述目标词的权重计算得到所述匹配分。

在某些实施方式中，所述计算所述预定模型输出句子中的目标词的权重，包括；

计算所述目标词在所述输出句子中出现的次数与所述输出句子中所有词的出现次数的比值；

计算所述目标词在文档中出现的频率；

将所述比值和所述出现的频率的乘积作为所述目标词的权值。

在某些实施方式中，所述匹配分采用以下公式计算：

其中，total_w_word为匹配的目标词的权重的加和；mapingword_len为匹配到的多媒体内容中的数据长度；Text1_len为查询词的文本的长度；Text2_len为目标词的文本的长度。

在某些实施方式中，所述用户行为分的计算包括：

计算所述多媒体内容中的特征数据的归一化值，所述特征数据包括播放次数、播放人数、平均播放时长、同一用户的播放次数、播放时长中的至少一种；

计算所述特征数据的权重；

累加所述归一化值和所述特征数据的权重的乘积的值作为所述用户行为分。

在某些实施方式中，所述归一化值采用以下公式计算：

X_norm＝(X-Xmin)/(Xmax-Xmin)

其中，X为特征数据，Xmin为特征数据的最小值，Xmax为特征数据的最大值。

本申请实施方式的推荐装置包括：

第一获取模块，用于获取查询词；

修正模块，用于基于拼写和相似词，修正所述查询词并得到修正词；

第二获取模块，用于获取与所述修正词相关的多个多媒体内容；

计算模块，用于根据训练的预定模型，计算多个所述多媒体内容与所述修正词的匹配分和多个所述多媒体内容的用户行为分，所述用户行为分根据所述媒体内容的历史播放情况确定；

推送模块，用于根据所述匹配分和所述用户行为分，对多个所述多媒体内容进行排序并输出推荐结果。

本申请实施方式的推荐装置通过对用户输入端查询词进行修正得到修正后的多个多媒体内容，然后再根据训练的预定模型计算得到的匹配分和用户行为分排序后输出推荐内容，可以提升用户输入模糊查询词时得到更准确的输出结果并推荐更符合用户的内容。

本申请实施方式的车机系统包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上述任一项实施方式所述多媒体推荐方法。

本申请实施方式的车机系统通过多媒体推荐方法能够在用户搜索内容文本匹配的基础之上，根据用户的行为数据进行推荐展示。

本申请实施方式的包含计算机程序的非易失性计算机可读存储介质，当所述计算机程序被一个或多个处理器执行时，使得所述处理器实现上述任一项实施方式所述多媒体推荐方法。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：

图1是本申请实施方式的多媒体推荐方法的流程示意图；

图2是本申请实施方式的推荐装置的模块示意图；

图3是本申请实施方式的多媒体推荐方法的整体架构示意图；

图4是本申请实施方式的多媒体推荐方法中数据采集到模型处理的过程示意图；

图5是图3中的在线搜索的过程示意图；

图6是本申请实施方式的多媒体推荐方法的流程示意图；

图7是本申请实施方式的多媒体推荐方法的流程示意图；

图8是本申请实施方式的多媒体推荐方法的流程示意图；

图9是本申请实施方式的多媒体推荐方法的流程示意图；

图10是本申请实施方式的车机系统的结构示意图。

主要元件符号说明：

推荐装置1000、第一获取模块110、修正模块120、第二获取模块130、计算模块140；

车机系统2000、存储器220、处理器220。

具体实施方式

下面详细描述本申请的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。

下文的公开提供了许多不同的实施方式或例子用来实现本申请的不同结构。为了简化本申请的公开，下文中对特定例子的部件和设置进行描述。当然，它们仅仅为示例，并且目的不在于限制本申请。此外，本申请可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设置之间的关系。此外，本申请提供了的各种特定的工艺和材料的例子，但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。

请参阅图1，本申请实施方式的多媒体推荐方法包括：

S10:获取查询词；

S20:基于拼写和相似词，修正查询词并得到修正词；

S30:获取与修正词相关的多个多媒体内容；

S40:根据训练的预定模型，计算多个多媒体内容与修正词的匹配分和多个多媒体内容的用户行为分，用户行为分根据多媒体内容的历史播放情况确定；

S50:根据匹配分和用户行为分，对多个多媒体内容进行排序并输出推荐结果。

请参阅图2，本申请实施方式的用于推荐多媒体内容的推荐装置1000包括第一获取模块110、修正模块120、第二获取模块130和计算模块130，第一获取模块110用于获取查询词；修正模块120用于基于拼写和相似词，修正查询词并得到修正词；第二获取模块130用于获取与修正词相关的多个多媒体内容；计算模块130用于根据训练的预定模型，计算多个多媒体内容与修正词的匹配分和多个多媒体内容的用户行为分，用户行为分根据媒体内容的历史播放情况确定；推送模块用于根据匹配分和用户行为分，对多个多媒体内容进行排序并输出推荐结果。

本申请实施方式的多媒体推荐方法和推荐装置1000通过对用户输入端查询词进行修正得到修正后的多个多媒体内容，然后再根据训练的预定模型计算得到的匹配分和用户行为分排序后输出推荐内容，可以提升用户输入模糊查询词时得到更准确的输出结果并推荐更符合用户的内容。

具体地，推荐装置1000实现多媒体推荐方法可先采取步骤S10，可通过第一获取模块110来获取查询词，查询词可以是用户向车机端输入的想要查询的词语。获取用户输入的查询词后可采取步骤S20，基于拼写和相似词修正查询词并得到修正词，其中拼写修正和相似词修正可通过拼音改错以及相似词替换等方式对查询词进行修正，进而得到修正后的修正词。进一步可采取步骤S30通过第二获取装置获取与修正词相关的多个多媒体内容，多媒体内容可以是车机端向用户提供的多媒体服务中的多种媒体来源，例如，音频、视频、歌曲以及新闻等内容。

然后计算模块130可采取步骤S40，根据训练的预定模型，计算多个多媒体内容与修正词的匹配分和多个多媒体内容的用户行为分，用户行为分根据媒体内容的历史播放情况确定；其中，匹配分可理解为根据修改词进行搜索得到的多个多媒体内容与修正词的匹配程度。用户行为分可理解为根据修改词进行搜索得到的多个多媒体内容中用户历史播放的情况，例如，历史播放情况可以是历史播放次数、历史播放时长等。预定模型可采用TF-IDF模型、权重模型等模型方法对匹配分已经用户行为分进行计算。

再然后推荐模块可采取步骤S50根据步骤S40中计算得出的匹配分和用户行为分的结果，对多个多媒体内容进行排序并输出推荐结果。

多媒体推荐方法的整体架构可如图3所示：

用户通过在线搜索输入词语进行查询，获取查询词后可先基于拼写改错再经过相似词替换后进行对多媒体内容的文本检索。拼写改错、相似词替换以及文本检索可基于交互数据结合离线训练的方式进行。

例如，拼写改错、相似词替换以及文本检索可运用图中交互数据对应的词库拼音表、相似词库、内容库等；图中离线训练对应的大数据平台内的词库提取、相似词库提取、用户对内容统计、数据清洗、数据整合以及内容统计等训练方式可有用于拼写改错、相似词替换以及文本检索。

进一步地，文本检索得到结果后可进行匹配分计算然后再进行用户行为分计算，最后可根据匹配分和用户行为分的计算结果得到输出推荐结果。相应的匹配分计算以及用户行为分的计算也可基于交互数据结构离线训练的方式进行。

例如，匹配分计算可运用图中交互数据对应的TF-IDF模型及图中离线训练对应的训练平台内的TF-IDF模型和权重模型。用户行为分计算可运用图中交互数据对应的内容热度、用户内容行为等及图中离线训练对应的训练平台内的TF-IDF模型和权重模型。

预定模型构建的过程可如图4所示：

首先可进行数据采集，车机端可将埋点数据上报至云端，转发给kafka(消息通道)，大数据平台消费kafka(消息通道)数据进入数据仓库。云端的业务数据包括用户和内容的基础信息同步到大数据平台。

然后进行数据处理通过对埋点数据和业务数据进行数据建模，根据需求计算用户特征和音乐特征。对多媒体内容文本数据处理，提取词库、提取关联词库，根据提取的词库对内容文本进行自定义分词，剔除停用词，分词后的专辑、内容名、作者名称合并统一存储。

再对查询词进行词权重模型的训练，可通过对用户使用语音搜索的文本数据训练TF-IDF模型，用于计算查询词中的词在该查询词中的权重，用于后期的文本匹配。

TF模型计算方法，预测时文本内词出现的次数与该文本内所有词的出现次数比值。

其中，tf_i,j表示查询词的第j个句子中的第i个词；n_i,j表示查询词的第j个句子中的第i个词在第j个句子中出现的次数；∑_kn_k,j表示查询词的第j个句子中的第i个词在第j个句子中所有词的次数和。

示例性地，用户输入的查询词为两句，第一句是“播放，消防车”，第二句是“哦，来一首，爱江山更爱美人”。以用户输入的第一句“播放，消防车”为例。第一句分词得到词语“播放”，“消防车”，以“播放”一词为例，“播放”的TF＝1/2，原理如下：

tf_i,j＝f_1,1表示查询词的第1个句子中的第1个词。n_i,j＝n_1,1＝1即“播放”一词在查询词的第1个句子中出现了1次。∑_kn_k,j＝n_1,1+n_2,1＝1+1＝2，即第一句分词得到“播放”一词，“消防车”一词，“播放”一词在查询词的第1个句子中出现了1次，“消防车”在查询词的第1个句子中出现了1次。因此第一句分词得到“播放”，“消防车”两个词，即第一句词的个数总和为2次。

IDF计算方法，可在模型训练时学习每个词在出现查询词中的次数，预测时根据预测的文本词进行字典查询。

其中，{j:t_i∈d_j}表示查询词的中出现单个词的句子数。|D|表示查询词中总的句子数。

预测时模型数据为TF与IDF乘积的值，作为每个目标词的权值。模型文件的输出可保存为PMML格式。

在线搜索的整体过程可如图5所示，车机端的用户输入语音请求语音服务对文本query请求搜索服务，搜索服务进行搜索服务内文本处理和数据查询然后从模型仓库中调用模型并将结果返回至搜索服务，再将最终数据返回至车机端。

在某些实施方式中，获取查询词包括:

将输入的文本作为查询词；和/或，

将输入的语音解析的文本作为查询词。

如此，通过输入、语音解析的文本作为查询词可便于用户在不同场景下使用。

具体地，将输入的文本作为查询词或将输入的语音解析的文本作为查询词或者将输入的文本作为查询词和将输入的语音解析的文本同时作为查询词。

请参阅图6，在某些实施方式中，修正查询词并得到修正词(步骤S20)，包括：

S21:基于读音的拼写，查询词库以确认查询词的正确性；

S22:在查询词不正确的情况下，修正查询词并得到修正词；

S23:基于语义，查询相似词库以确认查询词的相似词；

S24:在查询词具有相似词的情况下，将相似词作为修正词。

修正模块120用于基于读音的拼写，查询词库以确认查询词的正确性；及用于在查询词不正确的情况下，修正查询词并得到修正词；及用于基于语义，查询相似词库以确认查询词的相似词；以及用于在查询词具有相似词的情况下，将相似词作为修正词。

如此，通过对查询词的读音的拼写及语义从词库中进行确认从而修正查询词。

具体地，实现步骤S20，可先对查询词进行拼写的修正然后再进行相似词的替换，采取步骤S21，基于读音的拼写，查询词库以确认查询词的正确性；再采取步骤S22，在查询词不正确的情况下，修正查询词并得到修正词；然后采取步骤S23，基于语义，查询相似词库以确认查询词的相似词；再采取步骤S24，在查询词具有相似词的情况下，将相似词作为修正词。

例如，用户输入的查询词为“加州旅馆”具有拼写错误，通过步骤S21和步骤S22可将“加洲旅馆”修正为“加州旅馆”。进一步地，通过步骤S23和步骤S24可对修正后的“加州旅馆”进行相似词替换“加州旅馆”可替换为“Hotel California”。

请参阅图7，在某些实施方式中，匹配分的计算(步骤S40)包括：

S41:计算多媒体内容中的数据长度；

S42:确定需要匹配的文本的长度；

S43:计算预定模型输出句子中的目标词的权重；

S44:根据数据长度、文本的长度和目标词的权重计算得到匹配分。

计算模块130用于计算多媒体内容中的数据长度；及用于确定需要匹配的文本的长度；及用于计算预定模型输出句子中的目标词的权重；以及用于根据数据长度、文本的长度和目标词的权重计算得到匹配分。

如此，匹配分采用数据长度、文本的长度和目标词的权重计算可以体现查询词中目标词对应多媒体内容的匹配度。

具体地，步骤S40中的匹配分计算可先采取步骤S41计算多媒体内容中的数据长度；然后可采取步骤S42，确定需要匹配的文本的长度；再然后采取步骤S43，计算预定模型输出句子中的目标词的权重；再采取步骤S44，根据数据长度、文本的长度和目标词的权重计算得到匹配分。其中，预定模型可以是TF-IDF模型和权重模型。

请参阅图8，在某些实施方式中，计算预定模型输出句子中的目标词的权重(步骤S43)，包括；

S431:计算目标词在输出句子中出现的次数与输出句子中所有词的出现次数的比值；

S432:计算目标词在文档中出现的频率；

S433:将比值和出现的频率的乘积作为目标词的权值。

计算模块130用于计算目标词在输出句子中出现的次数与输出句子中所有词的出现次数的比值；及用于计算目标词在文档中出现的频率；以及用于将比值和出现的频率的乘积作为目标词的权值。

如此，采用次数比值和出现频率乘积的方式计算能够体现目标词的在句子中的权重。

具体地，步骤S431中计算目标词在输出句子中出现的次数与输出句子中所有词的出现次数的比值可以采用TF模型的计算方法。步骤S432中计算目标词在文档中出现的频率可以采用IDF模型的计算方法。然后如步骤S433可将步骤S431中计算得到的比值与步骤S432中出现的频率的乘积作为目标词的权值。

在某些实施方式中，匹配分采用以下公式计算：

其中，total_w_word为匹配到的目标词的权重的加和；mapingWord_len为匹配到的多媒体内容中的数据长度；Text1_len为查询词的文本的长度；Text2_len为目标词的文本的长度。

如此，匹配分采用的计算公式能够更加准确的得到目标词与多媒体内容的匹配程度。

具体地，计算公式中total_w_word为匹配到的目标词的权重的加和，其中权重可以是采用预测模型中的TF-IDF模型预测输出得到的句子中的目标词的权重；mapingWord_len为匹配到的多媒体内容中的数据长度；Text1_len为查询词的文本的长度，即用户输入的查询词具有的文本的长度；Text2_len为目标词的文本的长度，即查询词中目标词具有的文本的长度。

请参阅图9，在某些实施方式中，用户行为分的计算包括：

S45:计算多媒体内容中的特征数据的归一化值，特征数据包括播放次数、播放人数、平均播放时长、同一用户的播放次数、播放时长中的至少一种；

S46:计算特征数据的权重；

S47:累加归一化值和特征数据的权重的乘积的值作为用户行为分。

计算模块130用于计算多媒体内容中的特征数据的归一化值，特征数据包括播放次数、播放人数、平均播放时长、同一用户的播放次数、播放时长中的至少一种；及用于计算特征数据的权重；以及用于累加归一化值和特征数据的权重的乘积的值作为用户行为分。

如此，用户行为分的计算能够显示出用户对多媒体内容的偏好等行为数据。

具体地，用户行为分的计算可在用户匹配分的计算之后，可采用步骤S45计算多媒体内容中的特征数据的归一化值，其中，特征数据包括播放次数、播放人数、平均播放时长、同一用户的播放次数、播放时长中的至少一种；然后可采用步骤S46，计算特征数据的权重。然后可采取步骤S47，累加归一化值和特征数据的权重的乘积的值作为用户行为分。

示例性地，采用用户点击和音乐特征归一化，然后计算每个特征信息熵的大小，根据信息熵确定特征数据的权重，然后可用于用户行为分的计算。

信息熵计算公式为：

其中，p_ij表示每个维度数据的归一化的数据值的比例。x_ij表示数据表，或者二维数组中第i行，第j列的数据值。表示每列数据中所有行数据加和。

举例来说，某一列数据为：1、2、4、6。总和为：1+2+4+6＝13；计算后的值为1/13、2/13、4/13、6/13。

信息熵计算公式还包括：

其中，表示上述公式中计算得到的数据的加和。表示所有行数，Ln是log以e为底的对数，E_j表示第j列数据的信息熵。

信息的权重计算公式为：

其中，表示上述公式中E_j计算得到的数据的加和。

请参阅图，在某些实施方式中，归一化值采用以下公式计算：

X_norm＝(X-Xmin)/(Xmax-Xmin)

如此，归一化可便于对特征数据进行排序以及后续用户行为分的计算。

具体地，X_norm表示特征数据归一化的值，以用户对多媒体内容的播放次数的特征数据为例，比如数据为1、3、4、6，进行归一化值的计算得到的数据为：

数据“1”计算得到的结果是“(1-1)/(6-1)＝0”，“3”计算得到的结果是“4”计算得到的结果是“6”计算得到的结果是“(6-1)/(6-1)＝1”可得到0到1之间的归化值。

然后用户行为分的计算公式可以是：

其中，w_j为每列数据的权重，X_norm表示每列归一化后的特征值，score_i即表示计算得到的每行数据分数，即为每个用户的行为分。

综上，步骤S50中根据匹配分和用户行为分，对多个多媒体内容进行排序并输出推荐结果。匹配分和用户对内容的行为分进行调和，从高到低排序，然后再输出内容。调和可以是以一定比例的累加，例如，0.6的匹配分加上0.4的用户行为分。不同用户所输出的内容不同。

示例性的，用户10001输入的查询词为“播放小明的歌曲”。

用户10001输出效果如下表：

用户10002输入的查询词同样为“播放小明的歌曲”。

用户10002输出效果如下表：

可以理解，根据用户的不同将推荐匹配用户并符合用户行为的内容。

请参阅图10，本申请实施方式的车机系统2000包括存储器210和处理器220，存储器210存储有计算机程序，处理器220执行计算机程序时实现上述实施方式中任一项多媒体推荐方法。

本申请实施方式的车机系统2000通过多媒体推荐方法能够在用户搜索内容文本匹配的基础之上，根据用户的行为数据进行推荐展示。

具体地，车机系统2000可以是汽车上的智能车载系统，可用于实现车机交互、媒体播放等功能。存储器210和处理器220可设置在车机系统2000上。

本申请实施方式的包含计算机程序的非易失性计算机可读存储介质，当计算机程序被一个或多个处理器执行时，使得处理器实现上述任一项实施方式多媒体推荐方法。

计算机程序的处理器可以为中央处理器(Central Processing Unit，CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

计算机程序可以被存储在存储器中，存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如上述方法实施例中的方法所对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的方法。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

应当理解，本申请的实施方式的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请的各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。

Claims

一种多媒体推荐方法，其特征在于，包括：

获取查询词；

基于拼写和相似词，修正所述查询词并得到修正词；

获取与所述修正词相关的多个多媒体内容；

根据训练的预定模型，计算多个所述多媒体内容与所述修正词的匹配分和多个所述多媒体内容的用户行为分，所述用户行为分根据所述多媒体内容的历史播放情况确定；

根据所述匹配分和所述用户行为分，对多个所述多媒体内容进行排序并输出推荐结果。
根据权利要求1所述的方法，其特征在于，所述获取查询词包括:

将输入的文本作为所述查询词；和/或，

将输入的语音解析的文本作为所述查询词。
根据权利要求1所述的方法，其特征在于，所述基于拼写和相似词，修正所述查询词并得到修正词，包括：

基于读音的拼写，查询词库以确认所述查询词的正确性；

在所述查询词不正确的情况下，修正所述查询词并得到修正词；

基于语义，查询相似词库以确认所述查询词的相似词；

在查询词具有相似词的情况下，将所述相似词作为所述修正词。
根据权利要求1所述的方法，其特征在于，所述匹配分的计算包括：

计算所述多媒体内容中的数据长度；

确定需要匹配的查询词的文本的长度；

计算所述预定模型输出句子中的目标词的权重；

根据所述数据长度、所述文本的长度和所述目标词的权重计算得到所述匹配分。
根据权利要求4所述的方法，其特征在于，所述计算所述预定模型输出句子中的目标词的权重，包括；

计算所述目标词在所述输出句子中出现的次数与所述输出句子中所有词的出现次数的比值；

计算所述目标词在文档中出现的频率；

将所述比值和所述出现的频率的乘积作为所述目标词的权值。
根据权利要求1所述的方法，其特征在于，所述匹配分采用以下公式计算：

其中，total_w_word为匹配到的目标词的权重的加和；mapingWord_len为多媒体内容中的数据长度；Text1_len为查询词的文本的长度；Text2_len为目标词的文本的长度。
根据权利要求1所述的方法，其特征在于，所述用户行为分的计算包括：

计算所述多媒体内容中的特征数据的归一化值，所述特征数据包括播放次数、播放人数、平均播放时长、同一用户的播放次数、播放时长中的至少一种；

计算所述特征数据的权重；

累加所述归一化值和所述特征数据的权重的乘积的值作为所述用户行为分。
根据权利要求7所述的方法，其特征在于，所述归一化值采用以下公式计算：
X_norm＝(X-Xmin)/(Xmax-Xmin)

其中，X为特征数据，Xmin为特征数据的最小值，Xmax为特征数据的最大值。
一种推荐装置，其特征在于，所述推荐装置包括：

第一获取模块，用于获取查询词；

修正模块，用于基于拼写和相似词，修正所述查询词并得到修正词；

第二获取模块，用于获取与所述修正词相关的多个多媒体内容；

计算模块，用于根据训练的预定模型，计算多个所述多媒体内容与所述修正词的匹配分和多个所述多媒体内容的用户行为分，所述用户行为分根据所述媒体内容的历史播放情况确定；

推送模块，用于根据所述匹配分和所述用户行为分，对多个所述多媒体内容进行排序并输出推荐结果。
一种车机系统，其特征在于，所述车机系统包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-8中任一项所述多媒体推荐方法。
一种包含计算机程序的非易失性计算机可读存储介质，其特征在于，当所述计算机程序被一个或多个处理器执行时，使得所述处理器实现权利要求1-8中任一项所述多媒体推荐方法。