CN111079013A - 一种基于推荐模型的信息推荐方法及装置 - Google Patents

一种基于推荐模型的信息推荐方法及装置 Download PDF

Info

Publication number
CN111079013A
CN111079013A CN201911286243.5A CN201911286243A CN111079013A CN 111079013 A CN111079013 A CN 111079013A CN 201911286243 A CN201911286243 A CN 201911286243A CN 111079013 A CN111079013 A CN 111079013A
Authority
CN
China
Prior art keywords
recommendation
information
vector
processing
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911286243.5A
Other languages
English (en)
Other versions
CN111079013B (zh
Inventor
李天阳
唐剑波
李长亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Beijing Kingsoft Software Co Ltd
Original Assignee
Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Beijing Kingsoft Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Kingsoft Interactive Entertainment Technology Co ltd, Beijing Kingsoft Software Co Ltd filed Critical Chengdu Kingsoft Interactive Entertainment Technology Co ltd
Priority to CN201911286243.5A priority Critical patent/CN111079013B/zh
Publication of CN111079013A publication Critical patent/CN111079013A/zh
Application granted granted Critical
Publication of CN111079013B publication Critical patent/CN111079013B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请提供一种基于推荐模型的信息推荐方法及装置,其中所述基于推荐模型的信息推荐方法包括:获取至少一个推荐参考数据;将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量;将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。使得推荐模型可以对不定长的信息进行处理,提高了推荐模型的处理能力,使得推荐模型可以在更广泛的场景中得到应用。

Description

一种基于推荐模型的信息推荐方法及装置
技术领域
本申请涉及人工智能技术领域,特别涉及一种基于推荐模型的信息推荐方法及装置、计算设备和计算机可读存储介质。
背景技术
随着人工智能技术的日益发展,越来越多的推荐模型被应用于日常的生活中,如根据用户浏览视频的行为推荐视频,根据用户的搜索记录推荐商品等等。
在目前众多的推荐模型的应用中,仅能处理固定长度的信息,如经过One-Hot编码处理后的类别特征和数值特征。但是在日常应用的推荐场景下,对于经常会出现的不定长度的信息,如用户读写的文字内容、用户行为的序列信息等,现有的推荐模型无法对不定长的特征信息进行处理识别。因此推荐模型无法根据非固定长度的推荐参考数据进行推荐,不利于模型学习更多的特征信息,减弱了推荐模型的处理能力,限制了推荐模型的推广应用。
因此,如何解决推荐模型无法处理不定长度的推荐参考数据的问题就成为技术人员目前亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种基于推荐模型的信息推荐方法及装置、计算设备和计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本申请实施例的第一方面,提供了一种基于推荐模型的信息推荐方法,包括:
获取至少一个推荐参考数据;
将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量;
将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
可选的,将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量,包括:
将所述推荐参考数据进行分元素处理,生成元素集合;
将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,并将所述元素集合向量作为推荐参考向量。
可选的,将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,包括:
将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量;
将所述元素向量做池化获得所述元素集合对应的固定长度的元素集合向量。
可选的,将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量,包括:
获取至少一个推荐参考数据的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,其中,n为正整数;
根据所述向量维度n,将所述元素集合中的每个元素分别做嵌入化处理生成n维的元素向量。
可选的,所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息,包括:
将所述特征向量经过稀疏特征处理得到第一特征值集合,其中,所述第一特征值集合包括多个第一特征值;
将述第一特征值集合经过嵌入化处理得到第二特征值集合,其中,所述第二特征值集合包括多个第二特征值;
根据所述第一特征值集合和所述第二特征值集合生成推荐信息。
可选的,根据所述第一特征值集合和所述第二特征值集合生成推荐信息,包括:
将所述第一特征值集合中多个所述第一特征值经过线性处理后获得第一推荐信息;
将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;
将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,根据所述第一特征值集合和所述第二特征值集合生成推荐信息,包括:
将所述第一特征值集合中多个所述第一特征值经过一阶处理,将所述第二特征值集合中多个所述第二特征值经过二阶处理,并根据所述一阶处理的结果和所述二阶处理的结果获得第一推荐信息;
将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;
将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,所述基于推荐模型的信息推荐方法,还包括:
接收类别特征和数值特征;
根据所述类别特征获得对应的类别特征向量,根据所述数值特征获得对应的数值特征向量;
将所述类别特征向量、所述数值特征向量和所述推荐参考向量作为特征向量输入至预先训练好的推荐模型中。
根据本申请实施例的第二方面,提供了一种基于推荐模型的信息推荐装置,包括:
获取模块,被配置为获取至少一个推荐参考数据;
预处理模块,被配置为将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量;
输入模型模块,被配置为将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
可选的,所述预处理模块,包括:
分元素子单元,被配置为将所述推荐参考数据进行分元素处理,生成元素集合;
数据处理子单元,被配置为将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,并将所述元素集合向量作为推荐参考向量。
可选的,所述数据处理子单元,进一步被配置为将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量;将所述元素向量做池化获得所述元素集合对应的固定长度的元素集合向量。
可选的,所述数据处理子单元,进一步被配置为获取至少一个推荐参考数据的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,其中,n为正整数;根据所述向量维度n,将所述元素集合中的每个元素分别做嵌入化处理生成n维的元素向量。
可选的,所述输入模型模块中的推荐模型包括:
稀疏特征子单元,被配置为将所述特征向量经过稀疏特征处理得到第一特征值集合,其中,所述第一特征值集合包括多个第一特征值;
嵌入子单元,被配置为将述第一特征值集合经过嵌入化处理得到第二特征值集合,其中,所述第二特征值集合包括多个第二特征值;
生成信息子单元,被配置为根据所述第一特征值集合和所述第二特征值集合生成推荐信息。
可选的,所述生成信息子单元,进一步被配置为将所述第一特征值集合中多个所述第一特征值经过线性处理后获得第一推荐信息;将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,所述生成信息子单元,进一步被配置为将所述第一特征值集合中多个所述第一特征值经过一阶处理,将所述第二特征值集合中多个所述第二特征值经过二阶处理,并根据所述一阶处理的结果和所述二阶处理的结果获得第一推荐信息;将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,所述基于推荐模型的信息推荐装置,还包括:
接收特征模块,被配置为接收类别特征和数值特征;
生成向量模块,被配置为根据所述类别特征获得对应的类别特征向量,根据所述数值特征获得对应的数值特征向量;
输入向量模块,被配置为将所述类别特征向量、所述数值特征向量和所述推荐参考向量作为特征向量输入至预先训练好的推荐模型中。
根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述基于推荐模型的信息推荐方法的步骤。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述基于推荐模型的信息推荐方法的步骤。
根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机指令,该指令被芯片执行时实现所述基于推荐模型的信息推荐方法的步骤。
本申请实施例中,通过对不固定长度的推荐参考数据做预处理,生成固定长度的特征向量,不定长的数据可以转换为固定长度的向量输入到推荐模型中,使得推荐模型可以接收并处理推荐参考数据,所述推荐模型将接收到的特征向量进行稀疏特征处理得到第一特征值集合,可以精简特征值,消除冗余特征值,再对第一特征值集合中的第一特征值进行嵌入化处理得到第二特征值集合,可以提取更深层次的特征,并最终根据第一特征值集合和第二特征值集合给出推荐信息,对参考数据的预处理解决了现有技术中无法处理不固定长度的参考信息的问题,在模型中对特征向量进行的稀疏特征处理和嵌入化处理提高了推荐模型的处理能力,使得推荐模型可以在更广泛的场景中得到应用。
其次,推荐参考数据中的元素按照维度进行嵌入化处理,得到对应的元素向量,选择维度既能包含推荐参考数据的有效内容,又能保证计算机的快速高效地处理,不浪费计算机资源,再将元素向量做池化操作,进一步减少了计算量,节约了计算资源。
附图说明
图1是本申请实施例提供的计算设备的结构框图;
图2是本申请实施例提供的基于推荐模型的信息推荐方法的流程图;
图3是本申请实施例提供的生成推荐参考数据向量方法的流程图;
图4是本申请实施例提供的推荐模型生成推荐信息的流程图;
图5是本申请实施例提供的基于推荐模型的信息推荐方法的模型结构示意图;
图6是本申请实施例提供的基于推荐模型的信息推荐装置的结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
推荐模型:寻找用户和物品信息之间产生的连接,根据用户的特征为用户推荐个性化信息的模型。
在本申请中,提供了一种基于推荐模型的信息推荐方法及装置、计算设备和计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本申请一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。
计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本申请的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备100还可以是移动式或静止式的服务器。
其中,处理器120可以执行图2所示基于推荐模型的信息推荐方法中的步骤。图2示出了根据本申请一实施例的基于推荐模型的信息推荐方法的流程图,包括步骤202至步骤206。
步骤202:获取至少一个推荐参考数据。
推荐参考数据是为推荐信息提供参考的数据,推荐参考数据为除去类别特征和数值特征之外的参考内容,可以是文本数据,可以是序列数据,推荐参考数据包含有对推荐信息重要的参考内容,为不定长的数据。推荐参考信息可以为中文,可以是外文,也可以是经过脱敏的数据序列等。
推荐参考数据的获取途径有多种,如用户在终端设备中输入的一段文字内容;或者用户输入语音信息,终端将语音转换为文字信息;或者用户在终端设备上进行相关操作,终端记录用户操作并将该操作转换为文字信息等;或者用户在终端设备中输入的一段ID序列或数据序列。在本申请中,不对推荐参考数据的获取途径做限定。
在本申请提供的一种具体实施方式中,用户使用手机输入一段语音“我对产品经理相关的书籍有浓厚的兴趣”,获取用户的语音信息,并将用户的语音信息转换为相关的文字信息“我对产品经理相关的书籍有浓厚的兴趣”,文字信息即为推荐参考数据。
在本申请提供的第二种具体实施方式中,用户使在电脑的文本框中输入一段文字“我现在饿了,想吃面条”,获取用户输入的文字内容,获取的文字内容即为推荐参考数据。
在本申请提供的第三种具体实施方式中,用户使用平板电脑对某商品做了点击收藏的操作,获取用户的行为序列{张三,男,收藏,平板电脑,2019-11-1019:34:12},获取的用户行为序列即为推荐参考数据。
在本申请提供的第四种具体实施方式中,用户使用电脑输入一列经过脱敏的数据序列{W3,W9,W20,W33,W1,W100},该数据序列即为推荐参考数据。
步骤204:将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量。
由于推荐参考数据的长度是随机的,无法确定的,现有的推荐模型无法接收处理不固定长度的信息。因此需要将接收到的推荐参考数据进行相应的数据嵌入化处理,获得固定长度的推荐参考向量。
推荐参考数据的信息之间是相互关联,相互联系的,如果用One-Hot编码表示会损失很多有效信息,不利于信息的表达,One-Hot编码一般用来表示互相之间独立的类别特征。
可选的,参见图3,步骤204可以通过下述步骤302至步骤304实现。
步骤302:将所述推荐参考数据进行分元素处理,生成元素集合。
将获取到的推荐参考数据按照元素为单位进行分元素处理,生成对应的元素集合,在实际应用中,对于文本类型的推荐参考数据进行分元素处理,生成元素集合,即对文本数据进行分词处理,生成词单元集合;对于序列类型的推荐参考数据进行分元素处理,生成元素集合,即对序列数据进行分元素处理,生成元素集合,在本申请中,对推荐参考数据按照推荐参考数据的类型进行的处理,统称为分元素处理。
在本申请提供的一种具体实施方式中,推荐参考数据为“我对产品经理相关的书籍有浓厚的兴趣”的文本,对推荐参考数据进行分元素处理后得到对应的元素集合为:(我,对,产,品,经,理,相,关,的,书,籍,有,浓,厚,的,兴,趣)。
在本申请提供的第二种具体实施方式中,推荐参考数据为“我现在饿了,想吃面条”,对推荐参考数据进行分元素处理后得到对应的元素集合为:(我,现在,饿了,想,吃,面条)。
在本申请提供的第三种具体实施方式中,推荐参考数据为{张三,男,收藏,平板电脑,2019-11-10 19:34:12}的用户行为序列,对推荐参考数据进行分元素处理后得到对应的元素集合为:(张三,男,收藏,平板电脑,2019-11-10 19:34:12)。
在本申请提供的第四种具体实施方式中,推荐参考数据为{W3,W9,W20,W33,W1,W100}的脱敏数据序列,对推荐参考数据进行分元素处理后得到对应的元素集合为:(W3,W9,W20,W33,W1,W100)。
步骤304:将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,并将所述元素集合向量作为推荐参考向量。
可选的,将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量,将所述元素向量做池化获得所述元素集合对应的固定长度的元素集合向量,池化后获得的元素集合向量即为推荐参考向量。
在实际应用中,获取至少一个推荐参考数据的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,其中,n为正整数,根据所述向量维度n将所述元素集合中的每个元素分别做嵌入化处理,生成n维的元素向量,将每个n维元素向量中对应维度的向量元素做池化,获得的元素集合向量即为推荐参考向量。
将所述元素向量做池化获得元素向量集合的方式有很多如:平均池化、最大池化、加和池化等。在本申请中不对池化的具体实施方式做限定。
获取推荐参考数据对应的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,例如,有三个推荐参考数据,分别对应的元素个数为3个、5个和10个,当元素个数为3个时,向量维度n的优选范围为128、200、256,当元素个数为5个时,向量维度n的优选范围为64、128、200,当元素个数为10个时,向量维度n的优选范围为64、128。根据元素个数最多的推荐参考数据确定向量维度为128。
向量维度的取值可以有多种,根据元素个数最多的推荐参考数据确定向量维度n,即有利于信息的表达,又不会导致数据量过大,有利于计算机的处理。
在本申请提供的一种具体实施方式中,向量维度为128,根据向量维度将元素集合(我,对,产,品,经,理,相,关,的,书,籍,有,浓,厚,的,兴,趣)中的每个字分别做嵌入化的数据处理,获得每个字的128维度的元素向量:(我1,我2……我128),(对1,对2……对128)……(趣1,趣2……趣128),其中,“我1、对1、……趣1”、为每个元素向量中对应第1维度的向量元素,“我2、对2、……趣2”、为每个元素向量中对应第2维度的向量元素,“我128、对128、……趣128”、为每个元素向量中对应第128维度的向量元素,将元素向量做加和池化即:A1=我1+对1+……+趣1;A2=我2+对2+……+趣2;……A128=我128+对128+……+趣128,获得元素集合向量(A1,A2……A128),获得的元素集合向量即为推荐参考向量。
在本申请提供的第二种具体实施方式中,向量维度为64,根据向量维度将元素集合(我,现在,饿了,想,吃,面条)做嵌入化的数据处理,获得每个元素的64维度的元素向量:(我1,我2……我64),(现在1,现在2……现在64)……(面条1,面条2……面条64),将元素向量做加和池化获得元素集合向量(B1,B2……B64),其中,B1=我1+现在1+……+面条1;B2=我2+现在2+……+面条2;……B64=我64+现在64+……+面条64
在本申请提供的第三种具体实施方式中,向量维度为256,根据向量维度将元素集合(张三,男,收藏,平板电脑,2019-11-10 19:34:12)做嵌入化的数据处理,获得每个元素的256维度的元素向量,将元素向量做平均池化获得元素集合向量(C1,C2……C256)。
在本申请提供的第四种具体实施方式中,向量维度为512,根据向量维度将元素集合(W3,W9,W20,W33,W1,W100)做嵌入化的数据处理,获得每个元素的512维度的元素向量,将元素向量做最大池化获得元素集合向量(D1,D2……D256)。
步骤206:将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
推荐模型为通过融合浅层(wide)模型和深层(deep)模型进行联合训练的框架,综合利用浅层模型的记忆能力和深层模型的泛化能力,实现单模型对推荐系统准确性和扩展性的兼顾的深度学习模型。常见的推荐模型有Wide&Deep模型、DeepFM模型、xDeepFM模型等,推荐模型被训练于根据输入的固定长度的特征向量,生成对应的推荐信息。
在本申请中,将推荐参考向量作为特征向量输入至预先训练好的推荐模型中,以使所述推荐模型根据所述特征向量获取的特征值集合,并基于所述特征值集合生成推荐信息。
可选的,参见图4,图4示出了推荐模型生成推荐信息的流程图,包括步骤402至步骤406。
步骤402:将所述特征向量经过稀疏特征处理得到第一特征值集合,其中,所述第一特征值集合包括多个第一特征值。
特征向量被输入到所述推荐模型中,经过第一层稀疏特征处理,可以提取特征向量中的特征值,去掉冗余信息。
在本申请提供的一种具体实施方式中,将推荐参考向量(A1,A2……A128)作为特征向量输入到推荐模型中,所述推荐模型经过对所述特征向量的稀疏特征处理,得到第一特征值集合(e1,e2,……en),其中e1、e2、……en为第一特征值集合中的多个第一特征值。
步骤404:将述第一特征值集合经过嵌入化处理得到第二特征值集合,其中,所述第二特征值集合包括多个第二特征值。
将第一特征值集合中的多个第一特征值经过所述推荐模型嵌入层的嵌入化处理得到第二特征值集合。对多个第一特征值的嵌入化处理可以提取更深层次的特征。
在本申请提供的一种具体实施方式中,将第一特征值集合中的特征值e1、e2、……en输入到推荐模型内的嵌入层内,经过嵌入化处理后得到第二特征值集合(f1,f2,……fm),其中f1、f2、……fm为第二特征值集合中的多个第二特征值。
步骤406:根据所述第一特征值集合和所述第二特征值集合生成推荐信息。
可选的,根据所述第一特征值集合和所述第二特征值集合生成推荐信息包括:将所述第一特征值集合中多个所述第一特征值经过线性处理后获得第一推荐信息,将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息,将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
在本申请提供的一具体实施方式中,将所述第一特征值集合中多个所述第一特征值e1、e2、……en进行线性处理,获得第一推荐信息《人人都是产品经理》。
将所述第二特征值集合中多个第二特征值f1、f2、……fm经过深度神经网络的全连接处理,获得第二推荐信息《产品经理手册》、《结网》。
将第一推荐信息和第二推荐信息进行加权处理后生成推荐信息为《人人都是产品经理》、《产品经理手册》、《结网》等相关的产品经理的书籍。
可选的,根据所述第一特征值集合和所述第二特征值集合生成推荐信息包括:
将所述第一特征值集合中多个所述第一特征值经过一阶处理,将所述第二特征值集合中多个所述第二特征值经过二阶处理,并根据所述一阶处理的结果和所述二阶处理的结果获得第一推荐信息;将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
在本申请提供的一具体实施方式中,将所述第一特征值集合中多个所述第一特征值e1、e2、……en分别配以相应的权重做相加作为一阶处理。
将所述第二特征值集合中多个第二特征值f1、f2、……fm任意两个特征值两两做内积后,将内积的结果相加作为二阶处理。
根据一阶处理的结果和二阶处理的结果得到第一推荐信息《人人都是产品经理》、《启示录》。
将所述第二特征值集合中多个第二特征值f1、f2、……fm经过深度神经网络的全连接层的处理,获得第二推荐信息《产品经理手册》、《结网》。
将第一推荐信息和第二推荐信息进行加权处理后生成推荐信息为《人人都是产品经理》、《产品经理手册》、《结网》、《启示录》等相关的产品经理的书籍。
本申请提供的基于推荐模型的信息推荐方法,通过对不固定长度的推荐参考数据做预处理,将生成的特征向量输入到预先训练好的推荐模型中获得对应的推荐结果。推荐模型对输入的特征向量做稀疏特征处理,可以提取特征向量中的特征值,去掉冗余信息。再对稀疏表示的特征做嵌入化处理,提取更深层次的特征值,使模型输出推荐信息时可以更加准确,解决了现有技术中无法处理不固定长度信息的问题,提高了推荐模型的处理能力,使得推荐模型可以在更广泛的场景中得到应用。
其次,对不固定长度的推荐参考数据做预处理,推荐参考数据中的元素按照维度进行嵌入化处理,选择合适的维度既能包含推荐参考数据的有效内容,又能保证计算机的快速高效地处理,不浪费计算机资源。将推荐参考数据中的元素向量做池化操作,可以有效地减少推荐模型处理的向量的数量,提高模型的处理效率。
图5示出了本申请一实施例的基于推荐模型的信息推荐方法的模型结构示意图,结合该模型结构示意图对基于推荐模型的信息推荐方法进行进一步解释说明。
本申请提供的实施例以DeepFM模型为例,接收到的推荐参考数据为用户输入的文字“我现在饿了,想吃面条”,向量维度为64。
对推荐参考数据进行分元素处理后得到对应的元素集合为:(我,现在,饿了,想,吃,面条)。
根据向量维度64,将元素集合中的每个元素分别做嵌入化的数据处理,每个元素分别生成一个64维度的元素向量。
将每个元素对应维度的向量元素相加,获得池化向量(B1,B2……B64),B1=我1+现在1+……+面条1;B2=我2+现在2+……+面条2;……B64=我64+现在64+……+面条64
此外,还接收到用户关于籍贯的类别特征“重庆”和关于年龄的数值特征“30”,将所述关于籍贯的类别特征经过One-Hot编码处理后获得一条关于籍贯的类别特征向量,同时根据年龄的数值特征获得一条关于年龄的数值特征向量,类别特征向量和数值特征向量均为固定长度向量。
将所述类别特征向量、所述数值特征向量和所述池化向量作为特征向量输入到预先训练好的DeepFM推荐模型中,经过模型内的稀疏特征层进行稀疏特征处理,获得第一特征值集合(M1,M2,……Mn),再将第一特征值集合中的第一特征值经过嵌入层处理,获得第二特征值集合(N1,N2,……Nn)。
将第一特征值集合中多个第一特征值(M1,M2,……Mn)经过一阶线性处理,将所述第二特征值集合中多个第二特征值(N1,N2,……Nn)进行二阶内积处理,根据一阶处理的结果和二阶处理的结果得到第一推荐信息“距离您1000米内有以下面馆:X面馆……”。
将所述第二特征值集合中的多个第二特征值(N1,N2,……Nn)经过深度神经网络的全连接处理,获得第二推荐信息“距离您1000米内有以下面馆:Y小面、Z牛肉面……”。
将第一推荐信息和第二推荐信息进行加权处理后生成推荐信息为“距离您1000米内有以下面馆:Y小面、X面馆、Z牛肉面……”。推荐模型会根据用户输入文本信息与用户自身的有关籍贯的类别特征和有关年龄的数值特征将Y小面放在推荐结果的第一位。
本申请提供的基于推荐模型的信息推荐方法,将推荐参考数据在输入至推荐模型之前进行数据预处理,将不固定长度的推荐参考数据转换为固定长度的推荐参考向量,将推荐参考向量输入至预先训练好的推荐模型的同时,还会输入同样为固定长度的类别特征向量和数值特征向量,这样可以将更多的特征输入至推荐模型中,推荐模型对输入的特征向量做稀疏特征处理,可以提取特征向量中的特征值,去掉冗余信息。再对稀疏表示的特征做嵌入化处理,提取更深层次的特征值,使模型输出推荐信息时可以更加准确,解决了现有技术中无法处理不固定长度信息的问题,提高了推荐模型的处理能力,使得推荐模型可以在更广泛的场景中得到应用。
其次,在对不固定长度的推荐参考数据做预处理时,推荐参考数据中的元素按照维度进行嵌入化处理获得元素向量,选择合适的维度既能包含推荐参考数据的有效内容,又能保证计算机的快速高效地处理,不浪费计算机资源。将推荐参考数据中的元素向量做池化操作,可以有效地减少推荐模型处理的特征向量的数量,提高推荐模型的处理效率。
与上述方法实施例相对应,本申请还提供了基于推荐模型的信息推荐装置实施例,图6示出了本申请一个实施例的基于推荐模型的信息推荐装置的结构示意图。如图6所示,该装置包括:
获取模块602,被配置为获取至少一个推荐参考数据。
预处理模块604,被配置为将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量。
输入模型模块606,被配置为将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
可选的,所述预处理模块604,包括:
分元素子单元,被配置为将所述推荐参考数据进行分元素处理,生成元素集合;
数据处理子单元,被配置为将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,并将所述元素集合向量作为推荐参考向量。
可选的,所述数据处理子单元,进一步被配置为将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量;将所述元素向量做池化获得所述元素集合对应的固定长度的元素集合向量。
可选的,所述数据处理子单元,进一步被配置为获取至少一个推荐参考数据的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,其中,n为正整数;根据所述向量维度n,将所述元素集合中的每个元素分别做嵌入化处理生成n维的元素向量。
可选的,所述输入模型模块606中的推荐模型包括:
稀疏特征子单元,被配置为将所述特征向量经过稀疏特征处理得到第一特征值集合,其中,所述第一特征值集合包括多个第一特征值;
嵌入子单元,被配置为将述第一特征值集合经过嵌入化处理得到第二特征值集合,其中,所述第二特征值集合包括多个第二特征值;
生成信息子单元,被配置为根据所述第一特征值集合和所述第二特征值集合生成推荐信息。
可选的,所述生成信息子单元,进一步被配置为将所述第一特征值集合中多个所述第一特征值经过线性处理后获得第一推荐信息;将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,所述生成信息子单元,进一步被配置为将所述第一特征值集合中多个所述第一特征值经过一阶处理,将所述第二特征值集合中多个所述第二特征值经过二阶处理,并根据所述一阶处理的结果和所述二阶处理的结果获得第一推荐信息;将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
可选的,所述基于推荐模型的信息推荐装置,还包括:
接收特征模块,被配置为接收类别特征和数值特征;
生成向量模块,被配置为根据所述类别特征获得对应的类别特征向量,根据所述数值特征获得对应的数值特征向量;
输入向量模块,被配置为将所述类别特征向量、所述数值特征向量和所述推荐参考向量作为特征向量输入至预先训练好的推荐模型中。
本申请提供的基于推荐模型的信息推荐装置,通过对不固定长度的推荐参考数据做预处理,将生成的特征向量输入到预先训练好的推荐模型中获得对应的推荐结果。推荐模型对输入的特征向量做稀疏特征处理,可以提取特征向量中的特征值,去掉冗余信息。再对稀疏表示的特征做嵌入化处理,提取更深层次的特征值,使模型输出推荐信息时可以更加准确,解决了现有技术中无法处理不固定长度信息的问题,提高了推荐模型的处理能力,使得推荐模型可以在更广泛的场景中得到应用。
其次,对不固定长度的推荐参考数据做预处理,推荐参考数据中的元素按照维度进行嵌入化处理,选择合适的维度既能包含推荐参考数据的有效内容,又能保证计算机的快速高效地处理,不浪费计算机资源。将推荐参考数据中的元素向量做池化操作,可以有效地减少推荐模型处理的特征向量的数量,提高推荐模型的处理效率。
本申请一实施例中还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述的基于推荐模型的信息推荐方法的步骤。
本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述基于推荐模型的信息推荐方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的基于推荐模型的信息推荐方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述基于推荐模型的信息推荐方法的技术方案的描述。
本申请实施例公开了一种芯片,其存储有计算机指令,该指令被处理器执行时实现如前所述基于推荐模型的信息推荐方法的步骤。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本申请的内容,可作很多的修改和变化。本申请选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims (11)

1.一种基于推荐模型的信息推荐方法,其特征在于,包括:
获取至少一个推荐参考数据;
将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量;
将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
2.如权利要求1所述的基于推荐模型的信息推荐方法,其特征在于,将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量,包括:
将所述推荐参考数据进行分元素处理,生成元素集合;
将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,并将所述元素集合向量作为推荐参考向量。
3.如权利要求2所述的基于推荐模型的信息推荐方法,其特征在于,将所述元素集合中的元素做数据处理,获得所述元素集合对应的固定长度的元素集合向量,包括:
将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量;
将所述元素向量做池化获得所述元素集合对应的固定长度的元素集合向量。
4.如权利要求3所述的基于推荐模型的信息推荐方法,其特征在于,将所述元素集合中的每个元素做嵌入化处理生成对应的固定长度的元素向量,包括:
获取至少一个推荐参考数据的元素的个数,根据元素个数最多的推荐参考数据确定向量维度n,其中,n为正整数;
根据所述向量维度n,将所述元素集合中的每个元素分别做嵌入化处理生成n维的元素向量。
5.如权利要求1所述的基于推荐模型的信息推荐方法,其特征在于,所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息,包括:
将所述特征向量经过稀疏特征处理得到第一特征值集合,其中,所述第一特征值集合包括多个第一特征值;
将述第一特征值集合经过嵌入化处理得到第二特征值集合,其中,所述第二特征值集合包括多个第二特征值;
根据所述第一特征值集合和所述第二特征值集合生成推荐信息。
6.如权利要求5所述的基于推荐模型的信息推荐方法,其特征在于,根据所述第一特征值集合和所述第二特征值集合生成推荐信息,包括:
将所述第一特征值集合中多个所述第一特征值经过线性处理后获得第一推荐信息;
将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;
将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
7.如权利要求5所述的基于推荐模型的信息推荐方法,其特征在于,根据所述第一特征值集合和所述第二特征值集合生成推荐信息,包括:
将所述第一特征值集合中多个所述第一特征值经过一阶处理,将所述第二特征值集合中多个所述第二特征值经过二阶处理,并根据所述一阶处理的结果和所述二阶处理的结果获得第一推荐信息;
将所述第二特征值集合中多个所述第二特征值经过全连接层处理得到第二推荐信息;
将所述第一推荐信息和所述第二推荐信息进行加权处理生成推荐信息。
8.如权利要求1所述的基于推荐模型的信息推荐方法,其特征在于,还包括:
接收类别特征和数值特征;
根据所述类别特征获得对应的类别特征向量,根据所述数值特征获得对应的数值特征向量;
将所述类别特征向量、所述数值特征向量和所述推荐参考向量作为特征向量输入至预先训练好的推荐模型中。
9.一种基于推荐模型的信息推荐装置,其特征在于,包括:
获取模块,被配置为获取至少一个推荐参考数据;
预处理模块,被配置为将所述推荐参考数据经过数据预处理获得固定长度的推荐参考向量;
输入模型模块,被配置为将所述推荐参考向量作为特征向量输入至预先训练好的推荐模型,以使所述推荐模型根据所述特征向量获得特征值集合,并基于所述特征值集合生成推荐信息。
10.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-8任意一项所述方法的步骤。
11.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-8任意一项所述方法的步骤。
CN201911286243.5A 2019-12-13 2019-12-13 一种基于推荐模型的信息推荐方法及装置 Active CN111079013B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911286243.5A CN111079013B (zh) 2019-12-13 2019-12-13 一种基于推荐模型的信息推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911286243.5A CN111079013B (zh) 2019-12-13 2019-12-13 一种基于推荐模型的信息推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111079013A true CN111079013A (zh) 2020-04-28
CN111079013B CN111079013B (zh) 2023-12-29

Family

ID=70314531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911286243.5A Active CN111079013B (zh) 2019-12-13 2019-12-13 一种基于推荐模型的信息推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111079013B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784006A (zh) * 2020-06-05 2021-05-11 珠海金山办公软件有限公司 一种书籍推荐方法、装置、电子设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078520A1 (en) * 2014-09-12 2016-03-17 Microsoft Corporation Modified matrix factorization of content-based model for recommendation system
KR101617649B1 (ko) * 2014-12-26 2016-05-03 세종대학교산학협력단 영상의 관심 구간 추천 시스템 및 방법
CN106933996A (zh) * 2017-02-28 2017-07-07 广州大学 一种采用深度特征匹配的推荐方法
CN107145850A (zh) * 2017-04-28 2017-09-08 西安电子科技大学 一种基于稀疏滤波特征选择的目标识别方法
CN109190044A (zh) * 2018-09-10 2019-01-11 北京百度网讯科技有限公司 个性化推荐方法、装置、服务器和介质
CN110008409A (zh) * 2019-04-12 2019-07-12 苏州市职业大学 基于自注意力机制的序列推荐方法、装置及设备
CN110334266A (zh) * 2018-03-13 2019-10-15 优酷网络技术(北京)有限公司 观点提取方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078520A1 (en) * 2014-09-12 2016-03-17 Microsoft Corporation Modified matrix factorization of content-based model for recommendation system
KR101617649B1 (ko) * 2014-12-26 2016-05-03 세종대학교산학협력단 영상의 관심 구간 추천 시스템 및 방법
CN106933996A (zh) * 2017-02-28 2017-07-07 广州大学 一种采用深度特征匹配的推荐方法
CN107145850A (zh) * 2017-04-28 2017-09-08 西安电子科技大学 一种基于稀疏滤波特征选择的目标识别方法
CN110334266A (zh) * 2018-03-13 2019-10-15 优酷网络技术(北京)有限公司 观点提取方法及装置
CN109190044A (zh) * 2018-09-10 2019-01-11 北京百度网讯科技有限公司 个性化推荐方法、装置、服务器和介质
CN110008409A (zh) * 2019-04-12 2019-07-12 苏州市职业大学 基于自注意力机制的序列推荐方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任秀伟: "基于嵌入式稀疏特征选择策略的降维算法研究", 《中国硕士学位论文全文数据库》 *
田军霞: "基于短文本处理算法优化的文本信息推荐系统 的设计与实现", 《中国优秀硕士学位论文全文数据库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784006A (zh) * 2020-06-05 2021-05-11 珠海金山办公软件有限公司 一种书籍推荐方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN111079013B (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
CN110008399B (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110348535B (zh) 一种视觉问答模型训练方法及装置
CN109977428B (zh) 一种答案获取的方法及装置
CN108229590B (zh) 一种获取多标签用户画像的方法和装置
CN107861938B (zh) 一种poi文案生成方法及装置,电子设备
WO2020207079A1 (zh) 基于图像识别的脱敏处理方法以及装置
CN114495129B (zh) 文字检测模型预训练方法以及装置
CN115391499A (zh) 生成多任务生成模型的方法、问答对生成方法和相关装置
CN115687664A (zh) 中文图文检索方法及中文图文检索的数据处理方法
CN110147414B (zh) 一种知识图谱的实体表征方法及装置
CN113610231A (zh) 语言模型训练方法及装置和词组推荐方法及装置
CN111079013B (zh) 一种基于推荐模型的信息推荐方法及装置
CN116756278A (zh) 机器问答方法以及装置
CN112464106B (zh) 对象推荐方法及装置
CN113657112A (zh) 解读文章的方法以及装置
CN114356860A (zh) 对话生成方法及装置
CN113538079A (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN113822302A (zh) 一种目标检测模型的训练方法及装置
CN113869337A (zh) 图像识别模型的训练方法及装置、图像识别方法及装置
CN114647717A (zh) 一种智能问答方法及装置
CN113971399A (zh) 识别模型的训练方法及装置、文本识别方法及装置
CN111782762A (zh) 问答应用中相似问题确定方法、装置、电子设备
CN113535887B (zh) 一种公式相似度检测方法及装置
CN116089614B (zh) 文本打标方法及装置
CN116108144B (zh) 信息抽取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant