CN113592289A - 图书质量的预测方法、装置及设备 - Google Patents

图书质量的预测方法、装置及设备 Download PDF

Info

Publication number
CN113592289A
CN113592289A CN202110857447.0A CN202110857447A CN113592289A CN 113592289 A CN113592289 A CN 113592289A CN 202110857447 A CN202110857447 A CN 202110857447A CN 113592289 A CN113592289 A CN 113592289A
Authority
CN
China
Prior art keywords
book
information
current
current book
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110857447.0A
Other languages
English (en)
Other versions
CN113592289B (zh
Inventor
吴志勇
金懿伟
郭宇
史佳慧
斯凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Digital Media Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Digital Media Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Digital Media Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110857447.0A priority Critical patent/CN113592289B/zh
Priority claimed from CN202110857447.0A external-priority patent/CN113592289B/zh
Publication of CN113592289A publication Critical patent/CN113592289A/zh
Application granted granted Critical
Publication of CN113592289B publication Critical patent/CN113592289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种图书质量的预测方法、装置及设备,该方法包括:获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;根据所述隐性关系,获得所述当前图书的预测质量结果。通过上述方式,本发明实现了图书的自动质量预测评估,为用户选书提供可靠支撑。

Description

图书质量的预测方法、装置及设备
技术领域
本发明涉及图书信息处理技术领域,具体涉及一种质量的预测方法、装置及设备。
背景技术
网文图书质量评估,即电子书运营平台整合图书的运营数据和读者反馈信息数据等综合信息,为当前在架的网文图书给出综合性的质量打分,方便用户选择高质量的图书。
目前常用的图书打分方法有:编辑打分、所有用户评分取均值、竞品评分取均值及图书运营数据回归预测给出图书评分等。
现有网文图书质量评估方法中,编辑打分评估主观性强;所有用户评分取均值方法在用户量足够多时具有一定的代表性,该方法只能针对已完结且上架很久的图书评估有参考价值,存在局限性;
竞品评分取均值的方法受各平台用户画像、运营数据及评估方法的影响,对上架较久的图书有参考价值,缺乏适应性;
基于图书运营数据回归预测图书评分的网文图书质量评估方法,能够较客观的反应图书的质量,但是该方法在图书运营趋于稳定时候的输出结果具有参考性,不能在图书上架前期、中期给出客观而准确的质量预估,缺少时变性。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的质量的预测方法、装置及设备。
根据本发明实施例的一个方面,提供了一种图书质量的预测方法,包括:
获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;
根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;
根据所述隐性关系,获得所述当前图书的预测质量结果。
根据本发明实施例的另一方面,提供了一种图书质量的预测装置,包括:
获取模块,用于获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;
处理模块,用于根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;根据所述隐性关系,获得所述当前图书的预测质量结果。
根据本发明实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的图书质量的预测方法对应的操作。
根据本发明实施例的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述的图书质量的预测方法对应的操作。
根据本发明上述实施例提供的方案,通过获取当前图书的第一相关信息;根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系;根据所述隐性关系,获得所述当前图书的预测质量结果;可以实现图书的自动打分,由此解决了现有评分方法中缺乏客观性和适应性的问题,取得了为平台图书运营与用户选书提供可靠支撑的有益效果。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的图书质量的预测方法流程图;
图2示出了本发明另一实施例提供的图书质量的预测方法的流程图;
图3示出了本发明实施例提供的图书质量的预测方法的一具体实现流程图;
图4示出了本发明实施例提供的图书质量的预测装置的结构示意图;
图5示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的图书质量的预测方法的流程图。如图1所示,该方法包括以下步骤:
步骤11,获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;这里,所述第一相关信息可以包括以下至少一项:当前图书的封面信息;当前图书的内容信息;当前图书的属性信息;
步骤12,根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;
步骤13,根据所述隐性关系,获得所述当前图书的预测质量结果。
该实施例中,当前图书的内容信息可以包括图书简介、标签、前几章内容等中的一项或者多项;当前图书的属性信息可以包括书名、作者、版权方、类别、是否有影视作品、题材、字数等中的一项或者多项;
该实施例所述的方法通过获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,这里的当前图书的实际价值信息用于客观反映当前图书的价值;这里的当前图书可以是最新上架的图书,如没有运营数据信息或者用户交互数据信息的图书;进一步根据所述隐性关系,获得所述当前图书的预测质量结果;实现图书质量评估的自适应性,为图书的运营与用户的选书提供支撑。
图2示出了本发明另一个实施例提供的图书质量的预测方法的流程图。
如图2所示,该方法包括以下步骤:
步骤21,获取当前图书的第一相关信息;这里,所述第一相关信息包括以下至少一项:当前图书的封面信息;当前图书的内容信息;当前图书的属性信息;
步骤22,根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,得到训练后的第一网络模型;
这里,已有图书例如可以是已经上架一预设时间的图书,具有相应的运营数据信息或者用户交互数据信息等;所述已有图书的第一相关信息包括以下至少一项:已有图书的封面信息;已有图书的内容信息;已有图书的属性信息;所述第二相关信息包括所述已有图书的实际运营数据;具体可以通过爬虫和平台数据库获取已有图书的第一相关信息以及第二相关信息;
步骤23,根据所述当前图书的第一相关信息以及训练后的所述第一网络模型,预测所述当前图书的第一相关信息对应的所述当前图书的实际价值信息,根据所述训练后的所述第一网络模型,得到所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系;
步骤24,根据所述隐性关系,获得所述当前图书的预测质量结果。
该实施例,通过已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,得到训练后的第一网络模型,所述隐性关系通过训练后的所述第一网络模型表示,从而可以通过训练后的第一网络模型所表示的隐性关系,对当前图书的质量进行预测,从而实现图书质量自动预测,为图书的运营与用户的选书提供支撑。
该可选的实施例中,步骤22中根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,包括:
步骤221,获得所述已有图书的第一相关信息以及第二相关信息;
步骤222,将所述已有图书的第一相关信息通过第二网络模型进行处理,生成所述已有图书的价值隐性特征向量;具体的,该步骤可以包括:
步骤2221,将所述已有图书的第一相关信息进行特征提取和聚合,得到所述已有图书的图书表征向量;
该实施例中,如图3所示,第二网络模型可以是生成模型G,第一网络模型可以是对抗网络模型D;所述已有图书的第一相关信息输入第二网络模型之前,还需要将第一相关信息通过相应的特征提取算法进行特征提取,得到相应的特征向量;比如,已有图书的封面信息经过图书封面特征获取卷积神经网络进行特征提取,获得已有图书的封面的特征向量;
具体的,基于resnet50预训练好的CNN&FC网络加一层全连接层和图书标签数据经fine-tuning获取已有图书的封面特征向量p;已有图书的内容信息经过TF-IDF算法进行特征提取,获得已有图书的内容信息的特征向量,具体的,已有图书的内容信息经TF-IDF算法获取图书内容的关键信息Kinfo,之后将Kinfo信息与图书相关简介拼接后经Embedding网络获取已有图书的内容信息特征列向量c;已有图书的属性信息经过Embedding网络进行特征提取,获得已有图书的属性信息的特征向量,具体的,已有图书的属性信息经Embedding网络向量化后的输出为b;这里,TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。TF是词频,IDF是逆文本频率指数。
将已有图书的封面的特征向量、已有图书的内容信息的特征向量以及已有图书的属性信息的特征向量进行聚合;具体的,将已有图书的封面特征向量p、内容信息特征列向量c和属性信息的特征向量b拼接融合,得到已有图书的图书表征向量binfo;Embedding网络采用Skip-Gram模型,损失函数为L=-logp(wo|wI,1,...,wI,N),其中N为嵌入词的量,w为文本词,P是概率。
步骤2222,将所述图书表征向量和随机噪声向量输入第二网络模型进行处理,输出所述已有图书的价值隐性特征向量;所述第二网络模型的网络层级大于或者等于2,所述随机噪声向量服从P维的高斯分布,P为正整数;
如图3所示,第二网络模型的输入为随机噪声向量z和已有图书的图书表征向量binfo,z服从z~Np(0,I)的p维高斯分布。经过生成器的多层神经网络后,输出已有图书的价值隐性特征向量
Figure BDA0003184610500000061
第二网络模型的网络层级LG(LG>2);
步骤223,根据所述已有图书的第一相关信息、所述已有图书的价值隐性特征向量、所述已有图书的第二相关信息,对预设的第一网络模型进行训练。
具体的,根据所述已有图书的第二相关信息进行特征提取,得到所述已有图书的图书价值向量;具体的,将第二相关信息通过相应的特征提取算法进行特征提取,得到相应的特征向量,比如,所述已有图书的实际运营数据on经SVD分解降维输出R维的图书价值向量为o;
将所述已有图书的图书表征向量、所述已有图书的价值隐性特征向量以及所述已有图书的图书价值向量,输入所述第一网络模型进行训练,直到所述第一网络模型的损失函数收敛,训练结束;所述第一网络模型的网络层级大于或者等于2。具体的,将所述已有图书的图书表征向量binfo、图书价值向量o以及已有图书的价值隐性特征向量
Figure BDA0003184610500000062
输入所述第一网络模型进行训练,直到所述第一网络模型的损失函数收敛,训练结束。
第一网络模型(即对抗网络D)的网络层级LD(LD>2),根据生成对抗网络(GAN)的基本原理,取交叉熵损失函数为模型的损失函数,设对抗网络D的目标函数为V(G,D),V(G,D)可以表示:
Figure BDA0003184610500000071
基于批梯度下降法对模型和反向传播方法优化生成网络、对抗网络的模型参数Φ和θ,直至损失函数收敛,模型训练结束,保存最后的模型参数,记为Φ’和θ’,否则继续进行第二网络模型(即生成模型)的处理。E为期望值的表示方式,Pdata是向量o的分布,m是数据的量。
本发明的上述实施例中,根据所述隐性关系,获得所述当前图书的预测质量结果,包括:
步骤131,对当前图书的第一相关信息进行特征提取和聚合,得到所述当前图书的图书表征向量;这里,对当前图书的第一相关信息进行特征提取的方法同样采用如图3所示的方法,该实施例中,第二网络模型可以是生成模型G,第一网络模型可以是对抗网络模型D;所述当前图书的第一相关信息输入第二网络模型之前,还需要将第一相关信息通过相应的特征提取算法进行特征提取,得到相应的特征向量;比如,当前图书的封面信息经过图书封面特征获取卷积神经网络进行特征提取,获得当前图书的封面的特征向量,具体的,基于resnet50预训练好的CNN&FC网络加一层全连接层和图书标签数据经fine-tuning获取当前图书的封面特征向量p;当前图书的内容信息经过TF-IDF算法进行特征提取,获得当前图书的内容信息的特征向量,具体的,当前图书的内容信息经TF-IDF算法获取图书内容的关键信息Kinfo,之后将Kinfo信息与图书相关简介拼接后经Embedding网络获取当前图书的内容信息特征列向量c;当前图书的属性信息经过Embedding网络进行特征提取,获得当前图书的属性信息的特征向量,具体的,当前图书的属性信息经Embedding网络向量化后的输出为b;将当前图书的封面的特征向量、当前图书的内容信息的特征向量以及当前图书的属性信息的特征向量进行聚合,具体的,将当前图书的封面特征向量p、内容信息特征列向量c和属性信息的特征向量b拼接融合,得到当前图书的图书表征向量binfo;Embedding网络采用Skip-Gram模型,损失函数为L=-logp(wo|wI,1,...,wI,N),其中N为嵌入词的量,w为文本词,P是概率。
步骤132,将所述当前图书的图书表征向量和随机噪声向量,输入第二网络模型进行处理,输出所述当前图书的价值隐性特征向量;如图3所示,第二网络模型的输入为随机噪声向量z和当前图书的图书表征向量binfo,z服从z~Np(0,I)的p维高斯分布。经过生成器的多层神经网络后,输出当前图书的价值隐性特征向量
Figure BDA0003184610500000081
第二网络模型的网络层级LG(LG>2);
步骤133,将所述当前图书的图书表征向量以及所述当前图书的价值隐性特征向量,输入所述训练后的第一网络模型进行处理,获得所述当前图书的图书价值向量;由于第一网络模型经过上述实施例的训练,可以得到所述当前图书的第一相关信息与所述当前图书的实际价值信息之间的隐性关系,这里,当前图书的图书价值向量是根据当前图书的实际价值信息经过算法进行特征提取得到的;因此,将所述当前图书的图书表征向量以及所述当前图书的价值隐性特征向量,输入所述训练后的第一网络模型进行处理后,根据所述训练后的第一网络模型所表示的隐性关系,可以确定当前图书的图书价值向量;
步骤134,根据所述当前图书的图书价值向量以及所述第二网络模型,输出第一权重系数;
步骤135,根据所述第一权重系数以及经过训练的预设网络回归模型,获得所述当前图书的预测质量结果。
该实施例中,根据训练好的第一网络模型,可以得到当前图书的图书价值向量,第一网络模型和第二网络模型的相互作用,可以输出第一权重系数,即价值隐性特征向量影响权重系数,该价值隐性特征向量影响权重系数输入到网络回归模型中进行图书质量预测。
本发明的一可选的实施例中,上述步骤135的实现过程中,可以先对网络回归模型进行训练,训练如过下:
获取已有图书的图书用户交互数据信息,经Embedding网络向量化后的输出值为u;
将u、已有图书的运营数据信息经特征提取后得到的向量o和已有图书的图书表征向量binfo,经一平均池化过滤器后的输出为k;这里,已有图书的运营数据信息可以包括评论数、收藏数、收入、点赞数、分享数、在读人数、人气量、笔记量、粉丝量中的至少一项;
图书用户交互数据信息可以包括评论内容、笔记内容、涉及图书的讨论内容中的至少一项;
k=avgpool(u,o,binfo),k特征融合向量经DNN处理后最后一层全连接层的输出记为fc=DNN(k)。记市场上趋于稳定的网文图书内容价值为v,v由内容编辑标注获取。
为增加网络回归模型的记忆性,将图书价值隐性特征向量
Figure BDA0003184610500000091
先经过一滤波器F处理后和fc线性融合,图书的预测质量结果
Figure BDA0003184610500000092
Figure BDA0003184610500000093
其中,α为偏置项,w为权重系数,f为logistic回归函数,ψ为网络回归模型f的参数。
网文图书质量预测问题可视为回归问题,即优化参数ψ、w和α的过程。取回归问题的均方差损失函数为:
Figure BDA0003184610500000094
为防止梯度爆炸或者梯度损失等问题,在原始损失函数添加一系列惩罚项,之后构建拉格朗日损失函数J:
Figure BDA0003184610500000095
其中,Ω(ψ,w)为范数惩罚项,[ψ,w]表示将参数Ψ和w视为一整体来处理,约束问题的解为
Figure BDA0003184610500000096
待均方差损失函数
Figure BDA0003184610500000099
趋于稳定或者小于阈值loss3时,预测模型收敛,否则继续进行将上述相关输入信息输入该网络回归模型进行训练;其中,loss3由具体情况而定,α*可由w*、ψ*求出,最终实现网文图书内容价值的预测:
Figure BDA0003184610500000097
其中,
Figure BDA0003184610500000098
待预测图书的价值隐性特征向量。
本发明的上述实施例中,根据所述第一权重系数以及预设的网络回归模型,获得所述当前图书的预测质量结果,包括:
通过公式
Figure BDA0003184610500000101
获得所述当前图书的预测质量结果;
其中,
Figure BDA0003184610500000102
为当前图书的预测质量结果;
f为经过训练的网络回归模型即logistic回归函数,relu为激活函数;
fc=DNN(k),k=avgpool(binfo),binfo为所述当前图书的图书表征向量,avgpool表示将所述当前图书的图书表征向量由平均池化过滤器进行处理,DNN(k)表示k特征融合向量经DNN网络处理后最后一层全连接层的输出;
ψ为网络回归模型的参数;
Figure BDA0003184610500000105
为所述当前图书的价值隐性特征向量;w为所述第一权重系数;α为偏置项。
本发明的一可选的实施例中,基于上述步骤135之后,还可以进一步包括:
步骤136,获得所述当前图书的第三相关信息,所述第三相关信息包括以下至少一项:当前图书的运营数据信息,所述当前图书的用户交互数据信息,所述当前图书的得分数据信息。
步骤137,根据所述第一权重系数、预设的网络回归模型以及所述当前图书的第三相关信息,获得所述当前图书的更新的预测质量结果。
具体的,通过公式
Figure BDA0003184610500000103
获得所述当前图书的更新的预测质量结果;
其中,v为更新的当前图书的预测质量结果;
f为网络回归模型即logistic回归函数,relu为激活函数;
fc *=DNN(k),k=avgpool(u,o,binfo),u为所述当前图书的用户交互数据信息经第一预设算法向量化后的输出,o为当前图书的运营数据信息经过第二预设算法向量化后的输出,binfo为所述当前图书的图书表征向量,avgpool表示将所述当前图书的图书表征向量由平均池化过滤器进行处理,DNN(k)表示k特征融合向量经DNN网络处理后最后一层全连接层的输出;
ψ*为网络回归模型的参数;
Figure BDA0003184610500000104
为所述当前图书的价值隐性特征向量;w*为所述第一权重系数;α*为偏置项。
该实施例中,新书(即当前图书)进入平台初期,图书无运营数据,系统会基于该新书的现有数据(如上述的第一相关信息)给出初步的质量评估,待该新书与用户有交互数据(第二相关信息)后,系统会基于运营数据和交互数据实现网文图书质量评估的自更新,具体更新后的预测质量结果由上述v给出,以此实现网文图书的质量预测评估,为图书运营和用户选书提供可靠的数据支撑。
这里,为了更直观显示v的值,可以通过
Figure BDA0003184610500000111
Figure BDA0003184610500000112
来表示,其中,L为一个预设的整数,即将v的计算结果放大一整数倍,以使图书的预测质量结果直观地展示给用户,优选的,该L的值为100。
本发明的上述实施例提出的一种图书质量的预测方法,在实现图书质量自动评估的同时,能够基于图书营运数据以及图书与用户的交互数据,自适应更新图书的预测质量结果,解决现有质量评分方法中缺乏客观性、适应性和时变性的问题,为图书运营和用户选书提供可靠的数据支撑。
图4示出了本发明实施例提供的图书质量的预测装置的结构示意图。如图4所示,该装置40包括:
获取模块41,用于获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;
处理模块42,用于根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;根据所述隐性关系,获得所述当前图书的预测质量结果。
所述第一相关信息包括以下至少一项:当前图书的封面信息;当前图书的内容信息;当前图书的属性信息。
可选的,根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,包括:
根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,得到训练后的第一网络模型,所述第二相关信息包括所述已有图书的实际运营数据;
根据所述当前图书的第一相关信息以及训练后的所述第一网络模型,预测所述当前图书的第一相关信息对应的所述当前图书的实际价值信息;
根据所述训练后的所述第一网络模型,得到所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系。
可选的,根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,包括:
获得所述已有图书的第一相关信息以及第二相关信息;
将所述已有图书的第一相关信息通过第二网络模型进行处理,生成所述已有图书的价值隐性特征向量;
根据所述已有图书的第一相关信息、所述已有图书的价值隐性特征向量、所述已有图书的第二相关信息,对预设的第一网络模型进行训练。
可选的,将所述已有图书的第一相关信息通过第二网络模型进行处理,生成所述已有图书的价值隐性特征向量,包括:
将所述已有图书的第一相关信息进行特征提取和聚合,得到所述已有图书的图书表征向量;
将所述图书表征向量和随机噪声向量输入第二网络模型进行处理,输出所述已有图书的价值隐性特征向量;所述第二网络模型的网络层级大于或者等于2,所述随机噪声向量服从P维的高斯分布,P为正整数。
可选的,根据所述已有图书的第一相关信息、所述已有图书的价值隐性特征向量、所述已有图书的第二相关信息,对预设的第一网络模型进行训练,包括:
根据所述已有图书的第二相关信息进行特征提取,得到所述已有图书的图书价值向量;
将所述已有图书的图书表征向量、所述已有图书的价值隐性特征向量以及所述已有图书的图书价值向量,输入所述第一网络模型进行训练,直到所述第一网络模型的损失函数收敛,训练结束;所述第一网络模型的网络层级大于或者等于2。
可选的,根据所述隐性关系,获得所述当前图书的预测质量结果,包括:
对所述当前图书的第一相关信息进行特征提取和聚合,得到所述当前图书的图书表征向量;
将所述当前图书的图书表征向量和随机噪声向量,输入第二网络模型进行处理,输出所述当前图书的价值隐性特征向量;
将所述当前图书的图书表征向量以及所述当前图书的价值隐性特征向量,输入所述训练后的第一网络模型进行处理,获得所述当前图书的图书价值向量;
根据所述当前图书的图书价值向量以及所述第二网络模型,输出第一权重系数;
根据所述第一权重系数以及经过训练的预设网络回归模型,获得所述当前图书的预测质量结果。
可选的,根据所述第一权重系数以及经过训练的预设网络回归模型,获得所述当前图书的预测质量结果,包括:
通过公式
Figure BDA0003184610500000131
获得所述当前图书的预测质量结果;
其中,
Figure BDA0003184610500000132
为当前图书的预测质量结果;
f为经过训练的网络回归模型即logistic回归函数,relu为激活函数;
fc=DNN(k),k=avgpool(binfo),binfo为所述当前图书的图书表征向量,avgpool表示将所述当前图书的图书表征向量由平均池化过滤器进行处理,DNN(k)表示k特征融合向量经DNN网络处理后最后一层全连接层的输出;
ψ为网络回归模型的参数;
Figure BDA0003184610500000133
为所述当前图书的价值隐性特征向量;w为所述第一权重系数;α为偏置项。
所述获取模块41还用于获得所述当前图书的第三相关信息,所述第三相关信息包括以下至少一项:当前图书的运营数据信息,所述当前图书的用户交互数据信息,所述当前图书的得分数据信息。
所述处理模块42还用于根据所述第一权重系数、经过训练的预设网络回归模型以及所述当前图书的第三相关信息,获得所述当前图书的更新的预测质量结果。
可选的,通过公式
Figure BDA0003184610500000141
获得所述当前图书的更新的预测质量结果;
其中,v为更新的当前图书的预测质量结果;
f为经过训练的网络回归模型即logistic回归函数,relu为激活函数;
fc *=DNN(k),k=avgpool(u,o,binfo),u为所述当前图书的用户交互数据信息经第一预设算法向量化后的输出,o为当前图书的运营数据信息经过第二预设算法向量化后的输出,binfo为所述当前图书的图书表征向量,avgpool表示将所述当前图书的图书表征向量由平均池化过滤器进行处理,DNN(k)表示k特征融合向量经DNN网络处理后最后一层全连接层的输出;
ψ*为网络回归模型的参数;
Figure BDA0003184610500000142
为所述当前图书的价值隐性特征向量;w*为所述第一权重系数;α*为偏置项。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的图书质量的预测方法。
图5示出了本发明实施例提供的计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器,用于执行程序,具体可以执行上述用于计算设备的图书质量的预测方法实施例中的相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序具体可以用于使得处理器执行上述任意方法实施例中的图书质量的预测方法。程序中各步骤的具体实现可以参见上述图书质量的预测方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明实施例并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明实施例进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种图书质量的预测方法,其特征在于,包括:
获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;
根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;
根据所述隐性关系,获得所述当前图书的预测质量结果。
2.根据权利要求1所述的图书质量的预测方法,其特征在于,所述第一相关信息包括以下至少一项:
当前图书的封面信息;
当前图书的内容信息;
当前图书的属性信息。
3.根据权利要求1所述的图书质量的预测方法,其特征在于,根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,包括:
根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,得到训练后的第一网络模型,所述第二相关信息包括所述已有图书的实际运营数据;
根据所述当前图书的第一相关信息以及训练后的所述第一网络模型,预测所述当前图书的第一相关信息对应的所述当前图书的实际价值信息;
根据所述训练后的所述第一网络模型,得到所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系。
4.根据权利要求3所述的图书质量的预测方法,其特征在于,根据已有图书的第一相关信息以及第二相关信息,对预设的第一网络模型进行训练,包括:
获得所述已有图书的第一相关信息以及第二相关信息;
将所述已有图书的第一相关信息通过第二网络模型进行处理,生成所述已有图书的价值隐性特征向量;
根据所述已有图书的第一相关信息、所述已有图书的价值隐性特征向量、所述已有图书的第二相关信息,对预设的第一网络模型进行训练。
5.根据权利要求1所述的图书质量的预测方法,其特征在于,根据所述隐性关系,获得所述当前图书的预测质量结果,包括:
对所述当前图书的第一相关信息进行特征提取和聚合,得到所述当前图书的图书表征向量;
将所述当前图书的图书表征向量和随机噪声向量,输入第二网络模型进行处理,输出所述当前图书的价值隐性特征向量;
将所述当前图书的图书表征向量以及所述当前图书的价值隐性特征向量,输入所述训练后的第一网络模型进行处理,获得所述当前图书的图书价值向量;
根据所述当前图书的图书价值向量以及所述第二网络模型,输出第一权重系数;
根据所述第一权重系数以及经过训练的预设网络回归模型,获得所述当前图书的预测质量结果。
6.根据权利要求5所述的图书质量的预测方法,其特征在于,获得所述当前图书的预测质量结果后,还包括:
获得所述当前图书的第三相关信息,所述第三相关信息包括以下至少一项:当前图书的运营数据信息,所述当前图书的用户交互数据信息,所述当前图书的得分数据信息。
7.根据权利要求6所述的图书质量的预测方法,其特征在于,获得所述当前图书的第三相关信息后,还包括:
根据所述第一权重系数、经过训练的预设所述网络回归模型以及所述当前图书的第三相关信息,获得所述当前图书的更新的预测质量结果。
8.一种图书质量的预测装置,其特征在于,包括:
获取模块,用于获取当前图书的第一相关信息,所述第一相关信息包括图书的多个不同类型的信息;
处理模块,用于根据所述当前图书的第一相关信息,获得所述第一相关信息与所述当前图书的实际价值信息之间的隐性关系,所述实际价值信息用于客观反映当前图书的价值;根据所述隐性关系,获得所述当前图书的预测质量结果。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1至7中任一项所述的图书质量的预测方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1至7中任一项所述的图书质量的预测方法对应的操作。
CN202110857447.0A 2021-07-28 图书质量的预测方法、装置及设备 Active CN113592289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110857447.0A CN113592289B (zh) 2021-07-28 图书质量的预测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110857447.0A CN113592289B (zh) 2021-07-28 图书质量的预测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN113592289A true CN113592289A (zh) 2021-11-02
CN113592289B CN113592289B (zh) 2024-06-07

Family

ID=

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090060031A (ko) * 2007-12-07 2009-06-11 엔에이치엔(주) 도서 인기도 산출 방법 및 상기 방법을 수행하기 위한시스템
JP2013206208A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 図書管理装置、図書管理方法および図書管理プログラム
CN108256499A (zh) * 2018-02-05 2018-07-06 湖南科乐坊教育科技股份有限公司 一种图书评价信息确定方法、装置及系统
CN108416535A (zh) * 2018-03-27 2018-08-17 中国科学技术大学 基于深度学习的专利价值评估的方法
CN111400585A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 图书推荐方法及装置
CN111681021A (zh) * 2020-04-16 2020-09-18 北京信息科技大学 一种基于gca-rfr模型的数字内容资源价值评估方法
CN112417290A (zh) * 2020-11-30 2021-02-26 掌阅科技股份有限公司 书籍排序推送模型的训练方法、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090060031A (ko) * 2007-12-07 2009-06-11 엔에이치엔(주) 도서 인기도 산출 방법 및 상기 방법을 수행하기 위한시스템
JP2013206208A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 図書管理装置、図書管理方法および図書管理プログラム
CN108256499A (zh) * 2018-02-05 2018-07-06 湖南科乐坊教育科技股份有限公司 一种图书评价信息确定方法、装置及系统
CN108416535A (zh) * 2018-03-27 2018-08-17 中国科学技术大学 基于深度学习的专利价值评估的方法
CN111400585A (zh) * 2019-01-02 2020-07-10 中国移动通信有限公司研究院 图书推荐方法及装置
CN111681021A (zh) * 2020-04-16 2020-09-18 北京信息科技大学 一种基于gca-rfr模型的数字内容资源价值评估方法
CN112417290A (zh) * 2020-11-30 2021-02-26 掌阅科技股份有限公司 书籍排序推送模型的训练方法、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SK SHAME, ET AL.: "Analysis of book sales prediction at Amazon marketplace in India: a machine learning approach", 《INFORMATION SYSTEMS AND E-BUSINESS MANAGEMENT》, no. 17 *
李树青等: "基于读者借阅二分网络的图书可推荐质量测度方法及个性化图书推荐服务", 《中国图书馆学报》, vol. 39, no. 3 *
李雁翎;孙晓慧;陈玖冰;: "五维图书评价体系及分析模型的建构", 《情报科学》, no. 8 *

Similar Documents

Publication Publication Date Title
CN111460130B (zh) 信息推荐方法、装置、设备和可读存储介质
US20210279552A1 (en) Method for making recommendations to a user and apparatus, computing device, and storage medium
CN111061962B (zh) 一种基于用户评分分析的推荐方法
US11423234B2 (en) Content generation using target content derived modeling and unsupervised language modeling
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN109325146B (zh) 一种视频推荐方法、装置、存储介质和服务器
CN111242729A (zh) 一种基于长短期兴趣的序列化推荐方法
Heck et al. Horizontal traceability for just‐in‐time requirements: the case for open source feature requests
CN107818491A (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN108153792A (zh) 一种数据处理方法和相关装置
CN111813930A (zh) 相似文档检索方法及装置
US10579752B2 (en) Generating a model based on input
CN115641179A (zh) 信息推送方法、装置及电子设备
CN117252186A (zh) 基于xai的信息处理方法、装置、设备及存储介质
CN117112775A (zh) 自动填写输入表单以生成列表的技术
KR20140146437A (ko) 특허정보를 이용한 기업성과 예측 장치 및 방법
CN113592289A (zh) 图书质量的预测方法、装置及设备
CN113592289B (zh) 图书质量的预测方法、装置及设备
CN112559680B (zh) 基于多层次特征提取的文本分类方法、模型及存储介质
Amirian et al. A hybrid differential evolution for general multi-objective flow shop problem with a modified learning effect
CN110929528A (zh) 对语句情感分析的方法、装置、服务器及存储介质
CN111915339A (zh) 数据的处理方法、装置及设备
JP2006004103A (ja) 文書分類体系間の構造マッチング方法、構造マッチング装置、構造マッチングプログラム及びそのプログラムを記録した記録媒体
CN113642329A (zh) 术语识别模型的建立方法及装置、术语识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant