CN113268663B - 基于大数据的下载推荐系统及方法 - Google Patents

基于大数据的下载推荐系统及方法 Download PDF

Info

Publication number
CN113268663B
CN113268663B CN202110552226.2A CN202110552226A CN113268663B CN 113268663 B CN113268663 B CN 113268663B CN 202110552226 A CN202110552226 A CN 202110552226A CN 113268663 B CN113268663 B CN 113268663B
Authority
CN
China
Prior art keywords
expression
packages
chat
user
package
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110552226.2A
Other languages
English (en)
Other versions
CN113268663A (zh
Inventor
吕奶凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yudeshui Electric Technology Co Ltd
Original Assignee
Suzhou Yudeshui Electric Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Yudeshui Electric Technology Co Ltd filed Critical Suzhou Yudeshui Electric Technology Co Ltd
Priority to CN202110552226.2A priority Critical patent/CN113268663B/zh
Publication of CN113268663A publication Critical patent/CN113268663A/zh
Application granted granted Critical
Publication of CN113268663B publication Critical patent/CN113268663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据的下载推荐系统及方法,所述推荐系统包括聊天输入采集模块、标识识别模块、文字监测模块和分析推荐模块,所述聊天输入采集模块用于获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字,所述标识识别模块获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,在聊天标识为第一标识时,令文字监测模块工作,在聊天标识为第二标识时,令文字监测模块停止工作;所述文字监测模块将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包。

Description

基于大数据的下载推荐系统及方法
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的下载推荐系统及方法。
背景技术
“表情包”指的是一种利用图片来表示感情的方式。表情包是在社交软件活跃之后,形成的一种流行文化,表情包流行于互联网上面,基本人人都会发表情包。在移动互联网时期,人们以时下流行的明星、语录、动漫、影视截图为素材,配上一系列相匹配的文字,用以表达特定的情感。现有技术中,常常会出现用户的表情包不够用的情况。
发明内容
本发明的目的在于提供一种基于大数据的下载推荐系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的下载推荐系统,所述推荐系统包括聊天输入采集模块、标识识别模块、文字监测模块和分析推荐模块,所述聊天输入采集模块用于获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字,所述标识识别模块获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,在聊天标识为第一标识时,令文字监测模块工作,在聊天标识为第二标识时,令文字监测模块停止工作;所述文字监测模块将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,其中,用户表情包库为用于存储用户收藏的表情包,在用户表情包库里不存在表情包与输入文字相匹配时,令分析推荐模块采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包。。
进一步的,所述推荐系统还包括标识设置模块,所述标识设置模块包括第一聊天记录获取模块、发送信息采集模块、标识综合值计算模块和标识综合值比较模块,所述第一聊天记录获取模块用于获取用户与聊天对象在预设第一时间段内的聊天记录,所述发送信息采集模块用于统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数、获取相邻两个表情包之间间隔的发送信息的条数以及相邻两个表情包之间间隔的发送信息的条数,所述标识综合值计算模块根据发送信息采集模块采集到的数据计算聊天对象的标识综合值,所述标识综合值比较模块将标识综合值与标识综合阈值进行比较,在标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,在标识综合值大于等于标识综合阈值时,设置该聊天对象的聊天标识为第二标识。
进一步的,所述分析推荐模块包括主体对象选取模块、候选表情包选取模块、待推荐表情包选取模块和识别下载模块,所述主体对象选取模块采集用户最近一段时间所使用的表情包,并从中选取待推荐表情包的主体对象,所述候选表情包选取模块在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包,所述待推荐表情包选取模块包括文字高度宽度采集模块、文字个数采集模块、综合参照值计算模块和综合参照值排序模块,所述文字高度宽度采集模块采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0,所述文字个数采集模块统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0,所述综合参照值计算模块根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx,所述综合参照值排序模块将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包,所述识别下载模块获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库。
进一步的,所述主体对象选取模块包括参考表情包选取模块、相似度比较模块和优选表情包选取模块,所述参考表情包选取模块采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,所述相似度比较模块获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,在相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,所述优选表情包选取模块统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象。
一种基于大数据的下载推荐方法,所述下载推荐方法包括以下步骤:
步骤S1:获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字;
步骤S2:获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,当聊天标识为第一标识时,开启输入文字监测,转步骤S3;当聊天标识为第二标识时,关闭输入文字监测;
步骤S3:将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,否则,转步骤S4,其中,用户表情包库用于存储用户收藏的表情包;
步骤S4:采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包。
进一步的,所述预设的聊天对象的聊天标识包括:
采集用户与聊天对象在预设第一时间段内的聊天记录,统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数p,
依次分别获取相邻两个表情包之间间隔的发送信息的条数N1、N2、…、Np-1,对各个数据进行归一化处理得到处理值Qi=(Ni-Nmin)/(Nmax-Nmin),其中,Ni表示第i个表情包与其相邻的第i+1个表情包之间间隔的发送信息的条数,Qi表示第i个条数的归一化处理得到的处理值,计算条数N1、N2、…、Np-1所对应的处理值的平均值Qx,Nmin为条数N1、N2、…、Np-1中的最小值,Nmax为条数N1、N2、…、Np-1中的最大值,
那么标识综合值U=0.68*(1-p/M)+0.32*Qx,
如果标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,否则,设置该聊天对象的聊天标识为第二标识。
进一步的,所述步骤S4进一步包括:
采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,分别获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,当相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象,
在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包;通过表情包的主体对象进行筛选,一方面能够达到减小表情包比较选取范围,提高表情包推荐效率的技术效果,另一方面能到达到提高推荐的表情包的合理性的技术效果;
采集优选表情包的信息,并据此从候选表情包中选出待推荐表情包,将待推荐表情包推送给用户。
进一步的,所述据此从候选表情包中选出待推荐表情包包括以下:
分别采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0
分别统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0
根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx
将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包。
进一步的,所述计算各个候选表情包的综合参照值Wx包括:
Wx=|Fx-F0|/F0+|Gx-G0|/G0,其中,Fx为候选表情包的文字参照值。
进一步的,所述下载推荐方法还包括:
获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库,从而达到了对用户表情包库动态调整的技术效果。
与现有技术相比,本发明所达到的有益效果是:本发明通过采集用户与聊天对象的历史聊天记录并据此判断是否要为用户推送表情包,在用户表情包数据库没有相应的表情包时,根据用户历史所使用的表情包的特征,为用户推荐表情包,在用户选取推荐的表情包,下载相应的表情包,丰富了用户表情包库。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于大数据的下载推荐系统的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:一种基于大数据的下载推荐系统,所述推荐系统包括聊天输入采集模块、标识识别模块、文字监测模块和分析推荐模块,所述聊天输入采集模块用于获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字,所述标识识别模块获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,在聊天标识为第一标识时,令文字监测模块工作,在聊天标识为第二标识时,令文字监测模块停止工作;所述文字监测模块将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,其中,用户表情包库为用于存储用户收藏的表情包,在用户表情包库里不存在表情包与输入文字相匹配时,令分析推荐模块采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包。
所述推荐系统还包括标识设置模块,所述标识设置模块包括第一聊天记录获取模块、发送信息采集模块、标识综合值计算模块和标识综合值比较模块,所述第一聊天记录获取模块用于获取用户与聊天对象在预设第一时间段内的聊天记录,所述发送信息采集模块用于统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数、获取相邻两个表情包之间间隔的发送信息的条数以及相邻两个表情包之间间隔的发送信息的条数,所述标识综合值计算模块根据发送信息采集模块采集到的数据计算聊天对象的标识综合值,所述标识综合值比较模块将标识综合值与标识综合阈值进行比较,在标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,在标识综合值大于等于标识综合阈值时,设置该聊天对象的聊天标识为第二标识。
所述分析推荐模块包括主体对象选取模块、候选表情包选取模块、待推荐表情包选取模块和识别下载模块,所述主体对象选取模块采集用户最近一段时间所使用的表情包,并从中选取待推荐表情包的主体对象,所述候选表情包选取模块在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包,所述待推荐表情包选取模块包括文字高度宽度采集模块、文字个数采集模块、综合参照值计算模块和综合参照值排序模块,所述文字高度宽度采集模块采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0,所述文字个数采集模块统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0,所述综合参照值计算模块根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx,所述综合参照值排序模块将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包,所述识别下载模块获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库。
所述主体对象选取模块包括参考表情包选取模块、相似度比较模块和优选表情包选取模块,所述参考表情包选取模块采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,所述相似度比较模块获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,在相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,所述优选表情包选取模块统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象。
一种基于大数据的下载推荐方法,所述下载推荐方法包括以下步骤:
步骤S1:获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字;
步骤S2:获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,当聊天标识为第一标识时,开启输入文字监测,转步骤S3;当聊天标识为第二标识时,关闭输入文字监测;
所述预设的聊天对象的聊天标识包括:
采集用户与聊天对象在预设第一时间段内的聊天记录,统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数p,
依次分别获取相邻两个表情包之间间隔的发送信息的条数N1、N2、…、Np-1,对各个数据进行归一化处理得到处理值Qi=(Ni-Nmin)/(Nmax-Nmin),其中,Ni表示第i个表情包与其相邻的第i+1个表情包之间间隔的发送信息的条数,Qi表示第i个条数的归一化处理得到的处理值,计算条数N1、N2、…、Np-1所对应的处理值的平均值Qx,Nmin为条数N1、N2、…、Np-1中的最小值,Nmax为条数N1、N2、…、Np-1中的最大值,
那么标识综合值U=0.68*(1-p/M)+0.32*Qx,
如果标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,否则,设置该聊天对象的聊天标识为第二标识。本实施例中,相邻两个表情包是指用户发送给聊天对象的信息中相邻的两个表情包。通过采集用户与聊天对象历史聊天记录中发送表情包的情况判断用户在该次聊天记录中是否有发送表情包的倾向;
步骤S3:将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,否则,转步骤S4,其中,用户表情包库为用于存储用户收藏的表情包;
步骤S4:采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包:
采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,分别获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,当相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象,
在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包;根据用户最近一段时间所使用的表情包的主体对象来筛选出候选表情包,不仅能够提高表情包推荐效率,而且能够使得选取出的表情包更加贴合用户的喜好;
采集优选表情包的信息,并据此从候选表情包中选出待推荐表情包,将待推荐表情包推送给用户;
所述据此从候选表情包中选出待推荐表情包包括以下:
分别采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0
分别统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0
根据文字参照值F、文字参照值的平均值F0、文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx=|Fx-F0|/F0+|Gx-G0|/G0,其中,Fx为候选表情包的文字参照值;
将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包;
获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库。通过表情包的主体对象、表情包中文字大小和文字个数来获取用户的表情包使用习惯,从而使得推荐给用户的表情包更符合用户的使用喜好。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于大数据的下载推荐系统,其特征在于,所述推荐系统包括聊天输入采集模块、标识识别模块、文字监测模块和分析推荐模块,所述聊天输入采集模块用于获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字,所述标识识别模块获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,在聊天标识为第一标识时,令文字监测模块工作,在聊天标识为第二标识时,令文字监测模块停止工作;所述文字监测模块将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送表情包,其中,用户表情包库为用于存储用户收藏的表情包,在用户表情包库里不存在表情包与输入文字相匹配时,令分析推荐模块采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包;
所述推荐系统还包括标识设置模块,所述标识设置模块包括第一聊天记录获取模块、发送信息采集模块、标识综合值计算模块和标识综合值比较模块,所述第一聊天记录获取模块用于获取用户与聊天对象在预设第一时间段内的聊天记录,所述发送信息采集模块用于统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数p、获取相邻两个表情包之间间隔的发送信息的条数,所述标识综合值计算模块根据发送信息采集模块采集到的数据计算聊天对象的标识综合值,对各个数据进行归一化处理得到处理值Qi=(Ni-Nmin)/(Nmax-Nmin),其中,Ni表示第i个表情包与其相邻的第i+1个表情包之间间隔的发送信息的条数N1、N2、…、Np-1,Qi表示第i个条数的归一化处理得到的处理值,计算条数N1、N2、…、Np-1所对应的处理值的平均值Qx, Nmin为条数N1、N2、…、Np-1中的最小值,Nmax为条数N1、N2、…、Np-1中的最大值,所述标识综合值比较模块将标识综合值与标识综合阈值进行比较,在标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,在标识综合值大于等于标识综合阈值时,设置该聊天对象的聊天标识为第二标识 ,
那么标识综合值U=0.68*(1-p/M)+0.32*Qx,
所述分析推荐模块包括主体对象选取模块、候选表情包选取模块、待推荐表情包选取模块和识别下载模块,所述主体对象选取模块包括参考表情包选取模块、相似度比较模块和优选表情包选取模块,所述参考表情包选取模块采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,所述相似度比较模块获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,在相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,所述优选表情包选取模块统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象,所述候选表情包选取模块在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包,所述待推荐表情包选取模块包括文字高度宽度采集模块、文字个数采集模块、综合参照值计算模块和综合参照值排序模块,所述文字高度宽度采集模块采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0,所述文字个数采集模块统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0,所述综合参照值计算模块根据文字参照值F、文字参照值的平均值F0、各个候选表情包中的文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx,所述综合参照值排序模块将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包,所述识别下载模块获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库;
所述计算各个候选表情包的综合参照值Wx包括:
Wx=|Fx-F0|/F0+|Gx-G0|/G0,其中,Fx为候选表情包的文字参照值。
2.一种基于大数据的下载推荐方法,其特征在于,包括以下步骤:
步骤S1:获取用户的聊天输入信息,所述聊天输入信息包括聊天对象和输入文字;
步骤S2:获取预设的聊天对象的聊天标识,所述聊天标识包括第一标识和第二标识,当聊天标识为第一标识时,开启输入文字监测,转步骤S3;当聊天标识为第二标识时,关闭输入文字监测;
步骤S3:将输入文字与用户表情包库里面的表情包进行匹配,如果用户表情包库里存在表情包与输入文字相匹配,向用户推送该表情包,否则,转步骤S4,其中,用户表情包库用于存储用户收藏的表情包;
步骤S4:采集用户历史使用表情包,根据历史使用表情包的相关信息推荐下载表情包;
所述预设的聊天对象的聊天标识包括:
采集用户与聊天对象在预设第一时间段内的聊天记录,统计用户在该聊天记录中发送信息给聊天对象的条数M以及发送信息的内容中包括表情包的条数p,
依次分别获取相邻两个表情包之间间隔的发送信息的条数N1、N2、…、Np-1,对各个数据进行归一化处理得到处理值Qi=(Ni-Nmin)/(Nmax-Nmin),其中,Ni表示第i个表情包与其相邻的第i+1个表情包之间间隔的发送信息的条数,Qi表示第i个条数的归一化处理得到的处理值,计算条数N1、N2、…、Np-1所对应的处理值的平均值Qx, Nmin为条数N1、N2、…、Np-1中的最小值,Nmax为条数N1、N2、…、Np-1中的最大值,
那么标识综合值U=0.68*(1-p/M)+0.32*Qx,
如果标识综合值小于标识综合阈值,设置该聊天对象的聊天标识为第一标识,否则,设置该聊天对象的聊天标识为第二标识;
所述步骤S4进一步包括:
采集用户最近一段时间所使用的表情包,并从中筛选出包含文字的表情包为参考表情包,分别获取各个参考表情包的主体对象,比较两两参考表情包的主体对象的相似度,当相似度大于等于第一相似度阈值时,这两个参考表情包互为彼此的相近表情包,统计每个参考表情包的相近表情包的个数,将参考表情包按照其相近表情包的个数从大到小的顺序进行排序,选取排序前三的表情包为优选表情包,并获取优选表情包的主体对象,
在网上搜索与输入文字相匹配的表情包,并对其进行筛选,筛选出主体对象为优选表情包的主体对象的表情包为候选表情包;
采集优选表情包的信息,并据此从候选表情包中选出待推荐表情包,将待推荐表情包推送给用户;
所述据此从候选表情包中选出待推荐表情包包括以下:
分别采集各个参考表情包和各个候选表情包中单个文字的高度H和宽度K以及与文字的高度相对应的参考表情包的边长D,与文字的宽度相对应的参考表情包的边长E,文字参照值F=H/D+K/E,统计所有参考表情包的文字参照值的平均值F0
分别统计各个参考表情包中的文字个数以及各个候选表情包中的文字个数Gx,统计所有参考表情包的文字个数平均值G0
根据文字参照值F、文字参照值的平均值F0、各个候选表情包中的文字个数Gx和文字个数平均值G0计算各个候选表情包的综合参照值Wx
将各个候选表情包的综合参照值按照从小到大的顺序排序,选取排序前五的表情包为待推荐表情包;
所述计算各个候选表情包的综合参照值Wx包括:
Wx=|Fx-F0|/F0+|Gx-G0|/G0,其中,Fx为候选表情包的文字参照值;
所述下载推荐方法还包括:
获取用户选取的待推荐表情包,下载该待推荐表情包,并将其存入用户表情包库。
CN202110552226.2A 2021-05-20 2021-05-20 基于大数据的下载推荐系统及方法 Active CN113268663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110552226.2A CN113268663B (zh) 2021-05-20 2021-05-20 基于大数据的下载推荐系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110552226.2A CN113268663B (zh) 2021-05-20 2021-05-20 基于大数据的下载推荐系统及方法

Publications (2)

Publication Number Publication Date
CN113268663A CN113268663A (zh) 2021-08-17
CN113268663B true CN113268663B (zh) 2023-04-18

Family

ID=77232053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110552226.2A Active CN113268663B (zh) 2021-05-20 2021-05-20 基于大数据的下载推荐系统及方法

Country Status (1)

Country Link
CN (1) CN113268663B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618222A (zh) * 2015-01-07 2015-05-13 腾讯科技(深圳)有限公司 一种匹配表情图像的方法及装置
CN108227956A (zh) * 2018-01-10 2018-06-29 厦门快商通信息技术有限公司 一种聊天工具表情推荐方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624648B (zh) * 2012-03-09 2015-04-08 北京百舜华年文化传播有限公司 一种即时通讯方法、装置、终端设备和系统
JP6242722B2 (ja) * 2014-03-13 2017-12-06 株式会社東芝 文字認識装置、区分機、およびプログラム
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN108401005B (zh) * 2017-02-08 2021-05-14 腾讯科技(深圳)有限公司 一种表情推荐方法和装置
CN109977409A (zh) * 2019-03-28 2019-07-05 北京科技大学 一种基于用户聊天习惯的智能表情推荐方法和系统
CN110399555A (zh) * 2019-07-19 2019-11-01 马鞍山微光网络科技有限公司 基于大数据的精准推荐云下载服务系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618222A (zh) * 2015-01-07 2015-05-13 腾讯科技(深圳)有限公司 一种匹配表情图像的方法及装置
CN108227956A (zh) * 2018-01-10 2018-06-29 厦门快商通信息技术有限公司 一种聊天工具表情推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于WEB的表情图片模块的动态管理与实现;屈佳等;《电子设计工程》;20160505(第09期);185-187 *

Also Published As

Publication number Publication date
CN113268663A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN108241667B (zh) 用于推送信息的方法和装置
US11449916B2 (en) Information push method and apparatus, server, and storage medium
CN101026802B (zh) 一种信息推送方法与装置
CN110543598B (zh) 信息推荐方法、装置及终端
CN109408665A (zh) 一种信息推荐方法及装置、存储介质
US9477747B2 (en) Method and apparatus for acquiring hot topics
CN109241451B (zh) 一种内容组合推荐方法、装置及可读存储介质
CN105574030B (zh) 一种信息搜索方法及装置
US20090171960A1 (en) Method and system for context-aware data prioritization
CN109800769B (zh) 产品分类控制方法、装置、计算机设备及存储介质
CN116455861B (zh) 一种基于大数据的计算机网络安全监测系统及方法
CN113536104A (zh) 一种信息推荐方法、装置、设备及存储介质
CN110322899A (zh) 用户智能分类方法、服务器及存储介质
CN106204053A (zh) 信息类目错放识别方法和装置
CN117495485A (zh) 产品推荐方法、设备及可读存储介质
TW201642195A (zh) 商品相關網路文章之自動圖文摘要方法及系統
CN113158048A (zh) 一种基于特征识别的移动互联网浏览内容智能推荐方法、系统、设备及存储介质
CN103377185A (zh) 一种为短文本自动添加标签的方法及装置
CN113268663B (zh) 基于大数据的下载推荐系统及方法
KR20140035221A (ko) 분야별 전문가 큐레이션 추천 시스템 및 이를 이용한 분야별 전문가 추천 방법
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
CN108024148B (zh) 基于行为特征的多媒体文件识别方法、处理方法及装置
CN117436956A (zh) 基于广告推送的智能营销管理系统
Yabas et al. Churn prediction in subscriber management for mobile and wireless communications services
CN110837553A (zh) 搜索邮件的方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230224

Address after: Room 704, building 5, No. 556, Changjiang Road, high tech Zone, Suzhou, Jiangsu 215000

Applicant after: SUZHOU YUDESHUI ELECTRICAL TECHNOLOGY Co.,Ltd.

Address before: 215000 No. 338, Jinding West Road, Wujiang District, Suzhou City, Jiangsu Province

Applicant before: Lv Naifeng

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant