CN118195862B - 一种线上线下育儿知识获取渠道分析管理系统 - Google Patents
一种线上线下育儿知识获取渠道分析管理系统 Download PDFInfo
- Publication number
- CN118195862B CN118195862B CN202410616060.XA CN202410616060A CN118195862B CN 118195862 B CN118195862 B CN 118195862B CN 202410616060 A CN202410616060 A CN 202410616060A CN 118195862 B CN118195862 B CN 118195862B
- Authority
- CN
- China
- Prior art keywords
- child
- article
- knowledge
- care
- care knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 230000010365 information processing Effects 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000013145 classification model Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000000556 factor analysis Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008131 children development Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种线上线下育儿知识获取渠道分析管理系统,包括信息收集单元、分类处理单元、预处理单元、渠道分析单元、信息处理单元、偏好推荐单元,本发明涉及渠道管理技术领域。该线上线下育儿知识获取渠道分析管理系统,通过精确分类、有效阅读量分析、平均阅读量计算、优先推荐因子分析和目标用户类型关注度计算等技术手段,能够为用户提供更准确、个性化的育儿知识推荐服务,能够帮助父母在众多的育儿信息中,找到最适合自己的育儿知识和方法,通过收集各个渠道内的育儿知识文章并做分类处理,满足父母多样化的育儿需求,有助于提高用户满意度、增加用户黏性和使用频率,同时为育儿知识提供方提供了更好的市场推广和宣传机会。
Description
技术领域
本发明涉及渠道管理技术领域,具体为一种线上线下育儿知识获取渠道分析管理系统。
背景技术
在当代社会,随着互联网技术的飞速发展和普及,人们获取信息的方式已经发生了翻天覆地的变化。特别是对于新手父母来说,他们往往通过网络来获取育儿知识和信息。然而,由于网络信息的海量性和复杂性,如何有效地获取、筛选、管理和利用这些育儿信息成了一个重要问题。
目前,虽然有许多网站和应用程序提供了育儿知识和信息,但这些信息往往是散乱的,没有进行有效的分类和管理。这给父母寻找所需信息带来了困扰,也使得一些有价值的信息无法被有效利用。
因此,急需一种能够有效管理、筛选和推荐育儿知识和信息的系统,以帮助父母更好地获取和利用这些信息,提高育儿的效率和质量。
发明内容
针对现有技术的不足,本发明提供了一种线上线下育儿知识获取渠道分析管理系统,解决了背景技术中所提出的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种线上线下育儿知识获取渠道分析管理系统,包括:
信息收集单元,用于收集各个渠道内育儿知识文章,收集渠道内各个文章类别组内各个育儿知识文章的文字数量和发布时间,以及收集各个育儿知识文章的总曝光量及其各个育儿知识文章中各个总曝光量对应的浏览时长,浏览时长即为用户查看对应育儿知识文章中的时间,同时收集各个育儿知识文章的在各个标准时段内的曝光单量;
且其还用于收集目标用户的使用记录,使用记录包含目标用户在育儿知识获取渠道对应平台上预先选定的育儿知识类型、目标用户的搜索记录、目标用户的文章浏览记录;
分类处理单元,用于将从所有获取渠道中获取的所有育儿知识文章导入预训练的知识分类模型中,随之得到划分至多个预设的文章类别组中的育儿知识文章;
预处理单元,用于依据各个文章类别组内各个育儿知识文章的浏览时长和各个育儿知识文章的总曝光量分析出获取渠道内各个文章类别组内育儿知识文章的有效阅读量;
渠道分析单元,用于依据预处理单元得出的结果分析出获取渠道内各个文章类别组的优先推荐因子;
分类处理单元,用于将目标用户的搜索记录、目标用户的文章浏览记录导入预训练的知识分类模型中并得到对应的搜索和浏览的育儿知识类型;
信息处理单元,用于依据目标用户的使用记录计算出目标用户的类型关注度;
偏好推荐单元,用于根据目标用户的类型关注度,对目标用户进行获取渠道推荐。
优选的,所述预处理单元的具体方式如下:
SF1、选取一个育儿知识文章,获取该育儿知识文章的总曝光量内各次曝光对应的浏览时长,同时获取该育儿知识文章的文字数量;
SF2、将该育儿知识文章的文字数量乘以预设的单字阅读时间系数,得到该育儿知识文章的浏览阈时;
SF3、选取总曝光量内单次曝光对应的浏览时长;
将浏览时长与浏览阈时进行比较,依据比较结果,为预设的有效阅读量赋值:
SF4、将所有总曝光量内各次曝光对应的浏览时长进行比较,依据比较结果,为预设的有效阅读量赋值,直至所有总曝光量对应的浏览时长全部比较结束,得到该育儿知识文章的有效阅读量的最终赋值;
SF5、同时,获取该育儿知识文章的发布时间,并将其发布时间与当前时间进行差值计算,得到该育儿知识文章的曝光时间差;
SF6、之后通过公式YP=YY/BC,得到该育儿知识文章的平均阅读量;
式中,YP表示为该育儿知识文章的平均阅读量,YY表示为该育儿知识文章的有效阅读量的最终赋值,BC表示为该育儿知识文章的曝光时间差;
SF7、获取各个标准时段内的曝光单量,并依据步骤SF4的方式,分析出各个标准时段内有效阅读量的最终赋值,并将各个标准时段内有效阅读量的最终赋值标记为BYi,i=1、2、……n,n表示为标准时段的数量,同时也表示为曝光时间差;
SF8、通过公式,计算出该育儿知识文章对应各个标准时段内有效阅读量的偏离值P1;
SF9、通过公式,计算得到该育儿知识文章的权重值DX;
其中β1、β2与β3均为预设的比例系数。
优选的,步骤SF3中有效阅读量的赋值方式如下:
若浏览时长大于等于浏览阈时,则表示该总曝光量内该次的曝光为有效曝光,且将有效阅读量的值加一,反之,则不为有效阅读量赋值。
优选的,所述渠道分析单元的具体分析方式如下:
SA1、选取一个文章类别组,获取该文章类别组内对应各个育儿知识文章的权重值,并将其标记为DXj,j=1、2、……m0,m0表示该文章类别组内对应各个育儿知识文章的数量;
SA2、随后将各个DXj分别与预设的权重阈值DY1和DY2进行比较分类,且DY1>DY2:
SA3、根据比较分类结果结合预设的优先推荐因子计算公式,得到对应文章类别组的优先推荐因子,其中λ1、λ2和λ3均为预设的固定系数;
以此类推,得到所有获取渠道内各个文章类别组的优先推荐因子。
优选的,步骤SA2中的比较分类方式如下:
若DXj>DY1,则将其纳入预先建立的第一权重集合中,并将第一权重集合中DXj重新标记为DXt1;
若DY1≥DXj>DY2,则将其纳入预先建立的第二权重集合中,并将第一权重集合中DXj重新标记为DXt2;
若DY2≥DXj,则将其纳入预先建立的第三权重集合中,并将第一权重集合中DXj重新标记为DXt3;
其中t1=1、2、……m1,t2=1、2、……m2,t3=1、2、……m3,且m1+m2+m3=m0;
优选的,步骤SA3中的公式如下:
。
优选的,所述信息处理单元的具体计算方式如下:
SE1、首先为目标用户在获取渠道对应平台上预先选定的育儿知识类型赋值,其赋值系数为1,未选定的育儿知识类型赋值系数为0;
SE2、在特定周期内,获取目标用户的搜索记录总量和浏览记录总量,同时获取各个育儿知识类型的搜索记录单量和浏览记录单量;
SE3、通过类型搜索比=搜索记录单量/搜索记录总量、类型浏览比=浏览记录单量/浏览记录总量,分别得出目标用户的各个育儿知识类型的类型搜索比和类型浏览比;
SE4、随后通过预设的类型关注度计算公式,获取到目标用户对不同育儿知识类型的类型关注度。
优选的,步骤SE4中的公式如下:
,
式中,Gr表示为类型关注度,SLr表示为类型搜索比,LLr表示为类型浏览比,r=1、2、……e,e表示目标用户预先选定的育儿知识类型、对应的搜索和浏览的育儿知识类型之间中不同育儿知识类型的数量,FX表示为赋值系数,α1、α2均为预设的影响系数。
优选的,所述分类处理单元中预训练的知识分类模型的划分方式为:
a)从育儿知识文章中提取关键词或关键短语,其采用TF-IDF方法;
b)依据所有预设的文章类别组,创建一个包含所有可能类别的关键词词汇表,且每个类别都有一组相关的关键词。
c)将提取的关键词与词汇表中的关键词进行匹配,确定哪些文章类别组中关键词在育儿知识文章中出现。
d)使用自然语言处理技术,来理解育儿知识文章中的语义内容,其采用词嵌入技术。
e)根据关键词匹配和语义分析的结果,并采用支持向量机来确定育儿知识文章对应划分的预设的文章类别组。
优选的,所述偏好推荐单元具体推荐方式如下:
首先在信息处理单元针对目标用户多个育儿知识类型对应的类型关注度计算结果中,选取类型关注度最高的育儿知识类型;
随之依据类型关注度最高的育儿知识类型,选取对应的文章类别组,并从各个渠道内该文章类别组的优先推荐因子中,选取值最大的一个优先推荐因子对应的一个渠道,随之将该渠道推荐给该目标用户。
本发明提供了一种线上线下育儿知识获取渠道分析管理系统。与现有技术相比具备以下有益效果:
全面性:该发明通过收集各个渠道内的育儿知识文章,进行分类处理和分析,能够全面地获取和利用各种育儿信息,满足父母多样化的育儿需求。
精准性:该发明通过对育儿知识文章进行分类和分析,能够准确地识别出各个类别组内的育儿知识文章,帮助父母快速找到所需的育儿信息。
实用性:该发明通过分析出各个渠道内各个文章类别组的优先推荐因子,能够帮助父母在众多的育儿信息中,找到最适合自己的育儿知识和方法。
个性化:该发明通过对目标用户的使用记录进行分析,能够根据用户的需求和兴趣,提供个性化的育儿信息推荐,提高用户的使用体验和满意度。
高效性:该发明通过预训练的知识分类模型对育儿知识文章进行分类识别,能够快速地处理大量的育儿信息,提高信息处理的效率。
创新性:该发明采用了关键词提取、语义分析等自然语言处理技术,对育儿知识文章进行深度分析和理解,提高了信息处理的准确性和深度。
灵活性:该发明的技术方案可以灵活应用于各种不同的育儿知识获取渠道,具有很好的通用性和扩展性。
总的来说,该发明提供了一种有效的育儿知识获取渠道分析管理系统,能够帮助父母更好地获取和利用育儿知识,提高育儿的效率和质量。
附图说明
图1为本发明的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
作为本发明的实施例一
请参阅图1,本发明提供一种技术方案:一种线上线下育儿知识获取渠道分析管理系统,包括:
信息收集单元,用于收集各个渠道内育儿知识文章;
分类处理单元,用于将从所有获取渠道中获取的所有育儿知识文章导入预训练的知识分类模型中,随之得到划分至多个预设的文章类别组中的育儿知识文章;
信息收集单元还用于收集渠道内各个文章类别组内各个育儿知识文章的文字数量和发布时间,在该实施例中,文字数量包含文章中的文本的文字数量和图片中含有的文字数量,以及收集各个育儿知识文章的总曝光量及其各个育儿知识文章中各个总曝光量对应的浏览时长;
其中,图片中含有的文字数量通过光学字符识别(OCR)技术提取,具体为当文本以图像形式存在时,可以使用OCR技术将图像中的文本转换为可编辑和可搜索的格式,然后再进行内容提取;
浏览时长即为用户查看对应育儿知识文章中的时间;
同时,收集各个育儿知识文章的在各个标准时段内的曝光单量,在该实施例中,标准时段的周期为1天;
预处理单元,用于依据各个文章类别组内各个育儿知识文章的浏览时长和各个育儿知识文章的总曝光量分析出获取渠道内各个文章类别组内育儿知识文章的有效阅读量;
具体方式如下:
以一个育儿知识文章为例:
SF1、获取该育儿知识文章的总曝光量内各次曝光对应的浏览时长,同时获取该育儿知识文章的文字数量;
SF2、将该育儿知识文章的文字数量乘以预设的单字阅读时间系数,得到该育儿知识文章的浏览阈时;
SF3、选取总曝光量内单次曝光对应的浏览时长;
将浏览时长与浏览阈时进行比较,依据比较结果,为预设的有效阅读量赋值:
其方式如下:
若浏览时长大于等于浏览阈时,则表示该总曝光量内该次的曝光为有效曝光,且将有效阅读量的值加一;
若浏览时长小于浏览阈时,则表示该总曝光量内该次的曝光为无效曝光,并不为有效阅读量赋值;
SF4、按照步骤SF3方式,将所有总曝光量内各次曝光对应的浏览时长进行比较,依据比较结果,为预设的有效阅读量赋值,直至所有总曝光量对应的浏览时长全部比较结束,得到该育儿知识文章的有效阅读量的最终赋值;
SF5、同时,获取该育儿知识文章的发布时间,并将其发布时间与当前时间进行差值计算,得到该育儿知识文章的曝光时间差;
其差值计算公式为:曝光时间差=当前时间-发布时间,在该实施例中,发布时间和当前时间的时间单位以天为单位;
SF6、之后通过公式YP=YY/BC,得到该育儿知识文章的平均阅读量;
式中,YP表示为该育儿知识文章的平均阅读量,YY表示为该育儿知识文章的有效阅读量的最终赋值,BC表示为该育儿知识文章的曝光时间差;
本实施例通过公式计算出文章的平均阅读量,可以评估文章的阅读效果和受众接受程度。这有助于了解文章的受欢迎程度和传播效果,为后续的内容优化和推荐提供参考依据。
SF7、获取各个标准时段内的曝光单量,并依据步骤SF4的方式,分析出各个标准时段内有效阅读量的最终赋值,并将各个标准时段内有效阅读量的最终赋值标记为BYi,i=1、2、……n,n表示为标准时段的数量,同时也表示为曝光时间差,在该步骤中,标准时段的数量与曝光时间差的含义相同,即BC=n;
SF8、通过公式,计算出该育儿知识文章对应各个标准时段内有效阅读量的偏离值P1;
SF9、通过公式,计算得到该育儿知识文章的权重值DX;
其中β1、β2与β3均为预设的比例系数;
本实施例通过分析总曝光量内单次曝光对应的浏览时长,可以得出有效阅读量的最终赋值。这种分析方法考虑了文章的文字数量、发布时间和曝光时间差等因素,能够更准确地评估文章的有效阅读量。
渠道分析单元,用于依据预处理单元得出的结果分析出获取渠道内各个文章类别组的优先推荐因子;
具体方式如下:
选取一个文章类别组;
SA1、获取该文章类别组内对应各个育儿知识文章的权重值,并将其标记为DXj,j=1、2、……m0,m0表示该文章类别组内对应各个育儿知识文章的数量;
SA2、随后将各个DXj分别与预设的权重阈值DY1和DY2进行比较分类,且DY1>DY2:
其方式如下:
若DXj>DY1,则将其纳入预先建立的第一权重集合中,并将第一权重集合中DXj重新标记为DXt1;
若DY1≥DXj>DY2,则将其纳入预先建立的第二权重集合中,并将第一权重集合中DXj重新标记为DXt2;
若DY2≥DXj,则将其纳入预先建立的第三权重集合中,并将第一权重集合中DXj重新标记为DXt3;
其中t1=1、2、……m1,t2=1、2、……m2,t3=1、2、……m3,且m1+m2+m3=m0;
SA3、采用公式:,得到对应文章类别组的优先推荐因子,其中λ1、λ2和λ3均为预设的固定系数。
以此类推,得到所有获取渠道内各个文章类别组的优先推荐因子。
本实施例通过分析各个文章类别组的权重值和预设的权重阈值,可以得到对应文章类别组的优先推荐因子。这有助于确定哪些文章类别组更受用户关注和喜爱,从而在推荐时给予更高的优先级。
作为本发明的实施例二,本申请在具体实施时,相较于实施例一,本实施例的技术方案与实施例一的区别仅在于:本实施例中还包括:
信息收集单元还用于收集目标用户的使用记录;
使用记录包含目标用户在育儿知识获取渠道对应平台上预先选定的育儿知识类型、目标用户的搜索记录、目标用户的文章浏览记录;
其中,育儿知识类型为依据文章类别组对应类型的育儿知识文章得到;
分类处理单元还用于将目标用户的搜索记录、目标用户的文章浏览记录导入预训练的知识分类模型中进行育儿知识文章分类识别,随后依据识别结果,得到对应的搜索和浏览的育儿知识类型;
其方式与育儿知识文章的分类识别方式相同;
信息处理单元,用于依据目标用户的使用记录计算出目标用户的类型关注度;
具体方式如下:
SE1、首先为目标用户在获取渠道对应平台上预先选定的育儿知识类型赋值,其赋值系数为1,未选定的育儿知识类型赋值系数为0;
SE2、在特定周期内,获取目标用户的搜索记录总量和浏览记录总量,同时获取各个育儿知识类型的搜索记录单量和浏览记录单量;
SE3、通过类型搜索比=搜索记录单量/搜索记录总量、类型浏览比=浏览记录单量/浏览记录总量,分别得出目标用户的各个育儿知识类型的类型搜索比和类型浏览比;
SE4、随后通过公式,获取到目标用户对不同育儿知识类型的类型关注度Gr;
式中,SLr表示为类型搜索比,LLr表示为类型浏览比,r=1、2、……e,e表示目标用户预先选定的育儿知识类型、对应的搜索和浏览的育儿知识类型之间中不同育儿知识类型的数量,FX表示为赋值系数,α1、α2均为预设的影响系数;
本实施例通过分析目标用户的使用记录,包括预先选定的育儿知识类型、搜索记录和文章浏览记录等,可以计算出目标用户对不同育儿知识类型的类型关注度。这有助于了解用户的兴趣偏好和需求,为用户提供个性化的获取渠道推荐。
偏好推荐单元,用于根据目标用户的类型关注度,对目标用户进行获取渠道推荐;
具体方式如下:
首先在信息处理单元针对目标用户多个育儿知识类型对应的类型关注度计算结果中,选取类型关注度最高的育儿知识类型;
随之依据类型关注度最高的育儿知识类型,选取对应的文章类别组,并从各个渠道内该文章类别组的优先推荐因子中,选取值最大的一个优先推荐因子对应的一个渠道,随之将该渠道推荐给该目标用户。
作为本发明的实施例三,本申请在具体实施时,相较于实施例一和实施例二,本实施例的技术方案是在于将上述实施例一和实施例二的方案进行组合实施,本实施例的技术方案与实施例一和实施例二的区别仅在于:本实施例中预训练的知识分类模型对育儿知识文章的对应划分至多个预设的文章类别组中,是基于关键词或语义对比进行,其方法涉及以下步骤:
第一步、关键词提取
从育儿知识文章中提取关键词或关键短语,其中,提取的关键词或关键短语表示为文章的主题或核心内容;
关键词提取方法包括频率分析、TF-IDF(词频-逆文档频率)、TextRank等,且其为现有技术,故此不做赘述;
第二步、构建词汇表
依据所有预设的文章类别组,创建一个包含所有可能类别的关键词词汇表,且每个类别都有一组相关的关键词;
第三步、关键词匹配
将提取的关键词与词汇表中的关键词进行匹配,确定哪些关键词在文本中出现。
第四步、语义分析
使用自然语言处理技术,如词嵌入(word embeddings)或主题模型(如LDA),来理解文本的语义内容。
第五步、分类决策
根据关键词匹配和语义分析的结果,使用最近邻、决策树、支持向量机中的一种来确定文本属于哪个类别,即将对应的育儿知识文章对应划分至多个预设的文章类别组中。
精确分类:通过预训练的知识分类模型,能够对育儿知识文章进行精确的分类,将文章划分至预设的文章类别组中。这种分类方法基于关键词提取、词汇表构建、关键词匹配、语义分析和分类决策等步骤,能够更好地理解文本的主题和内容,提高分类的准确性。
在该实施例中,文章类别组与预设设置得到,其按照以下方式进行分类得到:
按照孩子的发展阶段分类:将育儿知识文章分别划分至新生儿期文章类别组、婴儿期文章类别组、幼儿期文章类别组、学龄前期文章类别组中;
其中,新生儿期文章类别组中育儿知识文章涵盖有新生儿期的护理,婴儿期文章类别组中育儿知识文章涵盖有婴儿期的辅食添加,幼儿期文章类别组中育儿知识文章涵盖有幼儿期的教育引导;
按照育儿主题分类:将育儿知识文章根据不同的育儿主题进行分类,并获得相应的文章类别组,如喂养知识文章类别组、睡眠训练文章类别组、健康护理文章类别组、早教方法文章类别组、情绪管理文章类别组;
按照文章的形式和用途分类:将育儿知识文章分别划分至指导文章类别组、信息文章类别组和经验文章类别组,其中,指导文章类别组内育儿知识文章可以为育儿者提供具体的步骤和方法;信息文章类别组可以为育儿者提供最新的研究成果和医疗建议;经验文章类别组可以为育儿者提供来自其他父母的亲身体验和建议;
按照父母的角色分类:将育儿知识文章针对父亲或母亲的不同角色和需求进行分类,并获得相应的父亲育儿文章类别组和母亲育儿文章类别组;
按照特殊需求分类:根据育儿知识文章内容对应的特殊需求,将其划分为多个不同需求的文章类别组中,如早产儿文章类别组、双胞胎文章类别组、特殊教育需求文章类别组,对应需求的文章类别组中的育儿知识文章可以专门针对这些群体提供相关知识和指导;
按照资源和产品推荐分类:根据育儿知识文章内容对应推荐的育儿资源和产品,将其划分为多个不同需求的文章类别组中,如书籍文章类别组、玩具文章类别组、课程文章类别组,其帮助父母选择合适的育儿工具;
多样化分类方式:该专利提供了多种分类方式,包括按孩子的发展阶段、育儿主题、文章形式和用途、父母角色和特殊需求等进行分类。这种多样化的分类方式能够满足不同用户的需求,提供更全面和个性化的育儿知识推荐。
作为本发明的实施例四,本申请在具体实施时,相较于实施例一、实施例二和实施例三,本实施例的技术方案是在于将上述实施例一、实施例二、实施例三的方案进行组合实施。
总的来说,本发明通过精确分类、有效阅读量分析、平均阅读量计算、优先推荐因子分析和目标用户类型关注度计算等技术手段,能够为用户提供更准确、个性化的育儿知识推荐服务。这有助于提高用户满意度、增加用户黏性和使用频率,同时为育儿知识提供方提供了更好的市场推广和宣传机会。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
同时本说明书中未作详细描述的内容均属于本领域技术人员公知的现有技术。
以上对本发明的一个实施例进行了详细说明,但内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。
Claims (9)
1.一种线上线下育儿知识获取渠道分析管理系统,其特征在于,包括:
信息收集单元,用于收集各个渠道内育儿知识文章,收集渠道内各个文章类别组内各个育儿知识文章的文字数量和发布时间,以及收集各个育儿知识文章的总曝光量及其各个育儿知识文章中各个总曝光量对应的浏览时长,浏览时长即为用户查看对应育儿知识文章中的时间,同时收集各个育儿知识文章的在各个标准时段内的曝光单量;且其还用于收集目标用户的使用记录,使用记录包含目标用户在育儿知识获取渠道对应平台上预先选定的育儿知识类型、目标用户的搜索记录、目标用户的文章浏览记录;
分类处理单元,用于将从所有获取渠道中获取的所有育儿知识文章导入预训练的知识分类模型中,随之得到划分至多个预设的文章类别组中的育儿知识文章;且其还用于将目标用户的搜索记录、目标用户的文章浏览记录导入预训练的知识分类模型中并得到对应的搜索和浏览的育儿知识类型;
预处理单元,用于依据各个文章类别组内各个育儿知识文章的浏览时长和各个育儿知识文章的总曝光量分析出获取渠道内各个文章类别组内育儿知识文章的有效阅读量;
渠道分析单元,用于依据预处理单元得出的结果分析出获取渠道内各个文章类别组的优先推荐因子;
信息处理单元,用于依据目标用户的使用记录计算出目标用户的类型关注度;
偏好推荐单元,用于根据目标用户的类型关注度,对目标用户进行获取渠道推荐;
所述偏好推荐单元具体推荐方式如下:
首先在信息处理单元针对目标用户多个育儿知识类型对应的类型关注度计算结果中,选取类型关注度最高的育儿知识类型;
随之依据类型关注度最高的育儿知识类型,选取对应的文章类别组,并从各个渠道内该文章类别组的优先推荐因子中,选取值最大的一个优先推荐因子对应的一个渠道,随之将该渠道推荐给该目标用户。
2.根据权利要求1所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:所述预处理单元的具体方式如下:
SF1、选取一个育儿知识文章,获取该育儿知识文章的总曝光量内各次曝光对应的浏览时长,同时获取该育儿知识文章的文字数量;
SF2、将该育儿知识文章的文字数量乘以预设的单字阅读时间系数,得到该育儿知识文章的浏览阈时;
SF3、选取总曝光量内单次曝光对应的浏览时长;
将浏览时长与浏览阈时进行比较,依据比较结果,为预设的有效阅读量赋值:
SF4、将所有总曝光量内各次曝光对应的浏览时长进行比较,依据比较结果,为预设的有效阅读量赋值,直至所有总曝光量对应的浏览时长全部比较结束,得到该育儿知识文章的有效阅读量的最终赋值;
SF5、同时,获取该育儿知识文章的发布时间,并将其发布时间与当前时间进行差值计算,得到该育儿知识文章的曝光时间差;
SF6、之后通过公式YP=YY/BC,得到该育儿知识文章的平均阅读量;
式中,YP表示为该育儿知识文章的平均阅读量,YY表示为该育儿知识文章的有效阅读量的最终赋值,BC表示为该育儿知识文章的曝光时间差;
SF7、获取各个标准时段内的曝光单量,并依据步骤SF4的方式,分析出各个标准时段内有效阅读量的最终赋值,并将各个标准时段内有效阅读量的最终赋值标记为BYi,i=1、2、……n,n表示为标准时段的数量,同时也表示为曝光时间差;
SF8、通过公式,计算出该育儿知识文章对应各个标准时段内有效阅读量的偏离值P1;
SF9、通过公式,计算得到该育儿知识文章的权重值DX;
其中β1、β2与β3均为预设的比例系数。
3.根据权利要求2所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:步骤SF3中有效阅读量的赋值方式如下:
若浏览时长大于等于浏览阈时,则表示该总曝光量内该次的曝光为有效曝光,且将有效阅读量的值加一,反之,则不为有效阅读量赋值。
4.根据权利要求2所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:所述渠道分析单元的具体分析方式如下:
SA1、选取一个文章类别组,获取该文章类别组内对应各个育儿知识文章的权重值,并将其标记为DXj,j=1、2、……m0,m0表示该文章类别组内对应各个育儿知识文章的数量;
SA2、随后将各个DXj分别与预设的权重阈值DY1和DY2进行比较分类,且DY1>DY2:
SA3、根据比较分类结果结合预设的优先推荐因子计算公式,得到对应文章类别组的优先推荐因子,其中λ1、λ2和λ3均为预设的固定系数;
以此类推,得到所有获取渠道内各个文章类别组的优先推荐因子。
5.根据权利要求4所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:步骤SA2中的比较分类方式如下:
若DXj>DY1,则将其纳入预先建立的第一权重集合中,并将第一权重集合中DXj重新标记为DXt1;
若DY1≥DXj>DY2,则将其纳入预先建立的第二权重集合中,并将第一权重集合中DXj重新标记为DXt2;
若DY2≥DXj,则将其纳入预先建立的第三权重集合中,并将第一权重集合中DXj重新标记为DXt3;
其中t1=1、2、……m1,t2=1、2、……m2,t3=1、2、……m3,且m1+m2+m3=m0。
6.根据权利要求5所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:步骤SA3中优先推荐因子计算公式如下:
,经过计算得到优先推荐因子DZ。
7.根据权利要求6所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:所述信息处理单元的具体计算方式如下:
SE1、首先为目标用户在获取渠道对应平台上预先选定的育儿知识类型赋值,其赋值系数为1,未选定的育儿知识类型赋值系数为0;
SE2、在特定周期内,获取目标用户的搜索记录总量和浏览记录总量,同时获取各个育儿知识类型的搜索记录单量和浏览记录单量;
SE3、通过类型搜索比=搜索记录单量/搜索记录总量、类型浏览比=浏览记录单量/浏览记录总量,分别得出目标用户的各个育儿知识类型的类型搜索比和类型浏览比;
SE4、随后通过预设的类型关注度计算公式,获取到目标用户对不同育儿知识类型的类型关注度。
8.根据权利要求7所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:步骤SE4中的公式如下:
;
式中,Gr表示为类型关注度,SLr表示为类型搜索比,LLr表示为类型浏览比,r=1、2、……e,e表示目标用户预先选定的育儿知识类型、对应的搜索和浏览的育儿知识类型之间中不同育儿知识类型的数量,FX表示为赋值系数,α1、α2均为预设的影响系数。
9.根据权利要求1所述的一种线上线下育儿知识获取渠道分析管理系统,其特征在于:所述分类处理单元中预训练的知识分类模型的划分方式为:
a)从育儿知识文章中提取关键词或关键短语,其采用TF-IDF方法;
b)依据所有预设的文章类别组,创建一个包含所有可能类别的关键词词汇表,且每个类别都有一组相关的关键词;
c)将提取的关键词与词汇表中的关键词进行匹配,确定哪些文章类别组中关键词在育儿知识文章中出现;
d)使用自然语言处理技术,来理解育儿知识文章中的语义内容,其具体采用词嵌入技术;
e)根据关键词匹配和语义分析的结果,并采用支持向量机来确定育儿知识文章对应划分的预设的文章类别组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410616060.XA CN118195862B (zh) | 2024-05-17 | 2024-05-17 | 一种线上线下育儿知识获取渠道分析管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410616060.XA CN118195862B (zh) | 2024-05-17 | 2024-05-17 | 一种线上线下育儿知识获取渠道分析管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118195862A CN118195862A (zh) | 2024-06-14 |
CN118195862B true CN118195862B (zh) | 2024-07-12 |
Family
ID=91403012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410616060.XA Active CN118195862B (zh) | 2024-05-17 | 2024-05-17 | 一种线上线下育儿知识获取渠道分析管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118195862B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381627A (zh) * | 2021-01-14 | 2021-02-19 | 北京崔玉涛儿童健康管理中心有限公司 | 育儿知识下的商品评分处理推荐方法、装置 |
CN113254836A (zh) * | 2021-06-16 | 2021-08-13 | 长沙豆芽文化科技有限公司 | 一种智能育儿知识点信息推送方法、系统及云平台 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010085874A1 (en) * | 2009-01-27 | 2010-08-05 | Kibboko, Inc. | Recommender system for on-line articles and documents |
KR102185313B1 (ko) * | 2019-06-17 | 2020-12-01 | (주)봄소프트 | 육아 플랜 컨설팅 정보 제공 시스템 및 그 방법 |
KR20220140883A (ko) * | 2021-04-11 | 2022-10-18 | 이경근 | 육아 컨텐츠 제공 장치 및 방법 |
-
2024
- 2024-05-17 CN CN202410616060.XA patent/CN118195862B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112381627A (zh) * | 2021-01-14 | 2021-02-19 | 北京崔玉涛儿童健康管理中心有限公司 | 育儿知识下的商品评分处理推荐方法、装置 |
CN113254836A (zh) * | 2021-06-16 | 2021-08-13 | 长沙豆芽文化科技有限公司 | 一种智能育儿知识点信息推送方法、系统及云平台 |
Also Published As
Publication number | Publication date |
---|---|
CN118195862A (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674410B (zh) | 用户画像构建、内容推荐方法、装置及设备 | |
CN107577759B (zh) | 用户评论自动推荐方法 | |
CN103744981B (zh) | 一种基于网站内容用于网站自动分类分析的系统 | |
Zhao et al. | Topical keyphrase extraction from twitter | |
CN106156204B (zh) | 文本标签的提取方法和装置 | |
CN109492157A (zh) | 基于rnn、注意力机制的新闻推荐方法及主题表征方法 | |
CN111104526A (zh) | 一种基于关键词语义的金融标签提取方法及系统 | |
CN106202294B (zh) | 基于关键词和主题模型融合的相关新闻计算方法及装置 | |
CN104111925B (zh) | 项目推荐方法和装置 | |
CN107895303B (zh) | 一种基于ocean模型的个性化推荐的方法 | |
JP2008287517A (ja) | 強調表示装置及びプログラム | |
CN113609103A (zh) | 一种基于ai的交互式阅读支持数据库构建方法及系统 | |
CN111737558A (zh) | 一种资讯推荐方法、装置及计算机可读存储介质 | |
Tanaka et al. | Estimating content concreteness for finding comprehensible documents | |
CN112307336A (zh) | 热点资讯挖掘与预览方法、装置、计算机设备及存储介质 | |
Ng et al. | CrsRecs: A personalized course recommendation system for college students | |
CN106294398A (zh) | 信息处理装置和信息处理方法 | |
CN104794168B (zh) | 一种知识点关联方法及系统 | |
CN110781300A (zh) | 基于百度百科知识图谱的旅游资源文化特色评分算法 | |
CN111680505B (zh) | 一种Markdown特征感知的无监督关键词提取方法 | |
CN115860283B (zh) | 基于知识工作者画像的贡献度预测方法及装置 | |
CN118195862B (zh) | 一种线上线下育儿知识获取渠道分析管理系统 | |
CN112395484A (zh) | 一种面向自动驾驶汽车的用户满意度评价方法 | |
CN114547435B (zh) | 内容质量的识别方法、装置、设备及可读存储介质 | |
CN116956818A (zh) | 文本素材的处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |