CN117725314B - 一种基于关键字的网站管理推广方法及系统 - Google Patents

一种基于关键字的网站管理推广方法及系统 Download PDF

Info

Publication number
CN117725314B
CN117725314B CN202311741729.XA CN202311741729A CN117725314B CN 117725314 B CN117725314 B CN 117725314B CN 202311741729 A CN202311741729 A CN 202311741729A CN 117725314 B CN117725314 B CN 117725314B
Authority
CN
China
Prior art keywords
browsing
keywords
website
content
popularization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311741729.XA
Other languages
English (en)
Other versions
CN117725314A (zh
Inventor
颜健鸥
沈建国
杨磊
潘侨林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Fanya Information Network Co ltd
Original Assignee
Wuxi Fanya Information Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Fanya Information Network Co ltd filed Critical Wuxi Fanya Information Network Co ltd
Priority to CN202311741729.XA priority Critical patent/CN117725314B/zh
Publication of CN117725314A publication Critical patent/CN117725314A/zh
Application granted granted Critical
Publication of CN117725314B publication Critical patent/CN117725314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及推广管理相关领域,公开了一种基于关键字的网站管理推广方法及系统,包括通过样本库建立内容骨架链并基于内容骨架链生成推广关联骨架的步骤;通过点击链日志建立基于关键词的推广骨架链,从而可以实现基于推广骨架链的网站推广管理方法,相较于现有技术中基于网站关联性的推广方式,本申请中基于骨架链的关联推广方式,能够在特定环境下实现规律性的非内容关联推广方式,能够更加匹配浏览群体,获得更好的推广效果反馈。

Description

一种基于关键字的网站管理推广方法及系统
技术领域
本发明涉及推广管理相关领域,具体是一种基于关键字的网站管理推广方法及系统。
背景技术
网站推广是一种以互联网为基础,借助平台和媒体进行辅助营销的手段,其能够为新兴网站进行推流提高曝光度,从而被更多的用户所了解,能够有效的对优秀产品进行推广,从而促进市场的良性发展。
现有技术中的推广方式多采用的为固定网站的固定对象推广,即在网站a进行b、c网站的展出推广,可能以循环、时间段分发的方式执行,部分待推广对象较多的网站,会采用基于浏览用户的喜好进行筛选推广的方式进行,但这些现有技术均缺乏一个高效的泛用性推广方案来提升推广的有效实现比例。
发明内容
本发明的目的在于提供一种基于关键字的网站管理推广方法及系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于关键字的网站管理推广方法,包含步骤:
通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像;
对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格;
基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系;
对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格。
作为本发明的进一步方案:还包括基于推广关联骨架进行网站推广的步骤,具体包括:
获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个;
获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列;
基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限。
作为本发明的再进一步方案:还包括基于用户反馈的推广优化步骤,具体包括:
获取浏览对象对于当前网站的浏览记录数据,所述浏览记录数据包括网站的浏览时长,浏览分布记录以及内容完读比,其中浏览分布记录用于表征浏览时长在不同网站内容区域的分布情况,所述内容完读比用于表征浏览对象浏览内容与网站页面内容总和的比值;
若所述完读比或浏览时长小于预设值,则重新选取关键词及待推广网站并推送至浏览对象端,且小于预设值对应网站不用于建立点击链日志;
基于浏览对象的浏览分布情况判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,以用于向浏览对象连续推送。
作为本发明的再进一步方案:所述通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库的步骤具体包括:
获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息;
基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏。
作为本发明的再进一步方案:还包括内容骨架链建立的步骤,具体包括:
获取点击链日志中各个网站相对应的浏览记录数据;
基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
本发明实施例旨在提供一种基于关键字的网站管理推广系统,包含:
样本库获取模块,用于通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像;
训练骨架建立模块,用于对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格;
关联关系训练模块,用于基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系;
推广骨架建立模块,用于对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格。
作为本发明的进一步方案:还包括网站推广模块,具体包括:
骨架匹配单元,用于获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个;
推广匹配单元,用于获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列;
推广执行单元,用于基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限。
作为本发明的再进一步方案:还包括网站推广模块,具体包括:
骨架匹配单元,用于获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个;
推广匹配单元,用于获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列;
推广执行单元,用于基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限。
作为本发明的再进一步方案:所述样本库获取模块包括:
库数据筛选单元,用于获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息;
脱敏处理单元,用于基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,
所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏。
作为本发明的再进一步方案:所述训练骨架建立模块包括:
数据获取单元,用于获取点击链日志中各个网站相对应的浏览记录数据;
骨架建立单元,用于基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
与现有技术相比,本发明的有益效果是:通过点击链日志建立基于关键词的推广骨架链,从而可以实现基于推广骨架链的网站推广管理方法,相较于现有技术中基于网站关联性的推广方式,本申请中基于骨架链的关联推广方式,能够在特定环境下实现规律性的非内容关联推广方式,能够更加匹配浏览群体,获得更好的推广效果反馈。
附图说明
图1为一种基于关键字的网站管理推广方法的流程框图。
图2为一种基于关键字的网站管理推广方法中骨架叠加示意图。
图3为一种基于关键字的网站管理推广系统的组成框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现方式进行详细描述。
如图1、图2所述,为本发明一个实施例提供的一种基于关键字的网站管理推广方法,包括以下步骤:
S10,通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像。
S20,对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格。
S30,基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系。
S40,对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格。
本实施例中,给出了一种基于关键字的网站管理推广方法,通过点击链日志建立基于关键词的推广骨架链,从而可以实现基于推广骨架链的网站推广管理方法,相较于现有技术中基于网站关联性的推广方式,本申请中基于骨架链的关联推广方式,能够在特定环境下实现规律性的非内容关联推广方式,能够更加匹配浏览群体,获得更好的推广效果反馈;具体的来说,实现的方式可以如下理解:获取样本网站中一定数量的历史访问记录,并根据用户的浏览偏好画像进行分组,对于同一组内的点击链日志,保留用户再点击浏览过程中的顺序链信息,并对网站的关键词进行提取,因此,便可以实现一个呈首尾不连接的链条状关键词骨架,又因为每个网站可以提取多个关键词,因此可以建立呈网状结构的内容骨架链;而后,将同一组别内的数个内容骨架链根据关键词内容进行点对点定位叠加(即保留顺序关系的情况下进行相同关键词的计次叠加),从而可以建立包括每个关键词频率的推广关联骨架;例如图2所示,为内容骨架链的叠加情况,其中包括两组骨架(分别对应实线和虚线),分别为a-b-d(e)-f和a-c-(b-d-)d-g,其叠加关键词为a、b、d,因为其均为两个骨架叠加,因此叠加次数为2(对应其下方标注数字)。
作为本发明另一个优选的实施例,还包括基于推广关联骨架进行网站推广的步骤,具体包括:
获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个。
获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列。
基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限。
本实施例中,这里补充了通过推广关联骨架进行网站推广的方法,在进行推广时,首选获取浏览用户的浏览偏好画像,这一过程中,因为画像分组是具有局限性的,因此,也可以为浏览对象匹配多个推广关联骨架(例如浏览对象可以划分在三个组别内,则将将三个组别的推广关联骨架基于百分比进行叠加处理);而后根据当前浏览网站的关键词在推广关联骨架中进行定位,以获取相邻的多个关键词及关键词的叠加次数,则叠加次数最多的一个或多个关键词,则为网站推广的目标关键词,基于该关键词进行待推广网站的检索,进而将其进行推广输出,达成推广目的。
作为本发明另一个优选的实施例,还包括基于用户反馈的推广优化步骤,具体包括:
获取浏览对象对于当前网站的浏览记录数据,所述浏览记录数据包括网站的浏览时长,浏览分布记录以及内容完读比,其中浏览分布记录用于表征浏览时长在不同网站内容区域的分布情况,所述内容完读比用于表征浏览对象浏览内容与网站页面内容总和的比值。
若所述完读比或浏览时长小于预设值,则重新选取关键词及待推广网站并推送至浏览对象端,且小于预设值对应网站不用于建立点击链日志。
基于浏览对象的浏览分布情况判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,以用于向浏览对象连续推送。
本实施例中,在网站推广的过程中,用户对于推广网站不感兴趣、意愿低的情况是十分正常的,因此在进行推广的过程中,还是需要进行推广优化的,当用户在推广的网站浏览记录表征为快速翻动并退出时(即浏览时长较低,内容完读比较小或浏览分布记录表征网站各处均未仔细停留观看),则重新选取关键词并进行推对应的网站,同时因为用户已经表示为无兴趣,该记录不再用于生成点击链日志,该记录是无效的推广记录。
作为本发明另一个优选的实施例,所述通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库的步骤具体包括:
获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息。
基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏。
本实施例中,在进行原始样本库的建立过程中,因为其通过样本网站获取对数据中是包含较多的隐私敏感数据的,为了保证这些数据的安全,需要通过替换、删除、隐藏以及模糊等方式对其进行脱敏处理,同时为了区别不同的对象来表征用户特征信息,因此基本识别用户信息则通过编码的方式进行脱敏的同时以区分。
作为本发明另一个优选的实施例,还包括内容骨架链建立的步骤,具体包括:
获取点击链日志中各个网站相对应的浏览记录数据。
基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
本实施例中,在建立内容骨架链的过程中,为了保证最终数据的准确性,通过对用户浏览网站过程中的浏览区域偏好进行特定范围内容的关键词获取,从而使得获得的关键词更具有代表性,实现更良好的推广效果。。
如图3所示,本发明还提供了一种基于关键字的网站管理推广系统,其包含:
样本库获取模块100,用于通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像;
训练骨架建立模块200,用于对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格;
关联关系训练模块300,用于基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系;
推广骨架建立模块400,用于对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格。
作为本发明另一个优选的实施例,还包括网站推广模块,具体包括:
骨架匹配单元,用于获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个。
推广匹配单元,用于获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列。
推广执行单元,用于基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限。
作为本发明另一个优选的实施例,还包括推广优化模块,具体包括:
反馈评估单元,用于获取浏览对象对于当前网站的浏览记录数据,所述浏览记录数据包括网站的浏览时长,浏览分布记录以及内容完读比,其中浏览分布记录用于表征浏览时长在不同网站内容区域的分布情况,所述内容完读比用于表征浏览对象浏览内容与网站页面内容总和的比值。
筛选评估单元,用于若所述完读比或浏览时长小于预设值,则重新选取关键词及待推广网站并推送至浏览对象端,且小于预设值对应网站不用于建立点击链日志。
优化推广单元,用于基于浏览对象的浏览分布情况判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,以用于向浏览对象连续推送。
作为本发明另一个优选的实施例,所述样本库获取模块包括:
库数据筛选单元,用于获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息。
脱敏处理单元,用于基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏。
作为本发明另一个优选的实施例,所述训练骨架建立模块包括:
数据获取单元,用于获取点击链日志中各个网站相对应的浏览记录数据;
骨架建立单元,用于基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (2)

1.一种基于关键字的网站管理推广方法,其特征在于,包含步骤:
通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像;
对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格;
基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系;
对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格;
还包括基于推广关联骨架进行网站推广的步骤,具体包括:
获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个;
获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列;
基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限;
还包括基于用户反馈的推广优化步骤,具体包括:
获取浏览对象对于当前网站的浏览记录数据,所述浏览记录数据包括网站的浏览时长,浏览分布记录以及内容完读比,其中浏览分布记录用于表征浏览时长在不同网站内容区域的分布情况,所述内容完读比用于表征浏览对象浏览内容与网站页面内容总和的比值;
若所述完读比或浏览时长小于预设值,则重新选取关键词及待推广网站并推送至浏览对象端,且小于预设值对应网站不用于建立点击链日志;
基于浏览对象的浏览分布情况判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,以用于向浏览对象连续推送;
所述通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库的步骤具体包括:
获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息;
基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏;
还包括内容骨架链建立的步骤,具体包括:
获取点击链日志中各个网站相对应的浏览记录数据;
基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
2.一种基于关键字的网站管理推广系统,其特征在于,包含:
样本库获取模块,用于通过样本网站的历史访问记录随机抽样预设数量用户的点击链日志以及相对应的用户特征信息,以建立原始样本库,所述用户特征信息表征用户的浏览偏好画像;
训练骨架建立模块,用于对所述原始样本库中的点击链日志进行关键词抽取,以建立与点击链日志相匹配的内容骨架链,所述内容骨架链为包含数个相互关联关键词的关系网格;
关联关系训练模块,用于基于浏览偏好画像对数个内容骨架链进行分组,并对同一组别内的数个内容骨架链基于关键词进行匹配叠加,获取组别关系网格,所述匹配叠加的过程保留内容骨架链中关键词间的顺序关系;
推广骨架建立模块,用于对所述组别关系网络中的关键词进行叠加次数统计,基于预设的统计基数对所述关键词进行筛选,以建立推广关联骨架,所述推广关联骨架用于表征不同浏览偏好画像下的网站推广最优关联网格;
还包括网站推广模块,具体包括:
骨架匹配单元,用于获取网站当前浏览对象的浏览偏好画像,基于所述浏览偏好画像为浏览对象匹配相适应的推广关联骨架,相适应的推广关联骨架可以为多个;
推广匹配单元,用于获取当前网站的多个关键词,并基于推广关联骨架获取与所述关键词相邻关联的数个关联关键词,并基于关联关键词的叠加次数进行顺序排列,获取推广优待序列;
推广执行单元,用于基于推广优待序列的关键词顺序匹配获取多个待推广网站,依次推送所述待推广网站至浏览对象端并输出,所述顺序匹配的过程中,若待推广网站同时匹配多个关键词,则所述待推广网站具有优先推广权限;
还包括推广优化模块,具体包括:
反馈评估单元,用于获取浏览对象对于当前网站的浏览记录数据,所述浏览记录数据包括网站的浏览时长,浏览分布记录以及内容完读比,其中浏览分布记录用于表征浏览时长在不同网站内容区域的分布情况,所述内容完读比用于表征浏览对象浏览内容与网站页面内容总和的比值;
筛选评估单元,用于若所述完读比或浏览时长小于预设值,则重新选取关键词及待推广网站并推送至浏览对象端,且小于预设值对应网站不用于建立点击链日志;
优化推广单元,用于基于浏览对象的浏览分布情况判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,以用于向浏览对象连续推送;
所述样本库获取模块包括:
库数据筛选单元,用于获取当前网站及待推广网站的类型范围,并基于类型范围对样本网站进行匹配,随机抽取符合类型范围的点击链日志及对应的用户特征信息;
脱敏处理单元,用于基于脱敏模糊程序对点击链日志及用户特征信息进行脱敏处理,所述脱敏处理包括用户信息编码替换及地点身份信息模糊隐藏;
所述训练骨架建立模块包括:
数据获取单元,用于获取点击链日志中各个网站相对应的浏览记录数据;
骨架建立单元,用于基于浏览记录数据中相对应的浏览分布记录判断用户的高时长浏览内容区域,并获取相对应内容区域的关键词,基于多个关联词建立内容骨架链。
CN202311741729.XA 2023-12-18 2023-12-18 一种基于关键字的网站管理推广方法及系统 Active CN117725314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311741729.XA CN117725314B (zh) 2023-12-18 2023-12-18 一种基于关键字的网站管理推广方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311741729.XA CN117725314B (zh) 2023-12-18 2023-12-18 一种基于关键字的网站管理推广方法及系统

Publications (2)

Publication Number Publication Date
CN117725314A CN117725314A (zh) 2024-03-19
CN117725314B true CN117725314B (zh) 2024-06-07

Family

ID=90202980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311741729.XA Active CN117725314B (zh) 2023-12-18 2023-12-18 一种基于关键字的网站管理推广方法及系统

Country Status (1)

Country Link
CN (1) CN117725314B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060103034A (ko) * 2005-03-25 2006-09-28 주식회사 다음커뮤니케이션 인터넷 광고 서비스 시스템 및 방법
KR20090119532A (ko) * 2008-05-16 2009-11-19 엔에이치엔비즈니스플랫폼 주식회사 로그 분석을 통한 광고 키워드 추천 방법 및 시스템
CN103324645A (zh) * 2012-03-23 2013-09-25 腾讯科技(深圳)有限公司 一种网页推荐方法和装置
CN103514193A (zh) * 2012-06-21 2014-01-15 百度在线网络技术(北京)有限公司 一种用于确定推广关键词的推广结果信息的方法与设备
CN105488205A (zh) * 2015-12-09 2016-04-13 百度在线网络技术(北京)有限公司 页面生成方法和装置
CN106651429A (zh) * 2016-10-18 2017-05-10 安徽天达网络科技有限公司 一种基于互联网的广告推送方法
KR20180015491A (ko) * 2016-08-03 2018-02-13 삼성전자주식회사 키워드를 기초로 접속 기록을 저장하는 방법 및 장치
KR102414391B1 (ko) * 2020-12-30 2022-06-29 추철민 과거이력 기반 실시간 문서작성 추천 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551806B (zh) * 2008-04-03 2012-04-18 北京搜狗科技发展有限公司 一种个性化网址导航的方法和系统
CN102142033B (zh) * 2010-05-20 2013-04-24 百度在线网络技术(北京)有限公司 一种在搜索结果中提供相关子链接信息的方法和设备
WO2022006135A1 (en) * 2020-06-29 2022-01-06 6Sense Insights, Inc. Artificial intelligence for keyword recommendation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060103034A (ko) * 2005-03-25 2006-09-28 주식회사 다음커뮤니케이션 인터넷 광고 서비스 시스템 및 방법
KR20090119532A (ko) * 2008-05-16 2009-11-19 엔에이치엔비즈니스플랫폼 주식회사 로그 분석을 통한 광고 키워드 추천 방법 및 시스템
CN103324645A (zh) * 2012-03-23 2013-09-25 腾讯科技(深圳)有限公司 一种网页推荐方法和装置
CN103514193A (zh) * 2012-06-21 2014-01-15 百度在线网络技术(北京)有限公司 一种用于确定推广关键词的推广结果信息的方法与设备
CN105488205A (zh) * 2015-12-09 2016-04-13 百度在线网络技术(北京)有限公司 页面生成方法和装置
KR20180015491A (ko) * 2016-08-03 2018-02-13 삼성전자주식회사 키워드를 기초로 접속 기록을 저장하는 방법 및 장치
CN106651429A (zh) * 2016-10-18 2017-05-10 安徽天达网络科技有限公司 一种基于互联网的广告推送方法
KR102414391B1 (ko) * 2020-12-30 2022-06-29 추철민 과거이력 기반 실시간 문서작성 추천 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于网页关键词的个性化Web推荐算法;袁D;张;李军怀;;西安理工大学学报;20070330(第01期);全文 *

Also Published As

Publication number Publication date
CN117725314A (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN103888490A (zh) 一种全自动的web客户端人机识别的方法
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN106708841B (zh) 网站访问路径的聚合方法和装置
CN104572720A (zh) 一种网页信息排重的方法、装置及计算机可读存储介质
CN112115328A (zh) 一种页面流量地图构建方法、装置及计算机可读存储介质
CN117725314B (zh) 一种基于关键字的网站管理推广方法及系统
CN106202368A (zh) 预加载方法和装置
CN109145307B (zh) 用户画像识别方法、推送方法、装置、设备和存储介质
Zhang et al. The research on search engine optimization based on six sigma management
CN114154043A (zh) 网站指纹的计算方法、系统、存储介质和终端
CN105824951A (zh) 检索方法和装置
Brügger 8. Using the web to examine the evolution of the abortion debate in Australia, 2005–2015
CN115664736A (zh) 一种共享数据的方法、装置、设备及介质
Klein et al. How important are user-generated data for search result quality? Experimental evidence
CN114257565A (zh) 挖掘潜在威胁域名的方法、系统和服务器
CN109829112B (zh) 基于大数据的裂变话题跟踪方法、装置和计算机设备
CN113407803A (zh) 一种一步式采集互联网数据的方法
CN113868536A (zh) 一种信息推荐方法、装置、设备和存储介质
CN113486246A (zh) 信息的搜索方法、装置、设备以及存储介质
CN112257408A (zh) 一种文本对比的方法及相关装置
CN112487268A (zh) 一种基于分布式爬虫技术的数据爬取实现方法
CN113590960B (zh) 用户识别模型训练方法、电子设备及计算机存储介质
CN110688552A (zh) 网页正文内容获取方法、装置、计算机设备及存储介质
CN113127598A (zh) 一种新闻内容识别方法、模型训练方法和装置
CN111258969B (zh) 一种互联网访问日志解析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant