CN112417269A - 一种智能在线培训服务信息推送算法 - Google Patents
一种智能在线培训服务信息推送算法 Download PDFInfo
- Publication number
- CN112417269A CN112417269A CN202011193197.7A CN202011193197A CN112417269A CN 112417269 A CN112417269 A CN 112417269A CN 202011193197 A CN202011193197 A CN 202011193197A CN 112417269 A CN112417269 A CN 112417269A
- Authority
- CN
- China
- Prior art keywords
- phrases
- sensitive
- pushing
- online training
- training service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种智能在线培训服务信息推送算法,具体为,获取客户端入网的ID;建立敏感信息库;设置关联词组;获取浏览网页,判断网址字符串中是否含有关联词组,若有,判断哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,获取浏览网页上的内容,并判断是否含有关联词组,若有,判断哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,计算时间量程内是否有关联词组,若有,则推送,若没有计算敏感词组占比,再判断是否推送。
Description
技术领域
本发明涉及一种智能在线培训服务信息推送算法,属于数据智能处理的技术领域。
背景技术
现如今在线培训服务的普及和飞速发展,使得部分人能够在家就能享受到在线培训服务,在线培训服务的教育形式也很多种,有直播教课,也有录播教课,也有录制动画演示的形式,然而,新的在线培训服务上线,让更多人的知道,即推广显得尤为重要,除了采取传统的电视广告,以及各种张贴广告的形式,还可以采取最有针对的性的,根据需要人群,直接推送,比如上网的时候,插入对应的在线培训服务信息,或者给手机发送信息。如何有针对性地查找到目标推送对象是目前的亟待解决的问题。
发明内容
为了解决上述技术问题,本发明提供一种智能在线培训服务信息推送算法,其具体技术方案如下:
一种智能在线培训服务信息推送算法,包括以下步骤,
步骤1:获取ID:获取客户端入网的ID,以ID为唯一标识建立数据库,形成数据库群,数据库群的数据库数量与ID数量一致;
步骤2:设置敏感信息库:选取多个与在线培训服务关联的敏感词组,形成敏感信息库;
步骤3:设置关联词组:在线培训服务分为多种,每种有独立的敏感信息库,所述敏感信息库中的多个敏感词组设置关联词组,同一敏感词组可同时位于多个关联词组中;
步骤4:获取浏览网页:获取客户端的浏览网页,判断浏览网页网址字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为一级辨识,进入步骤5,否则不标记,进入步骤6,将其存储于ID目录下的数据库中;
步骤5:在数据库中,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,进入步骤6;
步骤6:获取浏览内容:获取浏览网页上的内容,包括视频、音频、图片、字母和文字,并存储在数据中,
步骤7:提取浏览信息:提取网页内容中的信息,转换为字符串,并判断字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为二级辨识,否则不标记,并存储在数据中,
步骤8:计算时间量程内的一级辨识和二级辨识的综合量在总浏览量中的占比,并存储在数据中;
步骤9:给客户端ID推送信息:设置步骤7中的占比阈值,当占比达到阈值,给客户端ID推送信息,否则不推送。
进一步的,所述步骤4中的时间长度为15天,预设值为3次。
进一步的,所述关联词组为敏感词组连续或间隔出现均可,当选中的敏感词组在同一网址字符串或者网页内容中同时出现时,便认定为出现关联词组,敏感词组之间可以有非敏感词组字符。
进一步的,所述步骤8的时间量程为7~15天。
进一步的,所述步骤8的一级辨识的计算过程为:
统计时间量程内的,所有点击的网址字符中敏感词组,在不同网址中存在能够组成关联词组时,判定该ID设定为目标对象,推送在线培训服务信息,若不存在,则以点开网址的数量为分母,以出现敏感词组的网址为分子,分子与分母的比值大于0.1时,判定该ID设定为目标对象,推送在线培训服务信息,否则,暂不推送,继续提取网页内容。
进一步的,所述步骤8中二级辨识的计算过程为:将最新浏览网页上的敏感词组,与时间量程内的所有其他敏感词组匹配,判断是否能形成关联词组,若能,则判定该ID设定为目标对象,推送在线培训服务信息,否则,不推送。
本发明的有益效果是:
本发明能够自动建搜每个ID的登录网址也网页信息,根据在线培训服务的敏感词,智能筛选出对在线培训服务感兴趣的潜在目标客户,然后定向推送匹配的现在培训服务,针对性强,命中率高。
当在线培训服务有多个时,给每个在线培训服务建立各自的敏感信息库,每个ID建立独立的数据库,形成时间链上的数据,当ID有网址访问时,用本专利方法判断是否要推送在线培训服务,以及推送哪个在线服务培训。
附图说明
图1是本发明的流程图。
具体实施方式
如图1所示,本发明的智能在线培训服务信息推送算法,包括以下步骤,
步骤1:获取ID:获取客户端入网的ID,以ID为唯一标识建立数据库,形成数据库群,数据库群的数据库数量与ID数量一致;
步骤2:设置敏感信息库:选取多个与在线培训服务关联的敏感词组,形成敏感信息库;关联词组为敏感词组连续或间隔出现均可,当选中的敏感词组在同一网址字符串或者网页内容中同时出现时,便认定为出现关联词组,敏感词组之间可以有非敏感词组字符。
步骤3:设置关联词组:在线培训服务分为多种,每种有独立的敏感信息库,所述敏感信息库中的多个敏感词组设置关联词组,同一敏感词组可同时位于多个关联词组中;
步骤4:获取浏览网页:获取客户端的浏览网页,判断浏览网页网址字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为一级辨识,进入步骤5,否则不标记,进入步骤6,将其存储于ID目录下的数据库中;
步骤5:在数据库中,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,进入步骤6;
步骤6:获取浏览内容:获取浏览网页上的内容,包括视频、音频、图片、字母和文字,并存储在数据中,
步骤7:提取浏览信息:提取网页内容中的信息,转换为字符串,并判断字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为二级辨识,否则不标记,并存储在数据中,
步骤8:一级辨识的计算过程为:
统计时间量程内的,所有点击的网址字符中敏感词组,在不同网址中存在能够组成关联词组时,判定该ID设定为目标对象,推送在线培训服务信息,若不存在,则以点开网址的数量为分母,以出现敏感词组的网址为分子,分子与分母的比值大于0.1时,判定该ID设定为目标对象,推送在线培训服务信息,否则,暂不推送,继续提取网页内容。
二级辨识的计算过程为:将最新浏览网页上的敏感词组,与时间量程内的所有其他敏感词组匹配,判断是否能形成关联词组,若能,则判定该ID设定为目标对象,推送在线培训服务信息,否则,不推送。
步骤4中的时间长度为15天,预设值为3次。在实际使用过程中,也可设置其他数值,根据使用需求而定。
步骤8的时间量程为7~15天。该时间长度可随意设置,为了确保不增加计算负担,又比较合适地筛选信息,时间长度设置为7~15天是个比较合适的范围。
当待推送的在线服务培训有多个时,可同时进行上述方法,每个在线培训服务建立自己的独立的敏感信息库,当ID采集到的网址或网页信息中包括多个在线培训服务的关联词组时,推送该多个在线培训服务,只有一个时,就推送一个,都没有时,就不推送。快捷高效,避免盲目推送,造成市场反馈差评,推送给专门有需求的人。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (6)
1.一种智能在线培训服务信息推送算法,其特征在于:包括以下步骤,
步骤1:获取ID:获取客户端入网的ID,以ID为唯一标识建立数据库,形成数据库群,数据库群的数据库数量与ID数量一致;
步骤2:设置敏感信息库:选取多个与在线培训服务关联的敏感词组,形成敏感信息库;
步骤3:设置关联词组:在线培训服务分为多种,每种有独立的敏感信息库,所述敏感信息库中的多个敏感词组设置关联词组,同一敏感词组可同时位于多个关联词组中;
步骤4:获取浏览网页:获取客户端的浏览网页,判断浏览网页网址字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为一级辨识,进入步骤5,否则不标记,进入步骤6,将其存储于ID目录下的数据库中;
步骤5:在数据库中,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,进入步骤6;
步骤6:获取浏览内容:获取浏览网页上的内容,包括视频、音频、图片、字母和文字,并存储在数据中,
步骤7:提取浏览信息:提取网页内容中的信息,转换为字符串,并判断字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为二级辨识,否则不标记,并存储在数据中,
步骤8:计算时间量程内的一级辨识和二级辨识的综合量在总浏览量中的占比,并存储在数据中;
步骤9:给客户端ID推送信息:设置步骤7中的占比阈值,当占比达到阈值,给客户端ID推送信息,否则不推送。
2.根据权利要求1所述的智能在线培训服务信息推送算法,其特征在于:所述步骤4中的时间长度为15天,预设值为3次。
3.根据权利要求1所述的智能在线培训服务信息推送算法,其特征在于:所述关联词组为敏感词组连续或间隔出现均可,当选中的敏感词组在同一网址字符串或者网页内容中同时出现时,便认定为出现关联词组,敏感词组之间可以有非敏感词组字符。
4.根据权利要求1所述的智能在线培训服务信息推送算法,其特征在于: 所述步骤8的时间量程为7~15天。
5.根据权利要求3所述的智能在线培训服务信息推送算法,其特征在于:所述步骤8的一级辨识的计算过程为:
统计时间量程内的,所有点击的网址字符中敏感词组,在不同网址中存在能够组成关联词组时,判定该ID设定为目标对象,推送在线培训服务信息,若不存在,则以点开网址的数量为分母,以出现敏感词组的网址为分子,分子与分母的比值大于0.1时,判定该ID设定为目标对象,推送在线培训服务信息,否则,暂不推送,继续提取网页内容。
6.根据权利要求5所述的智能在线培训服务信息推送算法,其特征在于:所述步骤8中二级辨识的计算过程为:将最新浏览网页上的敏感词组,与时间量程内的所有其他敏感词组匹配,判断是否能形成关联词组,若能,则判定该ID设定为目标对象,推送在线培训服务信息,否则,不推送。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011193197.7A CN112417269A (zh) | 2020-10-30 | 2020-10-30 | 一种智能在线培训服务信息推送算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011193197.7A CN112417269A (zh) | 2020-10-30 | 2020-10-30 | 一种智能在线培训服务信息推送算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112417269A true CN112417269A (zh) | 2021-02-26 |
Family
ID=74827048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011193197.7A Pending CN112417269A (zh) | 2020-10-30 | 2020-10-30 | 一种智能在线培训服务信息推送算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417269A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4637969B1 (ja) * | 2009-12-31 | 2011-02-23 | 株式会社Taggy | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 |
CN103067470A (zh) * | 2012-12-21 | 2013-04-24 | 北京奇虎科技有限公司 | 一种向浏览器推送信息的方法、服务器和系统 |
CN105279224A (zh) * | 2015-09-09 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法及装置 |
CN105912604A (zh) * | 2016-04-05 | 2016-08-31 | 苏州奇展信息科技有限公司 | 一种个性化推荐课程的在线培训平台 |
CN108073613A (zh) * | 2016-11-14 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 信息发送方法及装置 |
-
2020
- 2020-10-30 CN CN202011193197.7A patent/CN112417269A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4637969B1 (ja) * | 2009-12-31 | 2011-02-23 | 株式会社Taggy | ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法 |
CN103067470A (zh) * | 2012-12-21 | 2013-04-24 | 北京奇虎科技有限公司 | 一种向浏览器推送信息的方法、服务器和系统 |
CN105279224A (zh) * | 2015-09-09 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法及装置 |
CN105912604A (zh) * | 2016-04-05 | 2016-08-31 | 苏州奇展信息科技有限公司 | 一种个性化推荐课程的在线培训平台 |
CN108073613A (zh) * | 2016-11-14 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 信息发送方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190392487A1 (en) | System, Device, and Method of Automatic Construction of Digital Advertisements | |
CN101178737B (zh) | 一种互联网关键字符相关信息的发布方法和系统 | |
CN107862553A (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
CN109840793B (zh) | 推广信息的推送方法和装置、存储介质、电子装置 | |
US20080160490A1 (en) | Seeking Answers to Questions | |
CN106354861A (zh) | 电影标签自动标引方法及自动标引系统 | |
CN102695121A (zh) | 向社交网络中的用户推送好友信息的方法和系统 | |
CN105447147A (zh) | 一种数据处理方法及装置 | |
CN105868248A (zh) | 媒体推荐方法及装置 | |
CN108806355B (zh) | 一种书画艺术互动教育系统 | |
CN106326338B (zh) | 基于搜索引擎的服务提供方法和装置 | |
CN111815375B (zh) | 广告投放中的用户画像方法及装置 | |
CN107770574A (zh) | 视频传播的方法和装置 | |
KR100792700B1 (ko) | 신경망을 가지는 협업 필터링 시스템을 이용하여 클릭패턴에 기초한 웹 광고 추천 방법 및 그 시스템 | |
CN103136685A (zh) | 一种基于移动终端的用户属性进行定向广告的方法和系统 | |
CN108737524B (zh) | 一种企业信息推送方法 | |
CN107563807A (zh) | 一种基于数据挖掘的区域广告推送系统 | |
CN111984787A (zh) | 一种基于互联网数据的舆情热点获取方法及系统 | |
CN114155067B (zh) | 一种用户画像的建立方法及系统 | |
CN108230114A (zh) | 选取用户特征标签的方法、装置、设备及可读存储介质 | |
CN116383480A (zh) | 通话场景下媒体推荐的方法、装置、电子设备及存储介质 | |
CN107729573A (zh) | 信息推送方法和装置 | |
CN108416015A (zh) | 一种信息安全推送方法 | |
CN103747368A (zh) | 在视频节目中嵌入网络即时通讯的系统、方法 | |
CN112053184B (zh) | 推广信息投放方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |