CN105701232A - 一种基于app信息数据的超文本链接清单推送系统 - Google Patents
一种基于app信息数据的超文本链接清单推送系统 Download PDFInfo
- Publication number
- CN105701232A CN105701232A CN201610087726.2A CN201610087726A CN105701232A CN 105701232 A CN105701232 A CN 105701232A CN 201610087726 A CN201610087726 A CN 201610087726A CN 105701232 A CN105701232 A CN 105701232A
- Authority
- CN
- China
- Prior art keywords
- word
- anchor point
- linked list
- user
- anchor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9577—Optimising the visualization of content, e.g. distillation of HTML documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于APP信息数据的超文本链接清单推送系统,该系统包括用户端APP、处理模块和管理模块,用户通过用户端APP访问网页,APP获得页面数据,将网页数据发送给处理模块进行处理,处理模块首先获取网页数据中的文字,然后将该文字与管理模块中存储的锚点词进行匹配,对匹配成功的文字插入跳转链接清单,将这些信息发送给APP,然后APP根据这些信息构造新的页面数据,将新的页面展示给用户浏览。本发明的推送系统在不影响用户对原页面浏览的情况下,大幅度提升了用户体验。
Description
【技术领域】
本发明涉及计算机和互联网技术领域,尤其涉及一种基于APP信息数据的超文本链接清单推送系统。
【背景技术】
自从互联网诞生以来,人类进入了信息时代,互联网上每时每刻都在出现新的信息,远远超出普通人的接受能力,因此每个人只能有筛选地阅读其感兴趣的信息,但是这种筛选对一般人而言也是困难的,一般人单靠自己很难获得其想要的信息。
一种常见的解决方案是利用搜索引擎,用户可以通过搜索引擎搜索到自己需求的信息,但是这取决与搜索引擎的准确性,用户仍然需要从大量的搜索结果中找到自己真正需要的信息。
另一个解决方案是由互联网企业主动向用户推送信息,例如网络内容服务器(ICP)或互联网服务提供商(ISP)在用户访问网页时主动推送相应的页面,或对用户当前访问的页面进行一些修改,以推送相关信息。这种推送方式常见的有三种:基于门户认证的推送方式;基于网络设备的推送方式;基于服务器的集中式推送方式。
但是,无论是哪一种推送方式,现有的推送通常都是直接推送一个新页面,或者在用户需求的页面上漂浮一些内容,这些方式都大大超出了用户的意料,可能导致用户的屏蔽和反制措施,严重影响用户的体验。
【发明内容】
为了解决现有技术中的上述问题,本发明提出了一种基于APP信息数据的超文本链接清单推送系统,其技术方案如下:
一种基于APP信息数据的超文本链接清单推送系统,该系统包括用户端APP、处理模块和管理模块,其中
所述用户端APP,用于获取用户浏览网页的网页数据,并将所述网页数据发送至所述处理模块;
所述处理模块,用于将所述网页数据中的文字与所述管理模块中的锚点词进行匹配,根据匹配纬度对匹配成功的文字插入所述锚点词对应的跳转链接清单,其中,所述跳转链接清单具有其对应的显示区,以显示与所述锚点词相关的M个跳转链接,M的具体值根据具体需求由管理员权衡设置;
所述管理模块,用于存储所有可以用于超文本链接的锚点词及其对应的跳转链接清单,可通过锚点词查询到其相应的跳转链接清单;
所述用户端APP接收经所述处理模块处理后的网页数据并将所述经所述处理模块处理后的网页数据展示给用户,供用户选择文字的跳转链接清单中的跳转链接。
优选的,所述匹配纬度包括:锚点词数量、页面主题和句号分隔符;所述根据匹配纬度对匹配成功的文字插入所述锚点词对应的跳转链接清单包括:
1)锚点词数量匹配纬度:对于同一个锚点词,只保留页面数据中的第一个;或者,将页面数据按照文字数量划分成多个文字块,每个文字块里最多含有N个字或字母,从而限制每个文字块里最多出现一个该锚点词,其中N是一个预先设定的阈值;
2)页面主题匹配纬度:所述锚点推送平台分析并获取页面数据的页面主题,从而只保留和该页面主题相关的锚点词;
3)句号分隔符匹配纬度:以句号作为分隔符,限制每一句话中最多出现S个锚点词,S的具体值根据具体需求由管理员权衡设置。
进一步的,若所述网页数据中具有多个与所述管理模块中的同一锚点词匹配成功的文字,则允许对所述文字多次插入所述锚点词对应的跳转链接清单,但限制第i次对所述文字插入所述锚点词对应的跳转链接清单和第i+1次对所述文字插入所述锚点词对应的跳转链接清单之间至少有2i-1k+1个句号(i>1),K的具体值根据具体需求由管理员权衡设置。
进一步的,在所述管理模块中,锚点词与其对应的跳转链接清单中的跳转链接是一对多的对应关系,所述管理模块能够根据预定的规则从相应的多个跳转链接中选择M个。
本发明的推送系统使用最简洁的文本链接,除了带来特殊样式的呈现效果,还不影响用户对原页面的浏览,大幅度提升用户体验。
【附图说明】
此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:
图1是本发明的系统框架图。
【具体实施方式】
下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的不当限定。
本发明的基本思想是:当用户通过一个APP访问网络页面时,APP在获得页面数据后,将网页数据发送给处理模块进行处理,处理模块首先获取网页数据中的文字,然后将该文字与管理模块中存储的锚点词进行匹配,对匹配成功的文字插入跳转链接清单,将这些信息发送给APP,然后APP根据这些信息构造新的页面数据,将新的页面展示给用户浏览。
参见图1,图1是本发明超文本链接推送系统的基本框架,该系统包括用户端APP、处理模块和管理模块,其中
该APP的应用层添加了特殊的JS代码,来完成本发明的功能。用户通过该APP访问网络页面。用户可以通过输入网址或者点击链接等方式请求访问一个网络页面,该APP通过相应地址向网页服务器请求并获取相应的页面数据,然后该APP将该页面数据发送给处理模块,请求锚点词库展示。
所述处理模块是用于推送锚点的系统,其接收上述APP发送来的页面数据,并对页面数据进行分析和锚点词匹配,所述锚点词实际上是存储于锚点词库中的关键词。所述处理模块首先将将所有锚点词和页面数据中的文字进行匹配,从而在页面数据中标记出所有可以改成锚点的锚点词,然后所述处理模块通过三个匹配维度(锚点词数量、页面主题、句号分隔符)对上述标记的锚点词进行筛选(具体的筛选方法下面说明),从中选择出部分锚点词作为待展示的锚点词,并确定待展示锚点词在页面数据中的展示位置。该展示位置可以用各种已知的方式来表示,比如页面数据的第几个字/字母/符号。
所述处理模块通过上述过程确定待展示锚点词后,其向管理模块查询各个待展示锚点词的相关跳转链接。在获得所述跳转链接后,处理模块就可以对匹配成功的文字插入所述锚点词对应的跳转链接清单。
所述用户端APP接收经所述处理模块处理后的网页数据并将所述经所述处理模块处理后的网页数据展示给用户,供用户选择文字的跳转链接清单中的跳转链接。
在上述超文本链接清单的推送过程中,所述管理模块,用于存储所有可以用于超文本链接的锚点词及其对应的跳转链接清单,可通过锚点词查询到其相应的跳转链接清单;其中,所述跳转链接清单具有其对应的显示区,以显示与所述锚点词相关的M个跳转链接,M的具体值根据具体需求由管理员权衡设置;这些锚点词是预先存储在锚点词库中的,可以由系统管理员进行修改,也可以通过锚点词库管理平台进行锚点词的添加和删除。
若所述网页数据中具有多个与所述管理模块中的同一锚点词匹配成功的文字,则允许对所述文字多次插入所述锚点词对应的跳转链接清单,但限制第i次对所述文字插入所述锚点词对应的跳转链接清单和第i+1次对所述文字插入所述锚点词对应的跳转链接清单之间至少有2i-1k+1个句号(i>1),K的具体值根据具体需求由管理员权衡设置。
锚点词和跳转清单中的跳转链接可以是一对一的对应关系,也可以是一对多的对应关系,如果是一对多的关系,当处理模块查询锚点词的跳转链接时,管理模块需要根据预定的规则从多个跳转链接中选择一个,例如可以根据轮流的规则,即多个跳转链接轮流被选中,作为该锚点词的跳转链接;也可以为每个跳转链接设定一个展示概率,使得每个跳转链接被选中的概率满足其展示概率。
下面说明锚点推送平台通过三个匹配维度(锚点词数量、页面主题、句号分隔符)对页面数据中标记的锚点词进行筛选的过程。
要对锚点词进行筛选,首先是根据页面数据中词的数量。假设有一个锚点词是“华为”,并且在页面数据中,多处出现了“华为”这个词语,例如页面数据中出现了30个“华为”,如果把这30个词都作为锚点词,改写成锚点形式,则展示出来的页面就会有30个重复的锚点,这势必影响用户的体验。本发明的一个实施例是只保留页面数据中第一个“华为”作为锚点词,其他放弃。另一个实施例是将页面数据按照文字数量划分成多个文字块,每个文字块里最多含有N个字或字母,从而限制每个文字块里最多出现一个“华为”锚点词。其中N是一个预先设定的阈值,这样就限制了同一个锚点词出现的数量和频率。
筛选锚点词的第二个维度是根据页面主题,所述锚点推送平台根据获得的页面数据分析该页面的主题,具体的分析方法在本领域中已有公知的多种方法,此处不再赘述。在锚点推送平台获得页面的主题后,就可以只保留和该页面主题相关的锚点词,而筛选掉和页面主题不相关的锚点词。举例而言,在锚点词库中,“苹果”一词被划分到电子产品的主题中,如果页面的主题和电子产品相关,则“苹果”锚点词可以保留;但是如果页面主题和食品相关,则“苹果”锚点词就要被筛选掉,因为本系统中“苹果”一词的跳转链接指向的是电子产品“苹果”,如果保留该锚点词,则该锚点与用户的当前阅读的信息就不相关,推送该链接的意义就很小了。
筛选锚点词的第三个维度是以句号作为分隔符,限制每一句话中锚点词出现的数量,系统管理员可以预先设置每句话中最多出现S个锚点词,S的具体值可以根据具体需求由管理员权衡设置。因此,如果当一句话中出现多于S个锚点词,锚点推送平台需要删除多余的锚点词,可以随机删除,也可以按照一定顺序删除,例如删除排在后面的多余锚点词。
根据本发明的另一个实施例,也可以以句号为分隔符,限制同一个锚点词出现的分布。仍然以锚点词“华为”为例,假设页面数据中出现了多个“华为”锚点词,则限制第一个“华为”锚点词和第二个“华为”锚点词之间至少有k个句号,k是一个可由系统管理员预先设定的数值,第二个“华为”锚点词和第三个“华为”锚点词之间则至少有2k+1个句号,以此类推,即第i个“华为”锚点词和第i+1个华为锚点词之间至少有2i-1k+1个句号。之所以设置这样的句号分隔数量,是因为人类的阅读感受是以一句话为基本单元的,并且经过大量统计,上述的句号分隔数量,可以在尽量不影响用户体验的情况下,尽可能多的推送链接,是一个较佳的权衡。
以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。
Claims (4)
1.一种基于APP信息数据的超文本链接清单推送系统,其特征在于,该系统包括用户端APP、处理模块和管理模块,其中
所述用户端APP,用于获取用户浏览网页的网页数据,并将所述网页数据发送至所述处理模块;
所述处理模块,用于将所述网页数据中的文字与所述管理模块中的锚点词进行匹配,根据匹配纬度对匹配成功的文字插入所述锚点词对应的跳转链接清单,其中,所述跳转链接清单具有其对应的显示区,以显示与所述锚点词相关的M个跳转链接,M的具体值根据具体需求由管理员权衡设置;
所述管理模块,用于存储所有可以用于超文本链接的锚点词及其对应的跳转链接清单,可通过锚点词查询到其相应的跳转链接清单;
所述用户端APP接收经所述处理模块处理后的网页数据并将所述经所述处理模块处理后的网页数据展示给用户,供用户选择文字的跳转链接清单中的跳转链接。
2.根据权利要求1所述的系统,其特征在于,所述匹配纬度包括:锚点词数量、页面主题和句号分隔符;所述根据匹配纬度对匹配成功的文字插入所述锚点词对应的跳转链接清单包括:
1)锚点词数量匹配纬度:对于同一个锚点词,只保留页面数据中的第一个;或者,将页面数据按照文字数量划分成多个文字块,每个文字块里最多含有N个字或字母,从而限制每个文字块里最多出现一个该锚点词,其中N是一个预先设定的阈值;
2)页面主题匹配纬度:所述锚点推送平台分析并获取页面数据的页面主题,从而只保留和该页面主题相关的锚点词;
3)句号分隔符匹配纬度:以句号作为分隔符,限制每一句话中最多出现S个锚点词,S的具体值根据具体需求由管理员权衡设置。
3.根据权利要求1-2任意一项所述的系统,其特征在于,若所述网页数据中具有多个与所述管理模块中的同一锚点词匹配成功的文字,则允许对所述文字多次插入所述锚点词对应的跳转链接清单,但限制第i次对所述文字插入所述锚点词对应的跳转链接清单和第i+1次对所述文字插入所述锚点词对应的跳转链接清单之间至少有2i-1k+1个句号(i>1),K的具体值根据具体需求由管理员权衡设置。
4.根据权利要求1-3任意一项所述的系统,其特征在于,在所述管理模块中,锚点词与其对应的跳转链接清单中的跳转链接是一对多的对应关系,所述管理模块能够根据预定的规则从相应的多个跳转链接中选择M个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610087726.2A CN105701232B (zh) | 2016-02-03 | 2016-02-03 | 一种基于app信息数据的超文本链接清单推送系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610087726.2A CN105701232B (zh) | 2016-02-03 | 2016-02-03 | 一种基于app信息数据的超文本链接清单推送系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105701232A true CN105701232A (zh) | 2016-06-22 |
CN105701232B CN105701232B (zh) | 2020-11-27 |
Family
ID=56223234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610087726.2A Expired - Fee Related CN105701232B (zh) | 2016-02-03 | 2016-02-03 | 一种基于app信息数据的超文本链接清单推送系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105701232B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391534A (zh) * | 2017-04-19 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 页面显示、页面文件返回方法及装置、计算机存储介质 |
CN108156221A (zh) * | 2017-12-04 | 2018-06-12 | 北京小米移动软件有限公司 | 通信方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9092816B1 (en) * | 2011-12-08 | 2015-07-28 | Amazon Technologies, Inc. | Use of social connections for item exploration |
CN105095394A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 网页生成方法和装置 |
CN105279224A (zh) * | 2015-09-09 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法及装置 |
-
2016
- 2016-02-03 CN CN201610087726.2A patent/CN105701232B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9092816B1 (en) * | 2011-12-08 | 2015-07-28 | Amazon Technologies, Inc. | Use of social connections for item exploration |
CN105095394A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 网页生成方法和装置 |
CN105279224A (zh) * | 2015-09-09 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法及装置 |
Non-Patent Citations (1)
Title |
---|
黄建年: "《天章觅踪——古籍整理新论》", 1 December 2011, 安徽师范大学出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391534A (zh) * | 2017-04-19 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 页面显示、页面文件返回方法及装置、计算机存储介质 |
CN107391534B (zh) * | 2017-04-19 | 2020-06-02 | 阿里巴巴集团控股有限公司 | 页面显示、页面文件返回方法及装置、计算机存储介质 |
CN108156221A (zh) * | 2017-12-04 | 2018-06-12 | 北京小米移动软件有限公司 | 通信方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105701232B (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9449271B2 (en) | Classifying resources using a deep network | |
US9514405B2 (en) | Scoring concept terms using a deep network | |
US10140368B2 (en) | Method and apparatus for generating a recommendation page | |
JP6653334B2 (ja) | 情報抽出方法及び装置 | |
KR101335400B1 (ko) | 문서와 관련하여 보여주기 위한 코멘트의 식별 | |
Akpınar et al. | Vision based page segmentation algorithm: Extended and perceived success | |
CN106462559B (zh) | 任意大小内容项生成 | |
US20060293879A1 (en) | Learning facts from semi-structured text | |
CN106649316A (zh) | 一种视频推送方法及装置 | |
US20180041458A1 (en) | Adaptive presentation of comments based on sentiment | |
US11907644B2 (en) | Detecting compatible layouts for content-based native ads | |
US9514113B1 (en) | Methods for automatic footnote generation | |
Sundaramoorthy et al. | Newsone—an aggregation system for news using web scraping method | |
US20180225379A1 (en) | Recommendation Based On Thematic Structure Of Content Items In Digital Magazine | |
US11574123B2 (en) | Content analysis utilizing general knowledge base | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
CN112966081A (zh) | 处理问答信息的方法、装置、设备和存储介质 | |
WO2014000130A1 (en) | Method or system for automated extraction of hyper-local events from one or more web pages | |
CN109598171A (zh) | 一种基于二维码的数据处理方法、装置及系统 | |
CN112084342A (zh) | 试题生成方法、装置、计算机设备及存储介质 | |
CN110909768B (zh) | 一种标注数据获取方法及装置 | |
CN105260459A (zh) | 搜索方法和装置 | |
CN105808636A (zh) | 一种基于app信息数据的超文本链接推送系统 | |
US20160275572A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable storage medium | |
KR102575415B1 (ko) | 마케터의 작업량 기간의 예약 가능 광고 정보 제공방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160705 Address after: 100091 C141 room, two floor, No. 88 incense Hill Road, Beijing, Haidian District Applicant after: BEIJING ZHONGSOU CLOUD BUSINESS NETWORK TECHNOLOGY Co.,Ltd. Address before: Shou Heng Technology Building No. 51 Beijing 100191 Haidian District Xueyuan Road room 0902 Applicant before: BEIJING ZHONGSOU NETWORK TECHNOLOGY Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201127 Termination date: 20220203 |