CN103581275A - 一种浏览器地址栏智能提示算法的离线测试方法和系统 - Google Patents

一种浏览器地址栏智能提示算法的离线测试方法和系统 Download PDF

Info

Publication number
CN103581275A
CN103581275A CN201210281729.1A CN201210281729A CN103581275A CN 103581275 A CN103581275 A CN 103581275A CN 201210281729 A CN201210281729 A CN 201210281729A CN 103581275 A CN103581275 A CN 103581275A
Authority
CN
China
Prior art keywords
url
user
input
address bar
browser address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210281729.1A
Other languages
English (en)
Other versions
CN103581275B (zh
Inventor
肖镜辉
刘玉国
司天歌
周晓波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210281729.1A priority Critical patent/CN103581275B/zh
Publication of CN103581275A publication Critical patent/CN103581275A/zh
Application granted granted Critical
Publication of CN103581275B publication Critical patent/CN103581275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种浏览器地址栏智能提示算法的离线测试方法,包括:从浏览器地址栏上报数据中提取数据模拟用户本机历史URL;从浏览器地址栏上报数据中提取数据模拟用户期望输入的URL;根据用户期望输入的URL模拟用户在地址栏的输入;利用地址栏候选列表生成算法根据用户在地址栏的输入和用户本机历史URL生成候选URL列表;将候选URL列表中的URL与用户期望输入的URL相比对,计算相关测试指标。该方法将浏览器地址栏候选列表生成算法的改进工作与浏览器客户端开发相分离,使算法的改进不影响现有版本的发布,还可量化地衡量地址栏候选列表提示算法的性能。本发明还提供一种浏览器地址栏智能提示算法的离线测试系统。

Description

一种浏览器地址栏智能提示算法的离线测试方法和系统
技术领域
本发明涉及互联网技术,尤其涉及一种浏览器地址栏智能提示算法的离线测试方法和系统。
背景技术
随着互联网的发展,浏览器软件作为计算机用户通向互联网的入口,越来越受到各大互联网企业的重视。从早期的IE和网景,以能够渲染和展示网站页面为主要功能;到后来的火狐、Chrome,可提供丰富的可定制插件,并可与搜索引擎相结合;直到最近的QQ浏览器、Sogou浏览器和360浏览器,为用户提供个性化、定制化的服务,减少用户操作时间,缩短用户与互联网距离,提高用户上网体验。
地址栏是浏览器的重要组件,用户在浏览器地址栏中输入网址,确认后浏览器渲染、展现相应的网页内容。当前的主流浏览器通常都会在用户输入的同时运用智能算法,猜测用户的目标网址,并自动生成若干候选网址供用户进一步选择,以期减少用户输入操作,缩短用户与目标网站的距离,加快用户的上网速度。一个好的地址栏提示算法能够让用户用最少的输入,最快速的访问目标网址,从而提高用户使用浏览器的最终体验。可以说,地址栏智能提示算法的优劣,直接决定了用户通过浏览器访问互联网的距离。
目前,地址栏智能提示算法的改进和更新都是直接在客户端开发中完成,其算法改进效果通过产品发布后用户的反馈来衡量。这种做法有两不足:一方面,算法的质量衡量要等到产品发布之后,风险较大,容易破坏现有的用户体验,且一旦出了问题不容易修正;另一方面,单凭用户反馈,无法准确、客观地评价算法质量。
发明内容
有鉴于此,本发明提供一种的浏览器地址栏智能提示算法的离线测试方法及离线测试系统。
上述的浏览器地址栏智能提示算法的离线测试方法及离线测试系统是通过以下技术方案实现的:
一种浏览器地址栏智能提示算法的离线测试方法,其包括:
从浏览器地址栏上报数据中提取数据,模拟用户本机历史URL;
从浏览器地址栏上报数据中提取数据,模拟用户期望输入的URL;
根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
利用地址栏候选列表生成算法根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
将候选URL列表中的URL与用户期望输入的URL相比对,计算相关测试指标。
一种浏览器地址栏智能提示算法的离线测试系统,其包括:
浏览器地址栏上报数据集,包括用户浏览过的网页的URL;
训练集,包括由浏览器地址栏上报数据集中提取出来、用于模拟用户本机历史URL的数据;
测试集,包括由浏览器地址栏上报数据中提取出来、用于模拟用户期望输入的URL的数据;
用户输入生成器,用于根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
地址栏候选列表生成器,用于根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
比较器,用于将生成的候选URL列表与用户期望输入的URL相比对;以及
测试指标计算器,用于根据生成的候选URL列表与用户期望输入的URL的比对结果计算相关的测试指标。
本发明提供的浏览器地址栏智能提示算法的离线测试方法和离线测试系统将浏览器地址栏候选列表生成算法的改进工作与浏览器客户端开发相分离,离线地对浏览器地址栏算法进行开发和测试。一方面使算法的改进不影响现有版本的发布,使得版本发布更加安全可靠;另一方面,能够量化地衡量、比较地址栏候选列表提示算法的性能。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1为本发明揭示的一种浏览器地址栏智能提示算法的离线测试方法的流程图。
图2为本发明所揭示的一种浏览器地址栏智能提示算法的离线测试系统的示意图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的浏览器地址栏智能提示算法的离线测试方法及系统的具体实施方式、结构、特征及其功效,详细说明如后。
浏览器地址栏智能提示算法的离线测试方法
图1为本发明揭示的一种浏览器地址栏智能提示算法的离线测试方法的流程图。如图1所示,该离线测试方法包括以下步骤:
步骤S101:从浏览器地址栏上报数据中提取数据,模拟用户本机历史URL;
步骤S102:从浏览器地址栏上报数据中提取数据,模拟用户期望输入的URL;
步骤S103:根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
步骤S104:利用地址栏候选列表生成算法根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
步骤S105:将候选URL列表中的URL与用户期望输入的URL相比对,计算相关测试指标。
具体地,步骤S101中,从浏览器地址栏上报数据中提取数据,模拟用户本机历史URL包括:
统计用户使用浏览器访问网页的频率f;
根据所述频率f和需要模拟的时间t从浏览器地址栏上报数据中提取n个URL数据;
将提取的n个URL数据分成t份作为模拟的该段时间的用户本机历史URL。
例如,用户使用浏览器访问网页的频率f为100,即用户每天打开100个网页;需要模拟的时间t为30天,则需要从浏览器地址栏上报数据中依序提取n=3000个URL数据,将上述3000个URL数据分成30份来模拟用户在30天内的访问历史,其中1-100个URL表示用户第一天访问的,101-200个URL表示用户第二天访问的,……以此类推。
具体地,步骤S103中,根据用户期望输入的URL模拟用户在浏览器地址栏的输入包括:
从用户期望输入的URL中提取主域名;
从主域名中抽取前m个字符作为模拟的用户输入。
例如,用户期望输入的其中一条URL为http://www.sina.com.cn”,则根据该条URL模拟用户在浏览器地址栏的输入的步骤包括:首先,从该条URL  “http://www.sina.com.cn”中抽取主域名“sina”;接着,从主域名中抽取前m个字符,例如“si”,作为模拟的用户输入。其中,m既可以是固定长度,如:1或者2,也可以是随机产生的整数。m的值通常小于主域名的字符数目。
其中,步骤S105中所述的测试指标包括用户首选命中率,计算用户首选命中率的步骤包括:
将候选URL列表中的第一个URL与用户期望输入的URL相比较,如果相同,就表示命中一次,否则表示没有命中;
根据用户首选命中率=命中的URL数目/用户期望输入的全部URL数目计算首选命中率。
其中,步骤S105中所述的测试指标也可以包括用户输入字符长度平均值计算用户输入字符长度平均值的步骤包括:
统计根据输入的字符所产生的候选URL列表中的第一个URL与用户期望输入的URL相符时字符串的长度mi,mi表示在测试第i个用户期望输入的URL时,输入了m个字符;
根据
Figure BDA00001991645700052
对用户期望输入的全部URL计算mi的平均值,其中N表示用户期望输入的全部URL的数目。
利用上述公式计算出的
Figure BDA00001991645700053
的数值越小,表示用户在输入期望网址时所花费的代价越小,所采用的地址栏智能提示算法的性能越好。
本发明提供的浏览器地址栏智能提示算法的离线测试方法将浏览器地址栏候选列表生成算法的改进工作与浏览器客户端开发相分离,离线地对浏览器地址栏算法进行开发和测试。一方面使算法的改进不影响现有版本的发布,使得版本发布更加安全可靠;另一方面,能够量化地衡量、比较地址栏候选列表提示算法的性能。
浏览器地址栏智能提示算法的离线测试系统
图2为本发明所揭示的一种浏览器地址栏智能提示算法的离线测试系统的示意图。如图2所示,该离线测试系统包括:
浏览器地址栏上报数据集201,包括浏览器客户端上报至服务器的用户浏览过的网页的URL;
训练集202,包括由浏览器地址栏上报数据集201中提取出来、用于模拟用户本机历史URL的数据;
测试集203,包括由浏览器地址栏上报数据中提取出来、用于模拟用户期望输入的URL的数据;
用户输入生成器204,用于根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
地址栏候选列表生成器205,其内部存储有地址栏候选列表生成算法,用于根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
比较器206,用于将生成的候选URL列表与用户期望输入的URL相比对;以及
测试指标计算器207,用于根据生成的候选URL列表与用户期望输入的URL的比对结果计算相关的测试指标。
具体地,所述训练集202包括:根据用户使用浏览器访问网页的频率f和需要模拟的时间t从浏览器地址栏上报数据集201中提取的n个URL数据,所述的n个URL数据被分成t份作为模拟的该段时间的用户本机历史URL。
具体地,所述用户输入生成器204从用户期望输入的URL中提取主域名,并从提取的主域名中抽取前m个字符作为模拟的用户输入。
具体地,所述的测试指标包括用户首选命中率,所述测试指标计算器207中存储有用户首选命中率的计算公式:用户首选命中率=命中的URL数目/测试集中全部URL数目,其中命中的URL数目表示候选URL列表中的第一个URL与用户期望输入的URL相符的次数。
可以选择地,所述的测试指标也可以包括用户输入字符长度平均值
Figure BDA00001991645700061
所述测试指标计算器207中存储有用户输入字符长度平均值的计算公式:
Figure BDA00001991645700062
其中mi为根据输入的字符所产生的候选URL列表中的第一个URL与用户期望输入的URL相符时字符串的长度,N为测试集203中全部URL数目。
利用上述公式计算出的
Figure BDA00001991645700063
的数值越小,表示用户在输入期望网址时所花费的代价越小,所采用的地址栏智能提示算法的性能越好。
本发明提供的浏览器地址栏智能提示算法的离线测试系统将浏览器地址栏候选列表生成算法的改进工作与浏览器客户端开发相分离,离线地对浏览器地址栏算法进行开发和测试。一方面使算法的改进不影响现有版本的发布,使得版本发布更加安全可靠;另一方面,能够量化地衡量、比较地址栏候选列表提示算法的性能。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种浏览器地址栏智能提示算法的离线测试方法,其特征在于,该离线测试方法包括:
从浏览器地址栏上报数据中提取数据,模拟用户本机历史URL;
从浏览器地址栏上报数据中提取数据,模拟用户期望输入的URL;
根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
利用地址栏候选列表生成算法根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
将候选URL列表中的URL与用户期望输入的URL相比对,计算相关测试指标。
2.如权利要求1所述的浏览器地址栏智能提示算法的离线测试方法,其特征在于,从浏览器地址栏上报数据中提取数据,模拟用户本机历史URL的步骤包括:
统计用户使用浏览器访问网页的频率f;
根据所述频率f和需要模拟的时间t从浏览器地址栏上报数据中提取n个URL数据;
将提取的n个URL数据分成t份作为模拟的该段时间的用户本机历史URL。
3.如权利要求1所述的浏览器地址栏智能提示算法的离线测试方法,其特征在于,根据用户期望输入的URL模拟用户在浏览器地址栏的输入的步骤包括:
从用户期望输入的URL中提取主域名;
从主域名中抽取前m个字符作为模拟的用户输入。
4.如权利要求1所述的浏览器地址栏智能提示算法的离线测试方法,其特征在于,所述的测试指标包括用户首选命中率,计算用户首选命中率的步骤包括:
将候选URL列表中的第一个URL与用户期望输入的URL相比较,如果相同,就表示命中一次,否则表示没有命中;
根据用户首选命中率=命中的URL数目/用户期望输入的全部URL数目计算首选命中率。
5.如权利要求1所述的浏览器地址栏智能提示算法的离线测试方法,其特征在于,所述的测试指标包括用户输入字符长度平均值
Figure FDA00001991645600021
计算用户输入字符长度平均值的步骤包括:
统计根据输入的字符所产生的候选URL列表中的第一个URL与用户期望输入的URL相符时字符串的长度mi;
根据
Figure FDA00001991645600022
对用户期望输入的全部URL计算mi的平均值,其中N表示用户期望输入的全部URL的数目。
6.一种浏览器地址栏智能提示算法的离线测试系统,其特征在于:该离线测试系统包括:
浏览器地址栏上报数据集,包括用户浏览过的网页的URL;
训练集,包括由浏览器地址栏上报数据集中提取出来、用于模拟用户本机历史URL的数据;
测试集,包括由浏览器地址栏上报数据中提取出来、用于模拟用户期望输入的URL的数据;
用户输入生成器,用于根据用户期望输入的URL模拟用户在浏览器地址栏的输入;
地址栏候选列表生成器,用于根据用户在浏览器地址栏的输入和用户本机历史URL生成候选URL列表;
比较器,用于将生成的候选URL列表与用户期望输入的URL相比对;以及
测试指标计算器,用于根据生成的候选URL列表与用户期望输入的URL的比对结果计算相关的测试指标。
7.如权利要求6所述的浏览器地址栏智能提示算法的离线测试系统,其特征在于,所述训练集包括:根据用户使用浏览器访问网页的频率f和需要模拟的时间t从浏览器地址栏上报数据集中提取的n个URL数据,所述的n个URL数据被分成t份作为模拟的该段时间的用户本机历史URL。
8.如权利要求6所述的浏览器地址栏智能提示算法的离线测试系统,其特征在于,所述用户输入生成器从用户期望输入的URL中提取主域名,并从提取的主域名中抽取前m个字符作为模拟的用户输入。
9.如权利要求6所述的浏览器地址栏智能提示算法的离线测试系统,其特征在于,所述的测试指标包括用户首选命中率,所述测试指标计算器中存储有用户首选命中率的计算公式:用户首选命中率=命中的URL数目/测试集中全部URL数目,其中命中的URL数目表示候选URL列表中的第一个URL与用户期望输入的URL相符的次数。
10.如权利要求6所述的浏览器地址栏智能提示算法的离线测试系统,其特征在于,所述的测试指标包括用户输入字符长度平均值
Figure FDA00001991645600031
所述测试指标计算器中存储有用户输入字符长度平均值的计算公式:
Figure FDA00001991645600032
其中mi为根据输入的字符所产生的候选URL列表中的第一个URL与用户期望输入的URL相符时字符串的长度,N为测试集中全部URL数目。
CN201210281729.1A 2012-08-09 2012-08-09 一种浏览器地址栏智能提示算法的离线测试方法和系统 Active CN103581275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210281729.1A CN103581275B (zh) 2012-08-09 2012-08-09 一种浏览器地址栏智能提示算法的离线测试方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210281729.1A CN103581275B (zh) 2012-08-09 2012-08-09 一种浏览器地址栏智能提示算法的离线测试方法和系统

Publications (2)

Publication Number Publication Date
CN103581275A true CN103581275A (zh) 2014-02-12
CN103581275B CN103581275B (zh) 2018-02-27

Family

ID=50052190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210281729.1A Active CN103581275B (zh) 2012-08-09 2012-08-09 一种浏览器地址栏智能提示算法的离线测试方法和系统

Country Status (1)

Country Link
CN (1) CN103581275B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1365239A (zh) * 2001-01-11 2002-08-21 英华达股份有限公司 在无线应用协议浏览器上输入追踪和智能匹配网址的方法
CN1374600A (zh) * 2001-03-14 2002-10-16 英业达集团(南京)电子技术有限公司 在wap浏览器上输入追踪和智能匹配网址的方法
US20050028082A1 (en) * 2003-07-30 2005-02-03 Topalov Ognian Z. Reverse mapping method and apparatus for form filling
CN1629789A (zh) * 2003-12-16 2005-06-22 佳能株式会社 信息处理装置和数据输入方法
CN101194256A (zh) * 2004-11-12 2008-06-04 谷歌公司 具有表意文字和音标字符的语言的自动输入完成的方法和系统
CN101268463A (zh) * 2005-08-24 2008-09-17 雅虎公司 在完成搜索查询之前提出可选查询

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1365239A (zh) * 2001-01-11 2002-08-21 英华达股份有限公司 在无线应用协议浏览器上输入追踪和智能匹配网址的方法
CN1374600A (zh) * 2001-03-14 2002-10-16 英业达集团(南京)电子技术有限公司 在wap浏览器上输入追踪和智能匹配网址的方法
US20050028082A1 (en) * 2003-07-30 2005-02-03 Topalov Ognian Z. Reverse mapping method and apparatus for form filling
CN1629789A (zh) * 2003-12-16 2005-06-22 佳能株式会社 信息处理装置和数据输入方法
CN101194256A (zh) * 2004-11-12 2008-06-04 谷歌公司 具有表意文字和音标字符的语言的自动输入完成的方法和系统
CN101268463A (zh) * 2005-08-24 2008-09-17 雅虎公司 在完成搜索查询之前提出可选查询

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖镜辉 等: "《面向汉语建模的自适应词表生成算法》", 《自动化学报》 *

Also Published As

Publication number Publication date
CN103581275B (zh) 2018-02-27

Similar Documents

Publication Publication Date Title
CN102262661B (zh) 一种基于k阶混合马尔可夫模型的Web页面访问预测方法
CN104462593B (zh) 一种提供用户个性化资源消息推送的方法和装置
CN103559235B (zh) 一种在线社交网络恶意网页检测识别方法
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及系统
US20130268457A1 (en) System and Method for Extracting Aspect-Based Ratings from Product and Service Reviews
CN107330613A (zh) 一种舆情监控方法、设备及计算机可读存储介质
TWI443529B (zh) 自動化領域名詞建置方法及系統,及其電腦程式產品
CN106251174A (zh) 信息推荐方法及装置
US20120109956A1 (en) Profile prediction for shared computers
CN104536980A (zh) 一种确定候评项的质量信息的方法与装置
CN102663617A (zh) 一种广告的点击率预测方法及系统
CN103390051A (zh) 一种基于微博数据的话题发现与追踪方法
CN104216881A (zh) 一种个性化标签的推荐方法及装置
CN105069077A (zh) 搜索方法及装置
CN103150663A (zh) 一种网络投放数据投放的方法和装置
CN104933475A (zh) 网络转发行为预测方法及装置
CN106528777A (zh) 跨屏用户标识归一的方法及其系统
CN104794108A (zh) 网页标题抽取方法及其装置
Ji et al. Detecting suicidal ideation with data protection in online communities
CN112907128A (zh) 基于ab测试结果的数据分析方法、装置、设备及介质
CN108337255A (zh) 一种基于web自动化测试和宽度学习的钓鱼网站检测方法
CN112532624B (zh) 一种黑链检测方法、装置、电子设备及可读存储介质
CN103761266A (zh) 基于多级逻辑回归的点击率预测方法和系统
CN108133390A (zh) 用于预测用户行为的方法和装置以及计算设备
CN103617146B (zh) 一种基于硬件资源消耗的机器学习方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221206

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518000

Patentee after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 2, 518044, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right