CN108280092A - 应用信息获取方法及装置 - Google Patents

应用信息获取方法及装置 Download PDF

Info

Publication number
CN108280092A
CN108280092A CN201710010779.9A CN201710010779A CN108280092A CN 108280092 A CN108280092 A CN 108280092A CN 201710010779 A CN201710010779 A CN 201710010779A CN 108280092 A CN108280092 A CN 108280092A
Authority
CN
China
Prior art keywords
application
interface
shop
application shop
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710010779.9A
Other languages
English (en)
Inventor
王跃
路博
康明吉
秦娇
乔亲旺
朱广红
侯鹏鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Taier Zhixin Technology Co Ltd
Original Assignee
Guangzhou Taier Zhixin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Taier Zhixin Technology Co Ltd filed Critical Guangzhou Taier Zhixin Technology Co Ltd
Priority to CN201710010779.9A priority Critical patent/CN108280092A/zh
Publication of CN108280092A publication Critical patent/CN108280092A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明属于应用数据统计技术领域,具体涉及一种应用信息获取方法及装置。本发明的应用信息获取方法包括:调用应用商店的搜索接口,输入关键词进行搜索,其中,所述关键词根据需要获取的应用名称确定;从所述应用商店返回的结果中提取应用ID;调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。本发明的应用信息获取方法及装置,通过两次调用应用商店的接口,直接从应用商店获取应用信息,效率高,信息来源可靠,提高了后续应用信息统计的效率和可信度。

Description

应用信息获取方法及装置
技术领域
本发明涉及应用数据统计技术领域,具体涉及一种应用信息获取方法及装置。
背景技术
移动应用程序监测,主要是通过爬虫技术爬取应用商店的具体信息、应用详细信息、每个应用的下载量等等,对应用市场中的应用进行统计,为产业支撑、决策提供可靠的信息。但随着移动互联网的快速发展,部分移动应用商店迁移到移动客户端上,其不可被传统爬虫爬取并获得相关上述信息,而传统的手机爬取方式需要调用图像识别等技术,在应用层进行相关数据的获取,爬取效率低下。
发明内容
针对现有技术中的缺陷,本发明提供的应用信息获取方法及装置,通过两次调用应用商店的接口,直接从应用商店获取应用信息,效率高,信息来源可靠,提高了后续应用信息统计的效率和可信度。
第一方面,本发明提供的一种应用信息获取方法,包括:调用应用商店的搜索接口,输入关键词进行搜索,其中,所述关键词根据需要获取的应用名称确定;从所述应用商店返回的结果中提取应用ID;调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
优选地,所述调用应用商店的搜索接口,输入关键词进行搜索,包括:获取应用商店的搜索接口,并分析所述搜索接口的形式;根据分析结果在所述搜索接口中填入关键词生成http请求;通过所述http请求访问所述应用商店。
优选地,所述获取应用商店的搜索接口,并分析所述搜索接口的形式,包括:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出所述应用商店的搜索接口形式。
优选地,所述从所述应用商店返回的结果中提取应用ID,包括:从所述应用商店返回的字符串中提取前两个应用ID。
优选地,所述调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,包括:调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词填入所述具体信息接口中,生成http请求;通过发送所述http请求的方式访问所述应用商店。
第二方面,本发明提供的一种应用信息获取装置,包括:搜索接口调用模块,用于调用应用商店的搜索接口,输入关键词进行搜索,其中,所述关键词根据需要获取的应用名称确定;应用ID提取模块,用于从所述应用商店返回的结果中提取应用ID;信息接口调用模块,用于调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
优选地,所述搜索接口调用模块具体用于:获取应用商店的搜索接口,并分析所述搜索接口的形式;根据分析结果在所述搜索接口中填入关键词生成http请求;通过所述http请求访问所述应用商店。
优选地,所述搜索接口调用模块中的获取应用商店的搜索接口,并分析所述搜索接口的形式,包括:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出所述应用商店的搜索接口形式。
优选地,所述应用ID提取模块具体用于:从所述应用商店返回的字符串中提取前两个应用ID。
优选地,所述信息接口调用模块具体用于:调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词填入所述具体信息接口中,生成http请求;通过发送所述http请求的方式访问所述应用商店。
附图说明
图1为本发明实施例所提供的应用信息获取方法的流程图;
图2为本发明实施例所提供的应用信息获取装置的结构框图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
如图1所示,本实施例提供了一种应用信息获取方法,包括:
步骤S1,调用应用商店的搜索接口,输入关键词进行搜索,其中,关键词根据需要获取的应用名称确定。
其中,搜索接口为URL格式。
步骤S2,从应用商店返回的结果中提取应用ID。
其中,搜索接口返回的结果中包含与应用相关的一些数据。应用ID为应用在该应用商店中的唯一编码。
步骤S3,调用应用商店的具体信息接口,将应用ID作为具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
其中,信息接口指的是商店内部库互相连接时需要传递的参数。具体信息接口指的是某一个特定的信息接口。由于通过搜索接口只能搜索到应用的应用ID以及大概的应用信息,而详细的应用信息需要根据应用ID通过另一个具体信息接口进行应用详细信息的爬取。
根据步骤S3返回的应用信息,即可进行应用信息的统计,得到应用的上线、下线、版本更新等情况。
由于无法直接从应用商店获取应用信息,本实施例提供的应用信息获取方法,先通过应用商店的搜索接口获取应用在应用商店中的应用ID,通过应用ID调用应用的具体信息接口,通过具体信息接口直接获取应用信息。本实施例提供的应用信息获取方法,通过两次调用应用商店的接口,直接从应用商店获取应用信息,效率高,信息来源可靠,提高了后续应用信息统计的效率和可信度。
其中,步骤S1具体包括:
步骤S11,获取应用商店的搜索接口,并分析搜索接口的形式。
其中,搜索接口为URL(Uniform Resource Locator,网页地址),搜索接口的关键词为搜索接口的参数。比如某应用商店的搜索接口形式如“http://XXX/XX?word=微信&XX=XX”,其中,“微信”即为搜索接口的参数或者搜索接口的关键词,上述URL搜索的是“微信”相关的应用。
每个应用商店的搜索接口的形式都不同,为此步骤S11的优选方法为:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出应用商店的搜索接口形式。其中,抓包工具优选tcpdump抓包工具。
步骤S12,根据分析结果在搜索接口中填入关键词生成http请求。
如,搜索的应用为百度地图,通过步骤S11得到某应用商店的搜索接口的形式为“http://XXX/XX?word=关键词&XX=XX”,则在关键词的部位填入“百度地图”得到http请求“http://XXX/XX?word=百度地图&XX=XX”。
步骤S13,通过http请求访问应用商店。
应用商店返回的搜索结果会包含许多应用相关的信息,其中包含多个应用ID,但只有前两个应用ID为需要的应用ID,其余的都为无用信息,为此步骤S2具体包括:从应用商店返回的字符串中提取前两个应用ID。
其中,应用商店返回的结果中应用ID会以key或者value的形式返回,查找返回的字符串中的“key”或者“value”字符串,提取“key”或者“value”字符串后的值,即为应用ID。
其中,步骤S3具体包括:
步骤S31,调用应用商店的具体信息接口,将所应用ID作为具体信息接口的关键词填入具体信息接口中,生成http请求。
其中,获取具体信息接口的形式与获取搜索接口的形式的方法相同,在此不再赘述。
步骤S32,通过发送所述http请求的方式访问应用商店。
基于与上述应用信息获取方法相同的发明构思,本实施例还提供了一种应用信息获取装置,如图2所示,包括:搜索接口调用模块,用于调用应用商店的搜索接口,输入关键词进行搜索,其中,关键词根据需要获取的应用名称确定;应用ID提取模块,用于从应用商店返回的结果中提取应用ID;信息接口调用模块,用于调用应用商店的具体信息接口,将应用ID作为具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
由于无法直接从应用商店获取应用信息,本实施例提供的应用信息获取方法,先通过应用商店的搜索接口获取应用在应用商店中的应用ID,通过应用ID调用应用的具体信息接口,通过具体信息接口直接获取应用信息。本实施例提供的应用信息获取方法,通过两次调用应用商店的接口,直接从应用商店获取应用信息,效率高,信息来源可靠,提高了后续应用信息统计的效率和可信度。
优选地,搜索接口调用模块具体用于:获取应用商店的搜索接口,并分析搜索接口的形式;根据分析结果在搜索接口中填入关键词生成http请求;通过http请求访问应用商店。
优选地,搜索接口调用模块中的获取应用商店的搜索接口,并分析搜索接口的形式,包括:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出应用商店的搜索接口形式。
优选地,应用ID提取模块具体用于:从应用商店返回的字符串中提取前两个应用ID。
优选地,信息接口调用模块具体用于:调用应用商店的具体信息接口,将应用ID作为具体信息接口的关键词填入具体信息接口中,生成http请求;通过发送http请求的方式访问应用商店。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种应用信息获取方法,其特征在于,包括:
调用应用商店的搜索接口,输入关键词进行搜索,其中,所述关键词根据需要获取的应用名称确定;
从所述应用商店返回的结果中提取应用ID;
调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
2.根据权利要求1所述的方法,其特征在于,所述调用应用商店的搜索接口,输入关键词进行搜索,包括:
获取应用商店的搜索接口,并分析所述搜索接口的形式;
根据分析结果在所述搜索接口中填入关键词生成http请求;
通过所述http请求访问所述应用商店。
3.根据权利要求2所述的方法,其特征在于,所述获取应用商店的搜索接口,并分析所述搜索接口的形式,包括:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出所述应用商店的搜索接口形式。
4.根据权利要求1所述的方法,其特征在于,所述从所述应用商店返回的结果中提取应用ID,包括:从所述应用商店返回的字符串中提取前两个应用ID。
5.根据权利要求1所述的方法,其特征在于,所述调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,包括:
调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词填入所述具体信息接口中,生成http请求;
通过发送所述http请求的方式访问所述应用商店。
6.一种应用信息获取装置,其特征在于,包括:
搜索接口调用模块,用于调用应用商店的搜索接口,输入关键词进行搜索,其中,所述关键词根据需要获取的应用名称确定;
应用ID提取模块,用于从所述应用商店返回的结果中提取应用ID;
信息接口调用模块,用于调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词,搜索应用信息,并接收返回的应用信息。
7.根据权利要求6所述的装置,其特征在于,所述搜索接口调用模块具体用于:
获取应用商店的搜索接口,并分析所述搜索接口的形式;
根据分析结果在所述搜索接口中填入关键词生成http请求;
通过所述http请求访问所述应用商店。
8.根据权利要求7所述的装置,其特征在于,所述搜索接口调用模块中的获取应用商店的搜索接口,并分析所述搜索接口的形式,包括:通过抓包工具点击应用商店的搜索接口进行搜索,并通过wireshark工具分析得出所述应用商店的搜索接口形式。
9.根据权利要求6所述的装置,其特征在于,所述应用ID提取模块具体用于:从所述应用商店返回的字符串中提取前两个应用ID。
10.根据权利要求6所述的装置,其特征在于,所述信息接口调用模块具体用于:
调用应用商店的具体信息接口,将所述应用ID作为所述具体信息接口的关键词填入所述具体信息接口中,生成http请求;
通过发送所述http请求的方式访问所述应用商店。
CN201710010779.9A 2017-01-06 2017-01-06 应用信息获取方法及装置 Pending CN108280092A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710010779.9A CN108280092A (zh) 2017-01-06 2017-01-06 应用信息获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710010779.9A CN108280092A (zh) 2017-01-06 2017-01-06 应用信息获取方法及装置

Publications (1)

Publication Number Publication Date
CN108280092A true CN108280092A (zh) 2018-07-13

Family

ID=62800935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710010779.9A Pending CN108280092A (zh) 2017-01-06 2017-01-06 应用信息获取方法及装置

Country Status (1)

Country Link
CN (1) CN108280092A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
CN1282928A (zh) * 1999-07-28 2001-02-07 国际商业机器公司 提供本国语言查询服务的方法和系统
US6760746B1 (en) * 1999-09-01 2004-07-06 Eric Schneider Method, product, and apparatus for processing a data request
CN103064954A (zh) * 2011-12-30 2013-04-24 微软公司 基于实体的搜索和解析
CN104657484A (zh) * 2015-02-28 2015-05-27 深圳市中兴移动通信有限公司 应用软件下载的方法、装置及系统
CN106030569A (zh) * 2013-12-06 2016-10-12 奎克西公司 重构搜索查询的技术

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
CN1282928A (zh) * 1999-07-28 2001-02-07 国际商业机器公司 提供本国语言查询服务的方法和系统
US6760746B1 (en) * 1999-09-01 2004-07-06 Eric Schneider Method, product, and apparatus for processing a data request
CN103064954A (zh) * 2011-12-30 2013-04-24 微软公司 基于实体的搜索和解析
CN106030569A (zh) * 2013-12-06 2016-10-12 奎克西公司 重构搜索查询的技术
CN104657484A (zh) * 2015-02-28 2015-05-27 深圳市中兴移动通信有限公司 应用软件下载的方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
姚鑫: "分布式手机软件应用搜索爬虫系统设计与实现", 《中国优秀硕士学位论文全文数据库》 *
徐晓东: "App Store应用信息自动化采集系统设计与实现", 《CNKI中国会议论文全文库》 *
徐晓东: "移动互联网应用商店应用软件信息自动化采集系统设计与实现", 《中国优秀硕士学位论文全文数据库》 *

Similar Documents

Publication Publication Date Title
CN101847160B (zh) 一种移动终端个性化页面推送方法和装置
CN102663105A (zh) 号码信息数据库的建立方法及系统
CN104199851A (zh) 通过黄页信息提取电话号码的方法及云端服务器
CN104298782B (zh) 互联网用户主动访问行为轨迹的分析方法
CN110430188B (zh) 一种快速url过滤方法及装置
CN107861967A (zh) 一种智能匹配好友的方法、装置和系统
CN107092639A (zh) 一种搜索引擎系统
CN109905873B (zh) 一种基于特征标识信息的网络账号关联方法
CN108111547B (zh) 一种域名健康监测方法及系统
CN111104579A (zh) 一种公网资产的识别方法、装置及存储介质
CN107666404A (zh) 宽带网络用户识别方法和装置
CN112491917A (zh) 一种物联网设备未知漏洞识别方法及装置
CN109547294B (zh) 一种基于固件分析的联网设备型号探测方法、装置
CN106257887B (zh) 一种基于WebSocket的获取客户端硬件信息的方法
CN107766234A (zh) 一种基于移动设备的网页健康度的测评方法、装置及系统
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN103412913B (zh) 一种关联搜索方法和系统
CN105635064A (zh) Csrf攻击检测方法及装置
CN117332095A (zh) 一种基于资产探测的网络空间知识图谱构建方法
CN111209325A (zh) 业务系统接口识别方法、装置及存储介质
CN104980409A (zh) 一种上网行为管理方法及装置
CN109933712A (zh) 一种报文数据的提取方法及系统
CN113132340B (zh) 一种基于视觉与主机特征的钓鱼网站识别方法及电子装置
CN107862016A (zh) 一种专题页面的配置方法
CN105094810B (zh) 基于通用网关接口插件的数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination