CN110119337A - 一种数据分析方法、装置及服务器 - Google Patents
一种数据分析方法、装置及服务器 Download PDFInfo
- Publication number
- CN110119337A CN110119337A CN201910305066.4A CN201910305066A CN110119337A CN 110119337 A CN110119337 A CN 110119337A CN 201910305066 A CN201910305066 A CN 201910305066A CN 110119337 A CN110119337 A CN 110119337A
- Authority
- CN
- China
- Prior art keywords
- key assignments
- access
- application software
- log
- data list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
- G06F11/3082—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/552—Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/865—Monitoring of software
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请属于计算机技术领域,提供一种数据分析方法、装置及服务器,该方法包括:在接收到应用软件的前端设备的访问请求时,根据访问请求生成一条访问日志并存储于预设路径;每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;根据所述数据列表,分析和判断所述应用软件的使用情况。从而可以根据需要获取应用软件精确的数据,用以判断和分析应用软件的使用情况,提高了数据分析的安全性和准确率。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种数据分析方法、装置及服务器。
背景技术
随着科学技术的不断发展,出现了各种各样的应用软件提供不同的功能,汽修大师即是一款专业的汽车维修诊断的应用软件,可以提供学习、论坛、问答、远程诊断、商城等功能。
为更好维护应用软件的运营,需在用户使用应用软件时了解用户相关的使用情况,通常是对应用软件的行为数据进行分析,以了解用户相关的使用情况,目前对应用软件的数据分析都要借助第三方统计工具插件(如友盟、百度移动、魔方等)获取数据进行分析,第三方获取到应用软件的数据会使得安全性低,且现有第三方的统计技术通常只能初略的统计应用软件的访问人数,而不能进行获得精确的数据进行分析,从而数据分析结果的准确率低。
发明内容
有鉴于此,本申请实施例提供了一种数据分析方法、装置及服务器,旨在解决现有对应用软件的使用情况进行数据分析的准确率低且安全性低的问题。
本申请实施例的第一方面一种数据分析方法,其特征在于,应用于应用软件的后台服务器,所述数据分析方法包括:
在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径;
每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;
根据所述数据列表,分析和判断所述应用软件的使用情况。
在一个实施例中,所述预设标识包括用户标识和应用软件标识;
所述每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,包括:
每间隔预设时间,对所述预设路径在预设时间内生成的所有访问日志进行压缩,得到第一日志文件;
在到达预设时刻时,对所述第一日志文件进行解压;
对解压后的所述第一日志文件进行遍历,将所述第一日志文件中包括用户标识和应用软件标识的访问日志作为第一日志。
在一个实施例中,所述将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表之后,还包括:
将得到的数据列表批量存入数据库;
删除所述第一日志文件。
在一个实施例中,所述访问日志包括以下键值名中的至少一种和对应的键值:
所述应用软件的版本号、用户标识、应用软件标识;
所述后台服务器的IP地址;
访问所述后台服务器的访问时间和访问方式;
所述前端设备的IP地址;以及
所述应用软件中被访问的功能模块的标识。
在一个实施例中,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表,包括:
获取所有第一日志的条数;
根据所述条数,按预设数值对所述所有第一日志进行分批读取;
在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表。
在一个实施例中,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表,包括:
获取所述第一日志中包括第一预设键值名和所述第一预设键值名对应的键值,并存入第一数据列表中;所述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名;
和/或,获取所述第一日志中包括第二预设键值名和所述第二预设键值名对应的键值,并存入第二数据列表中;第二预设键值名对包括用户标识和访问时间两个键值名;
和/或,获取所述第一日志中包括第三预设键值名和所述第三预设键值名对应的键值,并存入第三数据列表中;第三预设键值名对包括用户IP地址和访问时间两个键值名。
在一个实施例中,根据所述数据列表,分析和判断所述应用软件的使用情况,包括:
根据所述第一数据列表,分析和判断所述应用软件包括的功能模块的使用情况;
和/或,根据所述第二数据列表,分析和判断所述应用软件的浏览请况和访问情况;
和/或,根据所述第三数据列表,分析和判断所述应用软件是否存在异常使用情况。
在一个实施例中,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表之后,还包括:
根据所述数据列表生成可视化图表;
根据所述可视化图表进行数据分析。
本申请实施例的第二方面提供一种数据分析装置,应用于所述应用软件的后台服务器,所述数据分析装置包括:
第一生成模块,用于在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径;
遍历模块,用于每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
第一存储模块,用于将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表;
分析判断模块,用于根据所述数据列表,分析和判断所述应用软件的使用情况。
在一个实施例中,所述预设标识包括用户标识和应用软件标识;
所述遍历模块包括:
压缩单元,用于每间隔预设时间,对所述预设路径在预设时间内生成的所有访问日志进行压缩,得到第一日志文件;
解压单元,用于在到达预设时刻时,对所述第一日志文件进行解压;
遍历单元,用于对解压后的所述第一日志文件进行遍历,将所述第一日志文件中包括用户标识和应用软件标识的访问日志作为第一日志。
在一个实施例中,所述所述数据分析装置还包括:
第二存储模块,用于将得到的数据列表批量存入数据库;
删除模块,用于将得到的数据列表批量存入数据库之后,删除所述第一日志文件。
在一个实施例中,所述访问日志包括以下键值名中的至少一种和对应的键值:
所述应用软件的版本号、用户标识、应用软件标识;
所述后台服务器的IP地址;
访问所述后台服务器的访问时间和访问方式;
所述前端设备的IP地址;以及
所述应用软件中被访问的功能模块的标识。
在一个实施例中,所述第一存储模块包括:
第一获取单元,用于获取所有第一日志的条数;
第一读取单元,用于根据所述条数,按预设数值对所述所有第一日志进行分批读取;
第一存储单元,用于在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表。
在一个实施例中,所述第一存储模块还包括:
第二存储单元,用于获取所述第一日志中包括第一预设键值名和所述第一预设键值名对应的键值,并存入第一数据列表中;所述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名;
和/或,第三存储单元,用于获取所述第一日志中包括第二预设键值名和所述第二预设键值名对应的键值,并存入第二数据列表中;第二预设键值名对包括用户标识和访问时间两个键值名;
和/或,第四存储单元,用于获取所述第一日志中包括第三预设键值名和所述第三预设键值名对应的键值,并存入第三数据列表中;第三预设键值名对包括用户IP地址和访问时间两个键值名。
在一个实施例中,所述分析判断模块包括:
第一分析判断单元,用于根据所述第一数据列表,分析和判断所述应用软件包括的功能模块的使用情况;
和/或,第二分析判断单元,用于根据所述第二数据列表,分析和判断所述应用软件的浏览请况和访问情况;
和/或,第三分析判断单元,用于根据所述第三数据列表,分析和判断所述应用软件是否存在异常使用情况。
在一个实施例中,所述数据分析装置还包括:
第二生成模块,用于根据所述数据列表生成可视化图表;
数据分析模块,用于根据所述可视化图表进行数据分析。
本申请实施例的第三方面提供一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现上述方法的步骤。
在本申请实施例中,由于根据应用软件的前端设备的访问请求生成访问日志并存储于预设路径,每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;根据数据列表,分析和判断所述应用软件的使用情况,从而可以根据需要获取应用软件精确的数据,用以判断和分析应用软件的使用情况,提高了数据分析的安全性和准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例一提供的数据分析方法的流程示意图;
图1-1是本申请实施例一提供的数据分析方法的步骤S102的具体实现流程图;
图2是本发明实施例二提供的数据分析方法的流程示意图;
图3是本发明实施例三提供的数据分析方法的流程示意图;
图4是本发明实施例四提供的数据分析装置的结构示意图
图5是本发明实施例五提供的服务器的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本申请实施例提供的数据分析方法,可应用于应用软件(如汽修大师或其它应用软件)的后台服务器中,本申请实施例中的数据分析方法步骤可由上述应用软件的一个后台服务器完成,也可由上述应用软件的多个后台服务器共同完成,对此不做限定,为了便于本领域技术人员对本申请实施例的理解,下面实施例中的方法步骤以一个后台服务器完成进行描述。为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。应理解,下述方法实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对各实施例的实施过程构成任何限定。
实施例一
本发明实施例提供的一种数据分析方法,应用于应用软件的后台服务器,如图1所示,所述数据分析方法包括:
步骤S101,在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径。
在本申请实施例中,上述应用软件的前端设备可以是装有所述应用软件的移动终端或电脑终端等设备。上述访问请求可以理解为当用户通过应用软件的前端设备登录并使用应用软件的某功能时生成的访问请求,上述访问请求可根据预先定义的格式生成。
在一个实施例中,所述应用软件的前端访问请求信息至少包括所述应用软件的版本号、用户标识、所述应用软件标识和认证签名共四个键值名;所述认证签名用于对所述前端设备的身份进行安全认证。
在具体应用中,上述应用软件的版本号用来记录是哪一版本的应用软件,上述用户标识可用于识别用户的身份,上述应用软件标识可用于区分应用软件的前端设备类型。如当应用软件的前端设备为移动终端,前端设备的类型可包括iso和android两种类型,具体地,前端设备类型为iso的应用软件标识号为131,前端类型为安卓的应用软件标识号对应为141。上述认证签名可以是根据传输信息和预先约定好的特殊码进行加密后的安全信息,具体可通过消息摘要算法(Message Digest Algorithm MD5)进行加密。例如认证签名可以表示为sign==md5(action=get_base_info&app_id=141&name=jonh&sex=1&special_code=xxxx&user_id=123&version=1.0.1)。
在一个实施例中,所述访问日志包括但不限于以下一种或多种键值名和对应的键值:所述应用软件的版本号、用户标识、应用软件标识;所述后台服务器的IP地址;访问所述后台服务器的访问时间和访问方式;所述前端设备的IP地址;以及所述应用软件中被访问的功能模块的标识。即访问日志的内容可包括上述一种或多种键值名和对应的键值,当每生成一条访问日志的时候,自动给当前的访问日志进行命名,命名规则可以预设进行设定,例如访问功能信息加上访问时间。
在一种应用场景中,如当应用软件为汽修大师时,访问汽修大师的用户中心对应生成的访问日志命名为“passport.api.dbscar.com_access_20190223”;访问汽修大师轱辘商城生成访问日志命名为“shop.x431.com_access_20190203”。上述访问方式POST/GET等。
步骤S102,每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
在本申请实施例中,预先设置一个预设时间,在每隔预设时间,遍历在当前预设时间内生成的所有访问日志,并将当前预设时间内生成的所有访问日志中包括预设标识的访问日志作为第一日志。
在一个实施例中,所述预设标识包括用户标识和应用软件标识,如图1-1所示,上述步骤S102包括步骤S1021至步骤S1023;
步骤S1021,每间隔预设时间,对所述预设路径在预设时间内生成的所有访问日志进行压缩,得到第一日志文件。
在本申请实施例中,由于应用软件上会存在对应的多种功能,且考虑到访问应用软件的用户量相对较多是的数据量较大,因此对生成的访问日志进行压缩,具体可根据时间段进行压缩。
步骤S1022,在到达预设时刻时,对所述第一日志文件进行解压。
在本申请实施例中,在到达预设时刻时,对压缩得第一日志文件进行解压,即设置定时任务对压缩后的第一日志文件进行解压。
在一个实施例中,根据每间隔一小时对生成的访问日志进行压缩,如可设置在每小时的第1分钟进行压缩,并对压缩后得到的第一日志文件进行命名,进行解压的时间为压缩每小时的第30分钟,从而可保压缩和解压的执行时间充裕。
步骤S1023,对解压后的所述第一日志文件进行遍历,将所述第一日志文件中包括用户标识和应用软件标识的访问日志作为第一日志。
在本申请实施例中,解压后的第一日志文件包括大量的访问日志,需对解压后的第一日志文件进行遍历,并查找出第一日志文件中包括用户标识和软件标识的访问日志,将该日志作为第一日志。
步骤S103,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表。
在本申请实施例中,上述将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表可理解为在第一日志中找到包含预设特征的数据进行存存入同一个数据列表。
在一个实施例中,所述将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表之后,还包括:将得到的数据列表批量存入数据库,删除所述第一日志文件。将得到的数据列表批量存入预先建立的数据库中。
在一个实施例中,将得到的数据列表批量存入数据库之后,删除所述第一日志文件即在执行存入数据库之后,将压缩的第一日志文件进行删除,用于避免过多占用后台服务器的存储空间。
在一个实施例中,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表,包括:
获取所述第一日志中包括第一预设键值名和所述第一预设键值名对应的键值,并存入第一数据列表中;所述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名;和/或,获取所述第一日志中包括第二预设键值名和所述第二预设键值名对应的键值,并存入第二数据列表中;第二预设键值名对包括用户标识和访问时间两个键值名;和/或,获取所述第一日志中包括第三预设键值名和所述第三预设键值名对应的键值,并存入第三数据列表中;第三预设键值名对包括用户IP地址和访问时间两个键值名。如上述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名,对应的键值为访问应用软件功能模块对应的标识号、用户标识号和应用软件标识号,应用软件中不同功能模块对应的标识号不同,不同身份用户标识号也不相同。
步骤S104,根据所述数据列表,分析和判断所述应用软件的使用情况。
在本申请实施例中,可根据上述数据列表,分析和判断应用软件的使用情况。具体可根据获得的不同数据列表,分析和判断应用软件的不同使用情况。具体可根据数据库中的不同数据列表,分析和判断应用软件的不同使用情况。
在一个实施例中,根据所述数据列表,分析和判断所述应用软件的使用情况,包括:根据所述第一数据列表,分析和判断所述应用软件包括的功能模块的使用情况;和/或,根据所述第二数据列表,分析和判断所述应用软件的浏览请况和访问情况;和/或,根据所述第三数据列表,分析和判断所述应用软件是否存在异常使用情况。
上述第一数据列表中存储第一预设键值名和对应的键值,第一键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名,对应的键值为访问应用软件功能模块对应的标识号、用户标识号和应用软件标识号。因此可根据第一数据列表中存储第一预设键值名和对应的键值进行分析和判断出应用软件中各个功能模块的用户访问量、浏览量等活跃情况。
上述第二数据列表中存储第二预设键值名和对应的键值,第二键值名包括用户标识和访问时间两个键值名,对应键值为用户标识号和用户访问时间。因此可根据第二数据列表中存储的第一预设键值名和对应的键值进行分析和判断出应用软件中用户访问量(unique visitor,PV),页面浏览量(page view,PV),日用户访问量,月用户访问量,季用户访问量,年用户访问量,日页面浏览量,月页面浏览量,季页面浏览量和年页面浏览量等应用软件的活跃指标数。
上述第三数据列表中存储第三预设键值名和对应的键值,第三键值包括用户IP地址和访问时间,对应键值为用户IP地址号和对应用户访问时间。因此可根据第三数据列表中存储的第三预设键值名和对应的键值进行分析和判断出应用软件中IP地址的活跃指标数,如当同一个用户IP地址在短时间内登入次数大于预设阈值,判断该IP地址的登入异常,根据第三数据列表还可作为分析是否受到黑客攻击的关键数据信息。
由此可见,在本申请实施例中,由于根据应用软件的前端设备的访问请求生成访问日志并存储于预设路径,每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;根据数据列表,分析和判断所述应用软件的使用情况,从而可以根据需要获取应用软件精确的数据,用以判断和分析应用软件的使用情况,提高了数据分析的安全性和准确率。
实施例二
本实施例是对实施例一的进一步说明,本实施例与实施例一相同或相似的地方具体可参见实施例一的相关描述,此处不在赘述,如图2所示,上述步骤S103,还包括:
步骤S201,获取所有第一日志的条数。
在本申请实施例中,获取第一日志的总条数,此时仅是根据第一日志名称去获取条数,并不会获取第一日志中对应的日志内容。
步骤S202,根据所述条数,按预设数值对所述所有第一日志进行分批读取。
在本申请实施例中,由于第一日志的数量较多,可根据第一日志的条数,对第一日志进行分批读取第一日志中对应的日志内容。
在一个实施例中,获取所有第一日志的条数,每次批量读取预设数值条数(如优选40000)条,将第一日志的条数除以预设数值条数对得到的结果向上取整算出需要读取的次数,最后利用PHP的for循环解析出每条的内容。
步骤S203,在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表。
在本申请实施例中,在分批量读取的过程中,将第一日志中找到包含预设特征的数据存入同一个数据列表。
由此可见,在本申请实施例中,获取所有第一日志的条数,根据所述条数,按预设数值对所述所有第一日志进行分批读取,在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表,由于通过分批量读取第一日志,可在第一日志的数据量过大时,提高运行效率。
实施例三
本实施例是对实施例一或实施例二的进一步说明,本实施例与实施例一或实施例二相同或相似的地方具体可参见实施例一或实施例二的相关描述,此处不在赘述,如图3所示,在上述步骤S103之后,还包括:
步骤S301,根据所述数据列表生成可视化图表。
在本申请实施例中,根据数据列表中的数据生成可视化图表,可视化图表可包括表格、柱状图、线图、曲线图等直观形式的图表。例如,可将数据列表中的键值名和键值对应图表中的X轴和Y轴的数据从而生成可视化图表。
步骤S302,根据所述可视化图表进行数据分析。
在本申请实施例中,根据据所述可视化图表进行数据分析,可更直观的进行数据分析,用以判断和分析应用软件的使用情况,并策划应用软件的下一步的运营工作。
由此可见,在本申请实施例中,根据所述数据列表生成可视化图表,再根据所述可视化图表进行数据分析,可更直观的进行数据分析,用以判断和分析应用软件的使用情况,提高对数据分析的效率。
实施例四
本发明实施例提供一种数据分析装置,可集成于所述应用软件的后台服务器,用于执行实施例一、实施例二和实施例三中的方法步骤,为了便于说明,仅示出于本发明相关的部分,如图4所示,所述数据分析装置400包括:
第一生成模块401,用于在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径;
在一个实施例中,所述访问日志包括以下键值名中的至少一种和对应的键值:所述应用软件的版本号、用户标识、应用软件标识;所述后台服务器的IP地址;访问所述后台服务器的访问时间和访问方式;所述前端设备的IP地址;以及所述应用软件中被访问的功能模块的标识。
遍历模块402,用于每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
在一个实施例中,所述预设标识包括用户标识和应用软件标识;
所述遍历模块402包括:
压缩单元,用于每间隔预设时间,对所述预设路径在预设时间内生成的所有访问日志进行压缩,得到第一日志文件;
解压单元,用于在到达预设时刻时,对所述第一日志文件进行解压;
遍历单元,用于对解压后的所述第一日志文件进行遍历,将所述第一日志文件中包括用户标识和应用软件标识的访问日志作为第一日志。
第一存储模块403,用于将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表;
在一个实施例中,所述第一存储模块包括:
第一获取单元,用于获取所有第一日志的条数;
第一读取单元,用于根据所述条数,按预设数值对所述所有第一日志进行分批读取;
第一存储单元,用于在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表。
在一个实施例中,所述第一存储模块还包括:
第二存储单元,用于获取所述第一日志中包括第一预设键值名和所述第一预设键值名对应的键值,并存入第一数据列表中;所述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名;
和/或,第三存储单元,用于获取所述第一日志中包括第二预设键值名和所述第二预设键值名对应的键值,并存入第二数据列表中;第二预设键值名对包括用户标识和访问时间两个键值名;
和/或,第四存储单元,用于获取所述第一日志中包括第三预设键值名和所述第三预设键值名对应的键值,并存入第三数据列表中;第三预设键值名对包括用户IP地址和访问时间两个键值名。
分析判断模块404,用于根据所述数据列表,分析和判断所述应用软件的使用情况。
在一个实施例中,所述分析判断模块包括:
第一分析判断单元,用于根据所述第一数据列表,分析和判断所述应用软件包括的功能模块的使用情况;
和/或,第二分析判断单元,用于根据所述第二数据列表,分析和判断所述应用软件的浏览请况和访问情况;
和/或,第三分析判断单元,用于根据所述第三数据列表,分析和判断所述应用软件是否存在异常使用情况。
在一个实施例中,所述所述数据分析装置还包括:
第二存储模块,用于将得到的数据列表批量存入数据库;
删除模块,用于将得到的数据列表批量存入数据库之后,删除所述第一日志文件。
在一个实施例中,所述数据分析装置还包括:
第二生成模块,用于根据所述数据列表生成可视化图表;
数据分析模块,用于根据所述可视化图表进行数据分析。
由此可见,在本申请实施例中,由于根据应用软件的前端设备的访问请求生成访问日志并存储于预设路径,每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;根据所述数据列表,分析和判断所述应用软件的使用情况,从而可以根据需要获取应用软件精确的数据,用以判断和分析应用软件的使用情况,提高了数据分析的安全性和准确率。
实施例五
如图5所示,是本发明实施例提供的服务器的结构示意图。所述服务器500包括:处理器501、存储器502以及存储在上述存储器502中并可在上述处理器501上运行的计算机程序503。上述处理器501执行上述计算机程序503时实现上述数据分析方法实施例中的步骤,例如实施例一中的方法步骤,实施例二中的方法步骤,和/或实施例三中的方法步骤。
示例性的,上述计算机程序503可以被分割成一个或多个单元/模块,上述一个或者多个单元/模块被存储在上述存储器502中,并由上述处理器501执行,以完成本发明。上述一个或多个单元/模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述上述计算机程序503在上述服务器500中的执行过程。例如,上述计算机程序503可以被分割成第一生成模块,遍历模块,第一存储模块,分析判断模块等模块,各模块具体功能在上述实施例四中已有描述,此处不在赘述。
上述服务器500可以是应用软件的后台服务器、移动终端、桌上型计算机、笔记本、掌上电脑及云端服务器等服务器。上述服务器500可包括,但不仅限于,处理器501、存储器502。本领域技术人员可以理解,图5仅仅是服务器500的示例,并不构成对服务器500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如上述服务器500还可以包括输入输出设备、网络接入设备、总线等。
所称处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述存储器502可以是服务器500的内部存储单元,例如服务器500的硬盘或内存。上述存储器502也可以是上述服务器500的外部存储设备,例如上述服务器500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述存储器502还可以既包括上述服务器500的内部存储单元也包括外部存储设备。上述存储器502用于存储上述计算机程序以及上述服务器500所需的其它程序和数据。上述存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述服务器中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据分析方法,其特征在于,应用于应用软件的后台服务器,所述数据分析方法包括:
在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径;
每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表;
根据所述数据列表,分析和判断所述应用软件的使用情况。
2.根据权利要求1所述的数据分析方法,其特征在于,所述预设标识包括用户标识和应用软件标识;
所述每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志,包括:
每间隔预设时间,对所述预设路径在预设时间内生成的所有访问日志进行压缩,得到第一日志文件;
在到达预设时刻时,对所述第一日志文件进行解压;
对解压后的所述第一日志文件进行遍历,将所述第一日志文件中包括用户标识和应用软件标识的访问日志作为第一日志。
3.根据权利要求1所述的数据分析方法,其特征在于,所述将所述第一日志中包括相同的预设键值名和对应的键值存入同一个数据列表之后,还包括:
将得到的数据列表批量存入数据库;
删除所述第一日志文件。
4.根据权利要求1所述的数据分析方法,其特征在于,所述访问日志包括以下键值名中的至少一种和对应的键值:
所述应用软件的版本号、用户标识、应用软件标识;
所述后台服务器的IP地址;
访问所述后台服务器的访问时间和访问方式;
所述前端设备的IP地址;以及
所述应用软件中被访问的功能模块的标识。
5.根据权利要求1所述的数据分析方法,其特征在于,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表,包括:
获取所有第一日志的条数;
根据所述条数,按预设数值对所述所有第一日志进行分批读取;
在分批量读取的过程中,将相同的预设键值名和对应的键值存入同一个数据列表。
6.根据权利要求1至5任一项所述的数据分析方法,其特征在于,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表,包括:
获取所述第一日志中包括第一预设键值名和所述第一预设键值名对应的键值,并存入第一数据列表中;所述第一预设键值名包括访问应用软件功能模块对应的标识、用户标识和应用软件标识三个键值名;
和/或,获取所述第一日志中包括第二预设键值名和所述第二预设键值名对应的键值,并存入第二数据列表中;第二预设键值名对包括用户标识和访问时间两个键值名;
和/或,获取所述第一日志中包括第三预设键值名和所述第三预设键值名对应的键值,并存入第三数据列表中;第三预设键值名对包括用户IP地址和访问时间两个键值名。
7.根据权利要求6所述的数据分析方法,其特征在于,根据所述数据列表,分析和判断所述应用软件的使用情况,包括:
根据所述第一数据列表,分析和判断所述应用软件包括的功能模块的使用情况;
和/或,根据所述第二数据列表,分析和判断所述应用软件的浏览请况和访问情况;
和/或,根据所述第三数据列表,分析和判断所述应用软件是否存在异常使用情况。
8.根据权利要求1所述的数据分析方法,其特征在于,将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表之后,还包括:
根据所述数据列表生成可视化图表;
根据所述可视化图表进行数据分析。
9.一种应用软件的数据分析装置,其特征在于,应用于所述应用软件的后台服务器,所述数据分析装置包括:
第一生成模块,用于在接收到应用软件的前端设备的访问请求时,根据所述访问请求生成一条访问日志并存储于预设路径;
遍历模块,用于每隔预设时间,遍历在预设时间内生成的所有访问日志,并将包括预设标识的访问日志作为第一日志;
第一存储模块,用于将所有第一日志中相同的预设键值名和对应的键值存入同一个数据列表;
分析判断模块,用于根据所述数据列表,分析和判断所述应用软件的使用情况。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910305066.4A CN110119337B (zh) | 2019-04-16 | 2019-04-16 | 一种数据分析方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910305066.4A CN110119337B (zh) | 2019-04-16 | 2019-04-16 | 一种数据分析方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110119337A true CN110119337A (zh) | 2019-08-13 |
CN110119337B CN110119337B (zh) | 2023-03-10 |
Family
ID=67521145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910305066.4A Active CN110119337B (zh) | 2019-04-16 | 2019-04-16 | 一种数据分析方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119337B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112527459A (zh) * | 2020-12-16 | 2021-03-19 | 新浪网技术(中国)有限公司 | 一种基于Kubernetes集群的日志分析方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013235408A (ja) * | 2012-05-09 | 2013-11-21 | Mitsubishi Electric Corp | ログ管理システム、ログ管理サーバ及びプログラム |
CN104951517A (zh) * | 2015-05-29 | 2015-09-30 | 小米科技有限责任公司 | 行为日志统计方法及装置 |
CN105049287A (zh) * | 2015-07-28 | 2015-11-11 | 小米科技有限责任公司 | 日志处理方法及装置 |
CN106294559A (zh) * | 2016-07-26 | 2017-01-04 | 北京三快在线科技有限公司 | 一种应用流量分析方法及装置 |
CN106446228A (zh) * | 2016-10-08 | 2017-02-22 | 中国工商银行股份有限公司 | 一种web页面数据的采集分析方法及装置 |
-
2019
- 2019-04-16 CN CN201910305066.4A patent/CN110119337B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013235408A (ja) * | 2012-05-09 | 2013-11-21 | Mitsubishi Electric Corp | ログ管理システム、ログ管理サーバ及びプログラム |
CN104951517A (zh) * | 2015-05-29 | 2015-09-30 | 小米科技有限责任公司 | 行为日志统计方法及装置 |
CN105049287A (zh) * | 2015-07-28 | 2015-11-11 | 小米科技有限责任公司 | 日志处理方法及装置 |
CN106294559A (zh) * | 2016-07-26 | 2017-01-04 | 北京三快在线科技有限公司 | 一种应用流量分析方法及装置 |
CN106446228A (zh) * | 2016-10-08 | 2017-02-22 | 中国工商银行股份有限公司 | 一种web页面数据的采集分析方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112527459A (zh) * | 2020-12-16 | 2021-03-19 | 新浪网技术(中国)有限公司 | 一种基于Kubernetes集群的日志分析方法及装置 |
CN112527459B (zh) * | 2020-12-16 | 2024-03-26 | 新浪技术(中国)有限公司 | 一种基于Kubernetes集群的日志分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110119337B (zh) | 2023-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543891B (zh) | 容量预测模型的建立方法、设备及计算机可读存储介质 | |
CN110661829B (zh) | 文件下载方法及装置、客户端和计算机可读存储介质 | |
CN107438833A (zh) | 一种数据更新方法、装置、系统及服务器 | |
CN111083013B (zh) | 基于流量回放的测试方法、装置、电子设备及存储介质 | |
CN109885037B (zh) | 一种车辆诊断的方法及相关设备 | |
CN107133233B (zh) | 一种配置数据查询的处理方法及装置 | |
CN104184763A (zh) | 一种反馈信息处理方法及系统、服务设备 | |
CN111563075B (zh) | 一种业务校验系统、方法及设备和存储介质 | |
CN112017007A (zh) | 用户行为数据的处理方法及装置、计算机设备、存储介质 | |
CN114091610A (zh) | 智能决策方法及装置 | |
CN107203464B (zh) | 业务问题的定位方法以及装置 | |
CN106375334A (zh) | 一种分布式系统的认证方法 | |
CN115563600A (zh) | 数据审核方法和装置、电子设备及存储介质 | |
CN112052267B (zh) | 一种数据查询方法、设备、服务器及存储介质 | |
CN112311624B (zh) | 云主机的测试方法及装置、存储介质、电子设备 | |
CN106951225B (zh) | 基于服务配置模板的数据处理方法及装置 | |
CN110119337A (zh) | 一种数据分析方法、装置及服务器 | |
CN113094415B (zh) | 数据抽取方法、装置、计算机可读介质及电子设备 | |
CN117240943A (zh) | 接口数据解析方法和装置 | |
CN111917848A (zh) | 基于边缘计算和云计算协同的数据处理方法及云服务器 | |
CN110881030A (zh) | 基于logstash的记录web服务管理员操作日志的方法及装置 | |
CN114157634B (zh) | 唯一账号识别方法、装置、设备及存储介质 | |
CN115292580A (zh) | 数据查询方法、装置、计算机设备及存储介质 | |
CN106875072A (zh) | 一种基于云服务端的汽车维修案例共享系统及方法 | |
CN112561376A (zh) | 对项目进行拆分的方法、装置以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Bantian street, Longgang District of Shenzhen City, Guangdong province 518000 yuan and five Avenue sign technology plant No. 1 building 4 floor Applicant after: GOLO IOV DATA TECHNOLOGY Co.,Ltd. Address before: Bantian street, Longgang District of Shenzhen City, Guangdong province 518000 yuan and five Avenue sign technology plant No. 1 building 4 floor Applicant before: GOLO IOV DATA TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |