CN111199423A - 用户行为轨迹生成方法、装置、设备及存储介质 - Google Patents
用户行为轨迹生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111199423A CN111199423A CN201911362664.1A CN201911362664A CN111199423A CN 111199423 A CN111199423 A CN 111199423A CN 201911362664 A CN201911362664 A CN 201911362664A CN 111199423 A CN111199423 A CN 111199423A
- Authority
- CN
- China
- Prior art keywords
- user
- log
- request
- result
- escape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012163 sequencing technique Methods 0.000 claims abstract description 20
- 230000006399 behavior Effects 0.000 claims description 75
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
- G06F16/2315—Optimistic concurrency control
- G06F16/2322—Optimistic concurrency control using timestamps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开一种用户行为轨迹生成方法、装置、设备及存储介质,该方法包括:接收用户登录信息,查询用户是否为注册用户;若是则采用异步操作从日志系统中拉取用户日志;对用户日志进行参数转义获得转义结果;根据转义结果对日志中的用户请求进行合理性判断并获得判断结果;按时间顺序对请求进行排序获得请求序列,根据判断结果对请求序列进行标记后生成对应的用户行为轨迹。由于是根据注册用户对应的用户标识自动拉取用户日志,对日志进行转义后对日志中的请求进行合理性判断,再根据判断结果对请求序列进行标记后生成对应的用户行为轨迹,从而能够保证生成的用户行为轨迹的准确性,也能实现对不合理请求的快速定位,方便客服人员查询。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户行为轨迹生成方法、装置、设备及存储介质。
背景技术
目前,市场上基于用户行为日志查询用户行为轨迹的工具不是很多,主要是因为前后端系统的关联性比较强,不同的用户行为日志涉及的数据范围广、零散度比较高,很难完全准确地分析出用户行为中出现的所有问题,
现有技术中客服人员在对用户轨迹进行分析查询时,往往需要依赖技术人员进行核查,导致事件处理时效较低。因此,如何快速准确地根据用户的行为数据生成对应的行为轨迹数据,以便客服人员查询,就成了一个亟待解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种用户行为轨迹生成方法、装置、设备及存储介质,旨在解决现有技术无法快速准确地根据用户的行为数据生成对应的行为轨迹数据的技术问题。
为实现上述目的,本发明提供了一种用户行为轨迹生成方法,所述方法包括以下步骤:
接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
根据标记后的请求序列生成所述用户对应的用户行为轨迹。
优选地,所述在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志的步骤,包括:
在所述用户为注册用户时,获取所述用户对应的注册信息,并从所述注册信息中提取所述用户对应的用户标识;
获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值;
在所述数量超过所述预设阈值时,基于所述可用线程采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
优选地,所述获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值的步骤之后,所述方法还包括:
在所述数量不超过所述预设阈值时,获取本地存储空间的可用内存;
基于所述可用内存在所述当前线程池中进行线程创建,以获得新的线程池;
基于所述新的线程池采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
优选地,所述按预设日志转义方式对所述用户日志进行参数转义,获得转义结果的步骤,包括:
读取所述用户日志对应的日志数据,根据预先构建的字符转义表检测所述日志数据中是否存在待转义字符;
若存在,则按照所述字符转义表对所述待转义字符进行转义,获得转义字符;
根据所述转义字符以及所述日志数据中未转义的字符确定所述日志数据对应的转义结果。
优选地,所述根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果的步骤,包括:
从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配;
在匹配成功时,对所述用户日志中记录的用户请求进行字段提取,以获得各用户请求对应的目标字段;
读取所述目标字段对应的属性值,并检测所述属性值是否为预设数值;
在所述属性值为所述预设数值时,判定所述用户请求合理,在所述属性值不为所述预设数值时,判定所述用户请求不合理。
优选地,所述从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配的步骤,包括:
从所述转义结果中读取输出参数,按预设数据维度从所述输出参数中读取对应的出参字段;
根据所述预设数据维度从预设数据库中确定待匹配的目标数据库;
采用精确匹配检索在所述目标数据库中查找是否存在与所述出参字段对应的数据;
若存在,则判定匹配成功,若不存在,则判定匹配失败。
优选地,所述按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记的步骤,包括:
从所述用户日志中读取各用户请求对应的请求时间戳;
按时间顺序对所述请求时间戳进行排序,以获得请求时间序列;
根据所述请求时间序列对所述用户日志中的各用户请求进行排序,获得请求序列;
根据所述判断结果检测所述请求序列中是否存在不合理请求;
若存在,则通过第一类标记对所述请求序列中的不合理请求进行标记,通过第二类标记对所述请求序列中的合理请求进行标记。
此外,为实现上述目的,本发明还提出一种用户行为轨迹生成装置,所述装置包括:
信息查询模块,用于接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
日志拉取模块,用于在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
日志转义模块,用于按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
请求判断模块,用于根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
请求标记模块,用于按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
轨迹生成模块,用于根据标记后的请求序列生成所述用户对应的用户行为轨迹。
此外,为实现上述目的,本发明还提出一种用户行为轨迹生成设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户行为轨迹生成程序,所述用户行为轨迹生成程序配置为实现如上文所述的用户行为轨迹生成方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有用户行为轨迹生成程序,所述用户行为轨迹生成程序被处理器执行时实现如上文所述的用户行为轨迹生成方法的步骤。
本发明通过接收用户登录信息,查询用户登录信息对应的用户是否为注册用户;在用户为注册用户时获取用户对应的用户标识,并采用异步操作从日志系统中拉取用户标识对应的用户日志;按预设日志转义方式对用户日志进行参数转义获得转义结果;根据转义结果对用户日志中记录的用户请求进行合理性判断并获得判断结果;按时间顺序对用户请求进行排序获得请求序列,并根据判断结果对请求序列进行标记;根据标记后的请求序列生成对应的用户行为轨迹。由于本发明是根据注册用户对应的用户标识自动拉取用户日志,然后对日志进行转义后对日志中的请求进行合理性判断,再根据判断结果对请求序列进行标记后生成对应的用户行为轨迹,能够保证生成的用户行为轨迹的准确性,也能实现对不合理请求的快速定位,方便客服人员查询。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的用户行为轨迹生成设备的结构示意图;
图2为本发明用户行为轨迹生成方法第一实施例的流程示意图;
图3为本发明用户行为轨迹生成方法第二实施例的流程示意图;
图4为本发明用户行为轨迹生成方法第三实施例的流程示意图;
图5为本发明用户行为轨迹生成装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的用户行为轨迹生成设备结构示意图。
如图1所示,该用户行为轨迹生成设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对用户行为轨迹生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及用户行为轨迹生成程序。
在图1所示的用户行为轨迹生成设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明用户行为轨迹生成设备中的处理器1001、存储器1005可以设置在用户行为轨迹生成设备中,所述用户行为轨迹生成设备通过处理器1001调用存储器1005中存储的用户行为轨迹生成程序,并执行本发明实施例提供的用户行为轨迹生成方法。
本发明实施例提供了一种用户行为轨迹生成方法,参照图2,图2为本发明用户行为轨迹生成方法第一实施例的流程示意图。
本实施例中,所述用户行为轨迹生成方法包括以下步骤:
步骤S10:接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
需要说明的是,本实施例方法的执行主体可以是具有数据处理、网络通信以及程序运行功能的应用程序客户端或轨迹数据处理平台(以下简称用户轨迹平台)。本实施例提出的用户行为轨迹生成方法的应用场景可以是用户在操作应用程序过程中出现自身解决不了的问题时,将问题上报给客服人员,客服人员在获取到这些问题后,在用户轨迹平台中直接输入用户登录信息(如手机号码,登录账号等)来进行用户操作信息的查询。
应理解的是,本实施例中用户轨迹平台主要用于客服人员在接收到用户上报的应用使用问题时,通过平台去查询该用户的操作行为轨迹信息,从而确定问题所在并尽快为该用户解决问题。
在具体实现中,用户轨迹平台在接收到客服人员输入的用户登录信息后,可在平台对应的用户体系数据库中查询该用户登录信息对应的用户是否为注册用户。具体的,可根据用户登录信息在用户体系数据库中对这些用户登录信息进行匹配,并根据匹配结果确定该用户对应的用户登录信息是否存在于用户体系数据库中,若不存在则表明该用户不属于注册用户或者属于初次登录的用户,若存在则表明该用户属于注册用户或非初次登录的用户。
步骤S20:在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
应理解的是,所述用户标识可以是能够区分不同注册用户的唯一标识信息,例如,手机号码、身份证号码,账户身份识别号(Identity Document,ID)等。所述异步操作即并行处理的方式,本实施例中由于日志系统在保存用户操作日志时通常是按功能模块(例如,证券交易应用涉及的功能模块可包括交易委托、账户登录、银证转账、总资产查询、身份证更新等)的不同来进行分类储存,因此采用异步操作进行日志的拉取能够大大节省用户日志的获取时间。
在具体实现中,用户轨迹平台可在查询到用户为注册用户时,先获取该用户对应的注册信息,然后从注册信息中提取用户标识,再采用异步操作从客户端应用程序对应的日志系统中拉取所有包含该用户标识的用户日志。
步骤S30:按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
应理解的是,在实际情况下,用户轨迹平台拉取的用户日志通常是以计算机语言(例如字符串)表示的数据。例如,用户轨迹平台拉取的用户日志可能是如下字符数据:
{"actionAuth":null,"status":1,"errmsg":null,"requestid":"AYLCAPP4D317735827749A5AAC679E50DA594AF",
"results":{"tips":null,"availableSize":null,"rmb":{"totalAssetVal":"10","totalMktVal":"10","totalMktDetail":{"stockMktVal":"301481.50","reverse":"0.00","reverseIncome":"0.00"},"fundMktVal":"1966.61","fundMktDetail":[{"name":"hqMktTotal","value":"0.00",
此时,用户轨迹平台就需要将这些字符串表示的用户日志转义成客服人员能够理解的日志数据。具体的,用户轨迹平台可按预先设定的转义格式对用户日志进行参数转义,从而获得转义后的结果。
例如上述字符数据经参数转义后得到的转义结果为:
总资产:10,股票市值:10,基金理财市值:1966.61,现金余额:3973.58,现金可取3973.58,现金宝:+109.69。
进一步地,为提高转义效率,本实施例用户轨迹平台在进行参数转义前,可预先构建一个字符转义表,该字符转义表中存放有每一个需要转义的字符对应的转义规则或转义后所获得的字符。在进行参数转义时,用户轨迹平台可按照该字符转义表进行参数转义。
具体的,用户轨迹平台可读取所述用户日志对应的日志数据,根据预先构建的字符转义表检测所述日志数据中是否存在待转义字符;若存在,则按照所述字符转义表对所述待转义字符进行转义,获得转义字符;然后根据所述转义字符以及所述日志数据中未转义的字符确定所述日志数据对应的转义结果。
步骤S40:根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
应理解的是,所谓对用户请求进行合理性判断,即判断用户请求是否存在请求失败或无法响应的情况。本实施例在对用户请求进行合理性判断时,可通过用户日志转义结果中各用户请求日志信息中记录的目标字段对应的属性值来判断,具体可以是通过状态(status)字段对应的属性值来判断每一个用户请求是否合理。
在具体实现中,用户轨迹平台可根据转义结果对所述用户日志中记录的用户请求进行合理性判断,然后获得每一个用户请求是否合理的判断结果。
步骤S50:按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
可理解的是,由于用户日志在日志系统中存放的位置不一定相同,因此仅仅是从日志系统中拉取用户日志并不能直接获知日志中每一个用户请求发生的先后顺序。此时,为了进一步地排查用户上报的问题所出现的具体位置,用户轨迹平台需要先按时间顺序对用户请求进行排序获得请求序列,然后再根据合理性判断的判断结果对用户请求进行标记,即标记用户请求是否合理。
本实施例中,对于不合理的请求,用户轨迹平台可对其采用区别标记,以使得用户轨迹平台在对这些不合理的用户请求进行展示时,易于客服人员查看。
在具体实现中,用户轨迹平台可从所述用户日志中读取各用户请求对应的请求时间戳;然后按时间顺序对所述请求时间戳进行排序,以获得请求时间序列;再根据所述请求时间序列对所述用户日志中的各用户请求进行排序,获得请求序列;最后根据所述判断结果检测所述请求序列中是否存在不合理请求;若存在,则通过第一类标记对所述请求序列中的不合理请求进行标记,通过第二类标记对所述请求序列中的合理请求进行标记。
其中,用户轨迹平台在按时间顺序对请求时间戳进行排序前,可先将请求时间戳转化成预设时间格式,如“Y/M/D:年/月/日”格式的时间参数,然后再基于时间的先后顺序对时间参数进行排序,获得请求时间序列。所述第一类标记为不合理请求对应的标记,所述第二类标记为合理请求对应的标记。
步骤S60:根据标记后的请求序列生成所述用户对应的用户行为轨迹。
需要说明的是,在执行步骤S60之前,可预先配置一个请求序列的展示模板,使得用户轨迹平台在获取到标记后的请求序列后,将这些携带标记的请求序列写入至展示模板从而获得用户对应的用户行为轨迹。
本实施例通过接收用户登录信息,查询用户登录信息对应的用户是否为注册用户;在用户为注册用户时获取用户对应的用户标识,并采用异步操作从日志系统中拉取用户标识对应的用户日志;按预设日志转义方式对用户日志进行参数转义获得转义结果;根据转义结果对用户日志中记录的用户请求进行合理性判断并获得判断结果;按时间顺序对用户请求进行排序获得请求序列,并根据判断结果对请求序列进行标记;根据标记后的请求序列生成对应的用户行为轨迹。由于是根据注册用户对应的用户标识自动拉取用户日志,然后对日志进行转义后对日志中的请求进行合理性判断,再根据判断结果对请求序列进行标记后生成对应的用户行为轨迹,能够保证生成的用户行为轨迹的准确性,也能实现对不合理请求的快速定位,方便客服人员查询。
参考图3,图3为本发明用户行为轨迹生成方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S20包括:
步骤S201:在所述用户为注册用户时,获取所述用户对应的注册信息,并从所述注册信息中提取所述用户对应的用户标识;
应理解的是,用户在进行账户注册时,通常会输入账户号、手机号又或是身份证号等注册信息,对于证券交易系统而言,用户还需要输入第三方托管银行账户对应的银行卡号等信息。
因此,用户轨迹平台在查询到用户为注册用户时,可从用户体系数据库中获取该用户对应的注册信息,然后从注册信息中包含的账户号、手机号、身份证号或银行卡号中选取任意一个作为用户对应的用户标识。
步骤S202:获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值;
应理解的是,异步操作通常以并行处理的方式同时处理多个任务,而并行处理的方式通常需要基于线程池中当前可用的线程来实现。因此,本实施例中,用户轨迹平台在进行异步操作前,需要获取平台当前线程池中可用线程的数量,然后检测该数量是否超过了预先设定的阈值,若超过了则表明此时可直接调用这些可用线程来进行用户日志的拉取,以进一步提高用户日志的获取效率。当然,所述预设阈值的具体数值可自行设定,本实施例对此不作限制。
考虑到实际情况下,线程可用并不代表线程是空闲的,可用的线程中可能也存在当前正在被占用或调用的线程。因此,本实施例用户轨迹平台在确定出当前线程池中的可用线程后,还可以先检测这些可用线程当前是否被调用,然后根据检测结果来对可用线程进行筛选,从而获得当前未被调用的线程,再基于这些未被调用的线程采用异步操作进行用户日志的拉取。
步骤S203:在所述数量超过所述预设阈值时,基于所述可用线程采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
在具体实现中,若用户轨迹平台检测到可用线程的数量超过了预设阈值,此时即可直接基于可用线程采用异步操作从日志系统中拉取用户标识对应的用户日志。
进一步地,若用户轨迹平台检测到可用线程的数量未超过预设阈值,此时为保证仍能采用异步操作来进行用户日志的拉取,用户轨迹平台可在所述数量不超过所述预设阈值时,先获取本地存储空间的可用内存;然后基于所述可用内存在所述当前线程池中进行线程创建,以获得新的线程池;再基于所述新的线程池采用异步操作从日志系统中拉取所述用户标识对应的用户日志,从而保证能够顺利采用异步操作拉取用户日志。
本实施例在用户为注册用户时,获取用户对应的注册信息,并从注册信息中提取用户对应的用户标识;获取当前线程池中可用线程的数量,并检测数量是否超过预设阈值;在数量超过预设阈值时,基于可用线程采用异步操作从日志系统中拉取用户标识对应的用户日志,由于是通过当前线程池中可用的线程数量来判断是否需要进行线程创建,若不需要则基于可用线程采用异步操作从日志系统中拉取用户标识对应的用户日志,提高了日志的拉取效率。
参考图4,图4为本发明用户行为轨迹生成方法第三实施例的流程示意图。
基于上述各实施例,在本实施例中,所述步骤S40可具体包括:
步骤S401:从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配;
应理解的是,所述输出参数,即输入参数(入参)被对应的函数调用后所输出的数据,在计算机领域通常称其为出参。通常情况下,输出参数中包含有不同的字段,例如用户账户字段:usercode、时间戳字段:timestamp、系统编码字段:system、请求状态字段:status等。
在实际应用中,用户轨迹平台可从转义结果中读取输出参数,然后将输出参数中包含的、类似于上述列举的出参字段与预设数据库中存放的数据进行匹配。
具体的,用户轨迹平台可从所述转义结果中读取输出参数,按预设数据维度从所述输出参数中读取对应的出参字段;根据所述预设数据维度从预设数据库中确定待匹配的目标数据库;采用精确匹配检索在所述目标数据库中查找是否存在与所述出参字段对应的数据;若存在,则判定匹配成功,若不存在,则判定匹配失败。
需要说明的是,所述预设数据维度可以是预先设定的用于进行数据读取的依据,这些依据中规定了哪些类型的数据是需要被读取的。本实施例中所述预设数据维度包括但不限于:账户登录、请求时间、请求处理结果等。
应理解的是,所谓精确匹配检索是指检索词与资源库中某一字段完全相同的检索方式。本实施例中采用精确匹配检索的方式能够保证最终匹配结果的准确性。
步骤S402:在匹配成功时,对所述用户日志中记录的用户请求进行字段提取,以获得各用户请求对应的目标字段;
需要说明的是,本实施例中所述目标字段为各用户请求对应的status字段。用户轨迹平台在对输出参数中包含的出参字段匹配成功后,可对用户日志中记录的所有用户请求都进行字段提取,从而获得各用户请求对应的status字段。
步骤S403:读取所述目标字段对应的属性值,并检测所述属性值是否为预设数值;
需要说明的是,status字段即状态字段,考虑到实际应用中,正常/正确的请求状态只有一个,而异常/错误的请求状态可能有多种,因此本实施例中所述预设数值优选为零或ture。即status字段对应的属性值为零或ture时,用户请求是合理的,反之status字段对应的属性值为非零或false时,则表明用户请求是不合理的。
在具体实现中,用户轨迹平台在提取出各用户请求对应的status字段后,即可读取该字段对应的属性值,然后检测该属性值是否为预设数值。
步骤S404:在所述属性值为所述预设数值时,判定所述用户请求合理,在所述属性值不为所述预设数值时,判定所述用户请求不合理。
在具体实现中,用户轨迹平台在检测到目标字段对应的属性值为预设数值时,即可判定用户请求合理,反之则可判定用户请求不合理。
本实施例通过从转义结果中读取输出参数,将输出参数中包含的出参字段与预设数据库中存放的数据进行匹配;在匹配成功时,对用户日志中记录的用户请求进行字段提取,以获得各用户请求对应的目标字段;读取目标字段对应的属性值,并检测属性值是否为预设数值;在属性值为预设数值时,判定用户请求合理,在属性值不为预设数值时,判定用户请求不合理,本实施例根据用户日志中记录的用户请求对应的字段属性值来判断请求是否合理,提高了请求合理性判断的效率,同时通过将输出参数中包含的出参字段与预设数据库中存放的数据进行匹配也避免了对用户请求的遗漏。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有用户行为轨迹生成程序,所述用户行为轨迹生成程序被处理器执行时实现如上文所述的用户行为轨迹生成方法的步骤。
参照图5,图5为本发明用户行为轨迹生成装置第一实施例的结构框图。
如图5所示,本发明实施例提出的用户行为轨迹生成装置包括:
信息查询模块501,用于接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
日志拉取模块502,用于在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
日志转义模块503,用于按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
请求判断模块504,用于根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
请求标记模块505,用于按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
轨迹生成模块506,用于根据标记后的请求序列生成所述用户对应的用户行为轨迹。
本实施例通过接收用户登录信息,查询用户登录信息对应的用户是否为注册用户;在用户为注册用户时获取用户对应的用户标识,并采用异步操作从日志系统中拉取用户标识对应的用户日志;按预设日志转义方式对用户日志进行参数转义获得转义结果;根据转义结果对用户日志中记录的用户请求进行合理性判断并获得判断结果;按时间顺序对用户请求进行排序获得请求序列,并根据判断结果对请求序列进行标记;根据标记后的请求序列生成对应的用户行为轨迹。由于是根据注册用户对应的用户标识自动拉取用户日志,然后对日志进行转义后对日志中的请求进行合理性判断,再根据判断结果对请求序列进行标记后生成对应的用户行为轨迹,能够保证生成的用户行为轨迹的准确性,也能实现对不合理请求的快速排查,方便客服人员查询。
基于本发明上述用户行为轨迹生成装置第一实施例,提出本发明用户行为轨迹生成装置的第二实施例。
在本实施例中,所述日志拉取模块502,还用于在所述用户为注册用户时,获取所述用户对应的注册信息,并从所述注册信息中提取所述用户对应的用户标识;获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值;在所述数量超过所述预设阈值时,基于所述可用线程采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
进一步地,所述日志拉取模块502,还用于在所述数量不超过所述预设阈值时,获取本地存储空间的可用内存;基于所述可用内存在所述当前线程池中进行线程创建,以获得新的线程池;基于所述新的线程池采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
进一步地,所述日志转义模块503,还用于读取所述用户日志对应的日志数据,根据预先构建的字符转义表检测所述日志数据中是否存在待转义字符;若存在,则按照所述字符转义表对所述待转义字符进行转义,获得转义字符;根据所述转义字符以及所述日志数据中未转义的字符确定所述日志数据对应的转义结果。
进一步地,所述请求判断模块504,还用于从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配;在匹配成功时,对所述用户日志中记录的用户请求进行字段提取,以获得各用户请求对应的目标字段;读取所述目标字段对应的属性值,并检测所述属性值是否为预设数值;在所述属性值为所述预设数值时,判定所述用户请求合理,在所述属性值不为所述预设数值时,判定所述用户请求不合理。
进一步地,所述请求判断模块504,还用于从所述转义结果中读取输出参数,按预设数据维度从所述输出参数中读取对应的出参字段;根据所述预设数据维度从预设数据库中确定待匹配的目标数据库;采用精确匹配检索在所述目标数据库中查找是否存在与所述出参字段对应的数据;若存在,则判定匹配成功,若不存在,则判定匹配失败。
进一步地,所述请求标记模块505,还用于从所述用户日志中读取各用户请求对应的请求时间戳;按时间顺序对所述请求时间戳进行排序,以获得请求时间序列;根据所述请求时间序列对所述用户日志中的各用户请求进行排序,获得请求序列;根据所述判断结果检测所述请求序列中是否存在不合理请求;若存在,则通过第一类标记对所述请求序列中的不合理请求进行标记,通过第二类标记对所述请求序列中的合理请求进行标记。
本发明用户行为轨迹生成装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种用户行为轨迹生成方法,其特征在于,所述方法包括:
接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
根据标记后的请求序列生成所述用户对应的用户行为轨迹。
2.如权利要求1所述的方法,其特征在于,所述在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志的步骤,包括:
在所述用户为注册用户时,获取所述用户对应的注册信息,并从所述注册信息中提取所述用户对应的用户标识;
获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值;
在所述数量超过所述预设阈值时,基于所述可用线程采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
3.如权利要求2所述的方法,其特征在于,所述获取当前线程池中可用线程的数量,并检测所述数量是否超过预设阈值的步骤之后,所述方法还包括:
在所述数量不超过所述预设阈值时,获取本地存储空间的可用内存;
基于所述可用内存在所述当前线程池中进行线程创建,以获得新的线程池;
基于所述新的线程池采用异步操作从日志系统中拉取所述用户标识对应的用户日志。
4.如权利要求1所述的方法,其特征在于,所述按预设日志转义方式对所述用户日志进行参数转义,获得转义结果的步骤,包括:
读取所述用户日志对应的日志数据,根据预先构建的字符转义表检测所述日志数据中是否存在待转义字符;
若存在,则按照所述字符转义表对所述待转义字符进行转义,获得转义字符;
根据所述转义字符以及所述日志数据中未转义的字符确定所述日志数据对应的转义结果。
5.如权利要求4所述的方法,其特征在于,所述根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果的步骤,包括:
从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配;
在匹配成功时,对所述用户日志中记录的用户请求进行字段提取,以获得各用户请求对应的目标字段;
读取所述目标字段对应的属性值,并检测所述属性值是否为预设数值;
在所述属性值为所述预设数值时,判定所述用户请求合理,在所述属性值不为所述预设数值时,判定所述用户请求不合理。
6.如权利要求5所述的方法,其特征在于,所述从所述转义结果中读取输出参数,将所述输出参数中包含的出参字段与预设数据库中存放的数据进行匹配的步骤,包括:
从所述转义结果中读取输出参数,按预设数据维度从所述输出参数中读取对应的出参字段;
根据所述预设数据维度从预设数据库中确定待匹配的目标数据库;
采用精确匹配检索在所述目标数据库中查找是否存在与所述出参字段对应的数据;
若存在,则判定匹配成功,若不存在,则判定匹配失败。
7.如权利要求1至6任一项所述的方法,其特征在于,所述按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记的步骤,包括:
从所述用户日志中读取各用户请求对应的请求时间戳;
按时间顺序对所述请求时间戳进行排序,以获得请求时间序列;
根据所述请求时间序列对所述用户日志中的各用户请求进行排序,获得请求序列;
根据所述判断结果检测所述请求序列中是否存在不合理请求;
若存在,则通过第一类标记对所述请求序列中的不合理请求进行标记,通过第二类标记对所述请求序列中的合理请求进行标记。
8.一种用户行为轨迹生成装置,其特征在于,所述装置包括:
信息查询模块,用于接收用户登录信息,查询所述用户登录信息对应的用户是否为注册用户;
日志拉取模块,用于在所述用户为注册用户时,获取所述用户对应的用户标识,并采用异步操作从日志系统中拉取所述用户标识对应的用户日志;
日志转义模块,用于按预设日志转义方式对所述用户日志进行参数转义,获得转义结果;
请求判断模块,用于根据所述转义结果对所述用户日志中记录的用户请求进行合理性判断,并获得判断结果;
请求标记模块,用于按时间顺序对所述用户请求进行排序获得请求序列,并根据所述判断结果对所述请求序列进行标记;
轨迹生成模块,用于根据标记后的请求序列生成所述用户对应的用户行为轨迹。
9.一种用户行为轨迹生成设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户行为轨迹生成程序,所述用户行为轨迹生成程序配置为实现如权利要求1至7中任一项所述的用户行为轨迹生成方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有用户行为轨迹生成程序,所述用户行为轨迹生成程序被处理器执行时实现如权利要求1至7任一项所述的用户行为轨迹生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362664.1A CN111199423A (zh) | 2019-12-25 | 2019-12-25 | 用户行为轨迹生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362664.1A CN111199423A (zh) | 2019-12-25 | 2019-12-25 | 用户行为轨迹生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111199423A true CN111199423A (zh) | 2020-05-26 |
Family
ID=70746464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911362664.1A Pending CN111199423A (zh) | 2019-12-25 | 2019-12-25 | 用户行为轨迹生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111199423A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112491602A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 行为数据的监控方法、装置、计算机设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103929321A (zh) * | 2013-01-15 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 一种日志处理方法和装置 |
CN108429783A (zh) * | 2018-01-16 | 2018-08-21 | 重庆金融资产交易所有限责任公司 | 电子装置、配置文件推送方法及存储介质 |
CN108459939A (zh) * | 2018-01-08 | 2018-08-28 | 平安科技(深圳)有限公司 | 一种日志收集方法、装置、终端设备及存储介质 |
CN109308247A (zh) * | 2017-07-27 | 2019-02-05 | 东软集团股份有限公司 | 一种日志处理方法、装置、设备及一种网络设备 |
CN109474698A (zh) * | 2018-12-14 | 2019-03-15 | 平安城市建设科技(深圳)有限公司 | 访问请求标记方法、装置、设备及存储介质 |
CN109509021A (zh) * | 2018-10-22 | 2019-03-22 | 武汉极意网络科技有限公司 | 基于行为轨迹的异常识别方法、装置、服务器及存储介质 |
-
2019
- 2019-12-25 CN CN201911362664.1A patent/CN111199423A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103929321A (zh) * | 2013-01-15 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 一种日志处理方法和装置 |
CN109308247A (zh) * | 2017-07-27 | 2019-02-05 | 东软集团股份有限公司 | 一种日志处理方法、装置、设备及一种网络设备 |
CN108459939A (zh) * | 2018-01-08 | 2018-08-28 | 平安科技(深圳)有限公司 | 一种日志收集方法、装置、终端设备及存储介质 |
CN108429783A (zh) * | 2018-01-16 | 2018-08-21 | 重庆金融资产交易所有限责任公司 | 电子装置、配置文件推送方法及存储介质 |
CN109509021A (zh) * | 2018-10-22 | 2019-03-22 | 武汉极意网络科技有限公司 | 基于行为轨迹的异常识别方法、装置、服务器及存储介质 |
CN109474698A (zh) * | 2018-12-14 | 2019-03-15 | 平安城市建设科技(深圳)有限公司 | 访问请求标记方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
李哲;李先国;: "基于关联规则的日志分析系统的研究与设计", 微型电脑应用, no. 03, 20 March 2009 (2009-03-20), pages 27 - 29 * |
沈鑫;曹敏;薛武;张金江;黄星;张林山;: "基于多源异构数据聚合技术的电力物联网设备全景信息构架模型研究与应用", 南方电网技术, no. 02, 20 February 2016 (2016-02-20), pages 48 - 55 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112491602A (zh) * | 2020-11-17 | 2021-03-12 | 中国平安财产保险股份有限公司 | 行为数据的监控方法、装置、计算机设备及介质 |
CN112491602B (zh) * | 2020-11-17 | 2023-09-26 | 中国平安财产保险股份有限公司 | 行为数据的监控方法、装置、计算机设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2527991B1 (en) | Analysis method, analysis device, and analysis program | |
CN109710508B (zh) | 测试方法、测试装置、测试设备及计算机可读存储介质 | |
US7313514B2 (en) | Validating content of localization data files | |
WO2020207167A1 (zh) | 文本分类方法、装置、设备及计算机可读存储介质 | |
CN110389941B (zh) | 数据库校验方法、装置、设备及存储介质 | |
CN110362601B (zh) | 元数据标准的映射方法、装置、设备及存储介质 | |
CN107862425B (zh) | 风控数据采集方法、设备、系统及可读存储介质 | |
CN110427375B (zh) | 字段类别的识别方法及装置 | |
US20220019742A1 (en) | Situational awareness by fusing multi-modal data with semantic model | |
CN111666346A (zh) | 信息归并方法、交易查询方法、装置、计算机及存储介质 | |
CN101453358A (zh) | 一种oracle数据库绑定变量的sql语句审计方法及系统 | |
CN112612756A (zh) | 异常文件的修复方法、装置、设备及存储介质 | |
CN114817968A (zh) | 无特征数据的路径追溯方法、装置、设备及存储介质 | |
CN112184003A (zh) | 银行柜面工作量评估方法、装置、存储介质及电子设备 | |
CN110929110A (zh) | 一种电子文档检测方法、装置、设备及存储介质 | |
CN111199423A (zh) | 用户行为轨迹生成方法、装置、设备及存储介质 | |
JP4973738B2 (ja) | 業務フロー処理プログラム、方法及び装置 | |
CN111767213B (zh) | 数据库检查点的测试方法、装置、电子设备及存储介质 | |
CN109145609A (zh) | 一种数据处理方法和装置 | |
CN112860722A (zh) | 数据核对方法、装置、电子设备和可读存储介质 | |
CN112364121B (zh) | 问卷pdf的自动创建方法、装置、存储介质及计算机设备 | |
CN114860121B (zh) | 网络安全等级保护中的信息匹配方法及应用 | |
CN114710556B (zh) | 多系统集成消息推送方法、装置、设备及存储介质 | |
CN109582534B (zh) | 系统的操作入口的确定方法、装置和服务器 | |
US11886459B2 (en) | Data management system and data management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |