WO2014166371A1 - 一种数据信息处理系统及方法 - Google Patents

一种数据信息处理系统及方法 Download PDF

Info

Publication number
WO2014166371A1
WO2014166371A1 PCT/CN2014/074863 CN2014074863W WO2014166371A1 WO 2014166371 A1 WO2014166371 A1 WO 2014166371A1 CN 2014074863 W CN2014074863 W CN 2014074863W WO 2014166371 A1 WO2014166371 A1 WO 2014166371A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
module
reading behavior
reading
synchronization
Prior art date
Application number
PCT/CN2014/074863
Other languages
English (en)
French (fr)
Inventor
李志明
张玉洲
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2014166371A1 publication Critical patent/WO2014166371A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Definitions

  • the invention relates to the field of mobile phone applications, and in particular to a data information processing system and method. Background technique
  • the present invention mainly provides a data information processing system and method that can reduce the reading behavior of a mobile phone user in a timely and accurate manner.
  • An embodiment of the present invention provides a data information processing system, including a data synchronization module, a log module, and a data processing module, where
  • the data synchronization module is configured to synchronize static data in the production library to the statistical library;
  • the log module is configured to read URL address data generated on the reading platform, and extract reading behavior in the URL address data Data, the reading behavior data is transmitted to the statistical library after the static data synchronization is completed;
  • the data processing module is configured to follow a predetermined rule after the reading behavior data transmission is completed
  • the static data and the reading behavior data stored in the statistical library are statistically processed.
  • the embodiment of the present invention further provides a data information processing method, including the following steps: synchronizing static data in a production library into a statistical library;
  • the static data and the reading behavior data are statistically processed according to predetermined rules.
  • the static data in the production library is sequentially synchronized to the statistical library through the data synchronization module, the log module, and the data processing module, and the reading behavior data is transmitted to the statistical library, and the predetermined behavior is followed after the reading behavior data is transmitted.
  • Statistical operations such as static data and reading behavior data stored in the statistical library can analyze the user's reading behavior in a timely and accurate manner without any update to the hardware device.
  • FIG. 1 is a schematic diagram of a data information processing system according to Embodiment 1 of the present invention.
  • FIG. 2 is a schematic diagram of a data information processing system according to Embodiment 2 of the present invention.
  • FIG. 3a is a schematic structural diagram of a log module according to Embodiment 1 and Embodiment 2 of the present invention
  • FIG. 3b is a schematic structural diagram of a data processing module according to Embodiment 1 and Embodiment 2 of the present invention
  • FIG. 4 is a mobile phone user reading analysis according to an embodiment of the present invention. Schematic diagram of the communication relationship between modules in the system;
  • FIG. 5 is a flowchart of a data information processing method according to Embodiment 3 of the present invention.
  • FIG. 6 is a flowchart of a data information processing method according to Embodiment 4 of the present invention. detailed description
  • the data information processing system 1 of the embodiment of the present invention includes a data synchronization module 11, a log module 12, and a data processing module 13, where the data synchronization module 11 can be implemented by a first data interface, configured to be produced.
  • the static data in the library is synchronized to the statistical library, and the data synchronization module 11 optionally starts the synchronous operation of the static data at 12 am every day, and synchronizes all the static data in the production library into the statistical library. If you can incrementally synchronize the tables, increase the synchronization as much as possible, which reduces the amount of data and saves valuable time. For large tables in the production library, you need to do the sub-table operation, otherwise tens of millions of data synchronization will be very slow.
  • the log module 12 can be implemented by the second data interface, configured to read the URL address data generated on the reading platform, and extract the reading behavior data in the URL address data, and transmit the reading behavior data to the location after the static data synchronization is completed.
  • Static data generally includes the user name (id), time, location, book name, operation type (read or order), etc. Static data is determined based on actual statistical needs.
  • the log module 12 preferably includes a log reading module 121, a log analyzing module 122, a determining module 123, and a log storage module 124.
  • the log reading module 121 is configured to read a URL address generated on the reading platform. data. As shown in FIG. 4, when the user sends an access request to the reading platform through the browser inputting the URL address, the corresponding URL address data is generated on the reading platform, and the URL address data reflects that the dynamic behavior of the user reading is saved in the reading platform.
  • reading behavior parameters are also determined according to actual statistical needs can be added to the URL address of the reading behavior parameters of concern, such as the user reading How many books, books, and which columns to enter for reading.
  • the log analysis module 122 is configured to extract reading behavior parameters in the URL address data every fixed period, for example, analyzing the URL address data once every hour. So it is not necessary to accumulate to the final analysis, to avoid the analysis and processing of all URL address data.
  • the URL data of the previous analysis failure may be repeatedly analyzed and processed to ensure the integrity of the obtained reading behavior data.
  • the determining module 123 may trigger whether the log storage module 124 performs a warehousing operation according to whether the synchronization completion table is generated. For example, the synchronization completion table is generated, and the log warehousing module 124 transmits the analyzed reading behavior data to the statistical library, otherwise continues. Wait, scan every 10 minutes to find out if a synchronization completion table is generated. After all the reading behavior data is synchronized, an inbound completion table needs to be generated to trigger the subsequent data statistics processing operation.
  • the data processing module 13 may be implemented by a processor, and preferably includes a determining module 131 and a computing analyzing module 132.
  • the determining module 131 is configured to determine whether the log storage module 124 has completed reading behavior data transmission to the statistical library.
  • the calculation analysis module 132 performs statistical processing on the static data and the reading behavior data according to a predetermined rule. Otherwise, it continues to wait, and scans every 10 minutes to find whether to generate the warehousing completion table.
  • the reading behavior of the user can be analyzed through a large amount of reading behavior data extracted from the log module 12 and static data synchronized from the data synchronization module 11.
  • the predetermined rule is set according to the user's statistical needs. For example, to count the number of users reading a book in a certain province, the number of users who read the book in the province is summed.
  • the data information processing system 2 of the embodiment of the present invention includes a data synchronization module 21, a log module 22, a data processing module 23, and a display module 24, wherein the data synchronization module 21 is configured to statically in the production library.
  • the data is synchronized to the statistical library, and the data synchronization module 21 can selectively perform the synchronous operation of the static data at 12 am every day to synchronize all the static data in the production library to the statistical library. If you can incrementally synchronize the tables, incrementally synchronize as much as possible, which reduces the amount of data and saves valuable time. For large tables in the production library, you need to do the sub-table operation, otherwise tens of millions of data synchronization will be very slow. It is best not to operate 5 million records per table. After all the static data is synchronized, a synchronization completion table of the synchronization completion operation record needs to be generated to trigger the subsequent storage operation.
  • the log module 22 is configured to read the URL address data generated on the reading platform, and extract the reading behavior data in the URL address data, and transmit the reading behavior data to the statistical library after the static data synchronization is completed.
  • the log module 22 preferably includes a log reading module 221, a log analysis module 222, a determination module 223, and a log storage module 224, wherein the log reading module 121 is configured to read a URL address generated on the reading platform.
  • the URL address data generated on the reading platform incorporates reading behavior parameters according to the user's statistical requirements, such as the user reading the books in the first chapter, which books, from which columns to read, etc.; the log analysis module 222 is configured to be every The fixed period extracts the reading behavior parameters in the URL address data, for example, analyzes the URL address data once every hour, so that it is not necessary to accumulate to the final analysis, so as to avoid analyzing and processing all the URL address data.
  • the URL address data of the previous analysis failure may be repeatedly analyzed to ensure the integrity of the obtained reading behavior data.
  • the judging module 223 may trigger whether the log storage module 224 performs a warehousing operation according to whether the synchronization completion table is generated.
  • the synchronization completion table is generated, and the log storage module 224 transmits the analyzed reading behavior data to the statistical library, otherwise continues. Wait, scan every 10 minutes to find out if a synchronization completion table is generated. After all the reading behaviors of the data synchronization are completed, an inbound completion table needs to be generated to trigger the subsequent data statistics processing operations.
  • the data processing module 23 preferably includes a determination module 231 and a calculation analysis module 232.
  • the determination module 231 is configured to determine whether the log storage module 224 has completed the operation of transmitting the reading behavior data into the statistical library, such as generating.
  • the warehousing completion table the calculation analysis module 232 performs statistical processing on the static data and the reading behavior data according to a predetermined rule; otherwise, it continues to wait, scans every 10 minutes to find out whether to generate the warehousing completion table.
  • the predetermined rule is set according to the statistical needs of the user. For example, to count the number of users reading a book in a certain province, The number of users who read the book in the province is summed.
  • the display module 24 displays the statistically processed results of the calculation analysis module 232. The results of the large data amount need to be displayed in a page, and the export function is provided for the number detail and the book details.
  • the first three modules are mutually restrained, one module is not completed, and the next module is not allowed. At the same time, these three modules need to be fully executed before 8:00 in the morning so that the display module can be called.
  • the data information processing method of the embodiment of the present invention includes the following steps:
  • S301 Synchronize the static data in the production library into the statistical library; determine whether the static data is synchronized; if the synchronization completion table is generated, the static data synchronization is completed to the next step; otherwise, the static data synchronization is not completed, and the static data is continuously synchronized;
  • S303 Perform statistical processing on the static data and the reading behavior data according to a predetermined rule.
  • the data information processing method of the embodiment of the present invention includes the following steps: S301: Synchronizing static data in the production library into a statistical library; determining whether the static data is synchronized, if a synchronization completion table is generated, Then the static data synchronization is completed to proceed to the next step; otherwise, the static data synchronization is not completed, and the static data is continuously synchronized;
  • S302 reading the URL address data generated on the reading platform, extracting the reading behavior data in the URL address data, and transmitting the reading behavior data to the statistical library; determining whether the reading behavior data is completed, if the inbound completion table is generated , the reading behavior data transmission is completed to proceed to the next step; otherwise, the reading behavior data transmission is not completed, and the reading behavior data transmission operation is continued; S303: Perform statistical processing on the static data and the reading behavior data according to a predetermined rule; S304: display the statistically processed result.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种数据信息处理系统及方法,该系统包括数据同步模块、日志模块和数据处理模块,数据同步模块配置为将生产库中的静态数据同步到统计库中;日志模块配置为读取阅读平台上产生的URL地址数据,并提取所述URL地址数据中的阅读行为数据,在静态数据同步完成后将阅读行为数据传送至所述统计库中;数据处理模块配置为在阅读行为数据传送完成后按照预定规则对所述统计库中存储的静态数据和阅读行为数据进行统计处理。本发明通过数据同步模块、日志模块和数据处理模块依次序运行,无须对硬件设备进行任何更新就可以及时、准确地分析用户阅读行为。

Description

一种数据信息处理系统及方法 技术领域
本发明涉及手机应用领域, 尤指一种数据信息处理系统及方法。 背景技术
随着 3G网络和智能手机逐渐普及,人们开始习惯用手机阅读的方式打 发闲暇时间。 于是, 手机阅读成为各个运营商重点争夺的新兴业务。 为了 更好地, 更有针对性地对用户进行营销活动, 于是, 运营商提出要对手机 用户阅读行为进行统计分析, 提供具体支撑数据, 以便做出下一步的营销 策略。 对手机用户阅读行为进行统计分析就需要做到能够及时、 准确的对 手机用户阅读行为进行统计, 这就需要对手机阅读过程中产生的数据进行 存储、 分类及分析, 然而手机阅读过程中产生的数据量巨大, 当前还不能 同时保证阅读行为统计的及时性和准确性, 发明内容
针对现有技术存在的问题, 本发明主要提供一种低成本, 并能对手机 用户阅读行为进行及时、 准确地分析的数据信息处理系统及方法。
本发明实施例提供一种数据信息处理系统, 包括数据同步模块、 日志 模块和数据处理模块, 其中,
所述数据同步模块, 配置为将生产库中的静态数据同步到统计库中; 所述日志模块, 配置为读取阅读平台上产生的 URL地址数据, 并提取 所述 URL地址数据中的阅读行为数据, 在静态数据同步完成后将阅读行为 数据传送至所述统计库中;
所述数据处理模块, 配置为在阅读行为数据传送完成后按照预定规则 对所述统计库中存储的静态数据和阅读行为数据进行统计处理。 本发明实施例还提供一种数据信息处理方法, 包括如下步骤: 将生产库中的静态数据同步到统计库中;
读取阅读平台上产生的 URL地址数据, 并提取所述 URL地址数据中 的阅读行为数据, 在静态数据同步完成后将阅读行为数据传送至所述统计 库中;
阅读行为数据传送完成后按照预定规则对静态数据和阅读行为数据进 行统计处理。
本发明实施例通过数据同步模块、 日志模块和数据处理模块依次序完 成生产库中的静态数据同步到统计库中、 将阅读行为数据传送至统计库中、 在阅读行为数据传送完成后按照预定规则对统计库中存储的静态数据和阅 读行为数据进行统计处理等操作, 无须对硬件设备进行任何更新就可以及 时、 准确地分析用户阅读行为。 附图说明
图 1为本发明实施例 1的数据信息处理系统的示意图;
图 2为本发明实施例 2的数据信息处理系统的示意图;
图 3a为本发明实施例 1和实施例 2中日志模块的结构示意图; 图 3b为本发明实施例 1和实施例 2中数据处理模块的结构示意图; 图 4 为本发明实施例手机用户阅读分析系统中各模块间的通讯关系示 意图;
图 5为本发明实施例 3的数据信息处理方法的流程图;
图 6为本发明实施例 4的数据信息处理方法的流程图。 具体实施方式
为了便于更清楚地理解本发明的方案, 以下结合附图和实施例对本发 明的实现方式进行详尽说明。
实施例 1 :
如图 1所示, 本发明实施例的数据信息处理系统 1, 包括数据同步模块 11、 日志模块 12和数据处理模块 13, 这里, 数据同步模块 11可以由第一 数据接口实现, 配置为将生产库中的静态数据同步到统计库中, 数据同步 模块 11可选择地在每天凌晨 12点开始进行静态数据的同步操作, 将生产 库中所有的静态数据同步到统计库中。 如果可以增量同步的表, 尽可能增 量同步, 这样可以减少数据量, 节约宝贵时间。 对于生产库中的大表, 需 要做分表操作, 否则几千万的数据同步会很慢。 每个表的数据最好不要操 作 500 万条记录。 所有静态数据同步完成后, 需要生成一条同步完成操作 记录的同步完成表, 以便触发后面的入库操作。 日志模块 12可以由第二数 据接口实现, 配置为读取阅读平台上产生的 URL地址数据, 并提取所述 URL地址数据中的阅读行为数据, 在静态数据同步完成后将阅读行为数据 传送至所述统计库中。 静态数据一般包括用户名称(id )、 时间、 地点、 书 籍名称、 操作类型 (阅读或订购)等, 静态数据根据实际统计需要确定。
如图 3所示, 日志模块 12优选包括日志读取模块 121、 日志分析模块 122、 判断模块 123和日志入库模块 124, 其中, 日志读取模块 121配置为 读取阅读平台上产生的 URL地址数据。 如图 4所示, 用户通过浏览器输入 URL地址向阅读平台发送访问请求时,阅读平台上则产生相应的 URL地址 数据, 该 URL地址数据体现的是用户阅读的动态行为均保存在阅读平台的 緩存中; 阅读平台上产生的 URL地址数据中根据用户的统计需求加入了阅 读行为参数, 阅读行为参数也是根据实际统计需要确定可以在 URL地址中 加入比较关注的阅读行为参数, 如用户在阅读第几章书籍、 哪本书籍、 从 哪个栏目进入阅读等。 日志分析模块 122配置为每隔固定周期提取 URL地 址数据中的阅读行为参数,例如每一个小时对 URL地址数据进行一次分析, 如此不必都积累到最后分析, 避免无法分析处理完所有的 URL地址数据。 可选择地在分析完最后一个小时的 URL地址数据后, 还可以对前面分析失 败的 URL地址数据重复进行分析处理,以保证所得阅读行为数据的完整性。 判断模块 123可以根据是否生成同步完成表来触发日志入库模块 124是否 进行入库操作, 如生成同步完成表, 日志入库模块 124将分析后所得的阅 读行为数据传送至统计库中, 否则继续等待, 每隔 10分钟扫描一次, 查找 是否生成同步完成表。 在所有阅读行为数据同步完成后, 需要生成一条入 库完成表, 以便触发后面的数据统计处理操作。
如图 4所示, 数据处理模块 13可以由处理器实现, 优选包括判断模块 131和计算分析模块 132;其中,判断模块 131配置为判断日志入库模块 124 是否已完成阅读行为数据传送至统计库中的操作, 如生成入库完成表, 计 算分析模块 132按照预定规则对静态数据和阅读行为数据进行统计处理, 否则, 继续等待, 每隔 10分钟扫描一次, 查找是否生成入库完成表。 通过 大量的从日志模块 12提取的阅读行为数据以及从数据同步模块 11 同步的 静态数据就可以分析得到用户的阅读行为习惯。 其中, 预定规则是根据用 户的统计需求而设定, 例如要统计某个省份阅读某一本书的用户数, 就将 该省阅读该书的用户数求和。
实施例 2:
如图 2所示, 本发明实施例的数据信息处理系统 2, 包括数据同步模块 21、 日志模块 22、 数据处理模块 23和显示模块 24, 其中, 数据同步模块 21配置为将生产库中的静态数据同步到统计库中,数据同步模块 21可选择 地在每天凌晨 12点开始进行静态数据的同步操作, 将生产库中所有的静态 数据同步到统计库中。 如果可以增量同步的表, 尽可能增量同步, 这样可 以减少数据量, 节约宝贵时间。 对于生产库中的大表, 需要做分表操作, 否则几千万的数据同步会很慢。 每个表的数据最好不要操作 500万条记录。 所有静态数据同步完成后, 需要生成一条同步完成操作记录的同步完成表, 以便触发后面的入库操作。
日志模块 22配置为读取阅读平台上产生的 URL地址数据, 并提取所 述 URL地址数据中的阅读行为数据, 在静态数据同步完成后将阅读行为数 据传送至所述统计库中。 如图 3a所示, 日志模块 22优选包括日志读取模 块 221、 日志分析模块 222、 判断模块 223和日志入库模块 224, 其中, 日 志读取模块 121配置为读取阅读平台上产生的 URL地址数据, 阅读平台上 产生的 URL地址数据中根据用户的统计需求加入了阅读行为参数, 如用户 在阅读第几章书籍、 哪本书籍、 从哪个栏目进入阅读等; 日志分析模块 222 配置为每隔固定周期提取 URL地址数据中的阅读行为参数, 例如每一个小 时对 URL地址数据进行一次分析, 如此不必都积累到最后分析, 避免无法 分析处理完所有的 URL地址数据。可选择地在分析完最后一个小时的 URL 地址数据后, 还可以对前面分析失败的 URL地址数据重复进行分析处理, 以保证所得阅读行为数据的完整性。 判断模块 223 可以根据是否生成同步 完成表来触发日志入库模块 224是否进行入库操作, 如生成同步完成表, 日志入库模块 224将分析后所得的阅读行为数据传送至统计库中, 否则继 续等待, 每隔 10分钟扫描一次, 查找是否生成同步完成表。 在所有阅读行 为数据同步完成后, 需要生成一条入库完成表, 以便触发后面的数据统计 处理操作。
如图 3b所示, 数据处理模块 23优选包括判断模块 231和计算分析模 块 232; 其中, 判断模块 231配置为判断日志入库模块 224是否已完成阅读 行为数据传送至统计库中的操作, 如生成入库完成表, 计算分析模块 232 按照预定规则对静态数据和阅读行为数据进行统计处理, 否则, 继续等待, 每隔 10分钟扫描一次, 查找是否生成入库完成表。 其中, 预定规则是根据 用户的统计需求而设定, 例如要统计某个省份阅读某一本书的用户数, 就 将该省阅读该书的用户数求和。 最后, 显示模块 24将计算分析模块 232统 计处理后的结果进行显示, 对于大数据量的结果需要分页展示, 同时对于 号码明细、 书本明细要提供导出功能。
上述实施例中前三个模块相互牵制, 一个模块没有完成, 下一个模块 就不允许进行。 同时, 这三个模块需要保证在早上 8点之前完全执行完毕, 以便显示模块能调用。
实施例 3:
如图 4和 5所示, 本发明实施例的数据信息处理方法, 包括如下步骤:
S301 : 将生产库中的静态数据同步到统计库中; 判断静态数据是否同 步完成, 如果生成同步完成表, 则静态数据同步完成进行下一步, 否则, 静态数据同步未完成, 继续同步静态数据;
S302: 读取阅读平台上产生的 URL地址数据, 并提取所述 URL地址 数据中的阅读行为数据, 将阅读行为数据传送至统计库中; 判断阅读行为 数据是否传送完成, 如果生成入库完成表, 则阅读行为数据传送完成进行 下一步, 否则, 阅读行为数据传送未完成, 继续阅读行为数据传送操作;
S303: 按照预定规则对静态数据和阅读行为数据进行统计处理。
实施例 4:
如图 4和 6所示, 本发明实施例的数据信息处理方法, 包括如下步骤: S301 : 将生产库中的静态数据同步到统计库中; 判断静态数据是否同 步完成, 如果生成同步完成表, 则静态数据同步完成进行下一步, 否则, 静态数据同步未完成, 继续同步静态数据;
S302: 读取阅读平台上产生的 URL地址数据, 并提取所述 URL地址 数据中的阅读行为数据, 将阅读行为数据传送至统计库中; 判断阅读行为 数据是否传送完成, 如果生成入库完成表, 则阅读行为数据传送完成进行 下一步, 否则, 阅读行为数据传送未完成, 继续阅读行为数据传送操作; S303: 按照预定规则对静态数据和阅读行为数据进行统计处理; S304: 将统计处理后的结果进行显示。
以上所述仅为本发明的优选实施例而已, 并不用于限制本发明, 对于 本领域的技术人员来说, 本发明实施例可以有各种更改和变化。 凡在本发 明实施例的精神和原则之内, 所作的任何修改、 等同替换、 改进等, 均应 包含在本发明的保护范围之内。

Claims

权利要求书
1、 一种数据信息处理系统, 包括: 数据同步模块、 日志模块和数据处 理模块, 其中,
所述数据同步模块, 配置为将生产库中的静态数据同步到统计库中; 所述日志模块, 配置为读取阅读平台上产生的 URL地址数据, 并提取 所述 URL地址数据中的阅读行为数据, 在静态数据同步完成后将阅读行为 数据传送至所述统计库中;
所述数据处理模块, 配置为在阅读行为数据传送完成后按照预定规则 对所述统计库中存储的静态数据和阅读行为数据进行统计处理。
2、 如权利要求 1所述的数据信息处理系统, 其中, 所述日志模块包括 日志读取模块、 日志分析模块、 判断模块和日志入库模块;
所述日志读取模块, 配置为读取阅读平台上产生的 URL地址数据; 所述判断模块, 配置为判断所述数据同步模块是否已完成静态数据同 步;
所述日志分析模块, 配置为每隔固定周期提取 URL地址数据中的阅读 行为数据;
所述日志入库模块, 配置为在静态数据同步完成后将日志分析模块提 取的阅读行为数据传送至统计库存储。
3、如权利要求 1或 2所述的数据信息处理系统,其中, 所述日志模块, 还配置为根据是否生成同步完成表判断所述数据同步模块是否已完成静态 数据的同步。
4、 如权利要求 1所述的数据信息处理系统, 其中, 所述数据处理模块 包括判断模块和计算分析模块;
所述判断模块, 配置为判断所述日志入库模块是否已完成阅读行为数 据传送至所述统计库中的操作; 所述计算分析模块, 配置为在所有阅读行为数据传送至所述统计库后, 按照预定规则对静态数据和阅读行为数据进行统计处理。
5、 如权利要求 1或 4所述的数据信息处理系统, 其中, 所述数据处理 模块根据是否生成入库完成表判断所述日志入库模块是否已完成阅读行为 数据的传送。
6、 如权利要求 1所述的数据信息处理系统, 其中, 所述数据信息处理 系统还包括显示模块, 配置为将所述数据处理模块统计处理后的结果进行 显示。
7、 一种数据信息处理方法, 包括如下步骤:
将生产库中的静态数据同步到统计库中;
读取阅读平台上产生的 URL地址数据, 并提取所述 URL地址数据中 的阅读行为数据, 在静态数据同步完成后将阅读行为数据传送至所述统计 库中;
阅读行为数据传送完成后按照预定规则对静态数据和阅读行为数据进 行统计处理。
8、 如权利要求 7所述的数据信息处理方法, 其中, 所述将生产库中的 静态数据同步到统计库中为: 将一天中生产库中存储的所有静态数据同步 到统计库后生成同步完成表。
9、 如权利要求 8所述的数据信息处理方法, 其中, 所述静态数据同步 是否完成是根据是否生成同步完成表来判断, 如果生成同步完成表, 则静 态数据同步完成; 否则, 静态数据同步未完成。
10、如权利要求 7所述的数据信息处理方法,其中,所述提取所述 URL 地址数据中的阅读行为数据为: 每隔固定周期提取所述 URL地址数据中的 阅读行为数据。
11、 如权利要求 7 所述的数据信息处理方法, 其中, 所述阅读行为数 据全部传送完成后生成入库完成表。
12、 如权利要求 11所述的数据信息处理方法, 其中, 所述阅读行为数 则阅读行为数据传送完成, 否则, 阅读行为数据传送未完成。
13、 如权利要求 11所述的数据信息处理方法, 其中, 在阅读行为数据 传送完成后按照预定规则对静态数据和阅读行为数据进行统计处理之后还 包括: 将统计处理后的结果进行显示。
PCT/CN2014/074863 2013-04-12 2014-04-04 一种数据信息处理系统及方法 WO2014166371A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310127731.8A CN104102672A (zh) 2013-04-12 2013-04-12 一种数据信息处理系统及方法
CN201310127731.8 2013-04-12

Publications (1)

Publication Number Publication Date
WO2014166371A1 true WO2014166371A1 (zh) 2014-10-16

Family

ID=51670831

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/074863 WO2014166371A1 (zh) 2013-04-12 2014-04-04 一种数据信息处理系统及方法

Country Status (2)

Country Link
CN (1) CN104102672A (zh)
WO (1) WO2014166371A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109450879A (zh) * 2018-10-25 2019-03-08 中国移动通信集团海南有限公司 用户访问行为监控方法、电子装置和计算机可读存储介质
CN109885547A (zh) * 2019-02-22 2019-06-14 安徽继远软件有限公司 基于it基础架构的多源运行数据中多模块日志的行为感知方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255991A (zh) * 2017-12-29 2018-07-06 广州贝睿信息科技有限公司 一种幼儿阅读行为分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809752B1 (en) * 2005-04-14 2010-10-05 AudienceScience Inc. Representing user behavior information
CN102238045A (zh) * 2010-04-27 2011-11-09 广州迈联计算机科技有限公司 一种无线互联网用户行为的预测系统和方法
CN102479192A (zh) * 2010-11-24 2012-05-30 盛乐信息技术(上海)有限公司 通过电子书阅读器进行用户行为模式分析的系统和方法
CN102768656A (zh) * 2011-05-05 2012-11-07 中国移动通信集团上海有限公司 一种阅读记录的处理方法、系统及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100504743C (zh) * 2002-03-19 2009-06-24 电子图书系统有限公司 用于分析电子文档的读者的阅读模式的方法和系统
US9836751B2 (en) * 2003-07-31 2017-12-05 International Business Machines Corporation Self-contained and automated eLibrary profiling system
CN101034997A (zh) * 2006-03-09 2007-09-12 新数通兴业科技(北京)有限公司 一种数据信息精确发布的方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809752B1 (en) * 2005-04-14 2010-10-05 AudienceScience Inc. Representing user behavior information
CN102238045A (zh) * 2010-04-27 2011-11-09 广州迈联计算机科技有限公司 一种无线互联网用户行为的预测系统和方法
CN102479192A (zh) * 2010-11-24 2012-05-30 盛乐信息技术(上海)有限公司 通过电子书阅读器进行用户行为模式分析的系统和方法
CN102768656A (zh) * 2011-05-05 2012-11-07 中国移动通信集团上海有限公司 一种阅读记录的处理方法、系统及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109450879A (zh) * 2018-10-25 2019-03-08 中国移动通信集团海南有限公司 用户访问行为监控方法、电子装置和计算机可读存储介质
CN109885547A (zh) * 2019-02-22 2019-06-14 安徽继远软件有限公司 基于it基础架构的多源运行数据中多模块日志的行为感知方法

Also Published As

Publication number Publication date
CN104102672A (zh) 2014-10-15

Similar Documents

Publication Publication Date Title
CN106372113B (zh) 新闻内容的推送方法及系统
US20190108273A1 (en) Data Processing Method, Apparatus and Electronic Device
EP4105848A1 (en) Method and apparatus for evaluating joint training model
US10878044B2 (en) System and method for providing content recommendation service
CN107645562A (zh) 数据传输处理方法、装置、设备及系统
CN103607457B (zh) 笔记处理方法、装置、终端、服务器及系统
CN110929183B (zh) 一种数据处理方法、装置和机器可读介质
EP3029567B1 (en) Method and device for updating input method system, computer storage medium, and device
CN108205560B (zh) 一种数据同步方法以及装置
CN104919457A (zh) 用于丰富社交媒体以改进个性化用户体验的方法和装置
US11042529B2 (en) System of migration and validation
US20140136527A1 (en) Apparatus, system, and method for searching for power user in social media
CN107615270A (zh) 一种人机交互方法及其装置
WO2014166371A1 (zh) 一种数据信息处理系统及方法
CN111597804A (zh) 一种实体识别模型训练的方法以及相关装置
US10540667B2 (en) Method and system for generating a search query
US10621630B2 (en) Method and system for obtaining interactive user feedback in real-time
CN109634986A (zh) 系统监测方法、装置、计算机及计算机可读存储介质
JP2018077671A (ja) 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム
CN107341105A (zh) 信息处理方法、终端及服务器
US11799734B1 (en) Determining future user actions using time-based featurization of clickstream data
US10229105B1 (en) Mobile log data parsing
WO2017075974A1 (zh) 输入序列的处理方法、装置、设备及非易失性计算机存储介质
WO2023115831A1 (zh) 应用程序的测试方法、装置、电子设备及存储介质
CN113782004B (zh) 人机语音交互测试方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14782334

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14782334

Country of ref document: EP

Kind code of ref document: A1