CN106407288A - 一种信息同步更新的方法及系统 - Google Patents

一种信息同步更新的方法及系统 Download PDF

Info

Publication number
CN106407288A
CN106407288A CN201610755262.8A CN201610755262A CN106407288A CN 106407288 A CN106407288 A CN 106407288A CN 201610755262 A CN201610755262 A CN 201610755262A CN 106407288 A CN106407288 A CN 106407288A
Authority
CN
China
Prior art keywords
information
data message
obtaining
equipment end
configuration parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610755262.8A
Other languages
English (en)
Other versions
CN106407288B (zh
Inventor
李磊
顾正相
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangmen Science and Technology Co Ltd
Original Assignee
Shanghai Zhangmen Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhangmen Science and Technology Co Ltd filed Critical Shanghai Zhangmen Science and Technology Co Ltd
Priority to CN201610755262.8A priority Critical patent/CN106407288B/zh
Publication of CN106407288A publication Critical patent/CN106407288A/zh
Application granted granted Critical
Publication of CN106407288B publication Critical patent/CN106407288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出了一种在网络设备端和用户设备端进行信息同步更新的方法及其系统。其中所述在网络设备端进行信息同步更新的方法包括:确定用于获取数据信息的配置参数;基于所述配置参数获取相对应信息发布平台的信息内容;将获取的信息内容同步到目标信息发布平台。通过本发明为媒体人提供了一种统一的信息发布系统,通过该系统可以将媒体人在某一个平台上的已有信息自动同步到其他信息发布平台,从而缩减了信息发布的时间,为信息化提供了更加便利的方式。

Description

一种信息同步更新的方法及系统
技术领域
本发明涉及网络信息发布领域,尤其涉及一种信息同步更新的方法及系统。
背景技术
对于新闻媒体人,其使用的每个信息发布平台都是一个独立信息发布系统。媒体人撰写的一条新闻在某一平台上发布后,其需要将其分享到其他多个平台上时,十分麻烦,因为每个媒体信息发布系统都存在不同的格式要求、广告插入、乱码,所以在不同的媒体信息发布系统发布时,都要重新调整格式,并将广告、乱码等问题排除才能发布。如何能够省去这些麻烦,是当前的重要问题。
发明内容
本发明的目的是通过以下技术方案实现的。
本发明提出了一种在网络设备端进行信息同步更新的方法,其包括以下步骤:
确定用于获取数据信息的配置参数;
基于所述配置参数获取相对应信息发布平台的信息内容;
将获取的信息内容同步到目标信息发布平台。
其中,所述用于获取数据信息的配置参数存储在配置参数数据库之中。
其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成获取数据信息的任务指令信息;
根据任务指令信息获取相对应信息发布平台的信息内容,其中,所述信息内容包括网页的源码信息和/或对应的多媒体文件。
其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤之后还包括:
对获取的数据信息进行预处理;
将经过预处理的数据信息存储至信息发布数据库。
其中,所述对获取的数据信息进行预处理包括下列一项或多项::
对获取的网页中的进行对递进式网页库进行去重;
对网页进行重新排版;
对网页广告信息进行过滤;
对所述获取的数据信息添加广告或评论功能的网页代码;
获取所述数据信息的分类和/或标签,并赋相关的分类或标签信息;
对GBK编码的汉字自动校验和纠错。
其中,所述将获取的信息内容同步到目标信息发布平台步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成发布数据信息的任务指令信息;
根据任务指令信息从信息发布数据库调取经过预处理的待发布数据信息;
将经过预处理的待发布数据信息发送至目标信息发布平台进行发布。
本发明还提出了一种在在用户设备端进行信息同步更新的方法,其包括以下步骤:
设置用于获取数据信息的配置参数;
将用于获取数据信息的配置参数发送至网络设备端。
其中,所述设置用于获取数据信息的配置参数步骤具体包括:
设置数据信息的来源;
确定获取数据信息的接口;
对获取已有信息发布平台的信息内容的授权;
设置获取数据信息的时间点、频率;
设置获取到数据信息后生成适于目标信息发布平台的内容格式模板。
其中,所述对获取已发布信息发布平台的信息内容的授权步骤具体包括:将已有的信息发布平台的验证信息与授权密钥进行配对。
本发明还提出了一种信息同步更新的系统,其包括用户设备端和网络设备端,其特征在于:
所述用户设备端包括:
设置模块,用于设置用于获取数据信息的配置参数;
发送模块,用于将用于获取数据信息的配置参数发送至网络设备端;
所述网络设备端包括:
配置数据库模块,用于存储所述用户设备端发送的设置信息;
数据获取模块,用于根据用户指令获取指定平台的信息内容;
数据预处理模块,用于对获取的信息内容进行预处理;
信息发布数据库,用于存储经过预处理的信息内容;
信息内容发送模块,用于将经过预处理的信息内容发送至目标信息发布平台。
本发明为媒体人提供了一种统一的信息发布系统,通过该系统可以将媒体人在某一个平台上的已有信息自动同步到其他信息发布平台,从而缩减的信息发布的时间,为信息化提供了更加便利的方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1示出了根据本发明实施方式的信息同步更新的系统原理图;
附图2示出了根据本发明实施方式的在网络设备端进行信息同步更新的方法流程图
附图3示出了根据本发明实施方式的一种在在用户设备端进行信息同步更新的方法流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
根据本发明的实施方式,提出一种信息同步更新的系统,如附图1所示,其包括用户设备端和网络设备端,其特征在于:
所述用户设备端包括:
设置模块,用于设置用于获取数据信息的配置参数;
发送模块,用于将用于获取数据信息的配置参数发送至网络设备端;
所述网络设备端包括:
配置数据库模块,用于存储所述用户设备端发送的设置信息;
数据获取模块,用于根据用户指令获取指定平台的信息内容;
数据预处理模块,用于对获取的信息内容进行预处理;
信息发布数据库,用于存储经过预处理的信息内容;
信息内容发送模块,用于将经过预处理的信息内容发送至目标信息发布平台。
如图2所示,本发明还提出了一种在网络设备端进行信息同步更新的方法,其包括以下步骤:
确定用于获取数据信息的配置参数;
基于所述配置参数获取相对应信息发布平台的信息内容;
将获取的信息内容同步到目标信息发布平台。
所述确定用于获取数据信息的配置参数包括授权与该信息同步更新系统帐号的绑定。用户已有的内容发布平台的帐号,可以是目前常用的微博帐号、微信公众帐号以及其他可以通过网络进行信息发布的平台。
在某一实施例中,通过复制需要同步的内容的链接,例如URL地址等到指定的位置。
在某一实施例中,可以复制相应的网页内容到指定位置。
其中,所述用于获取数据信息的配置参数存储在配置参数数据库之中。
其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成获取数据信息的任务指令信息;
根据任务指令信息获取相对应信息发布平台的信息内容,其中,所述信息内容包括网页的源码信息和/或对应的多媒体文件。
其中,所述基于配置参数获取相对应信息发布平台的信息内容步骤之后还包括:
对获取的数据信息进行预处理;
将经过预处理的数据信息存储至信息发布数据库。
其中,所述对获取的数据信息进行预处理包括如下一项或多项:
对获取的网页中的进行对递进式网页库进行去重;
对网页进行重新排版;
对网页广告信息进行过滤;所述过滤可以预先设置过滤条件;
对所述获取的数据信息添加广告或评论功能的网页代码;通过添加所述代码,可以使获取的信息具备发布广告和进行评论的功能;
获取所述数据信息的分类和/或标签,并赋于相关的分类或标签信息;通过对所述数据信息赋予分类或标签信息,可以使得将要发布的信息具有更高的区分度和有效的索引;
对GBK编码的汉字自动校验和纠错。
本领域技术人员明了,本申请的上述多项预处理操作可以根据实际需要选择一项或多项,各项之间可以设置操作时序关系,在此不再详细描述。
其中,对获取的网页中的进行对递进式网页库进行去重包括:
从新获取的网页中提取多个特征字段;
将每个新获取网页与内部网页库中的所有网页进行比较,当新获取网页的每个特征字段都与内部网页库中的一个网页的一个特征字段相同时,判断该新获取网页与内部网页库中的该网页重复,删除该新获取网页;
当该新获取网页与内部网页库中的所有网页都不重复时,将每个新获取网页的网址与外部网页库中的所有网页的网址进行比较,如果有相同现象,则以该新获取网页替代外部网页库中的相同网址的网页;
如果不存在相同的现象,将每个新获取网页与外部网页库中的所有网页进行比较,当新获取网页的每个特征字段都与外部网页库中的一个网页的一个特征字段相同时,判断该新获取网页与外部网页库中的该网页重复;
将该新获取网页的特征字段数量设为a,将外部网页库中与之重复的网页的特征字段数量设为b;当a<b,则删除该新获取网页;当a≥b,则以该新获取网页替代外部网页库中与之重复的网页。
其中对网页进行重新排版,包括:
获取网页的页面代码;
保存该网页的上下文和用户会话;
对网页代码进行标签过滤,去除代码,所述对网页代码进行标签过滤包括删除表单Table标签,删除区隔标记div标签,删除层叠样式表CSS;
对网页代码进行补充处理,添加代码;
加载上述保存的上下文和用户会话;
将处理后的网页代码加载,并重新生成网页。
在某一实施例中,使用正则表达式对网页代码进行标签过滤,去除不需要的部分代码;正则表达式(英文:Regular Expression)在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具裡,正則表达式通常被用来检索和/或替换那些符合某个模式的文本内容。
其中,对GBK编码的汉字自动校验和纠错包括:
1)从获取的中文文本的头部开始,依次遍历文本,判断文本的GBK编码中连续的两个字节,是否满足条件:第一个字节属于0x81-0xFE,第二个字节属于0x40-0xFE,如果满足该条件,则将这两个字节记录到校验字符串中;如果不满足该条件,则将第二个字节设定为后续遍历的起点;
2)重复步骤1),依次遍历后续文本,直到校验字符串的长度达到预先设定的字节数时,转到步骤3);
3)将两个计数器count_1和count_2的初始值设为0,判断校验字符串中的各个汉字是否属于高频汉字,如果是,则将count_1的数值加1;如果不是,则再判断该汉字是否在GB2312标准的BOA1至F7FE字符范围内,如果不在该字符范围内,则将count_2的数值加1;
4)计算校验字符串的乱码程度:charnum=count_2-count_1;
5)判断步骤4)得到的charnum数值,若charnum<3,则认为校验字符串编码正常,转到步骤8);若charnum≥3,则认为校验字符串编码有错误,转到步骤6);
6)去除校验字符串的第一个和最后一个字节,按照步骤3),统计count_1和count_2的数值,计算纠错尝试后的乱码程度charnum_new;
7)比较charnum和charnum_new的数值大小,若charnum-charnum_new>8,则纠错成功,输出纠错后的文本;若4<charnum-charnum_new≤8,则以该校验字符串后续的第一个字节为遍历起点,重复步骤1)至7),判断下一个校验字符串是否满足4<charnum-charnum_new≤8,如果满足,则纠错成功,输出纠错后的文本;
8)对后续字符串依照步骤1)至7)进行遍历,直至遍历完该中文文本的全部字符。
其中,所述将获取的信息内容同步到目标信息发布平台步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成发布数据信息的任务指令信息;
根据任务指令信息从信息发布数据库调取经过预处理的待发布数据信息;
将经过预处理的待发布数据信息发送至目标信息发布平台进行发布。
如图3所示,本发明还提出了一种在在用户设备端进行信息同步更新的方法,其包括以下步骤:
设置用于获取数据信息的配置参数;
将用于获取数据信息的配置参数发送至网络设备端。
用户通过用户设备端登录该信息同步更新系统。所述用户设备端包括移动电话、笔记本、PDA等无线智能设备。
其中,所述设置用于获取数据信息的配置参数步骤具体包括:
设置数据信息的来源;
确定获取数据信息的接口;
对获取已有信息发布平台的信息内容的授权;
设置获取数据信息的时间点、频率;
设置获取到数据信息后生成适于目标信息发布平台的内容格式模板。
数据信息获取的时间点指在某一天或某一时间段的固定时间点进行数据获取的时间。
频率指在某一设定时间内进行多少次信息的自动获取。
其中,所述对获取已发布信息发布平台的信息内容的授权步骤具体包括:将已有的信息发布平台的验证信息与授权密钥进行配对。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种在网络设备端进行信息同步更新的方法,其包括以下步骤:
确定用于获取数据信息的配置参数;
基于所述配置参数获取相对应信息发布平台的信息内容;
将获取的信息内容同步到目标信息发布平台。
2.根据权利要求1所述的在网络设备端进行信息同步更新的方法,所述用于获取数据信息的配置参数存储在配置参数数据库之中。
3.根据权利要求2所述的在网络设备端进行信息同步更新的方法,所述基于配置参数获取相对应信息发布平台的信息内容步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成获取数据信息的任务指令信息;
根据任务指令信息获取相对应信息发布平台的信息内容,其中,所述信息内容包括网页的源码信息和/或对应的多媒体文件。
4.根据权利要求1至3之一所述的在网络设备端进行信息同步更新的方法,所述基于配置参数获取相对应信息发布平台的信息内容步骤之后还包括:
对获取的数据信息进行预处理;
将经过预处理的数据信息存储至信息发布数据库。
5.根据权利要求4所述的在网络设备端进行信息同步更新的方法,所述对获取的数据信息进行预处理包括下列一项或多项:
对获取的网页中的进行对递进式网页库进行去重;
对网页进行重新排版;
对网页广告信息进行过滤;对所述获取的数据信息添加广告或评论功能的网页代码;
获取所述数据信息的分类和/或标签,并赋相关的分类或标签信息;
对GBK编码的汉字自动校验和纠错。
6.根据权利要求4所述的在网络设备端进行信息同步更新的方法,所述将获取的信息内容同步到目标信息发布平台步骤具体包括:
调用配置参数数据库中的用于获取数据信息的配置参数;
基于配置参数生成发布数据信息的任务指令信息;
根据任务指令信息从信息发布数据库调取经过预处理的待发布数据信息;
将经过预处理的待发布数据信息发送至目标信息发布平台进行发布。
7.一种在在用户设备端进行信息同步更新的方法,其包括以下步骤:
设置用于获取数据信息的配置参数;
将用于获取数据信息的配置参数发送至网络设备端。
8.根据权利要求7所述的在用户设备端进行信息同步更新的方法,所述设置用于获取数据信息的配置参数步骤具体包括:
设置数据信息的来源;
确定获取数据信息的接口;
对获取已有信息发布平台的信息内容的授权;
设置获取数据信息的时间点、频率;
设置获取到数据信息后生成适于目标信息发布平台的内容格式模板。
9.根据权利要求8所述的在用户设备端进行信息同步更新的方法,所述对获取已发布信息发布平台的信息内容的授权步骤具体包括:将已有的信息发布平台的验证信息与授权密钥进行配对。
10.一种信息同步更新的系统,其包括用户设备端和网络设备端,其特征在于:
所述用户设备端包括:
设置模块,用于设置用于获取数据信息的配置参数;
发送模块,用于将用于获取数据信息的配置参数发送至网络设备端;
所述网络设备端包括:
配置数据库模块,用于存储所述用户设备端发送的设置信息;
数据获取模块,用于根据用户指令获取指定平台的信息内容;
数据预处理模块,用于对获取的信息内容进行预处理;
信息发布数据库,用于存储经过预处理的信息内容;
信息内容发送模块,用于将经过预处理的信息内容发送至目标信息发布平台。
CN201610755262.8A 2016-08-29 2016-08-29 一种信息同步更新的方法及系统 Active CN106407288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610755262.8A CN106407288B (zh) 2016-08-29 2016-08-29 一种信息同步更新的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610755262.8A CN106407288B (zh) 2016-08-29 2016-08-29 一种信息同步更新的方法及系统

Publications (2)

Publication Number Publication Date
CN106407288A true CN106407288A (zh) 2017-02-15
CN106407288B CN106407288B (zh) 2020-01-10

Family

ID=58003603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610755262.8A Active CN106407288B (zh) 2016-08-29 2016-08-29 一种信息同步更新的方法及系统

Country Status (1)

Country Link
CN (1) CN106407288B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391607A (zh) * 2017-06-30 2017-11-24 天脉聚源(北京)传媒科技有限公司 一种协同变更关联数据项的方法及装置
CN108270784A (zh) * 2018-01-15 2018-07-10 中企动力科技股份有限公司 信息配置化群发方法及装置
CN108628881A (zh) * 2017-03-20 2018-10-09 北京京东尚科信息技术有限公司 数据同步方法和装置
CN108965945A (zh) * 2018-06-22 2018-12-07 中央电视台 多媒体信息发布方法及装置、存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291304A (zh) * 2008-06-13 2008-10-22 清华大学 可移植的网络信息共享方法
CN103491113A (zh) * 2012-06-11 2014-01-01 腾讯科技(深圳)有限公司 一种信息聚合文件的同步方法、装置及系统
CN103699638A (zh) * 2013-12-23 2014-04-02 国云科技股份有限公司 一种基于配置参数实现跨数据库类型同步数据的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101291304A (zh) * 2008-06-13 2008-10-22 清华大学 可移植的网络信息共享方法
CN103491113A (zh) * 2012-06-11 2014-01-01 腾讯科技(深圳)有限公司 一种信息聚合文件的同步方法、装置及系统
CN103699638A (zh) * 2013-12-23 2014-04-02 国云科技股份有限公司 一种基于配置参数实现跨数据库类型同步数据的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108628881A (zh) * 2017-03-20 2018-10-09 北京京东尚科信息技术有限公司 数据同步方法和装置
CN107391607A (zh) * 2017-06-30 2017-11-24 天脉聚源(北京)传媒科技有限公司 一种协同变更关联数据项的方法及装置
CN107391607B (zh) * 2017-06-30 2023-06-23 北京拉近众博科技有限公司 一种协同变更关联数据项的方法及装置
CN108270784A (zh) * 2018-01-15 2018-07-10 中企动力科技股份有限公司 信息配置化群发方法及装置
CN108270784B (zh) * 2018-01-15 2020-08-04 中企动力科技股份有限公司 信息配置化群发方法及装置
CN108965945A (zh) * 2018-06-22 2018-12-07 中央电视台 多媒体信息发布方法及装置、存储介质
CN108965945B (zh) * 2018-06-22 2021-04-20 中央电视台 多媒体信息发布方法及装置、存储介质

Also Published As

Publication number Publication date
CN106407288B (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
US10366154B2 (en) Information processing device, information processing method, and computer program product
CN101523413A (zh) 根据硬拷贝表单自动生成表单定义
CN109740159B (zh) 用于命名实体识别的处理方法及装置
CN106407288A (zh) 一种信息同步更新的方法及系统
CN103853806A (zh) 一种表格转换方法及装置
US20170228356A1 (en) System Generator Module for Electronic Document and Electronic File
CN107203574A (zh) 数据管理和数据分析的聚合
CN109033282A (zh) 一种基于抽取模板的网页正文抽取方法及装置
CN109445794B (zh) 一种页面构造方法及装置
CN110275963A (zh) 用于输出信息的方法和装置
CN106462933A (zh) 使用内容结构来社交地连接用户
CN105488471B (zh) 一种字形识别方法及装置
CN103761095B (zh) 一种生成通用的升级文件头部数据信息的方法
CN102467496B (zh) 用于将流式排版内容转换为块式排版文档的方法和装置
CN106528566A (zh) 日志文件的输出方法、服务器及客户端
US9619445B1 (en) Conversion of content to formats suitable for digital distributions thereof
CN104536947A (zh) 版式文档的处理方法及装置
CN107111802A (zh) 业务规范再生系统、业务规范再生方法
CN107025214A (zh) 数据处理方法和装置
CN101374307A (zh) 一种移动设备中更新数字内容信息的方法及装置
CN104320454B (zh) 一种在http协议还原中实现自定义输出的方法及系统
JP2007164503A (ja) システム生産方法、システム生産システム、システム生産プログラムおよびシステム生産に用いられる定義体情報のデータ構造
AU2015331032A1 (en) Electronic filing system for electronic document and electronic file
CN101464875A (zh) 使用xml表示电子字典数据的方法
CN104978379A (zh) 一种应用程序资料站的搭建方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant