CN104036028A - 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法 - Google Patents

一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法 Download PDF

Info

Publication number
CN104036028A
CN104036028A CN201410301570.4A CN201410301570A CN104036028A CN 104036028 A CN104036028 A CN 104036028A CN 201410301570 A CN201410301570 A CN 201410301570A CN 104036028 A CN104036028 A CN 104036028A
Authority
CN
China
Prior art keywords
information
electronic document
user
integration unit
data integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410301570.4A
Other languages
English (en)
Other versions
CN104036028B (zh
Inventor
吴涛军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410301570.4A priority Critical patent/CN104036028B/zh
Publication of CN104036028A publication Critical patent/CN104036028A/zh
Application granted granted Critical
Publication of CN104036028B publication Critical patent/CN104036028B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/131Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种电子文档信息片段的处理系统,以电子文档信息片段为基础建立数据集成单元。数据集成单元与特定用户对于电子文档信息片段的选择紧密相关,可以对电子文档信息片段进行整理、提炼和组织操作,数据集成单元包括资源发布层、用户交互层和基础服务层。本发明提供一种电子文档信息片段的生成方法,用户触发步骤,获取用户操作权限信息并进行判断;指示符生成步骤,根据用户操作的起点和终点生成开始指示符和结束指示符;信息片段确定步骤,选择开始指示符和结束指示符之间的内容作为信息片段,并将信息片段基本信息发送到资源发布层;坐标转化步骤,资源发布层将信息片段的位置信息转化为信息片段的文字坐标。

Description

一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法
技术领域
本发明涉及电子文档数据处理技术领域,属于数据挖掘与信息处理领域,具体涉及一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法。
背景技术
用于在浏览网页等电子文档的过程中,会产生很多关注焦点。该关注焦点是针对特定用户的信息聚合点,以该关注焦点为中心形成的信息片段具有较高的含金量。例如,日本索尼株式会社曾于2008年1月9日提出JP2008-001937号日本专利申请,该申请公开一种信息处理系统、设备、方法以及计算机程序。该信息处理系统有效地执行内容信息获取处理和内容购买处理,其中,需要访问不同的服务器。如果用户查看由信息提供服务器所提供的信息,例如电视节目表信息,并获取与从电视节目表信息中包括的信息片段中选择的信息相关的内容,所述用户可以向内容提供服务器传输包括内容描述信息的内容获取请求,只需通过将显示屏幕上显示的所选择的信息拖放到显示单元中包括的工具栏中或拖放到另一个服务器信息显示区。作为结果,用户可以有效地进行内容的选择和获取,而无需在与各种服务器的连接之间进行切换。该专利申请体现了根据特定用户的关注焦点确定相关信息内容。日本索尼株式会社曾对该技术进行深入改进,并于2011年10月3日提出JP2011-219158号日本专利申请,该申请涉及信息处理设备和方法、程序以及记录介质。一种信息处理设备包括第一和第二显示控制单元,以及操作区域指定单元。第一显示控制单元被配置为通过在图像中事先布置的多个区域中显示多个文章信息片段来控制内容的图像的显示,所述多个文章信息片段的每一个都由字符串和图片图像的其中之一构成,并且所述文章信息片段与所述区域彼此相关联。操作区域指定单元被配置为指定在图像中的哪个区域上执行操作。第二显示控制单元被配置为通过在图像中的预定区域中显示文 章信息片段来控制附加图像的显示,所述文章信息片段不包括与指定区域相关联的文章信息片段。
随着互联网技术的发展,针对特定用户关注焦点确定信息片段在互联网环境下有所应用。我国无线移动互联网领域学者崔勇、张鹏曾在《无线移动互联网:原理、技术与应用》中阐述基于移动IP技术的用户关注信息研究。实务界对此也高度关注,例如,美国IBM公司曾于2002年10月25日提出WO2003/038583号国际专利申请,其涉及聚集显示网页所用的上下文管理超级工具和过滤/排序模型。一种信息聚集和管理的系统和方法,具有选择的“深钻”能力并且采用一种客体-操作导航方法。一个用户首先选择一个关注的客体,然后选择对所述选中客体进行的一个或多个操作。可以从上下文窗格选择一个信息客体,然后可以从执行库选择对该客体可用的一个操作。一个内容窗格显示对该客体的操作结果。用户可以对显示信息进行重新安排、汇总、最大化、过滤和排序,以便有效地管理显示区域并且使获取信息和所关注的分析所需的操作最少。
美国微软公司曾于2009年8月11日提出WO2010/027611号国际专利申请,其涉及基于浏览信息的内容推荐,该申请是动态地跟踪关于网站的第一次或非活动用户的信息并迅速地将有针对性的内容呈现回用户以维持用户对网站的兴趣的体系结构。基于直接相关的内容和功能并且在不要求用户输入关于用户的简档信息的情况下建立与用户的内心连接。基于在网站处提供引起用户兴趣的面向动作的初始场景的同时所收集的若干浏览信息片段,使得用户对作为整体的内容(例如产品)感兴趣。在例如社交应用程序或在线服务提供者的上下文中,可以向用户推荐服务。该体系结构还便于基于当前的用户浏览活动来向用户进行例如服务、特征和产品的提升销售和交叉销售。
我国企业也对于特定用户关注焦点确定信息片段有所关注。例如,阿里巴巴集团控股有限公司曾于2009年3月5日公开了一种用户访问网页行为的可视化处理方法,该方法包括:采集用户端的鼠标点击数据;根据采集的所述鼠标点击数据,统计用户对网页中各区域的访问次数;以及,将用户对网页中各区域的访问次数与相应的区域相匹 配;显示匹配结果。本申请同时公开一种用户访问网页行为的可视化处理装置及系统。采用本申请实施例可以将用户对网页中内容的关注程度与网页中相应内容之间的关系紧密联系起来,直观、明了地显示用户对网页中内容的关注程度。另外,华为技术有限公司提出的201210236673号中国专利申请、北京奇虎科技有限公司和奇智软件(北京)有限公司提出的201310115834号中国专利申请,以及本申请人提出的201310186840号中国专利申请都体现了这一点。
但是,现有技术仅仅将用户关注焦点为中心形成的信息片段作为处理对象,并未实现同一用户在不同平台下信息片段的同步、数据显示和操作行为的上下文相关性保障以及不同用户在相同数据集成单元上的互动。
发明内容
本发明解决的问题在于提供一种电子文档信息片段的处理系统,可以实现同一用户在不同平台下信息片段及操作行为的同步、数据显示和操作行为的上下文相关性保障以及不同用户在相同数据集成单元上的互动。
需要指出的是,本申请首先定义一些基本概念:
本申请中的“数据集成单元”是指,以电子文档信息片段为基础建立的、与特定用户对于电子文档信息片段的选择紧密相关的、可以对电子文档信息片段进行整理、提炼和组织等操作的数据展示平台,该数据展示平台使得电子文档信息片段具有可操作性,其通过凝聚用户以及用户间的行为来增加信息片段的附属价值,并为基于数据集成单元或其他与数据集成单元相关数据源的应用提供内嵌接口。
本申请中所述的“空间”,是指数据集成单元进行数据显示和用户输入处理的最小窗体。
本申请中所述的“应用”,是指由一个或者多个功能有序组成的功能组构成、在空间中进行逻辑处理的单元,其可以从空间提供的数据源中获取数据,并且可以将运算结果在空间中加以展示。
用户可以从数据集成单元支持在空间中加载的功能列表中选择出一个或多个功能,若有多个功能需有序排列,在此基础上确定空间 数据源后形成一项应用。就数据集成单元的应用而言,用户可以在任意网页内容上建立数据集成单元,并通过设置数据展示窗口属性来控制窗口中的展现内容和内容显示方式。数据集成单元通过内置的定位模块将记录信息片段的位置,当同一用户再次访问到相同网页或其他被授权用户访问到相同网页,数据集成单元会被重建,用户会通过数据集成单元上集成的窗口获知关联的信息片段、访问者信息、创建者更改信息等与数据集成单元中信息片段相关的数据。
就“空间”和“应用”的关系而言,“空间”在运行状态下能够而且仅能够提供一个应用使用,能够而且仅能够呈现一个应用的运行过程和结果。
为了解决上述技术问题,本发明的技术方案为:
一种电子文档信息片段的处理系统,其特征在于,以电子文档信息片段为基础建立数据集成单元。
作为一种优选实施方式,其中,所述电子文档可以是网页。
作为另一种优选实施方式,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元与特定用户对于电子文档信息片段的选择紧密相关。
作为另一种优选实施方式,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元可以对电子文档信息片段进行整理操作。
作为另一种优选实施方式,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元可以对电子文档信息片段进行提炼操作。
作为另一种优选实施方式,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元可以对电子文档信息片段进行组织操作。
在以上任意一种优选实施方式当中,进一步来说,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元包括资源发布层,实现对信息片段的提取整理。其中,数据集成单元包括资源发布层,同时提供信息片段的操作接口。更具体地,数据集成单元的资 源发布层包括用于获取信息片段文字坐标的位置信息模块、用于提供信息片段展示区域空间规划操作(包括访问)接口的结构信息模块和用于提供信息片段属性操作(包括访问)接口的域内信息模块。其中,数据集成单元的资源发布层的位置信息模块处理内容的文字坐标、数据集成单元扩展区域的位置和应用所在的标准空间位置。数据集成单元的资源发布层的结构信息模块处理信息片段的显示样式。数据集成单元的资源发布层的结构信息模块处理信息片段上加载应用所在的可以扩大缩放的标准空间在扩展区域的布局格式。数据集成单元的资源发布层的结构信息模块处理的信息片段可以跨越多个文档节点。数据集成单元的资源发布层的域内信息模块处理文本信息片段和多媒体信息片段。其中,数据集成单元的资源发布层的域内信息模块处理的文本信息片段包含文本内容的长度和上下文。数据集成单元的资源发布层的域内信息模块处理的文本信息片段还包含创建者和创建时间。数据集成单元的资源发布层的域内信息模块处理的文本信息片段还包含访问者信息。数据集成单元的资源发布层的域内信息模块处理的文本信息片段长度以字符数作为单位,多媒体信息片段长度以像素数和帧数作为单位。
在以上任意一种优选实施方式当中,进一步来说,如上所述的电子文档信息片段的处理系统,其特征在于,数据集成单元包括用户交互层,实现数据集成单元与用户之间的即时反馈。其中,用户交互层包括用于将信息片段创建过程可视化的区域生成模块、用于突出显示信息片段的区域显示模块。用户交互层还包括用于在信息片段周围呈现可放置标准空间扩展区域的空间扩展模块。用户交互层还包括用于在水平扩展区域覆盖层叠将扩展区域垂直化的空间层级模块。
在以上任意一种优选实施方式当中,进一步来说,所述数据集成单元包括基础服务层,实现数据的存取。其中,数据集成单元包括基础服务层,同时实现操作权限的识别。另一方面,数据集成单元包括基础服务层,基础服务层保存信息片段信息、用户数据和应用数据。另一方面,数据集成单元的基础服务层包括根据空间信息确定可用功能集合的空间静态属性配置模块和用于记录空间状态值的空间动态 属性管理模块;其中,数据集成单元的基础服务层所根据的空间信息包括空间使用者、空间尺寸、空间位置、空间上下文、空间数据来源中的一种或者几种;数据集成单元的基础服务层的空间静态属性配置模块所管理的属性包括:空间使用者、空间尺寸、空间位置、空间上下文、空间数据来源、空间可加载功能列表和应用配置中的一种或者几种;空间运行状态包括:空间输入状态、空间显示状态、空间空闲状态中的一种;其中,当空间处于输入状态时,空间标准化模块接受用户输入信息并传送到基础服务层的数据记录模块;空间显示状态包括基本信息状态、用户状态、应用状态中的一种;应用状态显示空间应用运行过程和结果。或者,空间显示状态包括静止状态、滚动状态、幻灯状态等状态中的一种或者几种。或者,空间显示状态包括文字状态、图片状态和视频状态。其中,空间静态属性用于确定空间可加载应用的集合以及空间数据展示方式集合。展示的空间数据包括信息片段数据和空间应用数据中的一种或者两种。信息片段数据包括信息片段基本信息和信息片段附加信息。信息片段基本信息包括所在区域中的内容,所在区域的位置属性,上下文信息,创建者和创建时间。信息片段附加信息包括数据集成单元区域的初始样式、扩展区域空间初始布局、数据集成单元访问者、相关的其他数据集成单元中的一种或者几种。空间上下文包括信息片段内容、信息片段上下文关键词、网页标题中的一种或者几种。
一种电子文档信息片段的处理方法,其包括如下步骤,数据集成单元建立步骤,用户浏览电子文档中针对信息片段建立数据集成单元,数据集成单元包括资源发布层、用户交互层和基础服务层;位置信息获取步骤,获取信息片段的文字坐标;坐标解析步骤,当用户重新打开同一电子文档,通过获取的位置信息进行坐标解析;数据集成单元重建步骤,根据解析获取的坐标定位到同一信息片段,重建数据集成单元;位置确定步骤,确定扩展区域在电子文档中的显示位置。
作为该电子文档信息片段的处理方法的一种优选实施方式,其中,电子文档为网页。在坐标解析步骤中,不同用户重新打开电子文档,通过获取的位置信息进行坐标解析。
一种电子文档信息片段的生成方法,其特征在于,用户触发步骤,获取用户操作权限信息并进行判断;指示符生成步骤,根据用户操作的起点和终点生成开始指示符和结束指示符;信息片段确定步骤,选择开始指示符和结束指示符之间的内容作为信息片段,并将信息片段基本信息发送到资源发布层;坐标转化步骤,资源发布层将信息片段的位置信息转化为信息片段的文字坐标。
作为该电子文档信息片段的生成方法的一种优选实施方式,其中,信息片段确定步骤发送到资源发布层的信息片段基本信息包括信息片段内容、位置、创建者、创建时间中的一种或者几种。信息片段确定步骤发送到资源发布层的信息片段基本信息包括提取出的信息片段上下文。
作为该电子文档信息片段的生成方法的另一种优选实施方式,其中,信息片段确定步骤将信息片段基本信息发送到资源发布层的结构信息模块和域内信息模块。信息片段确定步骤还包括结构信息模块将信息片段所在的电子文档代码进行完整化处理。坐标转化步骤还包括将信息片段格式发送到基础服务层加以保存。坐标转化步骤还包括将信息片段格式发送到基础服务层的数据记录模块加以保存。
一种电子文档信息片段的差异化显示方法,其特征在于,区域显示样式获取步骤,信息片段创建成功之后获取区域显示样式;个性化显示样式获取步骤,通过基础服务层查询当前用户名下的个性化样式;显示步骤,根据个性化显示样式或者区域显示样式加以显示,如果没有个性化显示样式,展示显示样式列表。
作为该电子文档信息片段的差异化显示方法的一种优选实施方式,其中,如上所述的电子文档信息片段的差异化显示方法,其特征在于,还包括默认样式存储步骤,在显示步骤显示显示样式列表之后,提示用户将显示样式作为默认样式。
附图说明
图1是电子文档信息片段处理系统的数据集成单元的架构示图;
图2是电子文档信息片段处理系统的数据集成单元中信息片段生成的交互图;
图3是信息片段区域在页面上差异化显示的交互图;
图4是电子文档信息片段处理系统的数据集成单元创建标准空间的展示区域的交互图;
图5是电子文档信息片段处理系统的数据集成单元移动标准空间的交互图;
图6是电子文档信息片段处理系统的数据集成单元扩大缩小标准空间的交互图;
图7是电子文档信息片段处理系统的数据集成单元合并或拆分标准空间的交互图;
图8是标准空间在电子文档信息片段处理系统的数据集成单元的不同展示层级中变换的交互图;
图9是标准空间在电子文档信息片段处理系统的数据集成单元空间初始化可加载应用交互图;
图10是标准空间在电子文档信息片段处理系统的数据集成单元空间不同状态切换交互图。
图11是示例中选择区域以及相关引文所对应的html代码。
图12是示例中信息片段内容和引文部分内容的示意图。
图13是示例中扩展区域里的标准空间静态展示图。
图14是示例中标准空间加载应用后的展示图。
具体实施方式
如图1所示,电子文档信息片段处理系统的数据集成单元由资源发布层、用户交互层和基础服务层三部分组成。用户交互层可分为区域生成模块、区域显示模块、空间扩展模块、空间整合模块、空间层级模块和空间标准化模块。
资源发布层主要实现对信息片段中有价值的部分进行提取整理,并以规范的方式输出,为用户或应用对信息片段的操作提供接口。资源发布层输出的部分包括信息片段的内容、信息片段的位置、信息片段的创建者、信息片段的上下文环境、信息片段的创建时间和访问时间以及信息片段的展示空间规划,涵盖信息片段所在区域的初始显示样式、信息片段扩展区域上加载应用所在的标准空间的初始布局等。 用户交互层主要实现数据集成单元与用户之间的即时反馈机制,为用户提供针对数据集成单元及用于盛放应用的标准空间的可视化操作。用户交互层涉及信息片段的可视化创建,数据集成单元区域内的差异化显示,在数据集成单元扩展区域上标准空间的多维度呈现,对于针对标准空间的操作做出即时化响应。基础服务层主要为数据集成单元提供数据的记录功能、数据的多种表示形式但适配获取功能和空间管理的基础功能,而且为针对数据集成单元的操作提供权限识别功能。
就资源发布层而言,它可分为位置信息模块、结构信息模块和域内信息模块。数据集成单元的位置信息分为三类:信息片段所在区域的文字坐标、数据集成单元扩展区域在电子文档上的显示位置和应用所在标准空间在扩展区域中的位置。信息片段所在区域的文字坐标由网络上电子文档位置标识和电子文档内文字坐标共同组成。当用户在网络上浏览某一电子文档过程中针对信息片段建立了数据集成单元,位置信息模块负责获取信息片段的文字坐标,当同一用户或其他用户在其他时刻或其他浏览器中重新打开同一网页,通过位置信息模块对文字坐标的解析实现定位到同一信息片段从而异步重建数据集成单元。在文字坐标的基础上,数据集成单元需要通过事先确定好的若干参考文档节点的位置来确定扩展区域在电子文档上的显示位置。标准空间部署在扩展区域上,应用需要了解空间在扩展区域上的位置在对应的标准空间中进行加载。
域内信息模块提供信息片段部分基本信息的访问和操作接口。域内信息模块涉及到的信息片段部分基本信息包括多媒体信息内容本身,文本信息片段的上下文,信息内容的长度,数据集成单元的创建者和创建时间。由于文本信息片段的限定长度,在传播的过程中需要有源出处的上下文作为补充提示内容,让阅读者方便地理解,提高信息传播的效率。信息内容长度的单位根据信息片段的类型有所不同,文本的长度单位为字符数,图片的长度单位为像素数,视频的长度单位为帧数。
结构信息模块提供信息片段展示区域空间规划的访问和操作接口,涉及信息片段所在区域的显示样式和信息片段上加载应用所在的 标准空间在扩展区域中的布局格式。除此之外,由于信息片段中可能会包含不完整的文档标签,也就是说,数据集成单元可能跨越多个文档节点,造成数据集成单元所在区域内和数据集成单元所在区域外的文档标签不闭合,结构信息模块负责数据集成单元的内结构完整化即补全区域内缺失的文档标签,在此过程中同时实现数据集成单元外的文档标签的闭合。
在基础服务层,数据集成单元保存有三类数据,一是信息片段的基本信息及附加信息,其具有共享属性,任何空间应用在申请相应权限后可访问可修改;二是用户数据,与用户相关的数据包括数据集成单元的扩展区域上空间布局、空间动态属性、涵盖可加载功能列表和应用配置在内的空间静态属性;三是应用数据,即空间中所加载应用的操作逻辑产生的数据结果。
信息片段基本信息涉及所在区域中的内容,所在区域的位置属性,上下文信息,创建者和创建时间。另外,附加信息包括数据集成单元区域的初始样式,扩展区域空间初始布局,数据集成单元访问者、相关的其他数据集成单元等。空间中的应用分为初始配置标准应用和用户选择添加应用。信息片段基本数据可以供所有用户下的空间应用申请权限后进行访问,而创建者的部分应用具有修改相关信息片段基本信息的权限,所有用户的初始配置标准应用具有修改相关信息片段附加信息的权限。空间应用可以依据具体场景将产生数据以私有数据或者共用数据形式存储,不同用户可以以共用数据部分形式在同一应用下进行通信。
除了数据存取服务,基础服务层还提供与空间相关的服务:空间静态属性配置模块和空间动态属性管理模块。
空间静态属性包括空间使用者,空间尺寸,空间位置,空间的上下文,空间数据来源,空间可加载功能列表和应用配置等。空间静态属性配置模块可根据空间使用者,空间尺寸,空间位置,空间上下文以及空间数据来源为空间确定可在其中使用的功能集合。用户通过空间标准化模块选择功能或者选择功能组或者组合功能形成有序功能组来定义空间中即将运行的应用。
进一步,空间的上下文由信息片段基本信息、信息片段上下文中的关键词和网页标题等组成。
空间的数据来源涉及到信息片段的基本信息和附加信息,当用户确定有序功能集并选择数据来源定制完成应用后,可以将形成的应用以应用配置的形式存储于用户数据。用户可以通过应用配置在不同的数据集成单元的空间中加载相同的应用。同时,空间的数据来源可以在多个用户的应用中共享,即用户对于信息片段基本信息或附加信息的操作结果可以在多个数据集成单元中一个或多个用户拥有的应用中同步展现。
空间动态属性包括空间运行状态和空间当前运行应用。空间动态属性管理模块可以记录空间在具体某一时刻下的各项静态属性值及动态属性。
进一步,空间运行状态包括空间输入状态、空间显示状态和空间空闲状态。当空间处于输入状态时,空间中当前运行应用可以通过空间标准化模块接收用户的输入信息并传送到基础服务层的数据记录模块进行保存。空间显示状态依据显示内容不同可分为信息片段基本信息状态、用户状态和应用状态。其中应用状态是指空间中显示内容为应用运行所得结果。依据空间显示方式的不同可分为静止状态、滚动状态和幻灯状态等多种形式。依据空间显示数据类型的不同可分为文字状态、图片状态和视频状态。
如图2所示,区域生成模块将信息片段的创建过程可视化。用户在页面的选取操作触发数据集成单元的区域生成模块,区域生成模块会获取用户的操作权限信息,并发送给基础服务层中的权限识别模块来判断用户是否具有创建数据集成单元,当用户被判定有创建数据集成单元权限时,区域生成模块会在用户选取操作的起点和终点生成选择开始指示符和选择结束指示符。当用户停止选取操作,区域生成模块会将选择开始指示符和选择结束指示符之间的内容作为信息片段,并将信息片段的内容,信息片段的位置,信息片段的创建者和创建时间以及提取出的信息片段上下文作为信息片段基本信息交给资源发布层中的结构信息模块和域内信息模块。结构信息模块会首先将信息 片段所对应的文档结构进行完整化操作,保证区域内和区域外的文档标签成对出现。而域内信息模块将信息片段的位置信息转化生成信息片段的文字坐标,在此之后形成标准的信息片段格式发送到基础服务层的数据记录模块进行保存。
如图3所示,区域显示模块突出展示数据集成单元中的信息片段,与周围数据区别呈现。当资源发布层将信息片段创建成功的消息发送到用户交互层或者已建立的数据集成单元在页面重建时,区域显示模块启动,通过资源发布层的结构信息模块获取区域的基本显示样式,并通过基础服务层的数据获取模块查询该用户名下是否存在个性化样式。如果存在多种样式,同时用户没有进行默认样式的设置,区域显示模块会收到显示样式列表,经过用户选择确定后将显示样式应用于信息片段,并提示用户是否将本次选择的显示样式作为默认样式。
如图4所示,当用户在信息片段的显示区域鼠标悬停时,会启动空间扩展模块。空间扩展模块会在信息片段的周围呈现可放置标准空间的扩展区域,并依据资源发布层的结构信息模块提供的基本布局格式或者基础服务层提供的用户自定义布局格式在扩展区域上排列标准空间。
扩展区域中的标准空间中可以盛放与数据集成单元相关的应用,当标准空间中没有加载应用时称为占位空间。用户可以通过用户交互层的空间整合模块进行标准空间的移动、扩大缩小并对占位空间进行拆分合并。另一方面,用户可以设置某些空间的位置和大小不能发生变化。如图5所示,当用户对某个标准空间在水平扩展区域中进行位置调整时,空间整合模块动态显示位置变化情况。如图6所示,当用户对某个标准空间进行缩小操作时,空间整合模块会在扩展区域空闲部分增加占位空间;而进行扩大操作时,空间整合模块会适当移除水平扩展区域中的占位空间。如图7所示,当用户对占位空间进行拆分合并操作时,空间整合模块动态显示操作后的空间布局。当用户完成对标准空间的扩大缩小操作或在本层扩展区域中完成对标准空间的移动操作或对占位空间的拆分合并操作后,空间扩展模块会获取水平扩展区域中空间集合的新布局格式,与资源发布层的结构信息模块中 当前的布局格式比较,如果两者不同,会通过基础服务层的数据记录模块保存新布局格式。
空间层级模块会在水平扩展区域的基础上覆盖层叠将扩展区域垂直化。空间整合模块的对于水平扩展区域中的标准空间的移动和扩大操作会导致一些标准空间在扩展区域的层级间变换。如图8所示,当标准空间被移动到水平扩展区域的层级转化处或者部分标准空间由于扩大操作进入相邻层级时,空间整合模块会在本层扩展区域的空闲部分增加占位空间,而空间层级模块会为进入层级的标准空间递归寻找合适的占位空间。如果找到,则会进行占位空间的替换操作;如果没有,则在层级最后建立新的层级用来放置标准空间。在处理完标准空间在层级间的变换后,资源发布层的结构信息模块会根据空间层级模块提供的发生变化层级信息更改变化层级的布局格式,而基础服务层的数据记录模块会记录变化后的层级布局格式。
如图9所示,当用户在扩展区域中增加新的空间时,空间标准化模块会询问用户是否加载标准应用集合。标准应用集合不受空间范围、空间上下文、空间数据来源和空间使用者等因素影响,可以在任意数据集成单元上加载的通用功能集。用户选择是否加载标准应用集合后,空间标准化模块从资源发布层获取信息片段基本信息,并将此附加添加空间的用户信息和空间的尺寸信息后发送到基础服务层。基础服务层的空间静态属性配置模块,从信息片段基本信息提取空间上下文属性,通过用户信息确定空间使用者属性。在已有的空间静态属性的约束下,基础服务层的空间静态属性配置模块在可用的应用库中确定符合要求的可加载功能列表。空间标准化模块向用户展示基础服务层返回的功能加载列表,用户可从功能候选列表中确定空间中当前运行的应用。
如图10所示,空间标准化模块通过确定可监听事件定义了用户与空间中所加载应用之间的基本交互方式。空间标准化模块可提供基本事件的响应和处理过程。以网页上的操作为例,空间标准化模块将提供两种基本事件:鼠标右键单击和鼠标左键单击。当用户在空间中单击鼠标右键,空间会进入菜单模式,空间标准化模块会向加载应用 发出应用运行可选状态列表请求,加载应用返回状态配置文件和事件配置文件,空间标准化模块通过事件配置文件扩展可监听事件集合,应用使得空间在基本事件响应的基础上具备更丰富的用户交互。当空间标准化模块加载了应用的状态配置文件,用户可以在这里通过空间标准化模块切换空间的运行状态,并进一步确定空间具体的显示状态或者输入状态。当用户在空间中单击鼠标左键,空间会根据设定的运行状态进入应用的输入模式或者详细数据显示模式。
下面将以网页作为电子文档的示例,将文字作为信息片段的载体对数据集成单元进行展示说明。
首先在浏览器中新打开网页上创建数据集成单元。这一过程的实施依赖于用户对于文字内容的选择。在本发明的帮助下,用户通过输入装置,本例中为鼠标,在网页的文字内容进行划取操作从而确定选择区域,具体来讲,即通过鼠标的按下和弹起确定选择区域的起始点和终止点,本发明会通过展示选择开始指示符和选择结束指示符来帮助用户确认区域范围。区域确定过程会涉及到数据集成单元的模块有用户交互层区域生成模块中的权限标志获取和选择指示符控制。
选择区域在用户确定之后可以开始数据集成单元的整理操作,涉及到的模块有资源发布层结构信息模块中的内结构完整化。本例中网页对应的源代码如下图所示,可以看到,选择区域中包含的源代码为“<a>信息之间结构化”,即选择区域内的标签元素没有成对出现,同时区域外的原成对标签元素也会存在缺少。通过内结构完整化的整理操作,使得区域内外的标签元素成对出现,避免出现差异化显示未覆盖到选择区域等数据集成单元后续操作的异常情况。
接下来,数据集成单元将提炼区域中的内容及区域属性,并节选区域外的内容,将两者组织起来形成信息片段的基本信息部分,涉及到的模块包括用户交互层区域生成模块中区域信息获取、资源发布层位置信息模块中内容坐标信息和资源发布层域内信息模块中创建相关信息获取、内容处理以及引文处理。图11展示了本例中选择区域以及相关引文所对应的html代码。通过区域生成模块,数据集成单元可以获取到选择区域中html代码“<a>信息之间结构化”和区域在 网页中的位置信息。进一步,假设网页的body元素为参照节点,数据集成单元通过内容坐标信息操作将区域位置信息转化为以body为参照节点的文字坐标,通过内容处理操作将html代码转化为文本“信息之间结构化”。另外,在本例中,提取区域外的内容与区域内的内容形成固定长度的文本内容,区域外的文本内容称为引文。同时,创建信息获取操作将当前用户作为数据集成单元的创建者并将获得创建者信息的时间记录为数据集成单元的创建时间。最终,区域内文本、区域外引文、区域文字坐标和创建信息通过基础服务层的数据存取功能保存为信息片段的基本信息。
在此基础上,用户交互层区域显示模块中的样式适配通过资源发布层结构信息模块的样式控制获取样式信息从而完成区域内内容的差异化显示。至此,数据集成单元创建完成。
图12中实线边框里的文字为信息片段内容,虚线边框里的文字为引文部分。当数据集成单元创建完成后,用户可以选择进入信息片段修订模式。此时重新显示开始指示符和结束指示符确定信息片段区域,用户可以依次调整开始指示符和结束指示符的位置,确定新信息片段;之后,重新计算区域外内容长度形成引文,同时会出现引文区域开始指示符和结束指示符,对于引文内容进行微调。
当用户非创建者第一次访问已创建的数据集成单元,暂称为A,由于用户没有在基础服务层的用户数据中保存有自定义布局设置,空间扩展模块会从信息片段的附加信息中获取默认空间布局以及基础应用如图13展现。
如图13,在展示的扩展区域中,包含有四个相同尺寸的标准空间,其中第一标准空间加载了创建者信息显示应用,处于空间显示状态;第二标准空间加载了访问签到应用,处于空间输入状态;第三标准空间尚未加载应用,处于空间空闲状态,第四标准空间为加载了可进行当前空间设置的应用,处于空间输入状态。
第一标准空间通过头像图片展现信息片段的创建者信息;通过单击第二标准空间执行签到操作,第二标准空间获取当前用户信息作为访问者保存在信息片段的附加信息中;本例中,在第三标准空间中加 载访问者信息展示的应用,在基础服务层为当前用户提供的适应于当前空间条件的——空间尺寸、空间位置和当前信息片段等,可加载功能列表中选择两项功能,其中第一项为获取数据集成单元访问者信息,第二项为统计用户数量,将这两项功能按顺序组装,另外确定第三标准空间数据来源为“信息之间结构化”信息片段的附加信息——访问者信息,从而形成要加载应用,并获取应用初始配置,加载完毕后第三标准空间处于空间显示状态,显示的是签到当前信息片段的访问者总数,如图14所示:
当其他用户在另外浏览器中打开相同网页时,本发明在“信息之间结构化”信息片段上重建数据集成单元,暂称为B,展现的是默认空间布局及应用,A和B共享相同的信息片段基本信息和附加信息。用户可以通过B上第二标准空间进行签到操作从而使得信息片段的访问者数量增加1,此时在已加载了访问者显示应用的数据集成平台A上的第三标准空间将展现已更新的访问者总数。
以上对本发明所提供的电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示方法进行了详细介绍。本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种电子文档信息片段的处理系统,其特征在于,以电子文档信息片段为基础建立数据集成单元。
2.如权利要求1所述的电子文档信息片段的处理系统,其特征在于,数据集成单元包括资源发布层,实现对信息片段的提取整理。
3.如权利要求2所述的电子文档信息片段的处理系统,其特征在于,数据集成单元的资源发布层包括用于获取信息片段文字坐标的位置信息模块、用于提供信息片段展示区域空间规划操作接口的结构信息模块和用于提供信息片段属性操作接口的域内信息模块。
4.如权利要求1所述的电子文档信息片段的处理系统,其特征在于,数据集成单元包括用户交互层,实现数据集成单元与用户之间的即时反馈。
5.如权利要求1所述的电子文档信息片段的处理系统,其特征在于,数据集成单元包括基础服务层,实现数据的存取。
6.一种电子文档信息片段的处理方法,其包括如下步骤,
数据集成单元建立步骤,用户浏览电子文档中针对信息片段建立数据集成单元,数据集成单元包括资源发布层、用户交互层和基础服务层;
位置信息获取步骤,获取信息片段的文字坐标;
坐标解析步骤,当用户重新打开同一电子文档,通过获取的位置信息进行坐标解析;
数据集成单元重建步骤,根据解析获取的坐标定位到同一信息片段,重建数据集成单元;
位置确定步骤,确定扩展区域在电子文档中的显示位置。
7.一种电子文档信息片段的生成方法,其特征在于,
用户触发步骤,获取用户操作权限信息并进行判断;
指示符生成步骤,根据用户操作的起点和终点生成开始指示符和结束指示符;
信息片段确定步骤,选择开始指示符和结束指示符之间的内容作为信息片段,并将信息片段基本信息发送到资源发布层;
坐标转化步骤,资源发布层将信息片段的位置信息转化为信息片段的文字坐标。
8.一种电子文档信息片段的差异化显示方法,其特征在于,
区域显示样式获取步骤,信息片段创建成功之后获取区域显示样式;
个性化显示样式获取步骤,通过基础服务层查询当前用户名下的个性化样式;
显示步骤,根据个性化显示样式或者区域显示样式加以显示,如果没有个性化显示样式,展示显示样式列表。
CN201410301570.4A 2014-06-27 2014-06-27 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法 Active CN104036028B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410301570.4A CN104036028B (zh) 2014-06-27 2014-06-27 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410301570.4A CN104036028B (zh) 2014-06-27 2014-06-27 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法

Publications (2)

Publication Number Publication Date
CN104036028A true CN104036028A (zh) 2014-09-10
CN104036028B CN104036028B (zh) 2018-02-06

Family

ID=51466798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410301570.4A Active CN104036028B (zh) 2014-06-27 2014-06-27 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法

Country Status (1)

Country Link
CN (1) CN104036028B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462219A (zh) * 2014-11-10 2015-03-25 吴涛军 一种信息代理接口及基于该信息代理接口的应用系统
CN107784000A (zh) * 2016-08-26 2018-03-09 腾讯科技(深圳)有限公司 一种标签页展示方法、浏览器及用户设备
CN111144070A (zh) * 2019-12-31 2020-05-12 北京迈迪培尔信息技术有限公司 一种文档解析翻译方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493843A (zh) * 2009-02-20 2009-07-29 赵翼鹏 一种对网页中的文章进行评注的方法及服务器
CN102023987A (zh) * 2009-09-15 2011-04-20 阿里巴巴集团控股有限公司 一种web文档处理方法及其装置
US20120102390A1 (en) * 2009-12-10 2012-04-26 Huawei Technologies Co., Ltd. Method and apparatus for generating widget

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493843A (zh) * 2009-02-20 2009-07-29 赵翼鹏 一种对网页中的文章进行评注的方法及服务器
CN102023987A (zh) * 2009-09-15 2011-04-20 阿里巴巴集团控股有限公司 一种web文档处理方法及其装置
US20120102390A1 (en) * 2009-12-10 2012-04-26 Huawei Technologies Co., Ltd. Method and apparatus for generating widget

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462219A (zh) * 2014-11-10 2015-03-25 吴涛军 一种信息代理接口及基于该信息代理接口的应用系统
CN104462219B (zh) * 2014-11-10 2019-06-18 吴涛军 一种信息代理接口及基于该信息代理接口的应用系统
CN107784000A (zh) * 2016-08-26 2018-03-09 腾讯科技(深圳)有限公司 一种标签页展示方法、浏览器及用户设备
CN107784000B (zh) * 2016-08-26 2021-06-29 腾讯科技(深圳)有限公司 一种标签页展示方法、浏览器及用户设备
CN111144070A (zh) * 2019-12-31 2020-05-12 北京迈迪培尔信息技术有限公司 一种文档解析翻译方法和装置
CN111144070B (zh) * 2019-12-31 2023-08-01 北京迈迪培尔信息技术有限公司 一种文档解析翻译方法和装置

Also Published As

Publication number Publication date
CN104036028B (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
CN101882162B (zh) 一种网络信息推送方法及系统
CN102915237B (zh) 根据用户应用程序要求改写数据质量规则的方法和系统
US10366154B2 (en) Information processing device, information processing method, and computer program product
US20130326333A1 (en) Mobile Content Management System
CN104834753A (zh) 生成网页截图的方法及其装置
CN104714948A (zh) 一种回放用户网页操作行为的方法、系统及热图展现装置
CN102137306B (zh) 在电视上显示网页内容的方法及装置
CN103164525B (zh) Web应用发布方法和装置
CN107368511A (zh) 一种信息展示方法及装置
CN111338690A (zh) 小程序店铺页面配置方法、装置、计算机设备和存储介质
CN101622619A (zh) 用于导航和可视化关系数据库和/或多维数据库中的数据的方法和系统
CN104321743A (zh) 用于开发在通信网络上查询内容和服务的应用程序的方法和系统
CN106407199A (zh) 网络文章评论处理方法及装置
CN102163193A (zh) 超链接地图信息系统
CN112699295A (zh) 一种网页内容推荐方法、装置和计算机可读存储介质
CN107122185A (zh) 一种针对配电网参数类信息可视化展现方法
CN103475676A (zh) 一种用于提供页面主体信息的方法、装置、设备和系统
CN104036028A (zh) 一种电子文档信息片段的处理系统与电子文档信息片段的生成、处理、差异化显示的方法
CN106649518A (zh) 动态信息数据处理的方法和装置
US10210001B2 (en) Automatic execution of objects in a user interface
CN101950289A (zh) 一种应用网页语义的方法和系统
CN103246691A (zh) 文档管理系统及其方法
CN110413765A (zh) 一种海量数据集分析和展示的交互式系统及其方法
CN105578294B (zh) 浏览切换处理方法、装置及系统
CN102708167B (zh) 一种针对高分辨率SAR影像解译的基于Web的语义标注系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Yuhua Road, Qinhuai District of Nanjing City, Jiangsu province 210000 No. 22 treasure garden 22-302

Applicant after: Wu Taojun

Address before: 200000 West Yan'an Road 900 Road, Changning District, Shanghai

Applicant before: Wu Taojun

GR01 Patent grant
GR01 Patent grant