一种引用注释处理方法和系统
技术领域
本发明涉及一种引用注释处理方法和系统,属于计算机文字数据处理领域。
背景技术
版式文件在自定义的坐标系中,明确记录了每个文档源数据显示的位置和尺寸等,从而使文档打印出的结果和在计算机上浏览的结果一致,而且在任何计算机环境下都具有显示一致性,保证文档的原版原式。由于版式文件的“稳定”性,非常适合作为电子文档的最终发布和传播的形式,广泛用于电子公文、电子书、电子期刊、电子报纸等领域。
在版式文档中引用注释是指针对版式页面上某一个或者某一系列的页面元素进行注解,注解内容可以是版式页面的任意元素的集合,注解内容和被注解的页面元素在版式页面的位置上是不受任何限制的,甚至可以跨页。
在版式文档中,引用注释的存储方式与一些线条和文字的简单图元排列无异,并没有明确的逻辑结构。这种表示方式在遇到显示设备屏幕尺寸受限的情况时会出现问题,显示设备没有足够的信息对表示引用注释的图元进行处理,因此无法生成效果合理的显示结果。
多数显示设备采取简单的处理方式,现有技术中普遍采用的是不针对引用注释的情况做任何特殊处理,根据版面理解的结果生成自然的逻辑结构信息,从而实现版式文档内容的流式重排。但是这种方法会导致版式文档中的引用注释在流式重排后出现可读性极低的情况,因为此方法生成的重排结果中注释内容与被注释的对象在逻辑上往往并不相邻,导致注释内容出现在不该出现的位置,影响阅读体验。
发明内容
本发明所要解决的技术问题是现有技术中版式文档的流式重排中缺乏引 用注释逻辑结构,导致版式文档在屏幕尺寸受限的显示设备上被显示时,无法合理处理其中的引用注释数据,从而提供一种完善的引用注释处理方法和系统,使得引用注释保持版式描述不变的情况下,又能够在显示受限的情况下进行保持引用注释逻辑结构的重排。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种引用注释处理方法,包括以下步骤:
构建步骤,构建注释内容信息与其对应的引用注释的逻辑结构信息;
预先标注步骤,对文档中触发引用注释的位置进行预先标注,并建立注释的位置与所述注释内容信息的映射;
调取步骤,接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。
所述的引用注释处理方法,所述构建注释内容信息与其对应的引用注释的逻辑结构信息的过程,包括:
通过版面分析方法获得引用注释及其注释内容的数据,通过编辑和调整建立注释内容信息与其对应的引用注释的逻辑结构信息,并将所述逻辑结构信息保存在显示块中。
所述的引用注释处理方法,在所述逻辑结构信息中,将引用注释的逻辑结构与其对应的注释内容通过唯一编号进行关联。
所述的引用注释处理方法,所述注释内容在文档排版后不进行显示,在接收到预先标注位置的触发动作后显示注释内容。
所述的引用注释处理方法,所述构建注释内容信息与其对应的引用注释的逻辑结构信息的过程中,还包括进入当前页面后,收集该页面内预先标注的位置信息及引用注释信息的过程。
所述的引用注释处理方法,所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置。
一种引用注释处理系统,包括:
构建单元,构建注释内容信息与其对应的引用注释的逻辑结构信息;
预先标注单元,对文档中触发引用注释的位置进行预先标注,并建立注释的位置与所述注释内容信息的映射;
调取单元,接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。
所述的引用注释处理系统,所述构建单元中,包括构建子单元,用于通过版面分析方法获得引用注释及其注释内容的数据,通过编辑和调整建立注释内容信息与其对应的引用注释的逻辑结构信息,并将所述逻辑结构信息保存在显示块中。
所述的引用注释处理系统,在所述逻辑结构信息中,将引用注释的逻辑结构与其对应的注释内容通过唯一编号进行关联。
所述的引用注释处理系统,还包括显示单元,所述注释内容在文档排版后不进行显示,在接收到预先标注位置的触发动作后显示注释内容。
所述的引用注释处理系统,包括收集单元:进入当前页面后,收集该页面内预先标注的位置信息及引用注释信息的过程。
所述的引用注释处理系统,所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明所述的一种引用注释处理方法和系统,构建注释内容信息与其对应的引用注释的逻辑结构信息;对文档中触发引用注释的位置进行预先标注,并建立注释的位置与所述注释内容信息的映射;接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。由于现有技术中普遍采用的是不针对引用注释的情况做任何特殊处理,根据版面理解的结果生成自然的逻辑结构信息,从而实现版式文档内容的流式重排。但是这种方法会导致版式文档中的引用注释在流式重排后出现可读性极低的情况,因为此方法生成的重排结果 中注释内容与被注释的对象在逻辑上往往并不相邻,导致注释内容出现在不该出现的位置,影响阅读体验。本发明所述的引用注释处理方法,很好的克服了上述现有技术中的技术问题,通过构建逻辑结构信息,并在流式排版的结果上,对文档中触发引用注释的位置进行预先标注,在引用注释的位置通过出发动作可实现对其注释内容信息的调用和显示,使得引用注释保持版式描述不变的情况下,又能够在显示受限的情况下进行保持引用注释逻辑结构的重排,大大提高了引用注释部分的可阅读性。
(2)本发明所述的一种引用注释处理方法和系统,通过版面分析方法获得引用注释及其注释内容的数据,通过编辑和调整建立注释内容信息与其对应的引用注释的逻辑结构信息,并将所述逻辑结构信息保存在显示块中,由于自动获取的版面信息有很多信息不完整或者不准确,因此需要人工编辑和调整、修改来建立逻辑结构信息,这样才能让逻辑结构信息的内容更准确。
(3)本发明所述的一种引用注释处理方法和系统,所述注释内容在文档排版后不进行显示,在接收到预先标注位置的触发动作后显示注释内容,这样在排版时就不需要对注释内容再重新显示,节约了版面。
(4)本发明所述的一种引用注释处理方法和系统,所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置,注释内容信息在用户需要的情况下,根据预先定义的触发方式,通过用户的触发动作来显示,提高了用户的可操作性和目的性,让排版实现更加人性化。
(5)本发明所述的一种引用注释处理方法和系统,还包括收集单元,进入当前页面后,收集该页面内预先标注的位置信息及引用注释信息的过程。这样,当进入该页面后即进行了预先标注位置和引用注释信息的收集,当用户选择某个位置执行出发动作后,可以很快的将注释内容显示出来。通过预先收集的方式,将不属于本页内的引用注释不需要收集,减少了本页面进行引用注释标注时的处理数据量,提高了效率。
附图说明
为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明,其中,
图1是本发明所述一种引用注释处理方法的一个实施例的流程图;
图2是本发明所述一种引用注释处理方法中一个实施例中注释的整体结构图;
图3、图4本发明所述一种引用注释处理方法的一个实施例中的步骤中的示意图。
具体实施方式
下面提供本发明所述的一种引用注释处理方法和系统的具体实施方式。
实施例1
本发明所述的一种引用注释处理方法的流程图如图1所示,包括以下步骤:
(1)构建步骤,构建注释内容信息与其对应的引用注释的逻辑结构信息;在所述构建步骤中,通过版面分析方法获得引用注释及其注释内容的数据,然后采用人工调整的方式核对并编辑引用注释的逻辑结构和源版式描述信息,将引用注释的逻辑结构与其对应的注释内容通过唯一编号进行关联。这样通过自动获取、人工调整的方式,在保证效率的同时提高了信息的准确性和可编辑性,这样就构建了注释内容与其对应的引用注释的逻辑结构信息,并将所述逻辑结构信息保存在显示块中。由于自动获取的版面信息有很多信息不完整或者不准确,因此需要人工编辑和调整、修改来建立逻辑结构信息,这样才能让逻辑结构信息的内容更准确。
(2)预先标注步骤,在流式排版的结果上,对文档中触发引用注释的位置进行预先标注,并建立引用注释的位置与所述注释内容信息的映射。
(3)调取步骤,接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置, 注释内容信息在用户需要的情况下,根据预先定义的触发方式,通过用户的触发动作来显示,提高了用户的可操作性和目的性,让排版实现更加人性化。
作为优选的实施方式,在使用上述引用注释处理方法时,在排版时对所述注释内容在文档排版后不进行显示,先将注释部分忽略并保存,显示其他部分,再根据预先标注的位置的触发动作显示注释内容。这样,所述注释内容在文档排版后不进行显示,在接收到预先标注位置的触发动作后显示注释内容,这样在排版时就不需要对注释内容再重新显示,节约了版面。
在另外的实施例中,在所述构建步骤中,对存在明显标识信息的引用注释可以进行直接解析,此处明显的标识信息指版式文档中某元素存在明显指向对应注释的标识符号(如上标,下标等),对应注释内容处也有明显响应此标识符号的显示(如论文中参考文献角标的应用),这样标识符号和注释内容存在明显的对应关系,此时,可以直接解析到。其他情况通过接受人工调整的方式获取引用注释的逻辑结构和源版式描述信息。而且在引用注释的直接获取中,自动识别系统难免出错或者遗漏,这时也需要接受人工调整的方式来进行修正。通过自动识别、人工调整的方式,提高了处理效率且保证了准确度
实施例2
一种引用注释处理系统,包括:
构建单元,构建注释内容信息与其对应的引用注释的逻辑结构信息。其中还包括构建子单元,用于通过版面分析方法获得引用注释及其注释内容的数据,通过编辑和调整建立注释内容信息与其对应的引用注释的逻辑结构信息,并将所述逻辑结构信息保存在显示块中。在所述逻辑结构信息中,将引用注释的逻辑结构与其对应的注释内容通过唯一编号进行关联。所述构建单元中,还包括人工调整单元,通过人工调整的方式核对并编辑引用注释的逻辑结构和源版式描述信息。由于自动获取的版面信息有很多信息不完整或者不准确,因此需要人工编辑和调整、修改来建立逻辑结构信息,这样才能让逻辑结构信息的内容更准确。
预先标注单元,在流式排版的结果上,对文档中触发引用注释的位置进行预先标注,并建立注释的位置与所述注释内容信息的映射。通过标注的方式可以更好的将其关系对应起来,便于以后根据需要提取。
调取单元,接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置。所述触发动作类型自定义设置,所述显示注释内容信息的方式也自定义设置,注释内容信息在用户需要的情况下,根据预先定义的触发方式,通过用户的触发动作来显示,提高了用户的可操作性和目的性,让排版实现更加人性化。
作为优先的实施方式,所述的引用注释处理系统,还包括显示单元,所述注释内容在文档排版后不进行显示,在接收到预先标注位置的触发动作后显示注释内容。
作为其他的实施方式,所述引用注释处理系统还包括收集单元,进入当前页面后,收集该页面内预先标注的位置信息及引用注释信息的过程。这样,当进入该页面后即进行了预先标注位置和引用注释信息的收集,当用户选择某个位置执行出发动作后,可以很快的将注释内容显示出来。通过预先收集的方式,将不属于本页内的引用注释不需要收集,减少了本页面进行引用注释标注时的处理数据量,提高了效率。
由于现有技术中普遍采用的是不针对引用注释的情况做任何特殊处理,根据版面理解的结果生成自然的逻辑结构信息,从而实现版式文档内容的流式重排。但是这种方法会导致版式文档中的引用注释在流式重排后出现可读性极低的情况,因为此方法生成的重排结果中注释内容与被注释的对象在逻辑上往往并不相邻,导致注释内容出现在不该出现的位置,影响阅读体验。本发明所述的引用注释处理系统,很好的克服了上述现有技术中的技术问题,通过构建逻辑结构信息,并在流式排版的结果上,对文档中触发引用注释的位置进行预先标注,在引用注释的位置通过出发动作可实现对其注释内容信息的调用和显示,使得引用注释保持版式描述不变的情况下,又能够在显示 受限的情况下进行保持引用注释逻辑结构的重排,大大提高了引用注释部分的可阅读性。
实施例3
本实施例中给出一种引用注释处理方法,所述引用注释处理方法针对的是版式文档进行流式重排时,对引用注释部分的特殊重排方式。
此处所述的版式文档也叫版式文件,又叫版面固定文档,其特点是在不同设备和阅读软件上具有显示结果的一致性。它在自定义的坐标系中,明确地指定了每个文档内容显示的位置,尺寸等,保证真实的重现文档的原貌,这是一系列文档页面对象描述方式的统称。而此处所说的流式重排指的是根据显示设备屏幕的大小对版式文件的内容重新进行排版,相关技术现有技术中已经有较多的公开技术。流式排版核心算法的功能是,给出指定形状的显示区域,向区域内绘制由各种图元对象(文字,图片为主)混排的数据流,使得数据流在绘制过程中遇到限制区域边缘时,如果下一个图元绘制将越界,则自动切换到下一行继续输出。所述流式排版算法的基本思路是,算法每次绘制图元的一个最小粒度单位,即一幅图片或文字对象中的一个文字,在绘制前取出该对象的尺寸并判断与当前行剩余空白宽度的大小关系,如果宽度不够则换行,否则输出,输出结束后继续判断下一个图元。
本实施例中的引用注释处理方法,是当系统实现了较为完善的流式排版核心算法之后,采用本实施例中的注释重排方法,来处理引用注释部分的重排。
引用注释在版式文件上的表现形式就是一些线条和文字等简单图元的排列,并没有明确的逻辑结构。于是需要定义一套适合流式重排的引用注释结构,在不影响版式阅读效果的情况下实现流式重排。
本实施例中给出一种引用注释处理方法,具体过程如下:
第一,首先构建注释内容信息与其对应的引用注释的逻辑结构信息。引用注释的逻辑结构信息主要描述页面中注释内容为某些图元的注释(例如脚注、尾注)的逻辑结构信息。
图2给出了本设计中引用注释的逻辑结构信息的整体结构图,在图中的 标签所表示的数据信息如下表所1示:
图3是本发明的引用注释的逻辑结构信息的描述生成系统示意图,引用注释的逻辑结构信息中的数据生成系统通过以下过程生成:
1)源文档解析。
读取待转换的引用注释源文件内容,通过已知的版面理解等方法解析并获得其中关于引用注释的数据,此时可解析的只是存在明显标识对的引用注释,其它情况只能通过人工调整的方式获取。
2)版式描述生成。
将原版式描述转化为本实施例中的版式描述方法,其中包括,为每个图元描述增加唯一编号,便于引用。
3)流式描述生成,通过现有技术中的分析方法,将版式描述转化为流式描述。
4)人工调整模块。引用注释的获取必然存在着一定的误差,自动识别系统难免出错或者遗漏,故需要人工修正步骤1)-3)中出现的错误。如果没有进行识别工作提取,则按照本发明的树形结构人工添加一套逻辑信息给引用注释。
第二、进行信息关联,也就是在流式排版的结果上,对文档中触发引用 注释的位置进行预先标注,并建立引用注释的位置与所述注释内容信息的映射。用图元唯一编号为逻辑信息和版式描述信息添加关联,将版式中引用注释的相关内容利用唯一的图元编号储存到相应位置的逻辑结构中。通过建立关联,将引用注释的位置进行标注,获得引用注释的位置与所述注释内容信息的映射。这样,通过读取引用注释逻辑结构信息,获得引用注释逻辑结构和对应的版式描述信息。
第三、接收到预先标注位置的触发动作后,调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息。当版式文档进行流式重排后,被引用图元重排后展现在显示设备上,忽略注释部分,其中可以触发注释的位置已经被标注,在被引用图元的显示范围内均可触发其注释事件,保存当前可显示页面的所有可触发区域位置信息以及对应的注释内容的映射。触发注释事件后通过逻辑结构信息以及信息关联中保存的出阀位置信息查询对应的注释内容信息,通过自定义的方式处理注释信息(如显示在需要注释的引用旁边等),如图4所示。
实施例4
在实施例3的基础上,对展示情况再此进一步说明。在以上实施例所述的调取所述逻辑结构信息中与引用注释对应的标注内容信息,并按照预设方式显示注释内容信息中,当进入预先标注位置(也就是触发区域)时,可通过用户自定义设置的方式触发引用注释,并根据用户自定义设置的方式呈现引用注释。
下面给出一个具体设定的触发实施例:
对于触摸屏的电子设备(如触屏电脑、触屏手机、ipad等),用触摸笔或手在页面上滑动,当手第一次在当前页面滑动时,收集所有可触发的位置信息以及对应的引用注释信息;
手滑动的过程不断判断当前点是否落在可触发的位置区域,如果进入触发区域,并且在单击此区域后触发引用注释;触发后,收集目标区域的注释信息并通过弹出窗口展现。
在上述实施例中,触发方式是开放式的,用户可以任意定义其他触发方式,并且可以设定触发之后的显示方式。如通过鼠标的方式。
实施例5
作为另外的一个实施方式,一种引用注释处理方法,包括如下步骤:
第一、在生成流式信息的过程中,需要加入引用注释定义,并主要通过人工调整完成引用注释的逻辑结构信息的填充。在前文的排版算法中,只有文字块和非文字块,本实施例中在此基础上加入了引用注释块。在排版过程中如果遇到引用注释块,与其它普通类型的块具有相同的处理方式,唯一不同的是排版的结果忽略注释部分,并将其保存。
第二、排版完成后获取当前引用注释块的位置信息并与之前缓存的注释部分绑定,在流式排版的结果上,对文档中触发引用注释的位置进行预先标注,并建立引用注释的位置与所述注释内容信息的映射。
第三、完成整个页面的排版后,用户可以在排版结果的页面活动,典型的就是鼠标在页面上滑动,当鼠标第一次进入当前排版页面时,收集所有上步骤中的位置信息以及对应的注释信息;鼠标滑动的过程不断判断当前点是否落在标注的位置区域,如果进入触发区域,则鼠标变为手型并且在单击此区域后触发引用注释(触发方式是开放式的,用户可以任意定义);触发后,收集目标区域的注释信息并根据用户自定义的方式呈现。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘 存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。