CN113761833A - 一种文档内容的显示方法、装置及设备 - Google Patents

一种文档内容的显示方法、装置及设备 Download PDF

Info

Publication number
CN113761833A
CN113761833A CN202110935379.5A CN202110935379A CN113761833A CN 113761833 A CN113761833 A CN 113761833A CN 202110935379 A CN202110935379 A CN 202110935379A CN 113761833 A CN113761833 A CN 113761833A
Authority
CN
China
Prior art keywords
image
information
document
extracting
turning operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110935379.5A
Other languages
English (en)
Inventor
李刚
刘博�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202110935379.5A priority Critical patent/CN113761833A/zh
Publication of CN113761833A publication Critical patent/CN113761833A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种文档内容的显示方法、装置及设备,该方法包括:获取用户输入的对文档进行翻屏操作的指令;根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;在当前界面上显示第一公用信息;通过实施本发明,当一个表格或一张图像被分隔成两部分,设置在两个页面上时,用户翻到表格或图像后面的内容的时候,该表格或图像的公用信息会显示在当前界面上,使得该表格或图像的公用信息始终可见,可以提高用户体验。

Description

一种文档内容的显示方法、装置及设备
技术领域
本申请涉及文档内容显示技术领域,尤其涉及一种文档内容的显示方法、装置及设备。
背景技术
在阅读word、pdf等文档的时候,时常会碰到由于文档中表格的内容太多或图片的尺寸太大,表格或图像被分隔成两部分,设置在两个页面上。当我们通过电子设备阅读这样的表格或图像时,在当前界面上,无法完整地显示表格或图像。当用户翻到表格或图像后面的内容的时候,表格的表头或图像的主题会消失,如果用户想要查看表格的表头或图像的主题时,需要切换文档的页面,降低了用户体验。
发明内容
有鉴于此,本发明实施例通过提供一种文档内容的显示方法、装置及设备,用以解决现有技术中一个表格或一张图像被分隔成两部分,设置在两个页面上,当用户翻到表格或图像后面的内容的时候,如果用户想要查看表格的表头或图像的主题时,需要切换文档的页面,降低了用户体验的问题。
为了解决上述问题,第一方面,本发明实施例提供了一种文档内容的显示方法,包括:获取用户输入的对文档进行翻屏操作的指令;根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;在当前界面上显示第一公用信息。
可选地,在获取用户输入的对文档进行翻屏操作的指令之前,文档内容的显示方法还包括:识别文档中当前界面显示的第二表格或第二图像;提取第二表格或第二图像的第二特征信息和第一公用信息。
可选地,获取与第一特征信息对应的第一公用信息,包括:查找到与第一特征信息满足相似条件的第二特征信息;查找到与第二特征信息对应的第一公用信息。
可选地,在提取第一表格或第一图像的第一特征信息之后,文档内容的显示方法还包括:提取第一表格或第一图像的第二公用信息;在判定第二公用信息不存在的情况下,获取与第一特征信息对应的第一公用信息。
可选地,第一公用信息和第二公用信息均包括表格表头和表格主题,或图像主题。
可选地,提取第二表格或第二图像的第一公用信息,或提取第一表格或第一图像的第二公用信息,包括:对第一表格或第一图像,或第二表格或第二图像进行文字识别,得到识别结果;根据识别结果确认第一表格或第一图像,或第二表格或第二图像包括注释信息的情况下,提取注释信息,得到表格主题或图像主题;根据识别结果确认第一表格或第二表格的第一行包括特定字体或特定字符的情况下,提取第一表格或第二表格的第一行内容,得到表格表头。
可选地,提取第一表格或第一图像的第一特征信息,或提取第二表格或第二图像的第二特征信息,包括:对第一表格或第一图像,或第二表格或第二图像进行文字识别,得到识别结果;根据识别结果对第一表格或第一图像,或第二表格或第二图像进行语义分析,得到对应的第一特征信息或第二特征信息。
可选地,在当前界面上显示第一公用信息之后,文档内容的显示方法还包括:获取用户对第一公用信息的移动操作;根据移动操作,将第一公用信息进行移动。
第二方面,本发明实施例提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行如第一方面或第一方面任意实施方式中的文档内容的显示方法。
第三方面,本发明实施例提供了一种文档内容的显示装置,包括:第一分析单元,用于获取用户输入的对文档进行翻屏操作的指令;提取单元,用于根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取单元,用于获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;显示单元,用于在当前界面上显示第一公用信息。
本发明实施例提供的文档内容的显示方法、装置及设备,通过获取用户输入的对文档进行翻屏操作的指令;根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;在当前界面上显示第一公用信息;从而当一个表格或一张图像被分隔成两部分,设置在两个页面上时,用户翻到表格或图像后面的内容的时候,该表格或图像的公用信息会显示在当前界面上,使得该表格或图像的公用信息始终可见,可以提高用户体验。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本发明实施例中一种文档内容的显示方法的流程示意图;
图2为本发明实施例中当前界面显示的第三表格的示意图;
图3为本发明实施例中当前界面显示的第四表格的示意图;
图4为本发明实施例中一种文档内容的显示装置的结构示意图;
图5为本发明实施例中一种电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种文档内容的显示方法,如图1所示,包括:
S101.获取用户输入的对文档进行翻屏操作的指令;具体地,翻屏可以是对文档进行向前翻屏,使用户能够阅读到文档前一屏的内容;也可以是对文档进行向后翻屏,使用户能够阅读到文档后一屏的内容。文档可以包括word文档、pdf文档、ppt文档等。当文档被打开后,可以实时对文档中当前界面显示的内容进行分析,把当前界面的核心内容提炼出来,核心内容包括(a)表格表头和表格主题,或图像的主题,也即公用信息;(b)表格或图像的核心内容的概括信息,也即特征信息。当用户阅读完文档中当前界面显示的内容后,可以进行翻屏操作,则可以获取到用户输入的对文档进行翻屏操作的指令。
S102.根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;具体地,根据指令可以对文档进行翻屏操作,翻屏操作后,可以继续对文档当前界面显示的内容进行分析,当文档中当前界面显示的内容包括第一表格或第一图像时,识别出文档中当前界面显示的第一表格或第一图像,然后提取第一表格或第一图像的第一特征信息。第一特征信息为第一表格或第一图像的核心内容的概括信息。
S103.获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;具体地,第一公用信息包括表格表头和表格主题,或图像主题。提取到第一表格或第一图像的第一特征信息后,可以从翻屏操作前提取到的核心内容中查找与第一特征信息对应的第一公用信息。
S104.在当前界面上显示第一公用信息。具体地,查找到与第一特征信息对应的第一公用信息后,可以在当前界面上显示第一公用信息,可以通过悬浮窗的形式在当前界面上显示第一公用信息,第一公用信息可以显示在屏幕的上方,也可以显示在屏幕的下方。从而,在第一表格或第一图像,与第二表格或第二图像具有相同或匹配的第一特征信息的情况下,前一屏或前几屏的第二表格或第二图像的第一公用信息可以在当前屏上显示,可以使得被分隔成两部分,设置在两个页面上的一个或表格或一个图像的公用信息在两个页面上均可见。
本发明实施例提供的文档内容的显示方法,通过获取用户输入的对文档进行翻屏操作的指令;根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;在当前界面上显示第一公用信息;从而当一个表格或一张图像被分隔成两部分,设置在两个页面上时,用户翻到表格或图像后面的内容的时候,该表格或图像的公用信息会显示在当前界面上,使得该表格或图像的公用信息始终可见,可以提高用户体验。
在一个可选的实施例中,在步骤S101,获取用户输入的对文档进行翻屏操作的指令之前,文档内容的显示方法还包括:识别文档中当前界面显示的第二表格或第二图像;提取第二表格或第二图像的第二特征信息和第一公用信息。
具体地,可以实时对文档中当前界面显示的内容进行分析,在翻屏操作前,当文档中当前界面显示的内容包括第二表格或第二图像时,可以识别出文档中当前界面显示的第二表格或第二图像,然后提取第二表格或第二图像的第二特征信息和第一公用信息。第二特征信息为第二表格或第二图像的核心内容的概括信息。
在本发明实施例中,在翻屏操作前,通过识别文档中当前界面显示的第二表格或第二图像,提取第二表格或第二图像的第二特征信息和第一公用信息,可以获取到翻屏时当前屏显示的第二表格的或第二图像的第二特征信息和第一公用信息,从而可以在下一屏显示与第二表格或第二图像相关联的第一表格或第一图像时,将第一公用信息显示在下一屏上,可以便于用于用户阅读,提高用户体验。
在一个可选的实施例中,步骤S103,获取与第一特征信息对应的第一公用信息,包括:查找到与第一特征信息满足相似条件的第二特征信息;查找到与第二特征信息对应的第一公用信息。
具体地,由于第一特征信息为第一表格或第一图像的核心内容的概括信息,第二特征信息为第二表格或第二图像的核心内容的概括信息,因此,如果第一表格与第二表格为同一个表格,或第一图像与第二图像为同一个图像时,第一特性信息应该与第二特征信息匹配,第一特征信息与第二特征信息相似或相同,则可以通过第一特性信息查找到第二特征信息,然后再查找到与第二特征信息对应的第一公用信息。
在本发明实施例中,通过查找到与第一特征信息满足相似条件的第二特征信息,从而可以快速查找到与第一特征信息对应的第一公用信息,进而可以在当前界面上显示第一公用信息,使得同一个表格或同一张图像的公用信息始终可见,提高用户体验。
在一个可选的实施例中,在步骤S102,提取第一表格或第一图像的第一特征信息之后,文档内容的显示方法还包括:提取第一表格或第一图像的第二公用信息;在判定第二公用信息不存在的情况下,获取与第一特征信息对应的第一公用信息。
具体地,翻屏操作后,当文档中当前界面显示的内容包括第一表格或第一图像时,除了提取第一表格或第一图像的第一特征信息,还可以提取第一表格或第一图像的第二公用信息,判断第一表格或第一图像的第二公用信息是否存在。第二公用信息包括表格表头和表格主题,或图像主题。如果第二公用信息存在,说明当前界面显示的第一表格或第一图像具有表格表头和表格主题,或图像主题,在当前界面上,不需要将第二表格或第二图像的第一公用信息进行显示。如果第二公用信息不存在,说明当前界面显示的第一表格或第一图像不具有表格表头和表格主题,或图像主题,则可以获取与第一特征信息对应的第一公用信息,在当前界面上显示第一公用信息。
在本发明实施例中,通过提取第一表格或第一图像的第二公用信息,在判定第二公用信息不存在的情况下,才获取与第一特征信息对应的第一公用信息,从而可以使得第一表格或第一图像的第二公用信息存在的情况下,不在当前界面显示第二表格或第二图像的第一公用信息,减少第一公用信息不必要的显示。
在一个可选的实施例中,提取第二表格或第二图像的第一公用信息,或提取第一表格或第一图像的第二公用信息,包括:对第一表格或第一图像,或第二表格或第二图像进行文字识别,得到识别结果;根据识别结果确认第一表格或第一图像,或第二表格或第二图像包括注释信息的情况下,提取注释信息,得到表格主题或图像主题;根据识别结果确认第一表格或第二表格的第一行包括特定字体或特定字符的情况下,提取第一表格或第二表格的第一行内容,得到表格表头。
具体地,特定字体包括加粗字体,特定字符包括序号、数字、编号等。在提取第一公用信息或第二公用信息时,可以对第一表格或第一图像,或第二表格或第二图像进行文字识别。由于表格的主题属于注释信息,一般出现在表格的上方,图像的主题也属于注释信息,出现在图像的上方或下方,因此,当识别到注释信息的时候,可以提取该注释信息,得到表格主题或图像主题。对于表头,一般设置在表格的第一行,并进行加粗显示。可以对表格中的文字进行下述处理:1.当检测到加粗字体的时候,给加粗字体进行加分,然后进行权重的比较,权重最大的一行或一列为表格表头;2.设置一些默认的关键字,例如序号、数字、编号等,如果检测到表格的第一行包括这些关键字,表格的第一行为表格表头;通过上述处理,可以提取到表格表头。
由于文字识别的技术已经相当成熟,在本发明实施例中,通过对第一表格或第一图像,或第二表格或第二图像进行文字识别,从而根据文字识别结果可以准确提取到第一公用信息或第二公用信息。
在一个可选的实施例中,提取第一表格或第一图像的第一特征信息,或提取第二表格或第二图像的第二特征信息,包括:对第一表格或第一图像,或第二表格或第二图像进行文字识别,得到识别结果;根据识别结果对第一表格或第一图像,或第二表格或第二图像进行语义分析,得到对应的第一特征信息或第二特征信息。
具体地,在提取第一特征信息或第二特征信息时,可以对第一表格或第一图像,或第二表格或第二图像进行文字识别。然后根据文字识别结果进行上下文分析,确定表格中的属性信息,对表格中的属性信息进行语义分析,分析出该属性信息的意思,得到对应的第一特征信息或第二特征信息。
由于文字识别的技术已经相当成熟,在本发明实施例中,通过对第一表格或第一图像,或第二表格或第二图像进行文字识别,从而根据文字识别结果可以准确提取到第一特征信息或第二特征信息。
在一个可选的实施例中,在步骤S104,在当前界面上显示第一公用信息之后,文档内容的显示方法还包括:获取用户对第一公用信息的移动操作;根据移动操作,将第一公用信息进行移动。
一般地,第一公用信息显示在屏幕的上方或显示在屏幕的下方。但用户如果想要将第一公用信息拖动至其他位置时,如果能对第一公用信息进行拖动处理,则可以提供用户体验。因此,本发明实施例通过获取用户对第一公用信息的移动操作,根据移动操作,将第一公用信息进行移动,可以使得第一公用信息能够根据用户的需求进行移动,可以提高用户体验。
为了能够更好地理解本发明,下述以表格为例,对本发明进行进一步的阐述。
当用户通过电子设备打开文档时,可以触发数据分析器对该文档的内容进行实时分析。数据分析器可以对当前界面显示的文档进行文字识别,当识别到当前界面有第三表格的时候,如图2所示,可以提取第三表格中的第三公用信息和第三特征信息,第三公用信息包括第三表格主题和表头,如图2中黑框所示的内容。第三特征信息为第三表格的核心内容的概括信息。
在提取第三表格的第三公用信息时,可以首先提取第三表格的注释信息,例如,图2中第三表格上方的注释信息,得到第三表格主题。然后识别第三表格中的加粗字,对加粗字进行加分,然后对第三表格中所有的行和列进行分值的比较,分值最大的行或列为第三表格表头,如图2所示,第三表格第一行均为加粗字,第三表格第一行的分值最大,第三表格的第一行为第三表格表头;进一步地,为了提高提取的第三表格表头的准确性,可以设置一些序号、数字、号码,识别第三表格的第一行是否包括这些序号、数字、时间或号码,如果第三表格的第一行包括这些序号、数字、时间或号码,例如,第三表格的第一行包括一、二、三、四这些序号,还包括时间,且分值最大,则该第三表格的第一行为第三表格表头,然后提取第三表格的第一行内容,得到第三表格表头。
在提取第三表格的第三特征信息时,可以对第三表格的内容进行语义分析,分析第三表格中的上下文,对第三表格核心内容进行概括,例如,对于如图2所示的第三表格,通过语义分析,可以分析出第三表格第一列列举了多个属性、第二列至第五列的内容分别用于描述该多个属性。然后记录该分析得到的内容,得到第三特征信息。
然后用户向后翻屏后,数据分析器继续对该文档的内容进行分析,对当前界面显示的文档进行文字识别,当识别到当前界面有第四表格的时候,如图3所示,可以提取第四表格中的第四公用信息和第四特征信息,第四公用信息包括第四表格主题和表头,第四特征信息为第四表格的核心内容的概括信息。
如图3所示,由于第四表格不存在注释信息,因此提取不到第四表格的主题。又由于第四表格中没有加粗字体,第一行不包括序号、数字、时间或号码这些特定字符,因此也提取不到表头。从而提取不到第四公用信息。
在提取第四表格的第四特征时,可以对第四表格的内容进行语义分析,分析第四表格中的上下文,对第四表格核心内容进行概括,例如,对于如图3所示的第四表格,通过语义分析,可以分析出第四表格第一列列举了多个属性、第二列至第五列分别用于描述该多个属性。然后记录该分析得到的内容,得到第四特征信息。
对第三特征信息与第四特征信息进行比较,可以发现第三表格的第一列和第四表格的第一列均列举了多个属性,第二列至第五列均用于描述该多个属性,则第三特征信息与第四特征信息相似。且由于未提取到第四公用信息,因此,可以在当前界面上以悬浮框的形式显示与第三特征信息对应的第三公用信息,从而用户可以根据第三公用信息,更好地阅读和理解第四表格的内容,提高用户的体验。
本发明实施例提供了一种文档内容的显示装置,如图4所示,包括:
第一分析单元21,用于获取用户输入的对文档进行翻屏操作的指令;具体的实施方式详见上述方法实施例步骤S101的描述,在此不再赘述。
提取单元22,用于根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;具体的实施方式详见上述方法实施例步骤S102的描述,在此不再赘述。
获取单元23,用于获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;具体的实施方式详见上述方法实施例步骤S103的描述,在此不再赘述。
显示单元24,用于在当前界面上显示第一公用信息。具体的实施方式详见上述方法实施例步骤S104的描述,在此不再赘述。
本发明实施例提供的文档内容的显示装置,通过获取用户输入的对文档进行翻屏操作的指令;根据指令对文档进行翻屏操作,识别翻屏操作后文档中当前界面显示的第一表格或第一图像,提取第一表格或第一图像的第一特征信息;获取与第一特征信息对应的第一公用信息,第一公用信息为翻屏操作前,从文档的第二表格或第二图像中提取到的;在当前界面上显示第一公用信息;从而当一个表格或一张图像被分隔成两部分,设置在两个页面上时,用户翻到表格或图像后面的内容的时候,该表格或图像的公用信息会显示在当前界面上,使得该表格或图像的公用信息始终可见,可以提高用户体验。
基于与前述实施例中一种文档内容的显示方法同样的发明构思,本发明实施例还提供一种电子设备,如图5所示,包括:处理器31和存储器32,其中处理器31和存储器32可以通过总线或者其他方式连接,图5中以通过总线连接为例进行说明。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的文档内容的显示方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的文档内容的显示方法。
存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器31所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的一个或者多个模块存储在存储器32中,当被处理器31执行时,执行如图1所示实施例中的文档内容的显示方法。
上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器,使得通过计算机或其他可编程信息处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程信息处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种文档内容的显示方法,包括:
获取用户输入的对文档进行翻屏操作的指令;
根据所述指令对所述文档进行翻屏操作,识别翻屏操作后所述文档中当前界面显示的第一表格或第一图像,提取所述第一表格或所述第一图像的第一特征信息;
获取与所述第一特征信息对应的第一公用信息,所述第一公用信息为翻屏操作前,从所述文档的第二表格或第二图像中提取到的;
在当前界面上显示所述第一公用信息。
2.根据权利要求1所述的文档内容的显示方法,在获取用户输入的对文档进行翻屏操作的指令之前,还包括:
识别所述文档中当前界面显示的第二表格或第二图像;
提取所述第二表格或所述第二图像的第二特征信息和所述第一公用信息。
3.根据权利要求2所述的文档内容的显示方法,所述获取与所述第一特征信息对应的第一公用信息,包括:
查找到与所述第一特征信息满足相似条件的所述第二特征信息;
查找到与所述第二特征信息对应的第一公用信息。
4.根据权利要求1所述的文档内容的显示方法,在提取所述第一表格或所述第一图像的第一特征信息之后,还包括:
提取所述第一表格或所述第一图像的第二公用信息;
在判定所述第二公用信息不存在的情况下,获取与所述第一特征信息对应的第一公用信息。
5.根据权利要求4所述的文档内容的显示方法,所述第一公用信息和所述第二公用信息均包括表格表头和表格主题,或图像主题。
6.根据权利要求5所述的文档内容的显示方法,提取所述第二表格或第二图像的第一公用信息,或提取所述第一表格或第一图像的第二公用信息,包括:
对所述第一表格或第一图像,或所述第二表格或第二图像进行文字识别,得到识别结果;
根据所述识别结果确认所述第一表格或第一图像,或所述第二表格或第二图像包括注释信息的情况下,提取所述注释信息,得到表格主题或图像主题;
根据所述识别结果确认所述第一表格或第二表格的第一行包括特定字体或特定字符的情况下,提取所述第一表格或第二表格的第一行内容,得到表格表头。
7.根据权利要求2所述的文档内容的显示方法,提取所述第一表格或第一图像的第一特征信息,或提取所述第二表格或第二图像的第二特征信息,包括:
对所述第一表格或第一图像,或所述第二表格或第二图像进行文字识别,得到识别结果;
根据所述识别结果对所述第一表格或第一图像,或所述第二表格或第二图像进行语义分析,得到对应的所述第一特征信息或所述第二特征信息。
8.根据权利要求1所述的文档内容的显示方法,在当前界面上显示所述第一公用信息之后,还包括:
获取用户对所述第一公用信息的移动操作;
根据所述移动操作,将所述第一公用信息进行移动。
9.一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-8任意一项所述的文档内容的显示方法。
10.一种文档内容的显示装置,包括:
第一分析单元,用于获取用户输入的对文档进行翻屏操作的指令;
提取单元,用于根据所述指令对所述文档进行翻屏操作,识别翻屏操作后所述文档中当前界面显示的第一表格或第一图像,提取所述第一表格或所述第一图像的第一特征信息;
获取单元,用于获取与所述第一特征信息对应的第一公用信息,所述第一公用信息为翻屏操作前,从所述文档的第二表格或第二图像中提取到的;
显示单元,用于在当前界面上显示所述第一公用信息。
CN202110935379.5A 2021-08-16 2021-08-16 一种文档内容的显示方法、装置及设备 Pending CN113761833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110935379.5A CN113761833A (zh) 2021-08-16 2021-08-16 一种文档内容的显示方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110935379.5A CN113761833A (zh) 2021-08-16 2021-08-16 一种文档内容的显示方法、装置及设备

Publications (1)

Publication Number Publication Date
CN113761833A true CN113761833A (zh) 2021-12-07

Family

ID=78789403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110935379.5A Pending CN113761833A (zh) 2021-08-16 2021-08-16 一种文档内容的显示方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113761833A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176702A (zh) * 2011-12-22 2013-06-26 北大方正集团有限公司 一种应用于b/s结构的表格类信息显示、操作方法
CN107844468A (zh) * 2017-10-16 2018-03-27 平安科技(深圳)有限公司 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN111241796A (zh) * 2020-01-19 2020-06-05 北京字节跳动网络技术有限公司 表格信息的展示方法、装置、设备和存储介质
CN112380825A (zh) * 2020-11-17 2021-02-19 平安科技(深圳)有限公司 Pdf文档跨页表格合并方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176702A (zh) * 2011-12-22 2013-06-26 北大方正集团有限公司 一种应用于b/s结构的表格类信息显示、操作方法
CN107844468A (zh) * 2017-10-16 2018-03-27 平安科技(深圳)有限公司 表格信息跨页识别方法、电子设备及计算机可读存储介质
CN111241796A (zh) * 2020-01-19 2020-06-05 北京字节跳动网络技术有限公司 表格信息的展示方法、装置、设备和存储介质
CN112380825A (zh) * 2020-11-17 2021-02-19 平安科技(深圳)有限公司 Pdf文档跨页表格合并方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108595583B (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
US8762873B2 (en) Graphical user interface component identification
US8819028B2 (en) System and method for web content extraction
CN107766328B (zh) 结构化文本的文本信息提取方法、存储介质和服务器
CN111291572B (zh) 一种文字排版方法、装置及计算机可读存储介质
US10318646B2 (en) Generating a structured document guiding view
KR101481253B1 (ko) 워드 클라우드 기반 텍스트 문서의 이미지화 요약 방법 및 이를 이용한 정보 제공 시스템
CN114220057A (zh) 视频片尾识别方法、装置、电子设备及可读存储介质
Tuna et al. Indexing and keyword search to ease navigation in lecture videos
CN114357206A (zh) 基于语义分析的教育类视频彩色字幕生成方法及系统
CN112818200A (zh) 基于静态网站的数据爬取及事件分析方法及系统
CN112738640A (zh) 一种视频流的字幕的确定方法、装置及可读存储介质
KR102004981B1 (ko) 선택된 단어에 대한 자동 설명 삽입이 가능한 전자 문서 편집 장치 및 그 동작 방법
CN107909054B (zh) 图片文本的相似度评价方法及装置
CN117992439A (zh) 文本清洗方法、装置、电子设备和存储介质
CN111240962B (zh) 测试方法、装置、计算机设备及计算机存储介质
JP2010026923A (ja) 文書分類方法、文書分類装置、文書分類プログラム、および、コンピュータ読取り可能記録媒体
CN114579796B (zh) 机器阅读理解方法及装置
CN114155547B (zh) 一种图表识别方法、装置、设备及存储介质
CN116225956A (zh) 自动化测试方法、装置、计算机设备和存储介质
US20220301285A1 (en) Processing picture-text data
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN113761833A (zh) 一种文档内容的显示方法、装置及设备
CN106959945B (zh) 基于人工智能的为新闻生成短标题的方法和装置
CN112818984B (zh) 标题生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination