CN108733637B - 信息处理设备和信息处理方法 - Google Patents

信息处理设备和信息处理方法 Download PDF

Info

Publication number
CN108733637B
CN108733637B CN201711286741.0A CN201711286741A CN108733637B CN 108733637 B CN108733637 B CN 108733637B CN 201711286741 A CN201711286741 A CN 201711286741A CN 108733637 B CN108733637 B CN 108733637B
Authority
CN
China
Prior art keywords
additional information
information
pieces
processing apparatus
combined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711286741.0A
Other languages
English (en)
Other versions
CN108733637A (zh
Inventor
松尾刚典
笕瑠美子
丸山笃志
冈本直树
冈本拓也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN108733637A publication Critical patent/CN108733637A/zh
Application granted granted Critical
Publication of CN108733637B publication Critical patent/CN108733637B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32112Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3245Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of image modifying data, e.g. handwritten addenda, highlights or augmented reality information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3266Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/328Processing of the additional information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

信息处理设备和信息处理方法。一种信息处理设备包括输出单元。当提取设置在相同图像的副本中并且满足预定条件的附加信息时,该输出单元输出组合附加信息被设置在图像中的数据。该组合附加信息是附加信息被组合的信息。

Description

信息处理设备和信息处理方法
技术领域
本发明涉及一种信息处理设备和信息处理方法。
背景技术
当相同的文档被分发给多个人进行校对时,收集经校对的文档和组织校对信息的操作需要时间和精力。因此,已提出了旨在实现这种操作的效率的技术。
日本未审查专利申请公布No.8-95965公开了一种文档处理设备,其将具有相同文本正文并且多个人单独地添加了注释的文档组织成一个文档。在存储在文档存储单元中的多个文档当中,文档处理设备从文档存储单元读取具有相同文本正文的文档,并使得分离单元将注释与文本正文分离。通过分离单元所执行的分离处理,获得单个文本正文和多个注释。布局单元在相同的文本正文中重新布置如此分离的注释。
日本未审查专利申请公布No.2005-346376公开了一种文档处理装置,其参考与用户有关的附加信息。在文档处理设备中,当多个批注(附加信息)被添加到电子文档时,针对批注管理服务器设置的批注分类单元在接收到分类指令时基于关于存储在辅助存储单元中的批注的信息在给定条件下对批注进行分类。针对客户端设备设置的显示控制器控制显示器,以使得将批注与批注分类单元所获得的分类结果一起显示。
当设置在多个相同图像中的多条附加信息被简单地放在一起进行显示时,可能难以查看所述多条附加信息。这种情况的示例可包括由于多条附加信息很多而难以查看所述多条附加信息的情况、由于多条附加信息彼此重叠而难以查看多条附加信息的情况、以及由于多条附加信息彼此交叠或匹配所以查看附加信息花费时间的情况。
发明内容
为了解决上述问题,本发明的目的在于,与设置在相同图像的多个副本中的多条附加信息被设置在图像中而不处理所述多条附加信息的情况相比,使附加信息的查看更容易。
根据本发明的第一方面,提供了一种包括输出单元的信息处理设备。当提取设置在相同图像的副本中并且满足预定条件的附加信息时,所述输出单元输出组合附加信息被设置在图像中的数据。所述组合附加信息是附加信息被组合的信息。
根据本发明的第二方面,在根据第一方面的信息处理设备中,当提取设置在重叠区域中的附加信息时,输出单元输出组合附加信息被设置在图像的区域中的数据。所述组合附加信息是附加信息被写在一起的信息。所述区域对应于附加信息。
根据本发明的第三方面,在根据第一或第二方面的信息处理设备中,输出单元输出指示附加信息和与附加信息关联的属性信息之间的关联的组合附加信息。
根据本发明的第四方面,根据第三方面的信息处理设备还包括显示控制器和接收单元。显示控制器使得显示装置基于从输出单元输出的数据显示画面。接收单元接收操作。当接收到选择属性信息的操作时,输出单元输出与所选择的属性信息关联的附加信息的显示状态不同于与未选择的属性信息关联的附加信息的显示状态的数据。
根据本发明的第五方面,在根据第一至第三方面中的任一方面的信息处理设备中,当提取彼此交叠或匹配的附加信息时,输出单元输出附加信息被整合的组合附加信息。
根据本发明的第六方面,在根据第五方面的信息处理设备中,输出单元输出涉及同义词的附加信息被整合的组合附加信息。
根据本发明的第七方面,在根据第五方面的信息处理设备中,输出单元输出附加信息被整合的组合附加信息,所述附加信息具有相似度等于或大于阈值的字符串。
根据本发明的第八方面,提供了一种信息处理方法,该信息处理方法包括当提取设置在相同图像的副本中并满足预定条件的附加信息时,输出组合附加信息被设置在图像中的数据,所述组合附加信息是附加信息被组合的信息。
根据第一方面和第八方面,与设置在相同图像的多个副本中的多条附加信息被设置在所述图像中而不处理所述多条附加信息的情况相比,可使附加信息的查看更容易。
根据第二方面,与设置在相同图像的多个副本中的多条附加信息被设置在图像中而不处理所述多条附加信息的情况相比,即使当设置有附加信息的区域彼此重叠时,也可使附加信息的查看更容易。
根据第三方面,可提供与附加信息关联的属性信息。
根据第四方面,可使用属性信息来选择要显示的附加信息。
根据第五方面,与设置在相同图像的多个副本中的多条附加信息被设置在所述图像中而不处理所述多条附加信息的情况相比,当提取交叠或匹配的多条附加信息时,可使附加信息的查看更容易。
根据第六方面,与设置在相同图像的多个副本中的多条附加信息被设置在所述图像中而不处理所述多条附加信息的情况相比,当提取涉及同义词的多条附加信息时,可使附加信息的查看更容易。
根据第七方面,与设置在相同图像的多个副本中的多条附加信息被设置在所述图像中而不处理所述多条附加信息的情况相比,当提取具有相似度等于或大于阈值的字符串的多条附加信息时,可使附加信息的查看更容易。
附图说明
将基于以下附图详细描述本发明的示例性实施方式,附图中:
图1是示出信息处理设备的硬件配置的示图;
图2是示出信息处理设备的功能配置的示图;
图3是附加信息组合处理的示意性流程图;
图4是附加信息获得处理(步骤S02)的流程图;
图5是示出示例性附加信息表的示图;
图6是重叠确定处理(步骤S04)的流程图;
图7是组合处理(步骤S06)的流程图;
图8是更新处理(步骤S07)的详细流程图;
图9A至图9D是示出附加信息的示例性组合的示图;
图10A至图10D是示出附加信息的示例性组合的示图;
图11A至图11C是示出附加信息的示例性组合的示图;
图12A至图12C是示出附加信息的示例性组合的示图;
图13是附加信息组合处理的流程图;
图14A至图14D是示出附加信息的示例性组合的示图;以及
图15A至图15D是示出附加信息的示例性组合的示图。
具体实施方式
将描述用于实现本发明的示例性实施方式。
图1是示出信息处理设备1的硬件配置的示图。信息处理设备1包括控制器11、存储单元12、通信单元13、显示器14和操作单元15。作为诸如硬盘驱动器或存储器的存储装置,存储单元12存储程序和数据。包括处理器和用作计算工作区的存储器的控制器11根据存储在存储单元12中的程序来执行处理。通信单元13是信息处理设备1与外部设备之间的通信接口,并且例如包括用于局域网(LAN)的接口和调制解调器。
包括诸如液晶显示面板的显示装置的显示器14显示图形用户界面(GUI)画面,其上设置有用于操作信息处理设备1的微件。包括指点装置的操作单元15接收GUI上的操作。指点装置的示例包括覆盖显示器14的显示面的触摸面板、鼠标和触摸板。显示器14和操作单元15可被配置成与信息处理设备1分离的设备。
在信息处理设备1中,安装有描述附加信息组合处理的过程的程序。控制器11执行所述程序。因此,实现下面所描述的功能并且执行附加信息组合处理。
图2是示出信息处理设备1的功能配置的示图。提取单元110提取设置在相同图像的多个副本中的附加信息。当提取单元提取满足预定条件的多条附加信息时,输出单元120生成组合了所述多条附加信息的组合附加信息,并且输出组合附加信息被设置在图像中的数据。例如,当提取设置在重叠区域中的多条附加信息时,输出单元120生成所述多条附加信息被写在一起的组合附加信息,并且输出组合附加信息被设置在图像的与所述多条附加信息的位置对应的区域中的数据。另选地,当提取多条交叠或匹配的附加信息时,输出单元120生成所述多条交叠或匹配的附加信息被整合的组合附加信息。显示控制器130使得显示装置基于从输出单元120输出的数据来显示画面。接收单元140接收操作。
将描述要处理的文件。相同的电子文档文件被分发给多个人。每个人使用应用来打开文件,并使用针对该应用设置的已知信息添加功能来向文件添加信息。使用信息添加功能添加到文件的信息被称为附加信息。信息添加功能涵盖例如在页面上粘贴虚拟标签的功能、在虚拟标签中书写字符串的功能、以及在页面上书写字符串和标记的功能。标记例如是沿着字符串绘制的线段、围绕字符串的矩形、或者圆形标记。虚拟标签、字符串、标记等被视为附加信息。
文件的数据结构是树结构。文件包括一个或更多个页面。对各个页面,可添加一条或更多条附加信息。当此结构被表示为树结构时,一个或更多个页面作为文件的后代节点关联,并且一条或更多条附加信息作为页面的后代节点关联。
可向一条附加信息添加另一条或其它条附加信息。例如,当在粘贴在页面上的标签中书写字符串时,标签本身是附加信息,字符串是添加到标签的附加信息。当此结构被表示为树结构时,附加信息(字符串)作为附加信息(标签)的后代节点关联。因此,当一条附加信息与一条附加信息关联时,用作上代的这条附加信息被称为父信息,用作后代的这条附加信息被称为子信息。标签是可用作父信息的附加信息。
用户收集添加了附加信息的文件,并将所收集的文件输入到信息处理设备1。当用户指示信息处理设备1执行附加信息组合处理时,控制器11开始附加信息组合处理。
图3是附加信息组合处理的示意性流程图。首先,信息处理设备1接收文件(步骤S01)。然后,控制器11从各个文件获得附加信息,并将所获得的附加信息存储在存储单元12中(执行附加信息获得处理的步骤S02)。然后,控制器11确定是否存在未处理的页面。如果不存在未处理的页面(步骤S03中为“否”),则控制器11结束附加信息组合处理。如果存在未处理的页面(步骤S03中为“是”),则处理前进至步骤S04。
在步骤S04中,控制器11确定对于未处理的页面中的一个,从文件获得的多条附加信息是否彼此重叠(执行重叠确定处理的步骤S04)。如果没有附加信息彼此重叠(步骤S05中为“否”),则控制器11的处理返回到步骤S03。如果多条附加信息彼此重叠(步骤S05中为“是”),则控制器11生成彼此重叠的多条附加信息被组合的组合附加信息(执行组合处理的步骤S06)。然后,控制器11使用组合附加信息来更新文件图像(执行更新处理的步骤S07),并且重复地执行步骤S03及其后续步骤中的处理。将详细描述步骤S02、S04、S06和S07。
图4是附加信息获得处理(步骤S02)的流程图。首先,控制器11确定是否存在未处理的文件,即,未经受附加信息获得处理的文件。如果不存在未处理的文件(步骤S11中为“否”),则控制器11结束附加信息获得处理。如果存在未处理的文件(步骤S11中为“是”),则控制器11对未处理的文件中的一个执行以下处理。
在步骤S12中,控制器11从文件的树结构确定是否存在与文件关联的未处理的页面。如果不存在这种未处理的页面(步骤S12中为“否”),则处理返回到步骤S11。如果存在这种未处理的页面(步骤S12中为“是”),则控制器11从文件的树结构确定对于未处理的页面中的一个是否存在与该页面关联的未处理的附加信息。如果不存在这种未处理的附加信息(步骤S13中为“否”),则控制器11重复地执行步骤S12中的处理。如果存在这种未处理的附加信息(步骤S13中为“是”),则控制器11获得未处理的附加信息中所包括的一条附加谢谢的类型、左上坐标和尺寸(步骤S14)。
然后,控制器11从该条附加信息的类型确定该条附加信息是否可用作父信息。可用作父信息的附加信息的类型例如是标签。如果该条附加信息不能用作父信息(步骤S15中为“否”),则控制器11重复地执行步骤S13中的处理。如果该条附加信息可用作父信息(步骤S15中为“是”),则控制器11从文件的树结构确定是否存在与该条附加信息关联的未处理的子信息。如果不存在这种未处理的子信息(步骤S16中为“否”),则控制器11重复地执行步骤S13及其后续步骤中的处理。如果存在这种未处理的子信息(步骤S16中为“是”),则控制器11获得未处理的子信息中所包括的一条子信息的类型、左上坐标值和尺寸(步骤S17),并重复地执行步骤S16中的处理。上面描述了附加信息获得处理的过程。
图5示出了示例性附加信息表。控制器11向所获得的附加信息提供ID,并将以下信息与ID关联地写到附加信息表中。数据“文档”指示标识符(例如,文件名),其指示从其获得附加信息的文档。数据“页面”指示从其获得附加信息的页面的页码。数据“类型”指示附加信息的类型。类型例如是标签、字符串、标记等。数据“父ID”指示附加信息作为子信息所关联的父信息的ID。在此示例中,ID为1的附加信息被存储为父信息,ID为2的附加信息作为子信息关联。在此示例中,标签用作父信息,写在标签中的字符串用作子信息。数据“X坐标”、“Y坐标”、“宽度”和“高度”指示附加信息的左上x坐标、左上y坐标、宽度和高度。当附加信息指示字符串、标记等时,可获得附加信息的外接矩形的x坐标、y坐标、宽度和高度。数据“字符串”指示包括在附加信息中的字符串。
图6是重叠确定处理(步骤S04)的流程图。当从与相同页码对应并包括在文件的多个副本中的页面获得多条附加信息时,控制器11按照循环方式对多条附加信息当中的任两条附加信息的组合执行重叠确定处理。
首先,控制器11获得这两条附加信息的左上坐标和尺寸,并计算各条附加信息的中心点的坐标(步骤S21)。然后,控制器11计算这两条附加信息的宽度的一半之和W(步骤S22)。然后,控制器11计算这两条附加信息的高度的一半之和H(步骤S23)。然后,控制器11从这两条附加信息的中心点之间的水平方向上的距离减去W。如果减法值为负(步骤S24中为“是”),则从这两条附加信息的中心点之间的垂直方向上的距离减去H。如果减法值为负(步骤S25中为“是”),则控制器11确定这两条附加信息的区域彼此重叠,并将1设定为重叠标志(步骤S26)。控制器11将这两条附加信息的组合与重叠标志关联地存储。相反,如果步骤S24或S25中的确定结果为否,则控制器11确定这两条附加信息的区域彼此不重叠,并将0设定为重叠标志(步骤S27)。上面描述了重叠确定处理的过程。
图7是组合处理的流程图(步骤S06)。对在步骤S04中重叠标志被设定为1的多条附加信息的组合执行此处理。首先,控制器11从附加信息表获得包括在多条附加信息中的字符串(步骤S31)。然后,控制器11确定所获得的字符串是否彼此匹配。如果字符串彼此匹配(步骤S32中为“是”),则控制器11生成彼此匹配的字符串被整合的组合附加信息(步骤S33)。如果字符串彼此不匹配(步骤S32中为“否”),则控制器11生成这些字符串被写在一起的组合附加信息(步骤S34)。上面描述了组合处理的过程。
图8是更新处理(步骤S07)的流程图。首先,控制器11生成框图像(步骤S41)。该框例如是矩形框。通过对框内的背景进行着色,可生成虚拟标签图像。在这种情况下,可取的是框内的背景用与页面的背景不同的颜色来着色。框的颜色可与框内的背景的颜色相同,或者可与框内的背景的颜色不同。然后,控制器11将组合附加信息设置在框图像中(步骤S42),并输出设置有组合附加信息的框图像被设置在页面图像(添加附加信息之前的图像)中的数据(步骤S43)。上面描述了更新处理的过程。例如,数据被输出到显示装置,以使得显示设置有组合附加信息的页面。另外,数据被输出到打印机,以使得打印设置有组合附加信息的页面。
图9A至图9D示出了附加信息的示例性组合。图9A和图9B示出了两个不同的人在相同的页面上粘贴了虚拟标签作为附加信息的示例。当图9A和图9B中的示例被简单地放在一起时,如图9C所示,两个标签区域彼此重叠。因此,在重叠确定处理中确定发生了重叠。由于写在两个标签中的字符串彼此不匹配,所以在组合处理中生成这些字符串被写在一起的组合附加信息。结果,如图9D所示,生成了组合之前获得的两个标签中的字符串被一起写在单个标签中的图像。
修改示例
上述示例性实施方式可如下修改。
第一修改示例
可采用以下配置。提取单元提取与附加信息关联的属性信息。输出单元生成指示多条附加信息与属性信息之间的关联的组合附加信息。
图10A至图10D示出了附加信息的示例性组合。图10A至图10C示出了三个不同的人在相同的页面上粘贴了虚拟标签的示例。在各个页面中绘制的虚线指示字符串。当10A至图10C中的示例被简单地放在一起时,三个标签区域彼此重叠。因此,在重叠确定处理中,确定发生了重叠。在第一修改示例中,在组合处理(图7)中的步骤S31中,控制器11获得附加信息的字符串和属性信息。属性信息例如描述创建者的名字,并且从文件的性质(property)获得。在步骤S34中,控制器11将字符串写在一起,并且还书写与各个字符串对应的多条属性信息。结果,如图10D所示,生成组合之前的三个标签中的字符串、以及属性信息(在此示例中,创建者的名字)被写在单个标签中的图像。
第二修改示例
可采用以下配置。包括显示控制器和接收单元。显示控制器使得显示装置基于从输出单元输出的数据来显示画面。接收单元接收操作。当接收到选择属性信息的操作时,输出单元输出数据,使得与所选择的属性信息关联的附加信息按照不同于与未选择的属性信息关联的附加信息的显示状态的显示状态来显示。
图11A至图11C示出了附加信息的示例性组合。图11A示出了图10D所示的示例性显示。在第二修改示例中,用户执行选择多条所显示的属性信息中的一条(在此示例中,创建者的名字)的操作。例如,可使用指点装置来选择属性信息,或者可显示用于输入要选择的属性信息的微件。当属性信息“A先生/女士”被选择时,如图11B所示,显示与A先生/女士对应的附加信息(在此示例中,字符串),并且不显示与B先生/女士和C先生/女士对应的附加信息。当属性信息“B先生/女士”被选择时,如图11C所示,显示与B先生/女士对应的附加信息(在此示例中,字符串)。与B先生/女士和C先生/女士对应的附加信息可按照比与A先生/女士对应的附加信息的密度低的密度来显示,或者根本不需要显示。
第三修改示例
图12A至图12C示出了附加信息的示例性组合。图12A示出了除了标签之外还绘制围绕文档文本的矩形的示例。图12B示出了除了标签之外还绘制沿着文档文本的线段的示例。在重叠确定处理中,获得用于下面绘制有图12B中的线段的字符串组的外接矩形。确定图12A中的矩形区域和图12B中的外接矩形的区域彼此重叠。在组合处理中,图12A中的矩形可与图12B中的线段一起书写,或者可仅显示图12A中的矩形区域和图12B中的外接矩形的区域当中较大的区域。在此示例中,由于图12A中的矩形区域较大,所以如图12C所示,仅显示图12A中的矩形。
第四修改示例
可采用输出单元生成涉及同义词的多条附加信息被整合的组合附加信息的配置。
图13是附加信息组合处理的流程图。步骤S01至S05以及步骤S06至S07与上述示例性实施方式(图3)中的那些相同。在步骤S51中,控制器11对被确定为彼此重叠的多条附加信息执行形态分析,并提取单词。在步骤S52中,控制器11从字典提取所提取的单词的同义词。在组合处理中,控制器11将涉及同义词的附加信息整合。
图14A至图14D示出了附加信息的示例性组合。在此示例中,确定图14A中的标签中的“订正”是图14B中的标签中的“修正”的同义词。如图14D所示,字符串被整合成“修改”,“修改”被写在标签中。
图15A至图15D示出了附加信息的示例性组合。图15B示出在页面上写有附加信息的示例。在此示例中,确定图15A中的标签中的“订正”是写在图15B中的页面上的“修正”的同义词。如图15D所示,字符串被整合成“修改”,“修改”被写在标签中。
可采用这样的配置,其中输出单元生成具有相似度等于或大于阈值的字符串的多条附加信息被整合的组合附加信息。例如,当多个字符串包含共同的字符时,共同的字符的数量与原始字符串中的字符数量之比可用作相似度。另选地,当多个字符串包含共同的单词时,共同的单词中的字符数量与原始字符串中的字符数量之比可用作相似度。
第五修改示例
使得计算机执行上述处理的程序可通过将程序持久地存储在诸如光学记录介质或半导体存储器的计算机可读记录介质中来提供,或者可通过诸如互联网的通信网络来提供。当根据本发明的示例性实施方式的程序通过将程序持久地存储在记录介质中来提供时,计算机从记录介质读取程序以便于使用。当根据本发明的示例性实施方式的程序通过通信网络来提供时,计算机从分发源设备接收程序以便于使用。
为了例示和描述目的而提供了本发明的示例性实施方式的以上描述。其并不旨在为穷尽性的或者将本发明限于所公开的精确形式。显然,对本领域技术人员而言许多修改和变化将是显而易见的。选择并描述了实施方式以便最佳地说明本发明的原理及其实际应用,从而使得本领域技术人员能够理解本发明的各种实施方式以及适合于可以想到的具体用途的各种修改。本发明的范围旨在由以下权利要求书及其等同物限定。

Claims (7)

1.一种信息处理设备,该信息处理设备包括:
输出单元,当多条附加信息的内容彼此匹配时,该输出单元输出组合附加信息被设置在图像中的数据,
其中,所述多条附加信息被设置在相同图像的多个副本中,并且
其中,所述组合附加信息是所述多条附加信息被整合的信息。
2.根据权利要求1所述的信息处理设备,
其中,当提取设置在重叠区域中的所述多条附加信息时,所述输出单元输出所述组合附加信息被设置在所述图像的区域中的所述数据,所述组合附加信息是所述多条附加信息被写在一起的信息,所述区域对应于所述多条附加信息。
3.根据权利要求1或2所述的信息处理设备,
其中,所述输出单元输出指示所述多条附加信息和与所述多条附加信息关联的属性信息之间的关联的所述组合附加信息。
4. 根据权利要求3所述的信息处理设备,该信息处理设备还包括:
显示控制器,该显示控制器使得显示装置基于从所述输出单元输出的所述数据显示画面;以及
接收单元,该接收单元接收操作,
其中,当接收到选择所述属性信息的操作时,所述输出单元输出与所选择的属性信息关联的附加信息的显示状态不同于与未选择的属性信息关联的附加信息的显示状态的所述数据。
5.根据权利要求1所述的信息处理设备,
其中,所述输出单元输出涉及同义词的所述多条附加信息被整合的所述组合附加信息。
6.根据权利要求1所述的信息处理设备,
其中,所述输出单元输出所述多条附加信息被整合的所述组合附加信息,所述多条附加信息具有相似度等于或大于阈值的字符串。
7.一种信息处理方法,该信息处理方法包括以下步骤:
当多条附加信息的内容彼此匹配时,输出组合附加信息被设置在图像中的数据,
其中,所述多条附加信息被设置在相同图像的多个副本中,并且
其中,所述组合附加信息是所述多条附加信息被整合的信息。
CN201711286741.0A 2017-04-19 2017-12-07 信息处理设备和信息处理方法 Active CN108733637B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017082923A JP6926623B2 (ja) 2017-04-19 2017-04-19 情報処理装置及びプログラム
JP2017-082923 2017-04-19

Publications (2)

Publication Number Publication Date
CN108733637A CN108733637A (zh) 2018-11-02
CN108733637B true CN108733637B (zh) 2023-04-18

Family

ID=63852809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711286741.0A Active CN108733637B (zh) 2017-04-19 2017-12-07 信息处理设备和信息处理方法

Country Status (3)

Country Link
US (1) US10909736B2 (zh)
JP (1) JP6926623B2 (zh)
CN (1) CN108733637B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024023624A1 (ja) * 2022-07-28 2024-02-01 株式会社半導体エネルギー研究所 文書閲覧装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895965A (ja) * 1994-09-20 1996-04-12 Fuji Xerox Co Ltd 文書処理装置
JP2005339295A (ja) * 2004-05-28 2005-12-08 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
JP2005346376A (ja) * 2004-06-02 2005-12-15 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
CN1877560A (zh) * 2005-06-10 2006-12-13 富士施乐株式会社 文档处理系统、打印系统、文档文件、文档处理方法和计算机程序产品
CN101090373A (zh) * 2006-06-13 2007-12-19 富士施乐株式会社 附加信息发布装置和附加信息发布系统
CN101192236A (zh) * 2006-11-30 2008-06-04 富士施乐株式会社 文档处理装置和文档处理方法
CN101257554A (zh) * 2007-02-27 2008-09-03 富士施乐株式会社 文档处理装置、文档处理系统和文档处理方法
JP2012203491A (ja) * 2011-03-24 2012-10-22 Fuji Xerox Co Ltd 文書処理装置及び文書処理プログラム
CN104487934A (zh) * 2012-05-02 2015-04-01 谷歌有限公司 新闻领域中的社交相关内容
CN104798066A (zh) * 2012-11-27 2015-07-22 谷歌公司 检测编辑之间的关系并且对编辑的子集有所行动

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006373A (ja) * 2005-06-27 2007-01-11 Konica Minolta Business Technologies Inc 書類データ管理システム、画像形成装置、書類データ管理方法、およびコンピュータプログラム
JP2008097074A (ja) * 2006-10-06 2008-04-24 Fuji Xerox Co Ltd 付箋表示装置、付箋表示プログラム及び付箋表示方法
US8032546B2 (en) * 2008-02-15 2011-10-04 Microsoft Corp. Transformation-based framework for record matching
US9418054B2 (en) * 2008-05-12 2016-08-16 Adobe Systems Incorporated Document comment management
WO2012040621A2 (en) * 2010-09-23 2012-03-29 Carnegie Mellon University Media annotation visualization tools and techniques, and an aggregate-behavior visualization system utilizing such tools and techniques
JP5761237B2 (ja) * 2013-03-15 2015-08-12 コニカミノルタ株式会社 情報表示装置及び情報編集方法並びに情報編集プログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895965A (ja) * 1994-09-20 1996-04-12 Fuji Xerox Co Ltd 文書処理装置
JP2005339295A (ja) * 2004-05-28 2005-12-08 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
JP2005346376A (ja) * 2004-06-02 2005-12-15 Fuji Xerox Co Ltd 文書処理装置、文書処理方法及び文書処理プログラム
CN1877560A (zh) * 2005-06-10 2006-12-13 富士施乐株式会社 文档处理系统、打印系统、文档文件、文档处理方法和计算机程序产品
CN101090373A (zh) * 2006-06-13 2007-12-19 富士施乐株式会社 附加信息发布装置和附加信息发布系统
CN101192236A (zh) * 2006-11-30 2008-06-04 富士施乐株式会社 文档处理装置和文档处理方法
CN101257554A (zh) * 2007-02-27 2008-09-03 富士施乐株式会社 文档处理装置、文档处理系统和文档处理方法
JP2012203491A (ja) * 2011-03-24 2012-10-22 Fuji Xerox Co Ltd 文書処理装置及び文書処理プログラム
CN104487934A (zh) * 2012-05-02 2015-04-01 谷歌有限公司 新闻领域中的社交相关内容
CN104798066A (zh) * 2012-11-27 2015-07-22 谷歌公司 检测编辑之间的关系并且对编辑的子集有所行动

Also Published As

Publication number Publication date
CN108733637A (zh) 2018-11-02
US20180308270A1 (en) 2018-10-25
JP2018181149A (ja) 2018-11-15
US10909736B2 (en) 2021-02-02
JP6926623B2 (ja) 2021-08-25

Similar Documents

Publication Publication Date Title
US20220319219A1 (en) Technologies for content analysis
US10572725B1 (en) Form image field extraction
US9529438B2 (en) Printing structured documents
Rigaud et al. Knowledge-driven understanding of images in comic books
WO2016144621A1 (en) Ink experience for images
US10210141B2 (en) Stylizing text by replacing glyph with alternate glyph
US9779091B2 (en) Restoration of modified document to original state
US20170132484A1 (en) Two Step Mathematical Expression Search
JP2014056503A (ja) 多言語環境でのコミュニケーションに適する非テキスト要素を特定するためのコンピュータ実装方法、プログラム、および、システム
Coelho et al. Structured literature image finder: extracting information from text and images in biomedical literature
CN108733637B (zh) 信息处理设备和信息处理方法
JP2012203491A (ja) 文書処理装置及び文書処理プログラム
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
CN109445900B (zh) 用于图片显示的翻译方法和装置
JP5353325B2 (ja) 文書データ生成装置と文書データ生成方法
WO2019136920A1 (zh) 话题演变的可视化展现方法、应用服务器及计算机可读存储介质
JP7331551B2 (ja) 情報処理装置及び情報処理プログラム
JP6500341B2 (ja) 文書管理プログラム、文書管理方法及び文書管理システム
US11010978B2 (en) Method and system for generating augmented reality interactive content
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20150095314A1 (en) Document search apparatus and method
JP2018128850A (ja) 情報処理プログラム、情報処理方法および情報処理装置
JP4906044B2 (ja) 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
Bell et al. Approaches to handwritten conductor annotation extraction in musical scores
US20150142784A1 (en) Retrieval device and method and computer program product

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Tokyo, Japan

Applicant after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo, Japan

Applicant before: Fuji Xerox Co.,Ltd.

GR01 Patent grant
GR01 Patent grant