CN104077270A - 电子书制作装置、电子书系统以及电子书制作方法 - Google Patents

电子书制作装置、电子书系统以及电子书制作方法 Download PDF

Info

Publication number
CN104077270A
CN104077270A CN201410126642.6A CN201410126642A CN104077270A CN 104077270 A CN104077270 A CN 104077270A CN 201410126642 A CN201410126642 A CN 201410126642A CN 104077270 A CN104077270 A CN 104077270A
Authority
CN
China
Prior art keywords
character
page
images
electronic book
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410126642.6A
Other languages
English (en)
Inventor
寺横素
小椋绘理奈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Publication of CN104077270A publication Critical patent/CN104077270A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了电子书制作装置、电子书系统和电子书制作方法。为了当显示具有复杂布局的页面图像而布局不变时容易在页面图像中跨多个字符区域搜索字符串,该装置包括:获得页面图像的图像获得单元;检测页面图像中的字符区域的字符区域检测单元;识别字符区域中的字符的字符识别单元;获得指示每个字符的位置的字符位置信息的字符位置信息获得单元;读取顺序确定单元,基于每个字符区域的位置以及字符区域之间的字符至字符的连续性来确定字符区域当中的读取顺序;电子书数据生成单元,生成包括页面图像、字符信息、字符位置信息以及与字符或字符区域有关的顺序信息的电子书数据;以及输出电子书数据的电子书数据输出单元。

Description

电子书制作装置、电子书系统以及电子书制作方法
技术领域
本发明涉及当在布局不变的情况下在电子书阅读器设备上显示包括字符区域的页面图像而时允许易于在页面图像中的多个字符区域中搜索字符串的电子书制作装置、电子书系统、电子书制作方法和程序。
背景技术
传统地,公知的技术是允许电子书经由网络来分发或者经由便携式记录介质(存储器卡)来获得并且在便携式终端上进行显示。
日本未经审查专利申请公开No.2012-133659公开了,对电子书上的每页单元的图像(页面图像)进行分析,并且生成包括气球信息(诸如气球区域)、文本信息(诸如气球中的线)、以及显示控制信息(诸如页面图像的读取顺序)的附属信息,以生成包括页面图像和附属信息的电子书数据。
日本未经审查专利申请公开No.2004-240643公开了,首先与纵向书写或横向书写相对应地初步确定字符区域中的读取顺序,并且然后确定字符区域之间的字符连续性,以将读取顺序改变为最终读取顺序。
发明内容
然而,如果电子书的页面图像中的布局很复杂,则不利地难以在阅读器设备上进行对字符串的全文搜索。
在电子书当中,难以对处于具有字符的电子书与主要具有图像的电子书之间的混合电子书进行处理。混合电子书通常具有许多图和表,并且在复杂布局中包括字符。在这种混合电子书中,期望实现布局再现,并且还允许在页面图像中的对所有字符串的搜索(全文搜索)。具体地,例如,当字符区域和非字符区域在页面图像中以混合组合进行布置时,难以进行在页面图像中的跨多个字符区域的字符串的搜索的操作。
在日本未经审查专利申请公开No.2012-133659中,生成用于指示页面图像中的读取顺序的信息并且将其附加到页面图像。然而,该专利公报既没有公开特定读取顺序确定方法,也没有公开在页面图像中的多个字符区域中搜索字符串的操作。
在日本未经审查专利申请公开No.2004-240643中,公开了一种用于确定字符区域中的读取顺序的方法。然而,该专利公报没有公开在页面图像中的多个字符区域中搜索字符串的能力。
鉴于这些情况作出了本发明。本发明的目的在于,在完全再现复杂布局的同时允许进行全文搜索。具体地,本发明的目的在于,当在没有布局改变的情况下,在电子书阅读器设备上显示包括字符区域的页面图像时,允许容易搜索在页面图像中跨多个字符区域的字符串。
为了实现上述目的,本发明提供了一种电子书制作装置,该电子书制作装置包括:图像获得单元,该图像获得单元获得表示布置字符区域和非字符区域的每页单元的图像的页面图像;字符区域检测单元,该字符区域检测单元检测在由图像获得单元所获得的页面图像中的字符区域;字符识别单元,该字符识别单元识别由字符区域检测单元所检测到的字符区域中的字符;字符位置信息获得单元,该字符位置信息获得单元针对在字符区域中所识别的字符中的每一个获得字符位置信息,该字符位置信息指示所识别的字符在页面图像中的位置;读取顺序确定单元,该读取顺序确定单元基于字符区域在页面图像中的位置以及在页面图像中的字符区域之间的从一个字符至另一字符的连续性,来确定该页面图像中的字符区域当中的读取顺序;电子书数据生成单元,电子书数据生成单元生成下述电子书数据:该电子书数据包括指示识别出的字符的字符信息、指示页面图像中的识别出的字符中每一个的位置的字符位置信息、以及关于与页面图像中的字符区域当中的读取顺序相对应的字符或字符区域的顺序信息;以及电子书数据输出单元,该电子书数据输出单元输出由电子书数据生成单元所生成的电子书数据。
根据本发明,不仅基于页面图像中的字符区域的位置,而且还基于从字符区域之间的字符至字符的连续性来确定页面图像中的字符区域当中的读取顺序。而且,生成下述电子书数据:该电子书数据包括指示识别出的字符的字符信息、指示在页面图像中所识别出的每个字符的位置的字符位置信息、以及关于与页面图像中的字符区域当中的读取顺序相对应的字符或字符区域的顺序信息。因此,当在没有布局改变的情况下在获得电子书的阅读器设备处显示具有复杂布局的页面图像时,可以进行对在页面图像中跨多个字符区域的字符串的简单搜索。
根据本发明的一方面,该装置进一步包括显示控制程序生成单元,该显示控制程序生成单元生成要由能够显示页面图像的阅读器设备执行的显示控制程序,该显示控制程序具有基于添加到电子书数据中的页面图像的信息能够搜索在页面图像中的跨字符区域上的字符串的搜索功能以及能够突出显示通过该搜索所找到的字符区域中的字符串的突出显示功能,其中电子书数据生成单元将显示控制程序并入到电子书数据中。根据该方面,在电子书数据中包含显示控制程序,该显示控制程序具有能够在页面图像中的字符区域中搜索字符串的搜索功能以及能够突出显示通过该搜索所找到的字符区域中的字符串的突出显示功能。因此,即使在阅读器设备侧没有配备特殊搜索功能,也可以进行在页面图像中跨多个字符区域的字符串的简单搜索。
根据本发明的另一方面,显示控制程序生成单元生成显示控制程序,该显示控制程序具有通过阅读器设备在第一显示模式与第二显示模式之间切换的功能,第一显示模式在不改变字符区域和非字符区域的布置以及字符区域中的字符的布置的情况下显示页面图像,第二显示模式重排(reflow)显示字符区域中的字符。根据该方面,即使在阅读器设备侧没有配备特殊搜索功能,用户也能够在不改变布局的第一显示模式和用于通过改变布局来重排显示的第二显示模式之间进行选择。
根据本发明的又一方面,读取顺序确定单元基于页面图像中的字符区域的位置来初步地确定字符区域当中的读取顺序,并且基于从页面图像中的字符区域之间的一个字符至另一字符的连续性来对页面图像中的字符区域当中的读取顺序进行校正。根据该方面,可以快速并且可靠地确定字符区域当中的读取顺序。
根据本发明的又一方面,该装置进一步包括目录表信息生成单元,该目录表信息生成单元生成目录表信息,该目录表信息指示页面图像的每页或每多页的标题与页码之间的对应性,其中电子书数据生成单元将目录表信息并入到电子书数据中。根据该方面,可以基于目录表信息来简单地在阅读器设备上显示用户期望的页面图像。
根据本发明的又一方面,该装置进一步包括生成索引信息的索引信息生成单元,该索引信息指示在页面图像中的字符区域中的字符串与页码之间的对应性,其中电子书数据生成单元将该索引信息并入到电子书数据中。根据该方面,可以基于该索引信息来简单地在阅读器设备上显示用户期望的页面图像。
根据本发明的又一方面,该装置进一步包括锚点设置单元,该锚点设置单元对页面图像中的字符区域中的字符当中的指示非字符区域中的任何一个中的部分图像的字符设置用于将显示切换到非字符区域中的该部分图像的锚点。根据该方面,用户可很容易阅读彼此相关联的字符区域中的字符信息以及非字符区域中的部分图像。
根据本发明的又一方面,该装置进一步包括生成翻译信息的翻译信息生成单元,该翻译信息是通过将指示由字符识别单元所识别的字符的字符信息翻译成与字符信息的语言不同的语言来获得的,其中电子书数据生成单元将翻译信息并入到电子书数据中。根据该方面,用户能够容易理解甚至不是用户母语的语言的电子书。
此外,本发明提供了一种电子书系统,该电子书系统包括上述电子书制作装置中的任何一个以及阅读器设备,该阅读器设备获得从电子书制作装置输出的电子书数据并且显示电子书数据中的页面图像。
根据本发明的又一方面,阅读器设备具有能够基于对电子书数据中的页面图像添加的信息来在页面图像中的字符区域中搜索字符串的搜索功能以及能够突出显示通过该搜索所找到的字符串的突出显示功能。根据该方面,通过使用在阅读器设备侧配备的搜索功能和突出显示功能,可以跨多个字符区域搜索字符串并且进行显示。
根据本发明的又一方面,阅读器设备具有通过阅读器设备在第一显示模式与第二显示模式之间进行切换的功能,第一显示模式在不改变字符区域以及字符区域中的字符的布置的情况下显示页面图像,第二显示模式通过改变字符区域中的字符的布置来重排显示。根据该方面,通过使用在阅读器设备侧配备的切换功能,阅读器设备可以在第一显示模式(页面图像全显示)与第二显示模式(重排显示)之间进行切换。
本发明提供了一种电子书制作方法,该电子书制作方法包括:图像获得步骤,获得表示布置字符区域和非字符区域的每页单元的图像的页面图像;字符区域检测步骤,对在图像获得步骤中所获得的页面图像中的字符区域进行检测;字符识别步骤,识别在字符区域检测步骤中所检测到的字符区域中的字符;字符位置信息获得步骤,针对在字符区域中所识别的字符中的每一个来获得指示所识别的字符在字符区域中位置的位置信息;读取顺序确定步骤,基于页面图像中的字符区域的位置以及在页面图像中的字符区域之间的字符至字符的连续性来确定页面图像中的字符区域当中的读取顺序;电子书数据生成步骤,生成下述电子书数据:该电子书数据包括指示所识别的字符的字符信息、指示页面图像中的所识别的字符中的每一个的位置的字符位置信息、以及关于与页面图像中的字符区域当中的读取顺序相对应的字符或字符区域的顺序信息;以及电子书数据输出步骤,输出在电子书数据生成步骤中所生成的电子书数据。
根据本发明,当在没有布局改变的情况下在电子书阅读器设备上显示包括字符区域的页面图像时,能够允许在页面图像中跨多个字符区域的字符串的简单搜索。
附图说明
图1是电子书系统的示例的整体结构图;
图2是电子书制作装置的示例的硬件结构图;
图3是在用于在描述电子书制作程序与各种信息之间的关系中所使用的描述图;
图4是电子书制作装置的示例的功能框图;
图5是阅读器设备的示例的硬件结构图;
图6是描绘电子书制作处理的示例的流程的流程图;
图7是所获得的页面图像的示例的描述图;
图8是从图7的页面图像检测到的字符区域的描述图;
图9是在描述指示图7的页面图像中所识别的字符的位置的字符位置信息中所使用的描述图;
图10是在描述第一读取顺序确定结果中使用的描述图;
图11是在描述第二读取顺序确定结果中使用的描述图;
图12是阅读器设备上的页面图像的全显示的示例的描述图;
图13是图12的页面图像的放大主要部分的描述图;
图14是在阅读器设备上的重排显示的示例的描述图;以及
图15是阅读器设备上的超链接显示的示例的描述图。
具体实施方式
下面参考附图来详细描述本发明的实施例。
<系统结构>
图1是电子书系统(电子书数据分发系统)的示例的整体结构图。
扫描仪1读取纸张上的书稿以生成布置字符区域和非字符区域的每页单元的图像(以下简称为“页面图像”)。虽然图1描绘了通过扫描仪1读取纸张介质的书稿以获得一页或多页上的页面图像,但是本发明并不局限于该示例。可以经由网络或记录介质输入电子生成的书稿(数字稿)以获得一页或多页上的页面图像。
电子书制作装置2是生成包括一页或多页上的页面图像的电子书数据(在下文中还简称为“电子书”)的装置。电子书制作装置2例如由计算机装置来配置。
在有来自阅读器设备4的分发请求时,服务器装置3经由网络向阅读器设备4传送由电子书制作装置2所生成的电子书数据。服务器装置3例如由计算机装置来配置。
阅读器设备4(4a,4b,4c,4d)接收从服务器装置3传送的电子书数据并且显示页面图像。阅读器设备4是诸如便携式电话、智能电话和平板终端的各种便携式终端中的任何一个或者诸如个人计算机的各种终端设备(计算机装置)中的任何一个。
阅读器设备4具有显示屏,并且显示屏的大小针对每个型号而变化。当阅读器设备4的显示屏大小小于电子书数据的每页单元的整个页面图像的显示大小时,随着与阅读器设备4的显示屏大小相对应的显示区域在每页单元的页面图像中连续移动来进行显示。这样,通过与显示屏大小相对应的显示区域在页面图像中移动,在阅读器设备4的显示屏上顺序显示在显示范围中的部分图像,这可以被称为“追踪显示”或“顺序显示”。
<电子书制作装置的部件>
图2是电子书制作装置2的示例的硬件结构图。如在图2中所示,本示例的电子书制作装置2由包括控制设备21、操作设备22、显示设备23、通信设备24和存储设备25的计算机装置来配置。控制设备21例如由CPU(中央处理单元)来配置。在下文中可以将CPU简称为“微计算机”。操作设备22例如由键盘和鼠标来配置。显示设备23例如由液晶显示设备来配置。通信设备24是可以经由网络与服务器装置3进行通信的设备。存储设备25例如由诸如硬盘的大容量盘来配置。
如在图3中所示,电子书制作装置2的控制设备21执行电子书制作程序50,使页面图像51与附属信息相关联以生成由IDPF(国际数字出版论坛)所公布的EPUB(电子出版)格式的电子文档数据60,附属信息诸如字符区域信息52、读取顺序信息53、字符信息54、字符位置信息55、锚点信息56、目录表信息57和索引信息58。而且,可以对页面图像51添加显示控制程序59。在该情况下,可以在显示控制程序59中包括其他附加信息(例如字符区域信息52、读取顺序信息53、字符信息54、字符位置信息55、锚点信息56、目录表信息57、以及索引信息58。下面进一步详细描述这些附加信息中的每一个。
图4是电子书制作装置2的示例的功能框图。
将该示例的电子书制作装置2被配置成包括存储单元200、图像获得单元202、字符区域检测单元204、字符识别单元206、字符位置信息获得单元208、读取顺序确定单元210、锚点设置单元212、目录表信息生成单元214、索引信息生成单元216、翻译信息生成单元218、显示控制程序生成单元220、电子书数据生成单元222、以及电子书数据输出单元224。存储单元200例如由图2的存储设备25来配置。图像获得单元202例如由图2的通信设备24来配置。字符区域检测单元204、字符识别单元206、字符位置信息获得单元208、读取顺序确定单元210、锚点设置单元212、目录表信息生成单元214、索引信息生成单元216、翻译信息生成单元218、显示控制程序生成单元220和电子书数据生成单元222例如由图2的控制设备21来配置。电子书数据输出单元224例如由图2的通信设备24来配置。
存储单元200存储各种信息,诸如页面图像51、字符区域信息52、读取顺序信息53、字符信息54、字符位置信息55、锚点信息56、目录表信息57、索引信息58以及显示控制程序59。
图像获得单元202获得表示布置字符区域和非字符区域的每页单元的图像的页面图像51、并入到电子书数据60(电子书)中的页面图像51中的任何一个。这里,页单元并不局限于一页单元,而可以是多页的单元(例如,两页单元)。页面图像51的示例包括从诸如报纸、杂志、连环漫画(漫画)、办公文档、教科书以及参考书的纸张所读取的图像。页面图像51可以是从头开始电子生成的页面图像。例如,获得由图1的扫描仪1从纸张介质读取的一个或多个页面图像51。一个或多个页面图像51可以是从服务器装置3获得的。
字符区域检测单元204检测图像获得单元202所获得的页面图像51中的字符区域,并且输出字符区域信息52。可以通过使用各种已知技术中的任何一个来执行字符区域的检测。
字符识别单元206识别由字符区域检测单元204所检测到的字符区域中的字符并且输出字符信息54。可以通过使用各种已知技术中的任何一个来执行字符识别。
对于在任何字符区域中所识别的每个字符,字符位置信息获得单元208获得指示在页面图像51中所识别的字符的位置的字符位置信息55。下面进一步描述字符位置信息55的示例。
读取顺序确定单元210基于页面图像51中的字符区域的位置以及页面图像51中的字符区域之间的字符至字符的连续性来确定页面图像51中的字符区域当中的读取顺序,并且输出读取顺序信息53。通过基于例如字符的语言、纵向书写/横向书写等来确定字符区域当中的纵向和横向位置关系来执行基于字符区域的位置的读取顺序确定。通过使用词典、诸如语言分析的语言处理(例如形态分析)等,基于根据字符在作为词的字符区域之间是否连续来执行基于从字符至字符的连续性的读取顺序确定。
对于页面图像51中的字符区域中的字符当中的指示非字符区域中的部分图像(例如,图或表)的字符(例如,图或表号),锚点设置单元212设置用于将显示切换到非字符区域中的部分图像(例如图或表)的锚点。即,锚点设置单元212将用于切换到非字符区域中的部分图像的锚点信息56(例如,超链接)插入到字符区域中的字符串中。
目录表信息生成单元214生成目录表信息57,该目录表信息57指示与页面图像51有关的每页或每多个页的标题(章节标题)与页码之间的对应性。
索引信息生成单元216生成索引信息58,该索引信息58指示页面图像51的字符区域中的字符串(关键字候选)与页码之间的对应性。
翻译信息生成单元218将指示由字符识别单元206所识别的字符的字符信息翻译成与所识别的字符信息的语言(例如,日语)不同的语言(例如,英语)以生成翻译信息。
显示控制程序生成单元220生成可以显示页面图像51的阅读器设备4所要执行的显示控制程序59。例如,利用诸如JavaScript(注册商标)的脚本语言来生成显示控制程序59。可以使用任何其他语言。该示例的显示控制程序59具有能够基于对电子书数据60中的页面图像51添加的信息(诸如字符信息54、字符位置信息55、读取顺序信息53)来在字符区域中搜索字符串(搜索词)并且在页面图像51中跨字符区域搜索字符串(搜索词)的搜索功能、以及能够突出显示通过该搜索所找到的字符串的显示功能。而且,该示例的显示控制程序59具有通过阅读器设备4在用于在不改变字符区域、非字符区域和字符区域中的字符的布置的情况下显示页面图像的全显示的显示模式(第一显示模式)与重排显示字符区域中的字符的显示模式(第二显示模式)之间进行切换的功能。
电子书数据生成单元222通过使各种信息与页面图像51相关联而来生成电子书数据60。电子书数据生成单元222通过使至少指示所识别的字符的字符信息54、指示在页面图像51中所识别的字符的位置的字符位置信息55和包括与页面图像51中的字符区域当中的读取顺序相对应的字符顺序信息(或者字符区域顺序信息)的读取顺序信息53与页面图像51相关联来生成电子书数据60。如在图3中所示,可以对页面图像51添加字符区域信息52、读取顺序信息53、字符信息54、字符位置信息55、锚点信息56、目录表信息57以及索引信息58。此外,可以添加翻译信息。更进一步,可以对页面图像51添加显示控制程序59。
电子书数据输出单元224输出由电子书数据生成单元222所生成的电子书数据60。
<阅读器设备>
图5描绘了用于阅读由电子书制作装置2所生成的电子书数据60的阅读器设备4的硬件结构的示例。该示例的阅读器设备4由包括控制单元41、操作单元42、显示单元43、通信单元44以及存储单元45的便携式终端来配置。控制单元41例如由CPU(中央处理单元)来配置。控制单元42和显示单元43例如由触摸板显示器来配置。通信单元44是可经由网络与服务器设备3进行通信的设备。存储单元45例如由存储器来配置。
通信单元44向服务器设备发出用于分发电子书数据60的请求,并且从服务器设备3接收电子书数据60。
控制单元41通过遵循从用户输入到操作单元42的指令来执行存储在存储单元45中的阅读器程序。
控制单元41还遵循并入电子书数据60中的显示控制程序59,以执行对并入电子书数据60中的页面图像51的显示控制,并且使得在显示单元43上显示页面图像51。
<电子书制作处理的概要>
图6是描绘电子书制作处理的示例的流程的流程图。通过在图2的控制设备21(微计算机)的控制下遵循程序来执行处理。程序可以电地、磁地或者通过使用其他已知方法被预先存储在记录介质中,并且可以从该记录介质进行读取。
首先,通过图像获得单元202来获得页面图像51(步骤S1),该页面图像51是布置字符区域和非字符区域的每页单元的图像。图7描绘了所获得的页面图像51的示例。
接下来,字符区域检测单元204在所获得的页面图像51中检测字符区域(步骤S2)。这里,通过字符区域检测单元204来生成字符区域信息52。图8描绘了在图7的页面图像51中所检测到的字符区域T1,T2,T3,T4,T5,T6,T7。
接下来,字符识别单元206识别所检测到的字符区域T1至T7中的字符(步骤S3)。这里,字符识别单元206生成字符信息54。
接下来,对于在字符区域T1至T7中所识别的每个字符,获得指示在页面图像51中所识别的字符的位置(坐标)的字符位置信息。这里,字符位置获得单元208生成字符位置信息55。
图9描绘了在图7的页面图像51中所识别的每个字符的位置的示例。在图9中所描绘的示例中,字符识别单元206已经在字符区域T1中识别了四个字符C1,C2,C3,C4。此外,对于在字符区域T1中所识别的字符C1,C2,C3,C4中的每一个,字符识别单元206将页面图像中的字符周围的矩形的对角线上的两个点(在该示例中,右上端和左下段)的坐标计算为字符位置信息(例如,与字符C1有关的(x11,y11)和(x12,y12))。在该示例中,页面图像的右上端作为原点(0,0),并且将附图中的水平方向作为X方向,并且将附图中的竖直方向作为y方向。如字符区域T1中的字符C1至C4,对于在字符区域T2中所识别的字符(C5,C6,C7,C8,...)中的每一个,页面图像中的字符周围的矩形的对角线上的两个点的坐标被计算为字符位置信息。类似地,在其他字符区域T3至T7中,计算字符位置信息。
接下来,作为第一读取顺序确定,读取顺序确定单元210基于页面图像51中的每个字符区域来确定页面图像51中的字符区域当中的读取顺序(步骤S5)。图10描绘了图7的页面图像51中的第一读取顺序确定结果。在该示例的页面图像51中,因为字符是日语并且纵向书写,因此基本上按照从右到左并且从上到下的顺序初步地确定读取顺序。也就是说,读取顺序被初步确定为T1→T2→T3→T4→T5→T6→T7。
接下来,作为第二读取顺序确定,读取顺序确定单元210基于页面图像51中的字符区域之间的字符之间的连续性来确定页面图像51中的字符区域当中的读取顺序(步骤S6)。图11描绘了图7的页面图像51中的第二读取顺序确定结果。在该示例中,确定字符区域之间的字符至字符的连续性是否以在步骤S5处初步确定的读取顺序中来实现。在该示例的页面图像51中,字符区域T3末尾的字符和字符区域T4开始的字符不具有语言上的连续性,字符区域T3末尾的字符和字符区域T6开始的字符具有语言上的连续性,并且字符区域T6末尾的字符和字符区域T7开始的字符具有语言上的连续性。因此,字符区域T3后面是字符区域T6,并且字符区域T6后面是字符区域T7,并且因而读取顺序从T1→T2→T3→T4→T5→T6→T7变为T1→T2→T3→T6→T7→T4→T5。
通过读取顺序确定单元210生成读取顺序信息53。在该示例中,不仅生成T1→T2→T3→T4→T5→T6→T7的字符区域中的读取顺序(字符区域顺序信息)而且还生成指示页面图像51中的字符读取顺序的信息(字符顺序信息)。字符顺序信息和字符区域顺序信息中的任何一个可以被生成。
接下来,在页面图像51的字符区域中的字符当中,锚点设置单元212对指示非字符区域中的图/表图像的编号(图/表号)的字符设置对每个非字符区域中的图或表的图像(以下简称为"图/表图像")的超链接。这里,通过锚点设置单元212来生成锚点信息56。例如,当在字符区域中存在指示非字符区域中的图或表的“图A”的图/表号的字符“图A”时,对非字符区域中的图/表图像的超链接被设置为“图A”。
接下来,生成要对页面图像添加的各种附加信息(步骤S8)。在该步骤S8中,生成除了在步骤S2至S7所生成的附加信息之外的各种附加信息。在该示例中,通过目录表信息生成单元214来生成指示与页面图像有关的每页或每多页的标题(章节标题)与页码之间的对应性的目录表信息57。而且,索引信息生成单元216生成指示关键字与页码之间的对应性的索引信息58。而且,翻译信息生成单元218生成翻译信息,翻译信息生成单元218将指示字符识别单元206所识别的字符的字符信息翻译成与字符信息的语言(在该示例中,日语)不同的语言(例如,英语)。此外,显示控制程序生成单元220生成要由阅读器设备4执行的显示控制程序59。更进一步,当字符位置信息获得单元208所获得的字符位置信息以及读取顺序确定单元210所确定的读取顺序信息不是所需要的格式时,对字符位置信息和读取顺序信息进行编辑。在该示例中,针对每个字符生成字符相关信息,包括字符ID(字符标识信息)、字符位置信息(页面图像上的坐标)、字符信息(例如“寺院”)以及字符顺序信息。例如,生成诸如<char ID=“1”,rect=“20,20,100,100”,text=“寺院”,order=“1”/>的信息。该字符相关信息与图3的字符信息54、字符位置信息55以及读取顺序信息53相对应。而且,在该示例中,页面图像中的字符顺序信息被并入在电子书数据60中。替代地,指示字符区域的字符区域信息52以及字符区域顺序信息可以被并入电子书数据60中。
接下来,电子书数据生成单元222使在步骤S2至S8生成的各种附加信息和页面图像51彼此相关联,以生成电子书数据60(步骤S9)。例如,对页面图像51添加作为附加信息的由字符区域检测单元204生成的字符区域信息52和包括由读取顺序确定单元210生成的字符区域顺序信息和字符顺序信息的读取顺序信息53、由字符识别单元206生成的字符信息54、由字符位置信息获得单元208生成的字符位置信息55、由锚点设置单元212生成的锚点信息56、由目录表信息生成单元214生成的目录表信息57、由索引信息生成单元216生成的索引信息58、以及由显示控制程序生成单元220生成的显示控制程序59,以生成电子书数据60。在该示例中,步骤S8处所生成的字符相关信息被并入在电子书数据60中。
接下来,电子书数据输出单元224输出所生成的电子书数据60(步骤S10)。
<阅读器设备处的阅读处理的概要>
描述在图5所示的阅读器设备4处阅读电子书数据60的情况。首先,阅读器设备4的通信单元44从服务器设备3获得电子书数据60。可以从可移动的记录介质获得电子书数据60。当将显示控制程序59封装在电子书数据60中时,阅读器设备4的控制单元41从电子书数据60中提取显示控制程序59,并且通过遵循显示控制程序59来执行对页面图像51的显示控制。
当通过操作单元42的操作开始显示控制程序59时,控制单元41使得显示在图7中所示的整个页面图像51。
图12描绘了在控制单元41的控制下在阅读器设备4的显示单元43上显示的电子书阅读窗80。该示例中的电子书阅读窗80设置有搜索词输入框82。
当通过操作单元42的操作将搜索词输入到搜索词输入框82时,控制单元41使得突出显示页面图像51的字符区域中的任何一个中的搜索词84(与搜索词输入框82相对应的字符区域中的字符串)。这里,突出显示是具有以与要应用于其他字符的模式不同的模式来突出显示在字符区域中配置搜索词的字符的显示。存在各种突出显示模式,例如,用与其他字符的颜色不同的颜色来显示字符、比其他字符更明亮地显示字符,提供灰度等级、在字符周围显示框等。
在图13中对图12的页面图像51中的附图标记86所表示的部分放大并描述。在该示例中,通过操作单元42输入“可重排”作为搜索词。在控制单元41的控制下,使字符区域中的搜索词“可重排”被突出显示。在该突出显示中,当搜索词经过不同的字符区域T1和T2时,控制单元41基于与页面图像51相关联的附加信息(诸如字符位置信息55和读取顺序信息53)来在字符区域T1中突出显示字符“重排”,并且在字符区域T2中突出显示“可”。即,基于页面图像51的附加信息,通过遵循字符区域的读取顺序来使跨多个字符区域的搜索词被突出显示。
而且,当通过操作单元42输入用于在全显示与重排显示之间进行切换的指令时,在控制单元41的控制下将图12中所描绘的全显示切换为在图14中所描绘的重排显示。在图14的字符串中,“图A”是非字符区域中的图/表图像的编号,并且对图/表图像(图A)的超链接被设置为该“图A”。当利用操作单元42触摸“图A”时,如在图15中所描述的显示非字符区域中的图A的图像。
在上述实施例中,描述在电子书制作装置2具有显示控制程序生成单元220并且显示控制程序59被并入到电子书数据60中的情况。然而,本发明并不局限于该示例。阅读器设备4可以具有能够基于对电子书数据60中的页面图像51添加的信息来搜索在页面图像中跨字符区域的字符串的搜索功能以及突出显示跨通过搜索所找到的字符区域的字符串。此外,阅读器设备4可以具有下述功能:该功能能够通过阅读器设备4在不改变字符区域、非字符区域和字符区域中的字符的布置的情况下显示页面图像的全显示的显示模式(第一显示模式)与通过改变字符区域中的字符的布置来重排显示的显示模式(第二显示模式)之间进行切换。
本发明不限于这里所述的示例以及在附图中所述的示例,并且更不用说,在不脱离本发明的要旨的范围之内可做出各种设计变化和改进。

Claims (12)

1.一种电子书制作装置,包括:
图像获得单元,所述图像获得单元获得表示布置字符区域和非字符区域的每页单元的图像的页面图像;
字符区域检测单元,所述字符区域检测单元检测在所述图像获得单元所获得的所述页面图像中的所述字符区域;
字符识别单元,所述字符识别单元识别所述字符区域检测单元所检测到的所述字符区域中的字符;
字符位置信息获得单元,所述字符位置信息获得单元针对在所述字符区域中所识别的所述字符中的每一个获得指示所述页面图像中的所识别的字符的位置的字符位置信息;
读取顺序确定单元,所述读取顺序确定单元基于所述页面图像中的所述字符区域的位置以及所述页面图像中在所述字符区域之间的一个字符至另一字符的连续性来确定所述页面图像中的所述字符区域当中的读取顺序;
电子书数据生成单元,所述电子书数据生成单元生成电子书数据,所述电子书数据包括指示所识别的字符的字符信息、指示所述页面图像中的所识别的字符中的每一个的位置的所述字符位置信息、以及关于与所述页面图像中的所述字符区域当中的所述读取顺序相对应的字符或字符区域的顺序信息;以及
电子书数据输出单元,所述电子书数据输出单元输出所述电子书数据生成单元所生成的所述电子书数据。
2.根据权利要求1所述的电子书制作装置,进一步包括显示控制程序生成单元,所述显示控制程序生成单元生成要由能够显示所述页面图像的阅读器设备执行的显示控制程序,所述显示控制程序具有基于添加到所述电子书数据中的所述页面图像的信息能够搜索在所述字符区域的任何一个中的字符串以及在所述页面图像中跨字符区域上的字符串的搜索功能、以及能够突出显示通过所述搜索所找到的所述字符串的显示功能,其中,
所述电子书数据生成单元将所述显示控制程序并入到所述电子书数据中。
3.根据权利要求2所述的电子书制作装置,其中,
所述显示控制程序生成单元生成显示控制程序,所述显示控制程序具有通过所述阅读器设备在第一显示模式与第二显示模式之间进行切换的功能,所述第一显示模式在不改变所述字符区域、所述非字符区域以及所述字符区域中的字符的布置的情况下显示所述页面图像,所述第二显示模式重排显示所述字符区域中的字符。
4.根据权利要求1所述的电子书制作装置,其中,
所述读取顺序确定单元基于所述页面图像中的所述字符区域的位置来初步地确定所述字符区域当中的读取顺序,并且基于在所述页面图像中的所述字符区域之间的一个字符至另一字符的连续性来对所述页面图像中的所述字符区域当中的所述读取顺序进行校正。
5.根据权利要求1所述的电子书制作装置,进一步包括目录表信息生成单元,所述目录表信息生成单元生成目录表信息,所述目录表信息指示所述页面图像的每页或每多页的标题与页码之间的对应性,其中,
所述电子书数据生成单元将所述目录表信息并入到所述电子书数据中。
6.根据权利要求1所述的电子书制作装置,进一步包括索引信息生成单元,所述索引信息生成单元生成索引信息,所述索引信息指示所述页面图像中的所述字符区域中的字符串与页码之间的对应性,其中,
所述电子书数据生成单元将所述索引信息并入到所述电子书数据中。
7.根据权利要求1所述的电子书制作装置,进一步包括锚点设置单元,所述锚点设置单元对所述页面图像中的所述字符区域中的字符当中的指示所述非字符区域中的任何一个中的部分图像的字符设置用于将显示切换为所述非字符区域中的部分图像的锚点。
8.根据权利要求1所述的电子书制作装置,进一步包括翻译信息生成单元,所述翻译信息生成单元生成翻译信息,所述翻译信息是通过将指示由所述字符识别单元所识别的字符的字符信息翻译成与所述字符信息的语言不同的语言来获得的,其中,
所述电子书数据生成单元将所述翻译信息并入到所述电子书数据中。
9.一种电子书系统,所述电子书系统包括根据权利要求1至8中的任何一项所述的电子书制作装置以及获得从所述电子书制作装置输出的所述电子书数据并且显示所述电子书数据中的所述页面图像的阅读器设备。
10.根据权利要求9所述的电子书系统,其中,所述阅读器设备具有基于添加到所述电子书数据中的所述页面图像的信息能够搜索在所述字符区域中任何一个中的字符串和在所述页面图像中跨字符区域上的字符串的搜索功能以及能够突出显示通过所述搜索找到的所述字符串的显示功能。
11.根据权利要求9所述的电子书系统,其中,所述阅读器设备具有通过所述阅读器设备在第一显示模式与第二显示模式之间进行切换的功能,所述第一显示模式在不改变所述字符区域和所述非字符区域的布置以及所述字符区域中的字符的布置的情况下显示所述页面图像,所述第二显示模式通过改变所述字符区域中的字符的布置来重排显示。
12.一种电子书制作方法,包括:
图像获得步骤,所述图像获得步骤获得表示布置字符区域和非字符区域的每页单元的图像的页面图像;
字符区域检测步骤,所述字符区域检测步骤检测在所述图像获得步骤中所获得的所述页面图像中的所述字符区域;
字符识别步骤,所述字符识别步骤识别在所述字符区域检测步骤中所检测到的所述字符区域中的字符;
字符位置信息获得步骤,所述字符位置信息获得步骤针对在所述字符区域中识别的字符中的每一个来获得指示所述页面图像中的所识别的字符的位置的字符位置信息;
读取顺序确定步骤,所述读取顺序确定步骤基于所述页面图像中的所述字符区域的位置以及所述页面图像中的所述字符区域之间的字符至字符的连续性来确定所述页面图像中的所述字符区域当中的读取顺序;
电子书数据生成步骤,所述电子书数据生成步骤生成电子书数据,所述电子书数据包括指示所识别的字符的字符信息、指示所述页面图像中的所识别的字符中的每一个的位置的字符位置信息、以及关于与所述页面图像中的所述字符区域当中的所述读取顺序相对应的字符或字符区域的顺序信息;以及
电子书数据输出步骤,所述电子书数据输出步骤输出在所述电子书数据生成步骤中所生成的所述电子书数据。
CN201410126642.6A 2013-03-29 2014-03-31 电子书制作装置、电子书系统以及电子书制作方法 Pending CN104077270A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013073106A JP2014197341A (ja) 2013-03-29 2013-03-29 電子書籍制作装置、電子書籍システム、電子書籍制作方法及びプログラム
JP2013-073106 2013-03-29

Publications (1)

Publication Number Publication Date
CN104077270A true CN104077270A (zh) 2014-10-01

Family

ID=51598530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410126642.6A Pending CN104077270A (zh) 2013-03-29 2014-03-31 电子书制作装置、电子书系统以及电子书制作方法

Country Status (3)

Country Link
US (1) US20140298164A1 (zh)
JP (1) JP2014197341A (zh)
CN (1) CN104077270A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857302A (zh) * 2019-01-29 2019-06-07 掌阅科技股份有限公司 电子书信息的修复方法、电子设备及计算机存储介质
CN111078982A (zh) * 2019-06-09 2020-04-28 广东小天才科技有限公司 一种电子页面的检索方法、电子设备及存储介质
CN112463010A (zh) * 2019-09-06 2021-03-09 富士施乐株式会社 信息处理装置及记录媒体
CN113283432A (zh) * 2020-02-20 2021-08-20 阿里巴巴集团控股有限公司 图像识别、文字排序方法及设备

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6086851B2 (ja) * 2013-09-18 2017-03-01 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
CA2991100C (en) * 2015-07-10 2023-10-17 Rakuten, Inc. Electronic book display device, electronic book display method, and program
US10318559B2 (en) * 2015-12-02 2019-06-11 International Business Machines Corporation Generation of graphical maps based on text content
KR102553886B1 (ko) 2015-12-24 2023-07-11 삼성전자주식회사 전자 장치 및 전자 장치의 이미지 제어 방법
JP7003457B2 (ja) * 2017-06-26 2022-01-20 コニカミノルタ株式会社 文書再構成装置
US10410324B2 (en) 2017-10-31 2019-09-10 International Business Machines Corporation Displaying computer graphics according to arrangement and orientation attributes
US11176310B2 (en) * 2019-04-01 2021-11-16 Adobe Inc. Facilitating dynamic document layout by determining reading order using document content stream cues

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115826A (ja) * 1997-06-25 1999-01-22 Toshiba Corp 文書解析装置及び方法
JPH11328200A (ja) * 1998-05-15 1999-11-30 Matsushita Electric Ind Co Ltd 画像検索装置および方法ならびに情報記録媒体
US20020101620A1 (en) * 2000-07-11 2002-08-01 Imran Sharif Fax-compatible Internet appliance
CN102479173A (zh) * 2010-11-25 2012-05-30 北京大学 识别版面阅读顺序的方法及装置
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096901A (ja) * 1995-06-22 1997-01-10 Oki Electric Ind Co Ltd 文書読取装置
JPH10228473A (ja) * 1997-02-13 1998-08-25 Ricoh Co Ltd 文書画像処理方法、文書画像処理装置および記憶媒体
JP2000250908A (ja) * 1999-02-26 2000-09-14 Planet Computer:Kk 電子書籍の作成支援装置
US6976032B1 (en) * 1999-11-17 2005-12-13 Ricoh Company, Ltd. Networked peripheral for visitor greeting, identification, biographical lookup and tracking
US20080133388A1 (en) * 2006-12-01 2008-06-05 Sergey Alekseev Invoice exception management
US8172659B2 (en) * 2009-08-14 2012-05-08 Nitza Agam Electronic game that is not limited in the number of players or length of play
JP2011175569A (ja) * 2010-02-25 2011-09-08 Sharp Corp 文書画像生成装置、文書画像生成方法及びコンピュータプログラム
JP5538161B2 (ja) * 2010-09-24 2014-07-02 シャープ株式会社 電子書籍データ作成装置、電子書籍データ作成方法、プログラム及びその記録媒体
US20150199314A1 (en) * 2010-10-26 2015-07-16 Google Inc. Editing Application For Synthesized eBooks
US9195637B2 (en) * 2010-11-03 2015-11-24 Microsoft Technology Licensing, Llc Proportional font scaling
JP5812702B2 (ja) * 2011-06-08 2015-11-17 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文字の読み順を決定するための読み順決定装置、方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115826A (ja) * 1997-06-25 1999-01-22 Toshiba Corp 文書解析装置及び方法
JPH11328200A (ja) * 1998-05-15 1999-11-30 Matsushita Electric Ind Co Ltd 画像検索装置および方法ならびに情報記録媒体
US20020101620A1 (en) * 2000-07-11 2002-08-01 Imran Sharif Fax-compatible Internet appliance
CN102479173A (zh) * 2010-11-25 2012-05-30 北京大学 识别版面阅读顺序的方法及装置
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109857302A (zh) * 2019-01-29 2019-06-07 掌阅科技股份有限公司 电子书信息的修复方法、电子设备及计算机存储介质
CN111078982A (zh) * 2019-06-09 2020-04-28 广东小天才科技有限公司 一种电子页面的检索方法、电子设备及存储介质
CN111078982B (zh) * 2019-06-09 2023-11-24 广东小天才科技有限公司 一种电子页面的检索方法、电子设备及存储介质
CN112463010A (zh) * 2019-09-06 2021-03-09 富士施乐株式会社 信息处理装置及记录媒体
CN113283432A (zh) * 2020-02-20 2021-08-20 阿里巴巴集团控股有限公司 图像识别、文字排序方法及设备

Also Published As

Publication number Publication date
US20140298164A1 (en) 2014-10-02
JP2014197341A (ja) 2014-10-16

Similar Documents

Publication Publication Date Title
CN104077270A (zh) 电子书制作装置、电子书系统以及电子书制作方法
US20140143721A1 (en) Information processing device, information processing method, and computer program product
CN112507806B (zh) 智慧课堂信息交互方法、装置及电子设备
CN109766879A (zh) 字符检测模型的生成、字符检测方法、装置、设备及介质
CN113343815B (zh) 一种pdf等版式文档中识别表格的方法
JP2013089195A (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
CN115393872B (zh) 一种训练文本分类模型的方法、装置、设备及存储介质
CN112487871A (zh) 笔迹数据处理方法、装置及电子设备
US9141867B1 (en) Determining word segment boundaries
CN111062262B (zh) 发票识别方法以及发票识别装置
CN112486338A (zh) 医疗信息处理方法、装置及电子设备
US20240143163A1 (en) Digital ink processing system, method, and program
Ouali et al. Architecture for real-time visualizing arabic words with diacritics using augmented reality for visually impaired people
US9619126B2 (en) Computer-readable non-transitory storage medium with image processing program stored thereon, element layout changed material generating device, image processing device, and image processing system
CN112487876A (zh) 智能笔字符识别方法、装置及电子设备
JP2013020477A (ja) 画像処理装置およびプログラム
CN115114481A (zh) 文档格式转换方法、装置、存储介质及设备
CN112487774B (zh) 书写表单电子化方法、装置及电子设备
CN103488619A (zh) 一种用于进行文档文件处理的方法及装置
CN104850316B (zh) 电子图书字体调整方法及装置
CN113709584A (zh) 视频划分方法、装置、服务器、终端及存储介质
CN112487897A (zh) 笔迹内容评价方法、装置及电子设备
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
CN111476090A (zh) 水印识别方法和装置
CN113535017B (zh) 一种绘本文件的处理、同步显示方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141001