CN103348338A

CN103348338A - 文件格式、服务器、数字漫画的观看器设备、数字漫画产生设备

Info

Publication number: CN103348338A
Application number: CN2011800621938A
Authority: CN
Inventors: 野中俊一郎
Original assignee: Fujifilm Corp
Current assignee: Fujifilm Corp
Priority date: 2010-12-22
Filing date: 2011-11-24
Publication date: 2013-10-09
Also published as: JP2012133659A; US8719029B2; US20130282376A1; WO2012086356A1

Abstract

用户终端可以基于关于文件格式的气球区域的信息，以滚动视图和格视图两者来显示用于指示在发言气球中的对话的第一文本信息，并且可以在气球区域中恰当地配置原始语言的对话或从原始语言转换为任何语言的对话的字符串。

Description

文件格式、服务器、数字漫画的观看器设备、数字漫画产生设备

技术领域

本发明涉及用于数字化漫画内容的文件格式。

背景技术

随着近来在信息技术上的创新，已经建立了信息传递系统，其中，将应该被印刷在纸张上的、诸如杂志和漫画书的书籍数字化，并且在诸如iPad和Kindle的专用数字图书观看器上观看该书籍。

根据专利文献1，以除了日语之外的预定语言B来书写装订漫画书，并且在一个实施例中，以英语来书写装订漫画书。

根据专利文献2，根据页面顺序将垂直书写的文件确定为从左打开。

根据专利文献3，当垂直地书写原文并且水平地书写翻译文本时，旋转布局信息以将布局转换为水平布局。

根据专利文献4，基于显示大小、字体大小或文字方向等来设置实时数据显示速度（ticker display speed）。

根据专利文献5，格特征被转换为得分，并且根据该得分来应用诸如变焦和摇摄的效果。

根据专利文献6，基于环境文件来确定基本主名称、对话层名称、对话段落风格名称、格编号层名称、格编号段落风格名称、草图层名称、红宝石线间隔量、文本方向和缩放因子。

专利文献7涉及块（对应于发言气球）、文本属性和锚定（页面切换）。

根据专利文献8，提取与履历信息相关的音乐内容信息来播放音乐。

根据专利文献9，相对于漫画产生事件（语音再现操作、振动等）。例如，当存在尖叫等时，将声效设置为高、大声和长的音调。

根据专利文献10，将在被触摸部分中的文本输出为语音。

根据专利文献11，以不同的音调或以用户喜好的音调来再现不同人物的语音。与图像显示同步地再现该语音。以不同的颜色来显示当前再现的语音部分。

根据专利文献12，在发言气球中的文字被转换为语音。因为输出语音的说话者的嘴部移动，所以清楚地指示在人物和发言气球之间的关系。

{引用列表}

{专利文献}

{PTL1}日本专利申请公开No.2008-51872

{PTL2}日本专利申请公开No.2005-303880

{PTL3}日本专利申请公开No.06-96288

{PTL4}日本专利申请公开No.2008-170544

{PTL5}日本专利申请公开No.2007-037057

{PTL6}日本专利申请公开No.2006-185435

{PTL7}日本专利申请公开No.2005-056043

{PTL8}日本专利申请公开No.2010-068044

{PTL9}日本专利申请公开No.2007-241942

{PTL10}日本专利申请公开No.2007-102360

{PTL11}日本专利申请公开No.2005-321706

{PTL12}日本专利申请公开No.2004-194002

发明内容

{技术问题}

需要基于每一个终端的规格来改变再现数字漫画的方法。例如，可以不在具有小显示屏幕的移动电话中显示数字漫画的整个页面。因此，终端本身优选地确定如何显示页面的一部分。然而，传统技术不涉及对于该确定需要何种信息。

本发明提供了一种文件格式，该文件格式使得能够在发言气球区域内恰当地配置原始语言的对话的文字串和从原始语言的对话转换为任何语言的对话的文字串。

{对于问题的解决方案}

本发明提供了一种用于在观看器设备上观看的数字漫画的文件格式，该文件格式包括：用于漫画的每一个页面的整个页面的高清晰度图像；发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，该第一文本信息指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；以及，第一显示控制信息，该第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在该观看器设备的监控器上观看该整个页面的图像。

本发明提供了一种用于在观看器设备上观看的数字漫画的文件格式，该文件格式包括：漫画的每一个格的格图像（panel image）；发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该格图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，用于指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；以及，第二显示控制信息，该第二显示控制信息包括各个格图像的再现顺序和该格图像的图像大小，以便使得能够以格视图在该观看器设备的监控器上观看该格图像。

本发明提供了一种用于在观看器设备上观看的数字漫画的文件格式，该文件格式包括：漫画的每一个页面的整个页面的高清晰度图像；发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，该第一文本信息指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；第一显示控制信息，该第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在该观看器设备的监控器上观看该整个页面的图像；以及，第二显示控制信息，该第二显示控制信息包括格区域信息，该格区域信息指示各个格图像的在该整个页面的图像内的区域、各个格图像的再现顺序和所述格图像的图像大小，以便使得能够以格视图在该观看器设备的监控器上观看该整个页面的图像内的各个格的格图像。

该发言气球信息包括发言气球顶点的位置信息和发言气球线的类型的至少一种。

该文件格式包括存在区域信息，该存在区域信息指示在该整个页面的图像内的人物的区域。

该文件格式包括存在区域信息，该存在区域信息指示在该格图像内的人物的区域。

该文件格式包括第二文本信息，该第二文本信息指示在除了该发言气球区域之外的区域中的拟声或文字，该第二文本信息与每一个格相关。

该第一文本信息包括通过将在该发言气球内的原文的对话翻译为预定语言而获得的翻译文本。

该第二文本信息包括通过将在除了该发言气球区域之外的区域中的原文的拟声或文字翻译为预定语言而获得的翻译文本。

该文件格式包括关于该翻译文本的语言的信息。在此，关于语言的信息包括语言类型、在水平书写的情况下的阅读方向、垂直书写或水平书写等。

该第一文本信息包括在各个发言气球内的对话的人物的属性。在此，人物的属性包括性别或年龄等。

该第一文本信息包括在各个发言气球内的对话的文字的属性信息。在此，文字的该属性信息包括字体、点大小、文字间隔、行距和强调文字。

该第一文本信息包括用于在各个发言气球内的对话的语音的音量和读速度的至少一种的第一附属信息。

该第二文本信息包括在除了该发言气球区域之外的区域中的拟声或文字的属性信息。

该第二文本信息包括该拟声的发声数量、以及该拟声或文字的发声开始时间、音量和读速度的至少一种的第二附属信息。

该第一显示控制信息包括屏幕转变的场景（scenario），该场景包括在该滚动视图中在每一个锚定点处的停止时间。

该第二显示控制信息包括屏幕转变的场景，该场景包括在格视图中在每一个格图像处的停止时间。

该文件格式包括标签信息，该标签信息包括漫画题目、第几节、第几卷、作者和出版社。

本发明包括一种服务器，该服务器用于根据来自观看器设备的请求来传递采用如上所述的文件格式的数字漫画。

本发明包括一种用于数字漫画的观看器设备，包括：显示装置；信息获取装置，该信息获取装置获取采用如上所述的文件格式的数字漫画；图像显示控制装置，该图像显示控制装置基于所获取的数字漫画的显示控制信息，在该显示装置的屏幕上滚动再现或格再现每一个页面或每一个格的图像；以及，文字显示控制装置，该文字显示控制装置基于所获取的数字漫画的发言气球信息和文本信息，代替在该显示装置的屏幕上显示的图像中的发言气球区域内的原始文字，而显示与所获取的数字漫画的文本信息对应的文字。

本发明包括一种数字漫画产生设备，包括：图像获取装置，该图像获取装置获取漫画的每个页面的整个页面的高清晰度图像；页面信息分析装置，该页面信息分析装置分析所获取的图像，并且由此获取：发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，该第一文本信息指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；以及，第一显示控制信息，该第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在观看器设备的监控器上观看该整个页面的图像；以及，数字漫画产生装置，该数字漫画产生装置产生采用如下文件格式的数字漫画，该文件格式包括由该图像获取装置获取的该整个页面的高清晰度图像，以及由该页面信息分析装置获取的该发言气球信息、该第一文本信息和该第一显示控制信息。

本发明包括一种数字漫画产生设备，包括：图像获取装置，该图像获取装置获取漫画的每一个页面的整个页面的高清晰度图像；页面信息分析装置，该页面信息分析装置分析所获取的图像，并且由此获取：格区域信息，该格区域信息指示在该整个页面的图像内的各个格的格图像的区域；发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该格图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，该第一文本信息指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；以及，第二显示控制信息，该第二显示控制信息包括各个格图像的再现顺序和该格图像的图像大小，以便使得能够以格视图在该观看器设备的监控器上观看该格图像；格图像产生装置，该格图像产生装置通过基于由该页面信息分析装置获取的该格区域信息，从该高清晰度图像切出格图像来产生格图像；以及，数字漫画产生装置，该数字漫画产生装置产生采用如下文件格式的数字漫画，该文件格式包括由该格图像产生装置产生的格图像，以及由该页面信息分析装置获取的发言气球信息、第一文本信息和第二显示控制信息。

本发明包括一种数字漫画产生设备，包括：图像获取装置，该图像获取装置获取漫画的每一个页面的整个页面的高清晰度图像；页面信息分析装置，该页面信息分析装置分析所获取的图像，并且由此获取：格区域信息，该格区域信息指示在该整个页面的图像内的各个格的格图像的区域；发言气球信息，该发言气球信息包括发言气球区域的信息，该发言气球区域的信息指示发言气球的在该图像内的区域，在该发言气球中布置该漫画的人物的对话；第一文本信息，该第一文本信息指示在各个发言气球内的对话，该第一文本信息与每一个发言气球相关；第一显示控制信息，该第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在该观看器设备的监控器上观看该整个页面的图像；以及，第二显示控制信息，该第二显示控制信息包括各个格图像的再现顺序和该格图像的图像大小，以便使得能够以格视图在该观看器设备的监控器上观看该格图像；以及，数字漫画产生装置，该数字漫画产生装置产生采用如下文件格式的数字漫画，该文件格式包括由该图像获取装置获取的该整个页面的高清晰度图像，以及由该页面信息分析装置获取的格区域信息、发言气球信息、第一文本信息、第一显示控制信息和第二显示控制信息。

{本发明的有益效果}

根据本发明，该观看器设备可以以滚动视图和格视图两者来基于该文件格式的发言气球区域的信息来显示用于指示在每一个发言气球内的对话的第一文本信息，并且可以在发言气球区域内恰当地配置原始语言的对话的文字串以及从该原始语言的对话转换为任何语言的对话的文字串。

附图说明

图1是内容再现系统的示意配置图。

图2是内容文件的概念说明视图。

图3A是图示关于发言气球的形状的信息的一个示例的视图（正常）。

图3B是图示关于发言气球的形状的信息的一个示例的视图（大声的语音）。

图3C是图示关于发言气球的形状的信息的一个示例的视图（想象）。

图3D是图示关于发言气球的形状的信息的一个示例的视图（无生命对象）。

图4是传递处理的流程图。

图5是显示处理的流程图（滚动视图）。

图6是显示处理的流程图（格视图）。

图7是对话处理的流程图。

图8是图示在发言气球中的文本信息（水平）的显示的一个示例的视图。

图9是图示在发言气球中的文本信息（垂直）的显示的一个示例的视图。

图10是图示关于与显示的详细图像对应的语音再现的信息的一个示例的视图。

图11是图示在发言气球中的文本信息的显示的另一个示例（一行的滚动）的视图。

图12是图示在发言气球中的文本信息的显示的另一个示例（螺旋滚动）的视图。

图13是图示在发言气球中的文本信息的显示的另一个示例（多行的滚动）的视图。

图14是图示在发言气球中的文本信息的显示的另一个示例（根据发言气球的形状的螺旋滚动）的视图。

具体实施方式

<第一实施例>

图1示出根据本发明的优选实施例的内容传递系统的配置。该系统包括服务器1和数字图书观看器2。服务器1由计算机（信息处理器）构成，该计算机包括运算设备（CPU）、存储用于操作运算设备所需的程序和数据的存储器设备、输入输出电路等。

数字图书观看器2是包括能够再现图像的显示装置、通信装置、运算设备（CPU）、存储器设备、输入输出电路、操作装置或能够再现语音的语音再现装置等的信息终端，并且例如由智能电话或平板计算机构成。未指定的大量的数字图书观看器2可以访问服务器1。

更具体而言，服务器1包括页面信息分析部10、数据库（DB）11、操作部16和输入输出部17。

页面信息分析部10由诸如CPU的信息处理器构成。DB11由诸如硬盘和存储器的存储介质构成。操作部16是诸如键盘、鼠标和触摸板的操作装置。

DB11累积内容文件，该内容文件以预定格式存储与页面编号相关的内容图像和其附带的信息。通过经由扫描器等数字化原始内容来获得内容图像。以页面为单位来设置原始内容，诸如漫画、报纸、在周刊中的文章、办公文件（演示文件等）、课本和参考书。原始内容图像也与页面编号相关。

该内容图像及其附属信息可以被以任何格式存储，并且被存储在XML文件等中。该附属信息可以被记录在原始内容图像上。附属信息可以包括内容作者、题目、总页数、卷号、节号或版权的拥有者等。

该内容图像包括示意图像和详细图像（高清晰度数据），对于每一个页面、格或锚定点分别准备该示意图像和详细图像。

内容图像附带的附属信息包括从操作部16输入的信息、关于通过页面信息分析部10的分析结果的信息或经由输入输出部17输入的信息。

图2是内容文件的概念说明视图。该内容文件包括下述两者：用于滚动视图的内容文件，包括每一个页面的示意图像和与在页面中的每一个锚定点对应的详细图像；以及，用于格视图的内容文件，包括用于每一个页面的示意图像和用于每一个格的详细图像。虽然在本实施例中，数字漫画信息由一个文件构成，但是通过在分开的文件中存储内容图像和附属信息，该数字漫画信息可以由多个文件构成。

标头指示文件属性（文件名等）。

附属信息由下述信息构成：搜索标签信息、发言气球信息、文本信息、人物信息、显示控制信息、自动朗读的属性信息、再现效果信息、页面信息和其他信息。

搜索标签信息：搜索标签信息是用于搜索的标签信息。其示例可以包括诸如页面编号（页面识别信息）、格编号（格识别信息）、节号（例如指示第几节的节识别信息）、题目、作者、出版商（版权的拥有者）和总页面数的信息。

发言气球信息：发言气球信息是关于在以页面为单位（或以格为单位）的内容图像中的发言气球的信息。其示例包括：发言气球区域信息，用于指示发言气球的在内容图像内的存在区域；发言气球的形状；发言气球的起点（发言气球的顶点）的位置和方向；发言气球的线属性（虚线、实线等）；在内容图像的元素（说话者等）和发言气球的起点之间的相对位置关系（例如，在发言气球的顶点和由发言气球顶点指示的说话者的面部之间的最小间隔）；发言气球的大小；发言气球的说话者的识别信息；以及，发言气球所属的格。发言气球区域信息例如是用于指示在内容图像内的发言气球的线（框线）的位置的信息（例如，在与发言气球的形状对应的线上的多个点的位置信息或整条线的向量信息）。发言气球区域信息可以是位图信息，用于指示发言气球的整个区域（范围）。也可以通过发言气球的特定位置（中心位置）和发言气球的大小来表示发言气球区域信息。例如，当存在如图3A至3D中所示的四种类型的发言气球时，分别与发言气球对应的识别信息A至D被存储为发言气球的线属性。

文本信息：文本信息是关于在内容图像内的文本的信息。其示例包括与每一个格和每一个发言气球对应的文本（语句）、文字属性信息、行的数量、行距、文字间距、显示切换方法、所使用的语言和垂直书写/水平书写或读方向的区分。文字属性信息包括文字大小（点大小等）和文字类别（字体、强调文字等）。在文本信息中包括在发言气球中的说话者的对话。也可以在文本信息中包括在发言气球内配置的与原文的对话对应的、各种语言的翻译文本及其所使用的语言（可以将翻译的文本翻译为两种或更多种语言）。可以在文本信息中进一步包括在发言气球外部配置的文本（叙述、用于指示拟声的文字串等）、其翻译文本和该文本的属性（文字大小、字体、文本修饰等）及其朗读属性（音量、速度、重复计数、开始/结束时间等）。显示切换方法可以包括滚动速度、滚动方向和诸如用于开始、结束、暂停和重复滚动的方法的滚动方法。

人物信息：人物信息是关于在发言气球中的对话的说话者的信息。其示例包括：说话者区域信息（面部区域信息等），用于指示在内容图像（示意图像和详细图像）内的说话者（人物）的存在区域；说话者的识别信息（姓名等）以及说话者的属性（性别、年龄等）。说话者意指在发言气球中的对话（发言）的产生源，并且不仅包括人，而且包括动物，以及诸如电话、个人计算机、电子设备和机器人的无生命对象。

显示控制信息是关于以页面为单位或以格为单位的显示控制的信息。

用于滚动视图的显示控制信息使得能够通过将图像从当前锚定点向下一个锚定点移动（滚动）并且将在每一个锚定点处的图像停止期望的时间长度（预设停留时间或直到手动指令滚动到下一个锚定点的时间）来观看整个页面的图像，该用于滚动视图的显示控制信息包括在整个页面的图像上的每一个锚定点的位置信息（坐标）、各个锚定点的转变顺序或停留时间等。

用于格视图的显示控制信息使得能够通过根据格顺序从整个页面的图像切出格图像并且将切出的格图像停止期望的时间长度（预设停留时间或直到手动指令下一个格馈送的时间）来观看格图像，该用于格视图的显示控制信息包括用于指示在整个页面的图像内的每一个格图像的区域的格区域信息、相应的格图像的再现顺序、格图像的图像大小或停留时间等。

格区域信息包括：（1）通过多边形来表示并且由此通过在整个页面的图像上的多边形的所有顶点的位置信息（坐标）来表示“格”的信息；以及，（2）通过掩蔽图像（二进制图像，其中，格区域是1，并且除了格之外的区域是0）来表示“格”的信息。也可以以独立于上面的（1）和（2）来增加使能分层表达的项（关于格的数据项），该分层表达用于如同格存在于格内地指示（例如，“在格中的格”、“格所属的格”）。在使得能够通过直接地获取根据格顺序从整个页面的图像切出的格图像并且将所获取的格图像停止期望的时间长度而观看格图像的格视图的情况下，在如上所述的显示控制信息中的格区域信息（用于从整个页面的图像切出格图像的信息）变得不必要。

显示控制信息也包括屏幕滚动和/或屏幕切换。屏幕滚动信息可以包括作为详细信息的滚动速度、滚动方向、滚动顺序和用于开始、结束、暂停和重复滚动的方法。该屏幕切换信息可以包括作为详细信息的切换单位（格等）、用于确定切换定时的方法（手动、自动、半自动）和切换附带的显示效果（擦除、淡入/淡出、消融）。

自动朗读的属性信息：其示例包括读速度、音量和说话者的情绪。

显示控制信息包括再现场景。该再现场景包括：作为内容图像的部分显示区域的单位的详细图像的放大因子；从与前一个锚定点对应的详细图像向与下一个锚定点对应的详细图像的显示切换速度和显示切换方法（滚动、淡出/淡入等）；作为在每一个锚定点或每一个格处的视线停止时间长度的停留时间，即，与每一个锚定点对应的详细图像的显示时间长度；在内容中的示意图像和详细图像的等级（页面、部分）；锚定点的转变顺序；或者，标题信息等。锚定点意指在每一个页面的图像的部分区域（通常为格或格的一部分）内视线停止的位置（眼睛停止）。

再现场景包括适合于在与每一个锚定点对应的详细图像中的文本量的停留时间。当在每一个锚定点周围的详细图像中存在更大的文本量时，在一个屏幕中对应地存在更大量的信息。因此，在再现场景下将停留时间对应地设置得更长。

替代地，在访问服务器1的数字图书观看器2中设置在每一个锚定点处的详细图像的放大因子，或者，在再现场景中设置适合于每一个模型的屏幕大小的、用于每一个模型的停留时间。

替代地，在再现场景中设置在锚定点之间的显示切换速度。可以基于作为与访问服务器1的数字图书观看器2的用户对应的再现状态信息而获取的过去的观看速度来确定该速度，或者，可以通过向预定运算表达式（平均值等）应用从再现相同的再现内容的多个数字图书观看器2作为再现状态信息获取的过去观看速度，来确定该速度。

显示切换方法可以根据从数字图书观看器2的用户向操作部27的指令而被确定，可以采用预定的默认切换方法，或者可以基于内容分析信息而被设置。例如，当在格a内的内容中的人物的视线被朝向锚定点移向的格b引导时，从格a至格b的显示切换方法被设置为滚动。

关于读语音的信息：其示例包括读语音的内容、开始/结束时间、读速度、读音量和读出说话者的属性（性别、年龄等）。读语音的内容可以是记录的语音或人工语音。当读语音的内容是人工语音时，该内容可以与发言气球和/或附带语音的内容共享。

页面信息：其示例包括从左打开/从右打开与换行方向（在垂直书写的情况下）。

关于附带语音的信息：其示例包括拟声或音效的内容（原文和翻译文本的文本信息）、出现次数、出现格、量、开始时间/结束时间、速度和音量。拟声可以通过信息分析部10从内容图像获取，或者可以从输入输出部17等输入。例如，将在发言气球中未包括的文字信息获取为拟声的内容。也可以在该信息中包括与拟声对应的各种语言的翻译文本。

关于再现效果的信息：其示例包括诸如终端振动、屏幕摇动、屏幕闪烁和屏幕切换的效果的类型和开始时间。

可变性信息指示是否可以改变布局，诸如屏幕的放大。

其他信息：其示例包括页面边距区域和在该区域中配置的广告数据。在该其他信息中包括的可变性信息是指示是否可以修改原始内容，诸如是否可以改变布局的设置信息。例如，该信息指示是否允许翻译显示、发言气球放大、在发言气球形状上的改变、图像改变、对话或拟声的朗读、整个页面的左右反转。可以相对于每一个修改项独立地设置是否可以修改原始内容。例如，可以设置为使得允许翻译显示，但是禁止整个页面的左右反转。也可以设置为使得允许滚动再现（滚动视图），但是禁止格再现（格视图）。替代地，该其他信息包括诸如关于翻页的信息（例如，从左打开/从右打开）和换行方向（在垂直书写的情况下）的页面信息。

页面信息分析部10分析在DB11中累积的内容图像。作为分析结果获取的信息被提供为附属信息。例如，关于页面分析结果的信息包括在每一个页面中的内容元素（格、绘图、在绘图中的人物类型、发言气球、对话、文本、表格、附图等）的布局、该内容元素的读顺序、人物特征（人物名称、人物的视线方向、人物大小和位置等）、诸如对话的文本的内容、其位置和量（文字的数量）或者页面/部/章节等的分段等。

通过页面信息分析部10使用已知的图像分析技术或文本分析技术来分析和获取页面信息。例如，诸如面部、动物、建筑物、汽车和其他对象的内容元素的位置、大小和类型可以基于关于其图像信息的特征量而被自动检测。可以基于机器学习来自动地检测内容元素。例如，基于用于学习的采样漫画来以经验为主地设置检测格或发言气球的外边缘的精度和除了作为格或发言气球的矩形区域之外的区域的有效性的确定阈值。

替代地，可以通过OCR来识别在发言气球内的文本语句（对话），并且，可以将在该文本语句周围的区域识别为对话区域。根据文字方向来排序所得出的对话的各个文字。例如，当垂直地书写对话时，从行的顶部向底部，并且也从右列向左列排序文字。

根据预定规则来确定格编号或对话编号。例如，当内容的类型是漫画时，通过在从最右上位置处的格或发言气球向最左下位置处的格或发言气球在水平方向上依序扫描在内容分析信息中包括的相应格或相应发言气球的代表点（格或发言气球的中心或重心），来确定页面编号或对话编号。

每一个格的代表点被提供作为对于在每一个页面中的内容元素的视线的停止的位置（锚定点）。通过滚动或切换来在锚定点处以单位来切换内容显示。

替代地，虽然在附图中未示出，但是可以根据对于内容的作者的规则来确定页面编号或对话编号。

替代地，内容分析规则可以不仅是根据内容的作者或类型的规定规则，而且是通过人工智能学习的、根据内容的作者或类型的规则。

例如，如下学习规则。首先，对于多个基本模式的每一个初步准备正确的规则。页面信息分析部10提取用于多个基本模式的每一个的特征量（格边界线的厚度或长度等）。页面信息分析部10基于所提取的特征量来估计由内容建立者采用的格的读顺序。页面信息分析部10通过将为每一个基本模式估计的读顺序与正确的规则比较，来优化用于估计格的读顺序的参数。页面信息分析部10根据该优化的参数来估计漫画的格的读顺序。

为了说明的简化，假定原始内容是漫画，并且，假定原始内容图像是与漫画的每一个页面对应的图像。漫画意指由画面（不论是照片或绘图）和对话两者构成的内容。

服务器1包括图像获取装置（未示出），该图像获取装置经由记录介质或网络获取与漫画的每一个页面对应的整个页面的图像（高清晰度图像），或者通过由扫描器读取漫画来获取图像，并且页面信息分析部10通过分析所获取的图像而自动地获取如上所述的各种附属信息。页面信息分析部10也可以配备格图像产生功能，以通过从整个页面的图像切出用于格视图的格图像来产生格图像，或者，可以在服务器中设置格图像产生装置，该格图像产生装置通过从页面信息分析部10获取格区域信息并且从整个页面的图像切出用于格视图的格图像来产生格图像。

可以通过操作操作部16来校正由页面信息分析部10获取的各种附属信息。也可以通过操作部16来增加附属信息。

产生并在DB11中存储包括如上所述获取的与各个页面对应的整个页面的高清晰度图像或格图像、以及伴随图像的附属信息的文件格式的数字漫画。本发明不限于其中服务器1本身包括产生数字漫画的数字漫画产生部的情况，并且可以在服务器1的DB11中存储由外部数字漫画产生设备产生的数字漫画。

再一次参见图1，数字图书观看器2由诸如智能电话和平板计算机的便携信息终端构成，并且包括能够再现图像的显示装置、通信装置、操作检测装置、语音再现装置或信息处理器等。

更具体地，数字图书观看器2包括数据库（DB）21、显示部24、内容显示控制部25、语音再现部26、操作部27、扬声器28和输入输出部29。

显示部24是由诸如LCD的显示设备构成的显示装置。操作部27是由触摸板等构成的操作检测装置。操作部27优选地被层叠在显示部24上，并且可以检测在显示部24上的各种操作，诸如单击、双击、擦过和按压。

语音再现部26是从在内容文件中存储的关于语音的信息（关于读语音的信息和/或关于附带语音的信息）产生语音的电路，并且从扬声器28输出语音。

输入输出部29是用于将从服务器1的输入输出部17输出的内容文件输入的装置。输入输出部17和输入输出部29通常是通信装置。该输入输出部也可以是相对于计算机可读的记录介质的写入/读取装置。

DB21存储与DB11的信息等同的信息。即，当数字图书观看器2向服务器1请求数字图书的发送时，服务器1经由输入输出部29向DB21输出在DB11中的内容文件，并且在DB21中存储该内容文件。在DB11中的信息和在DB21的信息不必完全彼此相同。DB11是存储各种类型的内容图像的库，该各种类型的内容图像例如是不同的作者的漫画的相应容量的内容图像，以便响应于来自不同用户的请求。足够的是，DB21仅存储与数字图书观看器2的用户要观看的内容相关的内容文件。

内容显示控制部25执行内容在显示部24上的显示控制。下面将详细描述该控制。

图4示出在服务器1和数字图书观看器2之间执行的传递处理的流程图。通过数字图书观看器2来执行步骤S1和S4，并且通过服务器1来执行步骤S2和S3。在服务器1和数字图书观看器2的每一个中设置的、计算机可读的存储介质（RAM、ROM、CDROM等）中存储允许服务器1和数字图书观看器2分别执行该处理的程序。

在步骤S1中，数字图书观看器2经由输入输出部28向服务器1发送内容请求。

在步骤S2中，服务器1等待与滚动视图或格视图对应的内容请求，并且当服务器1经由输入输出部17从数字图书观看器2接收到内容请求时，该处理进行到步骤S3。

在步骤S3中，服务器1向数字图书观看器2发送内容文件。即，当存在与滚动视图对应的内容请求时，服务器1发送与滚动视图对应的内容文件，并且当存在与格视图对应的内容请求时，服务器1发送与格视图对应的内容文件。

在步骤S4中，数字图书观看器2接收内容文件，并且在DB21中存储内容文件。该处理然后进行到下述的显示处理。可以以页面为单位或以格为单位来发送内容图像，并且对于附属信息，可以仅发送与发送的内容图像的单位对应的信息。

图5示出由数字图书观看器2执行的显示处理（滚动视图）的流程图。图6示出由数字图书观看器2执行的显示处理（格视图）的流程图。根据来自操作部27的选择来执行在图5和6中的处理。

参见图5，在步骤S10中，内容显示控制部25基于在DB21中的内容文件来将在具有指定的内容图像的页面中的第一锚定点设置为当前锚定点。

在步骤S11中，内容显示控制部25基于当前锚定点从整个页面的示意图像切出用于显示的详细图像，并且采用详细图像作为当前图像。可以将内容文件的详细图像读出和用作当前图像，而不是切出详细图像。

在步骤S12中，内容显示控制部25在显示部24上显示详细图像。

在步骤S13中，内容显示控制部25基于在DB21中的内容文件的附属信息来确定与当前锚定点对应的停留时间是否已经过去。在是的情况下，处理进行到步骤S14，并且在否的情况下，处理返回到步骤S12。

在步骤S14中，内容显示控制部25确定当前锚定点是否是在页面中的最后锚定点。在是的情况下，处理进行到步骤S21以终止页面的显示。如果存在下一个页面，则对于该页面重复从S10起的步骤。在否的情况下，处理进行到步骤S15。

在步骤S15中，内容显示控制部25将沿着连接当前锚定点和下一个锚定点的线段从当前锚定点起以预定单位（例如，逐个点）递增的位置设置为试验性的锚定点。通过从S16至S19的循环的数量来重复该递增。

在步骤S16和S17中，内容显示控制部25基于该试验性锚定点来从整个页面的图像切出用于显示的详细图像，并且采用该详细图像来作为下一个详细图像。也可以使用内容文件的详细图像，而不是切出图像。

在步骤S18中，内容显示控制部25将与当前的试验性锚定点对应的详细图像切换为与下一个试验性锚定点对应的详细图像，并且显示该详细图像。结果，以预定单位滚动屏幕。

在步骤S19中，内容显示控制部25确定试验性锚定点是否到达在当前锚定点下一个的锚定点。在是的情况下，处理返回到步骤S12以采用下一个锚定点来作为新的当前锚定点，并且显示与当前锚定点对应的详细图像。在否的情况下，处理返回到步骤S16，以便以预定单位来继续滚动。

参见图6，在步骤S31中，内容显示控制部25基于在指定页面的内容图像中的格顺序来将第一格设置为当前格。

在步骤S32中，内容显示控制部25从内容图像切出与当前格对应的详细图像，并且采用该详细图像作为当前格图像。也可以使用内容文件的详细图像，而不是切出详细图像。

在步骤S33中，内容显示控制部25在显示部24上显示当前格图像。

在步骤S34中，内容显示控制部25基于内容文件的附属信息来确定与当前格对应的停留时间是否已经过去。在是的情况下，处理进行到步骤S35，并且在否的情况下，处理返回到步骤S33。

在步骤S35中，内容显示控制部25确定当前格是否是在页面中的最后格。在是的情况下，处理进行到步骤S36，以终止页面的显示。如果存在下一个页面，则对于该页面重复从S31起的步骤。在否的情况下，处理进行到步骤S37。

在步骤S37中，内容显示控制部25将在当前格下一个的格设置为新的当前格。该处理然后返回到步骤S32，以切出与当前格对应的详细图像，或者读出详细图像，并且采用该详细图像作为当前格图像。其后的步骤与如上所述的相同。

在步骤S12或S33中，可以根据向操作部27输入的图像馈送指令来切换图像。以锚定点为单位（S12）或以格为单位（S33）来切换图像。而且，根据锚定点顺序或格顺序来切换图像。因为用户可能期望诸如页面的跳过的无规律观看，则可以允许无视顺序的内容图像切换操作。

图7示出由数字图书观看器2执行的对话处理的流程图。与步骤S12或S33相结合地执行该处理。

在步骤S41中，内容显示控制部25基于在DB21中的内容文件来开始显示内容图像。该步骤类似于步骤S12或S33。

在步骤S42中，内容显示控制部25确定是否指令了“水平书写”或指令了“垂直书写”来作为在发言气球中的对话显示方向。当存在“水平书写”的指令时，该处理进行到步骤S51，并且当存在“垂直书写”的指令时，该处理进行到步骤S61。

在步骤S51中，内容显示控制部25读出与被指定显示的图像区域对应的发言气球的位置信息、在与发言气球对应的水平对话（翻译文本）的文本信息中包括的文本属性（大小、字体、文字间距、行距、行的数量等）和作为发言气球的说话者的人物的信息。

在步骤S52中，内容显示控制部25基于发言气球的位置信息，根据在发言气球内的文本属性来水平地配置对话的文本信息。内容显示控制部25确定文本信息当根据文本属性而被水平地配置时是否适配，并且当确定文本信息不适配时，内容显示控制部25开始在发言气球内滚动文本信息。可以以任何方式来执行滚动。例如，如图8中所示，文本信息的文字可以被配置在一行或多行中，并且，在从每行的第一文字向最后一个文字沿着行方向被依序滚动。滚动方向取决于语言的类型。因为从左向右阅读英语，所以滚动方向是左面。当结束所有的文字的滚动时，可以从第一文字起重复滚动。

在步骤S61中，内容显示控制部25读出与被指定显示的图像区域对应的发言气球的位置信息、与发言气球对应的垂直对话（原文）的文本信息和文本属性和作为发言气球的说话者的人物的信息。

在步骤S62中，内容显示控制部25基于发言气球的位置信息，根据在发言气球内的文本属性来垂直地配置对话的文本信息（参见图9）。

在步骤S71中，语音再现部26基于关于语音的信息来再现语音。

首先，语音再现部26确定与由内容显示控制部25当前显示的详细图像对应的对话、与该对话对应的语音和与该对话所属的格对应的附带语音，并且从该附属信息获取关于语音再现的信息（文本信息、人物的属性信息、自动朗读的属性信息、拟声）。

图10示出关于与所显示的详细图像（锚定点3）对应的语音再现的信息的一个示例。

语音再现部26从关于语音再现的信息识别对话语音的属性，并且向扬声器28输出与该属性对应的语音。例如，当属性指示对话说话者的年龄是15，并且对话说话者的性别是女性时，语音再现部26利用预设的少年女性语音的属性合成对话语音，并且从扬声器28输出对话语音。

当对话语音因为说话者不重要的原因（仅出现一次等）而没有属性和说话者没有个性等时，利用默认属性合成对话语音。

而且，当没有关于读音量或读速度的属性时，基于配置了对应的对话的发言气球的属性或对话的属性来合成对话语音。

例如，当发言气球的类型表示如图3B中所示的以大声的语音的对话时，语音再现部26将对话的读音量设置为“高”。替代地，当发言气球的类型表示如图3C中所示的指示想象或回忆的对话时，语音再现部26将对话的读音量设置为“低”。替代地，当发言气球的类型是除了在图3B和3C中的类型之外的类型时，语音再现部26将对话的读音量设置为“中等”。

替代地，当对话的文字包括强调的文字或标记“!”时，语音再现部26将对话的读音量设置为“高”。

替代地，当对话的文字间距是“大”时，语音再现部26将对话的读速度设置为“低”，并且当对话的文字间距“小”时，语音再现部26将对话的读速度设置为“快速”。

在此，语音再现部26以与在发言气球中配置的对话的语言相同的语言来产生语音。然而，如果通过操作部27指定了与发言气球的语言不同的语言，则语音再现部26以该语言来产生语音。

在发言气球中的对话的显示的开始/结束与在发言气球中的对话的朗读的开始/结束同步。例如，如果在关于发言气球的信息中包括发言气球的读顺序，则根据该顺序来朗读在发言气球中的对话。在这一点处，可以与正在被朗读的对话的再现同步地向对话文字应用可视效果。例如，作为在对话文字上的可视效果，可以加亮或使用下划线、点和颜色来修饰正在被朗读的对话的各个文字，可以通过滚动来仅示出正在被朗读的对话部分，可以将未正在被朗读的对话的各个文字灰化，或者，可以将已经被朗读的对话淡出。

当在关于附带语音的信息中指定附带语音的开始/结束时间时，根据该时间来再现附带语音。当未指定该时间时，在发言气球中的对话的朗读的开始/结束也与在发言气球所属的格中的附带语音的开始/结束同步。例如，当在背景中存在文字“哇”时，从包括该文字的详细图像的显示开始至结束再现对应的欢呼。

当在多个格上配置相同的附带语音时，语音再现部26通过例如从格的显示开始至结束重复附带语音来连续地再现附带语音。

如上所述，当向数字图书观看器2提供本发明的内容文件时，数字图书观看器2可以根据对话的语言来配置对话并且执行滚动，并且可以再现对话的语音、拟声和声效。

<第二实施例>

用于在发言气球中滚动文本信息的各种方法可以被用作根据第一实施例的显示处理的步骤S52中的滚动方法。例如，如图11中所示，在一行中滚动文本信息。替代地，如图12中所示，向左滚动在第一行中的文本，并且，然后以螺旋形状来执行滚动，使得在第二行中或下面的文本信息通过滚动向在第一行中产生的空间内前移。替代地，如图13中所示，同时滚动相应的行。替代地，如图14中所示，根据发言气球的形状以螺旋形状来执行滚动。

{附图标记列表}

1．服务器

2．数字图书观看器

Claims

1.一种用于在观看器设备上观看的数字漫画的文件格式，所述文件格式包括：

用于漫画的每一个页面的整个页面的高清晰度图像；

发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述图像内的区域，在所述发言气球内布置漫画的人物的对话；

第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；以及，

第一显示控制信息，所述第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在所述观看器设备的监控器上观看所述整个页面的图像。

2.一种用于在观看器设备上观看的数字漫画的文件格式，所述文件格式包括：

漫画的每个格的格图像；

发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述格图像内的区域，在所述发言气球中布置漫画的人物的对话；

第二显示控制信息，所述第二显示控制信息包括各个格图像的再现顺序和格图像的图像大小，以便使得能够以格视图在所述观看器设备的监控器上观看所述格图像。

3.一种用于在观看器设备上观看的数字漫画的文件格式，所述文件格式包括：

用于漫画的每一个页面的整个页面的高清晰度图像；

发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述图像内的区域，在所述发言气球中布置漫画的人物的对话；

第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；

第一显示控制信息，所述第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在所述观看器设备的监控器上观看所述整个页面的图像；以及，

第二显示控制信息，所述第二显示控制信息包括格区域信息、各个格图像的再现顺序和格图像的图像大小，所述格区域信息指示各个格图像的在所述整个页面的图像内的区域，以便使得能够以格视图在所述观看器设备的监控器上观看所述整个页面的图像内的各个格的格图像。

4.根据权利要求1至3的任何一项所述的文件格式，其中，所述发言气球信息包括发言气球顶点的位置信息和发言气球线的类型的至少一种。

5.根据权利要求1或3所述的文件格式，包括存在区域信息，所述存在区域信息指示在所述整个页面的图像内的人物的区域。

6.根据权利要求2或3所述的文件格式，包括存在区域信息，所述存在区域信息指示在所述格图像内的人物的区域。

7.根据权利要求1至6的任何一项所述的文件格式，包括第二文本信息，所述第二文本信息指示在除了所述发言气球区域之外的区域中的拟声或文字，所述第二文本信息与每个格相关。

8.根据权利要求1至7的任何一项所述的文件格式，其中，所述第一文本信息包括通过将在所述发言气球内的原文的对话翻译为预定语言而获得的翻译文本。

9.根据权利要求1至8的任何一项所述的文件格式，其中，所述第二文本信息包括通过将在除了所述发言气球区域之外的区域中的原文的拟声或文字翻译为预定语言而获得的翻译文本。

10.根据权利要求8或9所述的文件格式，其中，所述文本信息包括关于所述翻译文本的语言的信息。

11.根据权利要求1至10的任何一项所述的文件格式，其中，所述第一文本信息包括在各个发言气球内的对话的人物的属性。

12.根据权利要求1至11的任何一项所述的文件格式，其中，所述第一文本信息包括在各个发言气球内的所述对话的文字的属性信息。

13.根据权利要求1至12的任何一项所述的文件格式，其中，所述第一文本信息包括在各个发言气球内的对话的语音的音量和读速度的至少一种的第一附属信息。

14.根据权利要求7所述的文件格式，其在，所述第二文本信息包括在除了所述发言气球区域之外的区域中的拟声或文字的属性信息。

15.根据权利要求7或14所述的文件格式，其中，所述第二文本信息包括所述拟声的发声数量、以及所述拟声或文字的发声开始时间、音量和读速度的至少一种的第二附属信息。

16.根据权利要求1或3所述的文件格式，其中，所述第一显示控制信息包括屏幕转变的场景，所述场景包括在所述滚动视图中在每一个锚定点处的停止时间。

17.根据权利要求2或3所述的文件格式，其中，所述第二显示控制信息包括屏幕转变的场景，所述场景包括在所述格视图中在每一个格图像处的停止时间。

18.根据权利要求1至17的任何一项所述的文件格式，包括标签信息，所述标签信息包括漫画题目、第几节、第几卷、作者和出版社。

19.一种服务器，用于根据来自观看器设备的请求来传递采用根据权利要求1至18的任何一项所述的文件格式的数字漫画。

20.一种用于数字漫画的观看器设备，包括：

显示装置；

信息获取装置，所述信息获取装置获取采用根据权利要求1至18的任何一项所述的文件格式的数字漫画；

图像显示控制装置，所述图像显示控制装置基于所获取的数字漫画的显示控制信息，在所述显示装置的屏幕上滚动再现或格再现每一个页面或每一个格的图像；以及，

文字显示控制装置，所述文字显示控制装置基于所获取的数字漫画的发言气球信息和文本信息，代替在所述显示装置的屏幕上显示的图像中的发言气球区域内的原始文字，而显示与所获取的数字漫画的文本信息对应的文字。

21.一种数字漫画产生设备，包括：

图像获取装置，所述图像获取装置获取漫画的每一个页面的整个页面的高清晰度图像；

页面信息分析装置，所述页面信息分析装置分析所获取的图像，并且由此获取：发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述图像内的区域，在所述发言气球中布置所述漫画的人物的对话；第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；以及，第一显示控制信息，所述第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在所述观看器设备的监控器上观看所述整个页面的图像；以及，

数字漫画产生装置，所述数字漫画产生装置产生采用如下文件格式的数字漫画，所述文件格式包括所获取的整个页面的高清晰度图像、以及与该图像相关的所述发言气球信息、第一文本信息和第一显示控制信息。

22.一种数字漫画产生设备，包括：

页面信息分析装置，所述页面信息分析装置分析所获取的图像，并且由此获取：发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述图像内的区域，在所述发言气球中布置所述漫画的人物的对话；第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；以及，第一显示控制信息，所述第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在观看器设备的监控器上观看所述整个页面的图像；以及，

数字漫画产生装置，所述数字漫画产生装置产生采用如下文件格式的数字漫画，所述文件格式包括由所述图像获取装置获取的整个页面的高清晰度图像，以及由所述页面信息分析装置获取的发言气球信息、第一文本信息和第一显示控制信息。

23.一种数字漫画产生设备，包括：

页面信息分析装置，所述页面信息分析装置分析所获取的图像，并且由此获取：格区域信息，所述格区域信息指示在所述整个页面的图像内的各个格的格图像的区域；发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述格图像内的区域，在所述发言气球中布置所述漫画的人物的对话；第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；以及，第二显示控制信息，所述第二显示控制信息包括各个格图像的再现顺序和格图像的图像大小，以便使得能够以格视图在观看器设备的监控器上观看所述格图像；

格图像产生装置，所述格图像产生装置通过基于由所述页面信息分析装置获取的格区域信息，从所述高清晰度图像切出格图像来产生格图像；以及，

数字漫画产生装置，所述数字漫画产生装置产生采用如下文件格式的数字漫画，所述文件格式包括由所述格图像产生装置产生的格图像，以及由所述页面信息分析装置获取的发言气球信息、第一文本信息和第二显示控制信息。

24.一种数字漫画产生设备，包括：

页面信息分析装置，所述页面信息分析装置分析所获取的图像，并且由此获取：格区域信息，所述格区域信息指示在所述整个页面的图像内的各个格的格图像的区域；发言气球信息，所述发言气球信息包括发言气球区域的信息，所述发言气球区域的信息指示发言气球的在所述图像内的区域，在所述发言气球中布置所述漫画的人物的对话；第一文本信息，所述第一文本信息指示在各个发言气球内的对话，所述第一文本信息与每一个发言气球相关；第一显示控制信息，所述第一显示控制信息包括预定锚定点的位置信息和转变顺序，以便使得能够以滚动视图在观看器设备的监控器上观看所述整个页面的图像；以及，第二显示控制信息，所述第二显示控制信息包括各个格图像的再现顺序和格图像的图像大小，以便使得能够以格视图在观看器设备的监控器上观看所述格图像；以及，

数字漫画产生装置，所述数字漫画产生装置产生采用如下文件格式的数字漫画，所述文件格式包括由所述图像获取装置获取的整个页面的高清晰度图像，以及由所述页面信息分析装置获取的格区域信息、发言气球信息、第一文本信息、第一显示控制信息和第二显示控制信息。