CN103502962B

CN103502962B - 服务器装置和服务器装置的控制方法

Info

Publication number: CN103502962B
Application number: CN201280020699.7A
Authority: CN
Inventors: 益子宗
Original assignee: Rakuten Inc
Current assignee: Lotte Group Co.,Ltd.
Priority date: 2011-04-28
Filing date: 2012-04-26
Publication date: 2016-06-22
Anticipated expiration: 2032-04-26
Also published as: TW201250499A; EP2704014A1; ES2725556T3; JP2012234287A; EP2704014B1; US20140056525A1; TWI595368B; EP2704014A4; US9396392B2; CN103502962A; WO2012147839A1; JP5606385B2

Abstract

请求接收部（101）从终端接收对图像的识别信息和针对图像处理的参数进行了指定的请求。图像处理部（102）根据接收到的请求所指定的识别信息来获取图像，并对该图像采用所接收到的请求所指定的参数来应用图像处理，从而输出从该图像内提取出的提取信息。响应发送部（103）将指定了由图像处理部（102）输出的提取信息的响应发送到终端。在与接收到的请求所指定的识别信息和参数对应起来的提取信息已被缓存的情况下，代替图像的获取和图像处理的应用，图像处理部（102）获得所被缓存的提取信息并输出该获得的提取信息。

Description

服务器装置和服务器装置的控制方法

技术领域

本发明涉及服务器装置和服务器装置的控制方法，特别涉及图像内的文字列的翻译。

背景技术

以往，已知各种翻译工具，但有时请求采用这些翻译工具来进行包括含有文字的图像在内的网页的翻译。为了翻译图像中所含的文字，首先需要对图像中所含的文字进行文字识别。并且，在通过文字识别而确定了文字后，将该文字翻译成目的语言。但是，存在这样的问题：文字识别的处理需要一定的时间，因此，难以进行实时的翻译。为了应对这种问题，提出有各种方法。例如，在专利文献1中公开了一种机械翻译系统，其将含有文字的图像和翻译用的文字列对应起来存储好，在翻译含有文字的图像时，提示该文字列的翻译结果。

现有技术文献

专利文献

专利文献1：日本特许4658236号公报

发明内容

发明要解决的课题

另一方面，还有这样的请求：不准备翻译用的文字列，而想尽可能直接翻译图像内的文字。

本发明的目的在于，解决上述这样的课题，提供适合于对网页内的图像的文字实时地进行翻译的服务器装置、服务器装置的控制方法、程序以及记录介质。

用于解决课题的手段

本发明的第一方面的服务器装置的特征在于，

所述服务器装置具备：

请求接收部，其从终端接收指定了图像的识别信息的请求；

图像处理部，其根据所述接收到的请求所指定的识别信息来获取图像，并输出提取信息，该提取信息表示通过对所述获取到的图像应用至少包含文字识别处理在内的图像处理而获得的识别完毕文字列；以及

响应发送部，其将指定有由所述图像处理部输出的提取信息的响应发送到所述终端，

所述请求接收部从所述终端接收至少指定了针对所述图像处理部进行的文字识别处理的参数的所述请求，

所述请求所指定的针对文字识别处理的参数包括指定所述图像内的区域的指定区域，

在所述图像处理部的图像处理中包括提取处理，在该提取处理中，通过对所述图像内的所述参数中所包括的指定区域进行文字识别处理，提取从该图像内的该指定区域识别出的所述识别完毕文字列作为所述提取信息，

当提取到所述识别完毕文字列时，所述图像处理部与对应于该识别完毕文字列的图像的识别信息和指定区域对应起来地缓存该识别完毕文字列，

在与所述接收到的请求所指定的识别信息和参数中所包括的指定区域对应起来的识别完毕文字列已被缓存的情况下，代替所述文字识别处理，所述图像处理部获得所述被缓存的识别完毕文字列。

此外，在上述方面的服务器装置中，其特征在于，

在所述识别完毕文字列被缓存时对应起来的识别信息与所述接收到的请求所指定的识别信息一致，并且所述识别完毕文字列被缓存时对应起来的指定区域与所述接收到的请求所指定的参数中包括的指定区域重复的情况下，所述图像处理部判定为与所述接收到的请求所指定的识别信息和参数中所包括的指定区域对应起来的提取信息已被缓存。

此外，在上述方面的服务器装置中，其特征在于，

当提取到所述识别完毕文字列时，所述图像处理部将所述指定区域校正为在所述指定区域内识别出该识别完毕文字列的识别区域后对该识别完毕文字列进行缓存。

此外，在上述方面的服务器装置中，其特征在于，

所述请求所指定的参数包括识别用语言，

根据识别用语言进行所述图像处理部的文字识别。

此外，在上述方面的服务器装置中，其特征在于，

所述请求所指定的参数包括转换信息，

在所述图像处理部的图像处理中包括转换处理，在该转换处理中，通过对所述被输出的识别完毕文字列采用所述接收到的请求所指定的参数中所包括的转换信息来进行转换处理，输出从该识别完毕文字列转换而成的转换完毕文字列，

所述提取信息包括所述转换完毕文字列。

此外，在上述方面的服务器装置中，其特征在于，

当提取到所述转换完毕文字列时，所述图像处理部与对应于该转换完毕文字列的图像的识别信息、指定区域、识别用语言、识别完毕文字列和转换信息对应起来地缓存该转换完毕文字列，

在与所述接收到的请求所指定的识别信息、指定区域、识别用语言和转换信息对应的转换完毕文字列已被缓存的情况下，代替所述转换处理，所述图像处理部获得所述被缓存的转换完毕文字列，并输出该获得的转换完毕文字列。

此外，在上述方面的服务器装置中，其特征在于，

所述转换处理将所述识别完毕文字列翻译成所述转换信息所指定的翻译目的语言，从而获得所述转换完毕文字列。

此外，在上述方面的服务器装置中，其特征在于，

所述服务器装置还具备：

询问接收部，其从所述终端接收指定了图像的识别信息的询问接收；以及

回应发送部，在与所述接收到的询问所指定的识别信息对应起来的提取信息没有被缓存的情况下，所述回应发送部将指定了消息的回应发送到所述终端，其中，所述消息促使发送指定了图像的识别信息和图像处理的参数的请求，在与所述接收到的询问所指定的识别信息对应起来的提取信息已被缓存的情况下，所述回应发送部将指定了该提取信息的回应发送到所述终端。

此外，在上述方面的服务器装置中，其特征在于，

所述服务器装置还具备：

询问接收部，其从所述终端接收指定了图像的识别信息、该图像内的位置的询问；以及

回应发送部，在通过所述图像处理部缓存有与所述接收到的询问所指定的识别信息以及包括所述接收到的询问所指定的位置在内的指定区域对应起来的识别完毕文字列的情况下，所述回应发送部将指定了该被缓存的识别完毕文字列的回应发送到所述终端。

此外，在上述方面的服务器装置中，其特征在于，

所述服务器装置还具备：

询问接收部，其从所述终端接收指定了图像的识别信息、该图像内的位置和转换信息的询问；以及

回应发送部，在通过所述图像处理部缓存有与所述接收到的询问所指定的识别信息、转换信息以及包括所述接收到的询问所指定的位置在内的指定区域对应起来的转换完毕文字列的情况下，所述回应发送部将所述回应中指定了该被缓存的转换完毕文字列的回应发送到所述终端。

本发明的第二方面的程序由计算机执行，所述计算机具备将根据识别信息识别的图像显示在画面上的显示部，并能够与上述方面的服务器装置进行通信，该程序的特征在于，

该程序使该计算机作为对显示在所述画面上的图像内的位置的选择进行检测的位置检测部、当检测到所述位置的选择时将指定了所述识别信息和该被选择的位置的询问发送到所述服务器装置的询问发送部、以及从所述服务器装置接收回应的回应接收部而起作用，

该程序使该计算机起作用，使得所述显示部将所述接收到的回应所指定的提取信息进一步显示到所述画面上，

所述程序使该计算机作为对显示在所述画面上的图像内的区域的选择进行检测的区域检测部、促使设定图像处理用的参数的设定部、当检测到所述区域的选择时将指定了所述识别信息、所述被设定的参数和该被选择的区域的请求发送到所述服务器装置的请求发送部、以及从所述服务器装置接收回应的回应接收部而起作用，

该程序使该计算机起作用，使得所述显示部将所述接收到的回应所指定的提取信息进一步显示到所述画面上。

本发明的第三方面的服务器装置的控制方法，

所述服务器装置具备请求接收部、图像处理部以及响应发送部，所述控制方法的特征在于，

所述控制方法具备如下步骤：

请求接收步骤，所述请求接收部从终端接收指定了图像的识别信息的请求；

图像处理步骤，所述图像处理部根据所述接收到的请求所指定的识别信息来获取图像，输出提取信息，该提取信息表示通过对所述获取的图像应用至少包含文字识别处理在内的图像处理而获得的识别完毕文字列；以及

响应发送步骤，所述响应发送部将指定了由所述图像处理部输出的提取信息的响应发送到所述终端，

在所述请求接收步骤中，从所述终端接收至少指定了针对所述图像处理部进行的文字识别处理的参数的所述请求，所述请求所指定的针对文字识别处理的参数包括指定所述图像内的区域的指定区域，

在所述图像处理步骤中，

本发明的第四方面的程序的特征在于，

所述程序使计算机作为下列部件而起作用：

请求接收部，其从终端接收指定了图像的识别信息和针对图像处理的参数的请求；

图像处理部，其根据所述接收到的请求所指定的识别信息来获取图像，对该获取到的图像采用所述接收到的请求所指定的参数来应用所述图像处理，从而输出从该图像内提取出的提取信息；以及

响应发送部，其将指定了由所述图像处理部输出的提取信息的响应发送到所述终端，

并且，所述程序使计算机起作用，使得：

当提取到所述提取信息时，所述图像处理部与对应于该提取信息的图像的识别信息和参数对应起来地缓存该提取的提取信息，

在与所述接收到的请求所指定的识别信息和参数对应起来的提取信息已被缓存的情况下，代替所述图像的获取和所述图像处理的应用，所述图像处理部获得所述被缓存的提取信息，并输出该获得的提取信息。

本发明的第五方面的计算机能够进行读取的记录介质记录有程序，所述记录介质的特征在于，

所述程序使计算机作为下列部件而起作用：

并且，所述程序使计算机起作用，使得：

当提取到所述提取信息时，所述图像处理部与对应于该提取信息的图像的识别信息和参数对应起来地缓存该被提取的提取信息，

上述程序能够与执行程序的计算机独立开地经计算机通信网而进行散发和销售。此外，上述记录介质能够与计算机独立开地进行散发和销售。

这里，非暂时性的(non-transitory)记录介质是指有形的(tangible：可触知的)记录介质。非暂时性的记录介质是例如压缩磁盘、软盘、硬盘、光磁盘、数字视频光盘、磁带、半导体存储器等。此外，暂时性的(transitory)记录介质表示传送介质(传播信号)本身。暂时性的记录介质是例如电信号、光信号、电磁波等。另外，暂时性的(temporary)存储区域是用于暂时性地存储数据及程序的区域，是例如RAM(RandomAccessMemory：随机存取存储器)等易失性存储器。

发明效果

根据本发明，能够提供适合于对网页内的图像的文字实时地进行翻译的服务器装置、服务器装置的控制方法、程序以及记录介质。

附图说明

图1是示出本发明的实施方式的服务器装置、网络服务器装置和终端装置之间的关系的图。

图2是示出了实现本发明的实施方式的服务器装置或终端装置的典型的信息处理装置的概要结构的图。

图3是用于说明终端装置所显示的网页的示例的图。

图4是用于说明实施方式一的服务器装置的概要结构的图。

图5是用于说明网页内的图像的示例的图。

图6是用于说明提取信息表的图。

图7是用于说明网页内的图像的示例的图。

图8是用于说明实施方式一的服务器装置的各部进行的控制处理的流程图。

图9是用于说明指定区域的图。

图10是用于说明提取信息表的图。

图11是用于说明识别区域的图。

图12是用于说明提取信息表的图。

图13是用于说明指定区域的重复的图。

图14是用于说明实施方式二的服务器装置的各部进行的控制处理的流程图。

图15是用于说明网页内的图像的示例的图。

图16是用于说明提取信息表的图。

图17是用于说明网页内的图像的示例的图。

图18是用于说明实施方式三的服务器装置的各部进行的控制处理的流程图。

图19是用于说明实施方式四的服务器装置的概要结构的图。

图20是用于说明网页内的图像的示例的图。

图21是用于说明实施方式四的服务器装置的各部进行的控制处理的流程图。

图22是用于说明网页内的图像的示例的图。

图23是用于说明实施方式五的服务器装置的各部进行的控制处理的流程图。

图24是用于说明提取信息表的图。

图25是用于说明网页内的图像的示例的图。

图26是用于说明实施方式六的服务器装置的各部进行的控制处理的流程图。

图27是用于说明实施方式七的程序动作的终端装置的概要结构的图。

图28是用于说明实施方式七的终端装置的各部进行的控制处理的流程图。

具体实施方式

如图1所示，本发明的实施方式的服务器装置100与互联网300连接。互联网300上连接有用户所操作的多个终端装置211、212～21n(下面，将它们总称为“终端装置200”)和网络服务器装置400。网络服务器装置400根据来自终端装置200的请求而将预定的网页提供到终端装置200。并且，服务器装置100根据终端装置200的请求而进行网页的翻译，并将翻译结果提供到终端装置200。另外，在下面所示的实施方式中，服务器装置100和网络服务器装置400如图1所示那样，经互联网300而连接，但不限于此示例。例如，也可以通过相同的装置实现服务器装置100和网络服务器装置400。或者也可以将服务器装置100和网络服务器装置400直接连接。

下面，对实现本发明的实施方式的服务器装置100或终端装置200的典型的信息处理装置500进行说明。

(1.信息处理装置的概要结构)

如图2所示，信息处理装置500具备CPU(CentralProcessingUnit：中央处理器)501、ROM(ReadonlyMemory：只读存储器)502、RAM503、NIC(NetworkInterfaceCard：网络接口卡)504、图像处理部505、声音处理部506、DVD-ROM(DigitalVersatileDiscROM：数字式激光视盘只读存储器)驱动器507、接口508、外部存储器509、控制器510、监视器511和扬声器512。

CPU501对整个信息处理装置500的动作进行控制，与各结构要素连接并交换控制信号及数据。

在ROM502中记录有刚接通电源后立即执行的IPL(InitialProgramLoader：初始程序装入程序)，通过执行该IPL，在RAM503读出预定的程序而开始通过CPU501执行该程序。此外，在ROM502中记录有对整个信息处理装置500进行动作控制所需的操作系统的程序及各种数据。

RAM503用于临时性地存储数据及程序，保持从DVD-ROM读出的程序及数据和其它通信所需的数据等。

NIC504用于将信息处理装置500与互联网300等计算机通信网连接，其由构成LAN(LocalAreaNetwork：局域网)时采用的依照10BASE-T/100BASE-T规格的部件、以及用于采用电话线路来与互联网连接的模拟调制解调器、ISDN(IntegratedServicesDigitalNetwork：综合服务数字网络)调制解调器、ADSL(AsymmetricDigitalSubscriberLine：不对称数字用户线)调制解调器、用于采用有线电视线路来与互联网连接的线缆调制解调器等和在它们与CPU501之间进行搭桥的接口(未图示)构成。

图像处理部505利用CPU501及图像处理部505具备的图像运算处理器(未图示)对从DVD-ROM等读出的数据进行加工处理后，将其记录到图像处理部505具备的帧存储器(未图示)中。记录在帧存储器中的图像信息在预定的同步定时被转换成视频信号并被输出到监视器511。由此，能够进行各种页面显示。

声音处理部506将从DVD-ROM等读出的声音数据转换成模拟声音信号并从与之连接的扬声器512输出。此外，在CPU501的控制下，生成信息处理装置500进行的处理被进行中应产生的音，使与之对应的声音从扬声器512输出。

在安装于DVD-ROM驱动器507的DVD-ROM中存储有例如用于实现实施方式的服务器装置100的程序。通过控制CPU501，DVD-ROM驱动器507进行针对安装于其中的DVD-ROM的读出处理，将所需的程序及数据读出，这些程序及数据被临时地存储在RAM503等中。

在接口508上能够装卸地连接有外部存储器509、控制器510、监视器511和扬声器512。

在外部存储器509中能够改写地存储有与用户的个人信息有关的数据等。

控制器510受理信息处理装置500在各种设定时等进行的操作输入。信息处理装置500的用户通过控制器510而进行指示输入，从而能够将这些数据适当地记录到外部存储器509中。

监视器511将由图像处理部505输出的数据提示给信息处理装置500的用户。

扬声器512将由声音处理部506输出的声音数据提示给信息处理装置500的用户。

此外，信息处理装置500也可以构成为：采用硬盘等大容量外部存储装置而起到与ROM502、RAM503、外部存储器509、安装于DVD-ROM驱动器507中的DVD-ROM等同样的作用。

下面，参照图1至图28对在上述信息处理装置500中实现的实施方式的服务器装置100或终端装置200进行说明。通过接通信息处理装置500的电源，从而执行作为实施方式的服务器装置100或终端装置200而起作用的程序，实现实施方式的服务器装置100或终端装置200。

在下面的实施方式中，在图3中示出了通过网络服务器装置400向终端装置200提供的网页的示例。网页600由图像601、602、603和文本604、605、606构成。图像601、603是含有文字的图像，图像602是不含有文字的图像。此外，设图像601、602、603的图像URL为“http://xxx.601.jpg”、“http://xxx.602.jpg”、“http://xxx.603.jpg”。

(2.实施方式一的服务器装置的概要结构)

在翻译图像内所含的文字列时，在对该图像已经进行了文字识别的处理的情况下，实施方式一的服务器装置100能够省略图像的获取和文字识别的处理。

如图4所示，本实施方式的服务器装置100由请求接收部101、图像处理部102和响应发送部103构成。

请求接收部101从终端装置200接收对图像的识别信息、针对图像处理的参数进行了指定的请求。

图像的识别信息是指例如图像URL。此外，图像处理是指例如用于识别图像内的文字的文字识别的处理。并且，针对图像处理的参数是指例如表示图像内的文字是哪种语言的识别用语言。设图像内的文字为指定的识别用语言而进行文字识别。

下面，以用户请求服务器装置100对网页600的图像601进行翻译的情况为例进行说明。例如，当用户将光标701重叠于终端装置200中显示的图像601上时(将鼠标放在上面时)，如图5的(a)所示，显示出请求指定识别用语言的弹出窗口801。如图5的(b)所示，当用户用光标701点击按钮802时，显示出下拉菜单。用户从菜单中选择图像601内的文字列的语言(识别用语言)。并且，如图5的(c)所示，当指定了识别用语言“英语”时，指定了图像601的图像URL“http://xxx.601.jpg”和识别用语言“英语”的请求被发送到服务器装置100。服务器装置100的请求接收部101接收该请求。

在本实施方式中，CPU501和NIC504协作而作为请求接收部101来起作用。另外，在下面的实施方式二至六中也同样。

图像处理部102根据接收到的请求所指定的识别信息来获取图像，对于获取的图像采用接收到的请求所指定的参数来应用图像处理，从而输出从该图像内提取的提取信息。

这里，提取信息是指例如文字识别的结果、得到的图像内的文字列(下面，称为“识别完毕文字列”)。若接收到例如指定了图像URL“http://xxx.601.jpg”和识别用语言“英语”的请求时，则图像处理部102首先根据该图像URL从网络服务器装置400获取图像601。并且，图像处理部102设获取的图像601内所含的文字为英文而进行文字识别。当文字识别的结果是判断为图像601内的文字为“SaleWaterBestbangforthebuck”时，图像处理部102将这些文字列作为从图像601内提取的识别完毕文字列而输出。

此外，当提取到提取信息时，图像处理部102与对应于该提取信息的图像的识别信息和参数对应起来地缓存该提取到的提取信息。

例如，在RAM503中存储有图6所示那样的提取信息表101a。图像的识别信息(图像URL)101a1、参数(识别用语言)101a2和提取信息(识别完毕文字列)101a3对应起来地登记在提取信息表101中。当图像处理部102通过文字识别而得到识别完毕文字列“SaleWaterBestbangforthebuck”时，将该识别完毕文字列、图像601的图像URL“http://xxx.601.jpg”和识别用语言“英语”对应起来地登记在提取信息表101a中。

在本实施方式中，CPU501和图像处理部505协作而作为图像处理部102来起作用。另外，在下面的实施方式二至六中也同样。

响应发送部103将指定有由图像处理部102输出的提取信息的响应发送到终端装置200。

例如，响应发送部103将指定有识别完毕文字列“SaleWaterBestbangforthebuck”的响应发送到终端装置200。这里，该响应还包括例如将用于使任意的图形重叠地显示的标签添补在显示于终端装置200上的网页内的文字识别已完毕的图像上的命令。例如，当终端装置200接收到该响应时，如图7所示，在文字识别已完毕的图像601上重叠地显示有半透明的矩形901。

在本实施方式中，CPU501和NIC504协作而作为响应发送部103来起作用。另外，在下面的实施方式二至六中也同样。

并且，当对与接收到的请求所指定的识别信息和参数对应起来的提取信息进行缓存的情况下，代替图像的获取和图像处理的应用，图像处理部102得到被缓存的提取信息并输出该得到的提取信息。

例如，当请求接收部101接收到指定了图像601的图像URL和识别用语言“英语”的请求时，图像处理部102参照图6中的提取信息表101a。由于登记有与图像601的识别信息和识别用语言“英语”对应的识别完毕文字列“SaleWaterBestbangforthebuck”，因此，图像处理部102将图像601的获取和文字识别的处理省略，将该识别完毕文字列输出到响应发送部103。

(3.实施方式一的服务器装置的动作)

下面，采用图8中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图8的流程图中所示的控制处理。

请求接收部101从终端装置200接收对图像的识别信息(图像URL)和针对图像处理的参数(识别用语言)进行了指定的请求(步骤S101)。例如，当用户将光标701重叠在图像601上并按图5(a)～(c)所示的步骤指定识别用语言“英语”时，请求接收部101接收指定了图像URL“http://xxx.601.jpg”和识别用语言“英语”的请求。

图像处理部102对是否缓存有与接收到的请求所指定的识别信息和识别用语言对应起来的提取信息(识别完毕文字列)进行判断(步骤S102)。

在图像处理部102判断为缓存有该识别完毕文字列的情况下(步骤S102：是)，输出被缓存的识别完毕文字列(步骤S103)。在例如RAM503中存储有图6所示的提取信息表101a的情况下，图像处理部102将与图像URL“http://xxx.601.jpg”和识别用语言“英语”对应起来的识别完毕文字列“SaleWaterBestbangforthebuck”输出到响应发送部103。

另一方面，在图像处理部102判断为未缓存有该识别完毕文字列的情况下(步骤S102：否)，获取接收到的请求所指定的图像URL的图像(步骤S105)。例如在提取信息表101a中未登记与图像URL“http://xxx.601.jpg”和识别用语言“英语”对应起来的识别完毕文字列的信息的情况下，图像处理部102访问网络服务器装置400并获取与图像URL“http://xxx.601.jpg”对应的图像601。

当图像处理部102获取到图像时，接着，采用请求所指定的识别用语言来进行文字识别，从图像内提取文字列(识别完毕文字列)(步骤S106)。例如，图像处理部102设图像601内的文字为“英语”，对图像601进行文字识别，得到“SaleWaterBestbangforthebuck”的识别完毕文字列。

图像处理部102将识别完毕文字列与图像的识别信息和识别用语言对应起来进行缓存(步骤S107)。例如，图像处理部102如图6所示那样地将图像URL“http://xxx.601.jpg”、识别用语言“英语”和识别完毕文字列“SaleWaterBestbangforthebuck”对应起来地登记在提取信息表101a中。

并且，图像处理部102输出提取到的识别完毕文字列(步骤S108)。例如，图像处理部102将识别完毕文字列“SaleWaterBestbangforthebuck”作为文字识别的结果而输出到响应发送部103。

响应发送部103将指定了在步骤S103或步骤S108中输出的识别完毕文字列的响应发送到终端装置200(步骤S104)。例如，响应发送部103将指定了识别完毕文字列“SaleWaterBestbangforthebuck”的响应发送到终端装置200。

根据本实施方式，在对于图像已经得到文字识别的结果的情况下，能够省略图像的获取和文字识别的处理。并且，通过对得到文字识别的结果的文字列进行翻译，从而能够缩短翻译图像内的文字列所需的时间。

(4.实施方式二的服务器装置的概要结构)

在翻译图像内所含的文字列时，在对该图像内的指定的区域已经进行了文字识别的处理的情况下，实施方式二的服务器装置100能够将图像的获取和文字识别的处理省略。

与实施方式一同样地，本实施方式的服务器装置100由请求接收部101、图像处理部102和响应发送部103构成(图4)，但各部的功能及处理的信息与实施方式一不同。下面，详细地进行说明。

请求接收部101从终端装置200接收对图像的识别信息和该图像内的指定区域进行了指定的请求。

这里，指定区域是指例如对终端装置200进行操作的用户所指定的网页的图像内的区域。例如，指定区域是通过长方形确定并通过长方形的左上角和右下角的坐标来确定的区域。

例如，如图9的(a)所示，用户在终端装置200中拖曳光标701而选择了图像601内的区域902。这里，设定图像601的左上角911的坐标(为“(纵坐标、横坐标)”)为(0、0)，设定右下角912的坐标为(200、300)。此外，设区域902的左上角的坐标为(5、100)，设右下角的坐标为(48、200)。当用户指定区域902时，终端装置200将指定了图像601的图像URL“http://xxx.601.jpg”和指定区域“(5、100)︰(48、200)”的请求发送到服务器装置100。服务器装置100的请求接收部101接收该请求。

另外，对指定区域进行指定的方法不限于上述方法。也可以这样：例如，当如图9的(b)所示那样地将光标701重叠在图像内时，以光标701为中心地显示出预定大小的长方形903，将长方形903的区域作为指定区域。此外，指定区域不限于长方形，也可以是圆形等。

图像处理部102根据接收到的请求所指定的识别信息来获取图像，对获取到的图像内的指定区域进行文字识别，从而输出从该图像内的该指定区域识别出的识别完毕文字列。

若图像处理部102接收到指定了例如图像URL“http://xxx.601.jpg”和指定区域“(5、100)︰(48、200)”的请求，则图像处理部102首先根据该图像URL从网络服务器装置400获取图像601。然后，图像处理部102推定用于文字识别的识别用语言。例如，在网页600的URL中含有表示国家的域代码的情况下，根据该域代码推定图像内所含的文字的语言。例如，若域代码中含有“.UK”，则推定识别用语言为“英语”。或者判断在html内是否存在指定语言的标签，在存在的情况下，将该语言作为识别用语言。例如，在html内存在“<htmllang＝“en”>”的标签的情况下，使识别用语言为“英语”。在本实施方式中，识别用语言被推定为“英语”。图像处理部102设获取到的图像601的指定区域“(5、100)︰(48、200)”中所包括的文字为英语而进行文字识别。当文字识别的结果是判断为该指定区域内的文字是“Sale”时，则图像处理部102输出该文字列作为识别完毕文字列。

当提取到识别完毕文字列时，图像处理部102与对应于该识别完毕文字列的图像的识别信息和指定区域对应起来地缓存该识别完毕文字列。

例如，如图10所示，图像处理部102将图像601的图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域“(5、100)︰(48、200)”和识别完毕文字列“Sale”对应起来地登记到提取信息表101a中。

这里，也可以这样：当提取到识别完毕文字列时，图像处理部102将指定区域校正为在指定区域内识别出该识别完毕文字列的识别区域后缓存该识别完毕文字列。

识别区域是指例如通过包括识别完毕文字列在内且使长方形的纵向和横向的长度最小的长方形确定的区域。例如，“Sale”的识别区域(图11中的区域921)是“(8、110)︰(45、170)”，“Water”的识别区域(图11中的区域922)是“(60、120)︰(90、180)”，“Bestbangforthebuck”的识别区域(图11中的区域923)是“(110、25)︰(190、270)”。

例如，如图9的(a)所示，接收到区域902被指定为指定区域并且指定区域被指定为“(5、100)︰(48、200)”的请求。在该情况下，图像处理部102对该指定区域进行文字识别，在提取到“Sale”的文字列后，求出含有该文字列的识别区域。并且，如图12所示，图像处理部102将图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域(识别区域)“(8、110)︰(45、170)”和识别完毕文字列“Sale”对应起来地登记到提取信息表101a中。

此外，例如，如图9的(c)所示，接收到超出于图像601的区域904被指定为指定区域并且指定区域被指定为“(52、－20)︰(98、320)”的请求。在该情况下，如图12所示，图像处理部102将图像601的图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域(识别区域)“(60、120)︰(90、180)”和识别完毕文字列“Water”对应起来地登记到提取信息表101a中。

此外，例如，如图9的(d)所示，接收到横穿图像601内的文字列的那样的区域905被指定为指定区域并且指定区域被指定为“(85、15)︰(210、285)”的请求。在该情况下，如图12所示，图像处理部102将图像601的图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域(识别区域)“(110、25)︰(190、270)”和识别完毕文字列“Bestbangforthebuck”对应起来地登记到提取信息表101a中。

响应发送部103将指定有由图像处理部102输出的识别完毕文字列的响应发送到终端装置200。

例如，当终端装置200接收到指定有识别完毕文字列“Sale”的响应时，如图13(a)所示，半透明的矩形931与文字识别已完毕的识别完毕文字列“Sale”的识别区域重叠地显示。同样地，如图13的(b)至图13的(d)所示，半透明的矩形932、933与识别区域重叠地显示。

并且，在缓存有与接收到的请求所指定的识别信息和参数中包括的指定区域对应起来的识别完毕文字列的情况下，代替图像的获取和文字识别，图像处理部102获得被缓存的识别完毕文字列并输出该获得的识别完毕文字列。

这里，在缓存识别完毕文字列时对应起来的识别信息与接收到的请求所指定的识别信息一致，并且缓存识别完毕文字列时对应起来的指定区域与接收到的请求所指定的指定区域重复的情况下，图像处理部102判定为缓存有与接收到的请求所指定的识别信息和参数中包括的指定区域对应起来的提取信息。

例如，当用户如图13的(a)所示那样地指定区域906时，请求接收部101接收指定了图像601的图像URL和指定区域“(5、35)︰(52、200)”的请求。当接收到该请求时，图像处理部102参照图12中的提取信息表101a。在提取信息表101a中图像601的图像URL一致，且登记有请求所指定的指定区域“(5、35)︰(52、200)”与被缓存的指定区域“(8、110)︰(45、170)”重复的识别完毕文字列。因此，图像处理部102将图像的获取和文字识别的处理省略，将识别完毕文字列“Sale”输出到响应发送部103。

另外，请求所指定的指定区域与被缓存的的指定区域是否重复的判断能够适当地进行设定。

例如，如图13的(a)和图13的(b)所示，在包括缓存有请求所指定的指定区域(区域906、907)的全部指定区域(识别区域、矩形931、932)在内的情况下，判断为重复。另一方面，也可以如图13的(c)所示，在请求所指定的指定区域(区域908)与被缓存的指定区域(识别区域、矩形933)仅一部分重叠的情况下判断为不重复。或者，也可以在识别区域与请求所指定的指定区域重叠识别区域的面积的预定比例的情况下判断为重复。此外，或者，也可以如图13的(d)所示，在光标701与识别区域(矩形933)重叠的情况下判断为重复。

(5.实施方式二的服务器装置的动作)

下面，采用图14中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图14的流程图中所示的控制处理。

请求接收部101从终端装置200接收对图像的识别信息和指定区域进行了指定的请求(步骤S201)。例如，当用户指定图9的(a)中的区域902时，请求接收部101接收指定了图像URL“http://xxx.601.jpg”和指定区域“(5、100)︰(48、200)”的请求。

图像处理部102对是否缓存有与接收到的请求所指定的识别信息(图像URL)和指定区域对应起来的提取信息(识别完毕文字列)进行判断(步骤S202)。

在图像处理部102判断为缓存有该识别完毕文字列的情况下(步骤S202：是)，输出被缓存的识别完毕文字列(步骤S203)。例如，图像处理部102参照图12所示的提取信息表101a而判断为图像URL一致且请求所指定的指定区域“(5、100)︰(48、200)”与被缓存的指定区域(识别区域)“(8、110)︰(45、170)”重复。在该情况下，图像处理部102将与图像URL和识别区域对应起来的识别完毕文字列“Sale”输出到响应发送部103。

另一方面，在图像处理部102判断为未缓存有该识别完毕文字列的情况下(步骤S202：否)，获取接收到的请求所指定的图像URL的图像(步骤S205)。在例如图像URL“http://xxx.601.jpg”不一致的情况下、或者请求所指定的指定区域和被缓存的指定区域未重复的情况下，图像处理部102访问网络服务器装置400并获取与图像URL“http://xxx.601.jpg”对应的图像601。

当图像处理部102获取到图像时，接着，推定识别用语言，采用该识别用语言来进行文字识别，从图像内提取识别完毕文字列(步骤S206)。例如，图像处理部102设图像601的指定区域(区域902)的文字为“英语”，对区域902进行文字识别，得到“Sale”的识别完毕文字列。

图像处理部102将图像的识别信息、识别用语言、指定区域和识别完毕文字列对应起来进行缓存(步骤S207)。例如，图像处理部102如图10所示那样，将图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域“(5、100)︰(48、200)”和识别完毕文字列“Sale”对应起来地登记在提取信息表101a中。另外，也可以在进行登记前将该指定区域校正为识别区域“(8、110)︰(45、170)”而如图12所示那样地进行登记。

并且，图像处理部102输出提取到的识别完毕文字列(步骤S208)。例如，图像处理部102将识别完毕文字列“Sale”作为文字识别的结果而输出到响应发送部103。

响应发送部103将指定有在步骤S203或步骤S208中输出的识别完毕文字列的响应发送到终端装置200(步骤S204)。例如，响应发送部103将指定了识别完毕文字列“Sale”的响应发送到终端装置200。

根据本实施方式，在对于用户指定的图像内的区域已经得到文字识别的结果的情况下，能够省略图像的获取和文字识别的处理。并且，通过对得到了文字识别的结果的文字列进行翻译，从而能够缩短翻译图像内的文字列所需的时间。

(6.实施方式三的服务器装置的概要结构)

在翻译图像内所含的文字列时，在对该图像内的指定的区域已经进行了文字识别和翻译的处理的情况下，实施方式三的服务器装置100能够将图像的获取、文字识别和翻译的处理省略。

与实施方式二同样地，本实施方式的服务器装置100由请求接收部101、图像处理部102和响应发送部103构成(图4)，但各部的功能及处理的信息与实施方式二不同。下面，详细地进行说明。

请求接收部101从终端装置200接收对图像的识别信息、识别用语言、指定区域和转换信息进行了指定的请求。

转换信息是指，例如图像中所含的文字列的翻译后的语言(下面，称为“翻译目的语言”)。采用识别用语言来从图像内提取的识别完毕文字列被翻译成翻译目的语言。

下面，以用户请求服务器装置100对网页600的图像601内的指定区域(区域909、坐标为“(100、20)︰(200、280)”)进行翻译的情况为例进行说明。例如，当用户在终端装置200中拖曳光标701而选择图像601内的区域909时，如图15的(a)所示，显示出请求指定识别用语言和翻译目的语言的弹出窗口803。如图15的(b)所示，当用户用光标701点击按钮804时，显示出下拉菜单。用户从菜单中选择区域909内的文字列的语言(识别用语言)。同样地，对于翻译目的语言，点击按钮805而从菜单中选择将区域909内的文字列翻译成何种语言(翻译目的语言)。如图15的(c)所示，当指定了识别用语言“英语”和翻译目的语言“日语”时，指定了图像601的图像URL“http://xxx.601.jpg”、指定区域“(100、20)︰(200、280)”、识别用语言“英语”和翻译目的语言“日语”的请求被发送到服务器装置100。服务器装置100的请求接收部101接收该请求。

图像处理部102根据接收到的请求所指定的识别信息获取图像并对获取到的图像内的指定区域进行文字识别，从而输出从该图像内的该指定区域识别出的识别完毕文字列。并且，图像处理部102对于输出的识别完毕文字列采用接收到的请求所指定的转换信息(翻译目的语言)来进行转换处理，从而输出从该识别完毕文字列转换而成的转换完毕文字列。

例如，图像处理部102从网络服务器装置400获取与请求所指定的图像URL“http://xxx.601.jpg”对应的图像601。接着，图像处理部102对于指定区域“(100、20)︰(200、280)”采用识别用语言“英语”来提取识别完毕文字列“Bestbangforthebuck”。并且，图像处理部102将该识别完毕文字列转换成翻译目的语言“日语”，并将转换完毕文字列“お買い得”输出到响应发送部103。

当提取到转换完毕文字列时，图像处理部102与对应于该转换完毕文字列的图像的识别信息、指定区域、识别用语言、识别完毕文字列和转换信息对应起来地缓存该转换完毕文字列。另外，在本实施方式中，被缓存的指定区域为识别区域。

例如，如图16所示，图像处理部102将图像601的图像URL“http://xxx.601.jpg”、识别用语言“英语”、指定区域“(110、25)︰(190、270)”、翻译目的语言“日语”、识别完毕文字列“Bestbangforthebuck”和转换完毕文字列“お買い得”对应起来地登记到提取信息表101a中。另外，登记的信息不限于这些组合，例如，也能够不登记翻译目的语言和转换完毕文字列。

并且，在缓存有与接收到的请求所指定的识别信息(图像URL)、指定区域、识别用语言和转换信息(翻译目的语言)对应的转换完毕文字列的情况下，代替转换处理，图像处理部102获得被缓存的转换完毕文字列并输出该获得的转换完毕文字列。

例如，用户如图17的(a)所示那样地指定区域910(坐标为“(90、0)︰(200、290)”)，并在弹出窗口806中选择了识别用语言“英语”和翻译目的语言“日语”。在该情况下，请求接收部101接收指定了图像601的图像URL、指定区域“(90、0)︰(200、290)”、识别用语言“英语”和翻译目的语言“日语”的请求。图像处理部102参照图16中的提取信息表101a而判断为该请求所指定的图像URL、识别用语言和翻译目的语言与被缓存的这些信息一致、并且请求所指定的指定区域“(90、0)︰(200、290)”与被缓存的指定区域“(110、25)︰(190、270)”重复。因此，图像处理部102将图像的获取、文字识别和转换处理的处理省略，将转换完毕文字列“お買い得”输出到响应发送部103。

另外，在图像URL和识别用语言一致并且请求所指定的指定区域与被缓存的指定区域重复的情况下，图像处理部102也可以仅将图像的获取和文字识别的处理省略而采用在提取信息表101a中登记的识别完毕文字列来转换成翻译目的语言并获得转换完毕文字列。例如，请求接收部101接收指定了图像601的图像URL、指定区域“(90、0)︰(200、290)”、识别用语言“英语”和翻译目的语言“德语”的请求。在该情况下，由于在图16的提取信息表101a中未登记有对应的转换完毕文字列，因此进行将识别完毕文字列“Bestbangforthebuck”翻译成德语的转换处理，并输出转换完毕文字列。

响应发送部103将指定有由图像处理部102输出的转换完毕文字列的响应发送到终端装置200。

例如，当终端装置200接收到指定有转换完毕文字列“お買い得”的响应时，如图17的(c)所示，在网页600内显示记载有转换完毕文字列“お買い得”的弹出窗口807。或者，也可以如图17的(d)所示，在识别区域中重叠地显示记载有转换完毕文字列的矩形941。

(7.实施方式三的服务器装置的动作)

下面，采用图18中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图18的流程图中所示的控制处理。

请求接收部101从终端装置200接收对图像的识别信息(图像URL)、指定区域、识别用语言和转换信息(翻译目的语言)进行了指定的请求(步骤S301)。例如，当用户指定图15的(a)中的区域909并如图15的(c)所示那样地在弹出窗口803中指定识别用语言和翻译目的语言时，请求接收部101接收指定了图像URL“http://xxx.601.jpg”、指定区域“(100、20)︰(200、280)”、识别用语言“英语”和翻译目的语言“日语”的请求。

图像处理部102判断是否缓存有与接收到的请求所指定的识别信息、指定区域、识别用语言和翻译目的语言对应起来的转换完毕文字列(步骤S302)。

在图像处理部102判断为缓存有该转换完毕文字列的情况下(步骤S302：是)，输出被缓存的转换完毕文字列(步骤S303)。例如，图像处理部102参照图16所示的提取信息表101a而判断为图像URL、识别用语言和翻译目的语言一致并且请求所指定的指定区域“(100、20)︰(200、280)”与被缓存的指定区域(识别区域)“(110、25)︰(190、270)”重复。在该情况下，图像处理部102将与图像URL、指定区域、识别用语言和翻译目的语言对应起来的转换完毕文字列“お買い得”输出到响应发送部103。

另一方面，在图像处理部102判断为未缓存有该转换完毕文字列的情况下(步骤S302：否)，判断是否缓存有与图像URL、指定区域和识别用语言对应起来的识别完毕文字列(步骤S305)。

在图像处理部102判断为缓存有该识别完毕文字列的情况下(步骤S305：是)，将被缓存的识别完毕文字列转换成翻译目的语言，获取转换完毕文字列(步骤S306)。例如，在图16的提取信息表101a中，在未登记有翻译目的语言“日语”和转换完毕文字列“お買い得”的情况下，图像处理部102将识别完毕文字列“Bestbangforthebuck”转换成翻译目的语言“日语”，获得转换完毕文字列“お買い得”。

另一方面，在图像处理部102判断为未缓存有该识别完毕文字列的情况下(步骤S305：否)，获取接收到的请求所指定的图像URL的图像(步骤S309)。并且，图像处理部102对该图像内的指定区域进行文字识别，提取识别完毕文字列(步骤S310)。在例如图像URL“http://xxx.601.jpg”不一致的情况下、或者请求所指定的指定区域和被缓存的指定区域未重复的情况下，图像处理部102访问网络服务器装置400并获取与图像URL“http://xxx.601.jpg”对应的图像601。并且，采用请求所指定的识别用语言“英语”对指定区域进行文字识别，提取识别完毕文字列“Bestbangforthebuck”。

在步骤S310中，当提取到识别完毕文字列时，图像处理部102对该识别完毕文字列进行转换处理(步骤S306)。

图像处理部102将图像的识别信息、识别用语言、翻译目的语言、指定区域、识别完毕文字列和转换完毕文字列对应起来进行缓存(步骤S307)。并且，将获得的转换完毕文字列输出到响应发送部103(步骤S308)。例如，图像处理部102如图16所示那样地将图像URL“http://xxx.601.jpg”、识别用语言“英语”、翻译目的语言“日语”、指定区域(识别区域)“(110、25)︰(190、270)”、识别完毕文字列“Bestbangforthebuck”和转换完毕文字列“お買い得”对应起来地登记在提取信息表101a中。并且，将转换完毕文字列“お買い得”输出到响应发送部103。

并且，图像处理部102将指定有在步骤S303或步骤S308中输出的转换完毕文字列的响应发送到终端装置200(步骤S304)。例如，响应发送部103将指定了转换完毕文字列“お買い得”的响应发送到终端装置200。

根据本实施方式，在对于用户指定的图像内的区域已经得到转换处理的结果(翻译结果)的情况下，能够省略图像的获取、文字识别的处理和转换处理。由此，能够缩短翻译图像内的文字列所需的时间。

(8.实施方式四的服务器装置的概要结构)

实施方式四的服务器装置100向用户提示对图像的文字识别的处理是否完毕。

如图19所示，本实施方式的服务器装置100由请求接收部101、图像处理部102、响应发送部103、询问接收部104和回应发送部105构成。本实施方式的请求接收部101、图像处理部102和响应发送部103具有与实施方式一同样的功能。下面，对具有不同的功能的询问接收部104和回应发送部105进行说明。

询问接收部104从终端装置200接收指定有图像的识别信息的询问。

例如，如图20的(a)所示，当用户将光标701重叠在图像601内时(将鼠标放在上面时)，终端装置200将指定有图像601的图像URL的询问发送到服务器装置100。服务器装置100的询问接收部104接收该询问。

在本实施方式中，CPU501和NIC504协作而作为询问接收部104来起作用。另外，在下面的实施方式五和六中也同样。

在未缓存与接收到的询问所指定的识别信息对应起来的提取信息的情况下，回应发送部105将指定有下述消息的回应发送到终端装置200，其中，上述消息促使发送指定了图像的识别信息和图像处理的参数的请求，在缓存有与接收到的询问所指定的识别信息对应起来的提取信息的情况下，将指定有该提取信息的回应发送到终端装置200。

这里，图像处理的参数是指用于文字识别的识别用语言，提取信息是指识别完毕文字列。在服务器装置100中存储有图6所示的提取信息表101a。在该提取信息表101a中登记有与请求所指定的图像601的图像URL“http://xxx.601.jpg”对应的识别完毕文字列“SaleWaterBestbangforthebuck”。因此，回应发送部105将指定有识别完毕文字列的回应发送到终端装置200。当终端装置200接收到该回应时，如图20的(a)所示，在显示于终端装置200上的网页上显示含有识别完毕文字列的弹出窗口809。

另外，也可以在缓存有识别完毕文字列的情况下发送的回应中指定表示得到了识别完毕文字列的消息。当终端装置200接收到该回应时，如图20的(b)所示，显示弹出窗口810，所述弹出窗口810含有表示得到了识别完毕文字列的消息。

另一方面，在服务器装置100中未缓存与图像601的图像URL对应的识别完毕文字列的情况下，回应发送部105将指定有下述消息的回应发送到终端装置200，其中上述消息促使发送指定了图像601的图像URL和识别用语言的请求。当终端装置200接收到该回应时，如图5的(a)所示，在显示于终端装置200上的网页上显示弹出窗口801，所述弹出窗口801要求输入识别用语言。

在本实施方式中，CPU501和NIC504协作而作为回应发送部105来起作用。另外，在下面的实施方式五和六中也同样。

(9.实施方式四的服务器装置的动作)

下面，采用图21中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图21的流程图中所示的控制处理。

询问接收部104从终端装置200接收对图像的识别信息进行了指定的询问(步骤S401)。例如，接收对图像601的图像URL进行了指定的询问。

回应发送部105判断是否缓存有与该询问所指定的识别信息对应起来的识别完毕文字列(步骤S402)。

当回应发送部105判断为缓存有该识别完毕文字列时(步骤S402：是)，将指定了被缓存的识别完毕文字列的回应发送到终端装置200(步骤S403)。例如，在存储于服务器装置100的提取信息表101a中登记有与图像601的图像URL对应的识别完毕文字列“SaleWaterBestbangforthebuck”的情况下(图6)，回应发送部104将指定有该识别完毕文字列的回应发送到终端装置200。

另一方面，当回应发送部105判断为未缓存该识别完毕文字列时(步骤S402：否)，将指定有促使指定识别用语言的消息的回应发送到终端装置200(步骤S404)。例如，在存储于服务器装置100的提取信息表101a中未登记与图像601的图像URL对应的识别完毕文字列的情况下，回应发送部104将指定有下述消息的回应发送到终端装置200，其中，上述消息促使发送指定了图像601的图像URL和识别用语言的请求。

然后，当从终端装置200受理指定了图像601的图像URL和识别用语言的请求时，服务器装置100例如开始进行图8的流程图中所示的控制处理。

根据本实施方式，只要将鼠标放在图像上等，就能够告知用户对图像的文字识别的处理是否完毕。

(10.实施方式五的服务器装置的概要结构)

实施方式五的服务器装置100向用户提示对图像内的区域的文字识别的处理是否完毕。

如图19所示，本实施方式的服务器装置100由请求接收部101、图像处理部102、响应发送部103、询问接收部104和回应发送部105构成。本实施方式的请求接收部101、图像处理部102和响应发送部103具有与实施方式二同样的功能。下面，对具有不同的功能的询问接收部104和回应发送部105进行说明。

询问接收部104从终端装置200接收指定了图像的识别信息和该图像内的位置的询问。

例如，如图22的(a)所示，当用户将光标701重叠在图像601内时(将鼠标放在上面时)，终端装置200将指定了图像601的图像URL和该光标701的位置的坐标(为“(75︰175)”)的询问发送到服务器装置100。服务器装置100的询问接收部104接收该询问。

在通过图像处理部102缓存有与接收到的询问所指定的识别信息和包括接收到的询问所指定的位置在内的指定区域对应起来的识别完毕文字列的情况下，回应发送部105将指定了该被缓存的识别完毕文字列的回应发送到终端装置200。

例如，在服务器装置100中存储有图12所示的提取信息表101a。如图22的(a)所示，请求所指定的位置的坐标“(75︰175)”包含在识别区域922中。在该提取信息表101a中登记有与请求所指定的图像601的图像URL“http://xxx.601.jpg”和包括请求所指定的位置的坐标在内的指定区域(识别区域922)对应的识别完毕文字列“Water”。因此，回应发送部105将指定有该识别完毕文字列的回应发送到终端装置200。当终端装置200接收到该回应时，如图22(a)所示，在显示于终端装置200的网页上显示弹出窗口811，所述弹出窗口811中包含识别完毕文字列“Water”。

另外，也可以在缓存有识别完毕文字列的情况下发送的回应中指定促使发送指定了翻译目的语言的请求的消息。当终端装置200接收到该回应时，如图22的(b)所示，显示弹出窗口812，所述弹出窗口812要求指定翻译目的语言。

另一方面，在服务器装置100中未存储与图像601的图像URL和包括所指定的位置在内的指定区域对应的识别完毕文字列的情况下，回应发送部105将指定有下述消息的回应发送到终端装置200，其中，上述消息促使发送对该指定区域指定了图像601的图像URL、图像内的位置和识别用语言的请求。当终端装置200接收到该回应时，例如，如图22的(c)所示，在显示于终端装置200上的网页上显示弹出窗口813，所述弹出窗口813要求输入识别用语言。

(11.实施方式五的服务器装置的动作)

下面，采用图23中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图23的流程图中所示的控制处理。

询问接收部104从终端装置200接收对图像的识别信息和该图像内的位置进行了指定的询问(步骤S501)。例如，接收对图像601的图像URL和位置“(75︰175)”进行了指定的询问。

回应发送部105判断是否缓存有与该询问所指定的识别信息和包括位置在内的指定区域对应起来的识别完毕文字列(步骤S502)。

当回应发送部105判断为缓存有该识别完毕文字列时(步骤S502：是)，将指定了被缓存的识别完毕文字列的回应发送到终端装置200(步骤S503)。例如，在存储于服务器装置100的提取信息表101a中登记有与图像601的图像URL和包括所指定的位置“(75︰175)”在内的指定区域对应的识别完毕文字列“Water”的情况下(图12)，回应发送部104将指定了该识别完毕文字列的回应发送到终端装置200。

另一方面，当回应发送部105判断为未缓存该识别完毕文字列时(步骤S502：否)，将指定有促使对该图像的指定区域指定识别用语言的消息的回应发送到终端装置200(步骤S504)。例如，在被存储于服务器装置100的提取信息表101a中未登记与图像601的图像URL和包括所指定的位置在内的指定区域对应的识别完毕文字列的情况下，回应发送部104将指定有下述消息的回应发送到终端装置200，其中，上述消息促使发送指定了图像601的图像URL、该指定区域和识别用语言的请求。

根据本实施方式，只要进行将鼠标放在图像内的区域上等，就能够告知用户对该区域的文字识别的处理是否完毕。

(12.实施方式六的服务器装置的概要结构)

实施方式六的服务器装置100向用户提示对图像内的区域的转换处理是否完毕。

如图19所示，本实施方式的服务器装置100由请求接收部101、图像处理部102、响应发送部103、询问接收部104和回应发送部105构成。本实施方式的请求接收部101、图像处理部102和响应发送部103具有与实施方式三同样的功能。下面，对具有不同的功能的询问接收部104和回应发送部105进行说明。

询问接收部104从终端装置200接收指定有图像的识别信息、该图像内的位置和转换信息的询问。

例如，如图22的(a)所示，当用户将光标701重叠在图像601内时，如图22的(b)所示，显示弹出窗口812，所述弹出窗口812要求指定翻译目的语言(转换信息)。并且，当用户选择任意的翻译目的语言(例如“西班牙语”)时，终端装置200将指定了图像601的图像URL、该光标701的位置的坐标“(75︰175)”)和翻译目的语言“西班牙语”的询问发送到服务器装置100。服务器装置100的询问接收部104接收该询问。

在通过所述图像处理部缓存有与接收到的询问所指定的识别信息、转换信息和包括所述接收到的询问所指定的位置在内的指定区域对应起来的识别完毕文字列的情况下，回应发送部105发送所述回应中指定有该被缓存的转换完毕文字列的回应。

例如，在服务器装置100中存储有图24所示的提取信息表101a。在该提取信息表101a中登记有与请求所指定的图像601的图像URL“http://xxx.601.jpg”、包括请求所指定的位置的坐标在内的指定区域(识别区域922)和翻译目的语言“西班牙语”对应的转换完毕文字列“Agua”。因此，回应发送部105将指定了该转换完毕文字列的回应发送到终端装置200。当终端装置200接收到该回应时，如图25的(a)所示，在显示于终端装置200的网页上显示弹出窗口814，所述弹出窗口814中包含转换完毕文字列“Agua”。

另一方面，在服务器装置100中未缓存与图像601的图像URL、包括所指定的位置在内的指定区域和翻译目的语言对应的转换完毕文字列的情况下，回应发送部105将指定了表示未缓存该转换完毕文字列的消息的回应发送到终端装置200。当终端装置200接收到该回应时，例如，如图25的(b)所示，在显示于终端装置200的网页上显示弹出窗口815，所述弹出窗口815中包含表示未缓存转换完毕文字列的消息。

(13.实施方式六的服务器装置的动作)

下面，采用图26中的流程图对本实施方式的服务器装置100的各部进行的动作进行说明。当使服务器装置100接通电源后，CPU501开始进行图26的流程图中所示的控制处理。

询问接收部104从终端装置200接收对图像的识别信息、该图像内的位置和转换信息进行了指定的询问(步骤S601)。例如，接收指定了图像601的图像URL、位置“(75︰175)”和翻译目的语言“西班牙语”的询问。

回应发送部105对是否缓存有与该询问所指定的识别信息、包含位置在内的指定区域和翻译目的语言对应起来的转换完毕文字列进行判断(步骤S602)。

当回应发送部105判断为缓存有该转换完毕文字列时(步骤S602：是)，将指定了被缓存的转换完毕文字列的回应发送到终端装置200(步骤S603)。例如，在存储于服务器装置100的提取信息表101a中登记有与图像601的图像URL、包括所指定的位置“(75︰175)”在内的指定区域和翻译目的语言“西班牙语”对应的转换完毕文字列“Agua”的情况下(图24)，回应发送部104将指定了该转换完毕文字列的回应发送到终端装置200。

另一方面，当回应发送部105判断为未缓存该转换完毕文字列时(步骤S602：否)，将指定有表示未缓存该转换完毕文字列的消息的回应发送到终端装置200(步骤S604)。例如，在存储于服务器装置100的提取信息表101a中未登记与图像601的图像URL、包括所指定的位置在内的指定区域和翻译目的语言“西班牙语”对应的转换完毕文字列的情况下，回应发送部104将指定有表示未缓存该转换完毕文字列的消息的回应发送到终端装置200。

另外，在本实施方式中，也可以这样：询问接收部104接收指定了图像URL和位置的询问，回应发送部105发送指定了与该图像URL和包括该位置在内的指定区域对应的转换完毕文字列的回应。

例如，在接收到指定了图像601的图像URL和所指定的位置“(75︰175)”的询问的情况下，回应发送部105参照图24中的提取信息表101a并获取与该图像URL和包括该位置在内的指定区域对应的转换完毕文字列“水”、“Agua”、“L’eau”。并且，回应发送部105将指定了这所有的转换完毕文字列的回应发送到终端装置200。当终端装置200接收到该回应时，在终端装置200中，显示出例如图25的(c)所示的那样的弹出窗口816。或者，也可以这样：回应发送部105选择与目前为止请求中所指定的频率最高的翻译目的语言对应的转换完毕文字列，并发送指定了该转换完毕文字列的回应。此外，或者也可以这样：回应发送部105从登记在提取信息表101a中的转换完毕文字列中任意选择，发送指定了该转换完毕文字列的回应。

根据本实施方式，只要将鼠标放在图像内的区域上等，就能够告知用户对该区域的转换处理(翻译处理)是否完毕。

(14.实施方式七的终端装置的概要结构)

实施方式七中的程序起到这样的作用：使通过服务器装置进行的文字识别和转换处理的结果显示于能够与服务器装置通信的终端装置。

如图27所示，让本实施方式的程序工作的终端装置200由显示部201、位置检测部202、询问发送部203、回应接收部204、区域检测部205、设定部206、请求发送部207和响应接收部208构成。

显示部201使根据识别信息识别的图像显示在画面上。

例如，如图22的(a)所示，显示部201显示指定为图像URL“http://xxx.601.jpg”的图像601。

在本实施方式中，CPU501和图像处理部505协作而作为显示部201来起作用。

位置检测部202检测在画面上显示的图像内的位置的选择。

例如，当如图22的(a)所示那样地将光标701重叠在图像内时，位置检测部202检测该光标701的位置的坐标。

在本实施方式中，CPU501和图像处理部505协作而作为位置检测部202来起作用。

当检测出位置的选择时，询问发送部203将指定了识别信息和该选择的位置的询问发送到服务器装置100。

例如，在图22的(a)的情况下，询问发送部203将指定了图像601的图像URL和位置的坐标“(75︰175)”的询问发送到服务器装置100。

在本实施方式中，CPU501和NIC504协作而作为询问发送部203来起作用。

回应接收部204从服务器装置100接收回应。并且，显示部201将接收到的回应所指定的提取信息进一步地显示在画面上。

例如，回应接收部204接收指定了识别完毕文字列“Water”的回应。在该情况下，如图22的(a)所示，显示部201显示包括该识别完毕文字列在内的弹出窗口811。

在本实施方式中，CPU501和NIC504协作而作为回应接收部204来起作用。

区域检测部205检测在画面上显示的图像内的区域的选择。

例如，当如图9的(a)所示那样地在图像内拖曳光标701时，区域检测部205检测被拖曳的区域(区域902)的坐标。

在本实施方式中，CPU501和图像处理部505协作而作为区域检测部205来起作用。

设定部206促使设定图像处理用的参数。

例如，设定部206促使设定使用于文字识别的识别用语言。

在本实施方式中，CPU501作为设定部206而起作用。

当检测出区域的选择时，请求发送部207将指定了识别信息、所设定的参数和该被选择的区域的请求发送到服务器装置100。

例如，当如图9的(a)所示那样地指定了区域并检测出该区域的坐标时，请求发送部207将指定了图像URL“http://xxx.601.jpg”、识别用语言“英语”和所选择的区域的坐标“(5、100)︰(48、200)”的请求发送到服务器装置100。

在本实施方式中，CPU501和NIC504协作而作为请求发送部207来起作用。

响应接收部208从服务器装置100接收响应。并且，显示部201将接收到的响应所指定的提取信息进一步地显示在画面上。

例如，响应接收部208接收指定了识别完毕文字列“Sale”的响应。在该情况下，例如，如图13的(a)所示，显示部201使半透明的矩形931与识别完毕文字列“Sale”重叠地显示。

在本实施方式中，CPU501和NIC504协作而作为响应接收部208来起作用。

(15.实施方式七的终端装置的动作)

下面，采用图28中的流程图对本实施方式的终端装置200的各部进行的动作进行说明。当使终端装置200接通电源后，CPU501开始进行图28的流程图中所示的控制处理。

显示部201将根据识别信息识别的图像显示在画面上(步骤S701)。位置检测部202对是否检测出该画面上所显示的图像内的位置的选择进行判断(步骤S702)。

例如，当显示部201显示出指定为图像URL“http://xxx.601.jpg”的图像601并将光标701重叠在图像601上时，位置检测部202检测光标701的位置的坐标“(75︰175)”(图22(a))。

当判断为通过位置检测部202检测出位置的选择时(步骤S702：是)，询问发送部203将指定了识别信息和该选择的位置的询问发送到服务器装置100(步骤S703)。并且，回应接收部204从服务器装置100接收针对响应的回应(步骤S704)。显示部201将接收到的回应所指定的提取信息进一步地显示在画面上(步骤S705)。

例如，询问发送部203将指定了图像601的图像URL和位置的坐标“(75︰175)”的询问发送到服务器装置100。并且，回应接收部204接收指定了在包括该位置的坐标在内的区域中根据文字识别得到的识别完毕文字列“Water”的回应。当接收到该回应时，如图22的(a)所示，显示部201显示包括该识别完毕文字列在内的弹出窗口811。

另一方面，在未判断为通过位置检测部202检测出位置的选择的情况下(步骤S702：否)，区域检测部205对是否检测出在画面上显示的图像内的区域的选择进行判断(步骤S706)。

例如，当用户如图9的(a)所示那样地在图像内拖曳光标701时，区域检测部205检测出所拖曳的区域(区域902)的坐标“(5、100)︰(48、200)”。

当判断为通过区域检测部205检测出区域的选择时(步骤S706：是)，设定部206促使设定图像处理用的参数(步骤S707)。请求发送部207将指定了识别信息、所设定的参数和该选择的区域的请求发送到服务器装置100(步骤S708)。并且，响应接收部208从服务器装置100接收与该请求对应的响应(步骤S709)。显示部201将接收到的响应所指定的提取信息进一步地显示在画面上(步骤S710)。

例如，当设定部206促使设定使用于文字识别的识别用语言并设定识别用语言“英语”时，请求发送部207将指定了图像601的图像URL、识别用语言“英语”和区域的坐标“(5、100)︰(48、200)”的请求发送到服务器装置100。并且，响应接收部208接收指定了在与该区域重复的区域中根据文字识别得到的识别完毕文字列“Sale”的响应。当接收到该响应时，例如，如图13的(a)所示，显示部201使半透明的矩形931与识别完毕文字列“Sale”重叠地显示。

另一方面，在未判断为通过区域检测部205检测出区域的选择的情况下(步骤S706：否)，或者，当步骤S705、S710的处理完毕时，回到步骤S701。

另外，在本实施方式中，也可以这样：在回应接收部204接收的回应中进一步地指定下述区域信息，该区域信息示出从图像的哪个区域中提取出了提取信息。并且，本实施方式的程序也可以这样：使图像的识别信息、提取信息和区域信息对应起来地缓存于终端装置200。在该情况下，对于识别信息与该图像相同的图像，当用户将鼠标放在被缓存的区域信息中所包括的区域上时，显示部201将与该区域信息对应的提取信息显示在画面上。

此外，也可以这样：在响应接收部208接收的响应中进一步地指定下述区域信息，该区域信息示出从图像的哪个区域中提取出了提取信息。并且，本实施方式的程序也可以这样：使图像的识别信息、提取信息和区域信息对应起来地缓存于终端装置200。在该情况下，对于识别信息与该图像相同的图像，当用户选择区域以使得与被缓存的区域信息所示的区域重复时，显示部201将与该区域信息对应的提取信息显示在画面上。能够与例如实施方式二的情况同样地对区域是否重复进行判断。

此外，通过浏览器所执行的各种脚本语言等记述本实施方式的程序。

根据本实施方式，能够使通过服务器装置进行的文字识别及转换处理的结果显示在能够与服务器装置通信的终端装置上，能够在终端装置中实时地显示网页内的图像的文字。

另外，上述的实施方式用于说明，不限制本申请发明的范围。此外，本申请发明不限于应用在上述实施方式中所示的那样的特定的技术规格。因此，本领域技术人员也能够采用将本申请的各要素或全部要素置换成与之等同的要素的实施方式，这些实施方式也包括在本发明的范围中。

本发明基于2011年4月28日申请的日本专利申请2011-101534号。作为参照，将日本专利申请2011-101534号的说明书、权利要求书和附图整体地引入到本说明书中。

产业上的可利用性

根据本发明，能够提供适合于对网页内的图像的文字实时地进行翻译的服务器装置、服务器装置的控制方法、程序和记录介质。

标号说明

100：服务器装置；

101：请求接收部；

102：图像处理部；

103：响应发送部；

104：询问接收部；

105：回应发送部；

211、212～21n、200：终端装置；

201：显示部；

202：位置检测部；

203：询问发送部；

204：回应接收部；

205：区域检测部；

206：设定部；

207：请求发送部；

208：响应接收部；

300：互联网；

400：网络服务器装置；

500：信息处理装置；

501：CPU；

502：ROM；

503：RAM；

504：NIC；

505：图像处理部；

506：声音处理部；

507：DVD-ROM驱动器；

508：接口；

509：外部存储器；

510：控制器；

511：监视器；

512：扬声器；

600：网页；

601、602、603：图像；

604、605、606：文本；

701：光标；

801、803、806、807、809、810、811、812、813、814、815、816：弹出窗口；

802、804、805：按钮；

901、931、932、933、941：矩形；

902、903、904、905、906、907、908、909、910：区域；

911、912：角；

921、922、923：识别区域。

Claims

1.一种服务器装置，其特征在于，

所述服务器装置具备：

请求接收部，其从终端接收指定了图像的识别信息的请求；

2.根据权利要求1所述的服务器装置，其特征在于，

在所述识别完毕文字列被缓存时和所述识别完毕文字列对应起来的识别信息与所述接收到的请求所指定的识别信息一致，并且所述识别完毕文字列被缓存时和所述识别完毕文字列对应起来的指定区域与所述接收到的请求所指定的参数中包括的指定区域重复的情况下，所述图像处理部判定为与所述接收到的请求所指定的识别信息和参数中所包括的指定区域对应起来的提取信息已被缓存。

3.根据权利要求1或2所述的服务器装置，其特征在于，

4.根据权利要求1或2所述的服务器装置，其特征在于，

所述请求所指定的针对文字识别处理的参数包括识别用语言，

根据识别用语言进行所述图像处理部的文字识别处理。

5.根据权利要求1或2所述的服务器装置，其特征在于，

所述请求所指定的参数还包括转换信息，

在所述图像处理部的图像处理中包括转换处理，在该转换处理中，通过对所述被提取的识别完毕文字列采用所述接收到的请求所指定的参数中所包括的转换信息来进行转换处理，输出从该识别完毕文字列转换而成的转换完毕文字列，

所述提取信息包括所述转换完毕文字列。

6.根据权利要求5所述的服务器装置，其特征在于，

当输出所述转换完毕文字列时，所述图像处理部与对应于该转换完毕文字列的图像的识别信息、指定区域、识别完毕文字列和转换信息对应起来地缓存该转换完毕文字列，

在与所述接收到的请求所指定的识别信息、指定区域和转换信息对应的转换完毕文字列已被缓存的情况下，代替所述转换处理，所述图像处理部获得所述被缓存的转换完毕文字列，并输出该获得的转换完毕文字列。

7.根据权利要求5所述的服务器装置，其特征在于，

8.根据权利要求1所述的服务器装置，其特征在于，

所述服务器装置还具备：

询问接收部，其从所述终端接收指定了图像的识别信息的询问；以及

回应发送部，在与所述接收到的询问所指定的识别信息对应起来的提取信息没有被缓存的情况下，所述回应发送部将指定了消息的回应发送到所述终端，其中，所述消息促使发送指定了图像的识别信息和针对文字识别处理的参数的请求，在与所述接收到的询问所指定的识别信息对应起来的提取信息已被缓存的情况下，所述回应发送部将指定了该提取信息的回应发送到所述终端。

9.根据权利要求1或2所述的服务器装置，其特征在于，

所述服务器装置还具备：

10.根据权利要求5所述的服务器装置，其特征在于，

所述服务器装置还具备：

11.一种服务器装置的控制方法，所述服务器装置具备请求接收部、图像处理部以及响应发送部，所述控制方法的特征在于，

所述控制方法具备如下步骤：

在所述图像处理步骤中，