CN101267492A - 信息处理系统、信息处理方法及服务器 - Google Patents

信息处理系统、信息处理方法及服务器 Download PDF

Info

Publication number
CN101267492A
CN101267492A CNA2008100922348A CN200810092234A CN101267492A CN 101267492 A CN101267492 A CN 101267492A CN A2008100922348 A CNA2008100922348 A CN A2008100922348A CN 200810092234 A CN200810092234 A CN 200810092234A CN 101267492 A CN101267492 A CN 101267492A
Authority
CN
China
Prior art keywords
word
information
user
server
information processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100922348A
Other languages
English (en)
Inventor
山崎正裕
桑本英树
冈野祐三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN101267492A publication Critical patent/CN101267492A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3266Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3273Display

Abstract

一种信息处理装置,包括:一个照相机,用于输出图片信息;一个存储器,用于存储至少一个的一个或多个字符的字符串的相关简明信息;一个数据通信接口,用于经由网络进行通信。该信息处理装置还包括一个CPU,用于:识别该照相机输出的图片信息中包含的一个或多个字符的字符串;响应于用户的字符识别请求,显示识别结果及被识别的一个或多个字符的字符串的相关简明信息;当用户请求该识别一个或多个字符的字符串的相关详细信息时,控制该数据通信接口经由网络进行通信;显示该数据通信接口接收的信息。

Description

信息处理系统、信息处理方法及服务器
本申请是2004年7月9日提交的、申请号为200410063519.0、名称为“信息处理装置、信息处理方法及软件产品”的分案申请。
发明领域
本发明涉及一种信息处理装置,如移动蜂窝电话、PHS(个人手持电话系统)、PDA(个人数字助理)、便携式或手持个人电脑及其他同类产品。
背景技术
公开号为2002-252691的日本专利披露了一种能够使用OCR(光字符识别)功能输入地址、电话号码和URL(统一资源地址)等打印信息的移动电话终端。公开号为5-274346的日本专利披露了一种具有字符识别部件的电子词典,该电子词典能够识别打印的字符串,并将该字符串的翻译结果显示在一个显示部件上。
通常情况下,一个电子词典的存储容量是有限的,所以,如果用户想知道关于所识别的字符的更详细信息,该用户还需要其他电子词典或普通纸质词典,以在该词典中重新查找该字符。
因此,有必要提供一种改进的信息处理装置。
发明内容
为满足上述需求,本发明提供了一种信息处理装置,该信息处理装置包括:一个照相机,其输出图片信息;一个存储器,其存储关于至少一个的一个或多个字符的字符串的简明信息;以及一个数据通信接口,用于经由网络进行通信。该信息处理装置包括一个CPU,其识别照相机输出的图片信息中包含的一个或多个字符的字符串,并显示识别结果和关于该所识别字符串的简明信息,作为对用户发出的字符识别请求的响应。当用户请求该被识别的一个或多个字符的字符串的详细信息时,该CPU还控制数据通信接口与服务器进行通信,并显示该数据通信接口接收的信息。
附图简述
图1是一个信息处理装置的配置的结构框图;
图2所示为词典数据内容的一个实例;
图3所示为词典数据内容的另一个实例;
图4是描述一个信息处理装置工作过程的流程图;
图5所示为显示屏幕图像的实例;
图6所示为显示屏幕图像的实例;
图7所示为一个历史表的实例;
图8是描述一个历史表创建过程的流程图;
图9所示为显示屏幕图像的实例;
图10是描述下载字形数据的过程的流程图;
图11所示为出现在字形数据下载过程中的显示屏幕图像的实例;
图12所示为一个信息处理装置访问词典提供商的实例;
图13是一个访问Web站点的过程的流程图;
图14所示为一个信息处理装置的外观;
图15是在该信息处理装置中执行的一个过程的流程图;
图16所示为显示屏幕图像的实例;
图17所示为显示屏幕图像的实例;
图18所示为显示屏幕图像的实例;
图19所示为搜索确切定义的系统的实例;
图20所示为一个同现关系数据库的实例;
图21是在信息处理装置中执行的一个过程的流程图;
图22是在服务器中执行的一个过程的流程图;
图23是关于一个识别对象单词和同现单词的位置关系的说明图;
图24所示为信息处理装置和服务器执行的一系列示例性的操作;
图25所示为显示屏幕图像的实例。
发明详述
下面将结合附图,描述一种信息处理装置,如蜂窝电话、PHS、PDA、便携式或手持个人电脑。在附图中,相同的参考数字表示相同的部件。
图1是一个信息处理装置的配置的结构框图,该信息处理装置具有图像识别(OCR)功能。后面将描述使用图像识别功能来识别打印在纸张上的单词或其他类型的单词,并将该单词的定义显示在显示屏上的情况。
输入单元101包括:一个具有多个按键的键盘,这些按键包括一个快门按钮、一个电源按钮和多个数字按键。用户使用该输入单元101输入信息,如电话号码、电子邮件地址、电源开/关命令以及请求照相机103拍摄照片的图像拍摄命令等。输入单元101还可以包括一个触摸敏感的面板,使得用户能够用笔或他/她的手指触摸显示屏,从而输入信息或指示。输入单元101还可以包括一个语音识别单元,从而采用基于语音识别的输入方法。
中央处理单元(CPU)102通过执行存储器104中存储的程序,控制该信息处理装置的各个部件。照相机103将对象为人、风景或字符的光图像转化为符合如YUV标准的图片信息,并通过图片接口110将该图片信息传送到CPU102。这里,符合YUV标准的图片信息指的是包含亮度信号(Y)、亮度信号和红色分量的差值(U)以及亮度信号和蓝色分量的差值(V)的信息。但是,由照相机103转化的图片信息不限于符合YUV标准的图片信息,也可以是符合任何其他标准的信息,只要CPU102能够处理该图片信息即可。在本实例中,照相机103置于信息处理装置之内。本发明不限于该实例。照相机也可以通过图片接口110附着在信息处理装置之外。
CPU102将符合YUV标准的图片信息转换为符合RGB(红绿蓝)标准的图片信息,并将转换后的图片信息传输到显示屏107或类似部件上。用户在监视显示屏107上显示的图片的同时,可以选择他/她所要生成的图象的对象或主体,并使用快门按钮或类似部件进行拍摄。在按下快门按钮的时候,从照相机103发送的图片信息被保存到存储器104中。存储器104可以是只读存储器(ROM)或随机读取存储器(RAM)。图像数据、语音数据及CPU102执行的软件,都存储在存储器104中。
图片识别存储器105中存储了CPU102执行OCR功能的软件程序。OCR功能可用于识别一张图片内的一个或多个字符,如文字、标记、符号、标志、数字、标识信息及其他。标识信息可以是一个主页地址、一个电子邮件地址、一个邮政地址、一个电话号码或地图信息。标识信息不限于上述实例,它可以是用于标识一个实体的任何信息。
一个或多个字符的字符串的识别包括如下步骤:从照相机103拍摄的图片中标识出包含一个或多个字符的字符串的区域;将包含字符的部分的图像数据分割成预定的部分;将这些部分中的各数据转换成一个参数值;并根据该参数值,确定各个部分中包含的信息。
以识别一张图片中的字符“abc”为例进行说明。首先,识别出图片中包含字符“abc”的区域;然后,将包含字符“abc”的部分的图像数据分割成包含字符“a”、“b”、“c”的部分;再将包含“a”、“b”、“c”的部分的数据转换成相应的参数值。预定参数值的确定方式如下:一个字符被视为纵向段、横向段和倾斜段的组合;字符的白色部分用0表示;字符的黑色部分用1表示。对于每个部分,从字形数据中包含的字符中选择与参数值最相似的字符。该字形数据是将每个参数值与对应于该参数值的一个字符如一个字母数字字符相关联的数据。该字形数据可以预先存储在存储器104中,也可以由用户下载或安装。
在本实例中,图片识别存储器105是专用于存储图片处理软件的存储器。也可以选择将图片处理软件嵌入到CPU102或存储器104中,为CPU102提供OCR功能。通过将图片处理软件嵌入到CPU102或存储器104中,可以减少部件的数目,而且制造成本和其他类似成本也会降低。
在本实例中,为了减小电路规模,OCR功能由CPU102执行。但是,本发明的配置并不限于此例,例如,也可以使用专用处理器实现OCR功能。
在显示屏107上显示照相机103生成的图像或CPU102识别出的一个或多个字符的字符串。此外,显示屏107上也可以显示工作状态,如电源状态、电波强度、电池剩余功率量、服务器连接状态、未读邮件列表等,显示屏107上还可以显示电话号码、电子邮件地址或电子邮件所要传输的文档。除此之外,显示屏107上还可以显示动画和静态图像、呼叫终止时主叫方的电话号码、以邮件方式终止的文档、互联网上的Web页面等等。但是,信息(如标识信息)所要传输的目的地不限于显示屏107,该信息的表现形式也可以是扩音器广播出的话音。数据通信接口108经由网络,与信息提供商的一台服务器或主计算机或其他数据设备进行通信。数据通信接口108可以是一个MODEM、一块网卡或其他类似设备。
搜索单元109是一个处理器,它参考存储在存储器104中的词典数据106,搜索对应于由CPU102识别出的一个或多个字符的字符串的信息。
图2所示为词典数据106的一个实例。列201中记录的是单词,列202中记录的是记录在列201中的单词的简明定义,列203中记录的是记载有与记录在列201中的单词有关的信息片断(如单词用法举例等详细信息的片断)的主页URL。在本实例中,词典数据106是英-英词典的数据。存储器104可以存储多个词典数据库,如英-日词典、英-法词典、英-德词典、科技词典、体育词典。当选择英-日词典并识别一个英语单词时,就从列202中取出日文翻译显示给用户。
如图3所示,列203中的各个URL的部分都可以记录。在本实例中,由于http://www.ooo.com是共同使用的,所以,该公共部分就被记录在公共URL部分204的域中。列206中记录的是特有URL部分,如“a”或“abacus”,都是被作为特有URL部分记录的。此外,通过组合公共URL部分204和特有URL部分206来创建包含详细信息的主页URL的方法,记录在URL创建方法205的域中。当如上所述记录URL时,可以减小词典数据106的数据规模。如果列206中记录的信息与列201中记录的单词相同,就可以省略列206,这样,进一步减小词典数据的数据规模。此外,词典数据106中记录的数据不限于单词定义和/或翻译数据,也可以是与科技或体育相关的专门术语。
在本实例中,搜索单元109也可以采用专用于词典数据搜索的处理器。但是,本发明不仅仅限于该实例,为了减小电路规模,也可以由CPU102执行搜索功能。
在下面所要描述的情况下,有两种图像拍摄模式,即:一种是普通图像拍摄模式,这种模式拍摄人和景物的普通静态图片或动态图片或普通照相机的其他类似功能;另一种就是拍摄照片的识别模式。当用户选择两种模式之一时,一个模式确定标志就被存储在存储器104中,CPU102检查该模式确定标志以确定所选择的图像拍摄模式。该模式确定标志是存储在存储器104中的软件程序所描述的一个变量,该变量被设置成一个能区分识别模式和普通图像拍摄模式的值。根据此变量,CPU102可以在识别模式和普通图像拍摄模式之间进行切换。
下面将结合图4中的流程图描述当选择识别模式时所要执行的过程的一个实例。当用户按下输入单元101中的快门按钮时,CPU102指示照相机103拍摄照片(步骤S401)。通过CPU102将照相机103产生(转化)的图片信息保存到存储器104中(步骤S402)。
CPU102读取存储器104中存储的图片信息,并识别包含在该图片信息中的一个或多个字符的字符串,例如,一本书中包含的单词“recognition”。CPU102将识别结果保存在存储器104中(步骤S403)。
搜索单元109读取识别结果,从存储器104中存储的词典数据106的列201中记录的单词中搜索一个符合的单词(步骤S404)。如果找到一个与该被识别的一个或多个字符的字符串正确匹配的单词(步骤S405),则将与该单词相关的列202中的简明信息显示在显示屏107上(步骤S406)。
下面将描述一种优选的搜索方法。首先,搜索一个完全符合的单词。如果没有找到该完全符合的单词,再搜索只存在一个字母不同而其他字母符合的单词。采用该方法时,即使CPU102对一张纸上的一个或多个字符的字符串识别错误,也可以找到与该字符串最相似的单词。这样,就可以节省反复生成图像和执行字符串识别的工作,可以给用户带来很大的方便。
此外,如果没有找到只存在一个字符差异的单词,就搜索存在两个字符差异或存在三个字符差异的单词,即,可以搜索的单词中差异的字符数是逐渐递增的。这样,即使在识别率很低的情况下,也仍然能找到正确的单词。
CPU102判断用户是否通过输入单元101请求了详细的翻译信息(步骤S407)。如果发出了这样的请求,CPU102读取由搜索单元109在步骤S404中检索到的单词的相关URL,并将一个指示信号传送到数据通信接口108,使其访问该URL(步骤S408)。显示屏107显示经由数据通信接口108接收到的信息,如主页内容或其他类似信息。如果没有找到正确的单词(步骤S405),通过显示屏107向用户发出一条通知消息,告诉用户没有找到合适的单词(步骤S410)。然后,该过程结束。
如上所述,当用户不仅想得到简明信息,而且还想得到详细信息时,就需要显示记载详细信息的主页或其他类似物。这样,用户就可以在不必查词典的情况下获知一个单词的详细信息。该功能将是很方便用户的。
一个信息处理装置可能不具有大容量的存储器,即,信息处理装置上可能只存储了很少量的必须信息,如简明定义或典型翻译。当用户需要详细信息时,他可以通过网络从信息提供商的服务器处获取信息。因此,本实例中采用的方法是非常有效的。
在本实例中,可以根据需要,向用户提供简明信息和详细信息。但是,本发明并不仅仅限于该实例,也可以分别从存储器和通过网络提供两种不同类型的信息,如,第一信息和第二信息。
图5所示为显示屏幕图像的一些实例。顺便指出一点,各个屏幕图像下方的指示菜单中的指示对应于输入单元101中的相应按键。当用户按下一个按键或其他类似部件时,菜单的特征或类似指示所提供的显示屏幕图像就出现在显示屏107上。每一次切换显示屏幕图像时,都可以使用按键来执行与各个显示屏幕图像下方的指示所对应的特征。所以,可以根据显示的指示所对应的特征,对按键进行命名。例如,对应于菜单特征的按键可以被命名为菜单键,对应于返回特征的按键可以被命名为返回键。可以根据指示的显示位置,如右下方和左下方,将与指示相关的特征分配给按键。可以选择,把这些功能全部分配给同一个按键。
屏幕图像501是屏幕图像的一个实例,用户通过该屏幕图像定义图片识别的范围。例如,用户将出现在显示屏107中间的一个标记(如“+”、“?”、“?”或其他类似标记)置于字符串附近的位置。此时,显示屏107起取景器的作用。否则的话,用户可操纵输入单元101,移动显示屏上的一个光标,去指定识别范围。此外,用户也能够选择多种用于确定识别对象的方法中的任何方法。对于动画而言,要生成构成动画的若干静态图像表现帧,从而使得这些帧可以连续馈入。通过一个可连续馈入帧的帧馈入屏幕图像,可以指定识别对象。
可以使用点线或类似物圈定一个识别对象,从而区分该识别对象。也可以选择显示识别对象的放大图象或缩小图象。例如,原先用一个像素的横向和一个像素的纵向显示的字符,放大后,就用两个像素的横向和两个像素的纵向显示。此外,图像编辑单元可以将识别对象的包含一个或多个字符的字符串的图象部分的颜色,改变为黑白或棕褐色。否则,加亮该图象部分,然后进行显示。本发明不限于以上区分识别对象的方法,只要能清晰地标识出一个图像中包含的识别对象的任何方法都可采用。
例如,可以按下识别模式按钮,以从等待屏幕图像切换到屏幕图像501。或者,在等待屏幕图像中指定菜单屏幕图像,并且按下该菜单屏幕图像中包含的一个按钮,从而显示屏幕图像501。如果利用所显示的屏幕图像501,按动该屏幕图像下方的“识别”按钮,就会从屏幕图像501切换到屏幕图像502。
当用户按下快门按钮或“识别”按钮时,显示屏107显示屏幕图像502。屏幕图像502用于通告用户正在执行识别过程。当识别过程终止的时候,屏幕图像502被切换到屏幕图像503。
显示屏107上出现的屏幕图像503包含CPU102执行的识别结果以及与该识别结果相关的一条简明信息。为了区分识别对象,例如用黑色显示识别对象之外的图象部分。
如果用户想得知该单词的意思及其详细用法,用户可以按下屏幕图像503左下方的对应于详细表示的按钮。这样,屏幕图像503被切换到了屏幕图像504。屏幕图像504指示数据通信接口108正在将此信息处理装置连接列203中记录的一个URL。当该信息处理装置被连接到列203中记录的URL时,从屏幕图像504切换到屏幕图像505。屏幕图像505给出了详细信息,如URL定位的主页内容。
通过使用上述信息显示方法,在用户得到简明信息之后,执行简单的操作,就能获悉单词的详细信息及其他类似信息。这对用户是友好的。
此外,在本实例中,一个URL用于查找详细信息。但本发明并不限于此。例如,列203中可以存储很多URL,当请求详细信息时,可以选择这些URL中的任意一个。这种情况下,用户可以选择多个信息源中的任意一个,去获知单词的详细信息或其他类似信息。这对于用户来说是很方便。
此外,在本实例中,使用了URL或类似信息作为查找详细信息的信息。但本发明并不限于这种形式。只要能够获取单词的详细信息或其他类似信息,任何形式都是可以的。
通过使用URL或其他类似信息获取的详细信息被存储在存储器104中。这种情况下,对简明翻译和详细翻译做出区分来存储。如果用户再次请求同一单词的详细信息,则从存储器104中读取详细信息并显示。这样,由于不需访问互联网或其他类似设备,所以可以快速地显示详细信息。这样就可以节省时间。此外,即使移动蜂窝电话处于可进行通信的区域之外,也可以获取详细信息。
此外,也可以使用其他装置(如存储了详细信息的个人电脑或存储设备)获取详细信息。这种情况下,词典数据106中的列206中记录从其他装置读取详细信息所需的连接信息,该连接信息可以是,例如其他装置的标识,如为包含有详细信息的文件指定的IP地址、路径名或者文件名,或存储了详细信息的其他装置所包含的存储器中的一个地址。
例如,当用户需要一个或多个字符的字符串的详细信息时,他使用图5(3)的实例中的显示屏幕图像发出一个详细信息请求。接收到该请求信息的CPU102通过数据通信接口108,将存储在存储器104中与字符串相关的连接信息发送给其他装置,如PC;PC根据该连接信息将详细信息发送给信息处理装置,该详细信息存储于该装置的存储器中或外部存储器中;信息处理装置在显示屏107上显示该详细信息。可以使用电缆线或无线电波来链接该信息处理装置和其他装置。如果使用电缆线链接其他装置,即便该信息处理装置位于可以通信的区域之外,也能获取到详细信息。这对用户是友好的。此外,也可以从存储详细信息的存储媒介处获取详细信息。这种情况下,信息处理装置中需要包含用于从存储媒介中读取信息的存储媒介读取器,并执行与前述相同的过程。
此外,用户可以自己创建或编辑详细信息。这种情况下,显示屏107上显示一个设置屏幕图像,用户可通过它创建或编辑(增加或删除)详细信息。所输入的信息被记录在词典数据的列203中。也可以创建或编辑一个用户独有的原始词典。此外,创建的原始词典也可用于获取一个单词的详细信息。可以从预定的详细信息中增加或删除信息。这样,用户友好度得到了进一步的提高。
在本实例中,当需要简明信息时,就要使用存储器104中存储的信息。即使获得简明信息之后,也可以使用存储在其他装置或存储媒介中的信息以及从互联网接收的信息。
下面将说明存储器104存储了多个词典数据时信息处理装置的操作过程。
存储器104中存储了多个词典数据,如英-英词典、英-日词典、德-日词典,以及一个词典标志。
词典标志用于指定CPU102所使用的词典数据项。例如,词典标志是存储在存储器104中的软件程序中包含的一个变量。根据用户在输入单元101上执行的操作,词典标志的值是可变的。这样,用户可以获取一个单词的任何或多种语言翻译,这对用户是友好的。
图6所示为当用户选择词典时显示屏107上出现的显示屏幕图像的实例。当照相机103在识别模式下被激活时,就显示屏幕图像601。为了激活照相机103,可以按动该信息处理装置侧面的一个开关。或者,从等待屏幕图像切换到菜单屏幕图像,再多次按动按钮。在屏幕图像601中,按动该屏幕图像右下方出现的菜单对应的按钮,然后,从屏幕图像601切换到屏幕图像602。
屏幕图像602用于从一个菜单中选择菜单项。如果使用输入单元101选择菜单项“(1)选择一个词典”,就从屏幕图像602切换到屏幕图像603。如果使用输入单元101选择菜单项“(3)△△△日-英词典”,就从屏幕图像603切换到屏幕图像604。
屏幕图像604通知用户,“△△△日-英词典”已被选择为要使用的词典。此时,如果按动检查对应的按钮,就从屏幕图像604切换到屏幕图像601。如果该信息处理装置有多个词典数据项,用户就可以获得多种语言的信息,这对用户是友好的。
假设英-日词典被指定为要使用的词典数据,如果识别出一个德文单词,则无法找到符合的单词。如果没有在指定的词典中寻找到符合的单词,则CPU102就将词典数据从英-日词典自动切换为其他的词典数据。如果在第二个词典数据中未找到符合的单词,CPU切换到第三或第四词典数据。这种情况下,用户减轻了选择词典数据的负担,于是就实现了一个用户友好的词典功能。
下面参考图10的流程图,详细描述从互联网下载字形数据的过程。例如,图片识别存储器105中只存储了用于识别字母数字字符的软件程序,用户无法使用OCR功能识别其他字符,如中文字符或阿拉伯语字符。为了解决此问题,信息处理装置经由数据通信接口108,通过网络与信息提供商的一台服务器或主计算机进行通信,从而下载包含字形数据的软件程序。
首先,收到下载字形数据表指示的CPU102通过数据通信接口108访问互联网上的一个Web站点,该Web站点存放着字形数据(步骤S1001)。该Web站点上的一张Web页面显示出来时,用户按动输入单元101中的一个按钮,来指示下载字形数据(步骤S1002)。于是,CPU102通过数据通信接口从该Web站点下载字形数据(步骤S1003)。CPU102将该下载的字形数据增加到图片识别存储器中的字形数据表中(步骤S1004)。
图11所示为一些屏幕图像的实例,通过这些屏幕图像,信息处理装置被连接到可下载字形数据的Web站点。
屏幕图像1101给出了互联网上一个Web站点上保存的Web页面,可从该Web站点下载字形数据。例如,选择“阿拉伯”时,从屏幕图像1101切换到屏幕图像1102。屏幕图像1102显示的是用户希望下载阿拉伯字形数据时的用户确认信息,如果选择“Yes”,就从屏幕图像1102切换到屏幕图像1103。屏幕图像1103表示正在下载阿拉伯字形。下载结束之后,从屏幕图像1103切换到屏幕图像1104。屏幕图像1104表明,阿拉伯字形已经被下载。类似地,用户也可以下载表示其他任意外语字形的词典数据。
如上所述,由于可以下载多种语言的字形数据项和词典,所以,信息处理装置就可以识别多种语言的字符,并获取相关信息,如多种语言的翻译,这有助于改善用户友好度。
如果欲识别的字符没有包含在图片识别存储器105存储的字形数据项中的时候,用户收到一条通知消息,告知该字符无法被识别。同时,显示屏107上会显示一个屏幕图像,提示用户下载字形数据和词典数据。所以,即使图片识别存储器105或存储器104中既没有存储字形数据也没有存储词典数据,也可以识别一个字符,并显示相关信息。因此,改善了用户友好度。
可以选择,不将词典数据下载到信息处理装置上,而是浏览互联网上的词典。互联网上很多Web站点都提供记载有词典数据的主页。当请求相关信息时,可以进入Web站点的只可由注册用户浏览的Web页面。这种情况下,用户每一次请求相关信息时,都要输入他/她的用户ID和密码。这样就不太方便了。所以,可以将用户ID和密码记录在存储器104中。图12所示为这种情况的示意图,其中,信息处理装置使用存储器104中存储的用户ID和密码,访问包含词典的Web站点。在本实例中,不同的用户ID和密码对应于不同的词典数据。
图13是使用词典数据访问包含详细信息的Web站点的过程的流程图。
在步骤S1301中,信息处理装置获取用户ID和密码,以访问受限的Web站点。用户ID和密码可以通过数据通信接口108下载,从存储媒体安装,或使用输入单元101输入。用户ID和密码存储在存储器104中,例如,用户ID和密码写在词典数据106的一个头部中。
进行一个或多个字符的字符串识别(步骤S1302)。从存储器中读取简明信息并显示(步骤S1303)。
如果CPU102接收到一个请求显示详细信息的信号(步骤S1304),CPU102就从存储器104中读取出用户ID和密码。在步骤S 1306中,CPU102经由数据通信接口108,将一个访问信号、用户ID和密码发送到服务器。服务器接收到该访问信号、用户ID和密码之后,对用户进行身份认证。如果认证成功,则将详细信息发送给该信息处理装置。
在步骤S1307中,信息处理装置经由数据通信接口108接收详细信息。在步骤S1308中,显示屏107显示该信息。
如上所述,用户ID和密码存放在存储器104中,并可被发送到服务器。所以,用户每次请求访问受限Web站点时,就不必输入ID和密码了。这对用户是友好的。
接下来,将描述一个存储关于字符识别的历史信息的实例。由于人的存储容量是有限的,所以,人们可能会经常忘记一个单词的定义或相似情况,而一次又一次地查找其定义。在这种情况下,重复查找字符定义,既消耗时间,又消耗人力。
下面分别说明创建历史信息的过程和使用历史信息的过程。
首先描述创建历史信息的过程。图7所示为一个历史表的实例,该历史表作为历史信息存储在存储器104中。如图7所示,搜索单元109检索的单词及检索这些单词的时间点被作为历史进行记录。
列701中记录的是在词典数据列201中记录的单词,这些单词的字符已经被识别出。列702中记录的是识别次数,识别次数是各个单词被识别时所用的次数。列703中记录的是各个单词被识别的时间点中最新的时间点。列704中记录的是请求次数,请求次数是请求各个单词详细定义所用的详细信息请求的次数。列705中记录的是请求各个单词详细定义的最新时间点。
图8是描述字符识别执行完毕之后创建如图7所示的历史表的过程的流程图。步骤S406和S407对应于图4中的步骤S406和S407,步骤S801至S804被插入到步骤S406和S407之间。
在步骤S406中,显示词典数据106中包含的识别字符的简明信息,即典型翻译或简单翻译。判定存储器104是否已将识别字符(如一个单词)作为历史信息存储(步骤S801)。如果包含该单词,就执行步骤S802。在步骤S802中,CPU102更新或增加相关的识别次数,识别次数作为历史信息存储在列702中,该次数是该单词已被识别的次数。在步骤S803中,将CPU102到达步骤S803的时间点记录为最新识别时间点,在列703中,就是历史信息。
如果在步骤S801中判定该单词没有作为历史信息被存储,执行步骤S804。该单词和最新识别时间点作为历史信息被另外记录。流程到达步骤S804的时间点,被作为最新识别时间点记录在列703中。经过以上过程,历史表根据识别产生的历史信息被更新。优选为,将历史信息与存储器104中存储的词典数据关联存放,这样就可以使用历史信息检索一个单词的意思或其他类似信息。例如,可以将历史信息记录在词典数据的一部分(如头部)中。
例如,如果请求次数大于2,则将通过互联网下载的详细信息存储到词典数据106中。如果请求的最新时间点是在大于六个月之前,CPU102进行控制以删除词典数据106中存储的详细信息。接着,我们描述使用已创建的历史信息的过程。图9所示为使用历史信息显示单词定义的过程中所显示的屏幕图像的实例。
当显示屏幕图像901时,用户可以按动该屏幕图像右下方出现的菜单对应的按钮。这样,从屏幕图像901切换到屏幕图像902。在屏幕图像902中可以选择任何菜单。在这种情况下,如果选择菜单项“(5)历史表”,就从屏幕图像902切换到屏幕图像903。屏幕图像903显示一张历史表。列出单词、单词已被识别的识别次数以及请求该单词的相关详细信息的请求次数。如果选择显示的单词中的一个,如“recognition”,就从屏幕图像903切换到屏幕图像904。
屏幕图像904显示了“recognition”的详细信息。在本实例中,“recognition”的详细定义的请求次数是0。所以,通过互联网获取详细信息。如果选择“abalone”,就可以从词典数据106中读取详细信息,因为“abalone”的详细定义的请求次数是3。
在这种情况下,如果按下检查对应的按钮,就从屏幕图像904切换到了屏幕图像905。与屏幕图像903一样,屏幕图像905显示的是历史表。虽然在屏幕图像903中,“recognition”已被请求的请求次数是0,但在屏幕图像905中,该请求次数被加1。
用户可以随时随地检查已经识别一次的单词的意思,而不必重新对该单词进行识别。根据本实例,当用户反复查找某个单词时,他就可以在不访问互联网的情况下获取详细信息。这一点有助于改进用户友好度。
当显示图9中所示的屏幕图像时,用户可以很容易地得知识别次数和请求次数。此外,用户多次查找过的单词被可见地标识。如果识别次数和请求次数按降序排列,用户就可以标识出那些不容易记住的单词。这样,就可以鼓励用户有意识地记忆这些单词。这对用户是很友好的。
此外,简明信息和详细信息可以作为历史信息相互独立地存储在存储器104中。当用户使用历史信息时,如果用户既可以选择简明信息也可以选择详细信息,则用户友好度将得到进一步的改善。需要指出的是,历史信息并不限于图7中所显示的内容。任何信息,只要跟历史有关,都可以作为历史信息。
此外,CPU执行识别操作之后,用户可以获悉历史信息是否是可用的。例如,当显示识别结果时,显示屏107上也可以显示“历史信息可用”的通知或其他类似消息。历史信息可用或不可用的通知消息不限于显示字符、图标或标号,也可以是从扩音器和其它类似设备中广播出的声音。根据此通知,用户可得知她/他以前检查过同样的单词,并且可以去检查历史信息。这对用户是友好的。
此外,该信息处理装置还可以包括一个通过全球定位系统(GPS)或类似技术实现的位置信息获取单元。位置信息获取单元所获取的位置信息被作为历史信息存储在存储器104中。这种情况下,可以方便地检查单词已被识别的地点。当用户再次访问其名字已被作为历史信息记录的地点时,他就可以得知这一事实,以及在这一地点识别的单词以及该单词的意思。
图14是一个信息处理装置的外观示意图。该信息处理装置可以通过铰链1403折叠起来,这样,包含显示屏107的壳体200和包含输入单元101的壳体300就会互相贴合。轴1403包括一个可以旋转的照相机。
CPU102检测该移动蜂窝电话处于如图14(1)所示的翻开状态还是如图14(2)所示的叠合状态。例如,该信息处理装置可以在壳体200中集成一个磁体,在壳体300中集成一个霍尔效应部件。CPU102根据该霍尔效应部件提供的电压电平,检测该移动蜂窝电话是处于翻开状态还是叠合状态,该磁体施加在该霍尔效应部件上的一个磁场。用于检测的装置不限于此例,也可以使用基于凸面体部件和凹面体部件啮合的感应器作为折叠检测单元。
除了信息处理装置翻开时经常使用的显示屏107,该信息处理装置还包括一个子显示屏1407,当该信息处理装置折叠起来(叠合)的时候,可以看到该子显示屏。
普通图像拍摄按钮1401和识别图像拍摄按钮1402位于壳体300的侧面。
当按下普通图像拍摄按钮1401时,照相机103生成拍摄对象的一张图象,生成的图象被保存在存储器104中,并在必要的时候显示。当按下识别图像拍摄按钮1402时,照相机103生成识别对象的图象。CPU102识别字符之后,就将识别结果显示在显示屏107和/或子显示屏1407上。
如上所述,由于包括专用于识别模式的按钮,和普通的图像拍摄按钮,所以用户可以很方便地选择任一模式,这对用户很友好。此外,当两个按钮位于壳体300的侧面时,如图14所示,不管该信息处理装置是翻开的还是叠合的,这两个按钮都可以相同的方式被使用。这一点改善了用户友好度。此外,如图14(2)所示,由于操作键1408a和1408b位于壳体300的侧面的位置,所以,即使信息处理装置处于叠合状态,用户也可以操作该信息处理装置。这样提高了用户友好度。
需要指出的是,普通图像拍摄按钮1401和识别图像拍摄按钮1402优选为由不同的按钮实现。但是,也可以用同一个按钮实现普通图像拍摄按钮1401和识别图像拍摄按钮1402。如果用同一个按钮实现普通图像拍摄按钮1401和识别图像拍摄按钮1402,则必须区分操作此按钮进行照相和操作此按钮进行识别的方式。例如,可以根据按钮被按下的时间间隔或按钮被按动的次数,在普通图像拍摄模式和识别模式之间进行切换。此外,当普通图像拍摄按钮和识别图像拍摄按钮使用同一个按钮时,可以节省空间,而且信息处理装置可以设计地很紧凑。可以通过附着在移动蜂窝电话100上的任何一个传感器实现普通图像拍摄按钮1401和识别图像拍摄按钮1402,只要用户能操纵这两个按钮即可。
虽然已经描述了普通图像拍摄按钮1401和识别图像拍摄按钮1402都位于壳体的侧面,但本发明并不限于这种结构。只要信息处理装置在叠合的时候按扭处于用户可以操作的位置即可,例如,按钮可以位于信息处理装置的背面。在这种情况下,信息处理装置的背面指的是与显示屏107所处的信息处理装置的一面相对的一面,并且,在信息处理装置折叠(叠合)的时候能够看到该面。
下面将结合图15中的流程图,描述当信息处理装置处于叠合状态时执行图片识别功能的示例性的过程。
首先,在步骤S1501中,信息处理装置等待用户使用输入单元101中包含的按键进行输入。当CPU102检测到一个表示请求激活照相机的按键输入时(步骤S1502),CPU102判断该信息处理装置处于翻开状态还是叠合状态(步骤S1503)。
如果信息处理装置处于叠合状态,CPU102在子显示屏1407上控制图像的显示(步骤S1504)。在本描述中,省略了信息处理装置处于翻开状态时在步骤S1503中执行的过程。
当用户按下快门按钮时,指示拍摄图象的信号被传输到CPU102(步骤S1505)。CPU102就将照相机103生成(转化)的对象的图片信息保存在存储器104中(步骤S1506)。
CPU102执行图片识别操作,图片信息中包含的字符被识别,识别结果被保存在存储器104中(步骤S1507)。搜索单元109读取识别结果,并从存储在存储器104中的词典数据06中的列201中搜索一个符合的单词。识别结果及其简明信息显示在子显示屏1407上(步骤S1508)。
如果CPU102检测到该信息处理装置处于翻开状态(步骤S1509),执行步骤S1510。CPU102读取从词典数据中检索出的单词的相关URL,并通过数据通信接口108发送一个指示信号(步骤S1510),利用该指示信号连接到该URL。在步骤S1511中,CPU102通过数据通信接口108读取该URL所保存的主页的内容,并将该主页的内容显示在显示屏107上。
图16是一些屏幕图像的实例。如果用户将该信息处理装置从叠合状态(信息处理装置处于叠合状态)改变为翻开状态(信息处理装置不处于叠合状态),则用户不必进行任何键盘操作,就可以将通过数据通信接口108接收的详细信息显示在显示屏107上。在屏幕图像1601至1603中,包含在屏幕图像左下方的“菜单”指示对应于按钮1408a,而包含在屏幕图像右下方的“识别”指示对应于按钮1408b。例如,当“菜单”出现在屏幕图像的左下方时,我们称按钮1408a为“菜单”按钮。
屏幕图像1601是识别模式下子显示屏1407上显示的屏幕图像的实例。如果作为“识别”按钮的按钮1408b被按下,就会从屏幕图像1601切换到屏幕图像1602。
屏幕图像1602表明,“Recognition”已被选择为识别对象。该屏幕图像中除“Recognition”之外的部分变成了黑色,以高亮“Recognition”。此外,由于将屏幕图像中字符之外的部分变成了黑色,可以防止识别模式被误用的情况,如隐性成像。如果按下作为“确定”按钮的按钮1408b,就从屏幕图像1602切换到屏幕图像1603。
屏幕1603给出了识别结果以及识别出的字符串的简明信息。
如果在这种状态下移动蜂窝电话是翻开的,屏幕图像1604就出现在显示屏107上。屏幕图像1604是表示识别出的字符串的详细信息的屏幕图像的一个实例,。
如上所述,该信息处理装置处于叠合状态时也可以识别字符串。这样就节省了每次进行字符识别时打开该信息处理装置的工作,并可以更方便地进行字符识别。此外,当用户希望获悉详细信息时,如果用户打开信息处理装置,即使不操纵输入单元101,显示屏107上也会显示详细信息。这一点对用户来说是很友好的。
下面将说明一个编辑识别结果的实例。例如,CPU102对一张纸上写的“Recognition”进行字符识别。如果识别结果为“Reconifiom”,可以对该结果进行编辑。
图17是在编辑识别结果过程中显示的屏幕图像的实例。
屏幕图像1701是显示屏107上显示的屏幕图像的一个实例。在本实例中,CPU102将一个或多个字符的字符串“Recognition”错误地识别为“Reconifiom”。搜索单元109从词典数据106中搜索一个与“Reconifiom”最相似的单词,于是就将“reconfirm”作为搜索结果显示出来。这里,如果按下菜单按钮,就从屏幕图像1701切换到屏幕图像1702。
屏幕图像1702显示出一个菜单。这里,如果选择菜单项“(1)编辑结果”,并按下确定按钮,就从屏幕图像1702切换到屏幕图像1703。屏幕图像1703是帮助编辑识别结果的屏幕图象。识别结果显示的域1705中显示出一个光标1706。光标1706用于选择欲被编辑的字符所处的位置。通过使用输入单元101,可以对字符进行编辑。在本实例中,删除“m”,并输入“g”和“n”。如果在此状态下按下搜索按钮,搜索单元109就会从词典数据106中搜索符合的单词。然后,将符合的单词显示在搜索结果域中。屏幕图像1704就是表示搜索结果的屏幕图像的一个实例。
如上所述,当识别结果不正确时,CPU102无需执行字符识别。例如,当一张包含一个或多个字符的字符串的报纸很破烂时,即使多次执行字符识别,CPU也可能错误地识别字符串。这种情况下,用户会反复使用OCR功能。按照本实例,用户可以在不重复执行OCR功能的情况下更正识别结果。这对于用户是很友好的。
在前面的例子中,当按下搜索按钮时,搜索单元109从词典数据106中搜索一个与识别结果最接近的单词。可以选择,当增加或删除一个字符时,搜索单元109可以搜索最接近的单词。这种情况下,用户想显示搜索结果时不必每次都按下搜索按钮。当识别结果中包括多个被错误识别的字符时,用户可以在不对所有被错误识别的字符进行编辑的情况下获取正确的单词。这一点对用户是很友好的。
下面描述将识别结果和/或与该结果有关的信息发送到其他装置的示例性的过程。识别结果显示之后,用户操作输入单元101,以调用邮件功能(例如,按下一个邮件运行按键)。接收到输入信号的CPU102调用存储器104中驻留的邮件软件,并在显示屏107或显示屏1407上显示邮件创建屏幕图像。与此同时,CPU102将识别结果和/或相关的信息自动插入到邮件创建屏幕图像的文本域中。
此外,用户可以从存储器中存储的所有信息中选择地址信息(如名字、电话号码或邮件地址),并将所选择的地址信息插入到接收方的地址域中。
如上所述,通过执行一个简单的操作,用户就可以发送识别结果。从而改善了用户友好度。此外,如果标题名(如“OCR结果”)可被自动插入到标题域中,就可以进一步节省数据输入的负担,这将进一步改善用户友好度。
此外,如果识别出一个邮件地址,该地址会被作为地址自动插入到邮件创建屏幕图像的地址域中。优选为,在CPU102中包括编辑功能,因为用户可能希望将邮件地址插入到文本域中。这种编辑功能将结合图18进行说明。
屏幕图像(1)表示识别图像及识别结果。如果按下菜单按钮,就从屏幕图像(1)切换到屏幕图像(2)。屏幕图像(2)帮助用户选择使用识别结果“yamazaki@xxx.jp”的场合。当选择菜单项“(2)创建邮件”时,就从屏幕图像(2)切换到屏幕图像(3)。屏幕图像
(3)让用户选择将识别结果插入到邮件创建屏幕图像的哪个域中。如果选择“(3)文本”,就从屏幕图像(3)切换到邮件创建屏幕图像,即屏幕图像(4),在该屏幕图像中,识别结果被分配到邮件文本中。
如上所述,用户可以选择将识别结果插入到邮件中的哪个部分。所以,表示识别结果的屏幕图像被显示之后,如果进行了几次输入,屏幕图像就被切换到邮件创建屏幕图像,其中,可以将识别结果插入到文本域中。从而改善了用户友好度。
此外,当表示菜单的屏幕图像(2)被显示的时候,可以根据作为识别结果的字符串的类型确定光标位置。也就是说,如果识别结果中包含“@”,CPU102就会将识别结果视为一个邮件地址。如果识别结果中包含“http”,CPU102就会将识别结果视为一个URL。如果识别结果被视为邮件地址,当显示屏幕图像(2)时,光标定位在菜单项的“(2)创建邮件”上;如果识别结果被视为一个URL,光标定位在菜单项的“(1)互联网”上。如果在显示屏107上如此显示光标,就可以节省在屏幕图像(2)中选择菜单项的工作,从而进一步改善用户友好度。
此外,当识别结果被视为一个邮件地址时,如果用户希望将此邮件地址注册到地址本中,用户可以通过屏幕图像(2)选择菜单项“(4)注册到地址本中”。即使在这种情况下,也可以选择将作为识别结果的邮件地址插入到地址本的哪个域中,从而提供与前述相同的优点。
邮件软件提供的邮件创建屏幕图像被认为是包括地址域、标题域和文本域。本发明不限于邮件创建屏幕图像的这种结构。即便还包括任何其他域,如果在其中自动插入相关信息,也会节省输入的工作。这对于用户是很友好的。
此外,识别结果(如,一个URL)被描述为会被自动插入到邮件创建屏幕图像中的任何域中。用户可以选择使用输入单元101自行输入一个注释或其他文字。在这种情况下,当将识别结果传送给被叫方的时候,用户不仅可以发送识别结果,而且还可以发送关于该结果的注释或其他文字。此时,如果使用预存在存储器104中的任意固定形式的语句或象形图,将进一步改善用户友好度。
本发明不限于用户希望知道单词意思及其详细用法的情况。例如,也可以提供关于各个领域专用术语的信息,如体育、电影、历史、餐饮、科技、恐龙、动植物、娱乐等。这在种情况下,可以增加可用术语信息的种类,从而改善用户友好度。当可用信息量很大的时候,如果用户阅读杂志或者报纸、或散步时对某个单词感兴趣,并希望获知该单词的详细信息,用户就可以立即获取该单词的意思。这对用户来说是相当友好的。
此外,当用户希望获知关于“恐龙”的详细信息时,如果他获取到关于植物“恐龙”的详细信息,用户就会很不满意。当请求详细信息时,在显示屏107上会显示一条消息,例如,“你希望获知哪种类型的详细信息”。如果通过一个屏幕图像或其他类似物,让用户选择各种类型中的任何类型,将会进一步改善用户友好度。
下面将描述一个使用单词间的同现关系获知识别出的单词的确切意思的实例。“同现”指的是多个单词同时出现于同一文档中。通常情况下,一个单词会有多个意思。如果将词典中定义的多个意思按照原样全部显示出来,用户必须阅读上下文并思考识别出的单词在这种上下文环境中的意思。如果这个单词被理解错误,包含该单词的句子就会被理解错误。本实例试图解决此问题。图19所示为用于搜索确切定义的系统的实例。
服务器1900包括:一个服务器CPU1902;一个同现关系数据库1903;一个服务器存储器1904;一个服务器图片识别存储器1905;服务器词典数据1906;一个服务器数据通信接口1908;一个服务器搜索单元1909;以及一个用户注册数据库1910。
服务器数据通信接口1908执行通信功能,从而使得服务器1900能够通过数据网络(如互联网)与其他服务器进行通信。服务器CPU1902根据服务器存储器1904中存储的程序来起作用,并响应于通过服务器数据通信接口1908发送的信号,控制服务器中的相应部件。
同现关系数据库中包含表示同现关系的数据。如图20所示,同现关系数据库包括单词、单词的定义、同现单词以及每个单词的定义与同现单词组合使用的百分比。参考图20,其中一个单词是“character”,“character”的定义将会是“字符”和“人”。
同现关系数据库1903中存放着与多个单词相关的数据项,以及各个单词的定义以及各个定义与同现单词组合使用的概率。
如果识别出的单词与其他单词同时出现,就可以使用同现关系数据库1903去比较单词定义与各个同现单词组合使用的概率。然后,找到所识别单词的最确切定义。例如,如果“character”和单词“recognition”同时出现,在组合中使用定义“字符”的百分比是0.95,此外,在组合中使用定义“人”的百分比只有0.05。在这种情况下,将在组合中使用的百分比高的“字符”作为“character”的定义。通过数据通信接口接收的数据和服务器1900要处理的其他数据存储在服务器存储器1904中。服务器图片识别存储器1905中存储了一个软件程序,该软件程序中的OCR功能将由服务器CPU1902执行。
存储器104中存储的服务器词典数据1906包括多个字符,如单词、该单词的相关信息(如记载有该单词各种定义、用法和实例的各主页URL)以及关于该单词的图片或声音。
服务器搜索单元1909根据一个单词及同现单词,参考同现关系数据库1903,并选择出该单词的确切定义。
用户注册数据库1901中包含用户ID和密码,根据该用户ID和密码,用户可被认证为允许访问服务器1900的用户。
接下来,结合图21中的流程图描述该系统中移动蜂窝电话要执行的过程。
在步骤S2101中,像取景器一样,显示屏107显示照相机103输出的图象。当CPU102检测到快门按钮被按下的时候(步骤S2102),照相机103输出图片信息(步骤S2103)。CPU102执行图片识别操作(步骤S2104)。在步骤S2105中,对识别位置和识别单词进行采样,识别位置就是字符的位置,亦即照相机103生成的图片信息中的识别对象,而识别单词就是搜索单元109在步骤S2105中执行检索的搜索结果。
然后,经由输入单元101向CPU102发送一个指示访问服务器1900的访问信号。CPU102依次经由数据通信接口108将该访问信号发送给一个预定的服务器(步骤S2107)。
然后,接收到该访问信号的服务器1900发送一个输入请求信号,利用该输入请求信号请求输入用户ID及与该用户ID相关的密码。当信息处理装置100收到该请求信号时(步骤S2108),CPU102在显示屏107上显示输入屏幕图像,通过该图像输入用户ID和密码。通过输入屏幕图像输入用户ID和密码之后,将其发送到服务器1900(步骤S2109)。这里,用户输入的用户ID和密码用于用户身份认证。但是,本发明不限于此种认证方式,只要可以实现用户认证即可。例如,声波纹、指纹、虹膜都可用于认证。
CPU102检验从服务器接收到的信号指示认证成功或失败(步骤S2110)。如果该信号指示认证失败,在显示屏107上重新显示输入屏幕图像。如果该信号指示认证成功,则将照相机103生成的图像、识别位置及识别单词发送到服务器1900(步骤S2111)。
此后,当CPU102从服务器1900接收到识别单词的确切定义时,CPU102在显示屏107上显示该确切定义(步骤S2112和S2113)。
下面将参考图22的流程图描述本系统中服务器1900执行的过程。
当服务器1900接收到来自信息处理装置100的访问信号时(步骤S2201),服务器请求信息处理装置输入用户ID和密码(步骤S2201)。当接收到来自信息处理装置100的用户ID和密码时(步骤S2202),服务器CPU1902参考用户注册数据1910。如果接收到的用户ID和密码与用户注册数据1910中包含的一个用户ID和密码匹配,服务器CPU1902就通过服务器数据通信接口1908告知信息处理装置100该用户已经通过认证(步骤S2204)。然后,接收来自信息处理装置100的图像、识别位置和识别单词(步骤S2205)。
此后,服务器CPU1902识别接收图像中包含的字符。图23所示为接收图像的实例。在识别过程中,服务器CPU1902对图像中包含的所有单词进行采样,标识出识别位置。采样区域的边框剪裁的单词不被视为识别对象。
如图23中图像的实例所示,包括单词2301的带阴影的单词不被视为识别对象。那些未被采样区域的边框剪裁的其他单词会被识别,如单词2303“The”。服务器搜索单元1909从服务器词典数据1906中搜索与识别单词相符合或最接近的单词(步骤S2206)。
然后,计算识别对象单词的同现单词的数目n(步骤S2207),根据从信息处理装置接收到的识别位置和识别单词,标识出识别对象单词。在步骤S2208中,如果同现单词的数目大于或等于1,则判断同现关系数据库1903中是否包含该识别对象单词(步骤S2209)。如果包含该识别对象单词,则判断同现关系数据库1903的列2004中是否包含与同现单词相符合的单词(步骤S2210)。
如果同现关系数据库1903中包含与同现单词相符合的单词,则确定识别对象单词的最确切定义(步骤S2211)。
在确定过程中,计算识别对象单词的各个定义与同现关系数据库1903中包含的同现单词组合使用的概率。例如,假设识别对象单词为“character”,而同现单词是“string”和“recognition”。在这种情况下,如果“string”与“character”同时出现,则定义“字符”与“string”组合使用的百分比为0.90,如果“recognition”与“character”同时出现,则定义“字符”与“recognition”组合使用的百分比是0.95。这两个百分比之和为1.85。此外,定义“人”与“string”和“recognition”分别组合使用的概率之和为0.08。使该和最大的那个定义将被采纳为最确切的定义。在这种情况下,确切定义是通过累加百分比确定的。但本发明不限于该方法,也可以选择通过乘、除或减的组合来确定确切定义。最后,将确切定义发送给信息处理装置(步骤S2212)。
如果在步骤S2208中判断同现单词的数目为0,则执行步骤S2213。从服务器词典数据1906中检索一条典型定义,然后在步骤S2214中将其发送给该信息处理装置。
此外,如果在步骤S2209中判断识别对象单词未包含在同现关系数据库1903中,或者,如果在步骤S2210中判断与同现单词符合的单词没有包含在同现单词数据库1903中,则执行步骤S2213。将典型定义发送给该信息处理装置。
根据前面的过程,在步骤S2211中确定了确切定义。可以选择确定多个定义,如,计算出一个单词与同现单词组合使用的百分比之和的六个最大值。该数据被称为定义显示顺序数据。图25(1)所示为“character”的未排序的定义,而图25(2)所示为根据意思确切程度的排序定义。
这些定义以定义显示顺序数据的形式被发送到该信息处理装置。CPU102根据定义显示顺序数据将这些定义显示在显示屏107上。
然后,用户就可以获悉识别对象单词的定义,并且,用户还可以很容易地获知识别对象单词在特定的上下文中可能具有的定义。这一点对用户是很友好的。
此外,服务器1900选择的确切定义也可能是不正确的。即使在这种情况下,也会按顺序列出该确切定义和其他定义,如图25所示,这会极大地帮助用户根据上下文去判断一个单词的定义。
图24是该信息处理装置和服务器所执行的处理顺序的实例。如图中所示,CPU102进行字符识别(步骤S2401),并对表示识别对象单词的数据和表示识别对象单词位置的数据进行采样(步骤S2402)。然后,用户使用输入单元101来指示获取识别对象单词的详细信息。CPU102发送一个访问信号,利用该访问信号将信息处理装置连接到服务器(步骤S2403)。
响应于该访问信号,服务器向信息处理装置发送一个用户ID/密码请求信号,请求用户ID和密码(步骤S2404和S2405)。响应于该用户ID/密码请求信号,CPU102进行控制从而将用户通过输入屏幕图像或其他类似物输入的用户ID和密码经数据通信接口108发送给服务器(步骤S2406)。
然后,服务器检查接收的用户ID和密码,以判断该用户是否为授权的注册用户。如果判断结果显示该用户为授权的注册用户(有效的),则服务器1900发送表示认证成功的数据。如果用户被视为未授权用户(无效的),服务器发送表示认证失败的数据(步骤S2407到S2409)。这里,我们假设认证是有效的。
接收到认证成功消息的信息处理装置向服务器发送生成的图像、以及该图像中所包含的识别对象单词和该识别对象单词的位置(步骤S2410和S2411)。
如前所述,接收到该图像、识别对象单词和该识别对象单词的位置的服务器标识该图像中包含的识别对象单词(步骤S2413)。对识别对象单词的同现单词进行采样(步骤S2412至S2414)。然后,参考服务器中的同现关系数据库,从而将表示该识别对象单词确切定义的数据发送到信息处理装置(步骤S2415和S2416)。
信息处理装置在显示屏107上显示该确切定义(步骤S2417和S2418)。
然后,用户就可以获知与上下文匹配的某个单词的确切定义,该功能对用户是很友好的。此外,服务器的吞吐量和存储容量通常都大于信息处理装置,服务器的存储器中存储了同现关系数据库,所以需要通过使用该数据库确定最优翻译。这样,就减轻或减少了移动蜂窝电话的处理量负荷及其必须提供的存储容量。因此,在吞吐量和存储容量方面实现了系统均衡。但是,本发明不限于该实例,信息处理装置也可以具有同现关系数据库,并在不连接服务器的情况下搜索确切定义。
此外,如果使用前述的处理信息的服务器提供确切定义服务或其他服务,每个月都可以得到稳定的收入。从经济角度考虑,这是实际可行的。
此外,即使免费或低价向用户提供该服务,也可以跟广告代理订立合同,从而以广告费作为收入。在这种情况下,服务器可以在确切定义之后增加广告信息,并将该确切定义发送给信息处理装置,信息处理装置将确切定义和广告信息一起显示。与此同时,服务器也发送位置数据,以使广告信息和确切定义在显示时不会出现重叠现象。信息处理装置根据位置数据显示广告和确切定义。所以,用户看到的确切定义和广告信息不会重叠或共存。
需要指出的是,用于实现前述实例功能的软件不必预先存储到信息处理装置的存储器中。而是用户在购买信息处理装置之后,通过使用互联网或记录媒介在信息处理装置上安装软件。在这种情况下,不需要重新购买另一个信息处理装置。由于可以在已购买的信息处理装置中增添新功能,从而节省开支。
这里所说的“记录媒介”一词指的是实现该处理所采用的任何媒介。这样的媒介可以有多种多样的形式,包括但不仅限于非挥发性媒介、挥发性媒介和传输媒介。例如,非挥发性媒介包括光纤或磁盘;挥发性媒介包括动态存储器;传输媒介包括同轴电缆、铜线、光纤以及在这些物理链路中传输的电信号、电磁信号或光信号等。传输媒介的形式也可以是在无线频率和红外无线数据通信中产生的电信号或电磁信号、声波或光波。机器可读取得媒介一般包括软盘、移动盘、硬盘、磁盘、磁带及其它磁体媒介、CD-ROM、DVD及其它光媒介、RAM、PROM、EPROM、FLASH-EPROM及其他存储芯片或磁头,以及传输数据或指令的载波。
此外,本发明不限于以上实例,所披露的原理和创新特性包含很多种技术。此外,上述实例也被包括在内。

Claims (4)

1、一种包括信息处理装置和服务器的信息处理系统,
该信息处理装置包括:
图片接口,其将图片信息输入到该信息处理装置;
第一数据通信接口,用于与服务器进行通信;
第一CPU,其响应于用户的字符识别请求,识别通过该图片接口输入的该图片信息中所包含的单词,当用户请求与该被识别的单词相关的信息时,该第一CPU控制该第一数据通信接口,向该服务器发送包括该被识别的单词及该被识别的单词的一个同现单词的数据,以及显示由该第一数据通信接口接收的信息;
该服务器包括:
第二数据通信接口,用于与该信息处理装置进行通信;
存储器,其存储多个与单词和同现单词相关的信息;
第二CPU,其根据由该信息处理装置发送的数据,从该存储器中读取至少一项信息,并控制该第二数据通信接口将该信息发送到该信息处理装置并显示。
2、一种告知所识别单词的相应含义的方法,包括以下步骤:
在数据库中存储具有多条含义的单词以及与该单词具有同现关系的至少一个相关单词;
接收有关所识别单词的信息以及在含有所识别单词的文档中出现的同现单词;
当所述同现单词作为所述相关单词存储在所述数据库中时,根据所述同现单词从存储在所述数据库中的所识别单词的多条含义中选择一种含义;
将所选择的含义作为所识别单词的含义进行告知。
3、一种服务器,包括:
存储器,存储具有多条含义的单词以及与该单词具有同现关系的至少一个相关单词;
接收器,接收有关所识别单词的信息以及在含有所识别单词的文档中出现的同现单词;
选择器,当所述同现单词作为所述相关单词存储在所述存储器中时,根据所述同现单词从存储在所述存储器中的所识别单词的多条含义中选择一种含义;
发送器,将所选择的含义作为所识别单词的含义进行发送。
4、如权利要求3所述的服务器,其中所述信息处理装置是蜂窝电话。
CNA2008100922348A 2003-07-09 2004-07-09 信息处理系统、信息处理方法及服务器 Pending CN101267492A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003194007A JP4269811B2 (ja) 2003-07-09 2003-07-09 携帯電話
JP2003-194007 2003-07-09

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100635190A Division CN1578348A (zh) 2003-07-09 2004-07-09 信息处理装置、信息处理方法及软件产品

Publications (1)

Publication Number Publication Date
CN101267492A true CN101267492A (zh) 2008-09-17

Family

ID=33562495

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2004100635190A Pending CN1578348A (zh) 2003-07-09 2004-07-09 信息处理装置、信息处理方法及软件产品
CNA2008100922348A Pending CN101267492A (zh) 2003-07-09 2004-07-09 信息处理系统、信息处理方法及服务器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA2004100635190A Pending CN1578348A (zh) 2003-07-09 2004-07-09 信息处理装置、信息处理方法及软件产品

Country Status (4)

Country Link
US (1) US20050007444A1 (zh)
JP (1) JP4269811B2 (zh)
KR (2) KR100699372B1 (zh)
CN (2) CN1578348A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102196130A (zh) * 2010-03-16 2011-09-21 佳能株式会社 图像处理装置及图像处理方法
CN105260381A (zh) * 2015-09-08 2016-01-20 百度在线网络技术(北京)有限公司 基于图像识别的数据维护方法和装置
CN107360322A (zh) * 2017-06-30 2017-11-17 北京小米移动软件有限公司 信息提示方法及装置

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060095504A1 (en) * 2004-08-24 2006-05-04 Gelsey Jonathan I System and method for optical character information retrieval (OCR) via a thin-client user interface
JP4040619B2 (ja) * 2004-11-08 2008-01-30 キヤノン株式会社 画像出力装置およびその制御方法ならびに画像出力システム
US20060204098A1 (en) * 2005-03-07 2006-09-14 Gaast Tjietse V D Wireless telecommunications terminal comprising a digital camera for character recognition, and a network therefor
JP4669730B2 (ja) * 2005-04-18 2011-04-13 Necカシオモバイルコミュニケーションズ株式会社 携帯端末装置及びプログラム
KR100754656B1 (ko) * 2005-06-20 2007-09-03 삼성전자주식회사 이미지와 관련한 정보를 사용자에게 제공하는 방법 및시스템과 이를 위한 이동통신단말기
US20070124330A1 (en) * 2005-11-17 2007-05-31 Lydia Glass Methods of rendering information services and related devices
KR100716818B1 (ko) * 2005-12-29 2007-05-09 삼성전기주식회사 카메라 위치 감지 장치 및 이를 포함하는 휴대폰
JP2007188291A (ja) * 2006-01-13 2007-07-26 Casio Hitachi Mobile Communications Co Ltd 携帯通信端末、コンテンツ管理装置およびプログラム
US7787693B2 (en) * 2006-11-20 2010-08-31 Microsoft Corporation Text detection on mobile communications devices
US9015029B2 (en) * 2007-06-04 2015-04-21 Sony Corporation Camera dictionary based on object recognition
US20090177733A1 (en) * 2008-01-08 2009-07-09 Albert Talker Client application localization
JP5241345B2 (ja) 2008-07-01 2013-07-17 キヤノン株式会社 ジョブ処理装置及び当該ジョブ処理装置のジョブログの管理方法及びジョブ履歴管理システム
EP2189926B1 (en) * 2008-11-21 2012-09-19 beyo GmbH Method for providing camera-based services using a portable communication device of a user and portable communication device of a user
JPWO2012144124A1 (ja) * 2011-04-19 2014-07-28 日本電気株式会社 撮影画像処理システム、撮影画像処理方法、携帯端末及び情報処理装置
US9082035B2 (en) * 2011-08-29 2015-07-14 Qualcomm Incorporated Camera OCR with context information
WO2014064897A1 (ja) * 2012-10-25 2014-05-01 日本電気株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN107430560B (zh) * 2015-03-31 2021-07-20 索尼公司 信息处理设备、信息处理方法和计算机程序

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051086B2 (en) * 1995-07-27 2006-05-23 Digimarc Corporation Method of linking on-line data to printed documents
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
EP0810534B1 (en) * 1996-05-13 2003-03-19 Oki Electric Industry Co., Ltd. Document display system and electronic dictionary
GB9809679D0 (en) * 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
JP3506081B2 (ja) * 1999-12-27 2004-03-15 日本電気株式会社 情報提供方法
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
US20010056342A1 (en) * 2000-02-24 2001-12-27 Piehn Thomas Barry Voice enabled digital camera and language translator
US20010053252A1 (en) * 2000-06-13 2001-12-20 Stuart Creque Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store
JP2002024762A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 文書認識装置及びその方法
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
KR20020057202A (ko) * 2000-12-30 2002-07-11 송문섭 차세대 이동통신 단말기의 전자수첩 및 전자사전 장치
WO2002065303A1 (fr) * 2001-02-13 2002-08-22 Fujitsu Limited Terminal de reseau a mode d"economie d"energie
US20020165801A1 (en) * 2001-05-02 2002-11-07 Stern Edith H. System to interpret item identifiers
JP4240859B2 (ja) * 2001-09-05 2009-03-18 株式会社日立製作所 携帯端末装置及び通信システム
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US20030120478A1 (en) * 2001-12-21 2003-06-26 Robert Palmquist Network-based translation system
KR20020068308A (ko) * 2002-07-18 2002-08-27 나중열 휴대폰스캐너전자사전

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102196130A (zh) * 2010-03-16 2011-09-21 佳能株式会社 图像处理装置及图像处理方法
CN102196130B (zh) * 2010-03-16 2014-02-19 佳能株式会社 图像处理装置及图像处理方法
CN105260381A (zh) * 2015-09-08 2016-01-20 百度在线网络技术(北京)有限公司 基于图像识别的数据维护方法和装置
CN107360322A (zh) * 2017-06-30 2017-11-17 北京小米移动软件有限公司 信息提示方法及装置
CN107360322B (zh) * 2017-06-30 2020-03-03 北京小米移动软件有限公司 信息提示方法及装置

Also Published As

Publication number Publication date
KR100699372B1 (ko) 2007-03-27
KR20060067942A (ko) 2006-06-20
KR20050007160A (ko) 2005-01-17
CN1578348A (zh) 2005-02-09
KR100698986B1 (ko) 2007-03-26
JP4269811B2 (ja) 2009-05-27
US20050007444A1 (en) 2005-01-13
JP2005031827A (ja) 2005-02-03

Similar Documents

Publication Publication Date Title
CN101267492A (zh) 信息处理系统、信息处理方法及服务器
KR101191816B1 (ko) 확대된 검색 특성을 갖는 사용자 인터페이스
JP4445513B2 (ja) 文書管理方法、文書管理システム、コンピュータプログラム、および、画像形成装置
US8335493B2 (en) System and method for service selection in a portable device
EP3182684A1 (en) Intelligent service interaction platform apparatus, system and realizing method thereof
CN101501610A (zh) 非标准的基于位置的文本输入
JP3969595B2 (ja) メール情報提供サーバ、メール情報提供システム、メール情報提供方法、メール情報提供プログラム
CN101308443A (zh) 用于在移动设备上组织应用程序的图标的系统和方法
US20120096354A1 (en) Mobile terminal and control method thereof
CN102640104A (zh) 提供便携式装置的用户接口的方法和设备
JP4438656B2 (ja) 画像処理装置、画像処理システムおよびプログラム
EP1784745A2 (en) Using emoticons, such as for wireless devices
CN103049185A (zh) 促进与系统级搜索用户接口的交互
US20110131529A1 (en) Information Processing Apparatus, Information Processing Method, Computer Program, and Information Processing Server
CN103250152A (zh) 响应于共享广度而控制的图像显示设备
CN101601036A (zh) Web页面上的导航点
CN104063440A (zh) 基于终端拨号盘的数据检索方法及装置
US20080123973A1 (en) Executing functions using image code
US8612896B2 (en) Mobile terminal, data control program, and data control method
KR20060096943A (ko) 정보 처리 장치 및 방법, 및 프로그램
US20050144152A1 (en) Symbol-based query mechanism
JP2008160852A (ja) 情報処理装置、情報処理方法及びソフトウェア
KR100853489B1 (ko) 대기화면에서의 문자입력을 통해 기능전환이 가능한이동통신 단말기와 그 이동통신 단말기를 이용한 전화번호검색 시스템 및 전화번호 검색방법
WO2009104193A1 (en) Provisioning of media objects associated with printed documents
JPH11259489A (ja) 電子スクラップシステム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080917