CN100505771C - 具有字符识别功能的便携式通信设备 - Google Patents

具有字符识别功能的便携式通信设备 Download PDF

Info

Publication number
CN100505771C
CN100505771C CNB200310101415XA CN200310101415A CN100505771C CN 100505771 C CN100505771 C CN 100505771C CN B200310101415X A CNB200310101415X A CN B200310101415XA CN 200310101415 A CN200310101415 A CN 200310101415A CN 100505771 C CN100505771 C CN 100505771C
Authority
CN
China
Prior art keywords
character
display
image
reference frame
portable communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB200310101415XA
Other languages
English (en)
Other versions
CN1498016A (zh
Inventor
黑沢繁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Innovations Co ltd Hong Kong
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1498016A publication Critical patent/CN1498016A/zh
Application granted granted Critical
Publication of CN100505771C publication Critical patent/CN100505771C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • H04M1/2755Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by optical scanning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Telephone Function (AREA)
  • Character Discrimination (AREA)

Abstract

一种便携式通信设备,包括:图像捕获部分,根据对快门键的操作,捕获图像;以及字符识别部分,从所捕获的图像中识别字符。在显示器上设置字符大小调整指示器。字符大小调整指示器的大小如下:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率。

Description

具有字符识别功能的便携式通信设备
技术领域
本发明涉及一种如便携式电话装置或个人信息终端等便携式通信设备,更具体地,涉及一种装备有图像捕获装置的便携式通信设备。
背景技术
通常,市场上出售的便携式电话装置包括多种信息输入装置,例如,包括十键键盘的操作键以及如数字照相机等图像捕获设备。已经提出了多种装备有照相机的便携式电话(例如,日本专利申请未审公开No.2002-232544)。
便携式电话装置具有并入其中的存储器,设计用于存储电话号码、邮件地址合其他字符数据。通常,这些字符是通过诸如十键键盘等输入装置逐一手动输入的。因此,难以在较短的时间内、没有任何操作错误地输入字符数据。
另一方面,正如日本专利申请未审公开No.2002-133367和2002-74266中所公开的那样,光字符设备装置或光字符读出器是公知的。但是,这些传统的字符识别装置并非基于小型便携式设备的,因而,不能直接应用于便携式电话装置。
发明内容
本发明的目的是提供一种能够无差错地进行简单数据输入的便携式通信设备。
按照本发明,一种便携式通信设备,包括:图像捕获部分,根据对快门键的操作,捕获图像;字符识别部分,从所捕获的图像识别字符;显示器,至少用于显示所捕获的图像;以及字符大小调整指示器,设置在所述显示器上,其中,所述字符大小调整指示器包括参考框,所述参考框具有如下大小:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率。可以将识别出的字符显示在显示器上,如果需要,可以将其存储在存储器中。最好确定识别出的字符的种类,如电子邮件地址、URL或电话号码等。如果是电子邮件地址,则最好启动邮件程序。如果是URL,则自动启动浏览器程序。如果是电话号码,可以对该电话号码进行呼叫。
以这种方式,可以通过图像捕获部分输入必需的数据,使用户能够在较短的时间内、无任何操作错误地输入数据。
作为本发明的实施例,当将所述便携式通信设备设置为字符识别模式时,可以将所述字符大小调整指示器显示在所述显示器上。代替地,当将所述便携式通信设备设置为字符识别模式时,可以将所述字符大小调整指示器固定在所述显示器上。例如,将所述字符大小调整指示器印制在所述显示器上。所述参考框的形状可以类似于相对于所述显示器水平朝向的矩形。
对于所述字符识别部分的识别,存在最优的字符大小。此最优的大小可以依赖于所述显示器的大小和分辨率、图像处理器的分辨率以及字符识别部分的性能。因而,所述字符大小调整指示器具有参考框,所述参考框具有如下大小:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率。为了使要识别的显示字符串适合于所述参考框,用户移动靠近或远离要捕获的主体。当所显示的字符适当地位于所述参考框中时,用户点击所述快门键,以捕获包含所述字符的图像。
按照本发明,一种便携式通信设备,包括:图像捕获部分,根据对快门键的操作,捕获图像;字符识别部分,从所捕获的图像中识别字符;定时器,用于将所述图像捕获部分的图像捕获操作在完成对所述快门键的操作之后延迟预定的时间周期,以便提高字符识别成功率。由于便携式电话设备通常是小型而轻便的,对快门键的点击使其机身易于晃动,从而使所捕获的图像变得模糊,导致了字符识别成功率的降低。为了防止照相机在点击时晃动,在点击了快门键之后,经过预定的时间周期,才激发所述照相机部分的实际图像捕获操作。
按照本发明,一种便携式通信设备,包括:图像捕获部分,根据对快门键的操作,捕获图像;字符识别部分,从所捕获的图像中识别字符;程序存储器,存储包括邮件程序和浏览器程序的多个程序;以及处理器,至少用于执行其上的一个程序,其中,当所识别出的字符串表示电子邮件地址时,所述处理器启动邮件程序,当所识别的字符串表示URL(统一资源定位)时,所述处理器启动浏览器程序,以及/或者当所识别的字符串表示电话号码时,所述处理器开始对所述电话号码进行呼叫。
所述便携式通信设备还可以包括:存储器,存储多类识别判据,每类识别判据对应于要识别的不同类型字符串,其中,所述字符识别部分使用所述多类识别判据之一,对来自所捕获的图像的字符进行识别。
按照本发明的另一方面,一种用在具有捕获图像的图像捕获功能和显示器的便携式通信设备中的数据输入方法,包括:准备设置在所述显示器上的字符大小调整指示器,其中所述字符大小调整指示器包括参考框,所述参考框具有如下大小:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率;在显示在所述显示器上的至少一个字符适合于所述参考框时,根据快门键的操作,捕获图像;以及对来自所捕获的图像的字符进行识别,输入所述字符作为输入数据。
按照本发明的另一方面,一种在具有图像捕获装置和显示器的便携式通信设备中进行字符识别的方法,包括:a)在所述显示器上设置字符大小调整指示器,其中,所述字符大小调整指示器包括参考框,所述参考框的大小能够提供足够高的字符识别成功率;b)在显示在所述显示器上的至少一个字符适合于所述参考框时,根据快门键的操作,捕获图像;c)从所捕获的图像中,对处于所述参考框中的至少一个字符进行识别;以及d)在所述显示器上预定的显示区域中显示识别出的字符。
所述方法优选地包括以下步骤:e)通过顺序选择显示在所述显示器上的字符串的部分,重复所述步骤b)~d),每个部分至少包括一个适合于所述参考框的字符,其中,通过逐次地组合每个至少包括一个识别出的字符的部分,在所述显示器上显示所述识别出的字符。
所述步骤c)可以包括:c.1)存储多类识别判据,每类识别判据对应于要识别的不同类别字符串;c.2)确定要识别的字符串的类型;以及c.3)根据与要识别的字符串的所述类型相对应的识别判据,对处于所述参考框中的至少一个字符进行识别。
附图说明
图1A是按照本发明处于开盖状态的便携式电话装置的透视图;
图1B是按照本发明处于关盖状态的便携式电话装置的透视图;
图1C是按照本发明处于开盖状态的便携式电话装置的后视平面图;
图2是按照本发明第一实施例示出了便携式电话装置的内部电路的方框图;
图3是按照第一实施例示出了便携式电话装置的图像捕获操作的程序的流程图;
图4是示出了显示在屏幕上的字符大小调整指示器的示例的示意图;
图5A~5C是示出了字符大小调整操作的示意图;
图5D是示出了如何拍摄长字符串的示意图;
图6A和6B是按照第一实施例示出了便携式电话装置的操作的流程图;
图7是按照本发明第二实施例示出了便携式电话装置的图像捕获操作的程序的流程图;
图8是按照本发明第三实施例示出了便携式电话装置的图像捕获操作的程序的流程图;以及
图9是按照本发明第四实施例示出了便携式电话装置的字符识别模式设置操作的流程图。
具体实施方式
如图1A~1C所示,装备有照相机的便携式电话装置10主要由三部分组成:第一外壳11、第二外壳12和用于连接第一外壳11和第二外壳12使其自由打开和闭合的铰链部分13。
第一外壳11具有显示器15、天线16、照相机部分17以及在闭合便携式电话装置时将隐藏在内部、设置在其主表面111上的电话接收器(扬声器)18。显示器15可以是液晶显示器,在上面显示如正在呼叫的电话号码、电子邮件消息或所捕获的图像等必需的信息。照相机部分17装备有如CCD(电荷耦合装置)或CMOS图像传感器等小型而轻薄的图像捕获装置,其将并入到第一外壳11中。照相机部分17的镜头部分是暴露的,并位于其偏上位置的主表面111上。
第二外壳12具有在闭合便携式电话装置时将隐藏在内部、设置在其主表面121上的操作键和电话发射器(麦克风)19。操作键14用于输入诸如通信操作等数据或指令。在此实施例中,操作键14中预定的按键被用作照相机的快门。
便携式电话装置10的主电路容纳在第二外壳12中。包括照相机部分17和显示器15的另外的电路容纳在第一外壳11中,并且通过配线基片与主电路进行电连接。将参照图2对便携式电话装置10的电路结构进行描述。
1、第一实施例
电路结构
参照图2,便携式电话装置10具有由中央处理单元(CPU)203所控制的无线电收发器201、基带处理器202、编码器/解码器(CODEC)204组成的通信系统。CODEC 204与扬声器18和麦克风19相连。
CPU 203执行从程序存储器205中读取出的必要程序,以利用存储器206进行通信和其他数据处理操作。程序存储器205存储操作系统和包括了字符识别程序、邮件程序和浏览器程序的多个应用程序。存储器206存储缺省记录或由用户通过下述过程对操作键14或照相机进行操作而记录的电话号码、邮件地址和网址。
照相机部分17根据用户的指令捕获图像。在CPU203的控制下,将所捕获的图像存储在图像存储器207中,显示在显示器15上,以及由图像处理器208进行处理。由运行在CPU 203上的字符识别程序对所捕获的图像进行字符识别,对此将在下面进行描述。提供给电路的电源由电源控制器209进行控制,电源控制器209由诸如电池等电源供电。
字符大小调整指示器
在本实施例中,可以将便携式电话装置10设置为选中的一种操作模式:电话模式、照相机模式、字符识别模式、电子邮件发送模式以及网络浏览模式。
参照图3,CPU 203对显示器15进行控制,从而在显示器15上初始显示模式设置菜单(步骤S100)。当选择字符识别模式时(步骤S110),CPU 203创建字符大小调整指示器31,如图4所示,将其显示在显示器15上(步骤S120)。通过用户移动靠近或远离所要捕获的主体,可以改变显示在屏幕上的显示字符大小。在调整了字符大小使其适合于字符大小调整指示器(步骤S130)之后,用户点击快门键,捕获包含字符的图像(步骤S140)。
如图4所示,字符大小调整指示器31出现在显示器15近似中心的位置上,类似于水平朝向的矩形框。字符大小调整指示器31可以位于显示器15偏上或偏下的中心位置。字符大小调整指示器31是由四个角标记31a~31d、上中心标记31e、下中心标记31f和中心标记31g组成的参考框。确定字符大小调整指示器31的大小,使得CPU203上的字符识别处理能够提供最高的识别成功率。在识别字符显示区域15a中显示识别出的字符。
如图4所示,字符大小调整指示器31最好沿着显示器15上的长度(X轴)方向,因为用户难以读取沿显示器15上的Y轴方向排列的字符。字符大小调整指示器31的形状最好是矩形,但并不局限于此。可以采用任何形状,只要能够在其中排列所捕获的字符,例如,水平朝向的菱形、正方形或水平朝向的椭圆形。
字符大小调整指示器31最好只在选择了字符识别模式时(步骤S110)出现在显示器15上。代替地,可以在显示器15上固定地形成字符大小调整指示器31。可以通过在显示器15上进行印制、雕刻、模塑或粘贴印记,形成字符大小调整指示器31。这种固定的字符大小调整指示器31不需要程序在选择字符识别模式时指示CPU 203将字符大小调整指示器31显示在显示器15上,减轻了CPU 203的负担。
如图5A所示,用户通过移动便携式电话装置10靠近或远离要捕获的主体,对屏幕上显示字符的大小进行调整,使得屏幕上的字符适合于字符大小调整指示器31。当如图5B所示,屏幕上的字符稍微离开字符大小调整指示器31时,用户,即便携式电话装置10的照相机17移动远离主体。当如图5C所示,屏幕上的字符相对于字符大小调整指示器31过小时,用户移动靠近主体。
以这种方式,可以调整屏幕上字符的大小,使其适合于字符大小调整指示器31。当屏幕上的字符适合于字符大小调整指示器31时,能够以最高的识别成功率读出这些字符。限定在字符大小调整指示器31中的识别部分能够实现较高的识别成功率并降低读取出字符所需的时间。
如图5D所示,长字符串可以通过顺序地拍摄部分长字符串进行捕获,对此将在后面进行描述。
字符识别
如上所述,在调整要拍摄的字符大小使其适合于上述字符大小调整指示器31之后,用户点击快门键,拍摄包含字符的图像。
参照图6A和图6B,当照相机部分17捕获了包含字符的图像时(步骤S140),CPU 203指示图像处理器208处理图像数据(步骤S150),并且根据需要,将处理后的图像数据存储到图像存储器207中(步骤S160)。
随后,CPU 203剪切出由字符大小调整指示器31所限定的图像(步骤S170),并调用字符识别程序识别位于剪切后的图像中的字符(步骤S180)。将识别出的字符存储到图像存储器207或其他存储器中(步骤S190),并显示在显示器15上的识别字符显示区域15a中(步骤S200)。
在将识别出的字符显示在识别字符显示区域15a中时,CPU 203指示显示器15提示用户确定是否重复字符识别拍摄(步骤S210)。当字符串的长度比字符大小调整指示器31的长度长时(步骤S210中的“是”),需要重复步骤S140~S200,如图5D所示,顺序拍摄部分字符串几次。
例如,假设字符串是“http://www.biglobe.ne.jp”,而字符大小调整指示器31可以容纳六个字符,第一次拍摄捕获前六个字符“http:/”,并将识别出的字符“http:/”显示在识别字符显示区域15a中。第二次拍摄捕获接下去的六个字符“/www.b”,并在识别字符显示区域15a上的“http:/”之后显示识别出的字符“/www.b”。类似地,第三次拍摄捕获接下去的六个字符“iglobe”,并在识别字符显示区域15a上的“/www.b”之后显示识别出的字符“iglobe”。第四次拍摄捕获最后的六个字符“.ne.jp”,并在识别字符显示区域15a上的“iglobe”之后显示识别出的字符“.ne.jp”。以这种方式,可以通过顺序拍摄和识别部分字符串几次,捕获和识别比字符大小调整指示器31更长的字符串。
当一次或几次已经捕获了字符串时(步骤S210中的“否”),CPU 203指示显示器15提示用户确定是否对显示在识别字符显示区域15a上的识别字符进行编辑(步骤S220)。如果显示在识别字符显示区域15a上的识别字符包含错误或错误识别了的字符(步骤S220中的“是”),则用户操作键14,改正或修订错误,或者根据需要,追加字符(步骤S230)。
当不需要进行编辑时(步骤S220中的“否”),CPU 203确定所确定的字符串是否表示电话号码(步骤S240)。当其确定字符串表示电话号码时(步骤S240中的“是”),CPU 203指示显示器15提示用户确定是否记录该电话号码(步骤S250)。当选择了记录时(步骤S250中的“是”),将电话号码记录到存储器206中(步骤S260)。当未选择记录时(步骤S250中的“否”)或者当电话号码已经记录到存储器206中时,CPU203指示显示器15提示用户确定是否对此电话号码进行呼叫(步骤S270)。当选择了呼叫时(步骤S270中的“是”),CPU 203控制基带处理器202和无线电收发器201对此电话号码进行呼叫(步骤S280)。
当所确定的字符串不代表电话号码时(步骤S240中的“否”)或者当未选择呼叫时(步骤S270中的“否”),CPU203确定所确定的字符串是否表示邮件地址(步骤S290)。当其确定字符串表示邮件地址时(步骤S290中的“是”),CPU 203指示显示器15提示用户确定是否记录该邮件地址(步骤S300)。当选择了记录时(步骤S300中的“是”),将邮件地址记录到存储器206中(步骤S310)。当未选择记录时(步骤S300中的“否”)或者当邮件地址已经记录到存储器206中时,CPU 203指示显示器15提示用户确定是否向该邮件地址发送邮件(步骤S320)。当选择了发送邮件时(步骤S320中的“是”),CPU 203启动邮件程序,从而,用户创建邮件,然后向该邮件地址发送(步骤S330)。
当所确定的字符串不代表邮件地址时(步骤S290中的“否”)或者当未选择发送邮件时(步骤S320中的“否”),CPU 203确定所确定的字符串是否表示URL(统一资源定位)(步骤S340)。当其确定字符串表示URL时(步骤S340中的“是”),CPU 203指示显示器15提示用户确定是否记录该URL(步骤S350)。当选择了记录时(步骤S350中的“是”),将URL记录到存储器206中(步骤S360)。当未选择记录时(步骤S350中的“否”)或者当URL已经记录到存储器206中时,CPU 203指示显示器15提示用户确定是否对该URL进行访问(步骤S370)。当选择了访问URL时(步骤S370中的“是”),CPU 203启动浏览器程序,从而,用户自动地浏览该网站,而无需其他操作(步骤S380)。
当所确定的字符串不代表URL时(步骤S340中的“否”)或者当未选择访问URL时(步骤S370中的“否”),CPU 203将所确定的字符串确定为如通信地址、姓名或地点名称等除了上述地址之外的数据。从而,CPU203指示显示器15提示用户确定是否记录所确定的字符串(步骤S390)。当选择了记录时(步骤S390中的“是”),将该数据记录到存储器206中(步骤S400)。当未选择记录时(步骤S390中的“否”),CPU 203删除所确定的字符串,并终止字符识别处理(步骤S410)。
2、第二实施例
按照上述第一实施例,对整个所捕获的图像进行图像处理,并只剪切出位于字符大小调整指示器31中的图像部分用于字符识别。
相反,按照本发明的第二实施例,图像处理器208只处理位于字符大小调整指示器31中的图像部分,之后,将处理后的图像用于字符识别。因此,可以减少图像处理和字符识别所需的时间。
参照图7,当照相机部分17已经捕获了包含字符的图像时(步骤S500),CPU 203指示图像处理器208处理位于字符大小调整指示器31中的图像部分(步骤S510),并根据需要,将处理后的图像数据存储到图像存储器207中(步骤S520)。
随后,CPU 203调用字符识别程序对处理后的图像部分中的字符进行识别(步骤S530)。将识别出的字符存储到图像处理器207或其他处理器中(步骤S540),并显示在显示器15上的识别字符显示区域15a中(步骤S550)。之后,如前所述,执行步骤S210~S410。
3、第三实施例
按照本发明的第三实施例,包含在CPU 203中的定时器211用以将照相机部分17的实际捕获操作在用户点击快门键时延迟预定的时间周期。由于便携式电话装置10通常是小型而轻便的,对快门键的点击使其机身易于晃动,从而使所捕获的图像变得模糊,导致了字符识别成功率的降低。为了防止照相机在点击时晃动,在点击了快门键之后,经过预定的时间周期,才激发所述照相机部分17的实际图像捕获操作。所述预定的时间周期可以根据由于点击快门键而引起的照相机运动平静下来的时间周期确定。在本实施例中,将定时器211设置为N秒,例如,大约0.5秒。可以事先缺省设置该延迟时间周期,或者可以由用户通过显示器15操作键14,将该延迟时间周期确定为想要的周期。
参照图8,步骤S100~S130与图3中所描述的那些相类似。在调整字符大小使其适合于字符大小调整指示器(步骤S130)之后,用户按下快门键以捕获包含字符的图像(步骤S600),然后将其手指从快门键上移开(步骤S610)。
当CPU 203检测到手指移开快门键、从而快门键返回到正常位置时,CPU 203启动定时器211(步骤S620)。在过去N秒时,产生超时(步骤S630),从而CPU 203启动照相机部分17捕获图像(步骤S640)。以这种方式,可以有效地防止照相机晃动对图像质量的影响,得到清晰的字符图像,从而得到较高的识别成功率。
4、第四实施例
按照本发明的第四实施例,根据字符串所表示的地址种类,改变字符识别的判据。运行在CPU 203上的字符识别程序具有选择专用于电话号码、邮件地址和URL的识别模式和自动设置模式之一的选项。当选择了专用于电话号码的识别模式时,CPU 203使用专用于电话号码的判据从所捕获的图像中只识别电话号码。从而,可以使识别成功率和识别速度更高。利用其他识别模式也是如此。
如图9所示,在图6A的字符识别步骤S180和图7的步骤S530中,CPU203指示显示器15提示用户选择一种识别模式(步骤S700)。
电话号码识别
当选择了专用于电话号码的识别模式时(步骤S710),CPU 203读取电话号码判据,并使用该判据识别所捕获的字符串,作为电话号码(步骤S720)。在电话号码判据的情况下,当在所捕获的图像中发现数字串或如连字符或括号等分隔符时,CPU 203从所捕获的图像中只检索数字0~9,而忽略其他字符。在大多数情况下,电话号码包括连字符或括号,用在地区代码和区号之间以及用在区号和本地号码之间进行区分。
在每个预定长度顺序捕获字符串的情况下,如果第二或随后所捕获的字符串的第一个字符是右括号“)”,只有在第一所捕获的字符串中包括左括号“(”时,才不将其忽略。假设第一所捕获的字符串是“090(1234”,而第二所捕获的字符串是“)5678”,第二所捕获的字符串的第一字符“)”并不是数字,但却是有效字符,因为第一所捕获的字符串包括“(”。结果,CPU 203将“090(1234”与“)5678”进行组合,识别为字符串“090(1234)5678”,作为电话号码。
邮件地址识别
当选择了专用于邮件地址的识别模式时(步骤S740),CPU 203读取邮件地址判据,并使用该判据识别所捕获的字符串,作为邮件地址(步骤S750)。在邮件地址判据的情况下,当在所捕获的图像中发现由冒号“:”跟随的字符串“i1”或者符号“@”时,CPU 203从所捕获的图像中只检索以下字符,而忽略其他字符:1)数字0~9;2)小写字母字符a~z;3)大写字母字符A~Z;4)连字符“-”;5)at符号“@”;6)下划线“_”;7)冒号“:”;以及8)点“.”。
在大多数情况下,电子邮件地址写成以下形式:“e-mail:abc@def.ghij.ne.jp”。由于第一字符串“e-mail:”并不是电子邮件地址的一部分,CPU 203检索由冒号“:”跟随的字符串“i1”并从“e-mail:abc@def.ghij.ne.jp”中忽略“e-mail:”。当发现“@”时,CPU 203将没有“e-mail:”的字符串识别为电子邮件地址。
URL识别
当选择了专用于URL的识别模式时(步骤S760),CPU 203读取URL判据,并使用该判据识别所捕获的字符串,作为URL(步骤S770)。在URL判据的情况下,当在所捕获的字符中的前七个或更少的字符匹配以下字符串之一时,将所捕获的字符串识别为URL:a)“https://”;b)“http://”;c)“s://”;d)“://”;以及e)“www.”。
URL符号需要这些字符串,因而,当发现这些字符串时,CPU 203可以确定所捕获的字符串是URL。在这种情况下,CPU 203从所捕获的图像中只检索以下字符,而忽略其他字符:1)数字0~9;2)小写字母字符a~z;3)大写字母字符A~Z;4)连字符“-”;5)“%”;6)“&”;7)“=”;8)“~”;9)“?”;10)“/”;11)冒号“:”;12)点“.”;以及13)下划线“_”。
当CPU 203确定所捕获的字符串是URL时,删除上述字符串a)到e)之前的所有字符。以这种方式,CPU 203对所捕获的字符串进行识别,作为URL。
自动识别
当选择了自动识别模式时(步骤S780),CPU 203将所捕获的字符串识别为电话号码、邮件地址、URL或者其他数据,而不使用任何判据(步骤S730)。由于未使用任何判据,与使用了判据的情况相比,识别成功率下降,但在不能确定所捕获的字符串是电话号码、邮件地址和URL中的哪一个的情况下,自动识别模式仍然是有效的。
可以通过运行在CPU 203上的软件程序实现上述功能。这种软件可以存储在并入在便携式电话装置10中的程序存储器205中,或者存储在可移动记录介质中。程序存储器205可以是如RAM(随机存取存储器)或ROM(只读存储器)、EPROM(可擦可编程只读存储器)、EEPROM(电可擦可编程只读存储器)、Smart memoryTM、闪速存储器等存储芯片,或者是如Compact flashTM等可写存储卡。外部记录介质可以用作程序存储器205或可移动记录介质,例如,CD-ROM、PD、MO、DVD-ROM、FD或HDD等。

Claims (13)

1、一种便携式通信设备,包括:
图像捕获部分(17),根据对快门键的操作,捕获图像;
字符识别部分(203),从所捕获的图像中识别字符;
显示器(15),至少用于显示所捕获的图像;
字符大小调整指示器(31),设置在所述显示器上,其中,所述字符大小调整指示器包括参考框,所述参考框具有如下大小:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率;以及
定时器(211),用于将所述图像捕获部分的图像捕获操作在完成对所述快门键的操作之后延迟预定的时间周期;
其特征在于通过所述便携式通信设备的输入装置设置所述预定的时间周期。
2、按照权利要求1所述的便携式通信设备,其特征在于当将所述便携式通信设备设置为字符识别模式时,所述字符大小调整指示器出现在所述显示器上。
3、按照权利要求1所述的便携式通信设备,其特征在于当将所述便携式通信设备设置为字符识别模式时,将所述字符大小调整指示器事先固定在所述显示器上。
4、按照权利要求1所述的便携式通信设备,其特征在于所述参考框的形状类似于相对于所述显示器水平朝向的矩形。
5、按照权利要求1所述的便携式通信设备,其特征在于还包括:
程序存储器(205),存储包括邮件程序和浏览器程序的多个程序;以及
处理器(203),至少用于执行其上的一个程序,
其中,
当所识别出的字符串表示电子邮件地址时,所述处理器启动邮件程序,
当所识别的字符串表示统一资源定位时,所述处理器启动浏览器程序,以及
当所识别的字符串表示电话号码时,所述处理器开始对所述电话号码进行呼叫。
6、按照权利要求1或5所述的便携式通信设备,其特征在于还包括:
存储器(205),存储多类识别判据,每类识别判据对应于要识别的不同类型字符串,
其中,所述字符识别部分使用所述多类识别判据之一,对来自所捕获的图像的字符进行识别。
7、一种用在具有捕获图像的图像捕获功能和显示器的便携式通信设备中的数据输入方法,该方法包括:
准备设置在所述显示器上的字符大小调整指示器,其中所述字符大小调整指示器包括参考框,所述参考框具有如下大小:在所捕获的图像中所包含的至少一个字符适合于所述参考框时,能够提供足够高的字符识别成功率;
在显示在所述显示器上的至少一个字符适合于所述参考框时,根据快门键的操作,捕获图像;
对来自所捕获的图像的字符进行识别,输入所述字符作为输入数据。
8、一种在具有图像捕获装置和显示器的便携式通信设备中进行字符识别的方法,该方法包括:
a)在所述显示器上设置字符大小调整指示器,其中,所述字符大小调整指示器包括参考框,所述参考框的大小能够提供足够高的字符识别成功率;
b)在显示在所述显示器上的至少一个字符适合于所述参考框时,根据快门键的操作,捕获图像;
c)将图像捕获操作在完成对所述快门键的操作之后延迟预定的时间周期,其中通过所述便携式通信设备的输入装置设置所述预定的时间周期;
d)从所捕获的图像中,对处于所述参考框中的至少一个字符进行识别;以及
e)在所述显示器上预定的显示区域中显示识别出的字符。
9、按照权利要求8所述的方法,其特征在于所述步骤d)包括:
d.1)对所捕获的图像进行图像处理,以产生处理后的图像;
d.2)剪切出所述处理后的图像位于所述参考框中的部分;以及
d.3)对来自所述处理后的图像的所述部分中的至少一个字符进行识别。
10、按照权利要求8所述的方法,其特征在于所述步骤d)包括:
d.1)对所捕获的图像位于所述参考框中的部分进行图像处理,以产生处理后的图像;以及
d.2)对来自所述处理后的图像的至少一个字符进行识别。
11、按照权利要求8所述的方法,其特征在于还包括:
f)通过顺序选择显示在所述显示器上的字符串的部分,重复所述步骤b)~e),每个所述部分至少包括一个适合于所述参考框的字符,其中,通过逐次地组合每个至少包括一个识别出的字符的部分,在所述显示器上显示所述识别出的字符。
12、按照权利要求8所述的方法,其特征在于所述步骤d)包括:
d.1)存储多类识别判据,每类识别判据对应于要识别的不同类别字符串;
d.2)确定要识别的字符串的类型;以及
d.3)根据与要识别的字符串的所述类型相对应的识别判据,对处于所述参考框中的至少一个字符进行识别。
13、按照权利要求12所述的方法,其特征在于还包括:
g)当识别出的字符串是电子邮件地址类型的时,所述处理器启动邮件程序,
h)当识别出的字符串是统一资源定位类型的时,所述处理器启动浏览器程序,以及
i)当识别出的字符串是电话号码类型的时,所述处理器对识别出的字符串所表示的电话号码进行呼叫。
CNB200310101415XA 2002-10-17 2003-10-17 具有字符识别功能的便携式通信设备 Expired - Fee Related CN100505771C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002302798A JP3990253B2 (ja) 2002-10-17 2002-10-17 携帯電話装置
JP2002302798 2002-10-17

Publications (2)

Publication Number Publication Date
CN1498016A CN1498016A (zh) 2004-05-19
CN100505771C true CN100505771C (zh) 2009-06-24

Family

ID=32040831

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200310101415XA Expired - Fee Related CN100505771C (zh) 2002-10-17 2003-10-17 具有字符识别功能的便携式通信设备

Country Status (4)

Country Link
US (1) US20040141644A1 (zh)
EP (1) EP1411460A3 (zh)
JP (1) JP3990253B2 (zh)
CN (1) CN100505771C (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558595B2 (en) * 2004-06-25 2009-07-07 Sony Ericsson Mobile Communications Ab Mobile terminals, methods, and program products that generate communication information based on characters recognized in image data
US7433711B2 (en) * 2004-12-27 2008-10-07 Nokia Corporation Mobile communications terminal and method therefor
JP4453016B2 (ja) * 2005-01-31 2010-04-21 株式会社カシオ日立モバイルコミュニケーションズ 携帯端末、文字読取方法および文字読取プログラム
DE102005033001A1 (de) * 2005-07-14 2007-01-25 Siemens Ag Verfahren zur Optimierung von Kontrollvorgängen beim Einsatz mobiler Endgeräte
US20080094496A1 (en) * 2006-10-24 2008-04-24 Kong Qiao Wang Mobile communication terminal
EP2189926B1 (en) * 2008-11-21 2012-09-19 beyo GmbH Method for providing camera-based services using a portable communication device of a user and portable communication device of a user
JP4809462B2 (ja) * 2009-07-10 2011-11-09 京セラ株式会社 携帯端末装置
CN101609365B (zh) 2009-07-21 2012-10-31 上海合合信息科技发展有限公司 字符输入方法及系统、电子设备及其键盘
CN101639760A (zh) * 2009-08-27 2010-02-03 上海合合信息科技发展有限公司 联系信息输入方法及系统
US8374646B2 (en) * 2009-10-05 2013-02-12 Sony Corporation Mobile device visual input system and methods
US8515185B2 (en) * 2009-11-25 2013-08-20 Google Inc. On-screen guideline-based selective text recognition
RU2010149510A (ru) * 2010-12-06 2011-06-27 Владимир Витальевич Мирошниченко (RU) Способ телефонного вызова абонента телефонной связи
FR2979027A1 (fr) * 2011-08-12 2013-02-15 Epic Dream Procede de compensation d'une offre de remboursement dematerialisee et application logicielle pour la mise en oeuvre du procede
US9916514B2 (en) * 2012-06-11 2018-03-13 Amazon Technologies, Inc. Text recognition driven functionality
JP5561331B2 (ja) * 2012-09-12 2014-07-30 オムロン株式会社 携帯端末装置用のプログラムおよび携帯端末装置
JP6080586B2 (ja) * 2013-02-13 2017-02-15 株式会社ファインデックス 文字認識システム、文字認識プログラム及び文字認識方法
US9542613B2 (en) * 2013-03-15 2017-01-10 Orcam Technologies Ltd. Systems and methods for processing images
CN104142774B (zh) * 2013-05-06 2019-02-26 腾讯科技(深圳)有限公司 页面内容的处理方法及装置
JP6361090B2 (ja) * 2013-05-16 2018-07-25 ヤマハ株式会社 中継装置
US9342533B2 (en) 2013-07-02 2016-05-17 Open Text S.A. System and method for feature recognition and document searching based on feature recognition
EP2821934B1 (en) * 2013-07-03 2024-02-14 Open Text S.A. System and method for optical character recognition and document searching based on optical character recognition
US10002449B2 (en) * 2015-04-16 2018-06-19 Sap Se Responsive and adaptive chart controls
CN105376412A (zh) * 2015-12-01 2016-03-02 小米科技有限责任公司 信息处理的方法及装置
JP6448696B2 (ja) * 2017-03-22 2019-01-09 株式会社東芝 情報処理装置、方法及びプログラム
US11006043B1 (en) * 2018-04-03 2021-05-11 Snap Inc. Image-capture control

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69424096T2 (de) * 1993-07-16 2000-11-16 Sharp K.K., Osaka Bildprozessor
JP3307075B2 (ja) * 1994-04-06 2002-07-24 キヤノン株式会社 撮影装置
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
US6639626B1 (en) * 1998-06-18 2003-10-28 Minolta Co., Ltd. Photographing apparatus with two image sensors of different size
JP4128275B2 (ja) * 1998-07-06 2008-07-30 オリンパス株式会社 翻訳機能付カメラ
GB9922214D0 (en) * 1999-09-20 1999-11-17 Ncr Int Inc Creation transmission and retrieval of information
JP3895892B2 (ja) * 1999-09-22 2007-03-22 株式会社東芝 マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
JP2002152696A (ja) * 2000-11-10 2002-05-24 Hitachi Ltd 携帯端末
JP2002252691A (ja) * 2001-02-26 2002-09-06 Seiko Epson Corp OCR(OpticalCharacterRecognition:光学的文字読み取り)機能付き携帯電話端末
JP4240859B2 (ja) * 2001-09-05 2009-03-18 株式会社日立製作所 携帯端末装置及び通信システム
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images

Also Published As

Publication number Publication date
US20040141644A1 (en) 2004-07-22
CN1498016A (zh) 2004-05-19
EP1411460A3 (en) 2005-11-16
EP1411460A2 (en) 2004-04-21
JP2004140555A (ja) 2004-05-13
JP3990253B2 (ja) 2007-10-10

Similar Documents

Publication Publication Date Title
CN100505771C (zh) 具有字符识别功能的便携式通信设备
EP1387560B1 (en) Portable terminal device, in particular a mobile phone, for barcode reading and for taking photographs
US7889267B2 (en) Focus state display apparatus and focus state display method
JP3766433B1 (ja) 携帯端末装置及び撮影画像認識方法
JP2007067782A (ja) 電子機器
JP2002083302A (ja) 情報処理装置、動作認識処理方法及びプログラム格納媒体
JP4146700B2 (ja) 携帯端末装置、情報提供システム及び情報提供プログラムを記録した記録媒体並びに印刷媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LENOVO INNOVATION CO., LTD. (HONGKONG)

Free format text: FORMER OWNER: NEC CORP.

Effective date: 20141119

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20141119

Address after: Hongkong, China

Patentee after: LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)

Address before: Tokyo, Japan

Patentee before: NEC Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090624

Termination date: 20171017

CF01 Termination of patent right due to non-payment of annual fee