CN1815491A - 便携式终端、使用便携式终端的字符读取方法 - Google Patents

便携式终端、使用便携式终端的字符读取方法 Download PDF

Info

Publication number
CN1815491A
CN1815491A CNA2006100067420A CN200610006742A CN1815491A CN 1815491 A CN1815491 A CN 1815491A CN A2006100067420 A CNA2006100067420 A CN A2006100067420A CN 200610006742 A CN200610006742 A CN 200610006742A CN 1815491 A CN1815491 A CN 1815491A
Authority
CN
China
Prior art keywords
character string
mentioned
string
character
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100067420A
Other languages
English (en)
Other versions
CN100437626C (zh
Inventor
伊藤利久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)
Original Assignee
Casio Hitachi Mobile Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Hitachi Mobile Communications Co Ltd filed Critical Casio Hitachi Mobile Communications Co Ltd
Publication of CN1815491A publication Critical patent/CN1815491A/zh
Application granted granted Critical
Publication of CN100437626C publication Critical patent/CN100437626C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Telephone Function (AREA)

Abstract

本发明的便携式终端中,字符串提取部(20)从来自图像摄像装置(10)的图像数据中提取字符串的图像。字符识别部(30)识别所提取的字符串的图像,取得对应于该字符串的字符代码串。字符串跟踪部(40)将上述字符代码串作为跟踪对象字符串,如果该跟踪对象字符串将要伸出到可拍摄范围外,则边随时更新标志字符串一边跟踪作为最终输入字符串的跟踪对象字符串或标志字符串。显示部(50)强调显示跟踪对象字符串,并且如果跟踪对象字符串将要从图像摄像装置(10)的可拍摄范围伸出到外面,则显示表示其方向的箭头。

Description

便携式终端、使用便携式终端的字符读取方法
技术领域
本发明涉及便携式电话机、PHS(Personal IIandyphone System,个人手持系统)、便携式信息终端等便携式终端,特别涉及装载了照相机而具有摄影功能的便携式终端、使用便携式终端的字符识别方法以及字符识别程序。
背景技术
近年来,在便携式电话机及PHS等便携式终端中,制作并发送电子邮件,或为了利用因特网而输入URL(Uniform Resource Locator,超链接),或为了利用因特网上的检索站点而输入关键字等应用不断扩展,在便携式终端中输入字符数据的机会增多。
但是,由于便携式终端是小型的,所以只能装载少量的键,难以装载在PC中广泛使用的适于输入字符的Qwerty排列的键盘。
所以,在便携式终端中,一般将多个字符分配给1个键,通过按下键的次数而使输入的字符变化。但是,在上述那样的将多个字符分配给1个键、通过按下键的次数而使输入的字符变化的便携式终端中,为了输入字符而需要按下许多键,操作较烦杂、花费时间。
所以,在现有技术中,提出了利用用图像摄像装置拍摄的字符的图像,通过取得与其对应的字符代码来输入的技术(例如参照日本特开2002-111841号公报)。
但是,在上述现有技术中,为了用装载了摄像装置的便携式终端拍摄字符,必须使便携式终端非常接近字符,即使是便携式终端的很微小的移动,也对拍摄产生较大影响。特别是,在连续输入字符时,由于在拍摄1个字符后必须使便携式终端移动,所以有容易丢失刚才拍摄的字符的问题。
发明内容
本发明的目的是提供一种便携式终端、使用便携式终端的字符读取方法以及字符读取程序,通过跟踪之前拍摄并输入的字符,能够将连续的单词或字符串拍摄并容易读取。
为了达到上述目的,本发明的便携式终端,具备:图像摄像机构,拍摄文章;字符串提取机构,从由上述图像摄像机构拍摄的文章的图像中提取至少包含1个字符串的图像;字符识别机构,识别由上述字符串提取机构提取的图像中所包含的字符串,并取得该字符串的字符代码串;字符串跟踪机构,将由上述字符识别机构取得的字符代码串和从之前由上述图像摄像机构所拍摄的文章的图像中提取的字符串中所取得的字符代码串相比较,如果字符代码的排列至少部分相同,则将上述字符代码串的字符串作为跟踪对象字符串。
此外,为了达到上述目的,本发明的字符读取方法,是具有摄像部的便携式终端的字符读取方法,由上述摄像部以预定的时间间隔连续拍摄文章;从所拍摄的文章的图像中提取至少包含1个字符串的图像;识别所提取的图像中所包含的字符串,取得该字符串的字符代码串;将上述所取得的字符代码串和从由之前所拍摄的文章的图像中提取的字符串中取得的字符代码串相比较,如果字符代码的排列至少部分相同,则将上述字符代码串的字符串作为跟踪对象字符串;将作为跟踪对象字符串的字符串的字符代码串作为最终的输入字符串。
根据本发明,可得到能够从所拍摄的连续的单词或字符串中容易读取特定的字符串的优点。
附图说明
图1是表示本发明的实施方式的便携式终端的结构的框图。
图2是表示本发明的实施方式的便携式终端的动作的流程图。
图3是表示本发明的实施方式的便携式终端的动作的流程图。
图4是表示在显示部中与标志字符串位置信息P(x,y)对应地显示的箭头的例子的概念图。
图5A至图5G是表示本发明的实施方式的便携式终端的动作例的示意图。
具体实施方式
下面,参照附图说明本发明的实施方式。另外,下面,对读取记述了英文的文章的情况进行说明。本实施方式的便携式终端也可以按每个单词来读取字符串。
A、实施方式的结构
图1是表示本发明的实施方式的便携式终端的大致结构的框图。图中,便携式终端具有图像摄像装置10、字符串提取部20、字符识别部30、字符串跟踪部40、以及显示部50。图像摄像装置10将文章的图像拍摄为静态图像。字符串提取部20从图像摄像装置10获得图像数据,从该数据中提取字符串的图像,并取得表示该字符串的图像位于从图像摄像装置10获取的图像数据的何处的字符串图像位置信息及表示字符串的图像尺寸的图像尺寸信息。这里所谓的字符串,例如在识别对象为英语单词等、单词间由空格分割的语言的情况下,只要将从空格到下一个空格的部分确定为一段单词就可以,对于其他语言,只要根据各语言的特征确定字符或单词就可以。
字符识别部30具有所谓的OCR功能,根据从字符串提取部20获取的字符串的图像与该字符串图像位置信息取得与该字符串对应的字符代码串。更具体地讲,如果对例如“识别”图像数据内的“abc”的字符的情况进行说明,则首先确定“abc”是位于图像数据内的哪个位置的信息(字符串抽取),接着分割为“a”、“b”、“c”,并将“a”变换为预定的参数值(例如,将从纵、横、斜向观察该字符的线段的结构参数化,将字符的白色部分设为“0”、黑色部分设为“1”)。接着,从未图示的识别辞典中选择与最类似于变换后的参数值的参数值相对应的字符代码。
识别辞典以使参数值和与该参数值对应的字符代码成对的数据结构进行存储,并作为字符代码可以包括字母、日语的汉字或平假名、片假名、朝鲜字符、台湾语、汉语、阿拉伯字符、泰国字符等。此外,在如日语及朝鲜字符等那样字符数较多的情况下,如果将有关所有字符的信息保存在1个识别辞典中,则文件尺寸增大,所以也可以分割为多个识别辞典中来保存。例如,在日语的情况下,也可以将由JIS规定的第1级和第2级的字符分开独立保存。
字符串跟踪部40将从字符识别部30获取的2个字符串的字符代码及字符串图像位置信息与图像尺寸信息等进行比较,判断是否相同,如果相同、或部分相同,则识别为最终作为输入字符串的跟踪对象字符串或用来跟踪该跟踪对象字符串的标志字符串。此外,字符串跟踪部40根据字符串图像位置信息及图像尺寸信息,判断跟踪对象字符串或标志字符串是否从图像摄像装置10的可拍摄范围伸出到外面,或是否有从可拍摄范围伸出到外面的可能性,在跟踪对象字符串或标志字符串从图像摄像装置10的可拍摄范围伸出到外面的情况下,或预想到会从可拍摄范围伸出到外面的情况下,对字符串提取部20发出命令,使其提取与该跟踪对象字符串或标志字符串相邻、并且位于图像摄像装置10的可拍摄范围中的字符串。显示部50显示从图像摄像装置10获取的图像数据,在从字符串跟踪部40获取到跟踪对象字符串的字符串图像位置信息的情况下,强调显示该字符串图像,在从字符串跟踪部40获取到具有跟踪对象字符串的方向信息的情况下,显示其方向。
另外,图1所示的字符串提取部20、字符识别部30、以及字符串跟踪部40也可以作为CPU的软件来实现。
B、实施方式的动作
接着,参照附图说明上述实施方式的动作。这里,图2及图3是表示本实施方式的便携式终端的动作的流程图。如果终端使用者用图像摄像装置10拍摄文章(步骤S10),则图像摄像装置10将该静止图像数据传送给字符串提取部20和显示部50。显示部50显示该静止图像数据(步骤S10)。字符串提取部20提取单词的图像(步骤S12),并将所提取的图像数据和该字符串图像位置信息传送给字符识别部30。
字符识别部30根据单词的图像识别字符串(步骤S14),取得与其对应的字符代码串,将字符代码串与字符串图像位置信息传送给字符串跟踪部40。字符串跟踪部40获取到字符代码串和字符串图像位置信息后,将它们进行存储,检查前面获取的字符代码串和字符串图像位置信息的有无(步骤S16)。接着,在没有前面获取的字符代码串和字符串图像位置信息的情况下,返回步骤S10,重复上述的处理。
另一方面,在具有前面获取的字符代码串和字符串图像位置信息的情况下,以字符代码串比较前面获取的字符代码串与此次获取的字符代码串,检查是否全部或部分(此次的字符代码串的一部分包含在前面的字符代码串中)相同(步骤S18)。接着,如果不相同,则返回步骤S10,重复上述处理。另一方面,如果全部或部分相同,则将该单词识别为跟踪对象字符串,并根据该跟踪对象字符串的字符串图像位置信息及图像尺寸信息,检查该图像数据是否伸出到图像摄像装置10的可拍摄区域(由透镜或摄像元件等决定的有效摄影区域)之外(步骤S20)。并且,如果没有伸出到可拍摄区域之外,则强调显示该跟踪对象字符串(步骤S22),回到步骤S10,重复上述处理。由此,以与字符串提取部20、字符识别部30、字符串跟踪部40的处理能力相应的周期,在步骤S10中重复文章的摄影,结果,成为以预定的时间间隔(周期)重复拍摄的状态。
另一方面,如果跟踪对象字符串的图像数据伸出到图像摄像装置10的可拍摄区域之外,则对字符串提取部20发出命令,使其提取与跟踪对象字符串相邻、且位于图像摄像装置10的可拍摄区域中的单词。字符串提取部20提取与跟踪对象字符串相邻、且位于图像摄像装置10的可拍摄区域中的单词,并将所提取的图像数据及其字符串图像位置信息传送给字符识别部30。字符识别部30根据单词的图像识别字符串,取得与其对应的字符代码串,并将该字符代码串和字符串图像位置信息传送给字符串跟踪部40(步骤S24)。字符串跟踪部40将跟踪对象字符串附近的单词的字符代码串及其字符串图像位置信息识别为标志字符串的信息后进行存储,并转移到标志字符串跟踪处理(步骤S26)。
字符串跟踪部40在转移到图3所示的标志字符串跟踪处理时,存储该标志字符串位于跟踪对象字符串的上下偏离几行的位置还是横向偏离几个单词的位置。将标志字符串距离跟踪对象字符串位于向下偏离x单词、向右偏离y行时的位置信息表示为标志字符串位置信息P(x,y)。在本实施方式中,为了图示标志字符串相对于跟踪对象字符串位于哪个方向,显示表示其方向的箭头。所以,对于根据标志字符串位置信息P(x,y)的x、y值的组合而取得的、标志字符串相对于跟踪对象字符串的方向,如图4所示,预先将箭头(标志)表格化而进行存储。然后,根据P(x,y)检查跟踪对象字符串位于哪个方向,从图4所示的表中取得朝向该方向的箭头并显示在显示部50上(步骤S30),命令图像摄像装置10拍摄字符串并继续处理(步骤S32)。
图像摄像装置10拍摄字符串,并将该图像数据传送给字符串提取部20。字符串提取部20提取位于标志字符串的字符串图像位置信息所示的位置附近的字符串,将其图像数据及其字符串图像位置信息传送给字符识别部30(步骤S34)。字符识别部30识别所获取的字符串的图像数据,取得对应的字符代码串(步骤S36),并将该字符代码串和字符串图像位置信息传送给字符串跟踪部40。
字符串跟踪部40对前面存储的标志字符串的字符代码串与这次获取的字符代码串进行比较,检查是否全部或部分相同(步骤S38)。并且,如果不相同,则字符串跟踪部40将跟踪对象字符串的字符代码串与字符串图像位置信息、以及标志字符串的字符代码串和字符串图像位置信息丢弃,结束标志字符串跟踪处理,回到图2的步骤S10。
另一方面,如果前面存储的标志字符串的字符代码串与这次获取的字符代码串相同,则字符串跟踪部40对字符串提取部20发出命令,使其提取与标志字符串相邻、存在于跟踪对象字符串所在方向的字符串,使字符串提取部20提取该字符串(步骤S40),判断有没有提取字符串的图像数据(步骤S42)。并且,如果字符串提取部20不能提取该字符串,则将标志字符串保持该状态,前进到接下来的处理(步骤S46)。
另一方面,如果字符串提取部20能够提取该字符串,则将该图像数据及其字符串图像位置信息传送给字符识别部30,字符识别部30根据所获取的字符串的图像数据取得对应的字符代码串,并将该字符代码串与字符串图像位置信息传送给字符串跟踪部40,字符串跟踪部40根据所获取的字符代码串与字符串图像位置信息,检查该字符串相对于标志字符串位于哪个方向,更新P(x,y),将该字符串作为新的标志字符串(步骤S44)。
字符串跟踪部40不论有无标志字符串的更新,都根据该标志字符串的字符串图像位置信息及图像尺寸信息,检查标志字符串的图像数据是否伸出到图像摄像装置10的可拍摄区域之外(步骤S46)。并且,如果没有伸出到可拍摄区域之外,则回到步骤S30,重复上述处理。
另一方面,如果标志字符串的图像数据伸出到可拍摄区域之外,则字符串跟踪部40进行与标志字符串相邻、且位于图像摄像装置10的可拍摄区域中的单词的识别(步骤S48)。即,字符串跟踪部40对字符串提取部20发出命令,使其提取与标志字符串相邻、且位于图像摄像装置10的可拍摄区域中的单词。字符串提取部20提取与标志字符串相邻、且位于图像摄像装置10的可拍摄区域中的单词,将所提取的图像数据及其字符串图像位置信息传送给字符识别部30。
字符识别部30根据单词的图像识别字符串,并取得与其对应的字符代码串,将字符代码串与字符串图像位置信息传送给字符串跟踪部40。字符串跟踪部40根据所获取的字符代码串与字符串图像位置信息,检查该字符串相对于标志字符串位于哪个方向,更新P(x,y),将该字符串作为新的标志字符串(步骤S50)。
接着,判断该标志字符串是否为跟踪对象字符串(步骤S52)。即,如果P(x,y)的x=0且y=0,则字符串跟踪部40将该标志字符串作为跟踪对象字符串,结束标志字符串跟踪处理,回到图2的步骤S10。与此相对,在P(x,y)中,如果x不为0、或y不为0,则回到标志字符串跟踪处理的步骤S30,继续标志字符串的跟踪。
接着,参照图5A至图5G,说明上述本实施方式的便携式终端的动作例。如果对英文进行摄影,则将位于图像中央附近的字符“Hitachi”识别为跟踪对象字符串,用框B1围住并强调显示(图5A)。然后,在因手抖动等而使终端向左移动、跟踪对象字符串“Hitachi”将要伸出到拍摄范围外的情况下,将与“Hitachi”相邻的单词“are”识别为标志字符串,标志字符串位置信息P(x,y)变为P(-1,0),用箭头A1表示跟踪对象字符串所在的方向(图5B)。在此状态下,由于跟踪对象字符串所在的方向为右,所以识别与“are”相邻、位于右方的字符串“Hita”,标志字符串位置信息P(x,y)成为P(0,0)。
因而,“Hita”被识别为跟踪对象字符串,用框B2围住并强调显示(图5C)。但是,由于“Hita”将要伸出到拍摄范围外,所以相邻的单词“are”被识别为标志字符串,标志字符串位置信息P(x,y)变为P(-1,0),用箭头A1表示跟踪对象字符串所在的方向(图5B)。此时,重复图5B和图5C的动作。
进而,在因手抖动等而终端向左下移动的情况下,由于标志字符串“are”将要伸出到拍摄范围外,所以将位于摄影范围内、且相邻的字符串“Inspire”作为新的标志字符串。此时,“Inspire”由于位于下方,所以标志字符串位置信息P(x,y)变为P(-1,1),用箭头A2表示跟踪对象字符串所在的方向(图5D)。
接着,识别与标志字符串相邻、存在于跟踪对象字符串所处方向上的字符。此时,由于为“are”,所以将其更新为新的标志字符串,将标志字符串位置信息P(x,y)设为P(-1,0)(图5E)。但是,由于标志字符串“are”将要伸出到摄影范围外,所以将位于摄影范围内、且相邻的字符串“Inspire”作为新的标志字符串,将标志字符串位置信息P(x,y)设为P(-1,1)(图5D)。以后,重复图5D和图5E的动作,直到终端移动。
接着,用户为了搜寻跟踪对象字符串,使终端从图5E的状态开始向右移动。由此,识别存在于跟踪对象字符串所处的方向、且与标志字符串相邻的字符串“the”。由于所识别的字符串“the”位于标志字符串的右方,所以将标志字符串位置信息P(x,y)设为P(0,1),将所识别的字符串“the”作为新的标志字符串(图5F)。此时,由于在跟踪对象字符串所处方向上相邻的字符串不在摄影范围内,所以“the”依然成为标志字符串,用箭头A3表示跟踪对象字符串所在的方向。
进而,由于跟踪对象字符串所在的方向指向上方,所以用户向上移动终端。如果识别存在于跟踪对象字符串所在的方向上、与标志字符串相邻的字符串,则可识别“Hi”。该字符串“Hi”由于存在于标志字符串的上方,所以将标志字符串位置信息P(x,y)更新为P(0,0)。由于成为P(0,0),所以将该字符串“Hi”作为跟踪对象字符串,用框3围住并强调显示(图5G)。
以后,如上述那样,即使因手抖动等而使终端大幅移动、在显示部50中显示的之前拍摄的单词或字符串(跟踪对象字符串)移动,也能够实时地强调显示跟踪对象字符串,并且将该跟踪对象字符串附近的字符串识别为标志字符串,根据该标志字符串与跟踪对象字符串的位置关系,重复用图示箭头表示跟踪对象字符串所存在的方向的动作,所以能够容易找出之前拍摄的单词或字符串(跟踪对象字符串)。
另外,在上述实施方式中,在字符串跟踪部40进行2个单词的比较时,也可以不比较字符代码串,而是比较2个单词的字符串图像位置信息,如果2个单词的字符串图像位置的横向差在一个字符的横向的大小以内、且2个单词的字符串图像位置的纵向差在一个字符的纵向大小以内,则判断为相同的单词。
此外,在字符串跟踪部40进行2个单词的比较时,也可以不比较字符代码串,而是比较2个单词的图像尺寸,如果2个单词的图像尺寸的横向差在一个字符的横向大小以内、且2个单词的图像尺寸的纵向差在一个字符的纵向大小以内,则判断为相同的单词。
此外,在字符串跟踪部40进行2个单词的比较时,也可以比较上述2个单词的字符串图像位置信息、并比较上述2个单词的图像尺寸,在这2种比较中两者都能够判断为相同的单词的情况下,判断为相同的单词。
此外,在本实施方式中,字符串提取部20以英文为前提提取单词,但在如日语那样难以提取单词的语言的情况下,也可以如汉字和平假名那样、区分复杂的字符与简单的字符的交界处来提取。
根据上述实施方式,在用图像摄像装置10拍摄字符时,能够容易识别之前拍摄的单词及字符串。即,即使因手抖动等而使终端大幅移动、而看不到刚才拍摄的单词及字符串,通过在显示部50中显示的表示之前拍摄的单词及字符串所在的方向的箭头,也能够容易找出之前拍摄的单词及字符串。

Claims (22)

1、一种便携式终端,具备:
图像摄像机构,拍摄文章;
字符串提取机构,从由上述图像摄像机构拍摄的文章的图像中提取至少包含1个字符串的图像;
字符识别机构,识别由上述字符串提取机构提取的图像中所包含的字符串,并取得该字符串的字符代码串;
字符串跟踪机构,将由上述字符识别机构取得的字符代码串和从之前由上述图像摄像机构所拍摄的文章的图像中提取的字符串中所取得的字符代码串相比较,如果字符代码的排列至少部分相同,则将上述字符代码串的字符串作为跟踪对象字符串。
2、如权利要求1所述的便携式终端,其特征在于,将由上述字符串跟踪机构设为跟踪对象字符串的字符串的字符代码串作为最终的输入字符串。
3、如权利要求1或2所述的便携式终端,其特征在于,具备显示机构,所述显示机构在显示由上述图像摄像机构所拍摄的文章的图像时,将由上述字符串跟踪机构设为跟踪对象字符串的字符串强调显示在上述文章的图像上。
4、如权利要求1至3中任一项所述的便携式终端,其特征在于,上述图像摄像机构以预定的时间间隔连续拍摄文章。
5、如权利要求1至4中任一项所述的便携式终端,其特征在于,
上述字符串提取机构在从上述图像摄像机构所拍摄的图像中提取字符串的图像时,取得表示上述字符串的图像位于由上述图像摄像机构拍摄的图像上的何处的字符串图像位置信息;
上述字符串跟踪机构根据上述字符串图像位置信息,来判断上述跟踪对象字符串是否位于上述图像摄像机构的可拍摄范围外,在上述跟踪对象字符串将要伸出到上述图像摄像机构的可拍摄范围外的情况下,对上述字符串提取机构进行指示,使其提取位于由上述字符串图像位置信息所示的位置附近、且位于上述图像摄像机构的可拍摄范围内的字符串。
6、如权利要求1至5中任一项所述的便携式终端,其特征在于,
上述字符串提取机构在从上述图像摄像机构所拍摄的图像中提取字符串的图像时,还取得表示上述所提取的字符串的图像尺寸的图像尺寸信息;
上述字符串跟踪机构在判断是否为相同的字符串时,根据上述字符串图像位置信息和上述图像尺寸信息,判断字符串是否为大致相同位置、或大致相同图像尺寸,如果所比较的字符串为大致相同位置、或大致相同图像尺寸,则判断为相同的字符串。
7、如权利要求1至5中任一项所述的便携式终端,其特征在于,
上述字符串提取机构在从上述图像摄像机构所拍摄的图像中提取字符串的图像时,还取得表示上述所提取的字符串的图像尺寸的图像尺寸信息;
上述字符串跟踪机构在判断是否为相同的字符串时,根据上述字符串图像位置信息和上述图像尺寸信息,判断字符串是否为大致相同位置、且大致相同图像尺寸,如果所比较的字符串为大致相同位置、且大致相同图像尺寸,则判断为相同的字符串。
8、如权利要求5中所述的便携式终端,其特征在于,上述字符串跟踪机构对上述字符串提取机构进行指示,使其提取位于由上述字符串图像位置信息所示位置的附近、并且位于上述图像摄像机构的可拍摄范围内的字符串,结果,如果由上述字符串提取机构提取了位于上述跟踪对象字符串附近的字符串,则将位于上述跟踪对象字符串附近的字符串识别为用于跟踪上述跟踪对象字符串的标志字符串。
9、如权利要求8所述的便携式终端,其特征在于,上述字符串跟踪机构根据上述标志字符串的字符串图像位置信息,判断上述标志字符串是否将要伸出到上述图像摄像机构的可拍摄范围外,并在上述标志字符串将要伸出到上述图像摄像机构的可拍摄范围外的情况下,对上述字符串提取机构进行指示,使其提取位于由上述字符串图像位置信息所示位置的附近、且位于上述图像摄像机构的可拍摄范围内的字符串,其结果,如果由上述字符串提取机构提取了位于上述跟踪对象字符串附近的字符串,则将位于上述标志字符串附近的字符串识别为下一个标志字符串。
10、如权利要求8或9所述的便携式终端,其特征在于,上述字符串跟踪机构根据上述标志字符串的字符串图像位置信息和上述跟踪对象字符串的字符串图像位置信息,取得上述跟踪对象字符串相对于上述标志字符串位于哪个方向的方向信息。
11、如权利要求10所述的便携式终端,其特征在于,上述显示机构根据由上述字符串跟踪机构取得的方向信息,可识别地显示上述跟踪对象字符串所在的方向。
12、如权利要求8至11中任一项所述的便携式终端,其特征在于,上述字符串跟踪机构对上述字符串提取机构发出命令,使其提取从上述标志字符串所在的位置靠近上述跟踪对象字符串所在的方向的字符串,如果上述字符串提取机构能够提取该字符串,则将其作为新的标志字符串,并根据上述新的标志字符串的字符串图像位置信息来判断上述跟踪对象字符串所在的方向。
13、一种字符读取方法,是具有摄像部的便携式终端的字符读取方法,其特征在于,
由上述摄像部以预定的时间间隔连续拍摄文章;
从所拍摄的文章的图像中提取至少包含1个字符串的图像;
识别所提取的图像中所包含的字符串,取得该字符串的字符代码串;
将上述所取得的字符代码串和从由之前所拍摄的文章的图像中提取的字符串中取得的字符代码串相比较,如果字符代码的排列至少部分相同,则将上述字符代码串的字符串作为跟踪对象字符串;
将作为跟踪对象字符串的字符串的字符代码串作为最终的输入字符串。
14、如权利要求13所述的字符读取方法,其特征在于,在显示上述所拍摄的文章的图像时,将作为上述跟踪对象字符串的字符串强调显示在上述文章的图像上。
15、如权利要求13或14所述的字符读取方法,其特征在于,
在从上述摄像部所拍摄的图像中提取字符串的图像时,取得表示上述字符串的图像位于所拍摄的图像上的何处的字符串图像位置信息;
根据上述字符串图像位置信息判断上述跟踪对象字符串是否位于上述摄像部的可拍摄范围外,在上述跟踪对象字符串将要伸出到上述可拍摄范围外的情况下,提取位于由上述字符串图像位置信息所示的位置附近、且位于上述可拍摄范围内的字符串;
将位于上述跟踪对象字符串附近、且位于可拍摄范围内的字符串,识别为用于跟踪上述跟踪对象字符串的标志字符串;
根据上述标志字符串的字符串图像位置信息和上述跟踪对象字符串的字符串图像位置信息,取得上述跟踪对象字符串相对于上述标志字符串位于哪个方向的方向信息;
根据上述方向信息,可识别地显示上述跟踪对象字符串所在的方向。
16、如权利要求13至15中任一项所述的字符读取方法,其特征在于,
在从上述摄像部所拍摄的图像中提取字符串的图像时,还提取表示上述所提取的字符串的图像尺寸的图像尺寸信息;
在判断是否为相同的字符串时,根据上述字符串图像位置信息和上述图像尺寸信息,判断字符串是否为大致相同的位置、或大致相同的图像尺寸;
如果所比较的字符串为大致相同的位置、或大致相同的图像尺寸,则判断为相同的字符串。
17、如权利要求13至15中任一项所述的字符读取方法,其特征在于,
在从上述摄像部所拍摄的图像中提取字符串的图像时,还提取表示上述所提取的字符串的图像尺寸的图像尺寸信息;
在判断是否为相同的字符串时,根据上述字符串图像位置信息和上述图像尺寸信息,判断字符串是否为大致相同的位置、且大致相同的图像尺寸;
如果所比较的字符串为大致相同的位置、且大致相同的图像尺寸,则判断为相同的字符串。
18、如权利要求13至17中任一项所述的字符读取方法,其特征在于,
根据上述标志字符串的字符串图像位置信息,判断上述标志字符串是否位于上述摄像部的可拍摄范围外;
在上述标志字符串将要伸出到上述摄像部的可拍摄范围外的情况下,提取位于上述字符串图像位置信息所示位置的附近、且位于上述可拍摄范围内的字符串;
将该提取的字符串识别为下一个标志字符串。
19、如权利要求13至18中任一项所述的字符读取方法,其特征在于,
在提取从上述标志字符串所在的位置靠近上述跟踪对象字符串所在的方向的字符串时,如果能够提取该字符串,则将其作为新的标志字符串;
根据上述新的标志字符串的字符串图像位置信息,判断上述跟踪对象字符串所在的方向。
20、一种字符读取程序,是具有摄像部的便携式终端的字符读取程序,其特征在于,
使计算机执行以下步骤:
由上述摄影部拍摄文章的步骤;
从所拍摄的文章的图像中提取至少包含1个字符串的图像的步骤;
识别所提取的图像中所包含的字符串,并取得该字符串的字符代码串的步骤;
将上述所取得的字符代码串和从由之前所拍摄的文章的图像中提取的字符串中取得的字符代码串相比较,如果字符代码的排列至少部分地相同,则将上述字符代码串的字符串作为跟踪对象字符串的步骤;
将作为上述跟踪对象字符串的字符串的字符代码串作为最终的输入字符串的步骤。
21、如权利要求20所述的字符读取程序,其特征在于,在显示上述所拍摄的文章的图像时,还由计算机执行将作为上述跟踪对象字符串的字符串强调显示在上述文章的图像上的步骤。
22、如权利要求20或21所述的字符读取程序,其特征在于,还由计算机执行以下步骤:
在从上述摄像部所拍摄的图像中提取字符串的图像时,取得表示上述字符串的图像位于所拍摄的图像上的何处的字符串图像位置信息的步骤;
根据上述字符串图像位置信息,判断上述跟踪对象字符串是否位于上述摄像部的可拍摄范围外的步骤;
在上述跟踪对象字符串将要伸出到上述可拍摄范围外的情况下,提取位于由上述字符串图像位置信息所示位置的附近、且位于上述可拍摄范围内的字符串的步骤;
将位于上述跟踪对象字符串附近、且位于可拍摄范围内的字符串,识别为用于跟踪上述跟踪对象字符串的标志字符串的步骤;
根据上述标志字符串的字符串图像位置信息和上述跟踪对象字符串的字符串图像位置信息,取得上述跟踪对象字符串相对于上述标志字符串位于哪个方向的方向信息的步骤;
根据上述方向信息,可识别地显示上述跟踪对象字符串所在的方向的步骤。
CNB2006100067420A 2005-01-31 2006-01-27 便携式终端、使用便携式终端的字符读取方法 Expired - Fee Related CN100437626C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP023036/2005 2005-01-31
JP2005023036A JP4453016B2 (ja) 2005-01-31 2005-01-31 携帯端末、文字読取方法および文字読取プログラム

Publications (2)

Publication Number Publication Date
CN1815491A true CN1815491A (zh) 2006-08-09
CN100437626C CN100437626C (zh) 2008-11-26

Family

ID=36907688

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100067420A Expired - Fee Related CN100437626C (zh) 2005-01-31 2006-01-27 便携式终端、使用便携式终端的字符读取方法

Country Status (4)

Country Link
US (1) US7697722B2 (zh)
JP (1) JP4453016B2 (zh)
KR (1) KR100759165B1 (zh)
CN (1) CN100437626C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102420932A (zh) * 2010-09-27 2012-04-18 汉王科技股份有限公司 一种图像拍摄装置和方法
CN101251897B (zh) * 2007-02-20 2012-07-04 索尼株式会社 图像处理装置、图像处理方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7841533B2 (en) 2003-11-13 2010-11-30 Metrologic Instruments, Inc. Method of capturing and processing digital images of an object within the field of view (FOV) of a hand-supportable digitial image capture and processing system
US20080094496A1 (en) * 2006-10-24 2008-04-24 Kong Qiao Wang Mobile communication terminal
JP4941020B2 (ja) * 2007-03-14 2012-05-30 カシオ計算機株式会社 撮像装置及び撮像装置制御プログラム
KR101012729B1 (ko) * 2008-10-31 2011-02-09 한국과학기술원 마커를 이용한 문자열 추출 시스템 및 그 방법
JP2018005622A (ja) * 2016-07-04 2018-01-11 株式会社ウェルキャット 携帯型電子機器
JP7458816B2 (ja) * 2020-02-18 2024-04-01 キヤノン株式会社 データ入力支援装置、データ入力支援方法、表示装置、及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220025A (ja) 1994-01-31 1995-08-18 Canon Inc 画像処理装置
JPH11103411A (ja) 1997-09-29 1999-04-13 Sony Corp 画像撮影装置
CN1179533C (zh) * 1997-12-29 2004-12-08 三星电子株式会社 用于移动无线电通信终端的字符识别系统及其方法
JP2000207487A (ja) 1999-01-20 2000-07-28 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2001128131A (ja) 1999-10-28 2001-05-11 Casio Comput Co Ltd 画像通信システム、通信端末装置及び記録媒体
US6754389B1 (en) * 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
JP2002111841A (ja) 2000-10-04 2002-04-12 Sony Corp 携帯通信端末および文字読取装置
JP2002152696A (ja) 2000-11-10 2002-05-24 Hitachi Ltd 携帯端末
EP1336153A1 (en) * 2000-11-17 2003-08-20 Jacob Weitman Applications for a mobile digital camera, that distinguish between text-, and image-information in an image
KR20020054702A (ko) * 2000-12-28 2002-07-08 이인동 아이엠티-2000을 이용한 문자인식방법
JP4240859B2 (ja) * 2001-09-05 2009-03-18 株式会社日立製作所 携帯端末装置及び通信システム
JP2004023158A (ja) 2002-06-12 2004-01-22 Sharp Corp 画像撮像装置
AU2003252263A1 (en) * 2002-08-07 2004-02-25 Matsushita Electric Industrial Co., Ltd. Character recognition processing device, character recognition processing method, and mobile terminal device
JP2004129131A (ja) 2002-10-07 2004-04-22 Matsushita Electric Ind Co Ltd 監視カメラシステム
JP3990253B2 (ja) * 2002-10-17 2007-10-10 埼玉日本電気株式会社 携帯電話装置
JP2005020205A (ja) 2003-06-24 2005-01-20 Casio Comput Co Ltd 画像撮影装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251897B (zh) * 2007-02-20 2012-07-04 索尼株式会社 图像处理装置、图像处理方法
CN102420932A (zh) * 2010-09-27 2012-04-18 汉王科技股份有限公司 一种图像拍摄装置和方法

Also Published As

Publication number Publication date
US7697722B2 (en) 2010-04-13
CN100437626C (zh) 2008-11-26
KR20060088026A (ko) 2006-08-03
JP2006209599A (ja) 2006-08-10
JP4453016B2 (ja) 2010-04-21
KR100759165B1 (ko) 2007-09-14
US20060193517A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
CN1815491A (zh) 便携式终端、使用便携式终端的字符读取方法
JP5073022B2 (ja) カメラで取得されたドキュメント用の低解像度のocr
KR101588890B1 (ko) 카메라 기반 영상의 문자 인식 및 번역 방법
US9916499B2 (en) Method and system for linking printed objects with electronic content
KR101064845B1 (ko) 문서 이미지 인코딩 시스템, 코드북 생성 시스템 및 방법, 코드북 탐색 시스템, 및 정보 인코딩 방법
CN101855640A (zh) 尤其是用于移动无线设备的图像分析方法
WO2001054054A1 (en) Word recognition using silhouette bar codes
Van Phan et al. A nom historical document recognition system for digital archiving
CN1121605A (zh) 信息处理方法和设备
CN1878182A (zh) 名片输入识别手机及其识别方法
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
Liu et al. Mobile Retriever: access to digital documents from their physical source
US6167367A (en) Method and device for automatic error detection and correction for computerized text files
CN115273108B (zh) 一种人工智能识别自动归集方法及系统
Nguyen et al. Preliminary results on ancient cham glyph recognition from cham inscription images
Munjal et al. Stride: Scene text recognition in-device
JP4474231B2 (ja) 文書リンク情報取得システム
Basu et al. Segmentation of offline handwritten Bengali script
US20090324139A1 (en) Real time document recognition system and method
JP2008040910A (ja) 文字列判定装置、文字列判定方法、文字列判定プログラムおよびコンピュータ読み取り可能な記録媒体
Rangoni et al. OCR Based Thresholding.
Hu et al. Establishing the provenance of historical manuscripts with a novel distance measure
CN110889401A (zh) 一种基于opencv库的文本版面识别方法
KR20050003075A (ko) 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NEC CASIO MOBILE COMMUNICATIONS CO., LTD.

Free format text: FORMER OWNER: CASIO HITACHI MOBILE CO., LTD.

Effective date: 20100811

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: TOKYO, JAPAN TO: KANAGAWA, JAPAN

TR01 Transfer of patent right

Effective date of registration: 20100811

Address after: Kanagawa, Japan

Patentee after: NEC CASIO Mobile Communications, Ltd.

Address before: Tokyo, Japan

Patentee before: Casio Hitachi Mobile Co., Ltd.

ASS Succession or assignment of patent right

Owner name: NEC CORP.

Free format text: FORMER OWNER: NEC CASIO MOBILE COMMUNICATIONS, LTD.

Effective date: 20130701

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130701

Address after: Tokyo, Japan

Patentee after: NEC Corp.

Address before: Kanagawa, Japan

Patentee before: NEC CASIO Mobile Communications, Ltd.

ASS Succession or assignment of patent right

Owner name: LENOVO INNOVATION CO., LTD. (HONGKONG)

Free format text: FORMER OWNER: NEC CORP.

Effective date: 20141201

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: HONG KONG, CHINA

TR01 Transfer of patent right

Effective date of registration: 20141201

Address after: Hongkong, China

Patentee after: LENOVO INNOVATIONS Co.,Ltd.(HONG KONG)

Address before: Tokyo, Japan

Patentee before: NEC Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081126

Termination date: 20180127

CF01 Termination of patent right due to non-payment of annual fee