CN1292377C - 便携终端的字符识别中的处理对象选择方法及便携终端 - Google Patents

便携终端的字符识别中的处理对象选择方法及便携终端 Download PDF

Info

Publication number
CN1292377C
CN1292377C CNB2004100889727A CN200410088972A CN1292377C CN 1292377 C CN1292377 C CN 1292377C CN B2004100889727 A CNB2004100889727 A CN B2004100889727A CN 200410088972 A CN200410088972 A CN 200410088972A CN 1292377 C CN1292377 C CN 1292377C
Authority
CN
China
Prior art keywords
character
image
recognition
identifying object
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100889727A
Other languages
English (en)
Other versions
CN1617163A (zh
Inventor
酒井理雄
日间贺充寿
绪方日佐男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Omron Financial System Co Ltd
Original Assignee
Hitachi Omron Financial System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Omron Financial System Co Ltd filed Critical Hitachi Omron Financial System Co Ltd
Publication of CN1617163A publication Critical patent/CN1617163A/zh
Application granted granted Critical
Publication of CN1292377C publication Critical patent/CN1292377C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • H04M1/0264Details of the structure or mounting of specific components for a camera module assembly

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Telephone Function (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

便携终端的字符识别中的处理对象选择方法及便携终端。在带照相机的便携信息终端,为了高精度地实施字符识别处理,必须使识别对象的字符串在图像内不倾斜。或者,当字符的记述方向有竖写和横写2种时,为了得到正确的字符识别结果,必须指定相符的字符行方向。这些情况下由使用者指定或修正的负担较大。另外,当字符识别日语,并将识别结果作为关键词进行检索时,由于与英语不同,没有字符的分隔处,因此存在使用者指定检索对象字的负担大的问题。为了适宜地修正字符行的倾斜,将表示字符行倾斜的指示器显示在信息终端装置的画面上。或者,为了字符识别日语后将识别结果作为关键词进行检索,使用语态素分析结果和光标的位置信息来指定检索对象字。

Description

便携终端的字符识别中的处理对象选择方法及便携终端
技术领域
本发明涉及在便携信息终端中进行光学式字符识别时的处理对象选择方法。
背景技术
在安装了照相机等图像输入功能的便携信息终端,对拍摄的图像实施光学式字符识别的技术已被开发。但是,用便携信息终端的照相机所拍摄的图像,由于手摆动等原因,相对于画面,字符串倾斜着被拍摄的情况较多。因此,当字符识别结果错误(误读)时,或是让使用者调整拍摄时的角度再次拍摄,或是使用键盘等输入装置修正识别结果。
作为在识别处理之前修正识别对象字符串的倾斜的技术,在专利文献1中公开了检测在记入了识别对象字符串的用纸上预先记载好的2个以上的标记,根据由此所得到的倾斜,自动进行旋转后进行识别的技术尝试。
另外,在非专利文献1中公开了在便携信息终端识别英语单词并查找英日辞典这样的结合了字符识别和辞典检索的使用方法。
专利文献1:特开平11-250179号公报(4~7项,第3图)
非专利文献1:H.Fujisawa,H.Sako,Y.Okada,and S-W.Lee,“InformationCapturing Camera and Developmental Issues,”In Proc.Int.Conf.DocumentAnalysis and Recognition,ICDAR,99,Bangalore,India,Sep.20-22,1999’pp.205-208.
为了高精度地实施字符识别处理,重要的是在图像内识别对象的字符串未倾斜。但是,当使用数字照相机或带照相机的便携终端等的信息终端装置拍摄数字图像时,用手来固定该信息终端装置的情况较多,为了使识别对象的字符串在图像内不倾斜,在拍摄时需要特别的注意(第一课题)。
对于使用带照相机功能的便携终端所拍摄的图像进行的光学式字符识别的功能中,当字符串被倾斜着拍摄时,现有技术中存在不能进行字符识别,或达不到足够的识别精度的问题。因此,存在为了得到正确的字符识别结果,必须再次拍摄识别对象的字符的课题。
在专利文献1中虽然记载有通过在用纸上记载的2个以上的标记来检测倾斜的技术,但是该技术必须在识别对象的用纸上预先印上或记入标记,在识别名片等时不实用。另外,当对已拍摄完的图像实施字符识别处理时,只要不是付出上述那样特别的注意拍摄的,就存在识别对象字符串在图像内倾斜的情况。这时,在实施字符识别处理前必须使用图像处理软件等进行图像的角度修正(第二课题)。
另外,当字符的记述方向有横写和竖写2种写法时,即使在调整图像的角度后抽取了识别对象字符串,在字符识别时也必须设定识别对象字符串是竖写还是横写。当取得名片等的图像并实施字符识别处理时,由于存在竖写和横写的格式,所以存在每次都必须设定识别模式的问题。另外,在报纸、杂志等竖写和横写字符串混合的文书中,切换字符的记述方向的负担也较大(第三课题)。
在利用带照相机的便携信息终端等的装置时,可以想见,经常会发生乘坐着交通工具的路上等,在很难以图像稳定的位置进行拍摄的环境下的利用。但是,现有技术中,如果识别对象字符串不是在相对于图像而言倾斜被抑制在很小范围的状态下被选择,就得不到足够的字符识别精度。因此,使用者在拍摄识别对象图像时,为了调整角度必须付出特别的注意(第四课题)。
再者,在带照相机的便携信息终端,当要使用字符识别的结果进行辞典检索或网络检索时,当是英语单词时,因为通过空格被分隔成了单词单位,所以选择检索对象的单词较容易。但是,如果要将同样的处理适用于日语,由于与英语的情况不同,不存在由单词间的空格这样的编排信息造成的分隔,所以使用者必须把检索对象的字符串一个字符一个字符地进行选择,指定负担较大(第五课题)。
发明内容
本发明的目的是:鉴于这些课题,提供减轻使用带照相机的便携信息终端拍摄字符识别对象物时的拍摄者负担,或者减轻将拍摄后的图像修正为对字符识别较佳的角度时的负担的系统或方法。
另外,本发明的目的还在于,提供当字符识别日语并进行辞典或网络检索时,可以减轻指定检索对象的字符串的使用者的负担的系统或方法。
为了解决上述第一课题,在信息终端装置的画面上显示把在识别对象字符串的图像内的倾斜程度实时地呈示给拍摄者的角度指示器。使用者一边看着角度指示器所显示的信息一边移动信息终端装置或识别对象物,通过在适当的位置进行拍摄,可以拍摄出适于字符识别处理的图像。
为了解决上述第二课题,提供在把拍摄完的图像进行旋转的同时,实时地实施可以成为识别对象的字符串的行抽取的功能。使用者通过简单的键操作等,在信息终端装置的画面上旋转拍摄完的图像,实时确认被行抽取的识别对象候选字符串。通过在所希望的识别对象字符串被抽取的时点,使用者停止旋转处理,当若干行被抽取时选择想识别的字符串实行识别处理,实现对已拍摄完的图像的字符识别处理的简便化。
为了解决上述第三课题,提供自动判定该识别对象字符串是竖写还是横写的功能。在该识别对象字符串方向的自动判定中,使用所抽取的识别对象字符串的外接矩形的纵横尺寸比。具体是,识别对象字符串的外接矩形的高和宽的比例与规定值进行比较后,判断是竖写字符串还是横写字符串并实施识别处理。当使用的便携终端装置的画面的方向可变时,也可以根据画面的方向,自动实施竖写/横写的切换。
为了解决上述第四课题,提供跟踪识别对象字符串的倾斜角度,自动生成用于选择识别对象字符的外接矩形的装置。具体是,使用例如特开平7-141465“文件图像的倾斜检测方法”的方法计测识别对象字符串的倾斜角度,制成旋转成使得识别对象字符串为横写时相对于图像是水平位置,为竖写时相对于图像是垂直位置的图像。其后,生成识别对象字符串的外接矩形,制成追加到该旋转后图像的旋转外接矩形图像。接着,旋转该旋转外接矩形图像,返回到原来的字符串的倾斜角度,在信息终端装置的显示装置进行显示。
为了解决上述第五课题,提供以下装置:即对字符识别日语后的结果进行语态素分析,自动生成检索对象的候选字符串,使用者分别选择这些候选或选择这些候选字符串的组合。
通过以在视觉上容易理解的方式来显示识别对象的图像的倾斜状态,能够让使用者明确认识到图像发生了倾斜,这样就容易以对字符识别处理来说适宜的角度来拍摄图像。
另外,关于过去所拍摄的图像,由于可以直接编辑倾斜的图像,并对其结果实施字符识别处理,因此不必再次进行拍摄。
另外,即使是在角度修正困难的情况下,因为可以在倾斜的状态下进行字符串的选择,所以对带有某种程度的倾斜的图像,也能够实行字符识别处理。
附图说明
图1是本发明实施例的便携信息终端的框图。
图2是本发明实施例的流程图。
图3是本发明实施例的流程图。
图4是本发明实施例的角度修正的说明图。
图5是本发明实施例的流程图。
图6是表示本发明实施例的画面的图示。
图7是本发明实施例的流程图。
图8是本发明实施例的字符串外接矩形生成方式的说明图。
图9是本发明实施例的便携信息终端的框图。
图10是本发明实施例的流程图。
图11是本发明实施例的矩形座标表的说明图。
图12是本发明实施例的检索候选字的选择方式说明图。
图13是本发明实施例的矩形座标表的说明图。
图14是本发明实施例的选择区域表的说明图。
图15是本发明实施例的矩形座标的说明图。
图16是说明本发明实施例的图示。
图17是本发明实施例的矩形座标表的说明图。
图18是说明本发明实施例的图示。
图19是说明本发明实施例的图示。
图20是本发明实施例的矩形座标表的说明图。
图21是说明本发明实施例的图示。
具体实施方式
使用图1~20说明本发明较佳的一种实施方式。本发明的字符识别方式可以适用于读取并识别名片等的便携信息系统等,例如可以适用于在移动电话上进行的字符识别功能。
图1是适用本发明的便携信息终端的框图的一个例子。本例中具有:便携信息终端主体100;把作为识别对象的名片以光学方式输入的照相机或扫描器等的图像输入装置110;显示识别对象的图像或字符识别结果、光标121等的CRT或液晶等的显示装置120;配置了使用者能够操作的按钮131等的输入装置130;为了进行便携信息终端整体的控制而安装在终端主体内的控制部140;以及进行字符行抽取151、字符识别处理152等的字符识别部150;具有字符行倾斜的定量化功能161以及图像旋转处理功能162的图像处理部160。
字符识别部150和图像处理部160可以是软件的功能,可以在与控制部140相同的电路上操作。输入装置可为按钮等的一般的设备,为了提高操作性能,显示装置120和输入装置130也可用触摸面板等显示装置兼输入装置来实现。
图2是实施适用了用于解决第一课题的装置的字符识别处理时的流程的一个例子(第一实施方式)。使用者一开始OCR功能,从图像输入装置110输入的动画图像就被显示在显示装置120(S201)上。字符识别部150立刻对图像显示装置120上所显示的有十字型等光标121的区域实行字符行抽取处理(S202),显示包围所抽取的字符行的外接矩形(S203)。
同时,通过图像处理部160定量化字符行的倾斜,并将该定量化的值用柱状图等的形式在角度指示器123上进行可视化(S204)。定量化的值不受限制,只要反映了字符行与图像的倾斜程度就可以,但是如果采用例如与字符行和图像端边形成的角度θ的倒数成比例的值,则在倾斜度小的时候就在角度指示器123上显示大的值,从而使用者可以凭直觉进行操作。
处理返回到步骤(S201),直到使用者按下(S205)拍摄按钮为止,重复进行下面(S201~S204)的处理,并持续更新画面显示。
使用者以角度指示器123为参考移动终端装置或识别对象物,在合适的位置按下拍摄按钮(S205)后实行图像拍摄(S206)。如果接着按下识别按钮(S207),则对在步骤(S203)所显示的外接矩形内的字符串实行字符识别处理210,并显示识别结果(S211)。
当按下拍摄按钮(S205)后,删除按钮被按下时(S208),就删除已拍摄的图像并返回到步骤(S201)。当除此之外的按钮被按下时,分别转入到必要的操作(S209)。
图3是实施适用了用于解决第二课题的装置的字符识别处理时的流程的一个例子(第二实施方式)。便携信息终端的使用者进行把以前所拍摄的静止图像装入的操作(S301)后,该静止图像就被显示在显示装置120(S302)。字符识别部150立即进行字符行抽取(S303)、外接矩形显示(S304)以及角度指示器显示(S305)。在该时点处理转入到使用者的键输入等待(S306)。
当使用者按下识别实行按钮(S307)时,立即对在步骤(S304)所显示的外接矩形的内部的字符串实行字符识别处理(S310),并显示字符识别结果(S311)。当使用者按下箭头按钮(S308)时,根据按下的按钮,将图像向左或向右方向旋转一定角度(S309)。这时,旋转的中心是字符行矩形的中心,但是也可以把由使用者指定的图像上的一点作为中心进行旋转处理。
当持续按住箭头按钮时,图像连续旋转,随之外接矩形显示也实时更新。考虑到使用者的使用方便,可以用停止箭头按钮按下的操作(从按钮把手指移开)来代行识别实行按钮按下的操作。
图4是在第一实施方式以及第二实施方式中显示部120所显示的图像的一个例子。在第一实施方式中是从图像输入装置110所输入的动画、在第二实施方式中是以前所拍摄的静止图像,作为图像400显示在显示部120。
图像400内的识别对象字符串401在该时点是倾斜的。在画面的中央显示有作为旋转中心的十字光标402。字符识别部150生成包围识别对象字符串401的外接矩形403,并显示在画面上。在角度指示器上显示有表示倾斜了的识别对象字符串401的倾斜程度的柱状图(404)。
通过在第一实施方式中旋转用手持的便携信息终端(照相机)(406),或通过在第二实施方式中操作箭头键(405)来旋转画面上所显示的图像。通过图像的旋转,随着识别对象字符串401的倾斜变小,外接矩形的形状也同步变化(407)。
另外,在角度指示器,把表示识别对象字符串401的倾斜变小的大值作为柱状图显示(408)。使用者通过反复进行图像的旋转操作,并在角度指示器显示的值变大的位置实行字符识别处理,可以得到精度高的字符识别结果。
图5是实施适用了用于解决第一课题的装置的字符识别处理时的流程的一个例子(第三实施方式)。因为步骤(S501~S506)与步骤(S201~S209)相同,所以省略说明。
在识别按钮被按下(S504)的时点,计算识别对象字符串的外接矩形的纵横尺寸比(高和宽的比率),与预先规定的值α进行比较(S507)。如果纵横尺寸比比规定值α大,则判断为竖写字符串,实施竖写字符串识别用的参数设定等(S510),并实施字符识别处理(S511),显示结果(S512)。
同样,如果纵横尺寸比与规定值α比较不比规定值α大,则继续将纵横尺寸比与规定值β进行比较(S508)。如果纵横尺寸比比规定值β小,则判断为横写字符串,实施横写字符串识别用的参数设定等(S509),并实施字符识别处理(S511),显示结果(S512)。纵横尺寸比如果在α以下且β以上的范围,则认为字符串未被充分修正角度,不转入识别处理。
图6是在第三实施方式中显示部120所显示的图像的一个例子。当为横写的字符串601时,外接矩形的高602比宽603小。如果将纵横尺寸比定义为外接矩形的高除以外接矩形的宽,则纵横尺寸比比1小时外接矩形为横长。
例如,当把与纵横尺寸比比较的规定值β设定为0.5时,如果在纵横尺寸比低于0.5的状态下起动字符识别,则自动实施作为横写字符串所必要的设定。同样,当为竖写字符串604时,外接矩形的高605宽606大。
在与上述相同的纵横尺寸比的定义下,则当纵横尺寸比比1大时,外接矩形为竖长。例如,当把与纵横尺寸比比较的规定值α设定为1.5时,如果在纵横尺寸比高于1.5的状态下起动字符识别,则自动实施作为竖写字符串所必要的设定。
图7是实施适用用于解决第四课题的装置的字符识别处理时的流程的一个例子(第四实施方式)。
字符识别对象图像从图像输入装置110被输入(S701)后,图像处理部160就立即计算对识别对象字符串的图像的角度(S702),对所输入的字符识别对象图像旋转修正该角度部分。关于修正方向,如果是横写字符串则相对于画面旋转为水平方向,如果是竖写字符串则相对于画面旋转为垂直方向。
接着,对该旋转后图像实施字符串抽取,在该旋转后图像上附加外接矩形(S704),将该图像保存到图像缓冲器。在图像缓冲器保存的图像可以是图像整体,也可以仅为附加的外接矩形内部。
接着,将该旋转后图像正好反转通过步骤(S702)检测出的角度部分,制成与原输入图像倾斜相同程度的图像,显示在终端装置的显示部120。使用者如果不进行任何操作,则返回步骤(S701),对新的输入图像重复进行步骤(S701~S707)的处理。
如果按下识别按钮,则读取在步骤(S705)存储入图像缓冲器的图像(S710),对该图像实行字符识别处理(S711),显示字符识别结果(S712)。
图8是在第四实施方式中处理的图像的状态的一个例子。从图像输入装置110所输入的识别对象图像801上的识别对象字符串802相对于画面是倾斜的状态。图像处理部160检测出该识别对象字符802与画面的边缘所成角度803,将图像正好旋转角度803,进行修正从而使得识别对象字符串相对于画面成为水平,制成旋转修正图像804。
对于旋转修正图像804上的识别对象字符串806,字符识别部150实施字符行抽取,并附加外接矩形。图像处理部160将该旋转修正图像804正好反转角度803,生成返回到与原识别对象图像801相同角度的图像807,显示在显示装置120。
上面的第一到第四实施方式可以分别个自实现,也可以用选择性地采用全部或一部分的形式来实现。
下面,使用图9至12对用于解决第五课题的第五实施方式进行说明。图9是适用了第五实施方式的便携信息终端的框图的一个例子。与图1的差异是追加了检索语抽取部170、电子辞典171。
图10是在图9的装置实施适用了用于解决第五课题的装置的字符识别、辞典检索处理时的流程的一个例子。字符识别对象图像从图像输入装置110输入(S1001)后,当图像处理部160对原图像实施适当的图像处理之后,通过字符识别部150的字符行抽取部151抽取字符行(S1002)。之后,对于所抽取的字符行,字符行识别部152按每1个字符分离出字符,并输出识别的结果(S1003)。在识别结果中包含有每1个字符的字符代码和与此对应的矩形坐标。
字符识别的结果被输入检索语候选抽取部170,通过语态素分析将连续的字符串分解为单词等的词素(S1004)。例如,当图9的便携信息终端的显示器显示的是“文法の知識を使ぅと”(“如果使用语法知识”)这样的字符串的时候,生成如图11所示那样的表1100。存储有通过语态素分析所分解的字符串和与此对应的矩形坐标。
使用表1100的数据,在便携信息终端的显示器上显示检索对象的候选字(S1005)。例如,比较光标的中心坐标与表1100的候选字矩形坐标,将包括光标的中心坐标的候选字的矩形坐标以如图12所示的形式在显示器上显示。
接着,通过按下光标移动键174或176,如1201那样移动检索对象字的矩形显示,在显示了想要检索的矩形时按下选择按钮175,决定检索对象字(S1006)。把所决定的检索对象字向电子辞典部171输出。在电子辞典部171,将所输入的检索对象字作为关键词检索电子辞典(S1007),并将检索结果显示在显示器上(S1008)。
虽然在本实施例中使用语态素分析生成了检索对象的候选字,但是,也可以是以下方法:即在识别结果的字符串中从“汉字”变为“平假名”等字符的类别变化的地方断开,来生成候选字的方法。或者可以结合字符类别与空格或字符大小的变化的场所等几何学的信息一起判断。
下面,使用图9、图10以及图13至15,对用于解决第五课题的第六实施方式进行说明。在本实施例中,涉及像“の文法知識を使ぅ”(“使用语法知识”)这样有由多个词素构成的汉字列的情形,假设光标位于“文法知識”(“语法知识”)字符串中的任意1个。
由于存在使用者仅想把如“文法”(“语法”)或“知識”(“知识”)那样的词素作为检索对象的情形和想检索“文法知識”(“语法知识”)这样的复合词整体的情形,因此下面说明减轻这些选择负担的处理。在第六实施方式中,因为与在图10的处理流程中不同的部分是候选字抽取(S1004)和候选字显示(S1005)、候选字选择(S1006),所以仅对该处理进行说明。
在候选字抽取(S1004)中,通过与第五实施例所示相同的处理,由语态素分析生成候选字,生成与此对应的如图13所示的矩形坐标表1300。接着,由表1300生成用于分别选择“文法”、“文法知識”、“知識”(“语法”、“语法知识”、“知识”)的区域坐标表1400。该表用于如果光标中心坐标进入该区域,则显示与其对应的候选字的矩形。
图15模式地表示出本表的矩形坐标的X坐标。与“文法”、“文法知識”、“知識”(“语法”、“语法知识”、“知识”)分别对应的选择区域是1500、1501、1502,根据光标的中心坐标被包含哪一个区域,从表1400中选择作为检索候选字显示的矩形坐标。然后将所选择的矩形坐标显示在显示器上(S1005)。
图16表示所显示的矩形的例子。(a)是光标位于“知識”(“知识”)的选择区域时的显示例,(b)是光标位于“文法知識”(“语法知识”)的选择区域时的显示例,(c)是光标位于“文法”(“语法”)的选择区域时的显示例。使用者当想要检索的候选字被显示时,按下选择键选择检索对象字(S1006)。本实施例对1个字符行内的字符串选择进行了说明,但是通过一并持有对最大限度的字符行的区域坐标表,可以进行涉及多个字符行的选择。
下面,使用图9、图10、图13、图17、图18,对用于解决第五课题的第七实施方式进行说明。与第六实施方式一样,涉及像“の文法知識を使ぅ”(“使用语法知识”)这样有由多个词素构成的汉字列的情形,假设光标位于“文法”(“语法”)部分的情形。另外,与第六实施方式一样,仅说明候选字抽取(S1004)和候选字显示(S1005)、候选字选择(S1006)部分。
在候选字抽取(S1004)中,通过与第五实施例所示相同的处理,由语态素分析生成候选字,生成与此对应的如图13所示的矩形坐标表1300。接着,从表1300生成分别与词素和其复合词对应的矩形坐标表1700(图17)。假设表以左上点坐标排序。
在候选字显示(S1005)中,如图18所示,最初显示光标的中心坐标被包含在其矩形区域的词素的矩形(1800)。接着,每次按下光标键176,显示出下面的被排序的表1700的矩形。使用者可以在想要检索的矩形被显示的时点按下选择键175,检索电子辞典(S1006)。
下面,使用图9、图10、图13、图19对用于解决第五课题的第八实施方式进行说明。与第六实施方式一样,涉及像“の文法知識を使ぅ”(“使用语法知识”)这样有由多个词素构成的汉字列的情形,假设光标位于“文法”(“语法”)部分的情形。另外,与第六实施方式一样,仅说明候选字抽取(S1004)和候选字显示(S1005)、候选字选择(S1006)部分。
在候选字抽取(S1004)中,通过与第五实施例所示相同的处理,由语态素分析生成候选字,生成与其对应的如图13所示的矩形坐标表1300。然后以如图19所示的1900的形式显示包含有光标中心坐标的候选字矩形(1005)。
在此,当想选择“文法知識”(“语法知识”)这样的复合词时,按下被赋予指定选择范围的起点的意思的“1”键后,按下光标移动键176,显示像1901那样的矩形。如果再一次按下光标移动键176,则像1902那样,选择区域被扩大。使用者在使用光标键显示出适当的检索对象字的时点,按下选择键175,选择检索对象字(S1006)。
下面,使用图9、图10、图20、图21对用于解决第五课题的第九实施方式进行说明。涉及像“の文法知識処理を”(“语法知识处理”)这样有由3个以上的词素构成的汉字列的情形,假设光标位于“知識”(“知识”)部分的情形。
当为由3个以上的词素构成的汉字列时,使用者通常或是考虑将汉字列整体作为检索对象,或是想仅检索包含有光标中心坐标的词素,选择这两种的频度较高。因此,下面说明减轻这些选择负担的处理。另外,与第六实施方式一样,仅说明候选字抽取(S1004)和候选字显示(S1005)、候选字选择(S1006)的部分。
在候选字抽取(S1004)中,在通过与第五实施例所示相同的处理,由语态素分析生成候选字的同时,生成存储与候选字对应的字符种类和矩形坐标的、如图20所示的表2000。在此所说的字符种类是,如果属于“汉字”就是“汉字”,如果属于“平假名”就是“平假名”这样的,意味着按字符种类分类的结果。然后,合并具有与包含有光标的中心坐标的候选字(词素)相同字符种类的候选字的矩形,并以如图21那样的形式显示(1005)。
在此,当不想选择汉字列整体而想仅选择“知識”(“知识”)这个候选字时,按下被赋予了切换选择模式的意思的“#”键,并显示像2101那样的矩形。再者,当想选择“知識処理”(“知识处理”)字符串时,在按下被赋予指定选择范围起点的意思的“1”键后,按下光标移动键176,显示2102那样的矩形。使用者使用这样的键操作,在显示适当的检索对象字的矩形的时点按下选择键175来选择检索对象字(S1006)。
在上述实施例中,作为字符种类仅举出“汉字”“平假名”,但是,另外也适用于“片假名”“英语”“数字”“符号”“外语”等分类字符种类的任意类别。另外,除字符种类之外,也可以使用该词素所属的品词。
另外,在上述实施例中,为了指定选择范围起点、或切换选择模式,而分别按下“1”、“#”,但是,只要是分配了相同意思的键,则可以分配任意的键。
再者,在本实施例子中,将十字标记的光标的中心坐标作为选择信息使用,但是,只要是给与同样效果的方法,则可以是别的信息。例如,可以将双括弧显示在显示器上,使用该括弧的中心坐标或使用双括弧的矩形坐标。另外,在日语的选择中,虽然对横写进行了说明,但是,同样也可以适用于竖写。
另外,上述实施例子可以分别各自实现,也可以用选择性地采用全部或一部分的形式来实现。

Claims (8)

1.一种便携终端,是具有:
拍摄图像的图像拍摄部、
从图像内抽取字符识别对象字符行的字符行抽取部、
识别图像内的字符的字符识别部、
旋转所述图像以修正倾斜的图像处理部、
用于显示成为识别对象的图像的图像显示部、和
控制终端整体的控制部的便携信息终端,其特征在于,
所述图像处理部将字符行的倾斜定量化,将其值显示在角度指示器上,
所述控制部对被判定为适宜角度的拍摄图像进行字符识别的控制。
2.根据权利要求1所述的便携终端,其特征在于,
根据所述抽取的字符行的外接矩形的纵横尺寸比,自动判断是横写还是竖写,并切换识别模式。
3.一种便携终端,是具有:
从拍摄完静止图像中抽取字符识别对象字符行的字符行抽取部、
识别该图像内的字符的字符识别部、
旋转该图像以修正倾斜的图像处理部、
用于显示成为识别对象的图像的图像显示部、和
控制终端整体的控制部的便携信息终端,其特征在于,
所述字符识别部具有识别竖写字符的模式和识别横写文字的模式,
所述控制部根据所述字符行抽取部抽取的字符行的外接矩形的纵横尺寸比,自动判断是横写还是竖写,并切换所述字符识别部的识别模式。
4.根据权利要求3所述的便携终端,其特征在于,
跟踪所述拍摄的图像内的字符串的倾斜,自动地生成并显示识别对象候选字符串的外接矩形。
5.一种便携终端中的字符识别方法,识别从拍摄的图像中抽取的字符识别对象字符行的字符,其特征在于,包括以下步骤:
拍摄图像的步骤、
从所述图像内抽取字符识别对象字符行的步骤、
旋转所述拍摄的图像以修正倾斜的步骤、
显示成为识别对象的图像的步骤、
把对于字符识别处理来说适宜的拍摄角度定量地显示给便携信息终端使用者的步骤、
根据所述显示的拍摄角度判定适宜角度的步骤、和
对于以所述判定的适宜角度拍摄的图像进行字符识别的步骤。
6.根据权利要求5所述的便携终端中的字符识别方法,其特征在于,
进行所述字符识别的步骤中进一步包括:
根据所抽取的字符行的外接矩形的纵横尺寸比,自动地判定是横写还是竖写的步骤;
基于所述判定结果切换识别模式的步骤。
7.一种便携终端中的字符识别方法,识别从拍摄完的图像中抽取的字符识别对象字符行的字符,其特征在于,包括以下步骤:
从所述图像内抽取字符识别对象字符行的步骤、
旋转所述图像以修正倾斜的步骤、
显示成为识别对象的图像的步骤、
进行所述拍摄完图像的旋转处理的步骤、
在进行所述旋转处理的同时抽取字符识别对象候选字符串的步骤、
从所述抽取的字符识别对象候选字符串中选择识别对象字符串的步骤、和
对于所述被选择的识别对象字符串进行字符识别的步骤,其中
进行所述字符识别的步骤包括:根据所抽取的字符行的外接矩形的纵横尺寸比,自动地判定是横写还是竖写的步骤;和基于所述判定结果切换识别模式的步骤。
8.根据权利要求7所述的便携终端中的字符识别方法,其特征在于,
从所述字符识别对象候选字符串中选择识别对象字符串的步骤中进一步包括:
跟踪拍摄完图像内的字符串的倾斜,自动地生成并显示识别对象候选字符串的外接矩形的步骤。
CNB2004100889727A 2003-11-10 2004-11-09 便携终端的字符识别中的处理对象选择方法及便携终端 Expired - Fee Related CN1292377C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003379288 2003-11-10
JP2003379288A JP4443194B2 (ja) 2003-11-10 2003-11-10 携帯端末の文字認識における処理対象選択方法および携帯端末

Publications (2)

Publication Number Publication Date
CN1617163A CN1617163A (zh) 2005-05-18
CN1292377C true CN1292377C (zh) 2006-12-27

Family

ID=34689385

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100889727A Expired - Fee Related CN1292377C (zh) 2003-11-10 2004-11-09 便携终端的字符识别中的处理对象选择方法及便携终端

Country Status (4)

Country Link
JP (1) JP4443194B2 (zh)
KR (1) KR100615058B1 (zh)
CN (1) CN1292377C (zh)
TW (1) TWI294100B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106325522A (zh) * 2016-09-05 2017-01-11 广东小天才科技有限公司 一种电子终端调节光标大小的方法和装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100754656B1 (ko) * 2005-06-20 2007-09-03 삼성전자주식회사 이미지와 관련한 정보를 사용자에게 제공하는 방법 및시스템과 이를 위한 이동통신단말기
WO2007029740A1 (ja) * 2005-09-09 2007-03-15 Canon Kabushiki Kaisha 撮像装置
JP4844142B2 (ja) * 2006-02-06 2011-12-28 セイコーエプソン株式会社 プリンタ
KR100641791B1 (ko) 2006-02-14 2006-11-02 (주)올라웍스 디지털 데이터에 대한 태깅 방법 및 시스템
US8208725B2 (en) 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8144989B2 (en) 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
CN101482924B (zh) * 2008-01-08 2012-01-04 华晶科技股份有限公司 名片显像角度自动辨正方法
JP2012008733A (ja) * 2010-06-23 2012-01-12 King Jim Co Ltd カード情報管理装置
KR101870773B1 (ko) * 2011-08-31 2018-06-26 삼성전자 주식회사 광학식 문자 판독기를 이용한 스케줄 관리 방법 및 장치
CN103377371A (zh) * 2012-04-25 2013-10-30 佳能株式会社 用于改善识别特征的方法和系统和光学字符识别系统
JP5940615B2 (ja) * 2014-09-09 2016-06-29 株式会社アイエスピー 携帯端末装置用のスキューロジック文字認識方法、プログラム及び携帯端末装置
JP6371662B2 (ja) * 2014-10-07 2018-08-08 富士通フロンテック株式会社 文字認識支援装置、文字認識支援プログラム及び文字認識支援方法
CN104461424B (zh) * 2014-12-01 2017-11-03 上海斐讯数据通信技术有限公司 一种在单元格中显示旋转字符串的系统及方法
KR101712391B1 (ko) 2015-06-22 2017-03-07 한국표준과학연구원 스마트폰을 기반으로 하는 현장용 그래프 수치 분석 어플리케이션 및 그를 이용한 수치 분석방법
KR102391068B1 (ko) * 2020-07-24 2022-04-28 엄춘호 문서 인식 시스템 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3281469B2 (ja) * 1993-11-18 2002-05-13 株式会社リコー 文書画像の傾き検出方法および装置
JPH11250179A (ja) * 1998-02-27 1999-09-17 Matsushita Joho System Kk 文字認識装置および文字認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106325522A (zh) * 2016-09-05 2017-01-11 广东小天才科技有限公司 一种电子终端调节光标大小的方法和装置

Also Published As

Publication number Publication date
JP4443194B2 (ja) 2010-03-31
CN1617163A (zh) 2005-05-18
JP2005141603A (ja) 2005-06-02
TW200516509A (en) 2005-05-16
TWI294100B (en) 2008-03-01
KR100615058B1 (ko) 2006-08-22
KR20050045832A (ko) 2005-05-17

Similar Documents

Publication Publication Date Title
CN1292377C (zh) 便携终端的字符识别中的处理对象选择方法及便携终端
CN101667251B (zh) 具备辅助定位功能的ocr识别方法和装置
US10248878B2 (en) Character input method and system as well as electronic device and keyboard thereof
JP6138305B2 (ja) コンテキスト情報を用いるカメラocr
CN1269014C (zh) 字符输入装置
KR101220709B1 (ko) 한글 및 한자가 혼용된 문서에 대한 전자 사전 검색 장치 및 방법
US9292739B1 (en) Automated recognition of text utilizing multiple images
CN100336375C (zh) 便携式终端装置和文字输入方法
CN1839396A (zh) 文档扫描仪
JPWO2007004519A1 (ja) 検索システム及び検索方法
JP2014102669A (ja) 情報処理装置、情報処理方法およびプログラム
CN101076166A (zh) 具有显示按钮的装置及用于所述装置的显示方法和介质
CN1926559A (zh) 移动通信系统、移动终端和固定站设备,字符识别设备、方法和程序
CN1940941A (zh) 图像分析装置和图像分析程序存储介质
KR100759165B1 (ko) 휴대단말, 휴대단말을 이용한 문자판독방법
KR20210086836A (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
CN1918570A (zh) 字符显示方法
CN110806407A (zh) 一种基于Labview的二维材料扫描和视觉处理系统及其方法
CN1860776A (zh) 用于投影尺寸可调整的图像的照相机、计算机、投影仪和图像处理
EP2428884A2 (en) Method, software, and apparatus for displaying data objects
CN110795918B (zh) 确定阅读位置的方法、装置及设备
CN1641686A (zh) 乱笔顺库建立方法及联机手写汉字识别评测系统
CN1755589A (zh) 基于按键和语音识别的文字输入方法及装置
CN1606030A (zh) 一种电子摄相翻译释义方法及其装置
CN1107280C (zh) 中英文表单的识别系统及识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061227

Termination date: 20131109