CN101599123B - 影像翻译装置与方法 - Google Patents
影像翻译装置与方法 Download PDFInfo
- Publication number
- CN101599123B CN101599123B CN2008100285674A CN200810028567A CN101599123B CN 101599123 B CN101599123 B CN 101599123B CN 2008100285674 A CN2008100285674 A CN 2008100285674A CN 200810028567 A CN200810028567 A CN 200810028567A CN 101599123 B CN101599123 B CN 101599123B
- Authority
- CN
- China
- Prior art keywords
- image
- literal
- language
- visible
- infrared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
一种影像翻译装置与方法,包含:一影像获取模块,用以获取可见光影像与红外线影像;一影像处理模块,比对可见光影像与红外线影像,而产生文字影像;一光学文字辨识(OCR)模块,辨识文字影像为属于第一语言的文字;一翻译模块,翻译文字为第二语言;一输出模块,输出翻译为第二语言的文字。
Description
【技术领域】
本发明是一种翻译装置与方法,特别是一种影像翻译装置与方法。
【背景技术】
翻译机对于语言学习上具有相当的帮助。而一般传统翻译机的使用方式乃是使用者透过键盘而输入欲查询的单字、词组或句子,然后等待翻译机运算处理后,即可于翻译机的屏幕上看到查询的结果。
传统的翻译机在使用上,须由使用者透过键盘逐字输入所欲查询的文字,最后才能得到翻译的结果。此种方式在使用上具有不便之处,例如:透过键盘逐字输入,将使得整体的查询速度较为缓慢;使用者需熟知所欲查询文字的输入方式,若是使用者欲查询本身不熟悉的文字,便无法正确的输入。尤其当所欲查询的文字数量较多时,更加突显传统上逐字输入的翻译机的不便之处。
因此,台湾专利申请案号86111096摄像式电子翻译机与台湾专利申请案号95110498影像辨识翻译装置及方法,提出利用镜头摄取影像后,翻译影像中的文字并显示翻译出的文字。如此,不仅可避免使用者因看不懂文字而无法查询的困扰,更可达到随拍即用而快速翻译的功能。
上述的现有专利,利用辨识影像中的文字,进而翻译影像中文字的作法,改善了传统上逐字输入的翻译方法。然而,却衍生了另一个问题,当文字所在的广告牌或是印刷品的背景其底色花样过于丰富或花俏时,对于文字辨识系统而言是一个难解的问题。也就是说,当所取得的影像的背景影像过于复杂时,将使得文字辨识的处理结果经常有效能不彰,而且准确性差的问题产生。所以,仍然无法有效的翻译出影像中的文字。
【发明内容】
本发明的主要目的在于提供一种可大幅提升影像中文字辨识的能力的影像翻译装置与方法。
本发明提出一种影像翻译装置,包含:一影像获取模块,用以获取可见光影像与红外线影像;一影像处理模块,比对可见光影像与红外线影像,而产生文字影像;一光学文字辨识(OCR)模块,辨识文字影像为属于第一语言的文字;一翻译模块,翻译文字为第二语言;一输出模块,输出翻译为第二语言的文字。
本发明亦提出一种影像翻译方法,包含下列步骤:获取可见光影像与红外线影像;比对可见光影像与红外线影像,而产生文字影像;辨识文字影像为属于第一语言的文字;翻译文字为第二语言;输出翻译为第二语言的文字。
与现有技术相比较,通过本发明所提出的装置或方法,可大幅提升影像中文字辨识的能力。因此,即使所获取的影像具有过于复杂的背景,或者是色彩丰富的彩色影像,透过本发明所提出的装置或方法,皆能有效辨识出影像中的文字,进而翻译成使用者所需的语言。
【附图说明】
图1为影像翻译装置的一实施例方块图。
图2为影像翻译的示意图(一)。
图3为影像翻译的示意图(二)。
图4为影像翻译的方法流程图。
【具体实施方式】
请参照图1,该图所示为影像翻译装置的一实施例方块图。影像翻译装置包含:影像获取模块10、影像处理模块20、光学文字辨识(OCR)模块30、翻译模块40、输出模块50。
影像获取模块10用以获取可见光影像与红外线影像。影像获取模块10可为一般的相机或摄影机等,由于相机、摄影机一般皆具有红外线滤光片(IR cutfilter),用以过滤红外线。因此,本发明提出于利用影像获取模块10获取同一影像时,同时获取可见光影像与红外线影像,作法可为获取可见光影像时,如一般获取影像的模式,也就是使用红外线滤光片;相对的,在获取红外线影像时,以不使用红外线滤光片,并视情况使用只让红外线通过的滤光片(IR passfilter)便可获取到红外线影像。或者,也可采用如红外线夜视功能的方式,获取红外线影像。
影像处理模块20比对可见光影像与红外线影像,进而产生文字影像。透过影像处理模块20而产生文字影像后,通过光学文字辨识(OCR)模块30,辨识文字影像为属于第一语言的文字。之后,便可由翻译模块40翻译属于第一语言的文字为第二语言,例如:将原本文字影像中属于日本语言的日文翻译为中文等。最后,由输出模块50输出翻译为第二语言的文字,以提供使用者参考。
本发明为了克服先前技术所提及,当文字所在广告牌或印刷品的背景其底色花样过于丰富,也就是说,所取得的影像的背景过于复杂时,无法有效辨识该文字的问题,因此本发明提出同时获取可见光影像与红外线影像的方式而加以改善。于此,文字影像所对应的实体物可包含一涂料,且该涂料为可见光不可穿透而红外线可穿透。其中,实体物可为招牌、菜单、站牌或运输工具时刻表等。
举例说明,一般游客到国外旅游,特别是自助旅行时,当在各个观光景点遇到看不懂的文字,便可通过本发明所提出的影像翻译装置,先获取影像,而所获取的影像为可见光影像与红外线影像。由于文字影像所对应的实体物(例如:招牌),具有可见光不可穿透而红外线可穿透的涂料,也就是说,使用此涂料所印刷的文字是人眼清楚可见,但红外线却可穿透。因此,如果采用一般摄影模式即可将文字影像正常拍摄下来,若采用红外线影像摄影模式却几乎看不见该文字影像的存在。因此,影像处理模块20比对影像获取模块10所获取的可见光影像与红外线影像两者间的差异,便可得到文字影像。
于此,为了提升文字影像的辨识效果,影像处理模块20可先将可见光影像与红外线影像转换为灰阶格式后,再进行比对的动作。影像处理模块20应用数字影像处理技术,对两张影像进行比对及过滤的演算,滤除比对后的可见光影像与红外线影像的背景,即可产生一张对应于所欲查询文字的文字影像。因此,即使可见光影像为背景复杂的彩色影像,也可清楚获得文字影像,如此对于后续的文字辨识上,将大幅提升效能及准确性。
由上述说明可知,本发明实际使用的一实施例,可在观光景点、交通设施、餐饮店等设置时,便将招牌、站牌、运输工具时刻表或菜单等,用可见光不可穿透而红外线可穿透的涂料加以印刷。而观光客便可透过本发明所提出的装置或方法,迅速获取影像而翻译出所熟悉的文字,如此将提升外国观光客旅游时的便利性,进而提升观光旅游的质量。
上述的影像翻译装置可选自手机、个人数字助理(PDA)、智能电话(smartphone)或摄影机等,只要具有摄影功能的电子装置,即属于本发明的范畴。
请同时参照图2与图3分别为影像翻译的示意图(一)与(二),说明输出模块50的其中一种输出方式。输出模块50可显示第二语言的文字于可见光影像上。由图2与图3所示,左半边为可见光影像,图中的第一语言的文字为日本语言的日文字,经由影像翻译后,输出模块50在可见光影像上显示翻译为第二语言的文字,也就是中文,如图中右半边所示。如此,可让使用者清楚得知翻译后的结果。当然,输出模块50也可单纯显示第二语言的文字,也就是只显示翻译后的中文予使用者参考,或者通过语音拨放第二语言的文字,而让使用者得知翻译的结果。
请参照图4,该图所示为影像翻译的方法流程图,包含下列步骤。
步骤S10:获取可见光影像与红外线影像。其中,可见光影像可为彩色影像。
步骤S20:比对可见光影像与红外线影像,而产生文字影像。其中,文字影像所对应的实体物包含一涂料,且该涂料为可见光不可穿透而红外线可穿透。而该实体物可选自招牌、菜单、站牌、运输工具时刻表及其组合所构成的群组。
在步骤S20的比对步骤之前,可包含下列步骤:灰阶化可见光影像与红外线影像,之后再进行比对的动作。此外,比对步骤也可包含下列步骤:滤除比对后的可见光影像与红外线影像的背景。
步骤S30:辨识文字影像为属于第一语言的文字。
步骤S40:翻译文字为第二语言。
步骤S50:输出翻译为第二语言的文字。其中,输出的步骤可包含下列步骤:显示第二语言的文字于可见光影像上。或者,单纯显示第二语言的文字。又或者,语音拨放第二语言的文字。
Claims (15)
1.一种影像翻译装置,其特征在于包含:
一影像获取模块,用以获取一可见光影像与一红外线影像;
一影像处理模块,比对该可见光影像与该红外线影像两者间的差异,并对该可见光影像与该红外线影像两者进行比对及过滤演算,滤除比对后的可见光影像与红外线影像的背景,即可产生一张对应于所欲查询文字的文字影像,文字影像所对应的一实体物包含一涂料,且该涂料为可见光不可穿透而红外线可穿透;
一光学文字辨识模块,辨识该文字影像为属于一第一语言的一文字;
一翻译模块,翻译该文字为一第二语言;及
一输出模块,输出翻译为该第二语言的该文字。
2.根据权利要求1所述的影像翻译装置,其中该实体物选自招牌、菜单、站牌、运输工具时刻表及其组合所构成的群组。
3.根据权利要求1所述的影像翻译装置,其特征在于:该影像处理模块先将该可见光影像与该红外线影像灰阶化后再进行比对。
4.根据权利要求1所述的影像翻译装置,其特征在于:该可见光影像为一彩色影像。
5.根据权利要求1所述的影像翻译装置,其特征在于:该输出模块显示该第二语言的该文字于该可见光影像上。
6.根据权利要求1所述的影像翻译装置,其特征在于:该输出模块单纯显示该第二语言的该文字。
7.根据权利要求1所述的影像翻译装置,其特征在于:该输出模块语音拨放该第二语言的该文字。
8.根据权利要求1所述的影像翻译装置,其特征在于:该影像翻译装置选自手机、个人数字助理、智能电话、摄影机及其组合所构成的群组。
9.一种影像翻译方法,其特征在于包含下列步骤:
获取一可见光影像与一红外线影像;
比对该可见光影像与该红外线影像两者间的差异,并对该可见光影像与该红外线影像两者进行比对及过滤演算,滤除比对后的可见光影像与红外线影像的背景,即可产生一张对应于所欲查询文字的文字影像,文字影像所对应的一实体物包含一涂料,且该涂料为可见光不可穿透而红外线可穿透;
辨识该文字影像为属于一第一语言的一文字;
翻译该文字为一第二语言;及
输出翻译为该第二语言的该文字。
10.根据权利要求9所述的影像翻译方法,其特征在于:该实体物选自招牌、菜单、站牌、运输工具时刻表及其组合所构成的群组。
11.根据权利要求9所述的影像翻译方法,其特征在于:该可见光影像为一彩色影像。
12.根据权利要求9所述的影像翻译方法,其特征在于:该输出的步骤,包含下列步骤:显示该第二语言的该文字于该可见光影像上。
13.根据权利要求9所述的影像翻译方法,其特征在于:该输出的步骤,包含下列步骤:单纯显示该第二语言的该文字。
14.根据权利要求9所述的影像翻译方法,其特征在于:该输出的步骤,包含下列步骤:语音拨放该第二语言的该文字。
15.根据权利要求9所述的影像翻译方法,其特征在于:在该比对步骤之前,更包含下列步骤:灰阶化该可见光影像与该红外线影像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100285674A CN101599123B (zh) | 2008-06-06 | 2008-06-06 | 影像翻译装置与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100285674A CN101599123B (zh) | 2008-06-06 | 2008-06-06 | 影像翻译装置与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101599123A CN101599123A (zh) | 2009-12-09 |
CN101599123B true CN101599123B (zh) | 2012-11-21 |
Family
ID=41420564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100285674A Expired - Fee Related CN101599123B (zh) | 2008-06-06 | 2008-06-06 | 影像翻译装置与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101599123B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186593A (zh) * | 2011-12-30 | 2013-07-03 | 牟颖 | 一种通过手机快速获取电器产品质量认证信息的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1622118A (zh) * | 2003-11-24 | 2005-06-01 | 顺德市顺达电脑厂有限公司 | 结合影像转换与文字翻译之文件输入处理方法 |
CN2760676Y (zh) * | 2003-08-13 | 2006-02-22 | 林明 | 证件信息采集仪 |
-
2008
- 2008-06-06 CN CN2008100285674A patent/CN101599123B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2760676Y (zh) * | 2003-08-13 | 2006-02-22 | 林明 | 证件信息采集仪 |
CN1622118A (zh) * | 2003-11-24 | 2005-06-01 | 顺德市顺达电脑厂有限公司 | 结合影像转换与文字翻译之文件输入处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101599123A (zh) | 2009-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103617422B (zh) | 一种基于名片识别的社交关系管理方法 | |
CN104880835A (zh) | 智能眼镜 | |
CN100570632C (zh) | 机读信息卡或机读试卷的信息识别方法 | |
CN102236986A (zh) | 手语翻译系统、手语翻译装置及手语翻译方法 | |
US20090198486A1 (en) | Handheld electronic apparatus with translation function and translation method using the same | |
CN102956132A (zh) | 手语翻译系统、手语翻译装置及手语翻译方法 | |
WO2016065661A1 (zh) | 一种四维码、基于该四维码的图像识别系统及方法、检索系统及方法 | |
US8532389B2 (en) | Method for image analysis, especially for mobile stations | |
Karthik et al. | Voice assistance for visually impaired people | |
CN1758671A (zh) | 具有把拍摄文字转换为语音功能的移动通信终端及其方法 | |
WO2002017166A3 (en) | System and method for automatic preparation and searching of scanned documents | |
CN101465965B (zh) | 小型化投影图案装置及内嵌该小型化投影图案装置的手机 | |
CN101751512A (zh) | 应用于通讯装置的食谱管理系统及方法 | |
CN101599123B (zh) | 影像翻译装置与方法 | |
CN104142955A (zh) | 一种推荐学习课程的方法和终端 | |
CN205540812U (zh) | 一种具有英文识别功能的多用途笔 | |
CN101127036A (zh) | 影像识别翻译装置及方法 | |
Bao et al. | Real-time display camera communication system based on LED displays and smartphones | |
CN108886575B (zh) | 图像处理装置、图像处理系统及图像处理方法 | |
TWM457241U (zh) | 結合擴增實境的圖像文字辨識系統 | |
CN1459073A (zh) | 识别并处理数字图像中的命令的方法和装置,其中用户通过例如将其环绕而标记命令 | |
Lakshmi | Design and Implementation of Text to Speech conversion using Raspberry pi | |
CN103700289A (zh) | 一种扫描查询方法及其装置 | |
CN2634766Y (zh) | 一种手机的文字扫描识别装置 | |
JP2012049860A (ja) | 画像処理装置、画像処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121121 Termination date: 20160606 |