CN102023971A - 用于移动装置的用户交互式自动翻译装置和方法 - Google Patents

用于移动装置的用户交互式自动翻译装置和方法 Download PDF

Info

Publication number
CN102023971A
CN102023971A CN2009102618934A CN200910261893A CN102023971A CN 102023971 A CN102023971 A CN 102023971A CN 2009102618934 A CN2009102618934 A CN 2009102618934A CN 200910261893 A CN200910261893 A CN 200910261893A CN 102023971 A CN102023971 A CN 102023971A
Authority
CN
China
Prior art keywords
user
text string
automatic
character
interactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009102618934A
Other languages
English (en)
Inventor
李起荣
权五郁
崔承权
卢玧亨
金昌显
徐英爱
梁成一
金云
黄金霞
吴英顺
朴殷珍
金永吉
朴相奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN102023971A publication Critical patent/CN102023971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

一种用于移动装置的用户交互式自动翻译装置,包括:相机图像控制器,用于将相机捕获的图像转换为数字图像;图像字符识别控制器,用于用户交互式地从数字图像中选择要翻译的字符串区域,基于光学字符读取器(OCR)功能和字符识别信息来对所选择的字符串区域执行字符识别功能,以生成文本串,并且用户交互式地纠正包括在文本串中的错误。此外,所述用户交互式自动翻译装置包括:文本传送控制器,用于传送所述纠错后的文本串;以及自动翻译控制器,用于从文本传送控制器接收所述纠错后的文本串,基于目标语言的语法来对所述文本串执行语素分析、标记、结构分析、结构转换、和词汇转换,以生成文本串的翻译。

Description

用于移动装置的用户交互式自动翻译装置和方法
相关申请的交叉引用
本发明要求2009年9月11日提交的韩国专利申请第10-2009-0086064号的优先权权益,通过参考将其合并于此。
技术领域
本发明涉及一种用于移动装置的用户交互式自动翻译装置和方法;并且更具体地,涉及如下的用于移动装置的用户交互式自动翻译装置和方法,其能够通过与用户的交互、以增强的翻译准确度,来实现在由包括在移动装置(例如,蜂窝电话、PDA、PDP等)的相机所捕获的图像中所包括的单词或句子的高质量自动翻译。
背景技术
自动翻译装置的性能已经逐步改善,然而,自动翻译装置的翻译结果仍旧包含大量的错误或误差。用于执行基于规则的翻译或基于模式(pattern)的翻译的自动翻译装置具体地表现了具有不自然或不合语法的句子的令人不满意的翻译结果。
这些错误中的一些可通过改善包括在翻译引擎中的单独的模块来解决,然而,因为单独模块不将句子作为整体来考虑,所以错误仍有可能发生。因此,需要用于自动纠正发生在最终翻译中的错误的功能,来升级自动翻译装置的性能。
此外,大多数自动翻译装置主要用于桌面计算机或服务器。这些类型的自动翻译装置通常对已经数字化的文本文件、网页文档、PDF文件等执行自动翻译。
然而,存在需要翻译的各类离线文本,例如,餐馆的菜单、大街上的指示牌(sign board)、硬拷贝文档等。
传统上,已经存在了用于移动装置的自动翻译装置,其包括字符识别模块来提供自动翻译功能。
然而,由于字符识别技术的限制而导致传统的自动翻译装置具有翻译质量差的缺点。
发明内容
鉴于上面所述,本发明提供了一种用于具有相机的移动装置的用户交互式自动翻译装置和方法。根据本发明,用户可使用用户接口而在由具有相机的移动装置所捕获的静止图像中选择要自动翻译的字符串区域。然后,所选择的字符串区域经历字符识别处理以被转换为数字文本串。相应地,可通过用户反馈来直接纠正发生在字符识别处理中的错误,以生成纠错后的文本串,其又被自动翻译。
根据本发明的第一方面,提供了一种用于移动装置的用户交互式自动翻译装置,包括:相机图像控制器,用于将相机捕获的图像转换为数字图像;图像字符识别控制器,用于用户交互式地从数字图像中选择要翻译的字符串区域,基于光学字符读取器(OCR)功能和存储在字符识别信息DB中的字符识别信息,来对所选择的字符串区域执行字符识别功能,以生成文本串,并且用户交互式地纠正包括在文本串中的错误;文本传送控制器,用于传送所述纠错后的文本串;以及自动翻译控制器,用于从文本传送控制器接收所述纠错后的文本串,基于目标语言的语法来对所述文本串执行语素分析、标记、结构分析、结构转换、和词汇转换,以生成文本串的翻译,其中基于存储在自动翻译信息DB中的用于翻译的信息来执行所述语素分析、标记、结构分析、结构转换、词汇转换、和翻译生成。
根据本发明的第二方面,提供了一种用于移动装置的用户交互式自动翻译方法,包括:使用相机来捕获对象的图像;将对象的图像转换为数字图像;用户交互式地从数字图像中选择要翻译的字符串区域;基于光学字符读取器(OCR)和存储在字符识别信息DB中的字符识别信息,来对所选择的字符串区域执行字符识别,以生成文本串;用户交互式地纠正包括在文本串中的错误;以及基于目标语言的语法来对纠错后的文本串执行语素分析、标记、结构分析、结构转换、和词汇转换,以生成文本串的翻译,其中基于存储在自动翻译信息DB中的用于翻译的信息来执行所述语素分析、标记、结构分析、结构转换、词汇转换、和翻译生成。
根据本发明的实施例,用户可使用用户接口来在由具有相机的移动装置捕获的静止图像中选择要自动翻译的字符串区域。然后,所选择的字符串区域经历字符识别处理以被转换为数字文本串。可通过用户反馈来直接纠正发生在字符识别处理中的错误,以生成纠错后的文本串,其被依次自动翻译。相应地,可能解决表现了由于不准确的字符识别而导致的低质量自动翻译的传统问题。
此外,用户可能使用便携式移动装置在全国和全球的任何地方方便地执行诸如餐馆的菜单、交通指示、各种外国书籍、外国品牌产品的手册等翻译对象的高质量自动翻译。此外,可能通过与用户的交互以最小化字符识别错误,来实现高质量的自动翻译。
附图说明
根据结合附图给出的以下的实施例描述,本发明的目的和特征将变明显,其中:
图1是根据本发明的实施例的用于移动装置的用户交互式自动翻译装置的框图;
图2是图示了图1的图像字符识别控制器的详细框图;
图3是图示了图1的自动翻译控制器的详细框图;
图4是图示了根据本发明的实施例的字符识别错误显示窗口的视图;以及
图5A到图5C是依次图示了根据本发明的实施例的用于移动装置的用户交互式自动翻译方法的流程图。
具体实施方式
下文中,将参考形成本发明的一部分的附图来详细描述本发明的实施例。
图1是根据本发明的实施例的用于移动装置的用户交互式自动翻译装置100的框图。所述用户交互式自动翻译装置100包括:相机图像控制器101、图像字符识别控制器103、文本传送控制器105、和自动翻译控制器107。
所述相机图像控制器101对由相机S1(例如,嵌入在移动装置中的相机)捕获的对象的图像进行数字化,以生成例如数字静止图像的数字图像,并将所述数字图像供应到图像字符识别控制器103。
如图2中所示,图像字符识别控制器103包括:区域选择用户接口单元1031、字符识别单元1033、文本转换单元1035、基于用户交互的识别纠错单元1037、和字符识别信息数据库(DB)1039。
区域选择用户接口单元1031向用户提供用户接口,用户可以利用该用户接口而从供应自相机图像控制器101的数字图像中选择要自动翻译的字符串区域。响应于用户通过矩形区域选择工具来选择字符串区域,区域选择用户接口单元1031将所选择的字符串区域提供给字符识别单元1033。
字符识别单元1033基于光学字符读取器(OCR)的功能和存储在字符识别信息DB 1039中的用于字符识别的信息,来对从区域选择用户接口单元1031供应的字符串执行特性识别。然后,字符识别单元1033将作为结果的字符串供应到文本转换单元1035。
文本转换单元1035基于美国信息交换标准代码(ASCII)来将字符串转换为标准文本字符串,并将所述标准文本串供应给基于用户交互的识别纠错单元1037。
这里,来自文本转换单元1035的基于ASCII的标准文本串可以是可光学识别的标准文本串。基于用户交互的识别纠错单元1037在用户接口(UI)上显示用于包括在该文本串中的每个词语的识别候选者,从而用户自己可纠正当识别该文本串时可发生的错误。用户可利用各种输入工具(例如,移动装置上的数字笔、键盘等)来直接纠正包括在该文本串中的错误。基于用户交互的识别纠错单元1037从用户接收纠正后的文本串,并将它供应给文本传送控制器105。
字符识别信息DB 1039存储为了字符识别而预设的各类信息。
文本传送控制器105向自动翻译控制器107供应从基于用户交互的识别纠错单元1037供应的纠正后的文本串。
如图3中所示,自动翻译控制器107包括:句子识别预处理单元1071、源语言语素分析和标记单元1073、源语言结构分析单元1075、源语言/目标语言转换单元1077、目标语言生成单元1079、和自动翻译信息DB 1081。
句子识别预处理单元1071逐句地识别从文本传送控制器105供应的纠正后的文本串,并将逐句识别的文本串供应到源语言语素分析和标记单元1073。所述句子识别预处理单元1071可从文本串中分出OCR不能处理的句子。
源语言语素分析和标记单元1073基于存储在自动翻译信息DB 1081中的源语言语素分析词典、概率词典、和上下文概率数据,来分析从句子识别预处理单元1071供应的文本串的源语言语素;以诸如三字母组(trigram)或隐藏的马尔可夫模型(HMM:hidden markov model)之类的各种方法学来对结果执行标记,以将包括在文本串中的每个词汇恢复为其原始形式;将适合于上下文的最佳言语部分应用于恢复后的文本串,以提供作为结果的文本到源语言结构分析单元1075。
源语言结构分析单元1075基于存储在自动翻译信息DB 1081中的结构分析规则和翻译模式,来分析在从源语言语素分析和标记单元1073供应的文本串的每个句子中包括的词汇的语法相关性和修改结构,以提供作为结果的文本串给源语言/目标语言转换单元1077。
所述源语言/目标语言转换单元1077基于存储在自动翻译信息DB 1081中的翻译词典、翻译模式、和翻译存储(memory)等,来对从源语言结构分析单元1075供应的文本串执行源语言到目标语言的转换。此外,源语言/目标语言转换单元1077将源语言的词汇转换为目标语言的词汇,并将结构转换后且词汇转换后的文本串供应到目标语言生成单元1079。
目标语言生成单元1079对从源语言/目标语言转换单元1077供应的文本串执行诸如词尾变化(inflection)处理之类的处理,以适合于目标语言的语法,从而生成最终的翻译。
自动翻译信息DB 1081存储源语言语素分析词典、概率词典、上下文概率数据、结构分析规则、翻译模式、翻译词典、翻译模式、翻译存储等。
根据本发明的实施例,用户可使用用户接口而在由具有相机的移动装置所捕获的静止图像中选择要自动翻译的字符串区域。所选择的字符串区域经历字符识别处理以被转换为数字文本串。然后,发生在字符识别处理中的错误可直接通过用户反馈来纠正,以生成纠错后的文本串,其被依次自动翻译。相应地,可能解决表现了由于不准确字符识别而导致的低质量自动翻译的传统问题。
现在,将根据本发明的实施例,来描述在如上所述配置的移动装置中执行的用户交互式自动翻译方法。
图5A到图5C是依次图示了根据本发明的实施例的在移动装置中执行的用户交互式自动翻译方法的流程图。
首先,通过相机S 1(例如,在包括在用户交互式自动翻译装置100中的移动装置中包括的内部相机),来捕获对象的图像(S501)。
然后,相机图像控制器101在步骤S503中从相机S1接收对象的图像,在步骤S505中生成数字图像,并在步骤S507中将所生成的数字图像(例如,数字静止图像)供应到包括在图像字符识别控制器103中的区域选择用户接口单元1031。
区域选择用户接口单元1031在步骤S509中向用户提供用户接口功能,用户可利用该用户接口功能来从供应自相机图像控制器101的数字图像中选择要自动翻译的字符串区域。
用户使用矩形选择工具来选择经受自动翻译处理的字符串区域。区域选择用户接口单元1031在步骤S511中接收用户选择的字符串区域,以便在步骤S513中将它提供给字符识别单元1033。
在步骤S515中,字符识别单元1033基于OCR功能和在字符识别信息DB 1039中存储的用于字符识别的信息,来对从区域选择用户接口单元1031供应的字符串执行特性识别。然后,字符识别单元1033在步骤S517中将字符识别后的字符串提供给文本转换单元1035。
文本转换单元1035在步骤S519中将该字符串转换为基于ASCII的标准文本字符串,并在步骤S521中将标准文本串供应到基于用户交互的识别纠错单元1037。
文本转换单元1035不仅可以对由字符识别单元1033识别的字符串中的最优单词识别候选者(即,图4中的401)执行文本转换处理,而且可以对包括在每个最优单词识别候选者中的每个单词的识别候选者(即,图4中的402)执行文本转换处理。
这里,来自文本转换单元1035的基于ASCII的标准文本串可以是可最优地识别的标准文本串。在步骤S523中,基于用户交互的识别纠错单元1037在UI上显示用于包括在该文本串中的每个单词的识别候选者,从而用户自己可纠正当识别文本串时可能发生的错误。
用户可利用各种输入工具(例如,移动装置上的数字笔、键盘等),来直接纠正包括在文本串中的错误。基于用户交互的识别纠错单元1037在步骤S525中从用户接收纠正后的文本串,并在步骤S527中将纠正后的文本串提供给文本传送控制器105。
例如,用户可以在如图4所示的字符识别错误显示屏幕上执行纠错处理。
更具体地,如图4中所示,在字符识别错误显示屏幕上显示用于通过文本转换单元1035转换的基于ASCII的标准文本串的最优单词识别候选者401。此外,用于每个最优单词识别候选者401的识别候选者402也按照从高权重值到低权重值的顺序向下显示在字符识别错误显示屏幕上,其中每个识别候选者402被封入矩形中。此时,在其中最优单词识别候选者401之中的例如“单词1”处于识别错误的情况下,用户可触摸或点击用于单词1的识别候选者之一(例如,“候选者1-2”),以纠正字符识别的错误。
字符识别错误显示屏幕提供输入单元403(例如,小键盘(key pad))和输入窗口404,如图4中所示。相应地,在其中错误的单词不属于在字符识别错误显示屏幕中出现的识别候选者的情况下,用户可利用输入单元403录入单词,同时通过输入窗口404识别所录入的单词,从而纠正字符识别错误。
在步骤S529中,文本传送控制器105将供应自基于用户交互的识别纠错单元1037的纠正后的文本串提供给包括在自动翻译控制器107中的句子识别预处理单元1071。
句子识别预处理单元1071在步骤S531中逐句地识别从文本传送控制器105提供的纠正后的文本串,并在步骤S533中将逐句识别的文本串提供给源语言语素分析和标记单元1073。
源语言语素分析和标记单元1073基于在自动翻译信息DB 1081中存储的源语言语素分析词典、概率词典、上下文概率数据等,来分析从句子识别预处理单元1071提供的文本串的源语言语素;在步骤S535中以诸如三字母组或隐藏的马尔可夫模型(HMM)等之类的各种方法学来对结果执行标记,以将包括在文本串中的每个词汇恢复为其原始形式;将适合于上下文的最佳言语部分应用于作为结果的文本串;并且在步骤S537中提供作为结果的文本到源语言结构分析单元1075。
源语言结构分析单元1075在步骤S539中基于存储在自动翻译信息DB1081中的结构分析规则和翻译模式,来分析在从源语言语素分析和标记单元1073提供的文本串的每个句子中包括的词汇的语法相关性和修改结构;并且在步骤S541中提供作为结果的文本串给源语言/目标语言转换单元1077。
所述源语言/目标语言转换单元1077基于存储在自动翻译信息DB 1081中的翻译词典、翻译模式、和翻译存储,来对从源语言结构分析单元1075提供的文本串执行源语言到目标语言的转换。此外,源语言/目标语言转换单元1077在步骤S543中将源语言的词汇转换为目标语言的词汇,并在步骤S545中将作为结果的文本串提供到目标语言生成单元1079。
在步骤S547中,目标语言生成单元1079对从源语言/目标语言转换单元1077供应的文本串执行诸如词尾变化处理之类的处理,以适合于目标语言的语法,从而生成最终的翻译。
根据本发明的实施例的用户交互式自动翻译方法可实现为存储在计算机可读存储介质中的计算机可执行代码或程序。
计算机可读存储介质包括用于存储可由计算机系统读取的数据的所有类型的存储装置。
计算机可读存储介质的示例包括:ROM、RAM、CD-ROM、磁带、软盘、光学数据存储器等。此外,计算机可执行代码或程序可以在包括因特网的网络上传送,并且分布式地在经由网络而互连的多个计算机系统中执行。
尽管已经结合实施例而示出并描述了本发明,但是本领域的技术人员将理解,可以进行各种改变和修改,而不脱离由下面的权利要求所限定的本发明的范围。

Claims (20)

1.一种用于移动装置的用户交互式自动翻译装置,包括:
相机图像控制器,用于将相机捕获的图像转换为数字图像;
图像字符识别控制器,用于用户交互式地从数字图像中选择要翻译的字符串区域,基于光学字符读取器(OCR)功能和存储在字符识别信息DB中的字符识别信息,来对所选择的字符串区域执行字符识别功能,以生成文本串,并且用户交互式地纠正包括在文本串中的错误;
文本传送控制器,用于传送所述纠错后的文本串;以及
自动翻译控制器,用于从文本传送控制器接收所述纠错后的文本串,基于目标语言的语法来对所述文本串执行语素分析、标记、结构分析、结构转换、和词汇转换,以生成文本串的翻译,其中基于存储在自动翻译信息DB中的用于翻译的信息来执行所述语素分析、标记、结构分析、结构转换、词汇转换、和翻译生成。
2.根据权利要求1的用于移动装置的用户交互式自动翻译装置,其中所述图像字符识别控制器包括:
区域选择用户接口单元,用于向用户提供接口,使得用户从数字图像中选择字符串区域,并接收用户选择的字符串区域;
字符识别单元,用于基于OCR功能和存储在字符识别信息DB中的字符识别信息来对所接收的字符串区域执行字符识别功能;
文本转换单元,用于将字符识别后的字符串转换为标准文本串;以及
基于用户交互的识别纠错单元,用于通过用户接口而在显示窗口上显示所述标准文本串,以通过用户接口来接收纠错后的文本串。
3.根据权利要求2的用于移动装置的用户交互式自动翻译装置,其中所述基于用户交互的识别纠错单元显示用于标准文本串的最优单词识别候选者和用于每个最优单词识别候选者的识别候选者,使得按照从高权重值到低权重值的顺序在最优单词识别候选者下方、向下显示所述识别候选者,每个识别候选者被封入矩形中,并且,当通过用户接口来点击与错误的最优单词识别候选者相关联的识别候选者之一时,用点击的识别候选者来代替错误的最优单词识别候选者,以纠正字符识别的错误。
4.根据权利要求3的用于移动装置的用户交互式自动翻译装置,当不存在与错误的最优单词识别候选者相关联的识别候选者时,所述基于用户交互的识别纠错单元用由用户录入的单词或字符来代替错误的最优单词识别候选者,以纠正字符识别的错误。
5.根据权利要求2的用于移动装置的用户交互式自动翻译装置,其中文本转换单元将用于字符串的最优单词识别候选者和用于最优单词识别候选者的识别候选者转换为文本。
6.根据权利要求1的用于移动装置的用户交互式自动翻译装置,其中所述自动翻译控制器包括:
句子识别预处理单元,用于逐句地识别文本串;
源语言语素分析和标记单元,用于基于存储在自动翻译信息DB中的第一自动翻译信息来分析逐句识别的文本串的源语言语素,对结果执行标记,并将包括在所述文本串中的每个词汇恢复为其原始形式,以将言语的部分应用于所恢复的文本串;
源语言结构分析单元,用于基于存储在自动翻译信息DB中的第二自动翻译信息来分析在所恢复的文本串的每个句子中包括的词汇的语法相关性和修改结构;
源语言/目标语言转换单元,用于基于存储在自动翻译信息DB中的第三自动翻译信息来对分析后的文本串执行源语言到目标语言的转换,以将源语言的词汇转换为目标语言的词汇;以及
目标语言生成单元,用于将目标语言的语法应用于结构转换后且词汇转换后的文本串,以生成翻译。
7.根据权利要求6的用于移动装置的用户交互式自动翻译装置,其中所述句子识别预处理单元基于OCR对传送的文本串执行句子分离功能。
8.根据权利要求6的用于移动装置的用户交互式自动翻译装置,其中所述第一自动翻译信息包括源语言语素分析词典、概率词典、和上下文概率数据。
9.根据权利要求6的用于移动装置的用户交互式自动翻译装置,其中所述第二自动翻译信息包括结构分析规则和翻译模式。
10.根据权利要求6的用于移动装置的用户交互式自动翻译装置,其中所述第三自动翻译信息包括翻译词典、翻译模式和翻译存储。
11.一种用于移动装置的用户交互式自动翻译方法,包括:
使用相机来捕获对象的图像;
将对象的图像转换为数字图像;
用户交互式地从数字图像中选择要翻译的字符串区域;
基于光学字符读取器(OCR)和存储在字符识别信息DB中的字符识别信息,来对所选择的字符串区域执行字符识别,以生成文本串;
用户交互式地纠正包括在文本串中的错误;以及
基于目标语言的语法来对纠错后的文本串执行语素分析、标记、结构分析、结构转换、和词汇转换,以生成文本串的翻译,其中基于存储在自动翻译信息DB中的用于翻译的信息来执行所述语素分析、标记、结构分析、结构转换、词汇转换、和翻译生成。
12.根据权利要求11的用于移动装置的用户交互式自动翻译方法,其中所述纠正步骤包括:
向用户提供用户接口,使得用户从数字图像中选择字符串区域;
通过所述用户接口来选择要自动翻译的字符串区域;
基于OCR功能和存储在字符识别信息DB中的字符识别信息来对所选择的字符串区域执行字符识别;
将字符识别后的字符串转换为标准文本串;
通过用户接口而在显示窗口上显示所述标准文本串;以及
通过用户接口来纠正所述文本串。
13.根据权利要求12的用于移动装置的用户交互式自动翻译方法,其中所述显示步骤包括:显示用于错误的最优单词识别候选者的识别候选者,以纠正错误的最优单词识别候选者,使得按照从高权重值到低权重值的顺序在最优单词识别候选者下方、向下显示所述识别候选者,每个识别候选者被封入矩形中。
14.根据权利要求13的用于移动装置的用户交互式自动翻译方法,其中所述纠正步骤包括:当通过用户接口来点击与错误的最优单词识别候选者相关联的识别候选者之一时,用点击的识别候选者来代替错误的最优单词识别候选者,以纠正字符识别的错误。
15.根据权利要求14的用于移动装置的用户交互式自动翻译方法,其中所述纠正步骤包括:当不存在与错误的最优单词识别候选者相关联的识别候选者时,用由用户录入的单词或字符来代替错误的最优单词识别候选者,以纠正字符识别的错误。
16.根据权利要求12的用于移动装置的用户交互式自动翻译方法,其中所述转换步骤包括:将用于字符串的最优单词识别候选者和用于最优单词识别候选者的识别候选者转换为文本。
17.根据权利要求11的用于移动装置的用户交互式自动翻译方法,其中所述生成翻译的步骤包括:
逐句地识别纠错后的文本串;
基于存储在自动翻译信息DB中的第一自动翻译信息来分析和标记逐句识别的文本串的源语言语素,以将包括在所述文本串中的每个词汇恢复为其原始形式;
基于存储在自动翻译信息DB中的第二自动翻译信息来分析在所恢复的文本串的每个句子中包括的词汇的语法相关性和修改结构;
基于存储在自动翻译信息DB中的第三自动翻译信息来对分析后的文本串执行源语言到目标语言的转换,以将源语言的词汇转换为目标语言的词汇;以及
将目标语言的语法应用于结构转换后且词汇转换后的文本串,以生成翻译。
18.根据权利要求17的用于移动装置的用户交互式自动翻译方法,其中所述第一自动翻译信息包括源语言语素分析词典、概率词典、和上下文概率数据。
19.根据权利要求17的用于移动装置的用户交互式自动翻译方法,其中所述第二自动翻译信息包括结构分析规则和翻译模式。
20.根据权利要求17的用于移动装置的用户交互式自动翻译方法,其中所述第三自动翻译信息包括翻译词典、翻译模式和翻译存储。
CN2009102618934A 2009-09-11 2009-12-31 用于移动装置的用户交互式自动翻译装置和方法 Pending CN102023971A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR86064/09 2009-09-11
KR1020090086064A KR101263332B1 (ko) 2009-09-11 2009-09-11 모바일 기기에서 사용자 상호작용을 이용한 자동 번역 장치 및 그 방법

Publications (1)

Publication Number Publication Date
CN102023971A true CN102023971A (zh) 2011-04-20

Family

ID=43731394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102618934A Pending CN102023971A (zh) 2009-09-11 2009-12-31 用于移动装置的用户交互式自动翻译装置和方法

Country Status (3)

Country Link
US (1) US8504350B2 (zh)
KR (1) KR101263332B1 (zh)
CN (1) CN102023971A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488626A (zh) * 2013-09-03 2014-01-01 深圳Tcl新技术有限公司 一种对终端的与参数名称映射的字符串纠错的方法和装置
CN104636322A (zh) * 2015-03-03 2015-05-20 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN105718930A (zh) * 2016-01-26 2016-06-29 北京纽思曼教育科技有限公司 一种多功能翻译笔及其翻译方法
CN106412008A (zh) * 2016-08-26 2017-02-15 乐视控股(北京)有限公司 标识纠错方法及装置
CN106462574A (zh) * 2014-06-24 2017-02-22 谷歌公司 用于基于来自图像的非文本上下文信息的来自图像的文本的机器语言翻译的技术
CN106971134A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种可纠错的图像识别装置及方法
CN107111761A (zh) * 2015-01-12 2017-08-29 谷歌公司 用于提供用户图像捕捉反馈以便进行改良的机器语言翻译的技术
CN107168627A (zh) * 2017-07-06 2017-09-15 三星电子(中国)研发中心 用于触摸屏的文本编辑方法和装置
CN108319592A (zh) * 2018-02-08 2018-07-24 广东小天才科技有限公司 一种翻译的方法、装置及智能终端
CN109670189A (zh) * 2017-10-13 2019-04-23 北京搜狗科技发展有限公司 一种翻译纠错方法、装置和用于翻译纠错的装置
CN110502093A (zh) * 2018-05-18 2019-11-26 夏普株式会社 电子设备、控制装置、控制方法、及记录介质
CN111339788A (zh) * 2020-02-18 2020-06-26 北京字节跳动网络技术有限公司 交互式机器翻译方法、装置、设备和介质
US11373048B2 (en) 2019-09-11 2022-06-28 International Business Machines Corporation Translation of multi-format embedded files
CN115457557A (zh) * 2022-09-21 2022-12-09 深圳市学之友科技有限公司 一种扫描式翻译笔控制方法及装置

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011146934A2 (en) * 2010-05-21 2011-11-24 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US8839379B2 (en) * 2010-10-26 2014-09-16 Cisco Technology, Inc. Using an image to provide credentials for service access
WO2013165334A1 (en) * 2012-04-29 2013-11-07 Hewlett-Packard Development Company, L.P. Re-digitization and error correction of electronic documents
KR20140030361A (ko) * 2012-08-27 2014-03-12 삼성전자주식회사 휴대단말기의 문자 인식장치 및 방법
KR102068604B1 (ko) * 2012-08-28 2020-01-22 삼성전자 주식회사 휴대단말기의 문자 인식장치 및 방법
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US8990068B2 (en) 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US8996353B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
KR101489446B1 (ko) 2013-06-10 2015-02-03 김도형 광학 문자 인식을 이용하는 정보 암호화 시스템 및 정보 암호화 방법
CN105308535A (zh) * 2013-07-15 2016-02-03 英特尔公司 无需用手的协助
KR102147670B1 (ko) * 2013-10-14 2020-08-25 에스케이텔레콤 주식회사 복합 문장 분석 장치, 이를 위한 기록매체
US9208243B2 (en) * 2014-01-07 2015-12-08 Google Inc. Systems and methods for processing machine readable codes by a locked device
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
KR20160071144A (ko) * 2014-12-11 2016-06-21 엘지전자 주식회사 이동단말기 및 그 제어 방법
CN105159893A (zh) * 2015-08-31 2015-12-16 小米科技有限责任公司 字符串保存方法及装置
CN105488036A (zh) * 2015-11-23 2016-04-13 百度在线网络技术(北京)有限公司 基于人工智能机器人的翻译提供方法及装置
CN105468586A (zh) * 2015-11-26 2016-04-06 百度在线网络技术(北京)有限公司 翻译功能的实现方法和装置
CN105512112A (zh) * 2015-12-01 2016-04-20 百度在线网络技术(北京)有限公司 提供翻译的方法和装置
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
CN107665087B (zh) * 2016-07-28 2021-03-16 夏普株式会社 图像显示装置、图像显示方法以及图像显示系统
WO2019060353A1 (en) 2017-09-21 2019-03-28 Mz Ip Holdings, Llc SYSTEM AND METHOD FOR TRANSLATION OF KEYBOARD MESSAGES
KR102008789B1 (ko) * 2018-03-26 2019-08-08 한국카카오은행 주식회사 은행 업무 처리 에이전트, 은행 업무 처리 시스템, 및 이를 이용한 계좌 개설 방법
WO2019190132A1 (ko) * 2018-03-26 2019-10-03 한국카카오은행 주식회사 은행 업무 처리 방법 및 은행 업무 처리용 어플리케이션이 저장된 컴퓨터 판독 가능한 저장 매체
KR102592595B1 (ko) 2018-12-07 2023-10-23 한국전자통신연구원 영상 내 문자 자동번역 시스템 및 방법
KR102279164B1 (ko) * 2019-03-27 2021-07-19 네이버 주식회사 인공지능 모델을 이용한 이미지 편집 방법 및 장치
CN111126045A (zh) * 2019-11-25 2020-05-08 泰康保险集团股份有限公司 一种文本纠错方法和装置
CN111665956B (zh) * 2020-04-17 2023-07-25 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN114332882A (zh) * 2021-12-30 2022-04-12 安徽淘云科技股份有限公司 文本翻译方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
CN1606030A (zh) * 2004-11-12 2005-04-13 无敌科技(西安)有限公司 一种电子摄相翻译释义方法及其装置
US20050197825A1 (en) * 2004-03-05 2005-09-08 Lucent Technologies Inc. Personal digital assistant with text scanner and language translator
CN101127036A (zh) * 2006-08-14 2008-02-20 英华达股份有限公司 影像识别翻译装置及方法
CN201035576Y (zh) * 2006-12-20 2008-03-12 北京恒基伟业投资发展有限公司 一种利用数码照相技术实现即时翻译的装置
CN101193158A (zh) * 2006-11-30 2008-06-04 财团法人工业技术研究院 应用行动通信设备翻译影像文字的方法及其系统
CN101354748A (zh) * 2007-07-23 2009-01-28 英华达(上海)电子有限公司 一种文字识别装置和方法、及移动终端
US20090198486A1 (en) * 2008-02-05 2009-08-06 National Tsing Hua University Handheld electronic apparatus with translation function and translation method using the same

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330530B1 (en) * 1999-10-18 2001-12-11 Sony Corporation Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures
US6778949B2 (en) * 1999-10-18 2004-08-17 Sony Corporation Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
US7496230B2 (en) 2003-06-05 2009-02-24 International Business Machines Corporation System and method for automatic natural language translation of embedded text regions in images during information transfer
US7310605B2 (en) * 2003-11-25 2007-12-18 International Business Machines Corporation Method and apparatus to transliterate text using a portable device
KR20050054007A (ko) 2003-12-03 2005-06-10 삼성전자주식회사 캠코더 기능의 카메라가 구비된 이동 통신 단말기에서번역 기능을 구현하는 방법
KR20060093206A (ko) 2005-02-21 2006-08-24 주식회사 팬택 사전정보 제공을 위한 이동통신 단말기 및 방법
KR100700141B1 (ko) 2005-11-01 2007-03-28 엘지전자 주식회사 이동통신 단말기의 명함인식방법
KR100912502B1 (ko) 2007-07-27 2009-08-17 한국전자통신연구원 Pdf 파일을 대상으로 하는 자동 번역 방법
KR101044652B1 (ko) 2009-04-15 2011-06-29 한국과학기술원 터치스크린을 통한 카메라 영상의 문자열 인식 시스템 및 그 방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010032070A1 (en) * 2000-01-10 2001-10-18 Mordechai Teicher Apparatus and method for translating visual text
US20050197825A1 (en) * 2004-03-05 2005-09-08 Lucent Technologies Inc. Personal digital assistant with text scanner and language translator
CN1606030A (zh) * 2004-11-12 2005-04-13 无敌科技(西安)有限公司 一种电子摄相翻译释义方法及其装置
CN101127036A (zh) * 2006-08-14 2008-02-20 英华达股份有限公司 影像识别翻译装置及方法
CN101193158A (zh) * 2006-11-30 2008-06-04 财团法人工业技术研究院 应用行动通信设备翻译影像文字的方法及其系统
CN201035576Y (zh) * 2006-12-20 2008-03-12 北京恒基伟业投资发展有限公司 一种利用数码照相技术实现即时翻译的装置
CN101354748A (zh) * 2007-07-23 2009-01-28 英华达(上海)电子有限公司 一种文字识别装置和方法、及移动终端
US20090198486A1 (en) * 2008-02-05 2009-08-06 National Tsing Hua University Handheld electronic apparatus with translation function and translation method using the same

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488626A (zh) * 2013-09-03 2014-01-01 深圳Tcl新技术有限公司 一种对终端的与参数名称映射的字符串纠错的方法和装置
CN106462574A (zh) * 2014-06-24 2017-02-22 谷歌公司 用于基于来自图像的非文本上下文信息的来自图像的文本的机器语言翻译的技术
CN106462574B (zh) * 2014-06-24 2019-07-12 谷歌有限责任公司 用于来自图像的文本的机器语言翻译的方法和服务器
CN107111761A (zh) * 2015-01-12 2017-08-29 谷歌公司 用于提供用户图像捕捉反馈以便进行改良的机器语言翻译的技术
CN107797754A (zh) * 2015-03-03 2018-03-13 广东欧珀移动通信有限公司 一种文本复制的方法及装置和介质产品
CN104636322A (zh) * 2015-03-03 2015-05-20 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN107797754B (zh) * 2015-03-03 2021-02-09 Oppo广东移动通信有限公司 一种文本复制的方法及装置和介质产品
CN104636322B (zh) * 2015-03-03 2018-01-23 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN104881405A (zh) * 2015-05-22 2015-09-02 东莞中山大学研究院 一种基于智能手机实现拍照翻译的方法及智能手机
CN106971134A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种可纠错的图像识别装置及方法
CN105718930A (zh) * 2016-01-26 2016-06-29 北京纽思曼教育科技有限公司 一种多功能翻译笔及其翻译方法
CN106412008A (zh) * 2016-08-26 2017-02-15 乐视控股(北京)有限公司 标识纠错方法及装置
CN107168627B (zh) * 2017-07-06 2020-08-07 三星电子(中国)研发中心 用于触摸屏的文本编辑方法和装置
CN107168627A (zh) * 2017-07-06 2017-09-15 三星电子(中国)研发中心 用于触摸屏的文本编辑方法和装置
CN109670189A (zh) * 2017-10-13 2019-04-23 北京搜狗科技发展有限公司 一种翻译纠错方法、装置和用于翻译纠错的装置
CN109670189B (zh) * 2017-10-13 2022-11-18 北京搜狗科技发展有限公司 一种翻译纠错方法、装置和用于翻译纠错的装置
CN108319592A (zh) * 2018-02-08 2018-07-24 广东小天才科技有限公司 一种翻译的方法、装置及智能终端
CN110502093A (zh) * 2018-05-18 2019-11-26 夏普株式会社 电子设备、控制装置、控制方法、及记录介质
US11373048B2 (en) 2019-09-11 2022-06-28 International Business Machines Corporation Translation of multi-format embedded files
CN111339788A (zh) * 2020-02-18 2020-06-26 北京字节跳动网络技术有限公司 交互式机器翻译方法、装置、设备和介质
CN111339788B (zh) * 2020-02-18 2023-09-15 北京字节跳动网络技术有限公司 交互式机器翻译方法、装置、设备和介质
CN115457557A (zh) * 2022-09-21 2022-12-09 深圳市学之友科技有限公司 一种扫描式翻译笔控制方法及装置
CN115457557B (zh) * 2022-09-21 2024-03-05 惠州市学之友电子有限公司 一种扫描式翻译笔控制方法及装置

Also Published As

Publication number Publication date
US8504350B2 (en) 2013-08-06
KR101263332B1 (ko) 2013-05-20
KR20110028123A (ko) 2011-03-17
US20110066421A1 (en) 2011-03-17

Similar Documents

Publication Publication Date Title
CN102023971A (zh) 用于移动装置的用户交互式自动翻译装置和方法
CN1918578B (zh) 具有自动校正的手写及语音输入
CN102449640B (zh) 识别手写单词
CN100416591C (zh) 字符识别电子设备和字符识别方法
CN100593167C (zh) 语言输入用户界面
US7395203B2 (en) System and method for disambiguating phonetic input
CN100555203C (zh) 修正已输入文字的系统及方法
JP4095050B2 (ja) 文字認識装置及び方法
US20020168107A1 (en) Method and apparatus for recognizing handwritten chinese characters
CN100472411C (zh) 输入法中取消字符串的方法及文字输入系统
CN102272827B (zh) 利用语音输入解决模糊的手工输入文本输入的方法和装置
CN101730898A (zh) 采用神经网络的手写识别
US20080180283A1 (en) System and method of cross media input for chinese character input in electronic equipment
CN101133411A (zh) 非罗马字符的容错罗马化输入方法
US20050268231A1 (en) Method and device for inputting Chinese phrases
CN105404621A (zh) 一种用于盲人读取汉字的方法及系统
US20070288240A1 (en) User interface for text-to-phone conversion and method for correcting the same
CN101739143B (zh) 文字输入方法及系统
CN105117034A (zh) 一种中文语音输入法及语句定位与纠错方法
US20050249419A1 (en) Apparatus and method for handwriting recognition
US9536180B2 (en) Text recognition based on recognition units
CN101135936A (zh) 快速键入设备和方法
JP2015040908A (ja) 情報処理装置、情報更新プログラム及び情報更新方法
CN113743102A (zh) 识别字符的方法、装置以及电子设备
US20050276480A1 (en) Handwritten input for Asian languages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110420