CN103902440B - 应用程序中的文字检测方法和装置 - Google Patents

应用程序中的文字检测方法和装置 Download PDF

Info

Publication number
CN103902440B
CN103902440B CN201210572578.5A CN201210572578A CN103902440B CN 103902440 B CN103902440 B CN 103902440B CN 201210572578 A CN201210572578 A CN 201210572578A CN 103902440 B CN103902440 B CN 103902440B
Authority
CN
China
Prior art keywords
language
character
text file
character information
suspicious
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210572578.5A
Other languages
English (en)
Other versions
CN103902440A (zh
Inventor
丁如敏
霍举振
高苡新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210572578.5A priority Critical patent/CN103902440B/zh
Priority to PCT/CN2013/084284 priority patent/WO2014101504A1/zh
Publication of CN103902440A publication Critical patent/CN103902440A/zh
Priority to US14/749,598 priority patent/US9767090B2/en
Priority to US15/676,791 priority patent/US10713437B2/en
Application granted granted Critical
Publication of CN103902440B publication Critical patent/CN103902440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation

Abstract

本发明实施例提供了一种应用程序中的文字检测方法和装置。所述方法包括:从多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件;按照语言版本对文本文件进行拆分得到对应的语言文本文件;根据语言版本调用语言检测工具;通过语言检测工具检测语言文本文件得到可疑字符信息。所述装置包括:文件处理模块,用于从多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件;拆分模块,用于按照语言版本对文本文件进行拆分得到对应的语言文本文件;工具调用模块,用于根据语言版本调用语言检测工具;文本检测模块,用于通过语言检测工具检测语言文本文件得到可疑字符信息。采用本发明能提高应用程序中文字检测的效率。

Description

应用程序中的文字检测方法和装置
技术领域
本发明涉及软件调试技术,特别是涉及一种应用程序中的文字检测方法和装置。
背景技术
随着各种应用程序的普遍使用,每一应用程序所面向的用户类型也越来越多,应用程序用户使用的语言并不仅限于单一种类的语言文字,例如中文,而是越来越多的用户使用英文、马来西亚文等各种不同的语言文字,因此,为适应各种不同用户的需求,多语言应用程序根据用户的选择提供了各种不同语言版本。
相应的,在应用程序中的文字检测中也应当对交互界面的语言文字进行检测,应用程序中的文字检测方式包括切换不同的语言版本进行检测和提取多语言应用程序的资源文件进行人工检测。其中,在切换不同的语言版本进行检测的过程中,首先将多语言应用程序安装于终端设备,并运行,切换各种不同的语言版本,检查该语言版本下所有交互界面的语言文字,但是,这一检测方式难以确保遍历检查到每一语言版本下所有的交互界面,并且在检测过程中还需配合多语言应用程序的操作进行,效率较低。
而提取资源文件进行人工检测的方式需要交由不同语言的专业人士负责,例如,英文版本的应用程序需由英语专业人员进行检测,印度语版本的应用程序需由印度语专业人员进行检测,效率更为低下。
发明内容
基于此,有必要针对检测效率低的问题,提供一种能提高效率的应用程序中的文字检测方法。
此外,还有必要提供一种能提高效率的应用程序中的文字检测装置。
一种应用程序中的文字检测方法,包括如下步骤:
从多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件;
按照语言版本对所述文本文件进行拆分得到对应的语言文本文件;
根据所述语言版本调用语言检测工具;
通过所述语言检测工具检测所述语言文本文件得到可疑字符信息。
一种应用程序中的文字检测装置,包括:
文件处理模块,用于从多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件;
拆分模块,用于按照语言版本对所述文本文件进行拆分得到对应的语言文本文件;
工具调用模块,用于根据所述语言版本调用语言检测工具;
文本检测模块,用于通过所述语言检测工具检测所述语言文本文件得到可疑字符信息。上述应用程序中的文字检测方法和装置,提取资源文件,并自动将提取的资源文件转换为适于进行检测的文本文件,进而根据不同的语言版本将文本文件拆分为相应的语言文本文件,逐一对每一语言版本所对应的语言文本文件进行正确性检测,不需要配合多语言应用程序的操作以及专业人员的人工检测即可完成,大大地提高了效率。
附图说明
图1为一个实施例中应用程序中的文字检测方法的流程图;
图2为图1中按照语言版本对文本文件进行拆分得到对应的语言文本文件的方法流程图;
图3为另一个实施例中应用程序中的文字检测方法的流程图;
图4为另一个实施例中应用程序中的文字检测方法的流程图;
图5为另一个实施例中检测语言文本文件的方法流程图;
图6为一个实施例中应用程序中的文字检测装置的结构示意图;
图7为图7中拆分模块的结构示意图;
图8为另一个实施例中应用程序中的文字检测装置的结构示意图;
图9为另一个实施例中检测模块的结构示意图。
具体实施方式
如图1所示,在一个实施例中,一种应用程序中的文字检测方法,包括如下步骤:
步骤S110,从多语言应用程序安装包中提取资源文件,并将资源文件转换为文本文件。
本实施例中,资源文件用于在应用程序中不需要重新编辑代码即可为用户提供各种交互界面以及交互界面中的文字、图像。资源文件包括了交互界面所对应的位图、字符以及其它数据,每一应用程序对应了一个资源文件,并根据提供的语言版本在资源文件中存储了相应语言版本的字符。
从应用程序的多语言应用程序安装包中提取资源文件,将提取到的资源文件转换为文本格式,得到该资源文件对应的文本文件,以适用于资源文件中字符的检测。
具体的,应用程序的多语言应用程序安装包为运行于终端设备,并安装应用程序的可执行文件,例如,在移动终端的Android操作系统中,应用程序的多语言应用程序安装包是后缀名为.apk的文件。
步骤S130,按照语言版本对文本文件进行拆分得到对应的语言文本文件。
本实施例中,资源文件为运行于终端设备中的应用程序提供了至少一个语言版本的交互界面,并且资源文件的文本文件中,字符是根据相应的语言版本进行有序存储的,例如,文本文件的每一列对应了一个语言版本。按照语言版本对文本文件进行拆分得到每一语言版本对应的语言文本文件,将包含了多语言字符的文本文件分成多个单语言字符的文本文件,即每一语言版本所对应的语言文本文件。
如图2所示,在一个实施例中,上述步骤S130的具体过程为:
步骤S131,根据语言版本从文本文件中提取对应的字符。
本实施例中,根据语言版本逐一在文本文件中提取该语言版本所对应的字符。
步骤S133,将字符保存为语言文本文件,并根据语言版本命名保存的语言文本文件。
本实施例中,将根据语言版本提取到的字符保存为文本格式得到该语言版本所对应的语言文本文件,并将该语言版本对应的语言名称使用语言文本文件的文件名。
步骤S150,根据语言版本调用语言检测工具。
本实施例中,为测试应用程序交互界面中文字是否正确,需逐一对每一语言版本的语言文本文件中的字符进行检测,以判断语言文本文件中用于形成交互界面文字的字符正确性。
语言检测工具用于进行文字检测,不同的语言检测工具对应了不同的语言版本,并对文本格式的文件进行检测。根据语言版本得到语言文本文件的语种,进而调用该语种所对应的语言检测工具。语言检测工具所进行的文字检测包括拼写检测以及语法检测,但并不仅限于此。
步骤S170,通过语言检测工具检测语言文本文件得到可疑字符信息。
本实施例中,应用语言检测工具对语言文本文件中的字符进行检测得到可疑字符信息,可疑字符信息包括了可疑字符、所在位置以及修改建议等信息,语言文本文件中得到的可疑字符信息形成列表的形式显示。
如图3所示,在另一个实施例中,上述应用程序中的文字检测方法还包括如下步骤:
步骤S210,从可疑字符信息中提取出误判的可疑字符信息。
本实施例中,由语言检测工具进行检测得到的可疑字符信息可能包含了实质为正确的可疑字符信息,即误判的字符信息,因此还需对得到的可疑字符信息进行筛选以提取出误判的可疑字符信息。
如图4所示,在另一个实施例中,上述步骤S210之前还包括如下步骤:
步骤S310,判断可疑字符信息中是否存在误判的可疑字符信息,若是,则进入上述步骤S210,若否,则进入步骤S330。
本实施例中,获取人工筛选得到的误判的可疑字符信息,并以此为依据判断语言检测工具检测得到的可疑字符信息是否被误判,若是,则提取误判的可疑字符信息,若否,则直接输出语言检测工具检测得到的可疑字符信息,以方便修正语言文本文件中的字符。
步骤S330,输出可疑字符信息。
步骤S230,记录误判的可疑字符信息。
本实施例中,将误判的可疑字符信息记录到字典,字典为语言检测工具所附带的词库,记录了正确的字符,在语言文本文件和字典的比对中若语言文本文件的字符与字典记录的字符相一致,则判定语言文本文件的字符为正确的,若不相一致,则判定语言文本文件的字符为可疑字符。
在一个实施例中,上述应用程序中的文字检测方法还包括:根据记录的误判的可疑字符信息去除检测得到的可疑字符信息中误判的可疑字符信息的步骤。
本实施例中,在对语言文本文件进行检测,并记录了语言文本文件中误判的可疑字符信息之后,还将根据记录的误判的可疑字符再次进行检测,去除可疑字符信息中误判的可疑字符信息,重新得到更为准确的文字检测结果。
如图5所示,在另一个实施例中,上述应用程序中的文字检测方法还包括:
步骤S410,获取终端设备的分辨率信息。
本实施例中,获取运行应用程序的终端设备屏幕的分辨率信息。分辨率信息用于通过水平和垂直像素来衡量终端设备屏幕每一行或列中显示文字的数量。
步骤S430,判断语言文本文件中字符的断行是否与分辨率信息相匹配,若否,则进入步骤S450,若是,则结束。
本实施例中,上述判断语言文本文件中字符的断行是否与分辨率信息相匹配的具体过程为:根据语言文本文件得到对应的语种并获取应用程序交互界面显示的字号,根据语种和显示的字号计算得到字符所占据的宽度,该宽度是通过像素表示的,根据分辨率信息计算终端设备屏幕得到每行所包含的像素点数量,进而将每行所包含的像素点数量和宽相除得到每行容纳字数,根据每行容纳字数判断语言文本文件中字符的断行是否正确,若不正确,则生成相应的可疑字符信息,以通过可疑字符信息标识断行错误的字符。
此外,上述步骤S430也可通过判断语言文本文件中同一行的字符长度所占据的像素值是否与屏幕中每行所包含的像素点数量相匹配来识别断行错误的字符,判断到同一行的字符长度所占据的像素值超出了屏幕中每行所包含的像素点数量,则说明出现了断行错误。
步骤S450,生成字符对应的可疑字符信息。
本实施例中,该可疑字符信息包括了断行出错的字符、所处位置以及修改建议等信息。
如图6所示,在一个实施例中,一种应用程序中的文字检测装置,包括文件处理模块110、拆分模块130、工具调用模块150和文本检测模块170。
文件处理模块110,用于从多语言应用程序安装包中提取资源文件,并将资源文件转换为文本文件。
本实施例中,资源文件用于在应用程序中不需要重新编辑代码即可为用户提供各种交互界面以及交互界面中的文字、图像。资源文件包括了交互界面所对应的位图、字符以及其它数据,每一应用程序对应了一个资源文件,并根据提供的语言版本在资源文件中存储了相应语言版本的字符。
文件处理模块110从应用程序的多语言应用程序安装包中提取资源文件,将提取到的资源文件转换为文本格式,得到该资源文件对应的文本文件,以适用于资源文件中字符的检测。
具体的,应用程序的多语言应用程序安装包为运行于终端设备,并安装应用程序的可执行文件,例如,在移动终端的Android操作系统中,应用程序的多语言应用程序安装包是后缀名为.apk的文件。
拆分模块130,用于按照语言版本对文本文件进行拆分得到对应的语言文本文件。
本实施例中,资源文件为运行于终端设备中的应用程序提供了至少一个语言版本的交互界面,并且资源文件的文本文件中,字符是根据相应的语言版本进行有序存储的,例如,文本文件的每一列对应了一个语言版本。拆分模块130按照语言版本对文本文件进行拆分得到每一语言版本对应的语言文本文件,将包含了多语言字符的文本文件分成多个单语言字符的文本文件,即每一语言版本所对应的语言文本文件。
如图7所示,在一个实施例中,拆分模块130包括字符提取单元131以及存储单元133。
字符提取单元131,用于根据语言版本从文本文件中提取对应的字符。
本实施例中,字符提取单元131根据语言版本逐一在文本文件中提取该语言版本所对应的字符。
存储单元133,用于将字符保存为语言文本文件,并根据语言版本命名保存的语言文本文件。
本实施例中,存储单元133将根据语言版本提取到的字符保存为文本格式得到该语言版本所对应的语言文本文件,并将该语言版本对应的语言名称使用语言文本文件的文件名。
工具调用模块150,用于根据语言版本调用语言检测工具。
本实施例中,为测试应用程序交互界面中文字是否正确,需逐一对每一语言版本的语言文本文件中的字符进行检测,以判断语言文本文件中用于形成交互界面文字的字符正确性。
语言检测工具用于进行文字检测,不同的语言检测工具对应了不同的语言版本,并对文本格式的文件进行检测。工具调用模块150根据语言版本得到语言文本文件的语种,进而调用该语种所对应的语言检测工具。语言检测工具所进行的文字检测包括拼写检测以及语法检测,但并不仅限于此。
文本检测模块170,用于通过语言检测工具检测语言文本文件得到可疑字符信息。
本实施例中,文本检测模块170应用语言检测工具对语言文本文件中的字符进行检测得到可疑字符信息,可疑字符信息包括了可疑字符、所在位置以及修改建议等信息,语言文本文件中得到的可疑字符信息形成列表的形式显示。
如图8所示,在另一个实施例中,上述应用程序中的文字检测装置还包括误判信息提取模块210以及记录模块230。
误判信息提取模块210,用于从可疑字符信息提取出误判的可疑字符信息。
本实施例中,由语言检测工具进行检测得到的可疑字符信息可能包含了实质为正确的可疑字符信息,即误判的字符信息,因此还需误判信息提取模块210对得到的可疑字符信息进行筛选以提取出误判的可疑字符信息。
在另一个实施使你中,上述应用程序中文字检测装置还包括误判信息识别模块,该误判信息识别模块用于判断可疑字符信息中是否存在误判的可疑字符信息,若是,则通知上述误判信息提取模块210,若否,则输出可疑字符信息。
本实施例中,误判信息识别模块获取人工筛选得到的误判的可疑字符信息,并以此为依据判断语言检测工具检测得到的可疑字符信息是否被误判,若是,则提取误判的可疑字符信息,若否,则直接输出语言检测工具检测得到的可疑字符信息,以方便修正语言文本文件中的字符。
记录模块230,用于记录误判的可疑字符信息。
本实施例中,记录模块230将误判的可疑字符信息记录到字典,字典为语言检测工具所附带的词库,记录了正确的字符,在语言文本文件和字典的比对中若语言文本文件的字符与字典记录的字符相一致,则判定语言文本文件的字符为正确的,若不相一致,则判定语言文本文件的字符为可疑字符。
上述文本检测模块170还用于根据记录的误判的可疑字符信息去除检测得到的可疑字符信息中误判的可疑字符信息。
本实施例中,在对语言文本文件进行检测,并记录了语言文本文件中误判的可疑字符信息之后,文本检测模块170还将根据记录的误判的可疑字符再次进行检测,去除可疑字符信息中误判的可疑字符信息,重新得到更为准确的文字检测结果。
如图9所示,在另一个实施例中,上述应用程序中的文字检测装置还包括获取模块310以及断行检测模块330。
获取模块310,用于获取终端设备的分辨率信息。
本实施例中,获取模块310获取运行应用程序的终端设备屏幕的分辨率信息。分辨率信息用于通过水平和垂直像素来衡量终端设备屏幕每一行或列中显示文字的数量。
断行检测模块330,用于判断语言文本文件中字符的断行是否与分辨率信息相匹配,若否,则生成该字符对应的可疑字符信息,若是,则停止执行。
本实施例中,断行检测模块330根据语言文本文件得到对应的语种并获取应用程序交互界面显示的字号,根据语种和显示的字号计算得到字符所占据的宽度,该宽度是通过像素表示的,根据分辨率信息计算终端设备屏幕得到每行所包含的像素点数量,进而将每行所包含的像素点数量和宽相除得到每行容纳字数,根据每行容纳字数判断语言文本文件中字符的断行是否正确,若不正确,则生成相应的可疑字符信息,以通过可疑字符信息标识断行错误的字符。
此外,断行检测模块330也可通过判断语言文本文件中同一行的字符长度所占据的像素值是否与屏幕中每行所包含的像素点数量相匹配来识别断行错误的字符,判断到同一行的字符长度所占据的像素值超出了屏幕中每行所包含的像素点数量,则说明出现了断行错误。可疑字符信息包括了断行出错的字符、所处位置以及修改建议等信息。
上述应用程序中的文字检测方法和装置,提取资源文件,并自动将提取的资源文件转换为适于进行检测的文本文件,进而根据不同的语言版本将文本文件拆分为相应的语言文本文件,逐一对每一语言版本所对应的语言文本文件进行正确性检测,不需要配合多语言应用程序的操作以及专业人员的人工检测即可完成,大大地提高了效率。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (8)

1.一种应用程序中的文字检测方法,包括如下步骤:
从应用程序的多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件,其中所述资源文件用于为用户提供各种交互界面以及交互界面中的文字、图像;
按照语言版本对所述文本文件进行拆分得到对应的语言文本文件;
根据所述语言版本得到所述语言文本文件的语种,并调用所述语种所对应的语言检测工具;
通过所述语言检测工具检测所述语言文本文件得到可疑字符信息,所述可疑字符信息包括可疑字符、所在位置以及修改建议;
获取终端设备的分辨率信息;
判断所述语言文本文件中字符的断行是否与所述分辨率信息相匹配,若否,则生成所述字符对应的可疑字符信息,所述字符对应的可疑字符信息包括了断行出错的字符、所处位置以及修改建议。
2.根据权利要求1所述的应用程序中的文字检测方法,其特征在于,所述按照语言版本对所述文本文件进行拆分得到对应的语言文本文件的步骤为:
根据语言版本从所述文本文件中提取对应的字符;
将所述字符保存为语言文本文件,并根据所述语言版本命名所述保存的语言文本文件。
3.根据权利要求1所述的应用程序中的文字检测方法,其特征在于,还包括:
从所述可疑字符信息提取出误判的可疑字符信息;
记录所述误判的可疑字符信息;
根据所述记录的误判的可疑字符信息去除所述检测得到的可疑字符信息中误判的可疑字符信息。
4.根据权利要求3所述的应用程序中的文字检测方法,其特征在于,所述从所述可疑字符信息提取出误判的可疑字符信息的步骤之前还包括:
判断所述可疑字符信息中是否存在误判的可疑字符信息,若是,则进入所述从所述可疑字符信息提取出误判的可疑字符信息的步骤;
若否,则输出所述可疑字符信息。
5.一种应用程序中的文字检测装置,其特征在于,包括:
文件处理模块,用于从应用程序的多语言应用程序安装包中提取资源文件,并将所述资源文件转换为文本文件,其中所述资源文件用于为用户提供各种交互界面以及交互界面中的文字、图像;
拆分模块,用于按照语言版本对所述文本文件进行拆分得到对应的语言文本文件;
工具调用模块,用于根据所述语言版本得到所述语言文本文件的语种,并调用所述语种所对应的语言检测工具;
文本检测模块,用于通过所述语言检测工具检测所述语言文本文件得到可疑字符信息,所述可疑字符信息包括可疑字符、所在位置以及修改建议;
获取模块,用于获取终端设备的分辨率信息;
断行检测模块,用于判断所述语言文本文件中字符的断行是否与所述分辨率信息相匹配,若否,则生成所述字符对应的可疑字符信息,所述字符对应的可疑字符信息包括了断行出错的字符、所处位置以及修改建议。
6.根据权利要求5所述的应用程序中的文字检测装置,其特征在于,所述拆分模块包括:
字符提取单元,用于根据语言版本从所述文本文件中提取对应的字符;
存储单元,用于将所述字符保存为语言文本文件,并根据所述语言版本命名所述保存的语言文本文件。
7.根据权利要求5所述的应用程序中的文字检测装置,其特征在于,还包括:
误判信息提取模块,用于从所述可疑字符信息提取出误判的可疑字符信息;
记录模块,用于记录所述误判的可疑字符信息;
所述文本检测模块还用于根据所述记录的误判的可疑字符信息去除所述检测得到的可疑字符信息中误判的可疑字符信息。
8.根据权利要求7所述的应用程序中的文字检测装置,其特征在于,还包括:
误判信息识别模块,用于判断所述可疑字符信息中是否存在误判的可疑字符信息,若是,则通知所述误判信息提取模块,若否,则输出所述可疑字符信息。
CN201210572578.5A 2012-12-25 2012-12-25 应用程序中的文字检测方法和装置 Active CN103902440B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210572578.5A CN103902440B (zh) 2012-12-25 2012-12-25 应用程序中的文字检测方法和装置
PCT/CN2013/084284 WO2014101504A1 (zh) 2012-12-25 2013-09-26 应用程序中的文字检测方法和装置
US14/749,598 US9767090B2 (en) 2012-12-25 2015-06-24 Correcting questionable line breaks after an OCR
US15/676,791 US10713437B2 (en) 2012-12-25 2017-08-14 Method and apparatus for identifying questionable line break characters in an application

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210572578.5A CN103902440B (zh) 2012-12-25 2012-12-25 应用程序中的文字检测方法和装置

Publications (2)

Publication Number Publication Date
CN103902440A CN103902440A (zh) 2014-07-02
CN103902440B true CN103902440B (zh) 2018-07-20

Family

ID=50993775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210572578.5A Active CN103902440B (zh) 2012-12-25 2012-12-25 应用程序中的文字检测方法和装置

Country Status (3)

Country Link
US (2) US9767090B2 (zh)
CN (1) CN103902440B (zh)
WO (1) WO2014101504A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572450B (zh) * 2014-12-25 2017-07-11 广东欧珀移动通信有限公司 一种检测资源配置的方法及装置
CN104765635B (zh) * 2015-04-09 2020-01-10 上海斐讯数据通信技术有限公司 一种核对apk内多国语言的方法及其系统
CN107153607A (zh) * 2016-03-03 2017-09-12 展讯通信(天津)有限公司 检查移动终端界面语言的方法、装置及系统
WO2018119630A1 (zh) * 2016-12-27 2018-07-05 华为技术有限公司 一种交互方法和终端
CN107168719A (zh) * 2017-06-02 2017-09-15 广州视源电子科技股份有限公司 应用程序运行方法、装置、终端及计算机可读存储介质
CN111027029B (zh) * 2019-10-21 2022-02-08 厦门天锐科技股份有限公司 一种判断文件是否是安装包并限制打开的方法
CN113220382B (zh) * 2020-01-21 2023-08-29 杭州萤石软件有限公司 一种应用语言包的异常检测方法及装置
CN112131869B (zh) * 2020-09-02 2021-09-10 苏州好玩友网络科技有限公司 基于多语言的文本检测方法及装置
CN113515443A (zh) * 2021-04-21 2021-10-19 深圳市康冠商用科技有限公司 多国语言自动核对方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787452A (en) * 1996-05-21 1998-07-28 Sybase, Inc. Client/server database system with methods for multi-threaded data processing in a heterogeneous language environment
CN101140590A (zh) * 2007-10-12 2008-03-12 中兴通讯股份有限公司 资源文件的校验方法和系统
CN102033915A (zh) * 2010-12-03 2011-04-27 百度在线网络技术(北京)有限公司 一种开放式知识共享平台及其编辑提示方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7313540B1 (en) * 2000-03-08 2007-12-25 Hueler Companies Electronic communication system and method for facilitating financial transaction bidding and reporting processes
US20030014445A1 (en) * 2001-07-13 2003-01-16 Dave Formanek Document reflowing technique
US7627816B2 (en) * 2005-04-12 2009-12-01 International Business Machines Corporation Method for providing a transient dictionary that travels with an original electronic document
US20120322675A1 (en) * 2007-08-31 2012-12-20 Florida State University Research Foundation Genome-scale analysis of replication timing
CN102541847A (zh) * 2010-12-08 2012-07-04 金蝶软件(中国)有限公司 一种资源文件的载入方法、装置及erp系统
EP2661705A4 (en) * 2011-01-05 2016-06-01 Google Inc METHOD AND SYSTEM FOR FACILITATING TEXT INPUT
CA2756102A1 (en) * 2011-11-01 2012-01-03 Cit Global Mobile Division Method and system for localizing an application on a computing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787452A (en) * 1996-05-21 1998-07-28 Sybase, Inc. Client/server database system with methods for multi-threaded data processing in a heterogeneous language environment
CN101140590A (zh) * 2007-10-12 2008-03-12 中兴通讯股份有限公司 资源文件的校验方法和系统
CN102033915A (zh) * 2010-12-03 2011-04-27 百度在线网络技术(北京)有限公司 一种开放式知识共享平台及其编辑提示方法

Also Published As

Publication number Publication date
US20170364501A1 (en) 2017-12-21
US20150293898A1 (en) 2015-10-15
WO2014101504A1 (zh) 2014-07-03
US9767090B2 (en) 2017-09-19
CN103902440A (zh) 2014-07-02
US10713437B2 (en) 2020-07-14

Similar Documents

Publication Publication Date Title
CN103902440B (zh) 应用程序中的文字检测方法和装置
JP2002297588A (ja) 訳例辞書の自動生成方法およびプログラムおよび装置
CN104636322B (zh) 一种文本复制的方法及装置
CN104424094A (zh) 一种异常信息获取方法、装置及智能终端设备
WO2013116022A1 (en) Resolving out-of-vocabulary words during machine translation
CN103688254B (zh) 用于自动评估写作的基于示例的错误检测系统、方法及错误检测设备
US10261884B2 (en) Method for correcting violation of source code and computer readable recording medium having program performing the same
KR101364321B1 (ko) 자연 언어 처리 장치, 방법 및 프로그램
CN103488488A (zh) 文本输入检查方法、装置及移动终端
CN112231507A (zh) 识别方法、装置及电子设备
WO2019045185A1 (en) MOBILE DEVICE, AND METHOD FOR CORRECTING CHARACTER CHAIN ENTERED VIA A VIRTUAL KEYBOARD
CN103678476A (zh) 文档处理装置以及文档处理方法
CN116089262A (zh) 一种基于代码动态分析的代码安全扫描系统及方法
JP2016057715A (ja) 図形式プログラム解析装置
US20120239654A1 (en) Related document search system, device, method and program
CN111090989B (zh) 一种基于文字识别的提示方法及电子设备
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
KR20100115048A (ko) 복사 문서 판별 시스템 및 그 방법
CN104978273B (zh) 菜单名称的自动检测方法及自动检测单元
KR101977206B1 (ko) 유사어 보정 시스템 및 방법
JP7206644B2 (ja) 文字認識装置、文字認識方法、及びプログラム
CN117636355A (zh) 扫描笔的测试方法、装置、系统和存储介质
Bowden Cooperative error handling and shallow processing
CN105808114B (zh) 一种信息处理方法及电子设备
JP2902138B2 (ja) 誤読文字修正方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant