CN106384108A

CN106384108A - 文字内容检索方法及词语解读装置和移动终端

Info

Publication number: CN106384108A
Application number: CN201610789129.4A
Authority: CN
Inventors: 陶媛媛
Original assignee: Shanghai Feixun Data Communication Technology Co Ltd
Current assignee: Shanghai Feixun Data Communication Technology Co Ltd
Priority date: 2016-08-31
Filing date: 2016-08-31
Publication date: 2017-02-08

Abstract

本发明属于计算机软件技术领域，公开了一种文字内容检索方法及词语解读装置和移动终端，所述文字内容包括存储在内部数据库中的关键词内容和与关键词内容对应的结果内容；检索步骤包括：步骤S1：从外部获取待查询关键词的文本内容；步骤S2：匹配外部关键词与内部关键词内容；将与外部关键词相匹配的内部关键词内容所对应的目标内容条目作为查询结果；步骤S3：输出查询结果。本发明通过图像识别、文本提取、语音识别和数据库比对技术，解读出词语的含义、用途、中英文翻译、相关典故等。该方法操作简单，准确度较高，节省了用户的时间和精力，同时也加强了读者对词语更好的理解。

Description

文字内容检索方法及词语解读装置和移动终端

技术领域

本发明属于计算机软件技术领域，涉及内容检索、图像识别、语音识别、数据库技术，具体涉及一种通过计算对词语进行解读的技术。

背景技术

日常生活中很容易遇到一些我们不熟悉的词语，如一种药物名称，一个生僻成语，一个陌生词组等等。对于这些不熟悉的词语，虽然可以通过电脑、手机、平面电脑等可以接入互联网的智能设备，在网络上搜索到相应的解释。但是一方面，需借助第三方浏览器工具，另一方面，需要将外部介质(如报纸、书本等)上的词语录入智能设备，不仅操作麻烦，而且当遇到不认识的字词时，使用拼音输入法或语音输入法均无法实现。

目前市面上可用的电子语典或网络词典很多，如金山词霸、有道词典等，但他们的功能仅限于查询，从外部介质到智能设备的录入还需要通过输入法实现，无法解决上述问题。而且，现有电子词典仅限于字词的查询，并且更多侧重于翻译，缺少对各种新名词解读的功能。

在阅读过程中，如果能快速方便地知道陌生词汇的含义、用途、中英文翻译、相关典故等，不仅节省了用户时间，而且还能让用户学到更多知识。

公开号为CN101599059A的中国专利公开了一种语音输入的翻译装置与方法,其装置包含：一数据库，储存若干个翻译表，所述翻译表依据若干个关键词而分类，且每一该翻译表包含若干个翻译句；一语音接收模块，用以接收一语音文句；一语音辨识模块，辨识该语音文句的一语意，并获取该语音文句中的关键词；及一检索模块，依据该语音文句所获取的关键词，由该数据库中取得相对应的翻译表，并依据该语音文句的语意，由所取得的翻译表中检索出相对应的翻译句。其装置使得电子装置不再局限于单字查询,有效解决使用者在与外籍人士对谈中,需要逐字查询并自行拼凑句意而产生口语沟通不能理解的问题。

但是上述专利仅提供了将语音识这样一种关键词获取方途径，当用户需要翻译的内容存在于纸质印刷品上时，用户将不得不将内容读出来，才能使装置采集到。不难想到的是，该装置的使用尤其依赖于用户的普通话发音标准程度。虽然我国现今普通话普及程度达到历史最高水平，但是绝大多数的人的发音难免还夹带着各种口音。此外，如果需要翻译的内容中某个或某些文字，用户不认识，该装置则难以使用。

发明内容

本发明目的在于，针对上述技术现状，提出一种基于图像识别、文本提取、语音识别和数据库比对技术，解读出词语的含义、用途、中英文翻译、相关典故的解决方案。该解决方案无需用户手动输入文字。

为实现上述目的，本发明提出一种文字内容检索方法，所述文字内容包括存储在内部数据库中的关键词内容和与关键词内容对应的结果内容；

其包括：

步骤S1：从外部获取待查询关键词的文本内容；

步骤S2：匹配从外部获取的待查询关键词与内部存储的关键词内容；将与外部获取的待查询关键词相匹配的内部关键词内容所对应的目标内容条目作为查询结果；

步骤S3：输出查询结果。

进一步地，从外部获取待查询关键词的方法包括图像识别和语音识别两种。

进一步地，从外部获取待查询关键词的方法包括：

步骤S1-1：采集包含有待查询关键词的图像内容；

步骤S1-2：对采集的图像内容进行线性变换，调整原始图像的字体大小；

步骤S1-3：输出经线性变换的图像内容在显示装置上显示图像；

步骤S1-4：输出图形化选框并在显示装置上显示；

步骤S1-5：调整图形化选框大小及位置，使图形化选框所对应的显示区域内包含待查询关键词；

步骤S1-6：以图形化选框轮廓为边界切割显示中的图像，获得目标图像；

步骤S1-7：对目标图像实施文字识别处理，生成文本内容。

进一步地，从外部获取待查询关键词的方法还包括：

步骤S1-1：采集包含有待查询关键词的音频内容；

步骤S1-2：对采集的音频内容进行语音识别处理，生成文本内容；

进一步地，步骤S2包括：

步骤S2-1：判断数据库中是否包含与外部关键词相匹配的内部关键词，若是，则执行步骤S2-2，若否则执行步骤S2-3；

步骤S2-2：判断数据库中是否包含与步骤S2-1中所匹配的内部关键词相对应的目标内容条目，若是，则将对应的目标内容条目作为查询结果，若否，则执行步骤S2-3；

步骤S2-3：将未查询到内容的提示作为查询结果。

进一步地，由用户选择步骤S1-4输出的图形化选框的数量。

进一步地，步骤S2包括：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容同时对应的一个目标内容条目作为查询结果。

作为替代，步骤S2包括：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容对应的多个目标内容条目作为查询结果。

进一步地，所述内部数据库可以是本地数据库，也可以是位置网络服务器上的数据库。

基于上述文字内容检索方法，本发明还进一步提出一种词语解读装置，包括：

图像采集单元，用于从外部文字内容载体上采集包含待解读词语的图像内容。

图像处理模块，用于对图像进行预处理及基于用户指令的图像分割。

文本提取模块，用于对图像内容实施文字识别处理，生成文本内容。

语音采集单元，用于采集外部包含待解读词语的音频内容。

语音识别模块，用于对音频内容实施语音识别处理，生成文本内容。

数据库模块，用于存储词语解读内容，每条词语解读内容都设置有关键词。

查询模块，用于通过关键词匹配，获得与待解读词语对应的词语解读内容并输出。

显示模块，用于显示查询模块输出的词语解读内容。

进一步地，所述图像采集单元、图像处理模块、文本提取模块依次连接，语音采集单元和语音识别模块连接，文本提取模块、语音识别模块、数据库模块、显示模块分别与查询模块连接。

外部载体上词语经图像采集单元采集生成图像，并输出至图像处理模块；图像处理模块对采集的图像进行线性变换，调整图像中字体大小后输出到显示屏上显示，图像处理模块输出图形化选框并在显示屏上显示，经用户调整图形化选框大小及位置并确认后，图像处理模块以图形化选框轮廓为边界切割显示中的图像，获得目标图像并输出给文本提取模块；文本提取模块对目标图像进行文字识别处理，生成文本内容并输出给查询模块；查询模块读取数据库模块中词语解读内容的关键词，并与文本提取模块输出的文本内容进行匹配，获得匹配结果后，将关键词与文本内容匹配的词语解读内容输出给显示模块，显示模块将词语解读内容显示在显示屏上。

基于上述词语解读装置，本发明进一步提出一种具有词语解读功能的移动终端，包括处理器、闪存、随机存储器、触摸显示屏、摄像头、MIC，该预装有操作系统及摄像头、MIC的驱动程序，其特征在于，该移动终端内还配置有：

图像采集模块，用于调用摄像头，并生成摄像头所捕捉的图像内容。

图像处理模块，与图像采集模块连接，用于调用触摸显示屏，对图像进行预处理，并基于触摸显示屏输入的指令对图像进行分割。

文本提取模块，分别与图像处理模块和查询模块连接，用于对图像内容实施文字识别处理，生成文本内容，并输出给查询模块。

语音采集模块，用于调用MIC，并生成MIC所捕捉的音频内容。

语音识别系统，分别与语音采集模块和查询模块连接，用于对音频内容实施语音识别处理，生成文本内容，并输出给查询模块。

数据库模块，与查询模块连接，用于存储词语解读内容，每条词语解读内容都设置有关键词。

查询模块，用于通过关键词匹配获得与待解读词语对应的词语解读内容并输出。

显示模块，用于调用显示屏，并在显示屏上显示查询模块输出的词语解读内容。

本发明有益效果：本发明通过图像识别、文本提取、语音识别和数据库比对技术，解读出词语的含义、用途、中英文翻译、相关典故等。该方法操作简单，准确度较高，节省了用户的时间和精力，同时也加强了读者对词语更好的理解。

附图说明

图1为一种简易的词语解读app结构组成框图。

图2为词语解读app以图像识别渠道为例的词语解读流程图。

具体实施方式

下面以几个实施例分别进一步介绍本发明所述的检索方法、检索系统、词语解读装置、移动终端。

实施例1

本实施例文字内容检索方法，包括：

步骤S1-1：采集包含有待查询关键词的音频内容；

步骤S2-3：将未查询到内容的提示作为查询结果。

步骤S3：输出查询结果。

实施例2

本实施例文字内容检索方法，包括：

步骤S1-1：采集包含有待查询关键词的图像内容；

步骤S1-4：输出图形化选框并在显示装置上显示；

步骤S1-7：对目标图像实施文字识别处理，生成文本内容；

步骤S2-3：将未查询到内容的提示作为查询结果。

步骤S3：输出查询结果。

实施例3

本实施例文字内容检索方法，包括：

步骤S1-1：采集包含有待查询关键词的图像内容；

步骤S1-4：输出多个图形化选框并在显示装置上显示；

步骤S1-5：分别调整图形化选框大小及位置，使每个图形化选框所对应的显示区域内包含一个待查询关键词；

步骤S1-7：对目标图像实施文字识别处理，生成文本内容；

步骤S2：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容同时对应的一个目标内容条目作为查询结果；

步骤S3：输出查询结果。

实施例4

本实施例文字内容检索方法，包括：

步骤S1-1：采集包含有待查询关键词的图像内容；

步骤S1-4：输出多个图形化选框并在显示装置上显示；

步骤S1-7：对目标图像实施文字识别处理，生成文本内容；

步骤S2：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容对应的多个目标内容条目作为查询结果；

步骤S3：输出查询结果。

实施例5

本实施例提供了包含文字内容检索方法的系统，包括：图像采集单元，用于从外部文字内容载体上采集包含待查询关键词的图像内容；图像处理模块，用于对图像进行预处理及基于用户指令的图像分割；文本提取模块，用于对图像内容实施文字识别处理，生成文本内容；语音采集单元，用于采集外部包含待查询关键词的音频内容；语音识别模块，用于对音频内容实施语音识别处理，生成文本内容；数据库模块，用于存储内部关键词内容和与内部关键词内容对应的结果内容，所述数据库模块可以位于本地存储器上，也可以位于网络服务器上，与查询模块通过网络连接；查询模块，用于匹配外部待查询关键词和内部查询关键词，并输出与匹配关键词对应的结果内容；显示模块，用于显示查询模块输出的结果内容。

图像采集单元、图像处理模块、文本提取模块依次连接，语音采集单元和语音识别模块连接，文本提取模块、语音识别模块、数据库模块、显示模块分别与查询模块连接。

外部载体上文字内容经图像采集单元采集生成图像，并输出至图像处理模块；图像处理模块对采集的图像进行线性变换，调整图像中字体大小后输出到显示屏上显示，图像处理模块输出图形化选框并在显示屏上显示，经用户调整图形化选框大小及位置并确认后，图像处理模块以图形化选框轮廓为边界切割显示中的图像，获得目标图像并输出给文本提取模块；文本提取模块对目标图像进行文字识别处理，生成文本内容并输出给查询模块；查询模块读取数据库模块中的内部关键词内容，并与文本提取模块输出的文本内容进行匹配，获得匹配结果后，将与匹配的内部关键词对应的结果内容输出给显示模块，显示模块将结果内容显示在显示屏上。

实施例6

本实施例词语解读装置，包括：图像采集单元，用于从外部文字内容载体上采集包含待解读词语的图像内容；图像处理模块，用于对图像进行预处理及基于用户指令的图像分割；文本提取模块，用于对图像内容实施文字识别处理，生成文本内容；语音采集单元，用于采集外部包含待解读词语的音频内容；语音识别模块，用于对音频内容实施语音识别处理，生成文本内容；数据库模块，用于存储词语解读内容，每条词语解读内容都设置有关键词，所述数据库模块可以位于本地存储器上，也可以位于网络服务器上，与查询模块通过网络连接；查询模块，用于通过关键词匹配，获得与待解读词语对应的词语解读内容并输出；显示模块，用于显示查询模块输出的词语解读内容。

实施例7

本实施例具有词语解读功能的移动终端，包括处理器、闪存、随机存储器、触摸显示屏、摄像头、MIC，该预装有操作系统及摄像头、MIC的驱动程序，其特征在于，该移动终端内还配置有：图像采集模块，用于调用摄像头，并生成摄像头所捕捉的图像内容；图像处理模块，与图像采集模块连接，用于调用触摸显示屏，对图像进行预处理，并基于触摸显示屏输入的指令对图像进行分割；文本提取模块，分别与图像处理模块和查询模块连接，用于对图像内容实施文字识别处理，生成文本内容，并输出给查询模块；语音采集模块，用于调用MIC，并生成MIC所捕捉的音频内容；语音识别系统，分别与语音采集模块和查询模块连接，用于对音频内容实施语音识别处理，生成文本内容，并输出给查询模块；数据库模块，与查询模块连接，用于存储词语解读内容，每条词语解读内容都设置有关键词；查询模块，用于通过关键词匹配获得与待解读词语对应的词语解读内容并输出；显示模块，用于调用显示屏，并在显示屏上显示查询模块输出的词语解读内容。

实施例8

本实施例基于本发明提出的方法及系统构建了一种简易的词语解读app，该app安装在移动终端中，例如：智能手机、平板电脑等。安装该app后的移动终端则成为前文所述的具有词语解读功能的移动终端。该移动终端需要配置有MIC和摄像头，并且MIC和摄像头驱动程序正常，功能正常可用。

本实施例一种简易的词语解读app，通过图像识别、文本提取、语音识别和数据库比对技术，解读出词语的含义、用途、典故、中英文翻译等等。

本app提供两种渠道获取待解读词语，分别是语音识别获取和图像文字识别获取，这两种获取方式均不需要用户借助输入法手动录入文字。两种获取方式分别操作如下：

语音识别获取：打开词语解读app后，如选择语音识别方式，则app调用音频输入接口，启动MIC，用户直接对着MIC说出需要查询的词语即可。

文字识别获取：打开词语解读app后，如选择文字识别方式，则app调用移动终端的摄像头。通过摄像头采集一幅包含待解读词语的图片。由于摄像头本身的限制以及文字大小的关系，采集的图片上势必会包含一些无用信息(如其它的文字)，为了尽快的查询词语，app提供框选功能，摄像头采集的图片显示在屏幕上，用户点击识别框启动按钮，启动app框选功能，app在屏幕上构造一个矩形的识别框。用户通过调整图片和识别框的大小，将需要解读的词语锁定在识别框中。然后app根据矩形识别框颜色和边缘信息可以很快的得到矩形框所处的坐标，并根据这些坐标从原图片中分割出目标图片，再对目标图片实施文字识别处理，提取出待解读词语。

下面参照图1、2，详细说明本例词语解读app的结构组成及工作流程。

根据附图1，本实施例词语解读app主要包括图像采集模块、图像处理模块、文本提取模块、语音采集模块、语音识别模块、数据库模块、显示模块。

其中，图像采集模块工作时需调用移动终端摄像头，通过延时或用户确认的方式，将摄像头前方所捕捉的图像内容保存并输出给图像处理模块。

图像处理模块与图像采集模块连接，其工作时会调用触摸显示屏，对图像进行预处理后将其显示在屏幕上，然后根据用户操作对图像进行分割。最后将经分割获得目标图像输出给文本提取模块。

文本提取模块分别与图像处理模块和查询模块连接，当接收到来自图像处理模块的目标图像后，对图像实施文字识别处理，生成文本内容，然后输出给查询模块。

语音采集模块工作时需调用移动终端的MIC，将MIC所捕获的声音信号处理成音频内容并发送给语音识别系统。

语音识别系统分别与语音采集模块和查询模块连接，当接收到来自语音采集模块的音频内容后，对音频内容实施语音识别处理，生成文本内容，然后输出给查询模块。

数据库模块内存储有词语解读内容，而且所存储的每条词语解读内容都设置有关键词。所述数据库模块可以是设在终端设备的本地存储器中，也可以设置在网络服务器中，与查询模块通过网络通讯连接。

查询模块接收到文本提取模块或语音识别模块的文本内容后，通过关键词匹配获得与待解读词语对应的词语解读内容并输出给显示模块。

显示模块工作时需调用移动终端的显示屏，并在显示屏上显示查询模块输出的词语解读内容。

根据附图2，使用图像识别渠道的词语解读流程，具体步骤如下：

1、移动终端通过图像采集模块采集含有待测词语的文字图像，如下图2，待测词语为“智慧城市”。主要的采集模块为智能终端的摄像头；

2、图像处理模块对采集的图像进行线性变换，将原始图像的字体大小调到合适的位置。接着点击app上面的矩形识别框，将待查询的词语锁定在框中。矩形识别框的大小也是可调的，并且可以一次添加多个矩形框，用户可自行选择；

3、根据矩形识别框颜色和边缘信息可以很快的得到矩形框所处的坐标，并根据这些坐标分割出目标图片。

4、通过文字识别技术将目标图片转换成文本格式。

5、比对数据库，识别出待查询词语的含义、用途、典故、中英文翻译等。

6、最后按先后顺序依次输出到显示模块中。

需要说明的是：以上内容是对本发明技术方案的解释说明，并非针对本发明保护范围而做出的限定，不难想到的是，任何基于本发明提出的发明构思，结合本领域常规知识不经创造性劳而做出的具体实施方式，均属于对本发明的一种实施，应当落入本发明保护范围之内。

Claims

1.一种文字内容检索方法，所述文字内容包括存储在内部数据库中的关键词内容和与关键词内容对应的结果内容；

其特征在于，包括：

步骤S1：从外部获取待查询关键词的文本内容；

步骤S2：匹配外部关键词与内部关键词内容；将与外部关键词相匹配的内部关键词内容所对应的目标内容条目作为查询结果；

步骤S3：输出查询结果。

2.根据权利要求1所述的文字内容检索方法，其特征在于，从外部获取待查询关键词的方法包括：

步骤S1-1：采集包含有待查询关键词的图像内容；

步骤S1-4：输出图形化选框并在显示装置上显示；

步骤S1-7：对目标图像实施文字识别处理，生成文本内容。

3.根据权利要求1所述的文字内容检索方法，其特征在于，从外部获取待查询关键词的方法包括：

步骤S1-1：采集包含有待查询关键词的音频内容；

步骤S1-2：对采集的音频内容进行语音识别处理，生成文本内容。

4.根据权利要求1所述的文字内容检索方法，其特征在于，步骤S2包括：

步骤S2-3：将未查询到内容的提示作为查询结果。

5.根据权利要求2所述的文字内容检索方法，其特征在于，由用户选择步骤S1-4输出的图形化选框的数量。

6.根据权利要求5所述的文字内容检索方法，其特征在于，步骤S2包括：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容同时对应的一个目标内容条目作为查询结果。

7.根据权利要求5所述的文字内容检索方法，其特征在于，步骤S2包括：分别匹配多个外部关键词与内部存储的关键词内容；获得分别与多个外部关键词相匹配的多个内部关键词；将与多个匹配的内部关键词内容对应的多个目标内容条目作为查询结果。

8.一种词语解读装置，其特征在于，包括：

图像采集单元，用于从外部文字内容载体上采集包含待解读词语的图像内容；

图像处理模块，用于对图像进行预处理及基于用户指令的图像分割；

文本提取模块，用于对图像内容实施文字识别处理，生成文本内容；

语音采集单元，用于采集外部包含待解读词语的音频内容；

语音识别模块，用于对音频内容实施语音识别处理，生成文本内容；

数据库模块，用于存储词语解读内容，每条词语解读内容都设置有关键词；

查询模块，用于通过关键词匹配，获得与待解读词语对应的词语解读内容并输出；

显示模块，用于显示查询模块输出的词语解读内容。

9.根据权利要求8所述的词语解读装置，其特征在于，所述图像采集单元、图像处理模块、文本提取模块依次连接，语音采集单元和语音识别模块连接，文本提取模块、语音识别模块、数据库模块、显示模块分别与查询模块连接；

10.一种具有词语解读功能的移动终端，包括处理器、闪存、随机存储器、触摸显示屏、摄像头、MIC，该预装有操作系统及摄像头、MIC的驱动程序，其特征在于，该移动终端内还配置有：

图像采集模块，用于调用摄像头，并生成摄像头所捕捉的图像内容；

图像处理模块，与图像采集模块连接，用于调用触摸显示屏，对图像进行预处理，并基于触摸显示屏输入的指令对图像进行分割；

文本提取模块，分别与图像处理模块和查询模块连接，用于对图像内容实施文字识别处理，生成文本内容，并输出给查询模块；

语音采集模块，用于调用MIC，并生成MIC所捕捉的音频内容；

语音识别系统，分别与语音采集模块和查询模块连接，用于对音频内容实施语音识别处理，生成文本内容，并输出给查询模块；

数据库模块，与查询模块连接，用于存储词语解读内容，每条词语解读内容都设置有关键词；

查询模块，用于通过关键词匹配获得与待解读词语对应的词语解读内容并输出；