CN105447109A - 关键字词搜索方法及装置 - Google Patents
关键字词搜索方法及装置 Download PDFInfo
- Publication number
- CN105447109A CN105447109A CN201510778573.1A CN201510778573A CN105447109A CN 105447109 A CN105447109 A CN 105447109A CN 201510778573 A CN201510778573 A CN 201510778573A CN 105447109 A CN105447109 A CN 105447109A
- Authority
- CN
- China
- Prior art keywords
- image
- searched
- crucial words
- word message
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开是关于一种关键字词搜索方法及装置,属于信息搜索技术领域。所述方法包括:对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息,获取待搜索的关键字词,判断所述文字信息中是否包括所述关键字词,当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。提高了在实体类读物中搜索所述关键字词的准确率和效率,节省了时间。
Description
技术领域
本公开涉及信息搜索技术领域,尤其涉及关键字词搜索方法及装置。
背景技术
现代社会生活中,阅读是必不可少的活动。用户可以通过阅读来陶冶情操、提高个人修养,也可以通过阅读来获取新闻和生活资讯。通常,用户在阅读的过程中不会对读物的全部内容都感兴趣,而是只关注该读物中的部分特定的文字信息,例如某一篇文章中的某一句话、车站牌上的某个站名、餐厅菜单中的某一道菜名等,因此,需要一种关键字词搜索方法来搜索该读物中的该文字信息。
在阅读电子读物时,用户可以通过直接在搜索框中输入关键字词,方便快捷的搜索到该文字信息;但在阅读书籍、报刊、车站牌、餐厅菜单等实体类读物时,用户只能通过仔细阅读该实体类读物来进行搜索,当该文字信息在该实体类读物中的位置靠后时,用户可能需要仔细阅读该实体类读物的全部内容才能搜索到该文字信息,而且,当该实体类读物内容较多时,用户很容易疲劳而错过该文字信息。例如,当用户要在整个餐厅菜单中搜索某一道菜名时,只能通过逐字逐行地阅读该餐厅菜单的全部内容来搜索该菜名,准确率和效率都很低,浪费时间。
发明内容
为克服相关技术中存在的问题,本公开提供一种关键字词搜索方法及装置。
根据本公开实施例的第一方面,提供一种关键字词搜索方法,所述方法包括:
对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
获取待搜索的关键字词;
判断所述文字信息中是否包括所述关键字词;
当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
结合第一方面,在上述第一方面的第一种可能的实现方式中,所述获取待搜索的关键字词,包括:
接收用户手动输入的关键字词;或,
接收语音指令,对所述语音指令进行语音识别,得到所述关键字词。
结合第一方面,在上述第一方面的第二种可能的实现方式中,所述方法还包括:
所述获取待搜索的关键字词之后,当所述关键字词与所述文字信息的语种不同时,将所述关键字词翻译为与所述文字信息相同的语种。
结合第一方面,在上述第一方面的第三种可能的实现方式中,所述方法还包括:
所述对待搜索图像进行文字识别之前,将取景框内的图像获取为待搜索图像;或,
所述对待搜索图像进行文字识别之前,将终端获取得到的图像作为待搜索图像;或,
所述对待搜索图像进行文字识别之前,从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
结合第一方面,在上述第一方面的第四种可能的实现方式中,所述方法还包括:
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第一提示信息,所述第一提示信息用于提示用户所述待搜索图像中不包含所述关键字;或,
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第二提示信息,所述第二提示信息用于提示用户重新输入待搜索图像;或,
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第三提示信息,所述第三提示信息用于提示用户重新输入关键字词。
根据本公开实施例的第二方面,提供一种关键字词搜索装置,所述装置包括:
识别模块,用于对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
第一获取模块,用于获取待搜索的关键字词;
判断模块,用于判断所述文字信息中是否包括所述关键字词;
第一显示模块,用于当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
结合第二方面,在上述第二方面的第一种可能的实现方式中,所述第一获取模块用于:
接收用户手动输入的关键字词;或,
接收语音指令,对所述语音指令进行语音识别,得到所述关键字词。
结合第二方面,在上述第二方面的第二种可能的实现方式中,所述装置还包括:
翻译模块,用于当所述关键字词与所述文字信息的语种不同时,将所述关键字词翻译为与所述文字信息相同的语种。
结合第二方面,在上述第二方面的第三种可能的实现方式中,所述装置还包括:
第二获取模块,用于将取景框内的图像获取为待搜索图像;或,
第三获取模块,用于将终端获取得到的图像作为待搜索图像;或,
第四获取模块,用于从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
结合第二方面,在上述第二方面的第四种可能的实现方式中,所述装置还包括:
第二显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第一提示信息,所述第一提示信息用于提示用户所述待搜索图像中不包含所述关键字;或,
第三显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第二提示信息,所述第二提示信息用于提示用户重新输入待搜索图像;或,
第四显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第三提示信息,所述第三提示信息用于提示用户重新输入关键字词。
根据本公开实施例的第三方面,提供一种关键字词搜索装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
获取待搜索的关键字词;
判断所述文字信息中是否包括所述关键字词;
当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开实施例中,对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息,获取待搜索的关键字词,判断所述文字信息中是否包括所述关键字词,当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。通过将实体类读物转换为图像,从而能够通过对图像的文字识别,达到将实体类读物上的文字数字化的目的,此时,可以采用文字搜索的方式对关键字词进行搜索,大大提高了在实体类读物中搜索该关键字词的准确率和效率,节省了时间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种关键字词搜索方法的流程图。
图2是根据一示例性实施例示出的另一种关键字词搜索方法的流程图。
图3是根据一示例性实施例示出的一种获取待搜索图像的终端界面示意图。
图4是根据一示例性实施例示出的一种提供提供文字搜索框或语音输入按键的终端界面示意图。
图5是根据一示例性实施例示出的一种搜索失败时的终端界面示意图。
图6是根据一示例性实施例示出的一种搜索成功时的终端界面示意图。
图7是根据一示例性实施例示出的一种关键字词搜索装置的框图。
图8是根据一示例性实施例示出的另一种关键字词搜索装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种关键字词搜索方法的流程图,如图1所示,该关键字词搜索方法用于终端中,包括以下步骤。
在步骤101中,对待搜索图像进行文字识别,得到该待搜索图像中的文字信息。
在步骤102中,获取待搜索的关键字词。
在步骤103中,判断该文字信息中是否包括该关键字词。
在步骤104中,当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开实施例中,对待搜索图像进行文字识别,得到该待搜索图像中的文字信息,获取待搜索的关键字词,判断该文字信息中是否包括该关键字词,当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。通过将实体类读物转换为图像,从而能够通过对图像的文字识别,达到将实体类读物上的文字数字化的目的,此时,可以采用文字搜索的方式对关键字词进行搜索,大大提高了在实体类读物中搜索该关键字词的准确率和效率,节省了时间。
在本公开的另一实施例中,该获取待搜索的关键字词,包括:
接收用户手动输入的关键字词;或,
接收语音指令,对该语音指令进行语音识别,得到该关键字词。
在本公开的另一实施例中,该方法还包括:
获取待搜索的关键字词之后,当该关键字词与该文字信息的语种不同时,将该关键字词翻译为与该文字信息相同的语种。
在本公开的另一实施例中,该方法还包括:
对待搜索图像进行文字识别之前,将取景框内的图像获取为待搜索图像;或,
对待搜索图像进行文字识别之前,将终端获取得到的图像作为待搜索图像;或,
对待搜索图像进行文字识别之前,从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
在本公开的另一实施例中,该方法还包括:
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第一提示信息,该第一提示信息用于提示用户该待搜索图像中不包含该关键字;或,
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第二提示信息,该第二提示信息用于提示用户重新输入待搜索图像;或,
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第三提示信息,该第三提示信息用于提示用户重新输入关键字词。
上述所有可选技术方案,均可按照任意结合形成本公开的可选实施例,本公开实施例对此不再一一赘述。
图2是根据一示例性实施例示出的另一种关键字词搜索方法的流程图。如图2所示,该关键字词搜索方法用于终端中,包括以下步骤。
在步骤201中,获取待搜索图像。
为了在阅读书籍、报刊、车站牌、餐厅菜单等实体类读物中搜索某些特定的文字信息,终端可以获取该实体类读物的图像作为待搜索图像,然后在该搜索图像中搜索该特定的文字信息。
其中,该获取待搜索图像可以包括下述任一种方式:
第一种方式,将取景框内的图像获取为待搜索图像。
当将取景框内的图像获取为待搜索图像时,需要用户保持该实体类读物在搜索过程中一直处于取景框内,但当需要搜索的范围很大时,可以在当前取景框内不存在搜索结果时,移动取景框,并将该取景框内的新图像作为待搜索图像,继续搜索,提高了搜索的效率。
第二种方式,将终端获取得到的图像作为待搜索图像。
当将终端获取得到的图像作为待搜索图像时,会占用该终端的部分存储空间,但当用户无需再次搜索就可以查阅该搜索结果,减少了重复性搜索。
其中,该终端获取得到的图像可以是:1,用户使用该终端拍摄得到;2,用户从网络上下载得到;3,其他用户发送给当前用户,并存储于当前终端的图像。当然该终端还可以由其它方式获取得到该图像,本公开实施例对此不作具体限定。
第三种方式,从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
其中,该多媒体片段可以是视频片段、动图(如.gif格式文件)或flash文件等动态显示的片段。该多媒体片段可能是以下任一种形式:
第一种形式、终端所获取的多媒体片段可以是针对一个静态目标的多媒体片段。
在这种情况下,根据该多媒体片段所包括的多个图像的不同可以有以下不同的处理方式:
第一种处理方式、当该多媒体片段包括多个相似度超过第一预设阈值的图像时,可以获知该多个相似度超过预设阈值的图像是对于同一个拍摄目标的图像,则从该多个图像中,获取清晰度最高的图像作为待搜索图像。
第二种处理方式、当该多媒体片段包括两两之间具有重叠部分的图像时,可以获知该两两之间具有重叠部分的图像是对于同一个拍摄目标的连续图像,则从该多个图像中,获取该两两之间具有重叠部分的图像作为待搜索图像,例如,一个菜单较长,为了完整识别,则可以录制包括了整体菜单的视频片段,并基于该视频片段获取待搜索图像。
当然,除了上述两种处理方式以外,还可以有其他处理方式,例如,对该多媒体片段中所包括的多个图像进行字符识别,如果任一个图像中包括字符,则将该图像获取为待搜索图像,本公开在此不作赘述。
第二种形式、终端所获取的多媒体片段可以是针对一个动态目标的多媒体片段。
该动态目标可以是一个正在播放的视频片段等,为了及时捕捉该动态目标,终端可以采用录制多媒体片段的方式,来获取能够包括该动态目标的多媒体片段。
在基于这种多媒体片段获取待搜索图像时,其具体过程可以与上述第一种形式中的处理过程同理,在此不作赘述。
需要说明的是,该终端获取该多媒体片段可以是:1,用户使用该终端拍摄得到;2,用户从网络上下载得到;3,其他用户发送给当前用户,并存储于当前终端的多媒体片段。当然该终端还可以由其它方式获取得到该多媒体片段,本公开实施例对此不作具体限定。
在步骤202中,对待搜索图像进行文字识别,得到该待搜索图像中的文字信息。
由于关键字搜索需要在已有文字信息中进行,因此,需要对待搜索图像进行文字识别。该文字识别过程可以包括:按照默认语种模型,对待搜索图像进行文字识别,得到待搜索图像中的文字信息。需要说明的是,由于用户当前查看的很可能是自己最熟悉的语种,因此,可以采用默认语种模型进行识别。相应地,该终端可以将任一个语种设置为默认语种,对待搜索图像进行文字识别时,将该待搜索图像优先与该默认语种模型匹配,识别该待搜索图像中的文字信息,提高识别的该待搜索图像中文字信息的准确率和效率。
当然,还有可能存在需要辨别语种的情况,那么可以根据多个不同语种的语种模型,在待搜索图像中进行识别,得到该待搜索图像中的文字信息。通过在识别过程中采用多个不同语种的语种模型进行识别,可以满足不同地域用户的搜索需求,同时提高识别该待搜索图像中文字信息的准确率和效率。当然,终端还可以将从多个语种中选择部分语种作为常用语种,从而在进行识别时,优先使用这些常用语种进行识别,以提高识别的该待搜索图像中文字信息的准确率和效率。
在步骤203中,获取待搜索的关键字词。
基于该关键字词,终端可以搜索到用户所关注的特定文字信息,该关键字词是该特定文字信息中的部分或者全部字词。当然,该关键字词可以是指一个或多个字词,本公开实施例对此不作具体限定。
其中,获取待搜索的关键字词可以包括下述任一种实现方式:
第一种实现方式,接收用户手动输入的关键字词。
在步骤201之后,可以在终端界面上提供关键字词的文字输入框,使得用户能够在该文字输入框中进行输入。当然,该提供文字输入框的步骤可以是在步骤202的识别过程中实现,还可以是在步骤202进行了识别,且提示文字信息识别成功后实现,本公开实施例对该实现时机不作具体限定。
第二种实现方式,接收语音指令,对该语音指令进行语音识别,得到该关键字词。
在步骤201之后,可以在终端界面上提供关键字词的语音输入按键,使得用户能够触发该语音输入按键,并基于麦克风进行语音输入,从而使得终端接收到语音指令,并通过语音识别,获知待搜索的关键字词。当然,该提供语音输入按键的步骤可以是在步骤202的识别过程中实现,还可以是在步骤202进行了识别,且提示文字信息识别成功后实现,本公开实施例对该实现时机不作具体限定。
进一步地,终端在步骤202过程中,还可以得到该文字信息的语种,而在采用上述第一种或第二种实现方式获取待搜索的关键字词时,也可以得到该关键字词的语种,如果文字信息与关键字词的语种相同,则可以直接进行后续搜索,以确定文字信息中是否包括该关键字词,而如果文字信息与关键字词的语种不同,则需要对关键字词进行翻译,得到该关键字词的翻译版本,从而能够进行后续搜索,通过比较语种,可以提高搜索的成功率,避免由于语种不同而造成的搜索失败等情况。
在步骤204中,判断该文字信息中是否包括该关键字词,如果是,执行步骤205,如果否,执行步骤206。
在获取该待搜索图像中的该文字信息和该关键字词时,可以直接开始搜索,或者,基于用户对搜索选项的触发操作,确定开始搜索,本公开实施例对此不作具体限定。
需要说明的是,由于不同用户可能有不同的搜索习惯,而且,当将该关键字词翻译为与该文字信息相同的语种时,该关键字词的语意也可能并不是完全吻合,因此,该终端可以进行精确搜索或者模糊搜索,当然,也可以由用户预先设定优先进行精确搜索或者模糊搜索,本公开实施例对此不作具体限定。其中,精确搜索是指:当该文字信息中存在该关键字词时,确定该文字信息中存在该关键字词;模糊搜索是指:当该文字信息中存在该关键字词部分相同或者语意相近的字词时,确定该文字信息中存在该关键字词。
当然,由于步骤204的判断是基于未翻译的关键字词进行,也可能存在由于语种不同而未搜索到的情况,因此,可以在确定文字信息不包括关键字词时,还可以进行上述的翻译步骤,再基于关键字词的翻译版本进一步进行搜索,从而避免由于语种不同而造成的遗漏,提高了搜索成功率。
在步骤205中,当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。
其中,该突出显示用于提示该文字信息中包括该关键字词,该突出显示可以是高亮显示、闪烁显示、对该关键字词添加符号标注等容易引起用户注意的显示方式,本公开实施例对此不作具体限定。该关键字词对应的图像部分可以是关键字词所在的行区域或关键字词的字宽和字高所确定的显示区域等,本公开实施例对此不作具体限定。
在步骤206中,当该文字信息中不包括该关键字词时,在该待搜索图像上显示第一提示信息,该第一提示信息用于提示用户该待搜索图像中不包含该关键字词;或,当该文字信息中不包括该关键字词时,在该待搜索图像上第二显示提示信息,该第二提示信息用于提示用户重新输入待搜索图像;或,当该文字信息中不包括该关键字词时,在该待搜索图像上显示第三提示信息,该第三提示信息用于提示用户重新输入关键字词。
本公开实施例是以如果搜索不到关键字词,则直接显示提示信息为例进行说明,而在另一实施例中,可以是在搜索不到关键字词以及关键字词的翻译版本时,再进行如上述的提示信息显示,当然,还可以是在搜索不到关键字词,再进行关键字词翻译,如果翻译版本仍然搜索不到,则显示提示信息。该显示还可以应用于其他组合方案的场景,本公开实施例对此不作具体限定。
进一步地,如果当前搜索为精确搜索,且该文字信息中不包括该关键字词,该提示信息还可以用于提示用户将精确搜索改为模糊搜索,然后在该文字信息中再次搜索该关键字词。
例如,获取待搜索图像如图3所示,从该待搜索图像中识别的文字信息为“Youhidyourskeletons,whenIhadshownyoumine。youwokethedevilthatIthoughtyouleftbehind。Isawtheevidencethecrimsonsoakingthrough。Tenthousandpromises,tenthousandwaystolose”,语种为英语;在终端界面上提供文字搜索框或语音输入按键如图4所示,获取待搜索的关键字词为“Allmenarecreatedequal”,语种为英语,该关键字词和该文字信息语种相同,搜索后判断该文字信息中不包括该关键字词,则显示提示信息如图5所示。重新获取待搜索的关键字词为“一万”,语种为汉语,该关键字词和该文字信息语种不同,则将“一万”翻译为英语“Tenthousand”,搜索后判断该文字信息中包括该关键字词,在该待搜索图像上,突出显示该关键字词对应的图像部分,如图6所示。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开实施例中,对待搜索图像进行文字识别,得到该待搜索图像中的文字信息,获取待搜索的关键字词,判断该文字信息中是否包括该关键字词,当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。通过将实体类读物转换为图像,从而能够通过对图像的文字识别,达到将实体类读物上的文字数字化的目的,此时,可以采用文字搜索的方式对关键字词进行搜索,大大提高了在实体类读物中搜索该关键字词的准确率和效率,节省了时间。进一步地,通过在获取待搜索的关键字词时,当该关键字词与该文字信息的语种不同时,将该关键字词翻译为与所述文字信息相同的语种,进行跨语种搜索,满足了不同地域用户的搜索需求,而且,可以由用户设置优先语种、优先搜索方式,进一步提高了在实体类读物中搜索该关键字词的准确率和效率。
图7是根据一示例性实施例示出的一种关键字词搜索装置框图。参照图7,该装置包括识别模块701,第一获取模块702,判断模块703和第一显示模块704。
识别模块701,用于对待搜索图像进行文字识别,得到该待搜索图像中的文字信息;
第一获取模块702,用于获取待搜索的关键字词;
判断模块703,用于判断识别模块701识别的该文字信息中是否包括第一获取模块702获取的该关键字词;
第一显示模块704,用于当判断模块703判断得该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。
在本公开的另一实施例中,该第一获取模块702用于接收用户手动输入的关键字词;或接收语音指令,对该语音指令进行语音识别,得到该关键字词。
在本公开的另一实施例中,该装置还包括翻译模块305。
翻译模块705,用于当第一获取模块702获取的该关键字词与识别模块701识别的该文字信息的语种不同时,将该关键字词翻译为与该文字信息相同的语种。
在本公开的另一实施例中,该装置还包括第二获取模块706,或第三获取模块707。
第二获取模块706,用于将取景框内的图像获取为待搜索图像;或,
第三获取模块707,用于将终端获取得到的图像作为待搜索图像;或,
第四获取模块708,用于从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
在本公开的另一实施例中,该装置还包括第二显示模块709、第三显示模块710或第四显示模块711。
第二显示模块709,用于当该文字信息中不包括该关键字词时,在该待搜索图像上显示第一提示信息,该第一提示信息用于提示用户该待搜索图像中不包含该关键字;或,
第三显示模块710,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第二提示信息,该第三提示信息用于提示用户重新输入待搜索图像;或,
第四显示模块711,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第三提示信息,该第三提示信息用于提示用户重新输入关键字词。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开实施例中,对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息,获取待搜索的关键字词,判断所述文字信息中是否包括所述关键字词,当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。通过将实体类读物转换为图像,从而能够通过对图像的文字识别,达到将实体类读物上的文字数字化的目的,此时,可以采用文字搜索的方式对关键字词进行搜索,大大提高了在实体类读物中搜索该关键字词的准确率和效率,节省了时间。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的另一种关键字词搜索装置800的框图。例如,装置800可以是智能手机,计算机,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述关键字词搜索方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种关键字词搜索方法,所述方法包括:
对待搜索图像进行文字识别,得到该待搜索图像中的文字信息;
获取待搜索的关键字词;
判断该文字信息中是否包括该关键字词;
当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。
在本公开的另一实施例中,该获取待搜索的关键字词,包括:
接收用户手动输入的关键字词;或,
接收语音指令,对该语音指令进行语音识别,得到该关键字词。
在本公开的另一实施例中,该方法还包括:
获取待搜索的关键字词之后,当该关键字词与该文字信息的语种不同时,将该关键字词翻译为与该文字信息相同的语种。
在本公开的另一实施例中,该方法还包括:
对待搜索图像进行文字识别之前,将取景框内的图像获取为待搜索图像;或,
对待搜索图像进行文字识别之前,将终端获取得到的图像作为待搜索图像;或,对待搜索图像进行文字识别之前,从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
在本公开的另一实施例中,该方法还包括:
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第一提示信息,该第一提示信息用于提示用户该待搜索图像中不包含该关键字;或,
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第二提示信息,该第二提示信息用于提示用户重新输入待搜索图像;或,
当该文字信息中不包括该关键字词时,在该待搜索图像上显示第三提示信息,该第三提示信息用于提示用户重新输入关键字词。
本公开的实施例提供的技术方案可以包括以下有益效果:在本公开实施例中,对待搜索图像进行文字识别,得到该待搜索图像中的文字信息,获取待搜索的关键字词,判断该文字信息中是否包括该关键字词,当该文字信息中包括该关键字词时,在该待搜索图像上,突出显示该关键字词对应的图像部分。通过将实体类读物转换为图像,从而能够通过对图像的文字识别,达到将实体类读物上的文字数字化的目的,此时,可以采用文字搜索的方式对关键字词进行搜索,大大提高了在实体类读物中搜索该关键字词的准确率和效率,节省了时间。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (11)
1.一种关键字词搜索方法,其特征在于,所述方法包括:
对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
获取待搜索的关键字词;
判断所述文字信息中是否包括所述关键字词;
当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
2.如权利要求1所述的方法,其特征在于,所述获取待搜索的关键字词,包括:
接收用户手动输入的关键字词;或,
接收语音指令,对所述语音指令进行语音识别,得到所述关键字词。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述获取待搜索的关键字词之后,当所述关键字词与所述文字信息的语种不同时,将所述关键字词翻译为与所述文字信息相同的语种。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述对待搜索图像进行文字识别之前,将取景框内的图像获取为待搜索图像;或,
所述对待搜索图像进行文字识别之前,将终端获取得到的图像作为待搜索图像;或,
所述对待搜索图像进行文字识别之前,从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第一提示信息,所述第一提示信息用于提示用户所述待搜索图像中不包含所述关键字;或,
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第二提示信息,所述第二提示信息用于提示用户重新输入待搜索图像;或,
当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第三提示信息,所述第三提示信息用于提示用户重新输入关键字词。
6.一种关键字词搜索装置,其特征在于,所述装置包括:
识别模块,用于对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
第一获取模块,用于获取待搜索的关键字词;
判断模块,用于判断所述文字信息中是否包括所述关键字词;
第一显示模块,用于当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
7.如权利要求6所述的装置,其特征在于,所述第一获取模块用于:
接收用户手动输入的关键字词;或,
接收语音指令,对所述语音指令进行语音识别,得到所述关键字词。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
翻译模块,用于当所述关键字词与所述文字信息的语种不同时,将所述关键字词翻译为与所述文字信息相同的语种。
9.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于将取景框内的图像获取为待搜索图像;或,
第三获取模块,用于将终端获取得到的图像作为待搜索图像;或,
第四获取模块,用于从终端获取的多媒体片段所包括的多个图像中,获取至少一个图像作为待搜索图像。
10.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第一提示信息,所述第一提示信息用于提示用户所述待搜索图像中不包含所述关键字;或,
第三显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第二提示信息,所述第二提示信息用于提示用户重新输入待搜索图像;或,
第四显示模块,用于当所述文字信息中不包括所述关键字词时,在所述待搜索图像上显示第三提示信息,所述第三提示信息用于提示用户重新输入关键字词。
11.一种关键字词搜索装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
对待搜索图像进行文字识别,得到所述待搜索图像中的文字信息;
获取待搜索的关键字词;
判断所述文字信息中是否包括所述关键字词;
当所述文字信息中包括所述关键字词时,在所述待搜索图像上,突出显示所述关键字词对应的图像部分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510778573.1A CN105447109A (zh) | 2015-11-13 | 2015-11-13 | 关键字词搜索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510778573.1A CN105447109A (zh) | 2015-11-13 | 2015-11-13 | 关键字词搜索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105447109A true CN105447109A (zh) | 2016-03-30 |
Family
ID=55557287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510778573.1A Pending CN105447109A (zh) | 2015-11-13 | 2015-11-13 | 关键字词搜索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105447109A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956121A (zh) * | 2016-05-06 | 2016-09-21 | 长沙市麓智信息科技有限公司 | 专利检索分析辅助系统及其辅助方法 |
CN105956954A (zh) * | 2016-05-06 | 2016-09-21 | 长沙市麓智信息科技有限公司 | 重复提案监控系统及其监控方法 |
CN108345839A (zh) * | 2018-01-22 | 2018-07-31 | 维沃移动通信有限公司 | 一种关键词定位的方法及移动终端 |
CN108491839A (zh) * | 2018-03-27 | 2018-09-04 | 北京小米移动软件有限公司 | 信息获取方法及装置 |
CN109635683A (zh) * | 2018-11-27 | 2019-04-16 | 维沃移动通信有限公司 | 一种图像中的内容提取方法及终端设备 |
CN109961068A (zh) * | 2017-12-26 | 2019-07-02 | 阿里巴巴集团控股有限公司 | 图像识别、训练、搜索方法和装置及设备、介质 |
CN111933141A (zh) * | 2020-08-31 | 2020-11-13 | 江西台德智慧科技有限公司 | 一种基于大数据的人工智能语音交互系统 |
CN112052312A (zh) * | 2019-06-05 | 2020-12-08 | 阿里巴巴集团控股有限公司 | 信息提供、商品查询、问答处理方法、设备、存储介质 |
CN113168514A (zh) * | 2018-11-25 | 2021-07-23 | 谷歌有限责任公司 | 查找和过滤视觉场景的元素 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914539A (zh) * | 2014-04-01 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 信息查询方法和装置 |
CN104239568A (zh) * | 2014-09-29 | 2014-12-24 | 上海斐讯数据通信技术有限公司 | 一种基于图片说明的快速照片搜索系统和方法 |
US20150317530A1 (en) * | 2012-03-14 | 2015-11-05 | Omron Corporation | Key word detection device, control method, and display apparatus |
-
2015
- 2015-11-13 CN CN201510778573.1A patent/CN105447109A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150317530A1 (en) * | 2012-03-14 | 2015-11-05 | Omron Corporation | Key word detection device, control method, and display apparatus |
CN103914539A (zh) * | 2014-04-01 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 信息查询方法和装置 |
CN104239568A (zh) * | 2014-09-29 | 2014-12-24 | 上海斐讯数据通信技术有限公司 | 一种基于图片说明的快速照片搜索系统和方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956121A (zh) * | 2016-05-06 | 2016-09-21 | 长沙市麓智信息科技有限公司 | 专利检索分析辅助系统及其辅助方法 |
CN105956954A (zh) * | 2016-05-06 | 2016-09-21 | 长沙市麓智信息科技有限公司 | 重复提案监控系统及其监控方法 |
CN109961068A (zh) * | 2017-12-26 | 2019-07-02 | 阿里巴巴集团控股有限公司 | 图像识别、训练、搜索方法和装置及设备、介质 |
CN108345839A (zh) * | 2018-01-22 | 2018-07-31 | 维沃移动通信有限公司 | 一种关键词定位的方法及移动终端 |
CN108491839A (zh) * | 2018-03-27 | 2018-09-04 | 北京小米移动软件有限公司 | 信息获取方法及装置 |
CN113168514A (zh) * | 2018-11-25 | 2021-07-23 | 谷歌有限责任公司 | 查找和过滤视觉场景的元素 |
CN109635683A (zh) * | 2018-11-27 | 2019-04-16 | 维沃移动通信有限公司 | 一种图像中的内容提取方法及终端设备 |
CN112052312A (zh) * | 2019-06-05 | 2020-12-08 | 阿里巴巴集团控股有限公司 | 信息提供、商品查询、问答处理方法、设备、存储介质 |
CN111933141A (zh) * | 2020-08-31 | 2020-11-13 | 江西台德智慧科技有限公司 | 一种基于大数据的人工智能语音交互系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105447109A (zh) | 关键字词搜索方法及装置 | |
CN104991789A (zh) | 应用程序开启方法和装置 | |
CN105488112A (zh) | 信息推送方法及装置 | |
CN104378441A (zh) | 日程创建方法和装置 | |
CN104539789A (zh) | 一种提示通话请求的方法和装置 | |
CN105068976A (zh) | 票务信息展示方法及装置 | |
CN106202150A (zh) | 信息显示方法及装置 | |
CN104268129A (zh) | 消息回复的方法及装置 | |
CN105677392A (zh) | 应用程序的推荐方法和装置 | |
CN105550643A (zh) | 医学术语识别方法及装置 | |
CN104850849A (zh) | 发送文字的方法、装置及终端 | |
CN104484438A (zh) | 图片处理方法及装置 | |
CN104461348A (zh) | 信息选取方法及装置 | |
CN104331503A (zh) | 信息推送的方法及装置 | |
CN105550235A (zh) | 信息获取方法及装置 | |
CN107229403B (zh) | 一种信息内容选择方法及装置 | |
CN105608064A (zh) | 字符替换方法及装置 | |
CN104281703A (zh) | 统一资源定位符url间相似度计算的方法及装置 | |
CN105302335B (zh) | 词汇推荐方法和装置及计算机可读存储介质 | |
CN105630749A (zh) | 一种数字信息的提取方法及装置 | |
CN107360322B (zh) | 信息提示方法及装置 | |
CN104182473A (zh) | 设置选项的显示方法及装置 | |
CN104836721A (zh) | 群组会话消息提醒方法及装置 | |
CN106844717A (zh) | 网页搜索显示方法及装置 | |
CN104281368A (zh) | 界面的显示方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160330 |