CN102708185A - 一种图片语音搜索方法 - Google Patents
一种图片语音搜索方法 Download PDFInfo
- Publication number
- CN102708185A CN102708185A CN2012101466847A CN201210146684A CN102708185A CN 102708185 A CN102708185 A CN 102708185A CN 2012101466847 A CN2012101466847 A CN 2012101466847A CN 201210146684 A CN201210146684 A CN 201210146684A CN 102708185 A CN102708185 A CN 102708185A
- Authority
- CN
- China
- Prior art keywords
- picture
- word
- phonetic search
- database
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种图片语音搜索方法,包括:101)在浏览图片或拍照时通过人机交互接收并判断是否对该图片设置文字标签,是进入下一步,否则退出标签设置步骤;102)接收并识别用户通过声音接收装置输入的语句;103)分析所述语句并将其分解为关键字或词语组合;104)将步骤103)中所述组合及其与图片的对应关系保存至图片数据库;对应还包括:201)接收并识别用户通过声音接收装置输入的语句;202)分析所述语句将其分解为关键字或词语组合;203)利用步骤202)中所述组合搜索图片数据库并判断是否有符合条件的记录,是显示所有符合条件的记录对应图片或图片列表,否则显示空或提示无符合条件的图片。
Description
技术领域
本发明涉及语音识别和计算机多媒体数据搜索技术,具体涉及一种图片语音搜索方法,尤其应用于智能手机。
背景技术
目前,手机相册的检索方法只能与文件夹,以时间等方式进行归类,不可以对图像的内容进行检索。但是一方面,图像的内容比较丰富,计算机很难识别,另一方面一些隐含的内容也不在图像中。因此图片检索也仅限于时间、文件夹,更没有对应的语音检索。同时,手机搜索图片必须考虑到不能对系统造成太大额外负担,且应当便于用户使用,而无须详细操作指导书,也不增加用户的额外负担。
发明内容
本发明需要解决的技术问题是,如何提供一种图片语音搜索方法,能对图片进行深度检索且便于用户实际操作和使用。
本发明的技术问题这样解决:构建一种图片语音搜索方法,利用声音接收装置,包括以下图片文字标签设置步骤:
101)在浏览图片或拍照时通过人机交互接收并判断是否对该图片设置文字标签?是进入下一步,否则退出图片文字标签设置步骤;
102)接收并识别用户通过声音接收装置输入的语句;
103)分析所述语句并将其分解为一个或一个以上的关键字或词语;
104)将步骤103)中所述关键字或词语以及它们与图片的对应关系保存至图片数据库;
该方法利用声音接收装置,还包括以下图片语音搜索步骤:
201)接收并识别用户通过声音接收装置输入的语句;
202)分析所述语句将其分解为一个或一个以上的关键字或词语;
203)利用步骤202)中所述关键字或词语及其组合搜索图片数据库并判断是否有符合条件的记录?是显示所有符合条件的记录对应图片或图片列表,否则显示空或提示无符合条件的图片。
按照本发明提供的图片语音搜索方法,所述关键字或词语包括地点、时间或事件,所述时间包括“旅游”、“骑车”等。
按照本发明提供的图片语音搜索方法,该方法中图片数据库是系统数据库或用户自定义数据库。
按照本发明提供的图片语音搜索方法,所述系统数据库包括新增的记录文字标签的字段。
按照本发明提供的图片语音搜索方法,该方法中语音搜索步骤发生在相册加载或用户自定义搜索时。
按照本发明提供的图片语音搜索方法,该方法应用在安卓(Android)、视窗(Windows)或苹果操作系统中的任一种。
按照本发明提供的图片语音搜索方法,该图片语音搜索方法应用于手持设备上。
按照本发明提供的图片语音搜索方法,所述手持设备包括智能手机、MP4或平板电脑等。
本发明提供的图片语音搜索方法,尤其应用于智能手机,较现有技术具有以下优点:
1、全语音交互,操作简单、系统占用小;
2、能对图片进行分类和标记;
3、能快速搜索。
附图说明
下面结合附图和具体实施例进一步对本发明进行详细说明:
图1为本发明具体实施例触摸屏智能手机上的图片语音搜索程序流程示意图;
图2为本发明具体实施例触摸屏智能手机上的拍照程序自动调用的图片文字标签语音设置程序流程示意图;
图3为本发明具体实施例触摸屏智能手机上的图片浏览程序调用的图片文字标签语音设置程序流程示意图。
具体实施方式
首先,说明本发明思想:
以具体文字标签对图片进行分类和标记的实现方式,从而达到方便快速地找到具有相同文字标签的图片。具体技术问题包括:㈠如何给图片增加文字标签:在拍照完毕或者查看图片时,增加添加语音描述语句的操作,如描述“某天在某地骑车”,语音服务收到此消息后根据句意分解出“某天”、“某地”和“骑车”等关键文字标签。在扫描多媒体图片时增加一个检索文字标签的动作,就是在扫描媒体图片时,增加给每张相片进行添加文字标签的动作;并且把文字标签信息保存到媒体数据库中。㈡图片搜索:在相册加载或者用户搜索中,启动语音服务,可以任意组合几个关键的文字标签,如“某地”+“某天”的组合,则对上述语音输入进行分解判断,分解出“某地”和“某天”的文字标签组合,将同时符合上述文字标签的图片查找出来,从而达到实现目标。
第二,说明本发明具体工作原理:
在系统数据库(媒体数据库)里增加一字段,用于记录图片文字标签。在拍照完毕或查看图片等界面,增加语音描述的图标,点击图标后,语音获取信息,如接收到“某天在某地骑车”的信息时,分解出“某天”、“某地”和“骑车”等关键文字标签,将这些关键文字标签加入到照片字段。这样进入相册时,可以根据文字标签来对图片进行归类,以达到相同文字标签的图片放在一起的目的。在搜索图片时,也可以通过任意组合几个关键的文字标签,如“某地”+“某天”的组合,则对上述语音输入进行分解判断,分解出“某地”和“某天”的文字标签组合,将同时符合上述文字标签的图片查找出来,从而达到快速查找的目的。比如进入相册可以快速查看到具有相同文字标签,如“旅游”的照片,可以快速根据语音搜索出具有相同文字标签的图片等,非常方便用户使用。
第三,结合本发明优选具体实施例进行详细说明:
如图1所示,本发明优选具体实施例触摸屏智能手机上的图片语音搜索程序具体包括以下步骤:
301)启动图片搜索;
302)启动语音识别服务记录输入语句;
303)分析关键文字标签和组合并利用它们搜索多媒体数据库;
304)若有结果,显示符合条件的图片;
305)若无结果,提示无图片符合条件。
如图2所示,本发明优选具体实施例触摸屏智能手机上的图片文字标签语音设置程序在拍照后设置入口,具体包括以下步骤:
401)拍照结束自动调用图片文字标签语音设置程序;
402)通过人机交互判断用户是否要为照片添加文字标签?是进入步骤404),否则进入下一步;
403)设置关键文字标签组合为空,进入步骤406);
404)启动语音识别服务记录输入语句;
405)分解出关键文字标签组合;
406)将关键文字标签组合保存到多媒体数据库中对应字段中。
如图3所示,本发明优选具体实施例触摸屏智能手机上的图片文字标签语音设置程序在图片浏览界面设置入口,具体包括以下步骤:
501)图片浏览界面中对图片进行浏览;
502)通过人机交互判断用户是否要为照片添加文字标签?是进入步骤504),否则进入下一步;
503)设置关键文字标签组合为空,进入步骤406);
504)启动语音识别服务记录输入语句;
505)分解出关键文字标签组合;
506)将关键文字标签组合保存到多媒体数据库中对应字段中。
最后,以上所述仅为本发明的较佳实施例,凡依本发明权利要求范围所做的均等变化与修饰,皆应属本发明权利要求的涵盖范围。
Claims (8)
1.一种图片语音搜索方法,其特征在于,该方法利用声音接收装置,包括以下图片文字标签设置步骤:
101)在浏览图片或拍照时通过人机交互接收并判断是否对该图片设置文字标签?是进入下一步,否则退出图片文字标签设置步骤;
102)接收并识别用户通过声音接收装置输入的语句;
103)分析所述语句并将其分解为一个或一个以上的关键字或词语;
104)将步骤103)中所述关键字或词语及其与图片的对应关系保存至图片数据库;
该方法利用声音接收装置,还包括以下图片语音搜索步骤:
201)接收并识别用户通过声音接收装置输入的语句;
202)分析所述语句将其分解为一个或一个以上的关键字或词语;
203)利用步骤202)中所述关键字或词语及其组合搜索图片数据库并判断是否有符合条件的记录?是显示所有符合条件的记录对应图片或图片列表,否则显示空或提示无符合条件的图片。
2.根据权利要求1所述图片语音搜索方法,其特征在于,所述关键字或词语包括地点、时间或事件。
3.根据权利要求2所述图片语音搜索方法,其特征在于,该方法中图片数据库是系统数据库或用户自定义数据库。
4.根据权利要求3所述图片语音搜索方法,其特征在于,所述系统数据库包括新增的记录文字标签的字段。
5.根据权利要求2所述图片语音搜索方法,其特征在于,该方法中语音搜索步骤发生在相册加载或用户自定义搜索时。
6.根据权利要求1-5任一项所述图片语音搜索方法,其特征在于,该方法应用在Android、Windows或苹果操作系统中的任一种。
7.根据权利要求1-5任一项所述图片语音搜索方法,其特征在于,该图片语音搜索方法应用于手持设备上。
8.根据权利要求7所述图片语音搜索方法,其特征在于,所述手持设备包括智能手机、MP4或平板电脑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012101466847A CN102708185A (zh) | 2012-05-11 | 2012-05-11 | 一种图片语音搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012101466847A CN102708185A (zh) | 2012-05-11 | 2012-05-11 | 一种图片语音搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102708185A true CN102708185A (zh) | 2012-10-03 |
Family
ID=46900951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012101466847A Pending CN102708185A (zh) | 2012-05-11 | 2012-05-11 | 一种图片语音搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708185A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455642A (zh) * | 2013-10-10 | 2013-12-18 | 三星电子(中国)研发中心 | 一种多媒体文件检索的方法和装置 |
CN104239568A (zh) * | 2014-09-29 | 2014-12-24 | 上海斐讯数据通信技术有限公司 | 一种基于图片说明的快速照片搜索系统和方法 |
CN104239382A (zh) * | 2013-06-17 | 2014-12-24 | 联想(新加坡)私人有限公司 | 用于内容检索的上下文智能标记 |
CN104881451A (zh) * | 2015-05-18 | 2015-09-02 | 百度在线网络技术(北京)有限公司 | 图片搜索方法及装置 |
CN105512164A (zh) * | 2014-10-14 | 2016-04-20 | 三星电子株式会社 | 使用语音标签管理图像的方法和装置 |
CN105630835A (zh) * | 2014-11-07 | 2016-06-01 | 中兴通讯股份有限公司 | 一种内容管理方法及装置 |
CN105677799A (zh) * | 2015-12-31 | 2016-06-15 | 宇龙计算机通信科技(深圳)有限公司 | 一种照片检索方法与系统 |
CN105868277A (zh) * | 2016-03-21 | 2016-08-17 | 广东欧珀移动通信有限公司 | 系统功能搜索方法、装置和终端设备 |
WO2017117785A1 (zh) * | 2016-01-07 | 2017-07-13 | 马岩 | 网络链接的搜索方法及系统 |
CN107256268A (zh) * | 2017-06-21 | 2017-10-17 | 苏州唯亚信息科技股份有限公司 | 适用于企业数据库的语音检索方法 |
CN107885813A (zh) * | 2017-11-03 | 2018-04-06 | 广东欧珀移动通信有限公司 | 图片处理方法、移动终端及计算机可读存储介质 |
CN108255917A (zh) * | 2017-09-15 | 2018-07-06 | 广州市动景计算机科技有限公司 | 图像管理方法、设备及电子设备 |
CN108572810A (zh) * | 2013-12-27 | 2018-09-25 | 三星电子株式会社 | 电子设备和提供电子设备的内容信息的方法 |
CN109002498A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 人机对话方法、装置、设备及存储介质 |
CN109979462A (zh) * | 2019-03-21 | 2019-07-05 | 广东小天才科技有限公司 | 一种结合上下文语境获取意图的方法和系统 |
CN110516083A (zh) * | 2019-08-30 | 2019-11-29 | 京东方科技集团股份有限公司 | 相册管理方法、存储介质及电子设备 |
WO2020037576A1 (zh) * | 2018-08-22 | 2020-02-27 | 深圳市欢太科技有限公司 | 一种速记方法及装置、终端、存储介质 |
WO2020037562A1 (zh) * | 2018-08-22 | 2020-02-27 | 深圳市欢太科技有限公司 | 一种速记方法及装置、终端、存储介质 |
CN111143595A (zh) * | 2019-12-27 | 2020-05-12 | 上海擎感智能科技有限公司 | 基于语音识别的图片管理方法、系统、介质及设备 |
CN111241235A (zh) * | 2019-12-28 | 2020-06-05 | 深圳市九洲电器有限公司 | 基于智能语音的网盘搜索方法及相关产品 |
CN111382124A (zh) * | 2020-03-13 | 2020-07-07 | 维沃移动通信有限公司 | 一种文件管理方法及电子设备 |
CN111970441A (zh) * | 2020-08-14 | 2020-11-20 | Oppo广东移动通信有限公司 | 图像处理方法及装置、存储介质和电子设备 |
CN115966206A (zh) * | 2022-11-23 | 2023-04-14 | 中创科技(广州)有限公司 | Ai语音识别的智能图片生成方法、装置、设备及介质 |
WO2023072241A1 (zh) * | 2021-10-30 | 2023-05-04 | 花瓣云科技有限公司 | 一种媒体文件管理方法及相关装置 |
US12010373B2 (en) | 2013-12-27 | 2024-06-11 | Samsung Electronics Co., Ltd. | Display apparatus, server apparatus, display system including them, and method for providing content thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1185610A (zh) * | 1996-10-21 | 1998-06-24 | 日本电信电话株式会社 | 图象信息检索装置、图象数据库装置、图象信息存储装置 |
CN1571477A (zh) * | 2004-05-14 | 2005-01-26 | 丁桦 | 一种可录入解释信息的数码相机及其后期处理系统 |
CN102362471A (zh) * | 2009-03-27 | 2012-02-22 | 维里逊专利及许可公司 | 对话支持 |
-
2012
- 2012-05-11 CN CN2012101466847A patent/CN102708185A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1185610A (zh) * | 1996-10-21 | 1998-06-24 | 日本电信电话株式会社 | 图象信息检索装置、图象数据库装置、图象信息存储装置 |
CN1571477A (zh) * | 2004-05-14 | 2005-01-26 | 丁桦 | 一种可录入解释信息的数码相机及其后期处理系统 |
CN102362471A (zh) * | 2009-03-27 | 2012-02-22 | 维里逊专利及许可公司 | 对话支持 |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239382A (zh) * | 2013-06-17 | 2014-12-24 | 联想(新加坡)私人有限公司 | 用于内容检索的上下文智能标记 |
CN104239382B (zh) * | 2013-06-17 | 2020-05-26 | 联想(新加坡)私人有限公司 | 用于内容检索的上下文智能标记 |
US10402407B2 (en) | 2013-06-17 | 2019-09-03 | Lenovo (Singapore) Pte. Ltd. | Contextual smart tags for content retrieval |
CN103455642B (zh) * | 2013-10-10 | 2017-03-08 | 三星电子(中国)研发中心 | 一种多媒体文件检索的方法和装置 |
CN103455642A (zh) * | 2013-10-10 | 2013-12-18 | 三星电子(中国)研发中心 | 一种多媒体文件检索的方法和装置 |
CN108572810A (zh) * | 2013-12-27 | 2018-09-25 | 三星电子株式会社 | 电子设备和提供电子设备的内容信息的方法 |
US12010373B2 (en) | 2013-12-27 | 2024-06-11 | Samsung Electronics Co., Ltd. | Display apparatus, server apparatus, display system including them, and method for providing content thereof |
CN104239568A (zh) * | 2014-09-29 | 2014-12-24 | 上海斐讯数据通信技术有限公司 | 一种基于图片说明的快速照片搜索系统和方法 |
CN105512164A (zh) * | 2014-10-14 | 2016-04-20 | 三星电子株式会社 | 使用语音标签管理图像的方法和装置 |
US10347296B2 (en) | 2014-10-14 | 2019-07-09 | Samsung Electronics Co., Ltd. | Method and apparatus for managing images using a voice tag |
CN105512164B (zh) * | 2014-10-14 | 2019-04-23 | 三星电子株式会社 | 使用语音标签管理图像的方法和装置 |
CN105630835A (zh) * | 2014-11-07 | 2016-06-01 | 中兴通讯股份有限公司 | 一种内容管理方法及装置 |
CN104881451A (zh) * | 2015-05-18 | 2015-09-02 | 百度在线网络技术(北京)有限公司 | 图片搜索方法及装置 |
CN105677799A (zh) * | 2015-12-31 | 2016-06-15 | 宇龙计算机通信科技(深圳)有限公司 | 一种照片检索方法与系统 |
WO2017117785A1 (zh) * | 2016-01-07 | 2017-07-13 | 马岩 | 网络链接的搜索方法及系统 |
CN105868277A (zh) * | 2016-03-21 | 2016-08-17 | 广东欧珀移动通信有限公司 | 系统功能搜索方法、装置和终端设备 |
CN107256268A (zh) * | 2017-06-21 | 2017-10-17 | 苏州唯亚信息科技股份有限公司 | 适用于企业数据库的语音检索方法 |
CN108255917A (zh) * | 2017-09-15 | 2018-07-06 | 广州市动景计算机科技有限公司 | 图像管理方法、设备及电子设备 |
CN108255917B (zh) * | 2017-09-15 | 2020-12-18 | 阿里巴巴(中国)有限公司 | 图像管理方法、设备及电子设备 |
CN107885813A (zh) * | 2017-11-03 | 2018-04-06 | 广东欧珀移动通信有限公司 | 图片处理方法、移动终端及计算机可读存储介质 |
CN109002498A (zh) * | 2018-06-29 | 2018-12-14 | 北京百度网讯科技有限公司 | 人机对话方法、装置、设备及存储介质 |
WO2020037576A1 (zh) * | 2018-08-22 | 2020-02-27 | 深圳市欢太科技有限公司 | 一种速记方法及装置、终端、存储介质 |
WO2020037562A1 (zh) * | 2018-08-22 | 2020-02-27 | 深圳市欢太科技有限公司 | 一种速记方法及装置、终端、存储介质 |
CN109979462A (zh) * | 2019-03-21 | 2019-07-05 | 广东小天才科技有限公司 | 一种结合上下文语境获取意图的方法和系统 |
CN110516083B (zh) * | 2019-08-30 | 2022-07-12 | 京东方科技集团股份有限公司 | 相册管理方法、存储介质及电子设备 |
US11580971B2 (en) | 2019-08-30 | 2023-02-14 | Boe Technology Group Co., Ltd. | Photo album management method, storage medium and electronic device |
CN110516083A (zh) * | 2019-08-30 | 2019-11-29 | 京东方科技集团股份有限公司 | 相册管理方法、存储介质及电子设备 |
CN111143595A (zh) * | 2019-12-27 | 2020-05-12 | 上海擎感智能科技有限公司 | 基于语音识别的图片管理方法、系统、介质及设备 |
CN111241235A (zh) * | 2019-12-28 | 2020-06-05 | 深圳市九洲电器有限公司 | 基于智能语音的网盘搜索方法及相关产品 |
CN111382124A (zh) * | 2020-03-13 | 2020-07-07 | 维沃移动通信有限公司 | 一种文件管理方法及电子设备 |
CN111970441A (zh) * | 2020-08-14 | 2020-11-20 | Oppo广东移动通信有限公司 | 图像处理方法及装置、存储介质和电子设备 |
WO2023072241A1 (zh) * | 2021-10-30 | 2023-05-04 | 花瓣云科技有限公司 | 一种媒体文件管理方法及相关装置 |
CN115966206A (zh) * | 2022-11-23 | 2023-04-14 | 中创科技(广州)有限公司 | Ai语音识别的智能图片生成方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708185A (zh) | 一种图片语音搜索方法 | |
EP3288024B1 (en) | Method and apparatus for executing a user function using voice recognition | |
US9552138B2 (en) | Mobile terminal and method for controlling the same | |
CN106896932A (zh) | 一种候选词推荐方法及装置 | |
US20150161246A1 (en) | Letter inputting method, system and device | |
CN105718500B (zh) | 电子设备的基于文本的内容管理方法和装置 | |
CN101876878A (zh) | 单词预测输入系统及方法 | |
CN104735243B (zh) | 联系人列表显示方法及装置 | |
CN104486495A (zh) | 在终端上显示新消息的提示信息的方法和装置 | |
JP5087144B2 (ja) | 知能型自動認識ツールバーの検索方法及び検索システム | |
CN111753064B (zh) | 一种人机交互方法及其装置 | |
TWI536183B (zh) | 語言歧義消除系統及方法 | |
CN106547886A (zh) | 应用程序推荐方法、装置、终端和服务器 | |
CN109634436B (zh) | 输入法的联想方法、装置、设备及可读存储介质 | |
US20090077494A1 (en) | Contextual prediction | |
US10360455B2 (en) | Grouping captured images based on features of the images | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN107885826A (zh) | 多媒体文件播放方法、装置、存储介质及电子设备 | |
CN112882623B (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN101923401A (zh) | 一种电子设备输入方法 | |
TWI528186B (zh) | 經由音訊發布訊息的系統及方法 | |
CN106599206A (zh) | 搜索信息的方法及装置 | |
CN105930487A (zh) | 应用于移动终端的题目搜索方法及装置 | |
CN107229698B (zh) | 一种信息处理的方法及装置 | |
CN104182473A (zh) | 设置选项的显示方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20121003 |