CN104714981B - 语音消息搜索方法、装置及系统 - Google Patents

语音消息搜索方法、装置及系统 Download PDF

Info

Publication number
CN104714981B
CN104714981B CN201310695093.XA CN201310695093A CN104714981B CN 104714981 B CN104714981 B CN 104714981B CN 201310695093 A CN201310695093 A CN 201310695093A CN 104714981 B CN104714981 B CN 104714981B
Authority
CN
China
Prior art keywords
voice
text
message
search
messages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310695093.XA
Other languages
English (en)
Other versions
CN104714981A (zh
Inventor
刘业鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310695093.XA priority Critical patent/CN104714981B/zh
Priority to PCT/CN2014/092426 priority patent/WO2015090137A1/en
Publication of CN104714981A publication Critical patent/CN104714981A/zh
Application granted granted Critical
Publication of CN104714981B publication Critical patent/CN104714981B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种语音消息搜索方法、装置及系统,属于移动互联网领域。所述方法包括:获取文本形式的搜索关键词;在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;将与所述搜索关键词匹配的文本消息所对应的所述语音消息作为搜索结果进行反馈。本申请解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。

Description

语音消息搜索方法、装置及系统
技术领域
本发明涉及移动互联网领域,特别涉及一种语音消息搜索方法、装置及系统。
背景技术
语音即时通讯应用是一种通讯双方或多方采用语音消息进行即时沟通的应用,比如微信、易信、Line(连我)和来往之类的应用。语音即时通讯应用已经成为诸如智能手机、平板电脑和电子书阅读器之类的移动终端上使用最为广泛的应用之一。
在用户使用语音即时通讯应用时,存在在历史语音消息中搜索目标内容的需求,比如,用户A和用户B互聊了几十条语音消息来商讨一次约见,聊完后用户A需要在这些语音消息中找出一条用户B发送的涉及约见地点的语音消息。此时,已有的语音消息搜索方法包括:用户使用移动终端逐条播放所有的语音消息或者播放根据猜测而选中的某条语音消息;在一条语音消息被播放后,用户通过人工来判断该条语音消息是否为包含目标内容的语音消息;若判断结果为包含,则用户停止搜索;若判断结果为不包含,则用户控制移动终端继续播放下一条语音消息。
在实现本发明的过程中,发明人发现上述技术至少存在以下问题:在语音消息较多时,逐条播放每条语音消息来查找目标内容的效率很低,并且用户的判断能力也会随着多次点击操作和滑动操作所引发的视觉疲惫而降低,导致上述语音消息搜索方法整体的搜索效率较差。
发明内容
为了解决背景技术提供的语音消息搜索方法的搜索效率较差的问题,本发明实施例提供了一种语音消息搜索方法、装置、设备及系统。所述技术方案如下:
第一方面,提供了一种语音消息搜索方法,用于客户端中,所述方法包括:
获取文本形式的搜索关键词;
在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;
将与所述搜索关键词匹配的文本消息所对应的所述语音消息作为搜索结果进行反馈。
第二方面,提供了一种语音消息搜索装置,所述装置包括:
搜索获取模块,用于获取文本形式的搜索关键词;
文本查找模块,用于在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;
结果反馈模块,用于将与所述搜索关键词匹配的文本消息所对应的所述语音消息作为搜索结果进行反馈。
第三方面,提供了一种语音消息搜索系统,所述系统包括客户端和服务器;所述客户端与所述服务器之间通过无线网络或有线网络相连;
所述客户端,包括如上第二方面所述的语音消息搜索装置。
本发明实施例提供的技术方案带来的有益效果是:
通过获取文本形式的搜索关键词,在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息来得到搜索结果;解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的语音消息搜索方法的方法流程图;
图2A是本发明另一实施例提供的语音消息搜索方法的方法流程图;
图2B至图2E是图2A所示实施例所涉及的实施界面示意图;
图3是本发明一个实施例提供的语音消息搜素装置的结构方框图;
图4是本发明另一实施例提供的语音消息搜索装置的结构方框图;
图5是本发明一个实施例提供的语音消息搜索系统的结构方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在本发明各个实施例中,客户端可以是手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)以及MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面3)播放器等等终端上的支持双方或者多方通过语音消息来通讯的应用客户端。
请参考图1,其示出了本发明一个实施例提供的语音消息搜索方法的方法流程图。本实施例以该语音消息搜索方法应用在支持双方或者多方通过语音消息来通讯的客户端中来举例说明。该方法包括:
步骤102,获取文本形式的搜索关键词;
客户端既可以直接获取用户直接以文本形式输入的搜索关键词;客户端也可以获取用户以语音形式输入的搜索语音信号,然后在本地或者服务器端通过语音识别技术从搜索语音信号中识别出文本形式的搜索关键词。
步骤104,在每条语音消息各自对应的文本消息中查找与搜索关键词匹配的文本消息,每条文本消息是由对应的语音消息的语音识别结果生成的;
每条语音消息各自对应一条文本消息,每条文本消息是由对应的语音消息的语音识别结果生成的。
步骤106,将与搜索关键词匹配的文本消息所对应的语音消息作为搜索结果进行反馈。
综上所述,本实施例提供的语音消息搜索方法,通过获取文本形式的搜索关键词,在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息来得到搜索结果;解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。
请参考图2A,其示出了本发明另一实施例提供的语音消息搜索方法的方法流程图。本实施例以该语音消息搜索方法应用于支持双方或者多方通过语音消息来通讯的客户端来举例说明。该方法包括:
步骤201,获取并保存每条语音消息对应的文本消息;
由于语音消息都是以语音形式来保存和传输的,首先客户端需要获取并保存每条语音消息对应的文本消息。比如,客户端需要将语音消息“你好,我是张三”转换为文本形式的文本消息“你好,我是张三”来与语音消息关联存储。
本步骤可以采用如下三种方式中的任意一种实现:
第一,客户端自身对每条语音消息进行语音识别得到各自的语音识别结果,并根据语音识别结果生成每条语音消息各自对应的文本信息;
此实现方式需要客户端所在终端拥有较强的处理能力,优选地,客户端在空闲时间执行上述语音识别过程。
第二,客户端将每条语音消息发送给服务器,客户端接收服务器反馈的每条语音消息各自对应的文本信息,该文本信息是服务器对每条语音消息进行语音识别得到各自的语音识别结果后生成的;
客户端可以每隔预定时间间隔或者在空闲时间或者在接入无线局域网时,将本地的全部或者部分语音消息发送给服务器,每条语音消息拥有唯一的消息ID。服务器接收客户端发送的语音消息,服务器对每条语音消息进行语音识别得到各自的语音识别结果后,服务器根据语音识别结果生成对应的文本消息。然后,服务器将各条文本消息反馈给客户端,每条文本消息沿用对应的语音消息的消息ID。客户端接收并关联存储每条语音消息所对应的文本消息。
第三,客户端接收服务器转发的其它客户端发送的语音消息和与该语音消息对应的文本信息,该文本信息是服务器对该语音消息进行语音识别得到语音识别结果后生成的;和/或,客户端在发送自身的语音消息后,接收服务器反馈的与语音消息对应的文本信息,该文本信息是服务器对语音消息进行语音识别得到语音识别结果后生成的。
由于语音消息是客户端与其它客户端之间通讯产生的,传输过程需要经过服务器的转发,服务器在转发一条语音消息之前,服务器对该语音消息进行语音识别得到语音识别结果后生成对应的文本消息;然后服务器将该语音消息和与该语音消息对应的文本信息发送给目标客户端,目标客户端接收服务器同时转发的其它客户端发送的语音消息和与该语音消息对应的文本信息并保存。另外,服务器还将文本信息反馈给该语音消息的来源客户端,来源客户端在发送自身的语音消息后,接收并保存服务器反馈的与该语音消息对应的文本信息。
显然,在服务器的处理能力较强时,优先采用第三种实现方式来实现本步骤。
步骤202,客户端获取文本形式的搜索关键词;
通常来讲,客户端可以通过如下三种方式中的任一种来获取文本形式的搜索关键词:
第一,客户端获取用户直接以文本形式输入的搜索关键词;
比如,客户端是语音即时通讯应用,客户端在文本搜索输入框22中接收用户A直接以文本形式输入的搜索关键词“我们明天去”,如图2B所示。
第二,客户端获取用户以语音形式输入的搜索语音信号,并且客户端通过语音识别技术从搜索语音信号中识别出文本形式的搜索关键词;
比如,客户端是语音即时通讯应用,在客户端所属终端的处理能力较强时,客户端在接收到用户A在语音搜索按钮24上的按压信号时,通过该终端的麦克风26接收用户以语音形式输入的搜索语音信号,然后客户端通过语音识别技术从搜索语音信号中识别出文本形式的搜索关键词“我们明天去”,如图2C所示。
第三,客户端获取用户以语音形式输入的搜索语音信号,然后客户端将搜索语音信号发送给服务器;客户端接收服务器反馈的搜索关键词,该搜索关键词是服务器通过语音识别技术从搜索语音信号中识别出的。
步骤203,在每条语音消息各自对应的文本消息中查找与搜索关键词匹配的文本消息,每条文本消息是由对应的语音消息的语音识别结果生成的;
为了提高查找效率,本步骤可以包括如下子步骤:
第一,客户端按照预定条件对待搜索的各条语音消息所对应的文本消息进行排序,该预定条件包括每条语音消息所对应时刻的早晚、每条语音消息所对应联系人的优先级和每条文本消息的数据量大小中的至少一种;
待搜索的语音消息通常是指客户端中与当前界面有关的联系人所产生的语音消息,比如:当前界面是联系人A和联系人B的聊天界面,则待搜索的语音消息是联系人A和联系人B在语音聊天时产生的语音消息;又比如,当前界面是群组的聊天界面,则待搜索的语音消息是该群组内的各个联系人在语音聊天时产生的语音消息;再比如,当前界面不是聊天界面,则待搜索的语音消息可以是全局所有的语音消息。
若预定条件包括每条语音消息所对应时刻的早晚,客户端可以根据每条语音消息所对应时刻的早晚对待搜索的各条语音消息所对应的文本消息进行排序。比如,客户端根据每条语音消息由早到晚或者由晚到早的顺序对待搜索的各条语音消息所对应的文本消息进行排序;又比如,在语音消息非常多时,客户端根据人的遗忘曲线来根据不同时间所对应的遗忘可能性由高到低的顺序来对待搜索的各条语音消息所对应的文本消息进行排序;再比如,由于用户可能已经将当前界面定位在一个非最近时间段的其它时间段内的语音消息(比如定位在前天的聊天记录),此时,客户端可以将该时间段内的语音消息所对应的文本消息排序在前,除该时间段之外的其它语音消息所对应的文本消息排序。
若预定条件包括每条语音消息所对应联系人的优先级,客户端可以联系人的优先级来对待搜索的各条语音消息所对应的文本消息进行排序。该优先级可以由客户端预先指定。比如,因为查找结果出现在他人的语音消息中的可能性更大,所以客户端可以设置其它联系人的优先级高于当前客户端所对应的联系人的优先级。也即,若当语音消息是当前联系人A和其它联系人B的聊天记录时,则把其它联系人B的语音消息所对应的文本消息排列在当前联系人A的语音消息所对应的文本消息之前,优先在联系人B对应的文本消息中查找。还比如,客户端还可以根据每个联系人的历史发言多少、每个联系人与当前联系人A的好友程度来设置不同联系人的优先级。
若预定条件包括每条文本消息的数据量大小时,客户端可以根据每条文本消息的数据量由大到小或者由小到大的顺序对待搜索的各条语音消息所对应的文本消息进行排序。
需要说明的一点是,排序时使用的预定条件可以同时包括2个或者3个,然后客户端先按其中一个条件排序后,再利用另一个条件在前一个条件的排序结果中继续排序。比如,客户端先按照联系人的优先级对各条文本消息排序后,对同一联系人的不同文本消息继续使用对应的语音消息的时刻由早到晚的顺序进行排序。
还需要说明的一点是,该排序过程可以在步骤202之前或同时执行,比如客户端检测到用户在语音搜索按钮24上的按压信号时,就触发排序过程。并行地,客户端在排序过程之后或同时接收用户输入的搜索语音信号。
第二,在排序后的文本消息中查找与该搜索关键词匹配的文本消息
然后,客户端在排序后的各条文本消息中查找与该搜索关键词匹配的文本消息即可。
比如,客户端查找到与该搜索关键词“我们明天去”匹配的文本消息为“我们明天去奇怪恐龙园玩吧,明天是万圣节,那里有鬼屋”。
步骤204,将与搜索关键词匹配的文本消息所对应的语音消息作为搜索结果进行反馈。
在客户端搜索到与搜索关键词匹配的文本消息时,客户端在当前界面中将与搜索关键词匹配的文本消息所对应的语音消息作为搜索结果进行显示或播放。
客户端不仅可以将搜索到的语音消息作为搜索结果;客户端还可以将搜索到的文本消息作为搜索结果;客户端还可以将搜索到的语音消息和对应的文本消息同时作为搜索结果。搜索结果的呈现方式可以由用户设定,比如用户设定总是以语音消息作为搜索结果来反馈,如图2B所示。搜索结果的呈现方式还可以根据终端当前的情景模式来确定,比如若终端当前的情景模式是户外,则客户端将搜索到的语音消息作为搜索结果来反馈;若终端当前的情景模式是静音,则客户端将搜索到的文本消息作为搜索结果来反馈,或,客户端将搜索到的语音消息和对应的文本消息同时作为搜索结果来反馈,如2C所示。
综上所述,本实施例提供的语音消息搜索方法,通过获取文本形式的搜索关键词,在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息来得到搜索结果;解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。
本实施例还通过按照预定条件对文本消息进行排序,可以提高搜索过程的搜索速度。特别是在语音消息这种双方或多方的聊天场景下,按照其它联系人的优先级高于当前联系人的优先级来对语音消息进行排序,可以显著加快搜索速度。
需要补充说明的一点是,为了实现更快的搜索速度,客户端可以在排序之前,接收用户在与当前界面有关的至少两个联系人中选择目标联系人的选择信号,然后客户端将属于被选择的目标联系人的语音消息确定为待搜索的各条语音消息。
参考图2D,用户在触发搜索后,客户端可以提供与当前界面有关的至少两个联系人的选择界面27。然后用户可以选择全部或者部分联系人,客户端根据接收到的选择信号,将群组中3个联系人里属于被选择的目标联系人“小疯子”和“小莉”的语音消息确定为待搜索的语音消息,从而缩小了需要搜索的语音消息的范围,提高了搜索效率。该实现方式在待搜索的语音消息包括多人的群组聊天场景下或者当前界面有关的是所有联系人的场景下,可以显著加快搜索速度。
同理,客户端可以在排序之前,接收用户在至少两个预设的候选时间段选择目标时间段的选择信号,然后客户端将属于被选择的目标时间段的语音消息确定为待搜索的语音消息。
参考图2E,用户在触发搜索后,客户端可以提供至少两个时间段的选择界面28。然后用户可以选择全部或者部分时间段,客户端根据接收到的选择信号,将被选择的时间段“最近一周”内的语音消息确定为待搜索的语音消息,从而缩小了需要搜索的语音消息的范围,提高了搜索效率。该实现方式在待搜索的语音消息包括有很长一段时间的多条语音消息的场景下,可以显著加快搜索速度。
下面是本发明的装置实施例,未详尽描述的细节,可以参考上述一一对应的方法实施例。
请参考图3,其示出了本发明一个实施例提供的语音消息搜索装置的结构方框图。该语音消息搜索装置可以通过软件、硬件或者两者的结合实现成为客户端或者终端的全部或者一部分。该语音消息搜索装置包括:
搜索获取模块320,用于获取文本形式的搜索关键词;
文本查找模块340,用于在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;
结果反馈模块360,用于将与所述搜索关键词匹配的文本消息所对应的所述语音消息作为搜索结果进行反馈。
综上所述,本实施例提供的语音消息搜索装置,通过获取文本形式的搜索关键词,在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息来得到搜索结果;解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。
请参考图4,其示出了本发明另一实施例提供的语音消息搜索装置的结构方框图。该语音消息搜索装置可以通过软件、硬件或者两者的结合实现成为客户端或者终端的全部或者一部分。该语音消息搜索装置包括:
搜索获取模块320,用于获取文本形式的搜索关键词;
文本查找模块340,用于在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;
结果反馈模块360,用于将与所述搜索关键词匹配的文本消息所对应的所述语音消息作为搜索结果进行反馈。
可选地,所述装置,还包括:文本生成模块310;
所述文本生成模块310,用于对每条语音消息进行语音识别得到各自的语音识别结果;根据所述语音识别结果生成每条语音消息各自对应的所述文本信息;
或,
所述文本生成模块310,用于将每条语音消息发送给服务器;接收所述服务器反馈的每条语音消息各自对应的所述文本信息,所述文本信息是所述服务器对每条语音消息进行语音识别得到各自的语音识别结果后,根据所述语音识别结果生成的;
或,
所述文本生成模块310,用于接收服务器转发的其它客户端发送的所述语音消息和与所述语音消息对应的所述文本信息,所述文本信息是所述服务器对所述语音消息进行语音识别得到语音识别结果生成的;和/或,在发送本地的所述语音消息后,接收所述服务器反馈的与所述语音消息对应的所述文本信息,所述文本信息是所述服务器对所述语音消息进行语音识别得到语音识别结果后生成的。
可选地,所述文本查找模块340,包括:消息排序模块342和排序查找模块344;
所述消息排序模块342,用于按照预定条件对待搜索的各条语音消息所对应的文本消息进行排序,所述预定条件包括每条语音消息所对应时刻的早晚、每条语音消息所对应联系人的优先级和每条文本消息的数据量大小中的至少一种;
所述排序查找模块344,用于在排序后的所述文本消息中查找与所述搜索关键词匹配的文本消息。
可选地,所述文本查找模块340,还包括:联系人选择模块和联系人确定模块(未具体示出);
所述联系人选择模块,用于接收在与当前界面有关的至少两个联系人中选择目标联系人的选择信号;
所述联系人确定模块,用于将属于被选择的所述目标联系人的语音消息确定为所述待搜索的各条语音消息。
可选地,所述文本查找模块340,还包括:时间选择模块和时间确定模块(未具体示出);
所述时间选择模块,用于接收在至少两个预设的候选时间段选择目标时间段的选择信号;
所述时间确定模块,用于将属于被选择的所述目标时间段的语音消息确定为所述待搜索的各条语音消息。
可选地,所述搜索获取模块320,用于获取直接以文本形式输入的所述搜索关键词;
或,
所述搜索获取模块320,用于获取以语音形式输入的搜索语音信号;通过语音识别技术从所述搜索语音信号中识别出文本形式的所述搜索关键词;
或,
所述搜索获取模块320,用于获取以语音形式输入的搜索语音信号;将所述搜索语音信号发送给服务器;接收所述服务器反馈的搜索关键词,所述搜索关键词是所述服务器通过语音识别技术从所述搜索语音信号中识别出的。
综上所述,本实施例提供的语音消息搜索装置,通过获取文本形式的搜索关键词,在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息来得到搜索结果;解决了背景技术提供的语音消息搜索方法的搜索效率较差的问题;达到了用户只需要输入搜索关键词,就可以快速、方便地查找到对应的语音消息的效果。
本实施例还通过按照预定条件对文本消息进行排序,可以提高搜索过程的搜索速度。特别是在语音消息这种双方或多方的聊天场景下,按照其它联系人的优先级高于当前联系人的优先级来对语音消息进行排序,可以显著加快搜索速度。
需要说明的是:上述实施例提供的语音消息搜索装置在搜索语音消息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的语音消息搜索装置与语音消息搜索方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图5,其示出了本发明一个实施例提供的语音消息搜索系统的结构方框图。该语音消息搜索系统包括至少一个客户端520和服务器540。该客户端520与服务器540之间通过无线网络或有线网络相连。
所述客户端520,包括图3实施例或者图4实施例所示的语音消息搜索装置。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种语音消息搜索方法,其特征在于,用于客户端中,所述方法包括:
按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序,每条文本消息是由对应的所述语音消息的语音识别结果生成的;所述待搜索的各条语音消息是属于被选择的目标联系人的语音消息,和/或,所述待搜索的各条语音消息是属于被选择的目标时间段的语音消息;所述定位时间段是当前界面定位的时间段;所述定位时间段内的语音消息所对应的文本消息,排序在所述定位时间段之外的语音消息所对应的文本消息之前;
在按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序的同时或者之后,获取文本形式的搜索关键词;
在排序后的所述文本消息中查找与所述搜索关键词匹配的文本消息;
根据所述客户端所在终端的情景模式,将与所述搜索关键词匹配的文本消息所对应的所述语音消息,和/或,所述与所述搜索关键词匹配的文本消息作为搜索结果进行反馈。
2.根据权利要求1所述的方法,其特征在于,所述在排序后的所述文本消息中查找与所述搜索关键词匹配的文本消息之前,包括:
对每条语音消息进行语音识别得到各自的语音识别结果;根据所述语音识别结果生成每条语音消息各自对应的所述文本消息;
或,
将每条语音消息发送给服务器;接收所述服务器反馈的每条语音消息各自对应的所述文本消息,所述文本消息是所述服务器对每条语音消息进行语音识别得到各自的语音识别结果后,根据所述语音识别结果生成的;
或,
接收服务器转发的其它客户端发送的所述语音消息和与所述语音消息对应的所述文本消息,所述文本消息是所述服务器对所述语音消息进行语音识别得到语音识别结果后生成的;和/或,在发送所述客户端的所述语音消息后,接收所述服务器反馈的与所述语音消息对应的所述文本消息,所述文本消息是所述服务器对所述语音消息进行语音识别得到语音识别结果后生成的。
3.根据权利要求1所述的方法,其特征在于,
所述预定条件包括每条语音消息所对应时刻的早晚。
4.根据权利要求3所述的方法,其特征在于,所述按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序之前,还包括:
接收在与当前界面有关的至少两个联系人中选择所述目标联系人的选择信号;
将属于被选择的所述目标联系人的语音消息确定为所述待搜索的各条语音消息。
5.根据权利要求3所述的方法,其特征在于,所述按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序之前,还包括:
接收在至少两个预设的候选时间段选择所述目标时间段的选择信号;
将属于被选择的所述目标时间段的语音消息确定为所述待搜索的各条语音消息。
6.根据权利要求1至5任一所述的方法,其特征在于,所述获取文本形式的搜索关键词,包括:
获取直接以文本形式输入的所述搜索关键词;
或,
获取以语音形式输入的搜索语音信号;通过语音识别技术从所述搜索语音信号中识别出文本形式的所述搜索关键词;
或,
获取以语音形式输入的搜索语音信号;将所述搜索语音信号发送给服务器;接收所述服务器反馈的搜索关键词,所述搜索关键词是所述服务器通过语音识别技术从所述搜索语音信号中识别出的。
7.一种语音消息搜索装置,其特征在于,用于终端中,所述装置包括:
搜索获取模块,用于获取文本形式的搜索关键词;
文本查找模块,用于在每条语音消息各自对应的文本消息中查找与所述搜索关键词匹配的文本消息,每条文本消息是由对应的所述语音消息的语音识别结果生成的;
结果反馈模块,用于根据所述终端的情景模式,将与所述搜索关键词匹配的文本消息所对应的所述语音消息,和/或,所述与所述搜索关键词匹配的文本消息作为搜索结果进行反馈;
所述文本查找模块,包括:消息排序模块和排序查找模块;
所述消息排序模块,用于按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序;所述待搜索的各条语音消息是属于被选择的目标联系人的语音消息,和/或,所述待搜索的各条语音消息是属于被选择的目标时间段的语音消息;所述定位时间段是当前界面定位的时间段;所述定位时间段内的语音消息所对应的文本消息,排序在所述定位时间段之外的语音消息所对应的文本消息之前;
所述排序查找模块,用于在排序后的所述文本消息中查找与所述搜索关键词匹配的文本消息;
其中,所述搜索获取模块,用于在所述消息排序模块按照预定条件以及定位时间段对待搜索的各条语音消息所对应的文本消息进行排序的同时或者之后,执行所述获取文本形式的搜索关键词的步骤。
8.根据权利要求7所述的装置,其特征在于,所述装置,还包括:文本生成模块;
所述文本生成模块,用于对每条语音消息进行语音识别得到各自的语音识别结果;根据所述语音识别结果生成每条语音消息各自对应的所述文本消息;
或,
所述文本生成模块,用于将每条语音消息发送给服务器;接收所述服务器反馈的每条语音消息各自对应的所述文本消息,所述文本消息是所述服务器对每条语音消息进行语音识别得到各自的语音识别结果后,根据所述语音识别结果生成的;
或,
所述文本生成模块,用于接收服务器转发的其它客户端发送的所述语音消息和与所述语音消息对应的所述文本消息,所述文本消息是所述服务器对所述语音消息进行语音识别得到语音识别结果生成的;和/或,在发送本地的所述语音消息后,接收所述服务器反馈的与所述语音消息对应的所述文本消息,所述文本消息是所述服务器对所述语音消息进行语音识别得到语音识别结果后生成的。
9.根据权利要求7所述的装置,其特征在于,
所述预定条件包括每条语音消息所对应时刻的早晚。
10.根据权利要求9所述的装置,其特征在于,所述文本查找模块,还包括:联系人选择模块和联系人确定模块;
所述联系人选择模块,用于接收在与当前界面有关的至少两个联系人中选择所述目标联系人的选择信号;
所述联系人确定模块,用于将属于被选择的所述目标联系人的语音消息确定为所述待搜索的各条语音消息。
11.根据权利要求9所述的装置,其特征在于,所述文本查找模块,还包括:时间选择模块和时间确定模块;
所述时间选择模块,用于接收在至少两个预设的候选时间段选择所述目标时间段的选择信号;
所述时间确定模块,用于将属于被选择的所述目标时间段的语音消息确定为所述待搜索的各条语音消息。
12.根据权利要求7至11任一所述的装置,其特征在于,
所述搜索获取模块,用于获取直接以文本形式输入的所述搜索关键词;
或,
所述搜索获取模块,用于获取以语音形式输入的搜索语音信号;通过语音识别技术从所述搜索语音信号中识别出文本形式的所述搜索关键词;
或,
所述搜索获取模块,用于获取以语音形式输入的搜索语音信号;将所述搜索语音信号发送给服务器;接收所述服务器反馈的搜索关键词,所述搜索关键词是所述服务器通过语音识别技术从所述搜索语音信号中识别出的。
13.一种语音消息搜索系统,其特征在于,所述系统包括客户端和服务器;所述客户端与所述服务器之间通过无线网络或有线网络相连;
所述客户端,包括如权利要求7至12任一所述的语音消息搜索装置。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序用于指令硬件实现上述权利要求1至6任一所述语音消息搜索方法。
CN201310695093.XA 2013-12-17 2013-12-17 语音消息搜索方法、装置及系统 Active CN104714981B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310695093.XA CN104714981B (zh) 2013-12-17 2013-12-17 语音消息搜索方法、装置及系统
PCT/CN2014/092426 WO2015090137A1 (en) 2013-12-17 2014-11-28 A voice message search method, device, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310695093.XA CN104714981B (zh) 2013-12-17 2013-12-17 语音消息搜索方法、装置及系统

Publications (2)

Publication Number Publication Date
CN104714981A CN104714981A (zh) 2015-06-17
CN104714981B true CN104714981B (zh) 2020-01-10

Family

ID=53402086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310695093.XA Active CN104714981B (zh) 2013-12-17 2013-12-17 语音消息搜索方法、装置及系统

Country Status (2)

Country Link
CN (1) CN104714981B (zh)
WO (1) WO2015090137A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558311B (zh) * 2015-09-30 2020-11-27 北京奇虎科技有限公司 语音内容提示方法和装置
US9984075B2 (en) 2015-10-06 2018-05-29 Google Llc Media consumption context for personalized instant query suggest
KR20240023200A (ko) 2016-05-18 2024-02-20 애플 인크. 그래픽 메시징 사용자 인터페이스 내의 확인응답 옵션들의 적용
US10592098B2 (en) 2016-05-18 2020-03-17 Apple Inc. Devices, methods, and graphical user interfaces for messaging
US10368208B2 (en) 2016-06-12 2019-07-30 Apple Inc. Layers in messaging applications
CN107402748A (zh) * 2016-07-01 2017-11-28 北京都在哪网讯科技有限公司 用于通信应用的信息处理方法及装置
CN107967250B (zh) * 2016-10-19 2020-12-29 中兴通讯股份有限公司 一种信息处理方法及装置
CN110019923A (zh) * 2017-07-18 2019-07-16 北京国双科技有限公司 语音消息的查找方法及装置
CN107818786A (zh) * 2017-10-25 2018-03-20 维沃移动通信有限公司 一种通话语音处理方法、移动终端
CN107798143A (zh) * 2017-11-24 2018-03-13 珠海市魅族科技有限公司 一种信息搜索方法、装置、终端及可读存储介质
CN110099360A (zh) * 2018-01-30 2019-08-06 腾讯科技(深圳)有限公司 语音消息处理方法及装置
CN108446389B (zh) * 2018-03-22 2021-12-24 平安科技(深圳)有限公司 语音消息搜索显示方法、装置、计算机设备及存储介质
CN110399468B (zh) * 2018-04-20 2024-08-06 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN108874904B (zh) * 2018-05-24 2022-04-29 平安科技(深圳)有限公司 语音消息搜索方法、装置、计算机设备及存储介质
CN109237740A (zh) * 2018-07-31 2019-01-18 珠海格力电器股份有限公司 一种电器的控制方法、装置、存储介质及电器
CN109274586A (zh) * 2018-11-14 2019-01-25 深圳市云歌人工智能技术有限公司 聊天信息的存储方法、装置及存储介质
CN111506752A (zh) * 2019-01-30 2020-08-07 阿里巴巴集团控股有限公司 搜索方法、装置、电子设备及计算机存储介质
CN110188233B (zh) * 2019-05-27 2023-11-14 努比亚技术有限公司 语音在线搜索处理的方法、可穿戴设备及存储介质
CN112311652B (zh) * 2019-07-23 2023-02-07 腾讯科技(深圳)有限公司 消息发送方法、装置、终端及存储介质
CN111988479B (zh) * 2020-08-20 2021-04-20 浙江企蜂信息技术有限公司 通话信息处理方法、装置、计算机设备及存储介质
CN112287162A (zh) * 2020-10-27 2021-01-29 维沃移动通信有限公司 消息搜索方法、装置和电子设备
CN113112236A (zh) * 2021-04-19 2021-07-13 云南电网有限责任公司迪庆供电局 一种基于语音和声纹识别的配网智能调度系统及方法
CN113282772A (zh) * 2021-04-25 2021-08-20 夏贵军 一种基于5g消息的用户搜索方法及系统
CN113836270A (zh) * 2021-09-28 2021-12-24 深圳格隆汇信息科技有限公司 大数据的处理方法及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及系统、移动终端、中转服务器
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1056265A2 (en) * 1999-05-26 2000-11-29 Lucent Technologies Inc. Voice message search system and method
JP4629560B2 (ja) * 2004-12-01 2011-02-09 本田技研工業株式会社 対話型情報システム
CN102750365B (zh) * 2012-06-14 2014-09-03 华为软件技术有限公司 即时语音消息的检索方法和系统,以及用户设备和服务器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591932A (zh) * 2011-12-23 2012-07-18 优视科技有限公司 语音搜索方法及系统、移动终端、中转服务器
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
群聊搜索 聊天记录快速曝光;小伟;《电脑迷》;20091231(第24期);第2-3段 *

Also Published As

Publication number Publication date
CN104714981A (zh) 2015-06-17
WO2015090137A1 (en) 2015-06-25

Similar Documents

Publication Publication Date Title
CN104714981B (zh) 语音消息搜索方法、装置及系统
CN112616063B (zh) 一种直播互动方法、装置、设备及介质
CN110266879B (zh) 播放界面显示方法、装置、终端及存储介质
US11153430B2 (en) Information presentation method and device
CN107977928B (zh) 表情生成方法、装置、终端及存储介质
CN104700836B (zh) 一种语音识别方法和系统
CN110263197B (zh) 一种图像搜索方法、装置、计算机设备和存储介质
CN109783798A (zh) 文本信息添加图片的方法、装置、终端及存储介质
US10637806B2 (en) User interface for a chatting application displaying a visual representation of a voice message with feature information indicating a mood
EP3652655A1 (en) Conversational/multi-turn question understanding using web intelligence
US11004445B2 (en) Information processing method, server, terminal, and information processing system
CN108541312A (zh) 分组化数据的多模态传输
CN106911487B (zh) 一种进行语音聊天的方法和装置
CN104125264A (zh) 资源收藏方法、装置和设备
WO2012159095A2 (en) Background audio listening for content recognition
CN110795589A (zh) 一种图像搜索方法、装置、计算机设备和存储介质
CN110460514A (zh) 即时通信工具的消息发送方法、装置、存储介质及设备
CN112003778B (zh) 消息处理方法、装置、设备和计算机存储介质
CN108090170B (zh) 一种智能问询语义识别方法及可视智能问询系统
US11294962B2 (en) Method for processing random interaction data, network server and intelligent dialog system
US20160247522A1 (en) Method and system for providing access to auxiliary information
CN111666498B (zh) 一种基于互动信息的好友推荐方法、相关装置及存储介质
CN106385498B (zh) 信息归类方法及装置
CN110798393B (zh) 声纹气泡的展示方法及使用声纹气泡的终端
CN109510897A (zh) 一种表情图片管理方法及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant