CN111104088B - 一种通过语音设备播报信息的方法及系统 - Google Patents

一种通过语音设备播报信息的方法及系统 Download PDF

Info

Publication number
CN111104088B
CN111104088B CN201811252503.2A CN201811252503A CN111104088B CN 111104088 B CN111104088 B CN 111104088B CN 201811252503 A CN201811252503 A CN 201811252503A CN 111104088 B CN111104088 B CN 111104088B
Authority
CN
China
Prior art keywords
voice
information
client
broadcasted
broadcasting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811252503.2A
Other languages
English (en)
Other versions
CN111104088A (zh
Inventor
曹天宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811252503.2A priority Critical patent/CN111104088B/zh
Publication of CN111104088A publication Critical patent/CN111104088A/zh
Application granted granted Critical
Publication of CN111104088B publication Critical patent/CN111104088B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种通过语音设备播报信息的方法及系统。其中,方法包括步骤:确定待播报信息;基于所确定的待播报信息生成播报请求;以及发送播报请求给服务器,以便服务器生成待播报的语音数据,并将所述数据推送给与客户端相应的语音设备,由语音设备进行播报。本发明一并公开了用于执行上述方法的计算设备。

Description

一种通过语音设备播报信息的方法及系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种通过语音设备播报信息的方法及系统。
背景技术
过去十几年来,互联网在人们生活的各个领域不断深化,人们可以通过互联网方便地进行购物、社交、娱乐、理财等活动。同时,为提高用户体验,研究人员实现了很多交互方案,如文字输入、手势输入、语音输入等。其中,智能语音交互由于其操作的便捷性而成为新一代交互模式的研究热点。
当前,随着物联网及智能化的快速发展,市场上出现了一些智能语音设备或者语音助手。智能语音设备(如,智能音箱)作为一个新兴的电子产品,已经逐步进入千家万户。因此,有必要提出一种通过语音设备播报信息的方案,以满足用户简单便捷地获取信息的需求,提高智能场景下的用户交互体验。
发明内容
为此,本发明提供了一种通过语音设备播报信息的方法及系统,以力图解决或至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种通过语音设备播报信息的方法,包括步骤:确定待播报信息;基于所确定的待播报信息生成播报请求;以及发送播报请求给服务器,以便服务器生成待播报的语音数据,并将语音数据推送给相应的语音设备,由语音设备进行播报。
可选地,在根据本发明的方法中,在确定待播报信息的步骤之前,还包括步骤:接收用户输入的用户账号和密码,以便验证用户身份。
可选地,在根据本发明的方法中,确定待播报信息的步骤包括:响应于用户输入,将用户选定的信息确定为待播报信息。
可选地,在根据本发明的方法中,确定待播报信息的步骤包括:接收来自同一群组内其他用户账号的信息;以及从所接收到的信息中确定待播报信息。
可选地,在根据本发明的方法中,还包括构建群组的步骤:利用至少一个用户账号来构建一个群组。
根据本发明的又一方面,提供了一种通过语音设备播报信息的方法,包括步骤:接收来自客户端的播报请求,播报请求中包含待播报信息;根据待播报信息生成待播报的语音数据;以及将语音数据推送给与客户端相应的语音设备,以便语音设备进行播报。
可选地,在根据本发明的方法中,根据待播报信息生成待播报的语音数据的步骤包括:获取待播报信息,并从中提取出有效信息;将有效信息转换为语音数据,作为待播报的语音数据。
可选地,在根据本发明的方法中,还包括步骤:预先关联存储客户端的用户账号和语音设备的标识号。
根据本发明的又一个方面,提供了一种客户端,包括:信息确认单元,适于确定待播报信息;控制单元,适于基于所确定的待播报信息生成播报请求;连接管理单元,适于发送播报请求给服务器。
根据本发明的再一个方面,提供了一种服务器,包括:输入输出接口,适于接收来自客户端的播报请求,播报请求中包含待播报信息;处理单元,适于根据待播报信息生成待播报的语音数据;以及输入输出接口还适于将语音数据推送给与客户端相应的语音设备,以便语音设备进行播报。
根据本发明的另一个方面,提供了一种通过语音设备播报信息的系统,包括:客户端,适于发送待播报信息给服务器;服务器,适于生成待播报的语音数据,并将语音数据推送给与客户端相应的语音设备;以及语音设备,适于播报所接收到的语音数据。
可选地,在根据本发明的系统中,客户端包括:信息确认单元,适于确定待播报信息;控制单元,适于基于所确定的待播报信息生成播报请求;连接管理单元,适于发送播报请求给服务器。
可选地,在根据本发明的系统中,在客户端中,信息确认单元还适于响应于用户输入,将用户选定的信息确定为待播报信息。
可选地,在根据本发明的系统中,在客户端中,连接管理单元还适于接收来自同一群组内其他用户账号的信息;以及信息确认单元还适于从所接收到的信息中确定待播报信息。
可选地,在根据本发明的系统中,服务器包括:输入输出接口,适于接收来自客户端的播报请求;处理单元,适于生成待播报的语音数据;以及输入输出接口还适于将语音数据推送给与客户端相应的语音设备,以便语音设备进行播报。
可选地,在根据本发明的系统中,在服务器中,处理单元还适于获取播报请求中的待播报信息,并从中提取出有效信息,且处理单元还适于将有效信息转换为语音数据,作为待播报的语音数据。
可选地,在根据本发明的系统中,在服务器中,还包括存储单元,适于预先关联存储客户端的用户账号和语音设备的标识号。
根据本发明的再一个方面,提供了一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行如上所述任一方法的指令。
根据本发明的再一个方面,提供了一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行如上所述的任一方法。
根据本发明的方案,通过客户端将用户要播报的信息推送给服务器。服务器获取待播报信息并从中提取出有效信息,再将提取出的有效信息转换为语音数据,推送给语音设备进行播报。根据本发明的方案利用了现在家庭消费者常用的语音设备,将文字化的信息转化成为语音进行播报,使得用户能够更方便地获取信息。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的通过语音设备播报信息的系统100的场景示意图;
图2示出了根据本发明一个实施例的计算设备200的示意图;
图3示出了根据本发明一个实施例的通过语音设备播报信息的方法300的交互流程图;
图4示出了根据本发明另一个实施例的通过语音设备播报信息的方法400的流程示意图;以及
图5示出了根据本发明再一个实施例的通过语音设备播报信息的方法500的流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的通过语音设备播报信息的系统100的场景示意图。如图1所示,系统100中包括客户端110、服务器120和语音设备130。应当指出,图1仅作为示意,本发明的实施例对系统100中所包含的各部分的数量并不做限制。
客户端110可以是手机、平板、智能家居设备(如智能电视)等,用户通过客户端110进行社交、娱乐等活动。另外,为实现本发明的目的,客户端110上布置有实现通过语音设备播报信息的应用。语音设备130例如可以是智能音箱,以便于家庭消费者通过语音进行上网,如点播歌曲、上网购物、了解天气预报等,还可以通过语音设备130来对家庭中的智能家居设备进行控制。在根据本发明的一个实施例中,语音设备130与布置在客户端110上的应用共同使用。应当指出,一个客户端110上的应用可以关联一个或多个语音设备130,不限于此。客户端110和语音设备130分别通过网络与服务器120相连。根据本发明的实施方式,客户端110与服务器120基于HTTP协议进行通信,同时,语音设备130与服务器120通过WebSocket协议保持长连接并进行数据交互。在一些应用场景中,用户对客户端110上的某条资讯内容感兴趣,此时,用户可以操作客户端110,请求通过语音设备130来播报客户端110上的感兴趣内容。
服务器120例如可以是物理上位于一个或多个地点的远程云服务器。根据本发明的实施方式,客户端110在接收到用户要播报信息的请求后,将用户要播报信息推送给服务器120。服务器120一方面生成待播报的语音数据,一方面查询该客户端110相应的语音设备,而后将语音数据推送给该语音设备130。最终由语音设备130播报语音数据。这样,通过系统100就可以将文字化的资讯转化成为适于播报的语音数据,以便于用户更方便地获取资讯。
在一种实施例中,客户端110将待播报信息的内容直接推送给服务器120,由服务器120据此生成待播报的语音数据。考虑到当要播报的信息比较多时,直接传送要播报的信息会产生的较大数据量,在另一些实施例中,客户端110将待播报信息的URL地址推送给服务器120。这样,服务器120可以获取该URL地址所指向的待播报信息,并生成待播报的语音数据。
同时,服务器120还可以预存与客户端110相关联的语音设备130(例如,采用同一个用户账号登录的客户端110和语音设备130,即认为是相关联的),这样,在接收到来自客户端110的播报请求时,将处理后的语音数据推送给与客户端110相关联的语音设备130。应当指出,服务器120在接收到来自客户端110的播报请求时,也可以通过网络查询布置在该客户端110周边的语音设备130,并将生成的语音数据推送给该客户端110附近的语音设备130。
如图1所示,客户端110包括:信息确认单元112、控制单元114和连接管理单元116。其中,信息确认单元112用来确定待播报信息;而后,控制单元114基于所确定的待播报信息生成播报请求;再由连接管理单元116将播报请求发送给服务器120。
可以采用以下几种方式来确定待播报信息。
在一些实施例中,用户登录客户端110的应用,选择要播报的信息,要播报的信息可以是文字、图片等格式。例如要播报的信息可以是一条或多条新闻、一段文字、甚至也可以是一张图片。本发明的实施例对此不做限制。用户在选定要播报的信息后,可以通过单击、双击、在弹出子菜单中选择输入等方式来通知客户端110“所选内容为要播报信息”。客户端110上的信息确认单元112响应于用户输入,计算出用户所选择的区域,并从中提取用户所选定的信息作为待播报信息。
在另一些实施例中,用户可以在客户端110的应用中构建群组或添加好友,例如客户端110发送好友请求给其他客户端110,来与其他客户端上的用户账号建立好友关系,又如,客户端110发送构建群组的请求给其他客户端110,来利用至少一个客户端上的用户账号构建出群组。这样,群组间的用户或者互为好友的用户之间,就可以通过发送信息的方式来分享内容给对方,其他用户也可以就分享内容进行回复、评价、交流等。应当指出,互为好友的用户账号之间、同一群组内的用户账号之间均可以通过广播或者单播的方式来共享信息,本发明的实施例对此不做过多限制。当连接管理单元116接收到来自同一群组内其他用户账号或者好友用户账号所分享的信息时,可以直接通知与之耦接的信息确认单元112,由信息确认单元112从所接收到的信息中确定出待播报信息。当然,在接收到来自同一群组内其他用户账号或者好友用户账号所分享的信息时,用户可以默认所分享的消息全部为待播报信息。同样也可以通过单击、双击、在弹出子菜单中选择输入等方式来通知客户端110“所选内容为要播报信息”,再由信息确认单元112将所选内容确定为待播报信息。
控制单元114在生成播报请求时,播报请求中包含所确定的待播报信息。在一种实施例中,控制单元114提取用户所选定的信息,并将其打包生成播报请求。在另一种实施例中,控制单元114获取待播报信息对应的URL地址,基于该URL地址生成播报请求。本发明的实施例对此不做限制。
图1中,服务器120至少包括输入输出接口122和处理单元124。其中,输入输出接口122接收来自客户端110的播报请求;处理单元124生成待播报的语音数据;再由输入输出接口122将所生成的语音数据推送给与该客户端110相应的语音设备130,以便语音设备130进行播报。
进一步地,处理单元124生成待播报的语音数据的过程可以分为两步。第一步,处理单元124获取播报请求中的待播报信息,并从中提取出有效信息。如前文所述,若播报请求中直接包含待播报信息,那么处理单元124从待播报信息中提取出有效信息;若播报请求中包含待播报信息对应的URL地址,则处理单元124先获取该URL地址所指向的待播报信息,再从中提取出有效信息。在一些实施例中,播报的语音数据主要针对文字内容,而待播报信息中可能包含空行、表情符号等无效内容,故处理单元124首先要从待播报信息(即用户选中的内容)中剔除这些无效内容,以提取出有效信息。在一些优选的实施例中,若待播报信息是图片格式,处理单元124可以采用图像处理算法从图片中提取出文字内容,进而筛选出有效信息。这里,从图片中提取文字内容的图像处理算法可以是常规的数字图像处理算法,也可以用基于深度学习的神经网络模型来实现,本发明的实施例不受限于采用何种图像处理算法。任何相关图像处理算法均可以与本发明的实施例相结合,实现根据本发明的方法300。第二步,处理单元124将所提取的有效信息转换为语音数据,作为待播报的语音数据。处理单元124可以通过TextToSpeech(TTS,从文本到语音)技术将所提取的有效信息转换为语音数据,TTS属于本领域技术人员已知内容,此处不做展开。
根据本发明的一种实施方式,除输入输出接口122和处理单元124外,服务器120还包括存储单元126。存储单元126上预先关联存储客户端110的应用上登录的用户账号和语音设备130的标识号,以便于处理单元124根据播报请求中的用户账号查找与之相关联的语音设备ID,并由输入输出接口122将语音数据推送给该语音设备ID对应的语音设备130。如表1示出了部分用户账号和语音设备ID(标识号)的关联关系的示例。假设播报请求中的用户账号为“123abc”,服务器120通过查询可得到相关联的语音设备ID为“A0B1”,这样,服务器120就直接将语音数据推送给标识号为“A0B1”的语音设备。
表1用户账号和语音设备ID的关联关系示例
用户账号 语音设备ID
111eee A0B0
123abc A0B1
912dt A0B2
根据本发明的另一种实施方式,服务器120在接收到播报请求时,还可以获取客户端110所在位置(当然,播报请求中也可以包含客户端110的地理位置信息,但不限于此),处理单元124查询布置在该地理位置预定范围内的一个或多个语音设备130(即,布置在客户端110周边的语音设备130),而后经由输入输出接口122将语音数据推送给查询到的一个或多个语音设备130。应当指出,语音设备130可以定期上传位置信息至服务器120,由服务器120进行缓存;也可以是在服务器120需要确认语音设备130的位置信息时,主动拉取语音设备130的位置信息,本发明的实施例对此不做过多限制。根据这种实施方式,假设一个家庭,在客厅、卧室、书房等房间分别布置了语音设备130,那么,用户在客厅通过客户端110发送播报请求,服务器120在处理后可以将语音数据推送给客厅、卧室、书房等房间内的语音设备130,家庭成员可以在家庭的任一个位置收听信息。
此外,在一些实施例中,服务器120先将客户端110相应的一个或多个语音设备130发送给客户端110(可以是与客户端110的用户账号相关联的语音设备130,也可以是处在客户端110周边的语音设备130,不限于此),由客户端110选择在其中的至少一个语音设备130上进行播放。而后,服务器120再将语音数据推送给所选择的至少一个语音设备130,由其进行播报。
根据本发明的实施方式,客户端110、服务器120和语音设备130均可以通过如下所述的计算设备200来实现。图2示出了根据本发明一个实施例的计算设备200的示意图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备200也可以实现为小尺寸便携(或者移动)电子设备的一部分。在根据本发明的实施例中,计算设备200被配置为执行根据本发明的通过语音设备播报信息的方法300。计算设备200的应用222中包含执行根据本发明的方法300(和/或方法400和/或方法500)的多条程序指令。
图3示出了根据本发明一个实施例的通过语音设备播报信息的方法300的交互流程图。方法300在上述系统100中执行,如图3上述,方法300始于步骤S310。
在步骤S310中,客户端110确定待播报信息。
如前文中关于客户端110的相关描述,本发明的实施例对确定待播报信息的方式不做过多限制。在一些实施例中,客户端110响应于用户输入,将用户选定的信息确定为待播报信息。在另一些实施例中,方法300还包括构建群组的过程:客户端110可以发送好友请求或构建群组的请求给其他客户端110,来建立好友关系或构建群组(相关的内容可参见前文所述,此处不做赘述)。当客户端110接收到来自同一群组内其他用户账号或互为好友的用户账号的信息时,可以将所接收到的信息确定为待播报信息。此外,待播报信息可以是一条或多条资讯,也可以是资讯中的一段文字,当然,可以包含文字、图片等。具体的内容可以参见前文中的相关描述,此处不做赘述。
随后在步骤S320中,客户端110基于所确定的待播报信息生成播报请求。
在一些实施例中,客户端110直接利用待播报信息来生成播报请求。在另一些实施例中,客户端110基于所确定的待播报信息对应的URL地址来生成播报请求。当然,播报请求中还可以包含用户账户信息。考虑到用户账号的安全性,客户端110也可以通过MD5等方式对待播报信息和/或待播报信息对应的URL地址和/或用户账号进行加密处理,再生成播报请求。或者,采用在播报请求中增加校验位的方式来保障账号的安全性。上述生成播报请求的方式均在本发明的保护范围内。关于播报请求的内容可参考前文关于系统100的相关描述,此处不再赘述。
随后在步骤S330中,客户端110发送该播报请求给服务器120。如前文所述,播报请求中包含待播报信息。
在步骤S340中,服务器120接收了来自客户端110的播报请求,根据播报请求中的待播报信息生成待播报的语音数据。更具体地,服务器120生成待播报的语音数据可以分两步执行。第一步,从待播报信息中提取出有效信息;第二步,将所提取的有效信息转换为语音数据,作为待播报的语音数据。根据本发明的实施方式,服务器120对播报请求进行解析,若播报请求中直接包含了待播报信息的内容,则服务器120直接从待播报信息中提取出有效信息;若播报请求中包含的是待播报信息的URL地址,则服务器120先获取该URL地址所指向的待播报信息,再从中提取出有效信息。更具体的执行过程可以参见前文中关于服务器120的相关描述,此处不做赘述。
在随后的步骤S350中,服务器120将所生成的语音数据推送给与该客户端110相应的语音设备130。关于服务器120确定相应的语音设备130的过程在前文中已进行了详细描述,可以是与该客户端110的用户账号相关联的语音设备130,也可以是处于该客户端110周边环境的语音设备130,同时,可以是一个语音设备130,也可以是多个语音设备130,本发明的实施例对此均不做过多限制。
随后在步骤S360中,语音设备130播报收到的上述语音数据。
根据本发明的实施方式,在语音设备130播报语音数据的同时,还可以在客户端110上同步显示播报进度。此外,用户还可以通过语音控制语音设备130的播报(包括控制开始/停止播报、播报速度、播报时间等等)。例如,用户说“停止播报”,语音设备130将用户的语音上传到服务器120,服务器120在处理后下发停止播报的命令给语音设备130,语音设备130停止播放语音数据。
根据本发明的方案,通过客户端110将用户要播报的信息推送给服务器120,服务器120从待播报信息中提取出有效信息,再将提取出的有效信息转换为语音数据,推送给语音设备130进行播报。根据本发明的方案利用了现在家庭消费者常用的语音设备,将文字化的信息转化成为语音进行播报,使得用户能够更方便地获取信息。且根据用户习惯,提供了多种确定待播报信息和播放语音数据的方式,提供了用户体验。
方法300的执行涉及到系统100中的各个部件,为此,在图4中示出了根据本发明另一个实施例的通过语音设备播报信息的方法400的流程示意图。图4所示的方法400适于在客户端110中执行,是图3所示方法的进一步说明。
在图4中,与图3所示的方法步骤相同的步骤用相同的标号进行指示,并且不再进行赘述。如图4所示,方法400还包括步骤S410,即在客户端110确定待播报信息之前,客户端110接收用户输入的用户账号和密码,以便验证用户身份。
用户打开布置在客户端110上的应用时,进入登录界面,此时用户需要输入用户账号和密码进行登录。应当指出,用户也可以使用第三方的账号和密码进行登录。客户端110将用户的登录信息(包括用户账号和密码)发送至服务器120,由其进行身份认证,在认证通过后提示用户登录成功。此时,用户可以在客户端110的应用上进行相关操作。
在方法400中,可选地,在执行方法300所描述的各个步骤之外,还包括步骤S420,构建群组。即利用至少一个用户账号来构建一个群组。客户端110发送构建群组的请求给其他一个或多个客户端110,在收到其他客户端的反馈后,利用这些客户端上的用户账号构建出群组。同理,客户端110也可以与其他客户端110建立好友关系。客户端110发送好友请求给其他客户端110,来与其他客户端上的用户账号建立好友关系。
除此之外,方法400还包括方法300中的步骤S310,确定待播报信息。客户端110可以根据用户自身的输入,将用户选定的信息确定为待播报信息。当然,在执行了步骤S420后,客户端110也可以从同一群组内其他用户账号所分享的信息中确定出待播报信息。例如,选定分享信息中的一部分为待播报信息。另外,图4中还示出了方法400包含:步骤S320(基于所确定的待播报信息生成播报请求)和步骤S330(发送播报请求给服务器120)。关于步骤S310、步骤S320和步骤S330的具体描述可参见前文关于图1和图3的相关内容,此处不再赘述。
需要说明的是,图4中对于各步骤的执行顺序的描述仅作为一个示例,在实际应用中,并不限制步骤(尤其是步骤S420)的执行顺序,例如可以在步骤S310之前,也可以在步骤S310之后。
图5示出了根据本发明再一个实施例的通过语音设备播报信息的方法500的处理流程的示意图。图5所示的方法500适于在服务器120中执行,是图3和图4所示的方法300和方法400的进一步说明。同样,与图3和图4所示的方法步骤相同的步骤用相同的标号进行指示,并且不再进行赘述。
在图5中,方法500还可以包括步骤S510,预先关联存储客户端110的用户账号和语音设备130的标识号,以便于在接收到播报请求后,根据播报请求中的用户账号查找与之相应的语音设备的标识号,进而将语音数据推送给查找到的语音设备。
此外,方法500还包括下述步骤。在步骤S340中,服务器120接收来自客户端110的播报请求,该播报请求中包含待播报信息,而后,服务器120根据待播报信息生成待播报的语音数据。具体地,服务器120先获取待播报信息,并从中提取出有效信息,再将有效信息转换成语音数据,作为待播报的语音数据。关于获取待播报信息、以及提取有效信息和转换语音数据的具体过程,可参考前文关于图1的相关描述。在步骤S350中,服务器120将所生成语音数据推送给相应的语音设备130,以便语音设备进行播报。关于步骤S340和步骤S350的具体描述可参见前文关于图1和图3的相关内容,此处不再赘述。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

Claims (13)

1.一种通过语音设备播报信息的方法,应用于客户端,所述客户端为移动终端,包括步骤:
接收来自同一群组内其他用户账号的信息;
从所接收到的信息中确定待播报信息;
基于所确定的待播报信息生成播报请求;
发送播报请求给服务器,以便所述服务器生成待播报的语音数据,并将所述语音数据推送给相应的语音设备,由所述语音设备进行播报,其中,所述服务器获取所述客户端的地理位置,并获取布置在该地理位置预定范围内的一个或多个语音设备作为所述语音设备,所述服务器还从所述语音设备接收用户发出的指令,并处理后下发给所述语音设备,以使所述语音设备对语音播放进行相应控制;以及
在所述语音设备播放语音时同步显示播报进度。
2.如权利要求1所述的方法,在所述确定待播报信息的步骤之前,还包括步骤:
接收用户输入的用户账号和密码,以便验证用户身份。
3.如权利要求1所述的方法,还包括构建群组的步骤:
利用至少一个用户账号来构建一个群组。
4.一种通过语音设备播报信息的方法,应用于服务器,包括步骤:
接收来自客户端的播报请求,所述播报请求中包含待播报信息,所述客户端为移动终端,所述待播报信息由所述客户端基于来自同一群组内其他用户账号的信息确定;
根据所述待播报信息生成待播报的语音数据;
将所述语音数据推送给与所述客户端相应的语音设备,以便所述语音设备进行播报,所述客户端在所述语音设备播放语音时同步显示播报进度,其中,所述语音设备的获取方法包括:获取所述客户端所在的地理位置,并获取布置在该地理位置预定范围内的一个或多个语音设备作为所述语音设备;以及
从所述语音设备接收用户发出的指令,并处理后下发给所述语音设备,以使所述语音设备对语音播放进行相应控制。
5.如权利要求4所述的方法,其中,根据所述待播报信息生成待播报的语音数据的步骤包括:
获取所述待播报信息,并从中提取出有效信息;
将所述有效信息转换为语音数据,作为待播报的语音数据。
6.一种客户端,所述客户端为移动终端,包括:
信息确认单元,适于接收来自同一群组内其他用户账号的信息,从所接收到的信息中确定待播报信息;
控制单元,适于基于所确定的待播报信息生成播报请求,并在语音设备播放语音时同步显示播报进度;
连接管理单元,适于发送播报请求给服务器,所述服务器获取所述客户端所在的地理位置,并查询布置在该地理位置预定范围内的一个或多个语音设备,将所述语音数据推送给所述语音设备,以便所述语音设备进行播报,所述服务器还从所述语音设备接收用户发出的指令,并处理后下发给所述语音设备,以使所述语音设备对语音播放进行相应控制。
7.一种服务器,包括:
输入输出接口,适于接收来自客户端的播报请求,所述播报请求中包含待播报信息,所述客户端为移动终端,所述待播报信息由所述客户端基于来自同一群组内其他用户账号的信息确定;
处理单元,适于根据待播报信息生成待播报的语音数据;以及
所述输入输出接口还适于将所述语音数据推送给与所述客户端相应的语音设备,以便所述语音设备进行播报,并从所述语音设备接收用户发出的指令,并处理后下发给所述语音设备,以使所述语音设备对语音播放进行相应控制,所述客户端在所述语音设备播放语音时同步显示播报进度,其中,所述语音设备的获取方法包括:获取所述客户端所在的地理位置,并查询布置在该地理位置预定范围内的一个或多个语音设备作为所述语音设备。
8.一种通过语音设备播报信息的系统,包括:
客户端,适于接收来自同一群组内其他用户账号的信息,从所接收到的信息中确定待播报信息,并发送所述待播报信息给服务器,以及在所述语音设备播放语音时同步显示播报进度,所述客户端为移动终端;
服务器,适于生成待播报的语音数据,将所述语音数据推送给与所述客户端对应的语音设备,从所述语音设备接收用户发出的指令,处理后下发给所述语音设备,以使所述语音设备对语音播放进行相应控制,其中,所述语音设备的获取方法包括:获取所述客户端所在的地理位置,并查询布置在该地理位置预定范围内的一个或多个语音设备作为所述语音设备;
语音设备,适于播报所接收到的语音数据。
9.如权利要求8所述的系统,其中,所述客户端包括:
信息确认单元,适于接收来自同一群组内其他用户账号的信息,从所接收到的信息中确定待播报信息;
控制单元,适于基于所确定的待播报信息生成播报请求,并在所述语音设备播放语音时同步显示播报进度;
连接管理单元,适于发送播报请求给服务器。
10.如权利要求8-9中任一项所述的系统,其中,所述服务器包括:
输入输出接口,适于接收来自客户端的播报请求;
处理单元,适于生成待播报的语音数据;以及
所述输入输出接口还适于将所述语音数据推送给与所述客户端对应的语音设备,以便所述语音设备进行播报,并从所述语音设备接收用户发出的指令,并处理后下发给所述语音设备。
11.如权利要求10所述的系统,在所述服务器中,
所述处理单元还适于获取所述播报请求中的待播报信息,并从中提取出有效信息,且所述处理单元还适于将所述有效信息转换为语音数据,作为待播报的语音数据。
12.一种计算设备,包括:
至少一个处理器;和
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-5中任一项所述方法的指令。
13.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-5中任一项所述的方法。
CN201811252503.2A 2018-10-25 2018-10-25 一种通过语音设备播报信息的方法及系统 Active CN111104088B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811252503.2A CN111104088B (zh) 2018-10-25 2018-10-25 一种通过语音设备播报信息的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811252503.2A CN111104088B (zh) 2018-10-25 2018-10-25 一种通过语音设备播报信息的方法及系统

Publications (2)

Publication Number Publication Date
CN111104088A CN111104088A (zh) 2020-05-05
CN111104088B true CN111104088B (zh) 2023-10-03

Family

ID=70417896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811252503.2A Active CN111104088B (zh) 2018-10-25 2018-10-25 一种通过语音设备播报信息的方法及系统

Country Status (1)

Country Link
CN (1) CN111104088B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113179346A (zh) * 2021-04-06 2021-07-27 支付宝(杭州)信息技术有限公司 车票语音播报方法及装置

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060026391A (ko) * 2004-09-18 2006-03-23 최중인 음원 활용 커뮤니티 서비스 장치 및 방법
CN101739437A (zh) * 2009-11-26 2010-06-16 杭州鑫方软件有限公司 一种网络搜音机的实现方法及其专用设备
CN101924755A (zh) * 2010-07-21 2010-12-22 宇龙计算机通信科技(深圳)有限公司 一种语音播报终端更新播报语音的方法及系统
CN203151514U (zh) * 2012-12-25 2013-08-21 安徽讯飞智元信息科技有限公司 一种具有自动语音合成功能的公共广播系统
CN103457747A (zh) * 2013-08-14 2013-12-18 太仓太乙信息工程有限公司 企业生产安全管理语音播报系统及其方法
CN103841190A (zh) * 2014-02-28 2014-06-04 广州华多网络科技有限公司 信息获取方法、信息分享方法、装置和系统
CN104618456A (zh) * 2015-01-13 2015-05-13 小米科技有限责任公司 信息发布方法及装置
CN105049999A (zh) * 2015-07-09 2015-11-11 广东欧珀移动通信有限公司 一种音箱分组的展示方法、本地服务器、移动终端以及系统
CN105654973A (zh) * 2015-12-22 2016-06-08 深圳创维数字技术有限公司 一种音频文件处理方法及系统
CN105679343A (zh) * 2016-01-12 2016-06-15 深圳市智慧猫软件技术有限公司 一种手机音乐智能播放方法及一种中控主机
WO2017004928A1 (zh) * 2015-07-09 2017-01-12 广东欧珀移动通信有限公司 一种歌曲目录设置方法、移动终端、服务器及系统
CN106973082A (zh) * 2017-03-07 2017-07-21 广州酷狗计算机科技有限公司 资源标识分享方法及装置
CN107026943A (zh) * 2017-03-30 2017-08-08 联想(北京)有限公司 语音交互方法及系统
CN107465595A (zh) * 2017-07-25 2017-12-12 腾讯科技(深圳)有限公司 设备消息播放控制方法、装置、消息播放设备及存储介质
CN108093653A (zh) * 2016-09-13 2018-05-29 松下知识产权经营株式会社 语音提示方法、语音提示程序、语音提示系统及终端装置
CN108133707A (zh) * 2017-11-30 2018-06-08 百度在线网络技术(北京)有限公司 一种内容分享方法及系统
CN207706216U (zh) * 2018-01-05 2018-08-07 广州市研恒计算机科技有限公司 Ip网络广播播放服务器
WO2018188589A1 (zh) * 2017-04-11 2018-10-18 腾讯科技(深圳)有限公司 媒体信息的播放方法及装置、存储介质以及电子装置
CN108694035A (zh) * 2017-04-05 2018-10-23 北京嘀嘀无限科技发展有限公司 语音信息的播报管理方法及装置

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060026391A (ko) * 2004-09-18 2006-03-23 최중인 음원 활용 커뮤니티 서비스 장치 및 방법
CN101739437A (zh) * 2009-11-26 2010-06-16 杭州鑫方软件有限公司 一种网络搜音机的实现方法及其专用设备
CN101924755A (zh) * 2010-07-21 2010-12-22 宇龙计算机通信科技(深圳)有限公司 一种语音播报终端更新播报语音的方法及系统
CN203151514U (zh) * 2012-12-25 2013-08-21 安徽讯飞智元信息科技有限公司 一种具有自动语音合成功能的公共广播系统
CN103457747A (zh) * 2013-08-14 2013-12-18 太仓太乙信息工程有限公司 企业生产安全管理语音播报系统及其方法
CN103841190A (zh) * 2014-02-28 2014-06-04 广州华多网络科技有限公司 信息获取方法、信息分享方法、装置和系统
WO2015127822A1 (zh) * 2014-02-28 2015-09-03 广州华多网络科技有限公司 信息获取方法、信息查询方法、终端和服务器
CN104618456A (zh) * 2015-01-13 2015-05-13 小米科技有限责任公司 信息发布方法及装置
WO2017004928A1 (zh) * 2015-07-09 2017-01-12 广东欧珀移动通信有限公司 一种歌曲目录设置方法、移动终端、服务器及系统
CN105049999A (zh) * 2015-07-09 2015-11-11 广东欧珀移动通信有限公司 一种音箱分组的展示方法、本地服务器、移动终端以及系统
CN105654973A (zh) * 2015-12-22 2016-06-08 深圳创维数字技术有限公司 一种音频文件处理方法及系统
CN105679343A (zh) * 2016-01-12 2016-06-15 深圳市智慧猫软件技术有限公司 一种手机音乐智能播放方法及一种中控主机
CN108093653A (zh) * 2016-09-13 2018-05-29 松下知识产权经营株式会社 语音提示方法、语音提示程序、语音提示系统及终端装置
CN106973082A (zh) * 2017-03-07 2017-07-21 广州酷狗计算机科技有限公司 资源标识分享方法及装置
CN107026943A (zh) * 2017-03-30 2017-08-08 联想(北京)有限公司 语音交互方法及系统
CN108694035A (zh) * 2017-04-05 2018-10-23 北京嘀嘀无限科技发展有限公司 语音信息的播报管理方法及装置
WO2018188589A1 (zh) * 2017-04-11 2018-10-18 腾讯科技(深圳)有限公司 媒体信息的播放方法及装置、存储介质以及电子装置
CN107465595A (zh) * 2017-07-25 2017-12-12 腾讯科技(深圳)有限公司 设备消息播放控制方法、装置、消息播放设备及存储介质
CN108133707A (zh) * 2017-11-30 2018-06-08 百度在线网络技术(北京)有限公司 一种内容分享方法及系统
CN207706216U (zh) * 2018-01-05 2018-08-07 广州市研恒计算机科技有限公司 Ip网络广播播放服务器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Participatory Learning Environment by Using Voice Trackback System in Zoological Garden;Yutaro Ohashi等;Seventh IEEE International Conference on Advanced Learning Technologies (ICALT 2007);全文 *
中药发药窗口数字化管理的新尝试;童思木;沈崇德;章伯鸣;;医疗卫生装备(第04期);全文 *
可切换式语言同步播报旅游解说系统研究与设计;林梅;陈益能;李青珉;韦炎明;苏少问;;物联网技术(第09期);全文 *
基于APICloud的手机智能播报系统设计;李剑;覃桢桢;周珊珊;;电子设计工程(第17期);全文 *

Also Published As

Publication number Publication date
CN111104088A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US9342817B2 (en) Auto-creating groups for sharing photos
WO2017211020A1 (zh) 一种电视操控方法及装置
CN111312235B (zh) 一种语音交互方法、装置及系统
CN106557034B (zh) 一种基于即时通信的智能家居控制方法
US20210029389A1 (en) Automatic personalized story generation for visual media
CN106254478A (zh) 一种基于二维码签到的会议管理方法及系统
CN104252517A (zh) 基于语音识别和云标签的简历推荐系统
CN103744575B (zh) 一种用于提供输入应用的输入辅助区域的方法与设备
WO2019019535A1 (zh) 数据发送、转发和传输的方法及装置
CN102771082A (zh) 具有混合能力的设备和接口之间的通信会话
WO2016026432A1 (zh) 名片信息查询方法和云服务器
US10860187B1 (en) Object oriented interactions
WO2020119541A1 (zh) 一种语音数据的识别方法、装置及系统
CN105511635A (zh) 一种使用在线内容以输入一信息至一应用程序的方法
JP2013025777A (ja) 情報処理装置、情報処理方法、及び、プログラム
CN103678624A (zh) 搜索方法、搜索服务器、搜索请求执行方法及终端
CN111104088B (zh) 一种通过语音设备播报信息的方法及系统
US10447692B2 (en) Auto-creation of application passwords
JP2019506653A (ja) 三次元モデルを転送するシステム、方法及びコンピュータプログラム製品
CN105763424A (zh) 一种文字信息处理方法和装置
US20090292823A1 (en) Digital Asset Format Transformation
CN105359513A (zh) 用于视频会议中的房间系统配对的系统和方法
JP6554517B2 (ja) サウンドを利用したソーシャルネットワークサービス提供装置及びその方法
CN105095454A (zh) 定向推送自定义二维码的方法与系统
US20170091887A1 (en) Method for accessing an online account after the owner's death

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant