CN109981448B - 信息处理方法和电子设备 - Google Patents
信息处理方法和电子设备 Download PDFInfo
- Publication number
- CN109981448B CN109981448B CN201910247818.6A CN201910247818A CN109981448B CN 109981448 B CN109981448 B CN 109981448B CN 201910247818 A CN201910247818 A CN 201910247818A CN 109981448 B CN109981448 B CN 109981448B
- Authority
- CN
- China
- Prior art keywords
- content
- broadcast content
- voice
- broadcast
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 20
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开提供了一种信息处理方法,包括:获得播报内容;调用语音播报单元;以及基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容的不同部分,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分。本公开还提供了一种电子设备。
Description
技术领域
本公开涉及一种信息处理方法和电子设备。
背景技术
人工智能、自动控制、通信和计算机技术的快速发展,给人们的生活带来了诸多便利。例如,一些应用程序提供播报服务,使用户可以通过听觉获得应用程序提供的信息。
但是,应用程序播报信息的技术还不够完善,应用程序只能用一个虚拟用户的声音传达要播报的内容,从而使得收听该播报内容的真实用户无法获得更多更有效的信息。
发明内容
本公开的一个方面提供了一种信息处理方法,包括:获得播报内容;调用语音播报单元;以及基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容的不同部分,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分。
可选地,所述至少两种声音特征为能够表征不同虚拟用户的声音,或者所述至少两种声音特征为能够表征同一个虚拟用户的声音中的响度、音调和语速中的至少一个。
可选地,基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容包括,按照声音特征的分配规则,将第一部分播报内容按照第一声音特征处理为第一语音以及将第二部分播报内容按照第二声音特征处理为第二语音,以使得收听所述播报内容的用户能够根据所述第一语音和所述第二语音区分出所述播报内容的第一部分播报内容和第二部分播报内容。
可选地,播报内容为文本内容,所述声音特征的分配规则为:如果识别到所述文本内容中包括对话内容将对话方所描述的内容处理为不同声音特征;或者所述播报内容为即时通讯应用的聊天窗口中聊天内容,所述声音特征的分配规则为将不同联系人对应聊天内容处理为不同声音特征。
可选地,所述播报内容为导航信息,所述声音特征的分配规则为:将所述导航信息中的不同内容部分分别处理为不同声音特征。
可选地,将所述导航信息中的不同内容部分分别处理为不同声音特征包括:基于所述导航信息中不同内容部分的类别,确定不同内容部分各自对应的声音特征。
本公开的另一个方面提供了一种电子设备,包括处理器以及存储器。存储器上存储有计算机可读指令,所述指令被处理器执行时,使得所述处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的信息处理方法的应用场景;
图2示意性示出了根据本公开实施例的信息处理方法的流程图;
图3示意性示出了根据本公开实施例的即时通讯应用的聊天窗口;
图4示意性示出了根据本公开实施例的信息处理系统的框图;以及
图5示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开的实施例提供了一种信息处理方法,包括:获得播报内容;调用语音播报单元;以及基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容的不同部分,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分。
图1示意性示出了根据本公开的实施例的信息处理方法的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,该应用场景中包括电子设备100,电子设备100安装有导航应用程序,该导航应用程序正在播报导航信息,以向用户提供参考行驶路径、即将行驶路段的交通状况等信息。
根据本公开的实施例,该导航应用程序可以采用至少两种声音特征播报导航信息,使得收听到导航信息的用户能够根据声音特征区分出导航信息的不同部分。例如该导航应用程序采用女声播报正常的路况信息,而采用男声播报拥堵的路况信息。
图2示意性示出了根据本公开实施例的信息处理方法的流程图。
如图2所示,该信息处理方法包括操作S210~S230。
在操作S210,获得播报内容。
在操作S220,调用语音播报单元。
在操作S230,基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分。
根据本公开实施例的信息处理方法,语音播报单元采用至少两种声音特征播报不同部分的播报内容,从而传达出更多的信息,使得用户能够根据播报的声音特征注意到不同的播报内容,达到提示用户的作用。
根据本公开的实施例,在操作S210,播报内容例如可以是导航信息、文本信息、即时通讯应用的聊天窗口中的聊天内容等。根据本公开的实施例,播报内容例如可以是从云端获得的,或者也可以是本地生成的。
根据本公开的实施例,在操作S220,语音播报单元例如可以包括处理芯片、扬声器等。
根据本公开的实施例,在操作S230,例如可以是通过语音播报单元处理播报内容,使得不同部分的播报内容对应于不同的声音特征,并且采用具有不同声音特征的声音播报所述播报内容的不同部分,使用户根据声音特征区分出播报内容的不同部分。
根据本公开的实施例,在操作S230,至少两种声音特征为能够表征不同虚拟用户的声音。例如男声和女声能够表征不同的虚拟用户。具体地,例如可以使用某位女明星的声音和某位男明星的声音表征不同的虚拟用户。又例如,不同的男声或者不同的女声表征不同的虚拟用户。具体地,例如可以使用多位女明星的声音表征不同的虚拟用户。
根据本公开的实施例,在操作S230,至少两种声音特征为能够表征同一个虚拟用户的声音中的响度、音调和语速中的至少一个。例如使用某女明星的声音播报导航内容,而不同部分的导航内容采用不同响度的该女明星的声音。
根据本公开的实施例,基于语音播报单元处理播报内容,且以语音方式输出播报内容包括,按照声音特征的分配规则,将第一部分播报内容按照第一声音特征处理为第一语音以及将第二部分播报内容按照第二声音特征处理为第二语音,以使得收听所述播报内容的用户能够根据所述第一语音和所述第二语音区分出所述播报内容的第一部分播报内容和第二部分播报内容。
根据本公开的实施例,声音特征的分配规则例如可以是用户自己设定的,或者也可以是应用该信息处理方法的系统中默认的。
例如,该信息处理方法应用于导航应用程序中,声音特征的分配规则例如可以是正常的路况信息对应于正常语速的语音,危险的路况信息对应于较快的语音,从而将正常的路况信息处理为第一语音,危险的路况信息处理为第二语音,其中,第二语音的语速快于第一语音的语速。
根据本公开的实施例,在播报内容为文本内容的情况下,信息处理方法还可以包括:识别文本内容,并获得识别结果。例如可以是解析文本内容,以获得文本内容涉及到的领域、文本内容中是否存在对话内容等信息。
根据本公开的实施例,在播报内容为文本内容的情况下,声音特征的分配规则为如果识别到文本内容包括对话内容,将对话方所描述的内容处理为不同声音特征。根据本公开的实施例,文本内容例如可以是网页、电子书、新闻等以文字形式呈现的内容。例如某一电子书通过播报的形式输出,该电子书中的一段内容为:乌苏娜失去了耐心,“如果你想这样,那就这样吧”,乌苏娜说到。在电子设备播报该段内容时,例如可以采用男声播报“乌苏娜失去了耐心”和“乌苏娜说到”,而采用女声播报“如果你想这样,那就这样吧”。
根据本公开的实施例,如果识别到文本内容包括对话内容,将对话方所描述的内容处理为不同声音特征,例如可以是将所有的对话方所描述的内容处理为具有第一声音特征的声音,而其他不是对话方所描述的内容处理为具有第二声音特征的声音。例如,小说中所有人物所说的内容全部由男声播报,而旁白部分全部由女声播报。
根据本公开的实施例,如果识别到文本内容包括对话内容,将对话方所描述的内容处理为不同声音特征,例如可以是将不同的对话方所描述的内容处理为具有不同声音特征的声音,而其他不是对话方所描述的内容处理为具有其他声音特征的声音。例如,播报内容为一本小说,小说中多名女性人物说的话分别使用具有不同声音特征的声音播报,同一人物说的不同的话使用具有同一声音特征的声音播报。类似地,小说中多个的男性人物说的话使用具有不同声音特征的声音播报,同一人物说的不同的话使用具有同一声音特征的声音播报。
根据本公开实施例的上述方法能够使得收听播报内容的用户根据声音特征区分不同的对话方,提高了收听效果,提高了用户体验。
根据本公开的实施例,在播报内容为即时通讯应用的聊天窗口中聊天内容的情况下,声音特征的分配规则为将不同联系人对应的聊天内容处理为不同声音特征。例如,多名用户通过即时通讯聊天应用聊天,该即时通讯聊天应用可以存储有多个虚拟用户的声音,并向用户提供语音播报功能。用户可以在即时通讯聊天应用中选择语音播报功能,使得该即时通讯聊天应用播报聊天记录。在电子设备播报聊天记录的过程中,可以采用不同虚拟用户的声音播报不同联系人发送的聊天消息。
根据本公开的实施例,在播报内容为即时通讯应用的聊天窗口中聊天内容的情况下,即时通讯应用例如能够获得联系人的性别信息,从而将联系人对应的聊天内容处理为具有与该联系人的性别相符的声音特征的声音。
根据本公开实施例的上述方法能够使得收听播报内容的用户根据声音特征区分不同的联系人,提高了收听效果,提高了用户体验。
图3示意性示出了根据本公开实施例的即时通讯应用的聊天窗口。
如图3所示,即时通讯应用的聊天窗口为X群组的聊天窗口。X群组中参与群聊的有用户A、B、C和D。
例如即时通讯应用通过查看用户A、B、C和D填写的性别信息,确定A、C用户为女性,B和D为男性。若群组中的另一成员E选择播报聊天记录,则可以使用即时通讯应用中存储的一名女明星的声音播报用户A发送的消息“今天天气真好”,而使用另一名女明星的声音播报用户C发送的消息“对,天气太好了,要不要去逛街”,使用一名男明星的声音播报用户B发送的消息“是呀,要不要去公园散步”,而使用另一名男明星的声音播报用户D发送的消息“好呀”。
根据本公开的实施例,播报内容为导航信息,所述声音特征的分配规则为:将所述导航信息中的不同内容部分处理为不同声音特征。根据本公开的实施例,导航信息中的不同内容部分例如可以包括交通信息、道路宽度和/或平整度信息、行驶路径信息等。
根据本公开的实施例,例如可以根据导航信息的类别,确定播报声音的声音特征,不同的类别对应不同的声音特征。例如导航信息的类别可以包括用于指示行驶路径的第一类别、用于提示交通状况的第二类别、用于提示安全隐患的第三类别和用于提示道路宽度和/或平整度的第四类别,第一类别、第二类别、第三类别和第四类别可以分别由不同虚拟用户的声音播报。根据本公开的实施例,对于同一类别下不同重要程度的导航信息,可以根据重要程度确定播报声音的响度、音调、语速中的至少一个。例如导航信息中的内容包括“前方直行,前方300米处有急转弯”,其中“前方直行”采用正常语速播报,而“前方300米处有急转弯”采用较快且紧张的预设播报。又例如,导航信息中的内容包括“前方500米处严重拥堵,预计通过时间为半小时”可以采用较为悲伤的语气播放等等。
根据本公开的实施例,信息处理方法还可以包括接收用户的输入操作,基于所述输入操作确定不同部分的播报内容与播报声音的声音特征的映射关系。例如用户可以在导航应用程序中自行设定不同类别的播报内容对应的声音特征。
根据本公开的实施例,播报需要播报内容使用的声音可以是存储在本地的,例如可以是用户自己录制并存储的语音,或者也可以是应用上述信息处理方法的应用程序中存储的,或者也可以是从云端下载得到的。
例如,该信息处理方法应用于导航应用程序中,该导航应用程序中存储有多个明星的语音库。获得一条播报内容为“前方500米处严重拥堵,预计通过时间为半小时”,确定该条播报内容使用男声播放,从语音库中选择一名男声播放该条播报内容。获得另一条播报内容为“直行300米”,确定该条播报内容使用男声播报,从语音库中选择一名女生播报该条播报内容。
又例如,用户可以在本地的导航应用程序中添加自己录制好的语音,并选择由自己录制的语音播报需要播报的导航信息。
图4示意性示出了根据本公开实施例的信息处理系统400的框图。
如图4所示,信息处理系统400包括获得模块410、调用模块420和播报模块430。
获得模块410,例如执行参考图2描述的操作S210,用于获得播报内容。
调用模块420,例如执行参考图2描述的操作S220,用于调用语音播报单元。
播报模块430,例如执行参考图2描述的操作S230,用于基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分。
根据本公开的实施例,至少两种声音特征为能够表征不同虚拟用户的声音,或者所述至少两种声音特征为能够表征同一个虚拟用户的声音中的响度、音调和语速中的至少一个。
根据本公开的实施例,基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容包括:按照声音特征的分配规则,将第一部分播报内容按照第一声音特征处理为第一语音以及将第二部分播报内容按照第二声音特征处理为第二语音,以使得收听所述播报内容的用户能够根据所述第一语音和所述第二语音区分出所述播报内容的第一部分播报内容和第二部分播报内容。
根据本公开的实施例,所述播报内容为文本内容,所述声音特征的分配规则为如果识别到所述文本内容中包括对话内容,将对话方所描述的内容处理为不同声音特征,或者所述播报内容为即时通讯应用的聊天窗口中聊天内容,所述声音特征的分配规则为将不同联系人对应聊天内容处理为不同声音特征。
根据本公开的实施例,所述播报内容为导航信息,所述声音特征的分配规则为:将所述导航信息中的不同内容部分处理为不同声音特征。
根据本公开的实施例所提供的语音播报单元识别待播报的播报内容。如果识别到所述播报内容中具有满足分配规则(例如,对话或者导航路径上特殊事件或者危险状况)的内容,那么语音播报单元自动为该满足分配规则的内容分配至少一个虚拟用户的声音来播报该满足分配规则的内容,例如,如果该对话内容涉及到一方、两方或者多方为其分配不同虚拟用户的声音来播报不同的对话内容。其中,具有该语音播报单元的电子设备能够调用多个虚拟用户的声音数据库。每个虚拟用户的声音对应一个声音数据库。该声音数据库可以存储在云端也可以存储在本地。同时,用另外一个虚拟用户的声音来播报不满足分配规则的内容(即,除了对话剩下的旁白内容,或者,导航路径上标准信息例如方向提醒等)。从而相对于现有技术只能用一个虚拟用户的声音一成不变的播报所有内容,本申请所提供的实施例让收听的用户能够快速区分该播报内容所涉及的不同内容,让用户获得更多更有效的信息输入。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获得模块410、调用模块420和播报模块430中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获得模块410、调用模块420和播报模块430中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获得模块410、调用模块420和播报模块430中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图5示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的方框图。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500包括处理器510、计算机可读存储介质520。该电子设备500可以执行根据本公开实施例的方法。
具体地,处理器510例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器510还可以包括用于缓存用途的板载存储器。处理器510可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质520,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质520可以包括计算机程序521,该计算机程序521可以包括代码/计算机可执行指令,其在由处理器510执行时使得处理器510执行根据本公开实施例的方法或其任何变形。
计算机程序521可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序521中的代码可以包括一个或多个程序模块,例如包括521A、模块521B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器510执行时,使得处理器510可以执行根据本公开实施例的方法或其任何变形。
根据本公开的实施例,处理器510来执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,获得模块410、调用模块420和播报模块430中的至少一个可以实现为参考图5描述的计算机程序模块,其在被处理器510执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (7)
1.一种信息处理方法,包括:
获得播报内容;
调用语音播报单元;以及
基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,
其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分;
所述基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容包括:
按照声音特征的分配规则,将第一部分播报内容按照第一声音特征处理为第一语音以及将第二部分播报内容按照第二声音特征处理为第二语音,以使得收听所述播报内容的用户能够根据所述第一语音和所述第二语音区分出所述播报内容的第一部分播报内容和第二部分播报内容;
所述播报内容为导航信息,所述声音特征的分配规则为:将所述导航信息中的不同内容部分分别处理为不同声音特征。
2.根据权利要求1所述的方法,其中,所述至少两种声音特征为能够表征不同虚拟用户的声音,或者所述至少两种声音特征为能够表征同一个虚拟用户的声音中的响度、音调和语速中的至少一个。
3.根据权利要求1所述的方法,其中:
所述播报内容为文本内容,所述声音特征的分配规则为如果识别到所述文本内容中包括对话内容,将对话方所描述的内容处理为不同声音特征;或者
所述播报内容为即时通讯应用的聊天窗口中聊天内容,所述声音特征的分配规则为将不同联系人对应聊天内容处理为不同声音特征。
4.根据权利要求1所述的方法,其中,所述将所述导航信息中的不同内容部分分别处理为不同声音特征包括:
基于所述导航信息中不同内容部分的类别,确定不同内容部分各自对应的声音特征。
5.一种电子设备,包括:
处理器;以及
存储器,其上存储有计算机可读指令,所述指令被处理器执行时,使得所述处理器执行:
获得播报内容;
调用语音播报单元;以及
基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容,
其中,所述语音播报单元在播报所述播报内容的过程中,采用至少两种声音特征来播报所述播报内容的不同部分,以使得收听所述播报内容的用户能够根据至少两种声音特征区分出所述播报内容的不同部分;
所述处理器基于所述语音播报单元处理所述播报内容,且以语音方式输出所述播报内容包括:
按照声音特征的分配规则,将第一部分播报内容按照第一声音特征处理为第一语音以及将第二部分播报内容按照第二声音特征处理为第二语音,以使得收听所述播报内容的用户能够根据所述第一语音和所述第二语音区分出所述播报内容的第一部分播报内容和第二部分播报内容;
所述播报内容为导航信息,所述声音特征的分配规则为:将所述导航信息中的不同内容部分分别处理为不同声音特征。
6.根据权利要求5所述的电子设备,所述至少两种声音特征为能够表征不同虚拟用户的声音,或者所述至少两种声音特征为能够表征同一个虚拟用户的声音中的响度、音调和语速中的至少一个。
7.根据权利要求5所述的电子设备,其中,所述播报内容为文本内容,所述声音特征的分配规则为:
如果识别到所述文本内容中包括对话内容将对话方所描述的内容处理为不同声音特征;或者
所述播报内容为即时通讯应用的聊天窗口中聊天内容,所述声音特征的分配规则为将不同联系人对应聊天内容处理为不同声音特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910247818.6A CN109981448B (zh) | 2019-03-28 | 2019-03-28 | 信息处理方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910247818.6A CN109981448B (zh) | 2019-03-28 | 2019-03-28 | 信息处理方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109981448A CN109981448A (zh) | 2019-07-05 |
CN109981448B true CN109981448B (zh) | 2022-03-25 |
Family
ID=67081480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910247818.6A Active CN109981448B (zh) | 2019-03-28 | 2019-03-28 | 信息处理方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109981448B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113448426A (zh) * | 2020-03-10 | 2021-09-28 | 华为技术有限公司 | 语音播报方法、装置、存储介质及电子设备 |
CN113643686B (zh) * | 2020-04-24 | 2024-05-24 | 阿波罗智联(北京)科技有限公司 | 语音播报方法、装置、系统、设备和计算机可读介质 |
CN112698807B (zh) * | 2020-12-29 | 2023-03-31 | 上海掌门科技有限公司 | 语音播报方法、设备及计算机可读介质 |
CN113489833B (zh) * | 2021-06-29 | 2022-11-04 | 维沃移动通信有限公司 | 信息播报方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006186867A (ja) * | 2004-12-28 | 2006-07-13 | Sharp Corp | 音声処理装置 |
CN104836916A (zh) * | 2015-05-25 | 2015-08-12 | 广东欧珀移动通信有限公司 | 一种语音播报聊天信息的方法、系统及移动终端 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
CN107289964A (zh) * | 2016-03-31 | 2017-10-24 | 高德信息技术有限公司 | 一种导航语音播报方法及装置 |
CN108053696A (zh) * | 2018-01-04 | 2018-05-18 | 广州阿里巴巴文学信息技术有限公司 | 一种根据阅读内容进行声音播放的方法、装置和终端设备 |
CN108962219A (zh) * | 2018-06-29 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 用于处理文本的方法和装置 |
CN109036373A (zh) * | 2018-07-31 | 2018-12-18 | 北京微播视界科技有限公司 | 一种语音处理方法及电子设备 |
-
2019
- 2019-03-28 CN CN201910247818.6A patent/CN109981448B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006186867A (ja) * | 2004-12-28 | 2006-07-13 | Sharp Corp | 音声処理装置 |
CN104836916A (zh) * | 2015-05-25 | 2015-08-12 | 广东欧珀移动通信有限公司 | 一种语音播报聊天信息的方法、系统及移动终端 |
CN107289964A (zh) * | 2016-03-31 | 2017-10-24 | 高德信息技术有限公司 | 一种导航语音播报方法及装置 |
CN106856091A (zh) * | 2016-12-21 | 2017-06-16 | 北京智能管家科技有限公司 | 一种多语言文本的自动播报方法及系统 |
CN108053696A (zh) * | 2018-01-04 | 2018-05-18 | 广州阿里巴巴文学信息技术有限公司 | 一种根据阅读内容进行声音播放的方法、装置和终端设备 |
CN108962219A (zh) * | 2018-06-29 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 用于处理文本的方法和装置 |
CN109036373A (zh) * | 2018-07-31 | 2018-12-18 | 北京微播视界科技有限公司 | 一种语音处理方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109981448A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109981448B (zh) | 信息处理方法和电子设备 | |
CN110267113B (zh) | 视频文件加工方法、系统、介质和电子设备 | |
US10714081B1 (en) | Dynamic voice assistant interaction | |
US10226702B2 (en) | Vehicle entertainment system | |
US10747497B2 (en) | Audio stream mixing system and method | |
CN103680134A (zh) | 一种提供打车服务的方法、装置及系统 | |
US11204255B2 (en) | Travel-based geo-paired information system | |
JP2016090681A (ja) | 車両用音声対話装置 | |
US20210063193A1 (en) | Systems and methods for providing uninterrupted media content during vehicle navigation | |
CN113581195A (zh) | 特种车辆识别方法、电子设备和计算机可读介质 | |
US10187738B2 (en) | System and method for cognitive filtering of audio in noisy environments | |
CN112673641B (zh) | 对视频或语音消息的内联响应 | |
US9406294B2 (en) | Information-sharing system | |
US10306316B2 (en) | Attention diverter responsive to determination of viewer and content | |
US20150325122A1 (en) | Method and system for streaming data for consumption by a user | |
US10629092B1 (en) | Systems and methods for improving call center performance | |
US11997577B2 (en) | Open channel communication system | |
US20230125307A1 (en) | Video conference verbal junction identification via nlp | |
CN111578965A (zh) | 导航播报信息处理方法、装置、电子设备和存储介质 | |
US20220205806A1 (en) | Travel-based geo-paired information system | |
CN112700767A (zh) | 人机对话打断方法及装置 | |
US11803400B2 (en) | Method and system for asynchronous notifications for users in contextual interactive systems | |
CN107844288B (zh) | 一种话题自动播放处理方法、服务器以及司机终端 | |
CN113808615B (zh) | 音频类别定位方法、装置、电子设备和存储介质 | |
US11573999B2 (en) | Accessible multimedia content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |