CN105741829A - 数据转换方法及装置 - Google Patents

数据转换方法及装置 Download PDF

Info

Publication number
CN105741829A
CN105741829A CN201610274186.9A CN201610274186A CN105741829A CN 105741829 A CN105741829 A CN 105741829A CN 201610274186 A CN201610274186 A CN 201610274186A CN 105741829 A CN105741829 A CN 105741829A
Authority
CN
China
Prior art keywords
tone
data
speech data
indicated
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610274186.9A
Other languages
English (en)
Inventor
李鲲鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuhuan Kanzhi Information Technology Co Ltd
Original Assignee
Yuhuan Kanzhi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuhuan Kanzhi Information Technology Co Ltd filed Critical Yuhuan Kanzhi Information Technology Co Ltd
Priority to CN201610274186.9A priority Critical patent/CN105741829A/zh
Publication of CN105741829A publication Critical patent/CN105741829A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种数据转换方法,包括:获取待转换的文本数据;将所述文本数据划分为关键内容和非关键内容;获取所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同;将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。本发明还公开了能够实施上述方法的数据转换装置,和包括如上数据转换装置的移动终端、服务器。

Description

数据转换方法及装置
技术领域
本发明涉及语音合成技术领域,尤其涉及一种数据转换方法及装置。
背景技术
随着科学技术的发展,手机、可穿戴设备等移动终端日益普及。移动终端是我们获取信息的重要来源。然而,对于手机等有屏幕的移动终端,长时间的阅读将造成视力疲劳;对于智能手表、智能眼镜等屏幕很小的移动终端,用户在其上看消息很不方便。
语音合成是通过机械的、电子的方法产生人造语音的技术。通过语音合成,可以将屏幕上的文本信息用语音读出来。但是,这种合成的语音往往语气单调、生硬,用户很难从中提取出关键的信息。
发明内容
为此,本发明提供一种数据转换方法及装置,以力图解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种数据转换方法,包括:获取待转换的文本数据;将所述文本数据划分为关键内容和非关键内容;获取所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同;将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。
可选地,在根据本发明的数据转换方法中,关键内容包括:所述文本数据中采用特殊格式进行标记的部分;所述非关键内容包括:所述文本数据中未采用特殊格式进行标记的部分。
可选地,在根据本发明的数据转换方法中,特殊格式包括:粗体、斜体、下划线,以及特殊的字体、字号、字间距、字体颜色、字体背景色中的至少一种。
可选地,在根据本发明的数据转换方法中,所述第一语气标识和所述第二语气标识所指示的语气包括:音调、音量、语速中的至少一种。
可选地,在根据本发明的数据转换方法中,所述第一语气标识和所述第二语气标识所指示的语气包括音调时,所述第一语气标识所指示的音调比所述第二语气所指示的音调高10%~50%。
可选地,在根据本发明的数据转换方法中,所述第一语气标识和所述第二语气标识所指示的语气包括音量时,所述第一语气标识所指示的音量比所述第二语气所指示的音量高10%~50%。
可选地,在根据本发明的数据转换方法中,所述第一语气标识和所述第二语气标识所指示的语气包括语速时,所述第一语气标识所指示的语速比所述第二语气所指示的语速低10%~50%。
可选地,在根据本发明的数据转换方法中,将所述关键内容转换为第一语音数据的步骤包括:检测语音库中是否包含所述第一语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第一语音数据时,获取所述第一语音数据。
可选地,在根据本发明的数据转换方法中,当语音库中未包含所述第一语音数据时:根据所述关键内容从语音库中获取第一原始语音数据,所述第一原始语音数据的语气与所述第一语气标识所指示的语气不同;按照第一语气标识对所述第一原始语音数据进行处理,得到所述第一语音数据;将得到的所述第一语音数据存储至所述语音库。
可选地,在根据本发明的数据转换方法中,将所述非关键内容转换为第二语音数据的步骤包括:检测语音库中是否包含所述第二语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第二语音数据时,获取所述第二语音数据。
可选地,在根据本发明的数据转换方法中,当语音库中未包含所述第二语音数据时:根据所述关键内容从语音库中获取第二原始语音数据,所述第二原始语音数据的语气与所述第二语气标识所指示的语气不同;按照第二语气标识对所述第二原始语音数据进行处理,得到所述第二语音数据;将得到的所述第二语音数据存储至所述语音库。
根据本发明的一个方面,提供一种数据转换装置,包括:数据获取模块,适于获取待转换的文本数据;文本划分模块,适于将所述文本数据划分为关键内容和非关键内容;语气设置模块,适于设置所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同;以及数据转化模块,适于将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。
可选地,在根据本发明的数据转换装置中,所述关键内容包括:所述文本数据中采用特殊格式进行标记的部分;所述非关键内容包括:所述文本数据中未采用特殊格式进行标记的部分。
可选地,在根据本发明的数据转换装置中,所述特殊格式包括:粗体、斜体、下划线,以及特殊的字体、字号、字间距、字体颜色、字体背景色中的至少一种。
可选地,在根据本发明的数据转换装置中,所述第一语气标识和所述第二语气标识所指示的语气包括:音调、音量、语速中的至少一种。
可选地,在根据本发明的数据转换装置中,所述第一语气标识和所述第二语气标识所指示的语气包括音调时,所述第一语气标识所指示的音调比所述第二语气所指示的音调高10%~50%。
可选地,在根据本发明的数据转换装置中,所述第一语气标识和所述第二语气标识所指示的语气包括音量时,所述第一语气标识所指示的音量比所述第二语气所指示的音量高10%~50%。
可选地,在根据本发明的数据转换装置中,所述第一语气标识和所述第二语气标识所指示的语气包括语速时,所述第一语气标识所指示的语速比所述第二语气所指示的语速低10%~50%。
可选地,在根据本发明的数据转换装置中,所述数据转化模块还适于:检测语音库中是否包含所述第一语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第一语音数据时,获取所述第一语音数据。
可选地,在根据本发明的数据转换装置中,所述数据转化模块还适于在语音库中未包含所述第一语音数据时:根据所述关键内容从语音库中获取第一原始语音数据,所述第一原始语音数据的语气与所述第一语气标识所指示的语气不同;按照第一语气标识对所述第一原始语音数据进行处理,得到所述第一语音数据;将得到的所述第一语音数据存储至所述语音库。
可选地,在根据本发明的数据转换装置中,所述数据转化模块还适于:检测语音库中是否包含所述第二语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第二语音数据时,获取所述第二语音数据。
可选地,在根据本发明的数据转换装置中,所述数据转化模块还适于在语音库中未包含所述第二语音数据时:根据所述关键内容从语音库中获取第二原始语音数据,所述第二原始语音数据的语气与所述第二语气标识所指示的语气不同;按照第二语气标识对所述第二原始语音数据进行处理,得到所述第二语音数据;将得到的所述第二语音数据存储至所述语音库。
根据本发明的一个方面,提供一种移动终端,包括如上数据转换装置。
根据本发明的一个方面,提供一种服务器,包括如上数据转换装置。
根据本发明提供的技术方案,可以识别出文本数据中采用特殊格式进行标记的部分,并将该部分内容作为该文本数据的关键内容。在将文本数据转化为语音数据时,为关键内容赋予特殊的语气以对所述关键内容进行强调,使用户可以方便地获取文本数据中的关键信息,提高用户体验。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的包括数据转换装置的移动终端100的结构图;
图2示出了根据本发明一个实施例的数据转换装置200的结构图;以及
图3示出了根据本发明一个实施例的数据转换方法300的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了包括根据本发明的数据转换装置的示例移动终端100的结构图。具有多点触摸能力的移动终端100可以包括存储器接口102、一个或多个数据处理器、图像处理器和/或中央处理单元104,以及外围接口106。
存储器接口102、一个或多个处理器104和/或外围接口106既可以是分立元件,也可以集成在一个或多个集成电路中。在移动终端100中,各种元件可以通过一条或多条通信总线或信号线来耦合。传感器、设备和子系统可以耦合到外围接口106,以便帮助实现多种功能。例如,运动传感器110、光传感器112和距离传感器114可以耦合到外围接口106,以方便定向、照明和测距等功能。其他传感器116同样可以与外围接口106相连,例如定位系统(例如GPS接收机)、温度传感器、生物测定传感器或其他感测设备,由此可以帮助实施相关的功能。
相机子系统120和光学传感器122可以用于方便诸如记录照片和视频剪辑的相机功能的实现,其中所述相机子系统和光学传感器例如可以是电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)光学传感器。
可以通过一个或多个无线通信子系统124来帮助实现通信功能,其中无线通信子系统可以包括射频接收机和发射机和/或光(例如红外)接收机和发射机。无线通信子系统124的特定设计和实施方式可以取决于移动终端100所支持的一个或多个通信网络。例如,移动终端100可以包括被设计成支持GSM网络、GPRS网络、EDGE网络、Wi-Fi或WiMax网络以及BlueboothTM网络的无线通信子系统124。
音频子系统126可以与扬声器128以及麦克风130相耦合,以便帮助实施启用语音的功能,例如语音识别、语音复制、数字记录和电话功能。
I/O子系统140可以包括屏幕控制器142和/或一个或多个其他输入控制器144。
屏幕控制器142可以耦合到屏幕146。举例来说,该屏幕146和屏幕控制器142可以使用多种触摸感测技术中的任何一种来检测与之进行的接触和移动或是暂停,其中感测技术包括但不局限于电容性、电阻性、红外和表面声波技术。
一个或多个其他输入控制器144可以耦合到其他输入/控制设备148,例如一个或多个按钮、摇杆开关、拇指旋轮、红外端口、USB端口、和/或指示笔之类的指点设备。一个或多个按钮(未显示)可以包括用于控制扬声器128和/或麦克风130音量的向上/向下按钮。
存储器接口102可以与存储器150相耦合。该存储器150可以包括高速随机存取存储器和/或非易失性存储器,例如一个或多个磁盘存储设备,一个或多个光学存储设备,和/或闪存存储器(例如NAND,NOR)。
存储器150可以存储操作系统152,例如Android、IOS或是WindowsPhone之类的操作系统。该操作系统152可以包括用于处理基本系统服务以及执行依赖于硬件的任务的指令。存储器150还可以存储各种应用154。在移动设备运行时,会从存储器150中加载操作系统152,并且由处理器104执行。应用154在运行时,也会从存储器150中加载,并由处理器104执行。应用154运行在操作系统之上,利用操作系统以及底层硬件提供的接口实现各种用户期望的功能,如即时通信、网页浏览、图片管理等。应用可以是独立于操作系统提供的,也可以是操作系统自带的。另外,应用154被安装到移动终端100中时,也可以向操作系统添加驱动模块。
本领域技术人员可以意识到,移动终端100可以是手机、平板电脑等移动设备,也可以是智能手表、智能眼镜、智能手环等可穿戴设备。应当理解,图1中的移动终端100仅是示例性的,实际上,移动终端可以不包括图1中示出的所有部件和功能,例如,对于可穿戴设备,可以不包括距离传感器114。
在图1中示出的各种应用154中,其中的一种应用为数据转换装置200,该装置可以识别出文本数据中采用特殊格式进行标记的部分,并将该部分内容作为该文本数据的关键内容。在将文本数据转化为语音数据时,为关键内容赋予特殊的语气以对所述关键内容进行强调,使用户可以方便地获取文本数据中的关键信息,提高用户体验。
图2示出了根据本发明一个实施例的数据转换装置200的结构图。如图2所示,数据转换装置200包括数据获取模块210,文本划分模块220,语气设置模块230和数据转化模块240。
数据获取模块210适于获取待转换的文本数据。文本数据可以是短信、电子邮件、即时通讯软件中的文本内容,也可以是txt、doc、docx等格式的文档中的文本内容。数据获取模块210除了可以直接从文本类的信息和文件中提取文字内容外,还可以获取其他带有文本内容的非文本类格式文件,例如,pdf文件或jpg、png、bmp等格式的图片等。对于非文本格式的文件,数据获取模块210需要将文件中的内容(例如图片)转化为文本内容,例如,通过OCR(OpticalCharacterRecognition,光学字符识别)技术识别图片中的文字。
在获取了待转换的文本数据后,文本划分模块220将上述文本数据划分为关键内容和非关键内容。具体来说,文本划分模块220可以检测该文本数据中是否有采用特殊格式进行标记的部分,如果有的话,则将该部分内容标记为关键内容,相应地,该文本数据中的其他内容被标记为非关键内容。例如,在邮件中,对于重要的内容,人们往往会使用加粗的字体来对其进行标记以表示强调。若数据获取模块210将该邮件中的文本内容作为文本数据,则文本划分模块220可以识别出该邮件中采用特殊格式进行标记的部分(即加粗的字体),并将该部分标记为关键内容。也就是说,邮件中的加粗字体为关键内容,邮件中的其他未采用特殊格式进行标记的部分位非关键内容。在上述例子中,“特殊格式”指的是粗体。本领域技术人员可以意识到,除了粗体以外,“特殊格式”还可以是斜体、下划线,特殊的字体、字号、字间距、字体颜色、字体背景色,等等,本发明对“特殊格式”的具体表现形式不做限制。总之,这种“特殊格式”使得某些文本内容相对于文本数据中的其他内容来说显得更加突出,以及与众不同。文本划分模块220可以识别出文本数据中突出的、不同的部分,并将该部分标记为关键内容,相应地,文本数据中的其他内容则被标记为非关键内容。
语气设置模块230适于设置文本数据中的关键内容对应的第一语气标识和非关键内容对应的第二语气标识。第一语气标识和第二语气标识所指示的语气包括音调、音量、语速中的至少一种。为了强调关键内容,第一语气标识和第二语气标识所指示的语气应当不同,且在大多数情况下,第一语气标识所指示的语气应当比第二语气标识所指示的语气更容易使用户听清楚。例如,第一语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调更高,音量更大,语速更慢。具体地,“音调更高”可以通过提高语音数据的频率来实现,“音量更大”可以通过软件或硬件的方式调高数据转换装置200所处的移动终端的音量来实现,“语速更慢”可以通过降低语音数据的播放速度来实现。
根据一种实施例,第一语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调和音量均不变,语速降低10%。
根据第二种实施例,第一语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调不变,音量提高15%,语速降低10%。
根据第三种实施例,第一语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调提高10%,音量提高10%,语速降低10%。
根据第四种实施例,第一语气标识所指示的语气为:音调500Hz,音量40dB(分贝),语速270字/分钟;第二语气标识所指示的语气为:音调500Hz,音量40dB,语速300字/分钟。
根据第五种实施例,第一语气标识所指示的语气为:音调500Hz,音量46dB,语速270字/分钟;第二语气标识所指示的语气为:音调500Hz,音量40dB,语速300字/分钟。
根据第六种实施例,第一语气标识所指示的语气为:音调550Hz,音量44dB,语速270字/分钟;第二语气标识所指示的语气为:音调500Hz,音量40dB,语速300字/分钟。
数据转化模块240适于将文本数据转换为语音数据,包括:将关键内容转换为第一语音数据,所述第一语音数据带有第一语气标识所指示的语气,以及将非关键内容转换为第二语音数据,所述第二语音数据带有第二语气标识所指示的语气。由于语气设置模块230中设置的第一语气标识和第二语气标识所指示的语气不同,用户在接收到由文本数据转换而来的语音数据时,可以清楚地从中获取关键内容。
在将文本数据转换为语音数据时,需要用到语音库。语音库中包含有各种语气的语音数据。语音库可以存储于移动终端处。由于语音库需要的存储空间往往比较大,在一种优选的实施例中,语音库存储于服务器端,以节省移动终端的存储空间。数据转化模块240检测语音库中是否存有第一语音数据,若是,则直接从语音库中获取该数据;若否,则根据关键内容从语音库中获取第一原始语音数据,第一原始语音数据的语气与第一语气标识所指示的语气不同;按照第一语气标识对第一原始语音数据进行处理,得到第一语音数据,并将得到的第一语音数据存储至语音库。对于第二语音数据,其转化过程与第一语音数据类似,即:数据转化模块240检测语音库中是否存有第二语音数据,若是,则直接从语音库中获取该数据;若否,则根据关键内容从语音库中获取第二原始语音数据,第二原始语音数据的语气与第二语气标识所指示的语气不同;按照第二语气标识对第二原始语音数据进行处理,得到第二语音数据,并将得到的第二语音数据存储至语音库。
根据一种实施例,第一语气标识所指示的语气为:音调550Hz,音量44dB,语速270字/分钟;第二语气标识所指示的语气为:音调500Hz,音量40dB,语速300字/分钟。第一语音数据为关键内容所对应的带有第一语气标识所指示的语气的语音数据,第二语音数据为非关键内容所对应的带有第二语气标识所指示的语气的语音数据。语音库中存有第一语音数据,但未存有第二语音数据。则数据转化模块240直接从语音库中获取第一语音数据,并从语音库中获取非关键内容对应的任意语气的语音数据(即,第二原始语音数据)。随后,数据转化模块240对获取到的第二原始语音数据进行处理,即,设置其语气为第二语气标识所指示的语气:音调500Hz,音量40dB,语速300字/分钟。这样,便得到了非关键内容所对应的第二语音数据。数据转化模块240将经过处理得到的第二语音数据存储至语音库,使得下次数据转换过程中,数据转化模块240可以直接从语音库中获取第二语音数据,而不必再经过处理,节省了时间和计算资源。
根据一种实施例,数据获取模块210获取的文本数据为“期刊征稿:本刊拟发行以大数据、物联网、云计算为主题的特刊,现公开征稿。请至本刊官网投稿,截稿日期2016年4月18日”文本划分模块220识别出采用特殊格式(粗体下划线)进行标记的文本“2016年4月18日”,并将其标记为关键内容,相应地,其他内容为非关键内容。语气设置模块230将关键内容对应的第一语气标识设置为:音调550Hz,音量44dB,语速270字/分钟;将非关键内容对应的第二语气标识设置为:音调500Hz,音量40dB,语速300字/分钟。语音库中存有关键内容所对应的带有第一语气标识所指示的语气的第一语音数据,但未存有非关键内容所对应的带有第二语气标识所指示的语气的第二语音数据。数据转化模块240直接从语音库中获取第一语音数据,并从语音库中获取非关键内容对应的任意语气的第二原始语音数据。随后,数据转化模块240对获取到的第二原始语音数据进行处理,即,设置其语气为第二语气标识所指示的语气:音调500Hz,音量40dB,语速300字/分钟。这样,便得到了非关键内容所对应的第二语音数据。随后,数据转化模块240将经过处理得到的第二语音数据存储至语音库,使得下次数据转换过程中,数据转化模块240可以直接从语音库中获取第二语音数据,而不必再经过处理。最终,用户将得到文本数据“期刊征稿:本刊拟发行以大数据、物联网、云计算为主题的特刊,现公开征稿。请至本刊官网投稿,截稿日期2016年4月18日”所对应的语音数据,更具体地,在上述语音数据中,非关键内容“期刊征稿:本刊拟发行以大数据、物联网、云计算为主题的特刊,现公开征稿。请至本刊官网投稿,截稿日期”对应的语音数据带有第二语气标识所指示的语气(音调500Hz,音量40dB,语速300字/分钟),关键内容“2016年4月18日”所对应的语音数据带有第一语气标识所指示的语气(音调550Hz,音量44dB,语速270字/分钟)。相较于非关键内容,关键内容“2016年4月18日”所对应的语音数据音调更高,音量更大,语速更慢,对用户起到了良好的提示作用。
图3示出了根据本发明一个实施例的数据转换方法300的流程图。如图3所示,该方法始于步骤S310。
在步骤S310中,获取待转换的文本数据。
文本数据可以是短信、电子邮件、即时通讯软件中的文本内容,也可以是txt、doc、docx等格式的文档中的文本内容。除此之外,文本数据还可以是由pdf文件或jpg、png、bmp等格式的图片中识别出的文本内容。
随后,在步骤S320中,将所述文本数据划分为关键内容和非关键内容。
检测该文本数据中是否有采用特殊格式进行标记的部分,如果有的话,则将该部分内容标记为关键内容,相应地,该文本数据中的其他内容被标记为非关键内容。“特殊格式”可以是粗体、斜体、下划线,特殊的字体、字号、字间距、字体颜色、字体背景色,等等。这种“特殊格式”使得某些文本内容相对于文本数据中的其他内容来说显得更加突出,以及与众不同。这些突出的、不同的部分将被标记为关键内容,相应地,文本数据中的其他内容则被标记为非关键内容。
随后,在步骤S330中,获取所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同。
第一语气标识和第二语气标识所指示的语气包括音调、音量、语速中的至少一种。为了强调关键内容,第一语气标识和第二语气标识所指示的语气应当不同,且在大多数情况下,第一语气标识所指示的语气应当比第二语气标识所指示的语气更容易使用户听清楚。例如,低于语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调更高,音量更大,语速更慢。具体地,“音调更高”可以通过提高语音数据的频率来实现,“音量更大”可以通过软件的方式调高数据转换装置200所处的移动终端的音量来实现,“语速更慢”可以通过降低语音数据的播放速度来实现。
根据一种实施例,第一语气标识所指示的语气相对于第二语气标识所指示的语气来说,音调提高10%,音量提高10%,语速降低10%。
根据另一种实施例,第一语气标识所指示的语气为:音调550Hz,音量44dB,语速270字/分钟;第二语气标识所指示的语气为:音调500Hz,音量40dB,语速300字/分钟。
随后,在步骤S340中,将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。
语音库中包含有各种语气的语音数据。语音库可以存储于移动终端处。由于语音库需要的存储空间往往比较大,在一种优选的实施例中,语音库存储于服务器端,以节省移动终端的存储空间。在进行数据转换的过程中,首先检测语音库中是否存有第一语音数据,若是,则直接从语音库中获取该数据;若否,则根据关键内容从语音库中获取第一原始语音数据,第一原始语音数据的语气与第一语气标识所指示的语气不同;按照第一语气标识对第一原始语音数据进行处理,得到第一语音数据,并将得到的第一语音数据存储至语音库。对于第二语音数据,其转化过程与第一语音数据类似,即:检测语音库中是否存有第二语音数据,若是,则直接从语音库中获取该数据;若否,则根据关键内容从语音库中获取第二原始语音数据,第二原始语音数据的语气与第二语气标识所指示的语气不同;按照第二语气标识对第二原始语音数据进行处理,得到第二语音数据,并将得到的第二语音数据存储至语音库。将处理得到的第一语音数据以及第二语音数据存储至语音库的步骤使得在下次数据转换过程中,可以直接从语音库中获取第一语音数据及第二语音数据,而不必再经过处理,节省了时间和计算资源。
根据本发明提供的技术方案,可以识别出文本数据中采用特殊格式进行标记的部分,并将该部分内容作为该文本数据的关键内容。在将文本数据转化为语音数据时,为关键内容赋予特殊的语气以对所述关键内容进行强调,使用户可以方便地获取文本数据中的关键信息,提高用户体验。
需要说明的是,本说明书中的前述内容所描述的数据转换装置200驻留于移动终端中,数据转换方法300亦于移动终端中执行。但是,本领域技术人员可以意识到,数据转换装置200还可以驻留于服务器中,相应地,数据转换方法300于服务器中执行。在这种情况下,移动终端仅用于获取原始文件(如短信、邮件,txt、doc等文本文件,pdf文件,jpg、png图片等),并将原始文件上传至服务器,随后,由服务器中的数据转换装置执行相应的数据转换过程,具体的数据转换过程与前述移动终端中的数据转换装置执行的数据转换过程相同,此处不再赘述。数据转换完成后,服务器将转换得出的语音数据发送至移动终端,并由移动终端将语音数据播报给用户。与设置在移动终端处相比,将数据转换装置200设置在服务器中可以节约移动终端处的计算资源、加快数据转换过程,但是,移动终端将原始文件上传至服务器、以及服务器将转换后的语音数据返回给移动终端的过程会造成网络流量消耗。技术人员可以据此自行斟酌将数据转换装置200设置于移动终端中抑或设置于服务器中。
A5:A4所述的数据转换方法,其中,所述第一语气标识和所述第二语气标识所指示的语气包括音调时,所述第一语气标识所指示的音调比所述第二语气所指示的音调高10%~50%。A6:A4所述的数据转换方法,其中,所述第一语气标识和所述第二语气标识所指示的语气包括音量时,所述第一语气标识所指示的音量比所述第二语气所指示的音量高10%~50%。A7:A4所述的数据转换方法,其中,所述第一语气标识和所述第二语气标识所指示的语气包括语速时,所述第一语气标识所指示的语速比所述第二语气所指示的语速低10%~50%。A8:A1所述的数据转换方法,其中,将所述关键内容转换为第一语音数据的步骤包括:检测语音库中是否包含所述第一语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第一语音数据时,获取所述第一语音数据。A9:A8所述的数据转换方法,其中,当语音库中未包含所述第一语音数据时:根据所述关键内容从语音库中获取第一原始语音数据,所述第一原始语音数据的语气与所述第一语气标识所指示的语气不同;按照第一语气标识对所述第一原始语音数据进行处理,得到所述第一语音数据;将得到的所述第一语音数据存储至所述语音库。A10:A1所述的数据转换方法,其中,将所述非关键内容转换为第二语音数据的步骤包括:检测语音库中是否包含所述第二语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第二语音数据时,获取所述第二语音数据。A11:A10所述的数据转换方法,其中,当语音库中未包含所述第二语音数据时:根据所述关键内容从语音库中获取第二原始语音数据,所述第二原始语音数据的语气与所述第二语气标识所指示的语气不同;按照第二语气标识对所述第二原始语音数据进行处理,得到所述第二语音数据;将得到的所述第二语音数据存储至所述语音库。
B16:B15所述的数据转换装置,其中,所述第一语气标识和所述第二语气标识所指示的语气包括音调时,所述第一语气标识所指示的音调比所述第二语气所指示的音调高10%~50%。B17:B15所述的数据转换装置,其中,所述第一语气标识和所述第二语气标识所指示的语气包括音量时,所述第一语气标识所指示的音量比所述第二语气所指示的音量高10%~50%。B18:B15所述的数据转换装置,其中,所述第一语气标识和所述第二语气标识所指示的语气包括语速时,所述第一语气标识所指示的语速比所述第二语气所指示的语速低10%~50%。B19:B12所述的数据转换装置,其中,所述数据转化模块还适于:检测语音库中是否包含所述第一语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第一语音数据时,获取所述第一语音数据。B20:B19所述的数据转换装置,其中,所述数据转化模块还适于在语音库中未包含所述第一语音数据时:根据所述关键内容从语音库中获取第一原始语音数据,所述第一原始语音数据的语气与所述第一语气标识所指示的语气不同;按照第一语气标识对所述第一原始语音数据进行处理,得到所述第一语音数据;将得到的所述第一语音数据存储至所述语音库。B21:B12所述的数据转换装置,其中,所述数据转化模块还适于:检测语音库中是否包含所述第二语音数据,所述语音库中包含带有语气的语音数据;当语音库中包含所述第二语音数据时,获取所述第二语音数据。B22:B21所述的数据转换装置,其中,所述数据转化模块还适于在语音库中未包含所述第二语音数据时:根据所述关键内容从语音库中获取第二原始语音数据,所述第二原始语音数据的语气与所述第二语气标识所指示的语气不同;按照第二语气标识对所述第二原始语音数据进行处理,得到所述第二语音数据;将得到的所述第二语音数据存储至所述语音库。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种数据转换方法,包括:
获取待转换的文本数据;
将所述文本数据划分为关键内容和非关键内容;
获取所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同;
将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。
2.如权利要求1所述的数据转换方法,其中,所述关键内容包括:所述文本数据中采用特殊格式进行标记的部分;
所述非关键内容包括:所述文本数据中未采用特殊格式进行标记的部分。
3.如权利要求2所述的数据转换方法,其中,所述特殊格式包括:
粗体、斜体、下划线,以及特殊的字体、字号、字间距、字体颜色、字体背景色中的至少一种。
4.如权利要求1所述的数据转换方法,其中,所述第一语气标识和所述第二语气标识所指示的语气包括:音调、音量、语速中的至少一种。
5.一种数据转换装置,包括:
数据获取模块,适于获取待转换的文本数据;
文本划分模块,适于将所述文本数据划分为关键内容和非关键内容;
语气设置模块,适于设置所述关键内容对应的第一语气标识和所述非关键内容对应的第二语气标识,其中,所述第一语气标识和所述第二语气标识所指示的语气不同;以及
数据转化模块,适于将所述文本数据转换为语音数据,包括:将所述关键内容转换为第一语音数据,所述第一语音数据带有所述第一语气标识所指示的语气,以及将所述非关键内容转换为第二语音数据,所述第二语音数据带有所述第二语气标识所指示的语气。
6.如权利要求5所述的数据转换装置,其中,所述关键内容包括:所述文本数据中采用特殊格式进行标记的部分;
所述非关键内容包括:所述文本数据中未采用特殊格式进行标记的部分。
7.如权利要求6所述的数据转换装置,其中,所述特殊格式包括:
粗体、斜体、下划线,以及特殊的字体、字号、字间距、字体颜色、字体背景色中的至少一种。
8.如权利要求5所述的数据转换装置,其中,所述第一语气标识和所述第二语气标识所指示的语气包括:音调、音量、语速中的至少一种。
9.一种移动终端,包括如权利要求5-8中任一项所述的数据转换装置。
10.一种服务器,包括如权利要求5-8中任一项所述的数据转换装置。
CN201610274186.9A 2016-04-28 2016-04-28 数据转换方法及装置 Pending CN105741829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610274186.9A CN105741829A (zh) 2016-04-28 2016-04-28 数据转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610274186.9A CN105741829A (zh) 2016-04-28 2016-04-28 数据转换方法及装置

Publications (1)

Publication Number Publication Date
CN105741829A true CN105741829A (zh) 2016-07-06

Family

ID=56287568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610274186.9A Pending CN105741829A (zh) 2016-04-28 2016-04-28 数据转换方法及装置

Country Status (1)

Country Link
CN (1) CN105741829A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689887A (zh) * 2019-09-24 2020-01-14 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200554A (ja) * 1993-12-28 1995-08-04 Toshiba Corp 文章読み上げ装置
JPH11231885A (ja) * 1998-02-19 1999-08-27 Fujitsu Ten Ltd 音声合成装置
CN1788305A (zh) * 2003-06-19 2006-06-14 国际商业机器公司 使用语义分析配置语音阅读器的系统和方法
CN103020019A (zh) * 2011-09-26 2013-04-03 株式会社东芝 标记辅助设备、方法和程序
CN105139848A (zh) * 2015-07-23 2015-12-09 小米科技有限责任公司 数据转换方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200554A (ja) * 1993-12-28 1995-08-04 Toshiba Corp 文章読み上げ装置
JPH11231885A (ja) * 1998-02-19 1999-08-27 Fujitsu Ten Ltd 音声合成装置
CN1788305A (zh) * 2003-06-19 2006-06-14 国际商业机器公司 使用语义分析配置语音阅读器的系统和方法
CN103020019A (zh) * 2011-09-26 2013-04-03 株式会社东芝 标记辅助设备、方法和程序
CN105139848A (zh) * 2015-07-23 2015-12-09 小米科技有限责任公司 数据转换方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689887A (zh) * 2019-09-24 2020-01-14 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备
CN110689887B (zh) * 2019-09-24 2022-04-22 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US11221819B2 (en) Extendable architecture for augmented reality system
JP7042963B1 (ja) 関連コンテンツを先見的に特定し、タッチ感知デバイス上に表面化させるためのシステム及び方法
JP7037602B2 (ja) デジタルアシスタントサービスの遠距離拡張
EP2990930B1 (en) Scraped information providing method and apparatus
US9666173B2 (en) Method for playing virtual musical instrument and electronic device for supporting the same
US20170249934A1 (en) Electronic device and method for operating the same
WO2020019220A1 (zh) 在预览界面中显示业务信息的方法及电子设备
KR102042211B1 (ko) 벤딩 상태에 따라 오브젝트를 변경하여 디스플레이하는 전자 장치 및 방법
US20150128073A1 (en) Method for sharing contents and electronic device thereof
KR102234400B1 (ko) 컨텐츠의 순서 또는 위치를 변경하는 전자 장치 및 방법
CN105139848B (zh) 数据转换方法和装置
CN111524501A (zh) 语音播放方法、装置、计算机设备及计算机可读存储介质
US10848558B2 (en) Method and apparatus for file management
WO2019118253A1 (en) Document recall based on vector nearest neighbor search
CN104978045A (zh) 一种汉字输入方法及装置
CN109189243B (zh) 输入法切换方法、装置及用户终端
US10969935B2 (en) System for generation of novel artifacts with user-guided discovery and navigation of the creative space
CN107872573B (zh) 一种闹钟设置方法及终端
US20150370351A1 (en) Pen Input Device Used With Mobile Device
CN105741829A (zh) 数据转换方法及装置
CN105577878A (zh) 一种短消息归类整理装置、方法及移动终端
JP6222111B2 (ja) 表示制御装置、表示制御方法および記録媒体
US20150347376A1 (en) Server-based platform for text proofreading
CN107612981B (zh) 应用程序推送方法、装置、终端及计算机可读存储介质
US20090282330A1 (en) Inputting data on a portable computing device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160706