CN106710597A - 语音数据的录音方法及装置 - Google Patents
语音数据的录音方法及装置 Download PDFInfo
- Publication number
- CN106710597A CN106710597A CN201710007151.3A CN201710007151A CN106710597A CN 106710597 A CN106710597 A CN 106710597A CN 201710007151 A CN201710007151 A CN 201710007151A CN 106710597 A CN106710597 A CN 106710597A
- Authority
- CN
- China
- Prior art keywords
- text
- speech data
- different
- text message
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000010365 information processing Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011017 operating method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明适用于终端领域,提供了一种语音数据的录音方法及装置。所述方法包括:录制录音人员根据第一文本得到的第一语音数据;识别所述第一语音数据,得到第二文本;将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息;录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据;将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。通过上述方法,提高了录音效率。
Description
技术领域
本发明实施例属于终端领域,尤其涉及一种语音数据的录音方法及装置。
背景技术
目前,学生手机、点读机、家教机等终端制作的语音数据都需要特定录音人员根据所给出的稿件(即文本)进行语音录制,录制好的语音数据再传回公司进行人工听音、修音、测试,以查找录制的语音数据是否存在错误,若存在错误,公司再安排录音人员重新录音。
故,有必要提出一种新的方法,以解决上述技术问题。
发明内容
本发明实施例提供了一种语音数据的录音方法及装置,旨在解决现有的方法中,需要人工听音、修音、测试,以查找录制的语音数据是否存在错误,从而导致录音效率过低的问题。
本发明实施例的第一方面,提供了一种语音数据的录音方法,所述方法包括:
录制录音人员根据第一文本得到的第一语音数据;
识别所述第一语音数据,得到第二文本;
将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息;
录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据;
将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
本发明实施例的第二方面,提供了一种语音数据的录音装置,所述装置包括:
第一语音数据录制单元,用于录制录音人员根据第一文本得到的第一语音数据;
第一语音数据识别单元,用于识别所述第一语音数据,得到第二文本;
文本比较单元,用于将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息;
第二语音数据录制单元,用于录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据;
语音数据替换单元,用于将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
在本发明实施例中,由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误,因此,简化了操作步骤,提高了录音效率。
附图说明
图1是本发明第一实施例提供的一种语音数据的录音方法的流程图;
图2是本发明第二实施例提供的一种语音数据的录音装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明第一实施例中,录制录音人员根据第一文本得到的第一语音数据,识别所述第一语音数据,得到第二文本,将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据,将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了本发明第一实施例提供的一种语音数据的录音方法的流程图,详述如下:
步骤S11,录制录音人员根据第一文本得到的第一语音数据。
具体地,录音人员根据第一文本的内容发出对应的语音,终端录制该语音,得到对应的第一语音数据。
步骤S12,识别所述第一语音数据,得到第二文本。
虽然第一语音数据是录音人员对照给出的第一文本进行录制,但是仍不能保证录制的第一语音数据是百分之百与第一文本匹配的,因此,需要再通过语音识别算法识别第一语音数据,得到第二文本。
步骤S13,将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息。
可选地,为了便于用户快速查看到两个文本不同的文本信息,所述步骤S13包括:
A1、将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息。
A2、在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。
上述鲜艳颜色是指,与显示第一文本(或第二文本)的文本信息的颜色不同且鲜艳的颜色,例如,假设显示第一文本的文本信息的颜色为黑色,若在第一文本上以鲜艳颜色标识确定的文本信息,则以红色或黄色或蓝色等鲜艳颜色显示确定的所述第一文本和所述第二文本不同的文本信息。
可选地,为了便于用户快速查看到两个文本不同的文本信息,所述步骤S13包括:
B1、将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息。
B2、在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。
其中,指定符号包括星号(如“※”),三角形、矩形等符号。在指定符号为星号时,在确定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”,以标识所述第一文本和所述第二文本不同的文本信息。
其中,指定字体包括宋体、楷体等。为了便于标识,显示所述第一文本和所述第二文本不同的文本信息的字体与显示所述第一文本和所述第二文本相同的文本信息的字体不同。为了进一步区分,显示所述第一文本和所述第二文本不同的文本信息的字号也与显示所述第一文本和所述第二文本相同的文本信息的字号不同。
步骤S14,录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据。
可选地,为了保证同一句语音数据的声音信息(如语速、语调等)相同,则所述步骤S14具体包括:
C1、判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息。具体地,判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且与包括的该其他文本信息之间是否包括标点符号,若包括标点符号,则判定为非整句的文本信息,否则,判定为整句的文本信息。或者,通过判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且与包括的该其他文本信息的语义是否相同,若相同,判定为整句的文本信息,否则,判定为非整句的文本信息。
C2、在所述第一文本和所述第二文本不同的文本信息为整句的文本信息,录制所述第一文本和所述第二文本不同的文本信息的第二语音数据。
C3、在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。
上述C1~C3中,由于录制的第二语音数据为整句的文本信息,因此,使得整句的文本信息对应的第二语音数据在语速、语调上保持一致,便于提高用户的满意度。
可选地,在录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据后,确定该第二语音数据的声音信息(如语速、语调、声音频率等),获取第一语音数据的声音信息,再将第二语音数据的声音信息与第一语音数据的声音信息比较,并在第二语音数据的声音信息与第一语音数据的声音信息的差大于预设的阈值时,发出重录制第二语音数据的提示。
步骤S15,将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
可选地,为了能够准确替换第一语音数据中对应的语音数据,则在执行所述步骤S13时,包括:
确定包括标识的文本信息对应的时间轴信息。其中,时间轴信息包括标识的文本信息的开始和结束的时间信息。需要指出的是,所述包括标识的文本信息对应的时间轴信息包括2种情况,1种是只为标识的文本信息的开始和结束的时间信息,另1种是标识的文本信息所在的整句的开始和结束的时间信息。
对应地,所述步骤S15具体包括:
将所述第二语音数据替换所述第一语音数据中与所述时间轴信息对应的语音数据,得到最终的语音数据。
本发明第一实施例中,录制录音人员根据第一文本得到的第一语音数据,识别所述第一语音数据,得到第二文本,将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据,将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误,因此,简化了操作步骤,提高了录音效率。
应理解,在本发明实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
图2示出了本发明第二实施例提供的一种语音数据的录音装置的结构图,该语音数据的录音装置可应用于各种终端中,该终端可以包括经无线接入网RAN与一个或多个核心网进行通信的用户设备,该用户设备可以是移动电话(或称为“蜂窝”电话)、具有移动设备的计算机等,例如,用户设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。又例如,该移动设备可以包括智能手机、平板电脑、个人数字助理PDA、销售终端POS或车载电脑等。为了便于说明,仅示出了与本发明实施例相关的部分。
该语音数据的录音装置包括:第一语音数据录制单元21、第一语音数据识别单元22、文本比较单元23、第二语音数据录制单元24、语音数据替换单元25。其中:
第一语音数据录制单元21,用于录制录音人员根据第一文本得到的第一语音数据。
第一语音数据识别单元22,用于识别所述第一语音数据,得到第二文本。
文本比较单元23,用于将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息。
可选地,为了便于用户快速查看到两个文本不同的文本信息,所述文本比较单元23包括:
第一不同的文本信息确定模块,用于将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息。
颜色标识模块,用于在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。上述鲜艳颜色是指,与显示第一文本(或第二文本)的文本信息的颜色不同且鲜艳的颜色。
可选地,为了便于用户快速查看到两个文本不同的文本信息,所述文本比较单元23包括:
第二不同的文本信息确定模块,用于将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息。
指定符号标识模块,用于在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。其中,指定符号包括星号(如“※”),三角形、矩形等符号。在指定符号为星号时,在确定的所述第一文本和所述第二文本不同的文本信息的同一行批注“※”,以标识所述第一文本和所述第二文本不同的文本信息。
其中,指定字体包括宋体、楷体等。为了便于标识,显示所述第一文本和所述第二文本不同的文本信息的字体与显示所述第一文本和所述第二文本相同的文本信息的字体不同。为了进一步区分,显示所述第一文本和所述第二文本不同的文本信息的字号也与显示所述第一文本和所述第二文本相同的文本信息的字号不同。
第二语音数据录制单元24,用于录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据。
可选地,为了保证同一句语音数据的声音信息(如语速、语调等)相同,所述第二语音数据录制单元24包括:
整句的文本信息判断模块,用于判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息。具体地,判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且与包括的该其他文本信息之间是否包括标点符号,若包括标点符号,则判定为非整句的文本信息,否则,判定为整句的文本信息。或者,通过判断所述第一文本和所述第二文本不同的文本信息的前面和后面是否包括其他文本信息,且与包括的该其他文本信息的语义是否相同,若相同,判定为整句的文本信息,否则,判定为非整句的文本信息。
整句的文本信息处理模块,用于在所述第一文本和所述第二文本不同的文本信息为整句的文本信息,录制所述第一文本和所述第二文本不同的文本信息的第二语音数据。
非整句的文本信息处理模块,用于在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。
可选地,该语音数据的录音装置包括:
提示单元,用于确定第二语音数据的声音信息(如语速、语调、声音频率等),获取第一语音数据的声音信息,再将第二语音数据的声音信息与第一语音数据的声音信息比较,并在第二语音数据的声音信息与第一语音数据的声音信息的差大于预设的阈值时,发出重录制第二语音数据的提示。
语音数据替换单元25,用于将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
可选地,为了能够准确替换第一语音数据中对应的语音数据,该语音数据的录音装置包括:
时间轴信息确定单元,用于确定包括标识的文本信息对应的时间轴信息。其中,时间轴信息包括标识的文本信息的开始和结束的时间信息。需要指出的是,所述包括标识的文本信息对应的时间轴信息包括2种情况,1种是只为标识的文本信息的开始和结束的时间信息,另1种是标识的文本信息所在的整句的开始和结束的时间信息。
对应地,所述语音数据替换单元具体包括:
将所述第二语音数据替换所述第一语音数据中与所述时间轴信息对应的语音数据,得到最终的语音数据。
本发明第二实施例中,由于无需通过人工听音、修音、测试来查找录制的语音数据是否存在错误,因此,简化了操作步骤,提高了录音效率。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种语音数据的录音方法,其特征在于,所述方法包括:
录制录音人员根据第一文本得到的第一语音数据;
识别所述第一语音数据,得到第二文本;
将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息;
录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据;
将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息,具体包括:
将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息;
在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息,具体包括:
将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息;
在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据,具体包括:
判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息;
在所述第一文本和所述第二文本不同的文本信息为整句的文本信息,录制所述第一文本和所述第二文本不同的文本信息的第二语音数据;
在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。
5.根据权利要求4所述的方法,其特征在于,在所述将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息时,包括:
确定包括标识的文本信息对应的时间轴信息;
对应地,所述将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据,具体包括:
将所述第二语音数据替换所述第一语音数据中与所述时间轴信息对应的语音数据,得到最终的语音数据。
6.一种语音数据的录音装置,其特征在于,所述装置包括:
第一语音数据录制单元,用于录制录音人员根据第一文本得到的第一语音数据;
第一语音数据识别单元,用于识别所述第一语音数据,得到第二文本;
文本比较单元,用于将所述第一文本和所述第二文本比较,并标识所述第一文本和所述第二文本不同的文本信息;
第二语音数据录制单元,用于录制包括所述第一文本和所述第二文本不同的文本信息的第二语音数据;
语音数据替换单元,用于将所述第二语音数据替换所述第一语音数据中对应的语音数据,得到最终的语音数据。
7.根据权利要求6所述的装置,其特征在于,所述文本比较单元包括:
第一不同的文本信息确定模块,用于将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息;
颜色标识模块,用于在所述第一文本上以鲜艳颜色标识确定的文本信息和/或在所述第二文本上以鲜艳颜色标识确定的文本信息。
8.根据权利要求6所述的装置,其特征在于,所述文本比较单元包括:
第二不同的文本信息确定模块,用于将所述第一文本和所述第二文本比较,确定所述第一文本和所述第二文本不同的文本信息;
指定符号标识模块,用于在所述第一文本上以指定符号或指定字体标识确定的文本信息和/或在所述第二文本上以指定符号或指定字体标识确定的文本信息。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述第二语音数据录制单元包括:
整句的文本信息判断模块,用于判断所述第一文本和所述第二文本不同的文本信息是否为整句的文本信息;
整句的文本信息处理模块,用于在所述第一文本和所述第二文本不同的文本信息为整句的文本信息,录制所述第一文本和所述第二文本不同的文本信息的第二语音数据;
非整句的文本信息处理模块,用于在所述第一文本和所述第二文本不同的文本信息不为整句的文本信息,录制包括所述第一文本和所述第二文本不同的文本信息所在的整句的文本信息的第二语音数据。
10.根据权利要求9所述的装置,其特征在于,所述装置包括:
时间轴信息确定单元,用于确定包括标识的文本信息对应的时间轴信息;
对应地,所述语音数据替换单元具体包括:
将所述第二语音数据替换所述第一语音数据中与所述时间轴信息对应的语音数据,得到最终的语音数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710007151.3A CN106710597B (zh) | 2017-01-04 | 2017-01-04 | 语音数据的录音方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710007151.3A CN106710597B (zh) | 2017-01-04 | 2017-01-04 | 语音数据的录音方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106710597A true CN106710597A (zh) | 2017-05-24 |
CN106710597B CN106710597B (zh) | 2020-12-11 |
Family
ID=58907899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710007151.3A Active CN106710597B (zh) | 2017-01-04 | 2017-01-04 | 语音数据的录音方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106710597B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108109633A (zh) * | 2017-12-20 | 2018-06-01 | 北京声智科技有限公司 | 无人值守的云端语音库采集与智能产品测试的系统与方法 |
CN108538292A (zh) * | 2018-04-26 | 2018-09-14 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、设备及可读存储介质 |
WO2018227761A1 (zh) * | 2017-06-13 | 2018-12-20 | 深圳市鹰硕技术有限公司 | 一种教学录播数据修正装置 |
WO2019061192A1 (zh) * | 2017-09-28 | 2019-04-04 | 深圳传音通讯有限公司 | 音频处理方法及相关产品 |
CN115050349A (zh) * | 2022-06-14 | 2022-09-13 | 抖音视界(北京)有限公司 | 文本转换音频的方法、装置、设备和介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210193A (ja) * | 1994-01-12 | 1995-08-11 | Matsushita Electric Ind Co Ltd | 音声対話装置 |
US20020049590A1 (en) * | 2000-10-20 | 2002-04-25 | Hiroaki Yoshino | Speech data recording apparatus and method for speech recognition learning |
CN1555553A (zh) * | 2001-09-17 | 2004-12-15 | �ʼҷ����ֵ��ӹɷ�����˾ | 通过比较所识别的文本中的语音学序列与手动输入的校正词的语音学转换来校正通过语音识别而识别的文本 |
CN1568501A (zh) * | 2001-10-12 | 2005-01-19 | 皇家飞利浦电子股份有限公司 | 标注所识别文本的部分的校正装置 |
US7177800B2 (en) * | 2000-11-03 | 2007-02-13 | Digital Design Gmbh | Method and device for the processing of speech information |
CN101031913A (zh) * | 2004-09-30 | 2007-09-05 | 皇家飞利浦电子股份有限公司 | 自动文本校正 |
CN101188110A (zh) * | 2006-11-17 | 2008-05-28 | 陈健全 | 提高文本和语音匹配效率的方法 |
US20130266127A1 (en) * | 2012-04-10 | 2013-10-10 | Raytheon Bbn Technologies Corp | System and method for removing sensitive data from a recording |
CN103366742A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入方法及系统 |
CN103366741A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入纠错方法及系统 |
CN103369122A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入方法及系统 |
CN104900233A (zh) * | 2015-05-12 | 2015-09-09 | 深圳市东方泰明科技有限公司 | 一种声音与文本全自动匹配对齐的方法 |
CN105244026A (zh) * | 2015-08-24 | 2016-01-13 | 陈娟 | 一种语音处理方法及装置 |
CN105653729A (zh) * | 2016-01-28 | 2016-06-08 | 努比亚技术有限公司 | 一种录音文件索引的装置及方法 |
CN105702256A (zh) * | 2014-11-28 | 2016-06-22 | 上海航空电器有限公司 | 一种基于机载设备的数字串语音识别方法 |
-
2017
- 2017-01-04 CN CN201710007151.3A patent/CN106710597B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210193A (ja) * | 1994-01-12 | 1995-08-11 | Matsushita Electric Ind Co Ltd | 音声対話装置 |
US20020049590A1 (en) * | 2000-10-20 | 2002-04-25 | Hiroaki Yoshino | Speech data recording apparatus and method for speech recognition learning |
US7177800B2 (en) * | 2000-11-03 | 2007-02-13 | Digital Design Gmbh | Method and device for the processing of speech information |
CN1555553A (zh) * | 2001-09-17 | 2004-12-15 | �ʼҷ����ֵ��ӹɷ�����˾ | 通过比较所识别的文本中的语音学序列与手动输入的校正词的语音学转换来校正通过语音识别而识别的文本 |
CN1568501A (zh) * | 2001-10-12 | 2005-01-19 | 皇家飞利浦电子股份有限公司 | 标注所识别文本的部分的校正装置 |
CN101031913A (zh) * | 2004-09-30 | 2007-09-05 | 皇家飞利浦电子股份有限公司 | 自动文本校正 |
CN101188110A (zh) * | 2006-11-17 | 2008-05-28 | 陈健全 | 提高文本和语音匹配效率的方法 |
CN103366742A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入方法及系统 |
CN103366741A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入纠错方法及系统 |
CN103369122A (zh) * | 2012-03-31 | 2013-10-23 | 盛乐信息技术(上海)有限公司 | 语音输入方法及系统 |
US20130266127A1 (en) * | 2012-04-10 | 2013-10-10 | Raytheon Bbn Technologies Corp | System and method for removing sensitive data from a recording |
CN105702256A (zh) * | 2014-11-28 | 2016-06-22 | 上海航空电器有限公司 | 一种基于机载设备的数字串语音识别方法 |
CN104900233A (zh) * | 2015-05-12 | 2015-09-09 | 深圳市东方泰明科技有限公司 | 一种声音与文本全自动匹配对齐的方法 |
CN105244026A (zh) * | 2015-08-24 | 2016-01-13 | 陈娟 | 一种语音处理方法及装置 |
CN105653729A (zh) * | 2016-01-28 | 2016-06-08 | 努比亚技术有限公司 | 一种录音文件索引的装置及方法 |
Non-Patent Citations (2)
Title |
---|
KEITH VERTANEN: ""automatic selection of recognition errors by respeaking the intended text"", 《2009 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION & UNDERSTANDING》 * |
翁兆廷: ""语音生词本的分析和实现"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018227761A1 (zh) * | 2017-06-13 | 2018-12-20 | 深圳市鹰硕技术有限公司 | 一种教学录播数据修正装置 |
WO2019061192A1 (zh) * | 2017-09-28 | 2019-04-04 | 深圳传音通讯有限公司 | 音频处理方法及相关产品 |
CN108109633A (zh) * | 2017-12-20 | 2018-06-01 | 北京声智科技有限公司 | 无人值守的云端语音库采集与智能产品测试的系统与方法 |
CN108538292A (zh) * | 2018-04-26 | 2018-09-14 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、设备及可读存储介质 |
CN108538292B (zh) * | 2018-04-26 | 2020-12-22 | 科大讯飞股份有限公司 | 一种语音识别方法、装置、设备及可读存储介质 |
CN115050349A (zh) * | 2022-06-14 | 2022-09-13 | 抖音视界(北京)有限公司 | 文本转换音频的方法、装置、设备和介质 |
CN115050349B (zh) * | 2022-06-14 | 2024-06-11 | 抖音视界有限公司 | 文本转换音频的方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106710597B (zh) | 2020-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106710597A (zh) | 语音数据的录音方法及装置 | |
CN105100366B (zh) | 骚扰电话号码确定方法、装置和系统 | |
CN109727041A (zh) | 智能客服多轮问答方法、设备、存储介质及装置 | |
US10666792B1 (en) | Apparatus and method for detecting new calls from a known robocaller and identifying relationships among telephone calls | |
CN106844413A (zh) | 实体关系抽取的方法及装置 | |
CN107992545A (zh) | 一种搜索方法、装置、终端及可读存储介质 | |
CN105426511A (zh) | 背诵辅助方法及装置 | |
CN113903363B (zh) | 基于人工智能的违规行为检测方法、装置、设备及介质 | |
CN103430232A (zh) | 利用设备停靠情境的语音识别 | |
CN107274916A (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
CN103249015B (zh) | 短消息合并方法及装置 | |
CN106250518A (zh) | 智能搜题方法及装置 | |
CN107292365A (zh) | 商品标签的绑定方法、装置、设备及计算机可读存储介质 | |
CN106294717A (zh) | 基于智能终端的搜题方法及装置 | |
CN103577989A (zh) | 一种基于产品识别的信息分类方法及信息分类系统 | |
CN109815321A (zh) | 问答方法、装置、设备及存储介质 | |
CN107885483A (zh) | 音频信息的校验方法、装置、存储介质及电子设备 | |
CN111783126B (zh) | 一种隐私数据识别方法、装置、设备和可读介质 | |
CN109767786A (zh) | 一种在线语音实时检测方法及装置 | |
CN101631341A (zh) | 信息的识别方法及移动终端 | |
CN107203265A (zh) | 信息交互方法和装置 | |
CN113051923B (zh) | 数据验证方法、装置、计算机设备和存储介质 | |
CN106776760A (zh) | 应用于智能终端的搜题方法及装置 | |
CN103546613A (zh) | 联系人记录方法、装置和移动终端 | |
CN110459223A (zh) | 数据跟踪处理方法、设备、存储介质及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |