CN102568524A - 一种音频信息的输出方法及系统 - Google Patents

一种音频信息的输出方法及系统 Download PDF

Info

Publication number
CN102568524A
CN102568524A CN2010106184443A CN201010618444A CN102568524A CN 102568524 A CN102568524 A CN 102568524A CN 2010106184443 A CN2010106184443 A CN 2010106184443A CN 201010618444 A CN201010618444 A CN 201010618444A CN 102568524 A CN102568524 A CN 102568524A
Authority
CN
China
Prior art keywords
audio
frequency information
information
frequency
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010106184443A
Other languages
English (en)
Other versions
CN102568524B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Liangming Technology Development Co Ltd
Original Assignee
Shanghai Liangming Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Liangming Technology Development Co Ltd filed Critical Shanghai Liangming Technology Development Co Ltd
Priority to CN201010618444.3A priority Critical patent/CN102568524B/zh
Publication of CN102568524A publication Critical patent/CN102568524A/zh
Application granted granted Critical
Publication of CN102568524B publication Critical patent/CN102568524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明的目的是提供一种音频信息的输出方法及系统,属于计算机、软件技术领域。所述的方法包括有如下步骤:步骤1,采集音频信息;步骤2,将音频信息按照比例关系进行分割;步骤3,将分割后的两份及两份以上的音频信息混合着输出。在本发明中,提供一种新型的音频信息的处理方式,可应用于各种具有音频成分的数据内容。在使用中,除了应用于语音学习之外,也应用于包含有声音信息的其它各种场景。利用本发明,能够获得具有混合效果的、效率更高的音频信息的输出方式。

Description

一种音频信息的输出方法及系统
技术领域
本发明属于计算机、软件技术领域。
技术背景
在目前的文化交流和经济交流中,人们经常会学习多种语言,学习语言的方式,有各种各样的途径。其中,对语音信息的理解与分析能力,在人们的交流中地位重要。如何向人们提供良好的语音学习方式,一直是人们所探讨的重要问题。
在本发明中,我们提供一种新型的音频信息的处理方式。除了应用于语音学习之外,也应用于声音的其它场景。
发明内容
本发明的目的,是提供一种音频信息的输出方法,以及配套的系统,利用本发明,能够获得具有混合效果的、效率更高的音频信息的输出方式。
一种音频信息的输出方法,该方法包括有如下步骤:
步骤1,采集音频信息;
步骤2,将音频信息按照比例关系进行分割;
步骤3,将分割后的两份及两份以上的音频信息混合着输出。
进一步,长度不一样的音频信息同时播放时,长度短的音频信息可循环着进行信息播放。
进一步,所述的音频信息的分割方式,是以分割比例为整数的方式进行分割,该整数是大于或等于2的整数形式。
进一步,所述的音频信息的分割方式,是以音频的时间总长度为参考量进行分割。
进一步,所述的音频信息的分割方式,对于字符内容来说,以独立的字符作为分割的信息单位。
进一步,所述的音频信息的分割方式中,进行音频分割的比例是分数。
进一步,所述的音频信息的分割方式中,对于人类语言内容来说,以声音来源的方式,来进行音频数据的分割。
进一步,在混合多种音频信息进行输出的时候,对混合的音频信息之间作时间间隔。
进一步,在混合多种音频信息进行输出的时候,将分段后的音频信息,采用随机的方式进行混合输出。
进一步,在混合多种音频信息进行输出的时候,进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
本发明还提供一种音频信息的输出系统,该系统包括:
音频信息采集模块,用以采集音频信息;
音频信息分割模块,用以将音频信息按照比例关系进行分割;
分割信息输出模块,将分割后的两份及两份以上的音频信息混合着输出。
附图说明
图1是本发明中,一段音频信息的示意图。
图2是本发明中,一段音频信息被非均匀分割为5段的示意图。
图3是本发明中,5段音频信息被同时播放的示意图,与图1、图2所示的实施例相对应。
图4是本发明所述方法的流程图。
图5是本发明所述系统的结构框图。
具体实施例
为了对本发明更好地进行说明,作为举例而非限定,将本发明的思想描述如下:
在生活中,声音信息经常是混合着输出的,比如,我们可以同时听到多人的谈话。因此,可以通过将音频信息进行分段处理,然后混合着进行输出,来同时输出多段的声音信息,从而提高用户获得音频内容的效率,或用以营造相应的声音环境。
下面结合着附图,对本发明进行详细描述。
本发明所描述的方法,包括有如下步骤:
步骤1,采集音频信息。
在该步骤中,主要是采集音频信息内容,作为进行本发明所描述的音频处理方式的基础数据。
需要指出的是,音频信息的载体形式,是多种多样的。可以仅仅是音频信息,也可以是多媒体信息,或者是和特定程序相关联或者和特定文档相关联的语音信息内容,等等。另外,音频信息的格式,也是不做任何限定的。这些包括有音频信息形式的数据内容,都可以应用于本发明。
采集音频信息的方式,除了直接载入音频信息的内容之外,另外,在本发明中,还可以直接通过包括麦克风在内的音频信息采集工具,通过录制声音信息的方式来采集。
所获得的音频信息内容,供接下来的数据处理之用。
步骤2,将音频信息按照比例关系进行分割。
在该步骤中,我们需要对上一步骤所采集获得的音频信息,按照预设的比例方式,对其进行分割处理,从而形成不同的音频信息段。
下面对能够应用于本发明的音频信息的多种分割方式,进行描述:
方式2-1:分割比例为整数的方式进行分割。
对这种方式进行举例说明:
比如说,一段长度为10分钟的音频信息,我们可以以时间的总量来作为待分隔的音频信息的数据总量,然后,我们设定分割比例为五等分,于是,该10分钟的音频信息,就被分成了五等份,每份包括有长度为2分钟的音频信息内容。
在该类实施例中,所述的整数,应当是大于或等于2的整数形式。具体实施时,如果混合输出的音频信息种类过多的话,也不利于用户对音频信息的有效接收。作为举例而非限定,在常规的应用中,我们可将该整数的上限设定为100,也就是说,可以将音频信息的数据总量,比如时间长度总量,分割为100份,或者分割为100份之内。
方式2-2:分割时,以音频的时间总长度为参考量进行分割。
前面所描述的方式2-1,所进行分割的参考量,就是以时间总长度为基础进行分割的。这是一种便于实施的方式,但并不是唯一的方式。下面会有其它方式的描述。
方式2-3:对于字符内容来说,以独立的字符作为分割的信息单位。
声音信息具有各种各样的信息形式,比如音乐演奏信息、大自然发出的各种声音、机器发出的声音,等等。
但在用户的特定用途中,比如语言的学习中,其声音信息一般和字符内容直接相对应,语音就是基于相应的字符产生的。
于是,对于字符类型的语音信息来说,还可以有专门的基于字符来实现的音频数据的分割方式。
该方式的核心在于:以“字符”而基本单位,来进行字符所对应的音频内容的分割。
在具体实施时,对于音频源包括有对应已存在字符的信息来说,直接采集其对应的字符信息,以及字符信息所对应的音频信息。进而,通过字符与相应声音进行配套的方式,来进行分割。
这种情况下,需要以独立的单个字符为基本的信息单位,来完成信息的分割处理。
原因在于:每个字符的发音长度,都可能会有区别。也就是说,我们任意选择一百个各不相同的字符,它们对应的发音长度也可能会各不相同。于是,可以将每个字符视作为一个独立的字符单元,然后,找出与其对应的音频信息就可以了。
处理的方式,可以基于独立的字符进行独立发音,也可以将每个字符所对应的音频信息,从总的音频数据中进行分割。
具体实现方式是不限定的。比如,可以通过字符发音强度变化的方式进行分割,也可以通过内容智能识别的方式进行分割,等等。
将独立的字符和独立的音频信息进行对应之后,就相当于对每个字符进行了音频信息分段,然后,就可以在此基础上,进行任意字符所对应的音频信息的混合输出了。
比如说,100个字符共对应有100个独立的音频信息段,每个字符即是一个音频信息段。于是,我们可以分成五等份,每个等份共包括有20个字符。
当输出的音频信息,开始输出第一等份的第一个字符时,第二等份、第三等份、第四等份、第五等份中的第一个字符的音频信息,就可以混合着进行输出了,这种情况下,就同步输出了5个字符的音频信息;进一步,当第一等份的第二个字符进行音频信息的输出时,第二等份、第三等份、第四等份、第五等份中的第二个字符的音频信息,也都可以混合着进行输出;以此类推,可以将进行分割后的字符所对应的声音,均混合着进行输出。
当然,具体的排序方式是并不限定的。
方式2-4:进行音频分割的比例,也可以是分数。
这种情况下,可能会造成分割后的音频信息,其播放的时间长度不均衡,这可以通过将长度短的信息加速播放的方式,来解决。
比如:有一段30分钟的音频信息,按照2/3的比例进行分割,于是,前一部分音频信息的时间长度为20分钟,后一部分音频信息的时间长度为10分钟,两者可以同步播放,只是后一部分的信息,循环着进行信息播放就可以了。
也就是说,对于音频长度短的信息内容,可以在一遍播放之后,再进行第二遍的播放,根据需要,还可以包括有第三遍,以及更多的遍数,直到前一部分的播放时间结束。当然,长度短的音频信息,并不需要进行全部播放完,可以播放了什么地方,就在什么地方停止。
方式2-5:对于人类语言内容来说,可以以声音来源的方式,来进行音频数据的分割。
这种情况下,就需要识别声音数据的来源,来进行有效分割。
作为举例而非限定,进行的步骤为:
步骤A1,采集音频信息;
步骤A2,识别所对应的音频源;
步骤A3,将不同的音频源下所对应的音频信息,作为独立的分割后的音频信息。
利用这种方式,来处理语音内容尤其有用。
这种方式,主要是分辨出不同声音源,然后,将各个独立声音源所发出的声音,来作为独立的分段信息。
比如说,共有五个人发出声音信息,那么,就可以将这五个人发出的
步骤3,将分割后的两份及两份以上的音频信息混合着输出。在该步骤中,根据用户的需要,或者用户的设定情况,或者服务提供商设定的情况,来将两份以及两份以上的音频信息混合着进行输出。前面已经描述了与本步骤相对应的实施例。下面,做进一步的描述。方式3-1:在混合多种音频信息的时候,可以对混合的音频信息作时间间隔。
比如说,设置有五等份的音频信息,它们的音频时间长度相同,各有10分钟。于是,就可以在刚开始的时候,输出第一等份的音频信息;过了10秒之后,混合着输出第二等份的音频信息;再过上10秒之后,输出第三等份的音频信息,依此类推,直到输出全部的音频信息。
方式3-2:可以将分段后的音频信息,采用随机的方式进行混合输出。
比如说,以字符为单位进行分割的音频信息,假如共包括100个字符的话,那么,就对应着100段的音频信息。于是,就可以将这100段的音频信息,每次混合着输出5个段,这5段音频信息的选择方式,可以按照预设的方式进行,也可以按照随机的方式进行。作为应用上的举例,这种形式,对于学习语言字符,比如英文单词,是很有用的。
比如,共有100个字符,代表着用户需要学习的100个英文单词。按照常规的方式,一次输出1个英文单词的音频信息的话,那么,用户一次只可以听到一个英文单词。实际上,在用户进行复习单词的时候,完全可以同步听多个单词,于是,就可以以同步或者接近同步的方式,同时输出5个英文单词的发音。
于是,前述的100个英文单词,也仅仅需要20次的音频输出,就可以全部输出一遍了。利用本发明,用户仅仅用了原来时间的百分之二十,就可以完成整体语音内容的复习工作了。这种方式,大幅度地提高了用户的效率。
当然,用户通过该方式,还可以将一整篇需要学习的英语文章,分割成多段,直接混合着进行输出,形成一个具有音频源混合效果的语言环境,有利于用户对语感的培养及学习。
方式3-3:进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
比如,一段音频数据被分成五段,然后,每段采用一位不同的人员进行朗读,或者,同一人员采用不同语调朗读,或者,分别设置不同的背景声音。进而,以这些具有变化形式的音频数据为基础,进行音频数据的混合输出。
再结合附图,进行说明。
参图1所示,这儿展示了一段音频信息100。参图2所示,在该实施例中,前述的一段音频信息100被非均匀分割为5段,有的音频段长一些,有的音频段短一些。参图3所示,这儿展示的是5段音频信息被同时播放的示意图。该图中所示的实施例中,音频信息的长度长的话,会较晚结束播放,音频信息短的话,会较早结束播放。
参图5所述,本发明还提供了一种与前述方法想对应的系统,该系统包括:
音频信息采集模块200,用以采集音频信息;
音频信息分割模块210,用以将音频信息按照比例关系进行分割;
分割信息输出模块220,将分割后的两份及两份以上的音频信息混合着输出。
该系统中的各个技术细节,与前述的方法相一致。
以上是对本发明的描述而非限定,基于本发明思想的其它实施例,亦均在本发明的保护范围之中。

Claims (11)

1.一种音频信息的输出方法,其特征在于该方法包括有如下步骤:
步骤1,采集音频信息;
步骤2,将音频信息按照比例关系进行分割;
步骤3,将分割后的两份及两份以上的音频信息混合着输出。
2.根据权利要求1所述的一种音频信息的输出方法,其特征在于:长度不一样的音频信息同时播放时,长度短的音频信息可循环着进行信息播放。
3.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,是以分割比例为整数的方式进行分割,该整数是大于或等于2的整数形式。
4.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,是以音频的时间总长度为参考量进行分割。
5.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,对于字符内容来说,以独立的字符作为分割的信息单位。
6.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式中,进行音频分割的比例是分数。
7.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式中,对于人类语言内容来说,以声音来源的方式,来进行音频数据的分割。
8.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,对混合的音频信息之间作时间间隔。
9.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,将分段后的音频信息,采用随机的方式进行混合输出。
10.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
11.一种音频信息的输出系统,其特征在于该系统包括:
音频信息采集模块,用以采集音频信息;
音频信息分割模块,用以将音频信息按照比例关系进行分割;
分割信息输出模块,将分割后的两份及两份以上的音频信息混合着输出。
CN201010618444.3A 2010-12-30 2010-12-30 一种音频信息的输出方法及系统 Active CN102568524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010618444.3A CN102568524B (zh) 2010-12-30 2010-12-30 一种音频信息的输出方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010618444.3A CN102568524B (zh) 2010-12-30 2010-12-30 一种音频信息的输出方法及系统

Publications (2)

Publication Number Publication Date
CN102568524A true CN102568524A (zh) 2012-07-11
CN102568524B CN102568524B (zh) 2015-11-11

Family

ID=46413758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010618444.3A Active CN102568524B (zh) 2010-12-30 2010-12-30 一种音频信息的输出方法及系统

Country Status (1)

Country Link
CN (1) CN102568524B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0592250A2 (en) * 1992-10-09 1994-04-13 Matsushita Electric Industrial Co., Ltd. System and method for video editing
CN2312472Y (zh) * 1997-11-04 1999-03-31 蔡坤明 笔记型计算机的扬声器装置
CN1305661A (zh) * 1998-04-14 2001-07-25 听觉增强有限公司 用户可调节的适应听力的音量控制
WO2010141504A1 (en) * 2009-06-01 2010-12-09 Music Mastermind, LLC System and method of receiving, analyzing, and editing audio to create musical compositions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0592250A2 (en) * 1992-10-09 1994-04-13 Matsushita Electric Industrial Co., Ltd. System and method for video editing
CN2312472Y (zh) * 1997-11-04 1999-03-31 蔡坤明 笔记型计算机的扬声器装置
CN1305661A (zh) * 1998-04-14 2001-07-25 听觉增强有限公司 用户可调节的适应听力的音量控制
WO2010141504A1 (en) * 2009-06-01 2010-12-09 Music Mastermind, LLC System and method of receiving, analyzing, and editing audio to create musical compositions

Also Published As

Publication number Publication date
CN102568524B (zh) 2015-11-11

Similar Documents

Publication Publication Date Title
CN106486128B (zh) 一种双音源音频数据的处理方法及装置
Ramnarine Acoustemology, Indigeneity, and Joik in Valkeapää's Symphonic Activism: Views from Europe's Arctic Fringes for Environmental Ethnomusicology
CN108133632B (zh) 英语听力的训练方法及系统
CN102915725A (zh) 人机互动的歌曲演唱系统、方法
CN101079301A (zh) 文本映射到音频并动画文本的设备及方法
CN106332394A (zh) 一种灯光随特定音乐互动的方法及系统
CN109274913A (zh) 一种视频智能切片剪辑方法及系统
CN111145719B (zh) 将中英混合及语气标签化的数据标注方法及装置
CN105280206A (zh) 一种音频的播放方法、装置
CN109492126B (zh) 一种智能交互方法及装置
CN110942765A (zh) 一种构建语料库的方法、设备、服务器和存储介质
CN102483944A (zh) 用于处理音频数据的方法和设备
Battier Describe, Transcribe, Notate: Prospects and problems facing electroacoustic music
CN102568524A (zh) 一种音频信息的输出方法及系统
Fröjd et al. Sound texture synthesis using an overlap–add/granular synthesis approach
RU2005115347A (ru) xPart-КОМПОНЕНТЫ - ОБЕРТКА СХЕМАТИЗИРОВАННЫХ ДАННЫХ
Thomas Library-podcast intersections
Mögele et al. SmartWeb UMTS Speech Data Collection: The SmartWeb Handheld Corpus.
Hughes Mediocrity to artistry: Technology and the singing voice
Chuchu et al. Application of Multimedia Technology in Music Teaching in Junior High School
CN108648118A (zh) 一种教学资源的共享系统
David et al. Efficient and cost-effective production of accessible video content for blind and low vision audiences
JP3949546B2 (ja) 語学教材データ生成方法
US20160093327A1 (en) Method for recording a plurality of audio files
Dang Exploring the value of binaural audio format for contemporary pop music

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wang Jianhong

Inventor before: The inventor has waived the right to be mentioned

COR Change of bibliographic data
CB03 Change of inventor or designer information

Inventor after: Ma Yuchen

Inventor before: Wang Jianhong

COR Change of bibliographic data