CN102568524A - 一种音频信息的输出方法及系统 - Google Patents
一种音频信息的输出方法及系统 Download PDFInfo
- Publication number
- CN102568524A CN102568524A CN2010106184443A CN201010618444A CN102568524A CN 102568524 A CN102568524 A CN 102568524A CN 2010106184443 A CN2010106184443 A CN 2010106184443A CN 201010618444 A CN201010618444 A CN 201010618444A CN 102568524 A CN102568524 A CN 102568524A
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency information
- information
- frequency
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明的目的是提供一种音频信息的输出方法及系统,属于计算机、软件技术领域。所述的方法包括有如下步骤:步骤1,采集音频信息;步骤2,将音频信息按照比例关系进行分割;步骤3,将分割后的两份及两份以上的音频信息混合着输出。在本发明中,提供一种新型的音频信息的处理方式,可应用于各种具有音频成分的数据内容。在使用中,除了应用于语音学习之外,也应用于包含有声音信息的其它各种场景。利用本发明,能够获得具有混合效果的、效率更高的音频信息的输出方式。
Description
技术领域
本发明属于计算机、软件技术领域。
技术背景
在目前的文化交流和经济交流中,人们经常会学习多种语言,学习语言的方式,有各种各样的途径。其中,对语音信息的理解与分析能力,在人们的交流中地位重要。如何向人们提供良好的语音学习方式,一直是人们所探讨的重要问题。
在本发明中,我们提供一种新型的音频信息的处理方式。除了应用于语音学习之外,也应用于声音的其它场景。
发明内容
本发明的目的,是提供一种音频信息的输出方法,以及配套的系统,利用本发明,能够获得具有混合效果的、效率更高的音频信息的输出方式。
一种音频信息的输出方法,该方法包括有如下步骤:
步骤1,采集音频信息;
步骤2,将音频信息按照比例关系进行分割;
步骤3,将分割后的两份及两份以上的音频信息混合着输出。
进一步,长度不一样的音频信息同时播放时,长度短的音频信息可循环着进行信息播放。
进一步,所述的音频信息的分割方式,是以分割比例为整数的方式进行分割,该整数是大于或等于2的整数形式。
进一步,所述的音频信息的分割方式,是以音频的时间总长度为参考量进行分割。
进一步,所述的音频信息的分割方式,对于字符内容来说,以独立的字符作为分割的信息单位。
进一步,所述的音频信息的分割方式中,进行音频分割的比例是分数。
进一步,所述的音频信息的分割方式中,对于人类语言内容来说,以声音来源的方式,来进行音频数据的分割。
进一步,在混合多种音频信息进行输出的时候,对混合的音频信息之间作时间间隔。
进一步,在混合多种音频信息进行输出的时候,将分段后的音频信息,采用随机的方式进行混合输出。
进一步,在混合多种音频信息进行输出的时候,进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
本发明还提供一种音频信息的输出系统,该系统包括:
音频信息采集模块,用以采集音频信息;
音频信息分割模块,用以将音频信息按照比例关系进行分割;
分割信息输出模块,将分割后的两份及两份以上的音频信息混合着输出。
附图说明
图1是本发明中,一段音频信息的示意图。
图2是本发明中,一段音频信息被非均匀分割为5段的示意图。
图3是本发明中,5段音频信息被同时播放的示意图,与图1、图2所示的实施例相对应。
图4是本发明所述方法的流程图。
图5是本发明所述系统的结构框图。
具体实施例
为了对本发明更好地进行说明,作为举例而非限定,将本发明的思想描述如下:
在生活中,声音信息经常是混合着输出的,比如,我们可以同时听到多人的谈话。因此,可以通过将音频信息进行分段处理,然后混合着进行输出,来同时输出多段的声音信息,从而提高用户获得音频内容的效率,或用以营造相应的声音环境。
下面结合着附图,对本发明进行详细描述。
本发明所描述的方法,包括有如下步骤:
步骤1,采集音频信息。
在该步骤中,主要是采集音频信息内容,作为进行本发明所描述的音频处理方式的基础数据。
需要指出的是,音频信息的载体形式,是多种多样的。可以仅仅是音频信息,也可以是多媒体信息,或者是和特定程序相关联或者和特定文档相关联的语音信息内容,等等。另外,音频信息的格式,也是不做任何限定的。这些包括有音频信息形式的数据内容,都可以应用于本发明。
采集音频信息的方式,除了直接载入音频信息的内容之外,另外,在本发明中,还可以直接通过包括麦克风在内的音频信息采集工具,通过录制声音信息的方式来采集。
所获得的音频信息内容,供接下来的数据处理之用。
步骤2,将音频信息按照比例关系进行分割。
在该步骤中,我们需要对上一步骤所采集获得的音频信息,按照预设的比例方式,对其进行分割处理,从而形成不同的音频信息段。
下面对能够应用于本发明的音频信息的多种分割方式,进行描述:
方式2-1:分割比例为整数的方式进行分割。
对这种方式进行举例说明:
比如说,一段长度为10分钟的音频信息,我们可以以时间的总量来作为待分隔的音频信息的数据总量,然后,我们设定分割比例为五等分,于是,该10分钟的音频信息,就被分成了五等份,每份包括有长度为2分钟的音频信息内容。
在该类实施例中,所述的整数,应当是大于或等于2的整数形式。具体实施时,如果混合输出的音频信息种类过多的话,也不利于用户对音频信息的有效接收。作为举例而非限定,在常规的应用中,我们可将该整数的上限设定为100,也就是说,可以将音频信息的数据总量,比如时间长度总量,分割为100份,或者分割为100份之内。
方式2-2:分割时,以音频的时间总长度为参考量进行分割。
前面所描述的方式2-1,所进行分割的参考量,就是以时间总长度为基础进行分割的。这是一种便于实施的方式,但并不是唯一的方式。下面会有其它方式的描述。
方式2-3:对于字符内容来说,以独立的字符作为分割的信息单位。
声音信息具有各种各样的信息形式,比如音乐演奏信息、大自然发出的各种声音、机器发出的声音,等等。
但在用户的特定用途中,比如语言的学习中,其声音信息一般和字符内容直接相对应,语音就是基于相应的字符产生的。
于是,对于字符类型的语音信息来说,还可以有专门的基于字符来实现的音频数据的分割方式。
该方式的核心在于:以“字符”而基本单位,来进行字符所对应的音频内容的分割。
在具体实施时,对于音频源包括有对应已存在字符的信息来说,直接采集其对应的字符信息,以及字符信息所对应的音频信息。进而,通过字符与相应声音进行配套的方式,来进行分割。
这种情况下,需要以独立的单个字符为基本的信息单位,来完成信息的分割处理。
原因在于:每个字符的发音长度,都可能会有区别。也就是说,我们任意选择一百个各不相同的字符,它们对应的发音长度也可能会各不相同。于是,可以将每个字符视作为一个独立的字符单元,然后,找出与其对应的音频信息就可以了。
处理的方式,可以基于独立的字符进行独立发音,也可以将每个字符所对应的音频信息,从总的音频数据中进行分割。
具体实现方式是不限定的。比如,可以通过字符发音强度变化的方式进行分割,也可以通过内容智能识别的方式进行分割,等等。
将独立的字符和独立的音频信息进行对应之后,就相当于对每个字符进行了音频信息分段,然后,就可以在此基础上,进行任意字符所对应的音频信息的混合输出了。
比如说,100个字符共对应有100个独立的音频信息段,每个字符即是一个音频信息段。于是,我们可以分成五等份,每个等份共包括有20个字符。
当输出的音频信息,开始输出第一等份的第一个字符时,第二等份、第三等份、第四等份、第五等份中的第一个字符的音频信息,就可以混合着进行输出了,这种情况下,就同步输出了5个字符的音频信息;进一步,当第一等份的第二个字符进行音频信息的输出时,第二等份、第三等份、第四等份、第五等份中的第二个字符的音频信息,也都可以混合着进行输出;以此类推,可以将进行分割后的字符所对应的声音,均混合着进行输出。
当然,具体的排序方式是并不限定的。
方式2-4:进行音频分割的比例,也可以是分数。
这种情况下,可能会造成分割后的音频信息,其播放的时间长度不均衡,这可以通过将长度短的信息加速播放的方式,来解决。
比如:有一段30分钟的音频信息,按照2/3的比例进行分割,于是,前一部分音频信息的时间长度为20分钟,后一部分音频信息的时间长度为10分钟,两者可以同步播放,只是后一部分的信息,循环着进行信息播放就可以了。
也就是说,对于音频长度短的信息内容,可以在一遍播放之后,再进行第二遍的播放,根据需要,还可以包括有第三遍,以及更多的遍数,直到前一部分的播放时间结束。当然,长度短的音频信息,并不需要进行全部播放完,可以播放了什么地方,就在什么地方停止。
方式2-5:对于人类语言内容来说,可以以声音来源的方式,来进行音频数据的分割。
这种情况下,就需要识别声音数据的来源,来进行有效分割。
作为举例而非限定,进行的步骤为:
步骤A1,采集音频信息;
步骤A2,识别所对应的音频源;
步骤A3,将不同的音频源下所对应的音频信息,作为独立的分割后的音频信息。
利用这种方式,来处理语音内容尤其有用。
这种方式,主要是分辨出不同声音源,然后,将各个独立声音源所发出的声音,来作为独立的分段信息。
比如说,共有五个人发出声音信息,那么,就可以将这五个人发出的
步骤3,将分割后的两份及两份以上的音频信息混合着输出。在该步骤中,根据用户的需要,或者用户的设定情况,或者服务提供商设定的情况,来将两份以及两份以上的音频信息混合着进行输出。前面已经描述了与本步骤相对应的实施例。下面,做进一步的描述。方式3-1:在混合多种音频信息的时候,可以对混合的音频信息作时间间隔。
比如说,设置有五等份的音频信息,它们的音频时间长度相同,各有10分钟。于是,就可以在刚开始的时候,输出第一等份的音频信息;过了10秒之后,混合着输出第二等份的音频信息;再过上10秒之后,输出第三等份的音频信息,依此类推,直到输出全部的音频信息。
方式3-2:可以将分段后的音频信息,采用随机的方式进行混合输出。
比如说,以字符为单位进行分割的音频信息,假如共包括100个字符的话,那么,就对应着100段的音频信息。于是,就可以将这100段的音频信息,每次混合着输出5个段,这5段音频信息的选择方式,可以按照预设的方式进行,也可以按照随机的方式进行。作为应用上的举例,这种形式,对于学习语言字符,比如英文单词,是很有用的。
比如,共有100个字符,代表着用户需要学习的100个英文单词。按照常规的方式,一次输出1个英文单词的音频信息的话,那么,用户一次只可以听到一个英文单词。实际上,在用户进行复习单词的时候,完全可以同步听多个单词,于是,就可以以同步或者接近同步的方式,同时输出5个英文单词的发音。
于是,前述的100个英文单词,也仅仅需要20次的音频输出,就可以全部输出一遍了。利用本发明,用户仅仅用了原来时间的百分之二十,就可以完成整体语音内容的复习工作了。这种方式,大幅度地提高了用户的效率。
当然,用户通过该方式,还可以将一整篇需要学习的英语文章,分割成多段,直接混合着进行输出,形成一个具有音频源混合效果的语言环境,有利于用户对语感的培养及学习。
方式3-3:进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
比如,一段音频数据被分成五段,然后,每段采用一位不同的人员进行朗读,或者,同一人员采用不同语调朗读,或者,分别设置不同的背景声音。进而,以这些具有变化形式的音频数据为基础,进行音频数据的混合输出。
再结合附图,进行说明。
参图1所示,这儿展示了一段音频信息100。参图2所示,在该实施例中,前述的一段音频信息100被非均匀分割为5段,有的音频段长一些,有的音频段短一些。参图3所示,这儿展示的是5段音频信息被同时播放的示意图。该图中所示的实施例中,音频信息的长度长的话,会较晚结束播放,音频信息短的话,会较早结束播放。
参图5所述,本发明还提供了一种与前述方法想对应的系统,该系统包括:
音频信息采集模块200,用以采集音频信息;
音频信息分割模块210,用以将音频信息按照比例关系进行分割;
分割信息输出模块220,将分割后的两份及两份以上的音频信息混合着输出。
该系统中的各个技术细节,与前述的方法相一致。
以上是对本发明的描述而非限定,基于本发明思想的其它实施例,亦均在本发明的保护范围之中。
Claims (11)
1.一种音频信息的输出方法,其特征在于该方法包括有如下步骤:
步骤1,采集音频信息;
步骤2,将音频信息按照比例关系进行分割;
步骤3,将分割后的两份及两份以上的音频信息混合着输出。
2.根据权利要求1所述的一种音频信息的输出方法,其特征在于:长度不一样的音频信息同时播放时,长度短的音频信息可循环着进行信息播放。
3.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,是以分割比例为整数的方式进行分割,该整数是大于或等于2的整数形式。
4.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,是以音频的时间总长度为参考量进行分割。
5.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式,对于字符内容来说,以独立的字符作为分割的信息单位。
6.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式中,进行音频分割的比例是分数。
7.根据权利要求1所述的一种音频信息的输出方法,其特征在于:所述的音频信息的分割方式中,对于人类语言内容来说,以声音来源的方式,来进行音频数据的分割。
8.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,对混合的音频信息之间作时间间隔。
9.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,将分段后的音频信息,采用随机的方式进行混合输出。
10.根据权利要求1所述的一种音频信息的输出方法,其特征在于:在混合多种音频信息进行输出的时候,进行分段之后,采用多音频效果的方式进行音频源转变,再进行音频数据的混合输出。
11.一种音频信息的输出系统,其特征在于该系统包括:
音频信息采集模块,用以采集音频信息;
音频信息分割模块,用以将音频信息按照比例关系进行分割;
分割信息输出模块,将分割后的两份及两份以上的音频信息混合着输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010618444.3A CN102568524B (zh) | 2010-12-30 | 2010-12-30 | 一种音频信息的输出方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010618444.3A CN102568524B (zh) | 2010-12-30 | 2010-12-30 | 一种音频信息的输出方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102568524A true CN102568524A (zh) | 2012-07-11 |
CN102568524B CN102568524B (zh) | 2015-11-11 |
Family
ID=46413758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010618444.3A Active CN102568524B (zh) | 2010-12-30 | 2010-12-30 | 一种音频信息的输出方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102568524B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0592250A2 (en) * | 1992-10-09 | 1994-04-13 | Matsushita Electric Industrial Co., Ltd. | System and method for video editing |
CN2312472Y (zh) * | 1997-11-04 | 1999-03-31 | 蔡坤明 | 笔记型计算机的扬声器装置 |
CN1305661A (zh) * | 1998-04-14 | 2001-07-25 | 听觉增强有限公司 | 用户可调节的适应听力的音量控制 |
WO2010141504A1 (en) * | 2009-06-01 | 2010-12-09 | Music Mastermind, LLC | System and method of receiving, analyzing, and editing audio to create musical compositions |
-
2010
- 2010-12-30 CN CN201010618444.3A patent/CN102568524B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0592250A2 (en) * | 1992-10-09 | 1994-04-13 | Matsushita Electric Industrial Co., Ltd. | System and method for video editing |
CN2312472Y (zh) * | 1997-11-04 | 1999-03-31 | 蔡坤明 | 笔记型计算机的扬声器装置 |
CN1305661A (zh) * | 1998-04-14 | 2001-07-25 | 听觉增强有限公司 | 用户可调节的适应听力的音量控制 |
WO2010141504A1 (en) * | 2009-06-01 | 2010-12-09 | Music Mastermind, LLC | System and method of receiving, analyzing, and editing audio to create musical compositions |
Also Published As
Publication number | Publication date |
---|---|
CN102568524B (zh) | 2015-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106486128B (zh) | 一种双音源音频数据的处理方法及装置 | |
Ramnarine | Acoustemology, Indigeneity, and Joik in Valkeapää's Symphonic Activism: Views from Europe's Arctic Fringes for Environmental Ethnomusicology | |
CN108133632B (zh) | 英语听力的训练方法及系统 | |
CN102915725A (zh) | 人机互动的歌曲演唱系统、方法 | |
CN101079301A (zh) | 文本映射到音频并动画文本的设备及方法 | |
CN106332394A (zh) | 一种灯光随特定音乐互动的方法及系统 | |
CN109274913A (zh) | 一种视频智能切片剪辑方法及系统 | |
CN111145719B (zh) | 将中英混合及语气标签化的数据标注方法及装置 | |
CN105280206A (zh) | 一种音频的播放方法、装置 | |
CN109492126B (zh) | 一种智能交互方法及装置 | |
CN110942765A (zh) | 一种构建语料库的方法、设备、服务器和存储介质 | |
CN102483944A (zh) | 用于处理音频数据的方法和设备 | |
Battier | Describe, Transcribe, Notate: Prospects and problems facing electroacoustic music | |
CN102568524A (zh) | 一种音频信息的输出方法及系统 | |
Fröjd et al. | Sound texture synthesis using an overlap–add/granular synthesis approach | |
RU2005115347A (ru) | xPart-КОМПОНЕНТЫ - ОБЕРТКА СХЕМАТИЗИРОВАННЫХ ДАННЫХ | |
Thomas | Library-podcast intersections | |
Mögele et al. | SmartWeb UMTS Speech Data Collection: The SmartWeb Handheld Corpus. | |
Hughes | Mediocrity to artistry: Technology and the singing voice | |
Chuchu et al. | Application of Multimedia Technology in Music Teaching in Junior High School | |
CN108648118A (zh) | 一种教学资源的共享系统 | |
David et al. | Efficient and cost-effective production of accessible video content for blind and low vision audiences | |
JP3949546B2 (ja) | 語学教材データ生成方法 | |
US20160093327A1 (en) | Method for recording a plurality of audio files | |
Dang | Exploring the value of binaural audio format for contemporary pop music |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Wang Jianhong Inventor before: The inventor has waived the right to be mentioned |
|
COR | Change of bibliographic data | ||
CB03 | Change of inventor or designer information |
Inventor after: Ma Yuchen Inventor before: Wang Jianhong |
|
COR | Change of bibliographic data |