CN103456313A - 电子设备中用于音频流的高速可视化的装置和方法 - Google Patents
电子设备中用于音频流的高速可视化的装置和方法 Download PDFInfo
- Publication number
- CN103456313A CN103456313A CN2013101502299A CN201310150229A CN103456313A CN 103456313 A CN103456313 A CN 103456313A CN 2013101502299 A CN2013101502299 A CN 2013101502299A CN 201310150229 A CN201310150229 A CN 201310150229A CN 103456313 A CN103456313 A CN 103456313A
- Authority
- CN
- China
- Prior art keywords
- audio file
- electronic equipment
- value
- audio
- global gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000012800 visualization Methods 0.000 title abstract 2
- 238000001914 filtration Methods 0.000 claims abstract description 73
- 239000000284 extract Substances 0.000 claims description 55
- 230000007704 transition Effects 0.000 claims description 49
- 238000010606 normalization Methods 0.000 claims description 39
- 238000003860 storage Methods 0.000 claims description 34
- 238000000605 extraction Methods 0.000 claims description 24
- 238000012790 confirmation Methods 0.000 claims description 13
- 239000003086 colorant Substances 0.000 claims description 5
- 230000009191 jumping Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 43
- 230000006870 function Effects 0.000 description 11
- 230000000007 visual effect Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical group N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 4
- 238000009499 grossing Methods 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005039 memory span Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
- G10L21/14—Transforming into visible information by displaying frequency domain information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/0485—Scrolling or panning
- G06F3/04855—Interaction with scrollbars
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/061—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of musical phrases, isolation of musically relevant segments, e.g. musical thumbnail generation, or for temporal structure analysis of a musical piece, e.g. determination of the movement sequence of a musical work
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/005—Non-interactive screen display of musical or status data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2220/00—Input/output interfacing specifically adapted for electrophonic musical tools or instruments
- G10H2220/091—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith
- G10H2220/101—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters
- G10H2220/106—Graphical user interface [GUI] specifically adapted for electrophonic musical instruments, e.g. interactive musical displays, musical instrument icons or menus; Details of user interactions therewith for graphical creation, edition or control of musical data or parameters using icons, e.g. selecting, moving or linking icons, on-screen symbols, screen regions or segments representing musical elements or parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2230/00—General physical, ergonomic or hardware implementation of electrophonic musical tools or instruments, e.g. shape or architecture
- G10H2230/005—Device type or category
- G10H2230/015—PDA [personal digital assistant] or palmtop computing devices used for musical purposes, e.g. portable music players, tablet computers, e-readers or smart phones in which mobile telephony functions need not be used
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
提供了一种用于音频流的高速可视化的电子设备和方法。操作电子设备的方法包括:从音频文件中包括的至少一帧中仅提取首部信息;使用提取的帧首部信息来提取全局增益值,所述全局增益值是相应帧的平均容量;对提取的全局增益值进行滤波;以及显示经滤波的值。
Description
技术领域
本发明涉及一种处理音频流的方法及电子设备。更具体地,本发明涉及一种用于音频流的高速可视化的方法,能够无时间延迟地立即显示该音频流,同时满足用户的视觉需求。
背景技术
具有媒体播放器或记录器功能的电子设备可以通过对音频流进行可视化来显示音频流。例如,当在具有媒体播放器功能的电子设备中再现具体音频文件时,通过使用图表的高低起伏,可视地显示当前正在再现的音频文件的声音。因此,用户不仅能够以听觉方式,还能够以视觉方式来欣赏当前正在再现的音频文件。因此,具有音频流的电子设备满足了用户的多种需求。
然而,现有技术的问题在于,由于具有音频流功能的电子设备需要完全解码要再现的整个音频文件以便在电子设备中显示音频流,因此出现时间延迟。
因此,需要一种音频流的高速可视化的方法,能够无时间延迟地立即显示该音频流,同时满足用户的视觉需求。
以上信息作为背景信息提供,仅帮助本公开的理解。对于上述任何内容是否可作为关于本发明的现有技术没有任何判定也没有任何断言。
发明内容
本发明的方面解决了至少上述问题和/或缺点并至少提供了下述优点。因此,本发明的一个方面提供了一种装置和方法,通过仅分析帧首部而不是对要再现的音频文件的全部原始数据进行完全解码,来无时间延迟地进行音频流的高速可视化。
本发明的另一方面提供了一种装置和方法,用于在由于不对音频文件的全部数据进行完全解码而不针对每一种格式提供解码器的情况下,进行音频流的可视化。
本发明的另一方面提供了一种装置和方法,用于通过仅提取音频流的特定部分,进行音频流的可视化以便于识别音乐部分以及再现音频流。
本发明的另一方面提供了一种装置和方法,用于通过以波形图样或特定颜色图样显示音频流来满足用户的多种需求。
根据本发明的一个方面,提供了一种操作电子设备的方法。所述方法包括:从音频文件中包括的至少一帧中仅提取首部信息;使用提取的帧首部信息来提取作为相应帧的平均容量(volume)的全局增益值;对提取的全局增益值进行滤波;并且显示经滤波的值。
在本发明的上述方面中,所述方法还包括接收用于再现音频文件的命令。
此外,使用提取的帧首部信息来提取作为相应帧的平均容量的全局增益值可以包括:从提取的帧首部信息中提取辅助信息,并且使用包括在提取的辅助信息中的信息来提取全局增益值。
此外,对提取的全局增益值进行滤波可以包括:连接提取的相应全局增益值;对相连的全局增益值进行归一化;并且对归一化的值进行平滑。
此外,对归一化的值进行平滑可以使用移动平均方法。
此外,显示经滤波的值可以包括:以音频流波形图样显示音频文件的整个区域。
此外,以音频流波形图样显示音频文件的整个区域可以包括:显示音频文件的整个区域,以便能够将整个区域划分为独唱(verse)、引子(intro)、过渡(bridge)和高潮(highlight)(例如合唱)部分。
此外,显示整个区域以便将整个区域划分为四部分可以包括:确认经滤波的值的每个峰值;并且将确认的峰值与预设的三个区域中的任意一个进行匹配。
此外,所述方法还包括:接收用于仅再现区域的四个划分部分之一的输入;并且仅再现输入的区域部分。
此外,所述方法还包括:接收从存储的多个音频文件中选择的至少一个音频文件;接收用于仅再现所述至少一个选定音频文件区域中的至少一个区域的输入;通过分析音频流的波形仅自动跳到所述至少一个输入区域;并且顺序地仅再现自动跳到的部分。
此外,显示经滤波的值可以包括:以色阶(color gradation)形式显示音频文件的整个区域。
此外,以色阶来显示音频文件的整个区域可以包括:以第一到第三颜色显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮部分。
此外,以第一到第三颜色显示音频文件的整个区域可以包括:确认经滤波的值的每个峰值;并且将确认的峰值与预设的三个颜色中的任意一个进行匹配。
此外,所述方法还包括:接收用于仅再现区域的四个划分部分之一的输入;并且仅再现输入的区域部分。
此外,所述方法还包括:接收从存储的多个音频文件中选择的至少一个音频文件;并且接收用于仅再现所述至少一个选定音频文件区域中至少一个区域的输入;通过分析色阶仅自动跳到所述至少一个输入区域;并且顺序地仅再现自动跳到的部分。
根据本发明的另一方面,提供了一种电子设备。所述电子设备可以包括:包括软件模块的存储器,用于从音频文件中包括的至少一帧中仅提取首部信息,通过使用提取的帧首部信息来提取全局增益值,所述全局增益值是相应帧的平均容量;处理器单元,用于对提取的全局增益值进行滤波并执行软件模块;以及触摸屏,用于显示经滤波的值。
在本发明的上述方面中,触摸屏可以接收用于再现音频文件的命令。
此外,存储器可以包括:辅助信息提取模块,用于从提取的帧首部信息中提取辅助信息;以及滤波模块,用于使用包括在提取的辅助信息中的信息来提取全局增益值。
此外,处理器单元可以连接提取的相应全局增益值,对相连的全局增益值进行归一化;并且对归一化的值进行平滑。
此外,处理器单元可以通过使用移动平均方法对归一化的值进行平滑。
此外,触摸屏可以以音频流波形图样显示音频文件的整个区域。
此外,触摸屏可以显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮(例如合唱)部分。
此外,所述电子设备还可以包括:用于确认经滤波的值的每个峰值并且将确认的峰值与预设的三个区域中的任意一个进行匹配的处理器单元。
此外,触摸屏可以接收用于仅再现区域的四个划分部分之一的输入,所述电子设备还可以包括用于仅再现输入的区域部分的处理器单元。
触摸屏可以接收从存储的多个音频文件中选择的至少一个音频文件,接收用于仅再现所述至少一个选定音频文件区域中的至少一个区域的输入,通过分析音频流的波形仅自动跳到所述至少一个输入区域,并且顺序地仅再现自动跳到的部分。
此外,触摸屏可以以色阶形式显示音频文件的整个区域。
此外,触摸屏可以以第一到第三颜色显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮部分。
此外,所述电子设备还可以包括:用于确认经滤波的值的每个峰值并且将确认的峰值与预设的三个颜色中的任意一个进行匹配的处理器单元。
此外,触摸屏可以接收用于仅再现区域的四个划分部分之一的输入,所述电子设备还可以包括用于仅再现输入的区域部分的处理器单元。
此外,触摸屏可以接收从存储的多个音频文件中选择的至少一个音频文件,接收用于仅再现所述至少一个选定音频文件区域中的至少一个区域的输入,通过分析色阶仅自动跳到所述至少一个输入区域,并且顺序地仅再现自动跳到的部分。
根据结合附图的以下详细描述,本发明的其他方面、优点和显著特征对于本领域技术人员更加显而易见,以下详细描述公开了本发明的示例性实施例。
附图说明
通过结合附图的以下描述,本发明一些示例性实施例的上述和其它方面、特征及优点将变得更加显而易见,其中:
图1示出了根据本发明示例性实施例的音频流显示;
图2A和2B示出了根据本发明示例性实施例提取包括在具体音频文件中的每一个帧首部信息;
图3A和3B示出了根据本发明示例性实施例对全局增益值进行归一化;
图4示出了根据本发明示例性实施例对归一化值进行平滑;
图5A和5B示出了根据本发明示例性实施例以波形图样来显示音频流;
图6A和6B示出了根据本发明示例性实施例使用色阶显示音频流;
图7A和7B示出了根据本发明示例性实施例接收用于仅再现特定区域的输入;
图8A和8B示出了根据本发明示例性实施例接收用于仅再现特定区域的输入;
图9A到9C示出了根据本发明示例性实施例仅再现电子设备中至少一个文件的特定部分;
图10A到10C示出了根据本发明示例性实施例仅再现电子设备中至少一个文件的特定部分;
图11是示出了根据本发明示例性实施例以波形图样来显示音频流的流程图;
图12是示出了根据本发明示例性实施例以色阶来显示音频流的流程图;
图13是示出了根据本发明示例性实施例在电子设备中通过分析音频流的波形仅顺序地再现至少任意一个区域的流程图;
图14是示出了根据本发明示例性实施例通过分析色阶仅顺序地再现至少任意一个区域的流程图;以及
图15是示出了根据本发明示例性实施例的电子设备的结构的方框图。
在所有附图中,应当注意相似的附图标记用于示出相同或相似的元件、特征和结构。
具体实施方式
参考附图提供以下描述来帮助全面理解权利要求及其等同物限定的本发明示例性实施例。以下描述包括多个具体细节以帮助理解,但是应将这些细节仅看作是示例性的。因此,本领域普通技术人员将认识到,可以在不背离本发明精神和范围的情况下对本文所描述的实施例进行多种改变和修改。此外,为了清楚和简明的目的,省略对公知功能和结构的描述。
以下描述和权利要求中使用的术语和词语并不限于字面意思,而是仅被发明人用来使本发明清楚并便于理解。因此,对于本领域技术人员显而易见的是,仅以说明的目的提供了本发明示例性实施例的以下描述,并且并不将其解释为对所附权利要求及其等同物限定的本发明的限制。
应该理解,除非上下文清楚地指示,否则单数形式的“一”、“一个”和“该”包括复数形式。因此,例如,提及“部件表面”包括提及一个或多个这种表面。
术语“实质上”的含义是不需要确切地达到所述特性、参数或值,而是在不妨碍特性要提供的效果的范围内可以出现偏离或变化,例如包括本领域技术人员熟知的容限、测量误差、测量精度限制和其他因素。
本发明的示例性实施例提供了一种装置和方法,通过仅分析帧首部而不是对要再现的音频文件的全部原始数据进行完全解码,来无时间延迟地进行音频流的高速可视化。
图1示出了根据本发明示例性实施例的音频流显示。认为本发明的电子设备具有媒体播放器功能。例如,认为电子设备能够再现音频文件。下文中,描述本发明的音频流。
在本发明的示例性实施例中,当在电子设备中再现具体音频文件时,不仅再现音频文件,还在触摸屏上显示当前正再现的音频文件的音频流。本文中,可以将音频流定义为以下功能:以预设的波形图样或色阶图样来显示当前正再现的音频文件,以便用户能够容易地识别音频文件的区段或类似。更具体地,通过仅分析具体音频文件中包括的至少一帧的每个帧首部,来基于预设的波形图样或色阶图样高速地可视化音频流。由于为了在电子设备上显示音频流,要对当前再现的整个音频文件进行完全解码,因此现有技术中具有音频流功能的电子设备存在时间延迟。结果,在完全解码要再现的整个音频文件之前,电子设备不能显示音频流,因此不能满足用户要求快速反馈的期望。另一方面,电子设备的优点在于,通过仅分析具体音频文件中包括的每一个帧首部而无需对要再现的整个音频文件进行完全解码,能够快速显示音频流。下文将描述图1的音频流。
参考图1,电子设备中当前正在再现歌曲A,媒体播放器的进度条101示出了正在再现的音频文件的再现位置。此外,以波形图样来显示音频流102。更具体地,如果假定没有以波形图样来显示音频流102,仅看到媒体播放器的进度条,用户难以识别当前正再现的音频文件的位置或音频文件的特定部分的位置。例如,如果假定用户再现具体音频文件,随后希望仅收听音频文件的高潮部分,则用户通过大致推测高潮部分来移动进度条101。例如,为了移到音频文件的高潮部分,用户不可避免地需要经历多次尝试和出错。然而,如图1的示例所示,电子设备不仅通过在进度条101上以波形图样显示音频流102来向用户提供快速音频流,还方便了容易地识别当前正再现的音频文件。在上述示例中,通过使用以波形图样显示的音频流102,用户能够容易地识别具有最高波峰的部分是高潮部分。因此,用户能够将进度条移到音频文件的高潮部分,而无需经历多次尝试和出错。
图2A和2B示出了根据本发明示例性实施例提取包括在具体音频文件中的每个帧首部信息。
参考图2A和2B,音频文件包括文件首部201和至少一帧202。此外,每一帧包括帧首部数据203和数据204。
图2A示出了根据本发明示例性实施例的音频文件的配置。更具体地,音频文件具有位于音频文件的前部的文件首部201,文件首部201包括音频文件所包括的帧的数目、标记信息等。例如,音频文件的文件首部201包括与音频文件中当前包括的帧的总数和音频文件的标记信息(例如,艺术家、标题、唱片信息等)相关的信息。
图2B示出了根据示例性实施例在音频文件中包括的任意一个相应帧的配置。更具体地,帧首部203位于具体帧的前部,帧首部203包括帧中包括的数据204的数据量、解码信息等。例如,具体帧的首部203包括数据量、编码压缩选项、比特率信息、辅助信息等。
下文中,将描述提取具体音频文件中包括的每一帧的首部信息的过程。首先,电子设备从用户接收用于再现具体音频文件的命令。之后,在从用户接收到的用于再现音频文件的命令所针对的音频文件中的至少一个帧202中,电子设备仅提取每一帧的首部203的信息。例如,提取电子设备要再现的音频文件中包括多个帧202的每一个帧中包括的帧首部203的信息。更具体地,从帧首部203中包括的信息中提取辅助信息,并提取作为相应帧的平均容量的全局增益值。在电子设备提取作为相应帧的平均容量的全局增益值之后,电子设备连接所提取的全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。下文将参考图3A、3B和图4来描述归一化和平滑过程。本文中,帧的平均容量指示了帧中包括的多个数据的平均信号大小。多个数据是音频信号。例如,全局增益值是每一帧的代表值,代表了每一帧中包括的音频信号的平均信号大小。可以在改变全局增益值的同时调整每一帧的容量(或电平(level))。
图3A和3B示出了根据本发明示例性实施例对全局增益值进行归一化。图3A示出了归一化之前的曲线,图3B示出了根据本发明示例性实施例的归一化之后的曲线。
参考图3A和3B,首先,如上参考图2A和2B所述,电子设备从用户接收用于再现具体音频文件的命令。当接收到用于再现具体音频文件的命令时,电子设备从音频文件中包括的至少一帧中仅提取每个帧首部信息。之后,电子设备从每个帧首部中包括的信息中提取辅助信息,提取作为相应帧的平均容量的全局增益值,并连接提取的相应全局增益值。例如,图3A的f(x)示出了连接提取的相应全局增益值之后的曲线。
更具体地,图3B的f’(x)示出了对图3A的f(x)进行归一化得到的曲线。参考图3B,将f’(x)与f(x)进行比较,两条曲线具有相同的图样。然而,y轴是归一化之前的范围A到B,而归一化之后y轴的范围缩减到范围A’到B’。本文中,y轴的范围是指表示最小峰值和最大峰值之差的动态范围。例如,尽管归一化之前的动态范围可以是从A到B,但是归一化之后动态范围减小到范围A’到B’。如上所述,由于在数据具有较大动态范围的情况下需要较大存储器容量用于数据处理,因此通过减小动态范围来执行归一化。例如,需要归一化任务来减小归一化之前的曲线f(x)的动态范围。本文中,可以通过以下等式(1)来确定全局增益值的归一化。
本文中,f’(x)表示连接相应全局增益值之后的归一化值,A表示归一化之前的最大峰值,B表示归一化之前的最小峰值,A’表示归一化之后的最大峰值,且B’表示归一化之后的最小峰值。
例如,本发明的示例性实施例通过连接提取的相应全局增益值来执行归一化,这样,如果解码之前音频文件(即,原始数据)具有从A到B的较大范围,那么当电子设备使用根据上述等式(1)的归一化曲线f’(x)来执行数据处理时,需要较小的存储器容量。
图4示出了根据本发明示例性实施例对归一化值进行平滑。
参考图4,首先对归一化值进行平滑,以使用移动平均方法对平滑之前具有角形图样的数据401进行滤波,并由此以平滑曲线402来显示。如上参考图3A和3B所述,对归一化值进行平滑的过程包括在对每个提取的全局增益值进行滤波的过程中。更具体地,对每个提取的全局增益值进行滤波的过程包括:连接提取的相应全局增益值的过程、对相连的全局增益值进行归一化的过程以及对归一化的值进行平滑的过程。例如,参考图4所述的对归一化的值进行平滑的过程包括在对提取的相应全局增益值进行滤波的过程中。下文中,将描述用于平滑归一化值的移动平均的概念。移动平均是仅对特定个数的最近测量的值进行平均,可以被定义为仅对最近值进行平均而不考虑先前的数据。更具体地,这是一种相对于时间序列的每一项,通过连接某一项之前或之后的特定个数的项的均值来获得倾斜线的方法。前述移动平均方法具有易于理解和易于计算方面的优点。例如,本发明的示例性实施例可以将归一化值平滑为移动平均值。
图5A和5B示出了根据本发明示例性实施例以波形图样显示音频流。图5A示出了根据本发明示例性实施例确认经滤波的值的峰值并将其与任意一个预设区域进行匹配。
参考图5A,电子设备对每个提取的全局增益值进行滤波,确认经滤波的值的每个峰值,并将确认的峰值与三个预设区域中的任意一个进行匹配。更具体地,电子设备连接提取的相应全局增益值、对相连的全局增益值进行归一化以及对归一化值进行平滑。归一化和平滑过程的完成意味着对提取的全局增益值的滤波完成。之后,电子设备确认每一个滤波后的值并将其与任意一个预设区域进行匹配。例如,当用户确定第一阈值和第二阈值时,电子设备确认经滤波的值的每个峰值。首先,如果滤波后的峰值501小于第一阈值,则对应部分可能是整个音频文件中的独唱部分或过渡部分。此外,如果滤波后的峰值502大于或等于第一阈值且小于第二阈值,则对应部分可能是整个音频文件中的引子部分。此外,如果滤波后的峰值503大于或等于第二阈值,则对应部分可能是整个音频文件中的高潮(例如合唱)部分。每个音频文件可以不明确地划分为独唱、引子、过渡和高潮部分,某一音频文件的特定部分可以是省略的。然而,大多数音频文件可以划分为如上所述的四个部分。例如,电子设备可以确认经滤波的值的每个峰值,并将整个音频文件划分为独唱、引子、过渡和高潮部分。本文中,独唱和过渡部分具有小于或等于第一阈值的相同峰值。然而,电子设备将其经滤波的值的峰值确认为小于或等于第一阈值的第一部分分类为独唱部分,将所确认的下一部分分类为过渡部分。因此,如上所述,经滤波的值的峰值501小于或等于第一阈值的部分可以是独唱或过渡部分。
图5B示出了根据本发明示例性实施例在电子设备的触摸屏中以波形图样显示音频流。如以上参考图5A所述,电子设备确认经滤波的值的峰值,并由此显示整个音频文件,从而用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。
参考图5B,电子设备可以以波形图样来显示整个音频文件。例如,可以在图5B所示的进度条上以音频流的波形图样来显示整个音频文件。更具体地,用户可以知道音频文件的第一开始部分是独唱部分504,独唱部分504之后且示出了与独唱部分504相比更高峰值的部分是引子部分505,引子部分505是包括第一语音的部分,并且可以确认示出了最高峰值的部分是音频文件的高潮部分506。此外,用户可以知道高潮部分506之后且显示的峰值较低的部分是过渡部分507,并且可以确认再次示出了较高峰值的部分是高潮部分508。如上所述,通过仅使用每个帧首部信息而不是对用户指示要再现的具体音频文件的整个数据进行解码,电子设备能够无时间延迟地以波形图样来显示音频流,还使得用户能够通过观看音频流的波形来容易地识别整个音频文件的区段。
图6A和6B示出了根据本发明示例性实施例的使用色阶显示音频流。图6A示出了根据本发明示例性实施例确认经滤波的值的峰值并将其与任意一个预设颜色进行匹配。
参考图6A,电子设备对每个提取的全局增益值进行滤波,确认经滤波的值的每个峰值,并将确认的峰值与三个预设颜色中的任意一个进行匹配。更具体地,电子设备连接提取的相应全局增益值、对相连的全局增益值进行归一化以及对归一化的值进行平滑。归一化和平滑过程的完成意味着对提取的全局增益值的滤波完成。之后,电子设备确认每一个滤波后的值并将其与任意一个预设颜色进行匹配。例如,当用户确定第一阈值和第二阈值时,电子设备确认经滤波的值的每个峰值。首先,如果滤波后的峰值601小于第一阈值,则对应部分可能是整个音频文件中的独唱部分或过渡部分。此外,如果滤波后的峰值602大于或等于第一阈值且小于第二阈值,则对应部分可能是整个音频文件中的引子部分。此外,如果滤波后的峰值603大于或等于第二阈值,则对应部分可能是整个音频文件中的高潮部分。每个音频文件可以不明确地划分为独唱、引子、过渡和高潮部分,某一音频文件的特定部分可以省略。然而,大多数音频文件可以划分为如上所述的四个部分。例如,电子设备可以确认经滤波的值的每个峰值,并将整个音频文件划分为独唱、引子、过渡和高潮部分。本文中,独唱和过渡部分具有小于或等于第一阈值的相同峰值。然而,电子设备将其经滤波值的峰值被确认小于或等于第一阈值的第一部分分类为独唱部分,将所确认下一部分分类为过渡部分。因此,如上所述,经滤波的值的峰值601小于或等于第一阈值的部分可以是独唱或过渡部分。
图6B示出了根据本发明示例性实施例的使用色阶在电子设备的触摸屏中显示音频流。如以上参考图6A所述,电子设备确认经滤波值的峰值,并由此显示整个音频文件,从而用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。
参考图6B,电子设备以色阶图样来显示整个音频文件。例如,可以在图6B所示的进度条上以音频流的色阶图样来显示整个音频文件。更具体地,用户可以知道进度条上显示的第一颜色604是作为第一开始部分的独唱部分,并知道第一颜色604之后利用第二颜色605显示的是包括第一语音的引子部分,并且能够确认第二颜色605之后利用第三颜色606显示的部分是音频文件的第一高潮部分。此外,用户可以知道第三颜色606之后再次利用第一颜色607显示的部分是过渡部分,并确认再次利用第三颜色608显示的部分是第二高潮部分。例如,由于可以将音频文件的分区划分为独唱、引子、过渡和高潮部分,用户可以容易地知道利用第一颜色604显示的部分是独唱部分,第一颜色604之后利用第二颜色605显示的部分是引子部分,第二颜色605之后利用第三颜色606显示的部分是第一高潮部分,利用第一颜色607显示的部分是过渡部分,以及利用第三颜色608显示的部分是第二高潮部分。如上所述,通过仅使用每个帧首部信息而不是对用户指示要再现的特定音频文件的整个数据进行解码,电子设备能够无时间延迟地以色阶来显示音频流,还使得用户能够通过观看音频流的色阶来容易地识别整个音频文件的区段。
图7A和7B示出了根据本发明示例性实施例接收用于仅再现特定区域的输入。图7A示出了根据本发明的示例性实施例以波形图样来显示音频流。
参考图7A,电子设备可以以波形图样来显示音频流。更具体地,当从用户接收到用于再现具体音频文件的命令时,电子设备能够通过从音频文件的至少一帧中仅提取每个帧首部信息来快速地显示音频流。根据本发明示例性实施例在图7A中以波形图样显示的音频流中,在媒体播放器中包括的进度条上以波形图样显示整个音频文件的区段。如图7A所示,音频文件开始是独唱部分701,之后是包括语音的引子部分702。引子部分702之后是第一高潮部分703。第一高潮部分703之后是过渡部分704,之后是第二高潮部分705和音频文件的结束。例如,通过仅使用每个帧首部信息而不是对用户指示要再现的特定音频文件的整个数据进行解码,电子设备能够无时间延迟地以波形图样来快速地显示音频流,还使得用户能够通过观看音频流的波形来容易地识别整个音频文件的区段。
图7B示出了根据本发明的示例性实施例通过使用显示的音频流的波形图样来仅显示特定区域。
参考图7B,在媒体播放器的进度条上以波形图样来显示当前正在再现的特定音频文件的区段。如上参考图7A所述,电子设备以波形图样来显示特定音频文件的区段,因此,优点在于能够容易地识别当前正在显示的音频文件的区段。之后,将参考图7B来描述通过使用显示音频流的波形图样来仅显示特定区域的示例。首先,如果电子设备接收到用于再现具体音频文件的命令,通过仅提取要再现的至少一帧音频文件中包括的帧首部信息,电子设备可以以波形图样来快速显示音频文件的区段,而无需解码整个音频文件。例如,通过观看以波形图样显示的音频流,用户可以容易地识别音频文件的全部区段。假定用户仅希望收听被称作高潮部分的特定部分而不是从开始收听音频文件。通过观看媒体播放器的进度条上以波形图样显示的音频流,用户能够直接将进度条移到当前正在再现的音频文件的高潮部分705。例如,如上所述,由于电子设备显示音频流,使得能够一眼就确认音频文件的全部区段,所以用户能够将进度条移到希望的部分,即,高潮部分705。在现有技术中,不是提供音频流使得用户能够容易地识别当前正在再现的音频文件的区段。因此,如上述示例所述,存在的问题在于用户不可避免地经历多次尝试并出错,以从特定部分开始再现音频文件。然而,由于在进度条上以波形图样来显示音频文件的全部区段,所以优点在于用户能够将进度条移到期望的部分而无需经历多次尝试并出错。
图8A和8B示出了根据本发明示例性实施例接收用于仅再现特定区域的输入。图8A示出了根据本发明的示例性实施例以色阶来显示音频流。
参考图8A,电子设备可以色阶来显示音频流。更具体地,当从用户接收到用于再现具体音频文件的命令时,电子设备能够通过从音频文件的至少一帧中仅提取每个帧首部信息来快速地显示音频流。根据本发明示例性实施例在图8A中以色阶图样显示的音频流中,在媒体播放器中包括的进度条上以第一到第三颜色显示整个音频文件的区段。如图8A所示,音频文件开始是独唱部分(第一颜色)801,之后是包括语音的引子部分(第二颜色)802。引子部分802之后是第一高潮部分(第三颜色)803。第一高潮部分803之后是过渡部分(第一颜色)804,之后是第二高潮部分(第三颜色)805和音频文件的结束。例如,通过仅使用每个帧首部信息而不是对用户指示要再现的特定音频文件的整个数据进行解码,电子设备能够无时间延迟地以色阶图样来快速地显示音频流,还使得用户能够通过观看音频流的颜色来容易地识别整个音频文件的区段。
图8B示出了根据本发明的示例性实施例通过使用色阶显示的音频流来仅显示特定区域。
参考图8B,在媒体播放器的进度条上以第一到第三颜色来显示当前正在再现的具体音频文件的区段。如上参考图8A所述,电子设备以色阶来显示具体音频文件的区段,因此,优点在于能够容易地识别当前正在显示的音频文件的区段。之后,将参考图8B来描述通过使用显示音频流的色阶来仅显示特定区域的示例。首先,如果电子设备接收到用于再现具体音频文件的命令,通过仅提取要再现的至少一帧音频文件中包括的帧首部信息,电子设备可以以第一到第三颜色来快速显示音频文件的区段,而无需解码整个音频文件。例如,通过仅观看显示音频流的颜色,用户可以容易地识别音频文件的全部区段。假定用户仅希望收听被称作高潮部分的特定部分而不是从开始收听音频文件。通过观看媒体播放器的进度条上以第一到第三颜色显示的音频流,用户能够直接将进度条移到当前正在再现的音频文件的第二高潮部分805。例如,如上所述,由于电子设备显示音频流使得能够一眼确认音频文件的全部区段,用户能够将进度条移到希望的部分,即,高潮部分805。在现有技术中,不是提供音频流使得用户能够容易地识别当前正在再现的音频文件的区段。因此,如上述示例所述,存在的问题在于用户不可避免地经历多次尝试并出错以从特定部分开始再现音频文件。然而,由于在进度条上以特定颜色来进行显示,优点在于用户能够将进度条移到期望的部分而无需经历多次尝试并出错。例如,可以在图8B所示的进度条上以音频流的色阶来显示整个音频文件。更具体地,用户可以知道进度条上显示的第一颜色801是作为第一开始部分的独唱部分,并知道第一颜色801之后利用第二颜色802显示的是包括第一语音的引子部分,并且能够确认第二颜色802之后利用第三颜色803显示的部分是音频文件的第一高潮部分。此外,用户可以知道第三颜色803之后再次利用第一颜色804显示的部分是过渡部分,并确认利用第三颜色805显示的部分是第二高潮部分。
图9A到9C示出了根据本发明示例性实施例仅再现电子设备中至少一个文件的特定部分。图9A示出了根据本发明的示例性实施例从电子设备中存储的音频文件中选择至少一个文件。
参考图9A,电子设备能够接收用户从电子设备存储的音频文件中选择的至少一个文件。例如,假定多个音频文件存储在电子设备中,用户希望通过从电子设备中存储的多个音频文件中选择至少一个文件来再现文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,如图9A的示例所示,通过用户触摸可以从电子设备中存储的所有音频文件中选择歌曲A、B和D。用户可以通过触摸从电子设备本地存储的所有音频文件中选择特定歌曲。在根据示例性实施例的图9A的示例中,通过用户触摸选择至少一个音频文件。尽管图9A中通过用户触摸来选择至少一个音频文件,显然还可以通过接收特定命令而不是用户触摸来选择至少一个音频文件。
图9B示出了根据本发明示例性实施例选择在电子设备中选择的音频文件的再现范围。
参考图9B,当如参考图9A所述从电子设备中存储的音频文件中选择至少一个音频文件时,为了选择用户所选至少一个音频文件的再现范围,电子设备显示选定的至少一个音频文件的再现范围,以便能够选择再现范围。例如,如果在上述示例中用户在电子设备中选择歌曲A、B和D,则电子设备特别显示选定歌曲A、B和D的再现范围。如图9B所示,显示特定部分(例如整个部分、仅独唱部分、仅引子部分、仅过渡部分和仅高潮部分)。例如,用户可以从电子设备的触摸屏上显示的选定歌曲的再现范围中选择期望部分,从而仅再现期望部分。如果用户希望仅收听高潮部分,则用户要做的是从电子设备中显示的特定部分中仅选择“高潮部分”。
参考图9C,图9C示出了根据本发明的示例性实施例通过分析电子设备中音频流的波形,仅顺序地再现至少一个选定区域。更具体地,电子设备从用户接收用于仅再现至少一个音频文件区域中的至少一个区域的命令,分析音频流的波形,并通过自动跳到至少一个输入区域来顺序地仅再现对应部分。在上述示例中,如果电子设备接收到用于仅再现用户选择的歌曲A、B和D的高潮部分901的输入,则电子设备自动地跳到歌曲A、B和D的高潮部分901,并仅再现歌曲A、B和D的高潮部分901。在现有技术中,不存在能够仅再现音频文件的特定部分的方法,本发明示例性实施例提出了一种如上所述能够仅再现至少一个音频文件的特定部分的方法,因此,有利地满足了用户的多种需求。尽管图9A到9C未示出,例如,当用户希望再现歌曲A、B和D的独唱部分和高潮部分二者时,如果用户同时选择特定再现范围中的“独唱部分”和“高潮部分”,则电子设备顺序地仅再现歌曲A、B和D的“独唱部分”和“高潮部分”。
图10A到10C示出了根据本发明示例性实施例仅再现电子设备中至少一个文件的特定部分。图10A示出了根据本发明示例性实施例从电子设备中存储的音频文件中选择至少一个文件。
参考图10A,电子设备能够接收用户从电子设备存储的音频文件中选择的至少一个文件。例如,假定多个音频文件存储在电子设备中,用户希望通过从电子设备中存储的多个音频文件中选择至少一个文件来再现文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,如图10A的示例所示,通过用户触摸可以从电子设备中存储的所有音频文件中选择歌曲A和C。例如,用户可以通过触摸从电子设备本地存储的所有音频文件中选择特定歌曲。在根据本发明示例性实施例的图10A的示例中,通过用户触摸选择至少一个音频文件。尽管图10A中通过用户触摸来选择至少一个音频文件,显然还可以通过接收特定命令而不是用户触摸来选择至少一个音频文件。
图10B示出了根据本发明示例性实施例选择在电子设备中选择的音频文件的再现范围。
参考图10B,当如参考图10A所述从电子设备中存储的音频文件中选择至少一个音频文件时,为了选择用户所选的至少一个音频文件的再现范围,电子设备显示选定的至少一个音频文件的再现范围,以便能够选择再现范围。例如,如果在上述示例中用户在电子设备中选择歌曲A和C,则电子设备特别显示选定歌曲A和C的再现范围。如图10B所示,显示特定部分(例如整个部分、仅独唱部分、仅引子部分、仅过渡部分和仅高潮部分)。例如,用户可以从电子设备的触摸屏上显示的选定歌曲的再现范围中选择期望部分,从而仅再现期望部分。如果用户希望仅收听独唱部分,则用户要做的是从电子设备中显示的特定部分中仅选择“独唱部分”。
参考图10C,图10C示出了根据本发明的示例性实施例通过分析电子设备中音频流的色阶,仅顺序地再现至少一个选定区域。更具体地,电子设备从用户接收用于仅再现至少一个音频文件区域中的至少一个区域的命令,分析以色阶显示的音频流,并通过自动跳到至少一个输入区域来顺序地仅再现对应部分。在上述示例中,如果电子设备接收到用于仅再现用户选择的歌曲A和C的独唱部分1001的输入,则电子设备自动地跳到歌曲A和C的独唱部分1001,并仅再现歌曲A和C的独唱部分1001。在现有技术中,不存在能够仅再现音频文件的特定部分的方法,本发明的示例性实施例提出了一种如上所述能够仅再现至少一个音频文件的特定部分的方法,因此,有利地满足了用户的多种需求。尽管图10A到10C未示出,例如,当用户希望再现歌曲A和C的独唱部分和高潮部分二者时,如果用户同时选择特定再现范围中的“独唱部分”和“高潮部分”,则电子设备顺序地仅再现歌曲A和C的“独唱部分”和“高潮部分”。
图11是示出了根据本发明示例性实施例以波形图样来显示音频流的流程图。
参考图11,在步骤1101,电子设备接收用于再现特定音频文件的命令。更具体地,电子设备从用户接收用于再现从本地存储的至少一个音频文件中选择的特定文件的命令。例如,当多个音频文件存储在电子设备中时,假定通过从电子设备中存储的多个音频文件中选择特定音频文件,用户想要再现文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,可以通过用户触摸从电子设备的所有音频文件中选择任意一个音频文件。例如,用户可以通过触摸从电子设备本地存储的所有音频文件中选择特定歌曲。
在步骤1102,当接收到用于再现具体音频文件的命令时,电子设备从具体音频文件中包括的至少一帧中仅提取每个首部信息。更具体地,音频文件可以包括文件首部和至少一帧。此外,每一帧可以包括帧首部和数据。例如,当接收到用于再现具体音频文件的命令时,电子设备从音频文件中包括的至少一帧中仅提取每个首部信息,而不是对具体音频文件的全部数据进行解码。
在从具体音频文件中包括的至少一帧中仅提取每个首部信息之后,在步骤1103,电子设备从提取的首部信息中提取辅助信息。更具体地,帧首部位于具体帧的前部,帧首部包括帧中包括的数据的数据量、解码信息等。例如,具体帧的首部包括帧的数据量、编码压缩选项、比特率信息、辅助信息等。这里,电子设备提取帧首部中包括的辅助信息。
在从提取的首部信息中提取辅助信息之后,在步骤1104,电子设备通过使用辅助信息中包括的信息来提取全局增益值。更具体地,通过从帧首部中包括的信息中提取辅助信息来提取全局增益值,全局增益值是相应帧的平均容量。本文中,可以将全局增益值定义为从帧中包括的信息中提取的辅助信息的相应帧的平均容量。
之后,在步骤1105,电子设备对提取的全局增益值进行滤波。更具体地,如果在电子设备中提取作为相应帧的平均容量的全局增益值,则电子设备连接提取的全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。例如,对每个提取的全局增益值进行滤波的过程可以包括:连接提取的相应全局增益值的过程、对相连的全局增益值进行归一化的过程以及对归一化的值进行平滑的过程。本文中,由于在数据具有较大动态范围的情况下需要较大存储器容量用于数据处理,所以对连接的全局增益值进行归一化。此外,通过根据移动平均方法对值进行滤波,对归一化值进行平滑以便以波形图样显示数据。
在对提取的全局增益值进行滤波之后,在步骤1106,电子设备以音频流波形图样来显示经滤波的值。更具体地,电子设备确认经滤波的值的峰值并显示整个音频文件,以便用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。例如,用户可以知道音频文件的第一开始部分是独唱部分,知道独唱部分之后且示出了与独唱部分相比更高的峰值的部分是引子部分,引子部分是包括第一语音的部分,并且能够确认示出了最高峰值的部分是音频文件的高潮部分。此外,用户可以知道高潮部分之后且显示的峰值较低的部分是过渡部分,并且能够确认再次示出了较高峰值的部分是高潮部分。如上所述,通过仅使用每个帧首部信息而不是对用户指示要再现的具体音频文件的全部数据进行解码,电子设备能够无时间延迟地以波形图样来显示音频流,还使得用户能够通过观看音频流的波形来容易地识别整个音频文件的区段。
图12是示出了根据本发明示例性实施例以色阶来显示音频流的流程图。
参考图12,在步骤1201,电子设备接收用于再现具体音频文件的命令。更具体地,电子设备从用户接收用于再现从本地存储的至少一个音频文件中选择的具体文件的命令。例如,当多个音频文件存储在电子设备中时,假定通过从电子设备中存储的多个音频文件中选择具体音频文件,用户希望再现该文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,可以通过用户触摸从电子设备的所有音频文件中选择任意一个音频文件。例如,用户可以通过触摸从电子设备本地存储的所有音频文件中选择特定歌曲。
在步骤1202,当接收到用于再现具体音频文件的命令时,电子设备从具体音频文件中包括的至少一帧中仅提取每个首部信息。更具体地,音频文件可以包括文件首部和至少一帧。此外,每一帧可以包括帧首部和数据。例如,当接收到用于再现具体音频文件的命令时,电子设备从音频文件中包括的至少一帧中仅提取每个首部信息,而不是对具体音频文件的全部数据进行解码。
在从具体音频文件中包括的至少一帧中仅提取每个首部信息之后,在步骤1203,电子设备从提取的首部信息中提取辅助信息。更具体地,帧首部位于特定帧的前部,帧首部包括帧中包括的数据的数据量、解码信息等。例如,特定帧的首部包括帧的数据量、编码压缩选项、比特率信息、辅助信息等。这里,电子设备提取帧首部中包括的辅助信息。
在从提取的首部信息中提取辅助信息之后,在步骤1204,电子设备通过使用辅助信息中包括的信息来提取全局增益值。更具体地,通过从帧首部中包括的信息中提取辅助信息来提取全局增益值,全局增益值是相应帧的平均容量。本文中,可以将全局增益值定义为从帧中包括的信息中提取的辅助信息的相应帧的平均容量。
之后,在步骤1205,电子设备对提取的全局增益值进行滤波。更具体地,如果在电子设备中提取作为相应帧的平均容量的全局增益值,则电子设备连接提取的全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。例如,对每个提取的全局增益值进行滤波的过程可以包括:连接提取的相应全局增益值的过程、对相连的全局增益值进行归一化的过程以及对归一化的值进行平滑的过程。本文中,由于在数据具有较大动态范围的情况下需要较大存储器容量用于数据处理,所以对连接的全局增益值进行归一化。此外,通过根据移动平均方法对值进行滤波,对归一化值进行平滑以便以波形图样显示数据。
在对提取的全局增益值进行滤波之后,在步骤1206,电子设备以色阶来显示滤波后的值。更具体地,电子设备确认经滤波的值的峰值并以色阶显示整个音频文件,以便用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。例如,用户可以知道进度条上显示的第一颜色是作为第一开始部分的独唱部分,并知道第一颜色之后利用第二颜色显示的是包括第一语音的引子部分,并且能够确认第二颜色之后利用第三颜色显示的部分是音频文件的第一高潮部分。此外,用户可以知道第三颜色之后再次利用第一颜色显示的部分是过渡部分,并确认利用第三颜色显示的部分是第二高潮部分。例如,由于可以将音频文件的区段划分为独唱、引子、过渡和高潮部分,用户可以容易地知道利用第一颜色显示的部分是独唱部分,第一颜色之后利用第二颜色显示的部分是引子部分,第二颜色之后利用第三颜色显示的部分是第一高潮部分,利用第一颜色显示的部分是过渡部分,以及利用第三颜色显示的部分是第二高潮部分。根据本发明的示例性实施例,通过仅使用每个帧首部信息而不是对用户指示要再现的具体音频文件的全部数据进行解码,电子设备能够无时间延迟地以色阶来显示音频流,还使得用户能够通过观看音频流的色阶来容易地识别整个音频文件的区段。
图13是示出了根据本发明示例性实施例通过分析电子设备中音频流的波形来仅顺序地再现至少任意一个区域的流程图。
参考图13,在步骤1301,电子设备接收用于再现至少一个音频文件的命令。更具体地,电子设备从用户接收用于再现从本地存储的至少一个音频文件中选择的至少一个音频文件的命令。例如,当多个音频文件存储在电子设备中时,假定通过从电子设备中存储的多个音频文件中选择至少一个文件,用户希望再现文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,可以通过用户触摸从电子设备的所有音频文件中选择任意一个音频文件。例如,用户可以通过触摸从电子设备本地存储的所有音频文件中选择至少一首歌曲。
在步骤1302,当接收到用于再现至少一个音频文件的命令时,电子设备接收输入的要再现的至少一个音频文件的再现范围。更具体地,为了选择用户所选至少一个音频文件的再现范围,电子设备显示选定的至少一个音频文件的再现范围,以便能够选择再现范围。例如,如果用户在电子设备中选择歌曲A和B,则电子设备特别显示选定歌曲A和B的再现范围。之后,显示特定部分(例如整个部分、仅独唱部分、仅引子部分、仅过渡部分和仅高潮部分)。例如,用户可以从电子设备的触摸屏上显示的选定歌曲的再现范围中选择期望部分,从而仅再现期望部分。如果用户希望仅收听独唱部分,则用户要做的是从电子设备中显示的特定部分中仅选择“独唱部分”。
之后,在步骤1303,当接收到用于再现具体音频文件的命令时,电子设备从具体音频文件中包括的至少一帧中仅提取每个首部信息。更具体地,音频文件可以包括文件首部和至少一帧。此外,每一帧可以包括帧首部和数据。例如,当接收到用于再现至少一个音频文件的命令时,电子设备从输入的音频文件中包括的至少一帧中仅提取每个首部信息,而不是对输入的至少一个音频文件的全部数据进行解码。
当从至少一个音频文件中包括的至少一帧中仅提取每个首部信息时,在步骤1304,电子设备从提取的首部信息中提取辅助信息。更具体地,帧首部位于具体帧的前部,帧首部包括帧中包括的数据的数据量、解码信息等。例如,具体帧的首部包括帧的数据量、编码压缩选项、比特率信息、辅助信息等。这里,电子设备提取帧首部中包括的辅助信息。
在从提取的首部信息中提取辅助信息之后,在步骤1305,电子设备使用辅助信息中包括的信息来提取全局增益值。更具体地,通过从帧首部中包括的信息中提取辅助信息来提取全局增益值,全局增益值是相应帧的平均容量。本文中,可以将全局增益值定义为从帧中包括的信息中提取的辅助信息的相应帧的平均容量。
之后,在步骤1306,电子设备对提取的全局增益值进行滤波。更具体地,如果在电子设备中提取作为相应帧的平均容量的全局增益值,则电子设备连接提取的全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。例如,对每个提取的全局增益值进行滤波的过程可以包括:连接提取的相应全局增益值的过程、对相连的全局增益值进行归一化的过程以及对归一化的值进行平滑的过程。本文中,由于在数据具有较大动态范围的情况下需要较大存储器容量用于数据处理,所以对连接的全局增益值进行归一化。此外,通过根据移动平均方法对值进行滤波,对归一化值进行平滑以便以波形图样显示数据。
在对提取的全局增益值进行滤波之后,在步骤1307,电子设备以音频流波形图样来显示经滤波的值。更具体地,电子设备确认经滤波的值的峰值并显示整个音频文件,以便用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。例如,用户可以知道音频文件的第一开始部分是独唱部分,知道独唱部分之后且示出了与独唱部分相比更高的峰值的部分是引子部分,引子部分是包括第一语音的部分,并且能够确认示出了最高峰值的部分是音频文件的高潮部分。此外,用户可以知道高潮部分之后且显示的峰值较低的部分是过渡部分,并且能够确认再次示出了较高峰值的部分是高潮部分。
之后,在步骤1308,电子设备分析音频流的波形并顺序地仅再现至少一个输入区域。更具体地,电子设备分析音频流的波形,自动跳到至少一个输入区域并顺序地仅再现对应部分。例如,如果电子设备接收到用于仅再现用户选择的歌曲A和D的高潮部分的输入,则电子设备自动地跳到歌曲A和D的高潮部分,并仅顺序地再现歌曲A和D的高潮部分。在现有技术中,不存在能够仅再现音频文件的特定部分的方法,本发明的示例性实施例提出了一种如上所述能够仅再现至少一个音频文件的特定部分的方法,因此,有利地满足了用户的多种需求。尽管图13未示出,例如,当用户希望再现歌曲A和D的独唱部分和高潮部分二者时,如果用户同时选择特定再现范围中的“独唱部分”和“高潮部分”,则电子设备顺序地仅再现歌曲A和D的“独唱部分”和“高潮部分”。
图14是示出了根据本发明示例性实施例通过分析色阶来仅顺序地再现至少一个区域的流程图。
参考图14,在步骤1401,电子设备接收用于再现至少一个音频文件的命令。更具体地,电子设备从用户接收用于再现从本地存储的至少一个音频文件中选择的至少一个音频文件的命令。例如,当多个音频文件存储在电子设备中时,假定通过从电子设备中存储的多个音频文件中选择至少一个文件,用户希望再现文件。首先,当电子设备接收到用户选择的本地部分时,电子设备显示当前存储的所有音频文件。之后,可以通过用户触摸从电子设备的所有音频文件中选择至少一个音频文件。例如,用户可以通过触摸从电子设备本地存储的所有音频文件中选择至少一首歌曲。
在步骤1402,当接收到用于再现至少一个音频文件的命令时,电子设备接收输入的要再现的至少一个音频文件的再现范围。更具体地,为了选择用户所选至少一个音频文件的再现范围,电子设备显示选定的至少一个音频文件的再现范围,以便能够选择再现范围。例如,如果用户在电子设备中选择歌曲A和B,则电子设备特别显示选定歌曲A和B的再现范围。之后,显示特定部分(例如整个部分、仅独唱部分、仅引子部分、仅过渡部分和仅高潮部分)。例如,用户可以从电子设备的触摸屏上显示的选定歌曲的再现范围中选择期望部分,从而仅再现期望部分。如果用户希望仅收听独唱部分,则用户要做的是从电子设备中显示的特定部分中仅选择“独唱部分”。
之后,当接收到用于再现具体音频文件的命令时,在步骤1403,电子设备从具体音频文件中包括的至少一帧中仅提取每个首部信息。更具体地,音频文件可以包括文件首部和至少一帧。此外,每一帧可以包括帧首部和数据。例如,当接收到用于再现具体音频文件的命令时,电子设备从输入音频文件中包括的至少一帧中仅提取每个首部信息,而不是对输入的至少一个音频文件的全部数据进行解码。
当从至少一个音频文件中包括的至少一帧中仅提取每个首部信息时,在步骤1404,电子设备从提取的首部信息中提取辅助信息。更具体地,帧首部位于特定帧的前部,帧首部包括帧中包括的数据的数据量、解码信息等。例如,具体帧的首部包括帧的数据量、编码压缩选项、比特率信息、辅助信息等。这里,电子设备提取帧首部中包括的辅助信息。
在从提取的首部信息中提取辅助信息之后,在步骤1405,电子设备通过使用辅助信息中包括的信息来提取全局增益值。更具体地,通过从帧首部中包括的信息中提取辅助信息来提取全局增益值,全局增益值是相应帧的平均容量。本文中,可以将全局增益值定义为从帧中包括的信息中提取的辅助信息的相应帧的平均容量。
之后,在步骤1406,电子设备对提取的全局增益值进行滤波。更具体地,如果在电子设备中提取作为相应帧的平均容量的全局增益值,则电子设备连接提取的全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。例如,对每个提取的全局增益值进行滤波的过程可以包括:连接提取的相应全局增益值的过程、对相连的全局增益值进行归一化的过程以及对归一化的值进行平滑的过程。本文中,由于在数据具有较大动态范围的情况下需要较大存储器容量用于数据处理,所以对连接的全局增益值进行归一化。此外,通过根据移动平均方法对值进行滤波,对归一化值进行平滑以便以波形图样显示数据。
在对提取的全局增益值进行滤波之后,在步骤1407,电子设备以色阶来显示经滤波的值。更具体地,电子设备确认经滤波的值的峰值并以色阶显示整个音频文件,以便用户能够容易地识别独唱、引子、过渡和高潮部分中的特定部分。例如,用户可以知道进度条上显示的第一颜色是作为第一开始部分的独唱部分,并知道第一颜色之后利用第二颜色显示的是包括第一语音的引子部分,并且能够确认第二颜色之后利用第三颜色显示的部分是音频文件的第一高潮部分。此外,用户可以知道第三颜色之后再次利用第一颜色显示的部分是过渡部分,并确认利用第三颜色显示的部分是第二高潮部分。例如,由于可以将音频文件的区段划分为独唱、引子、过渡和高潮部分,用户可以容易地知道利用第一颜色显示的部分是独唱部分,第一颜色之后利用第二颜色显示的部分是引子部分,第二颜色之后利用第三颜色显示的部分是第一高潮部分,利用第一颜色显示的部分是过渡部分,以及利用第三颜色显示的部分是第二高潮部分。
之后,在步骤1408,电子设备分析色阶并顺序地仅再现至少一个输入区域。更具体地,电子设备分析以色阶显示的音频流,自动跳到至少一个输入区域并顺序地仅再现对应部分。例如,如果电子设备接收到用于仅再现用户选择的歌曲A和C的独唱部分的输入,则电子设备自动地跳到歌曲A和C的独唱部分,并仅顺序地再现歌曲A和C的独唱部分。在现有技术中,不存在能够仅再现音频文件的特定部分的方法,本发明的示例性实施例提出了一种如上所述能够仅再现至少一个音频文件的特定部分的方法,因此,有利地满足了用户的多种需求。尽管图14未示出,例如,当用户希望再现歌曲A和C的独唱部分和高潮部分二者时,如果用户同时选择特定再现范围中的“独唱部分”和“高潮部分”,则电子设备顺序地仅再现歌曲A和C的“独唱部分”和“高潮部分”。
图15是示出了根据本发明示例性实施例的电子设备的结构的方框图。
参考图15,电子设备1500可以是便携式电子设备。此外,电子设备可以是便携式终端、移动电话、移动平板电脑、媒体播放器、平板计算机、手持计算机、个人数字助理(PDA)等。此外,电子设备可以是任意便携式电子设备,包括对上述那些设备的两个或更多个功能进行了组合的设备。
电子设备1500包括存储器1510、处理器单元1520、输入/输出(I/O)系统1530、触摸屏1540、其他输入或控制设备1550、音频子系统1560和外部端口1570。
存储器1510存储软件组件。软件组件包括音频内容再现模块1511、帧首部读取模块1512、辅助信息提取模块1513和滤波模块1514。在示例性实施例中,音频内容再现模块1511再现从用户接收的至少一个音频文件。帧首部读取模块1512从具体音频文件中包括的至少一帧中仅提取每个首部信息。辅助信息提取模块1513从提取的帧首部信息中提取辅助信息。滤波模块1514使用包括在提取的辅助信息中的信息来提取全局增益值。
处理器单元1520包括存储器接口1521、一个或多个处理器1522和外围接口1523。有时可以将整个处理器单元1520称作处理器。处理器1522通过执行多种软件程序来执行电子设备1500的各种功能,并处理和控制语音通信和数据通信。除了这种典型功能之外,处理器1522还用于执行存储器1510中存储的特定软件模块(即,指令集),因此,执行与模块相对应的各种特定功能。例如,处理器1522通过与存储在存储器1510中的软件模块交互工作来执行本发明示例性实施例的方法。此外,处理器1522可以包括一个或多个数据处理器、图像处理器或编解码器。可以分离地配置数据处理器、图像处理器或编解码器。此外,这些元件可以配置为多个处理器,各处理器执行不同功能。外围接口1523将电子设备1500的各种外围设备与处理器1522和(经由存储器接口)存储器1510相连。
在本发明的示例性实施例中,处理器单元1520对提取的相应全局增益值进行滤波,连接提取的相应全局增益值,对相连的全局增益值进行归一化,并对归一化的值进行平滑。此外,通过使用移动平均方法对归一化的值进行平滑,确认经滤波的值的每个峰值,并且将确认的峰值与预设的三个区域中的任意一个进行匹配。此外,仅再现输入部分区域,分析音频流的波形以便仅自动跳到至少一个输入区域,并且顺序地仅再现自动跳到的部分。此外,确认经滤波的值的每个峰值,将确认的峰值与预设三个颜色中的任意一个进行匹配,并且仅再现输入部分区域。此外,分析色阶以便仅自动跳到至少一个输入区域,并且顺序地仅再现自动跳到的部分。
I/O系统1530包括触摸屏控制器1531和/或其他输入控制器1532。触摸屏控制器1531可以与触摸屏1540耦合。尽管并不局限于此,触摸屏1540和触摸屏控制器1530可以使用用于确定一个或多个接触点的电容、电阻、红外和表面声波技术以及使用包括其他接近传感器阵列或其他元件的任意多次触摸检测技术,检测其触摸、运动、或停留。其他输入控制器1532可以与其他I/O控制设备1550相连。其他I/O控制设备1550可以是一个或多个按钮、摇杆、开关、拇指旋轮、拨号盘、操纵杆、和/或诸如触控笔的指点器装置。
触摸屏1540提供电子设备1500和用户之间的输入/输出接口。例如,触摸屏1540将用户的触摸输入发送至电子设备1500。此外,触摸屏1540是向用户显示从电子设备1500输出的媒介。例如,触摸屏1540向用户显示视觉输出。这种视觉输出可以用文本、图形、视频、或它们的组合来表示。
本公开的另一实施例可以是一种操作电子设备的方法。所述方法包括:选择至少两个音频文件,并依次再现至少两个文件的独唱、引子、过渡和高潮部分中的每一个。这里,还可以执行针对至少两个音频文件的再现帧,以音频流波形图样来显示提取的全局增益值。该另一实施例可以使用之前在说明书中所述的方法:提取帧的全局增益值、对提取的全局增益值进行滤波、以及显示滤波后的值。
可以将多种显示器用作触摸屏1540。例如,尽管并不局限于此,触摸屏1540可以包括液晶显示器(LCD)、发光二极管(LED)、发光聚合物显示器(LPD)、有机发光二极管(OLED)、有源矩阵有机发光二极管(AMOLED)、或FLED(柔性LED)。在示例性实施例中,触摸屏1540显示滤波后的值、接收用于再现具体音频文件的命令并以音频流波形图样来显示音频文件的整个区域。此外,显示音频文件的整个区域以便将整个区域划分为独唱、引子、过渡和高潮(即,合唱)部分,接收用于仅再现区域的四个部分中任意一个的输入,选择存储的多个音频文件中的至少一个,并接收用于仅再现选定的至少一个音频文件中的至少一个的输入。此外,以色阶来显示音频文件的整个区域,以第一到第三颜色来显示音频文件的整个区域以便将整个区域划分为独唱、引子、过渡和高潮部分。此外,接收用于仅再现区域的四个划分部分中任意一个的输入,选择存储的多个音频文件中的至少一个,并接收用于仅再现选定的至少一个音频文件中的至少一个的输入。
音频子系统1560经由扬声器1561和麦克风(未示出)与用户进行通信。音频子系统1560经由处理器单元1520的外围接口1523接收数据流,并将接收的数据流转换为电流、将转换的电流传送到扬声器1561。扬声器1561将电流转换为人类用户能够听到的声波,并输出电流。音频子系统1560将接收的电流转换为音频数据流,并将转换的音频数据流发送到外围接口1523。音频子系统1560可以包括可连接和可拆卸的耳机、头戴式耳机或头戴送受话器等。
根据用于音频流的高速可视化的电子设备和方法,能够提供一种装置和方法,通过仅分析帧首部而不是对要再现的音频文件的全部数据进行完全解码,能够无时间延迟地进行音频流的高速可视化。
尽管参照本发明的特定示例性实施例示出和描述了本发明,但是对本领域技术人员应理解,在不脱离所附权利要求及其等效物所限定的本发明的精神和范围的前提下,可以对本发明进行各种形式和细节改变。
Claims (23)
1.一种操作电子设备的方法,所述方法包括:
从音频文件中包括的至少两帧中仅提取首部信息;
针对所述至少两帧中的每一帧,使用提取的帧首部信息来提取全局增益值,所述全局增益值是相应帧的数据的平均容量;
对提取的每个全局增益值进行滤波;并且
显示经滤波的值。
2.根据权利要求1所述的方法,其中对提取的每个全局增益值进行滤波包括:
连接提取的相应全局增益值;
对相连的全局增益值进行归一化;并且
对归一化的值进行平滑。
3.根据权利要求2所述的方法,其中对归一化的值进行平滑使用了移动平均方法。
4.根据权利要求1所述的方法,其中显示经滤波的值包括:
以音频流波形图样来显示音频文件的整个区域。
5.根据权利要求4所述的方法,其中以音频流波形图样来显示音频文件的整个区域包括:
显示音频文件的整个区域,以便将整个区域划分为包括独唱、引子、过渡和高潮在内的四个部分。
6.根据权利要求4所述的方法,其中显示整个区域以便将整个区域划分为四个部分包括:
确认经滤波的值的每个峰值;并且
将确认的峰值与预设的三个区域中的任意一个进行匹配。
7.根据权利要求5所述的方法,还包括:
接收用于仅再现区域的四个划分部分之一的输入;并且
仅再现所输入的区域部分。
8.根据权利要求5所述的方法,还包括:
接收从存储的多个音频文件中选择的至少一个音频文件;并且
接收用于仅再现所选择的所述至少一个音频文件区域中的至少一个区域的输入;
通过分析音频流的波形仅自动跳到输入的所述至少一个区域;并且
顺序地仅再现自动跳到的区域的部分。
9.根据权利要求1所述的方法,其中显示经滤波的值包括:
以色阶来显示音频文件的整个区域。
10.根据权利要求9所述的方法,其中以色阶来显示音频文件的整个区域包括:
以第一到第三颜色显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮部分。
11.根据权利要求10所述的方法,其中以第一到第三颜色显示音频文件的整个区域包括:
确认经滤波的值的每个峰值;并且
将确认的峰值与预设的三个颜色中的任意一个进行匹配。
12.根据权利要求10所述的方法,还包括:
接收用于仅再现区域的四个划分部分之一的输入;并且
仅再现所输入的区域部分。
13.根据权利要求10所述的方法,还包括:
接收从存储的多个音频文件中选择的至少一个音频文件;并且
接收用于仅再现所选择的所述至少一个音频文件区域中的至少一个区域的输入;
通过分析色阶仅自动跳到输入的所述至少一个区域;并且
顺序地仅再现自动跳到的区域的部分。
14.一种电子设备,包括:
存储软件模块的存储器,软件模块用于从音频文件中包括的至少两帧中提取首部信息,并针对所述至少两帧中的每一帧,通过使用提取的帧首部信息来提取全局增益值,所述全局增益值是相应帧的数据的平均容量;
用于对提取的每个全局增益值进行滤波并且执行所述软件模块的处理器单元;以及
触摸屏,用于显示经滤波的值。
15.根据权利要求14所述的电子设备,其中存储器包括:
辅助信息提取模块,用于从提取的帧首部信息中提取辅助信息;以及
滤波模块,用于使用包括在提取的辅助信息中的信息来提取全局增益值。
16.根据权利要求14所述的电子设备,其中处理器单元连接提取的相应全局增益值,对相连的全局增益值进行归一化,并且对归一化的值进行平滑。
17.根据权利要求14所述的电子设备,其中触摸屏显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮部分。
18.根据权利要求17所述的电子设备,还包括:
用于确认经滤波的值的每个峰值并将确认的峰值与预设的三个区域中的任意一个进行匹配的处理器单元。
19.根据权利要求17所述的电子设备,其中触摸屏接收用于仅再现区域的四个划分部分之一的输入,所述电子设备还包括用于仅再现所输入的区域部分的处理器单元。
20.根据权利要求14所述的电子设备,其中触摸屏接收从存储的多个音频文件中选择的至少一个音频文件,接收用于仅再现所选择的所述至少一个音频文件区域中的至少一个区域的输入,通过分析音频流的波形仅自动跳到输入的所述至少一个区域,并且顺序地仅再现自动跳到的区域的部分。
21.根据权利要求14所述的电子设备,其中触摸屏以第一到第三颜色显示音频文件的整个区域,以便将整个区域划分为独唱、引子、过渡和高潮部分。
22.一种操作电子设备的方法,所述方法包括:
选择至少两个音频文件;
依次再现所述至少两个音频文件的独唱、引子、过渡和高潮部分中的每一个。
23.根据权利要求22所述的方法,还包括:针对所再现的所述至少两个音频文件的帧,以音频流波形图样显示所提取的全局增益值。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0057533 | 2012-05-30 | ||
KR1020120057533A KR20130134195A (ko) | 2012-05-30 | 2012-05-30 | 오디오 스트림을 고속 시각화시키는 전자 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103456313A true CN103456313A (zh) | 2013-12-18 |
Family
ID=48576187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013101502299A Pending CN103456313A (zh) | 2012-05-30 | 2013-04-26 | 电子设备中用于音频流的高速可视化的装置和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130325154A1 (zh) |
EP (1) | EP2669893A3 (zh) |
KR (1) | KR20130134195A (zh) |
CN (1) | CN103456313A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598215A (zh) * | 2014-05-30 | 2015-05-06 | 小米科技有限责任公司 | 音频图形展示方法及装置 |
CN105931657A (zh) * | 2016-04-19 | 2016-09-07 | 乐视控股(北京)有限公司 | 音频文件的播放方法、装置及移动终端 |
CN106887240A (zh) * | 2015-12-15 | 2017-06-23 | 卓望数码技术(深圳)有限公司 | 一种基于iOS平台的音频处理方法、系统及iOS设备 |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10391241B2 (en) | 2010-01-22 | 2019-08-27 | Deka Products Limited Partnership | Syringe pump having a pressure sensor assembly |
US9789247B2 (en) | 2011-12-21 | 2017-10-17 | Deka Products Limited Partnership | Syringe pump, and related method and system |
US9677555B2 (en) | 2011-12-21 | 2017-06-13 | Deka Products Limited Partnership | System, method, and apparatus for infusing fluid |
US9295778B2 (en) | 2011-12-21 | 2016-03-29 | Deka Products Limited Partnership | Syringe pump |
US9744300B2 (en) | 2011-12-21 | 2017-08-29 | Deka Products Limited Partnership | Syringe pump and related method |
US10722645B2 (en) | 2011-12-21 | 2020-07-28 | Deka Products Limited Partnership | Syringe pump, and related method and system |
US11217340B2 (en) | 2011-12-21 | 2022-01-04 | Deka Products Limited Partnership | Syringe pump having a pressure sensor assembly |
US9675756B2 (en) | 2011-12-21 | 2017-06-13 | Deka Products Limited Partnership | Apparatus for infusing fluid |
US11295846B2 (en) | 2011-12-21 | 2022-04-05 | Deka Products Limited Partnership | System, method, and apparatus for infusing fluid |
JP1527512S (zh) * | 2013-02-22 | 2015-06-29 | ||
USD732062S1 (en) * | 2013-02-22 | 2015-06-16 | Samsung Electronics Co., Ltd. | Display screen or a portion thereof with graphical user interface |
TWD172232S (zh) * | 2013-03-13 | 2015-12-01 | 三星電子股份有限公司 | 行動通訊裝置之圖形化使用者介面 |
KR101518294B1 (ko) * | 2013-05-07 | 2015-05-07 | 주식회사 인코렙 | 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치 |
USD735319S1 (en) | 2013-06-11 | 2015-07-28 | Deka Products Limited Partnership | Medical pump |
USD767756S1 (en) | 2013-06-11 | 2016-09-27 | Deka Products Limited Partnership | Medical pump |
USD736370S1 (en) | 2013-06-11 | 2015-08-11 | Deka Products Limited Partnership | Medical pump |
USD768716S1 (en) * | 2013-12-20 | 2016-10-11 | Deka Products Limited Partnership | Display screen of a medical pump with a graphical user interface |
USD760782S1 (en) | 2013-12-20 | 2016-07-05 | Deka Products Limited Partnership | Display screen of a medical pump with a graphical user interface |
USD757772S1 (en) * | 2014-01-03 | 2016-05-31 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with graphical user interface |
RU2589851C2 (ru) * | 2014-08-26 | 2016-07-10 | Общество С Ограниченной Ответственностью "Истрасофт" | Система и способ перевода речевого сигнала в транскрипционное представление с метаданными |
USD760759S1 (en) * | 2014-09-01 | 2016-07-05 | Apple Inc. | Display screen or portion thereof with graphical user interface |
US10265463B2 (en) | 2014-09-18 | 2019-04-23 | Deka Products Limited Partnership | Apparatus and method for infusing fluid through a tube by appropriately heating the tube |
CN104575542A (zh) * | 2014-12-15 | 2015-04-29 | 天脉聚源(北京)科技有限公司 | 一种实现音频区域播放的方法及装置 |
USD781877S1 (en) * | 2015-01-05 | 2017-03-21 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with graphical user interface |
USD803386S1 (en) | 2015-02-10 | 2017-11-21 | Deka Products Limited Partnership | Syringe medical pump |
USD803387S1 (en) | 2015-02-10 | 2017-11-21 | Deka Products Limited Partnership | Syringe medical pump |
USD805183S1 (en) | 2015-02-10 | 2017-12-12 | Deka Products Limited Partnership | Medical pump |
USD801519S1 (en) | 2015-02-10 | 2017-10-31 | Deka Products Limited Partnership | Peristaltic medical pump |
AU2016101424A4 (en) * | 2015-09-08 | 2016-09-15 | Apple Inc. | Device, method, and graphical user interface for providing audiovisual feedback |
US9990113B2 (en) | 2015-09-08 | 2018-06-05 | Apple Inc. | Devices, methods, and graphical user interfaces for moving a current focus using a touch-sensitive remote control |
CN107068145B (zh) * | 2016-12-30 | 2019-02-15 | 中南大学 | 语音评测方法及系统 |
KR102431737B1 (ko) * | 2017-02-28 | 2022-08-11 | 삼성전자주식회사 | 멀티미디어 데이터에서 하이라이트를 찾는 방법 및 그를 이용한 장치 |
KR101794881B1 (ko) * | 2017-07-20 | 2017-11-07 | 박준희 | 그라디에이션을 이용하여 추가 정보를 제공하는 멀티미디어 플레이어 및 그의 제공 방법 |
US11567627B2 (en) | 2018-01-30 | 2023-01-31 | Magic Leap, Inc. | Eclipse cursor for virtual content in mixed reality displays |
US10540941B2 (en) | 2018-01-30 | 2020-01-21 | Magic Leap, Inc. | Eclipse cursor for mixed reality displays |
WO2019236344A1 (en) | 2018-06-07 | 2019-12-12 | Magic Leap, Inc. | Augmented reality scrollbar |
BR112021002737A2 (pt) | 2018-08-16 | 2021-06-08 | Deka Products Limited Partnership | bomba médica |
USD905730S1 (en) * | 2018-10-03 | 2020-12-22 | Allstate Insurance Company | Display screen with graphical user interface |
USD919653S1 (en) * | 2018-10-12 | 2021-05-18 | Vasona Networks, Inc. | Display screen or portion thereof with animated graphical user interface |
USD962981S1 (en) * | 2019-05-29 | 2022-09-06 | Magic Leap, Inc. | Display screen or portion thereof with animated scrollbar graphical user interface |
USD930696S1 (en) * | 2019-10-10 | 2021-09-14 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with transitional graphical user interface |
USD936093S1 (en) * | 2019-10-10 | 2021-11-16 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with transitional graphical user interface |
USD940742S1 (en) * | 2019-12-13 | 2022-01-11 | Ip.Com I, Llc | Portion of display screen with an icon |
USD1006038S1 (en) * | 2021-08-05 | 2023-11-28 | Adp, Inc. | Display screen or portion thereof with graphical user interface |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5634020A (en) * | 1992-12-31 | 1997-05-27 | Avid Technology, Inc. | Apparatus and method for displaying audio data as a discrete waveform |
CN1779777A (zh) * | 2005-08-16 | 2006-05-31 | 深圳市彩秀科技有限公司 | 一种通过截取音频波形进行音频编辑和转化的方法 |
US20080089668A1 (en) * | 2005-01-11 | 2008-04-17 | Yoshiharu Morita | Recording Apparatus |
US20100056128A1 (en) * | 2008-09-04 | 2010-03-04 | Samsung Electronics Co. Ltd. | Audio file edit method and apparatus for mobile terminal |
WO2010034063A1 (en) * | 2008-09-25 | 2010-04-01 | Igruuv Pty Ltd | Video and audio content system |
-
2012
- 2012-05-30 KR KR1020120057533A patent/KR20130134195A/ko not_active Application Discontinuation
-
2013
- 2013-03-19 US US13/847,090 patent/US20130325154A1/en not_active Abandoned
- 2013-04-24 EP EP13165204.2A patent/EP2669893A3/en not_active Withdrawn
- 2013-04-26 CN CN2013101502299A patent/CN103456313A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5634020A (en) * | 1992-12-31 | 1997-05-27 | Avid Technology, Inc. | Apparatus and method for displaying audio data as a discrete waveform |
US20080089668A1 (en) * | 2005-01-11 | 2008-04-17 | Yoshiharu Morita | Recording Apparatus |
CN1779777A (zh) * | 2005-08-16 | 2006-05-31 | 深圳市彩秀科技有限公司 | 一种通过截取音频波形进行音频编辑和转化的方法 |
US20100056128A1 (en) * | 2008-09-04 | 2010-03-04 | Samsung Electronics Co. Ltd. | Audio file edit method and apparatus for mobile terminal |
WO2010034063A1 (en) * | 2008-09-25 | 2010-04-01 | Igruuv Pty Ltd | Video and audio content system |
Non-Patent Citations (1)
Title |
---|
RASSOL RAISSI: "The Theory Behind Mp3", 《HTTP://WWW.MP3-TECH.ORG/PROGRAMMER/DOCS/MP3_THEORY.PDF》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598215A (zh) * | 2014-05-30 | 2015-05-06 | 小米科技有限责任公司 | 音频图形展示方法及装置 |
CN104598215B (zh) * | 2014-05-30 | 2018-01-05 | 小米科技有限责任公司 | 音频图形展示方法及装置 |
CN106887240A (zh) * | 2015-12-15 | 2017-06-23 | 卓望数码技术(深圳)有限公司 | 一种基于iOS平台的音频处理方法、系统及iOS设备 |
CN105931657A (zh) * | 2016-04-19 | 2016-09-07 | 乐视控股(北京)有限公司 | 音频文件的播放方法、装置及移动终端 |
Also Published As
Publication number | Publication date |
---|---|
EP2669893A3 (en) | 2014-01-22 |
EP2669893A2 (en) | 2013-12-04 |
US20130325154A1 (en) | 2013-12-05 |
KR20130134195A (ko) | 2013-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103456313A (zh) | 电子设备中用于音频流的高速可视化的装置和方法 | |
US11327712B2 (en) | Information processing device, information processing method, information processing program, and terminal device | |
CN101241414B (zh) | 具有触摸屏的多媒体播放装置的用户接口方法 | |
KR101419701B1 (ko) | 멀티미디어 재생장치에서 멀티 터치를 이용한 재생 제어 방법 | |
JP6702451B2 (ja) | 車載装置、車載装置の制御方法および制御プログラム | |
KR101954794B1 (ko) | 영상 표시 장치에서 멀티미디어 컨텐츠의 재생구간을 탐색하기 위한 장치 및 방법 | |
KR20170124933A (ko) | 디스플레이 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 | |
CN101889261A (zh) | 提供能够检测菜单或背景上的多种形式的触摸的ui的方法及使用该方法的多媒体装置 | |
KR20090029138A (ko) | 동작에 의한 사용자 명령 입력 방법 및 이를 적용한멀티미디어 기기 | |
CN103257821A (zh) | 图像显示设备中改变字幕属性的装置和方法 | |
CN102841742A (zh) | 用于多媒体内容播放的方法和设备 | |
CN100432912C (zh) | 便携式电子设备及其显示方法和图形用户接口装置 | |
KR102337157B1 (ko) | 전자 칠판 장치 및 그 제어 방법 | |
JP6477822B2 (ja) | 端末装置、端末装置の制御方法および制御プログラム | |
JP6069927B2 (ja) | コンテンツ表示装置、コンテンツ表示方法およびプログラム | |
WO2006052076A1 (en) | Method and apparatus for playing multimedia content | |
US10420190B2 (en) | Audio apparatus, driving method for audio apparatus, and computer readable recording medium | |
KR102040851B1 (ko) | 휴대단말기의 키 입력 방법 | |
KR20070120359A (ko) | 음파 크기 디스플레이 장치 및 그 방법 | |
JP6332433B2 (ja) | コンテンツ表示装置、コンテンツ表示方法およびプログラム | |
CN101132582B (zh) | 在无线终端中输入数据的方法及执行该方法的无线终端 | |
JP5328047B2 (ja) | オーディオ情報検索装置 | |
JP2020191641A (ja) | 端末装置 | |
JP2007073153A (ja) | 再生装置及び再生方法 | |
KR20120138312A (ko) | 음악 재생기에서 음원을 재생하는 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131218 |