CN103187046A - 显示控制装置及方法 - Google Patents

显示控制装置及方法 Download PDF

Info

Publication number
CN103187046A
CN103187046A CN2012105801064A CN201210580106A CN103187046A CN 103187046 A CN103187046 A CN 103187046A CN 2012105801064 A CN2012105801064 A CN 2012105801064A CN 201210580106 A CN201210580106 A CN 201210580106A CN 103187046 A CN103187046 A CN 103187046A
Authority
CN
China
Prior art keywords
attribute
display control
data
value
control section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105801064A
Other languages
English (en)
Other versions
CN103187046B (zh
Inventor
大岛治
永田资司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of CN103187046A publication Critical patent/CN103187046A/zh
Application granted granted Critical
Publication of CN103187046B publication Critical patent/CN103187046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B31/00Arrangements for the associated working of recording or reproducing apparatus with related apparatus
    • G11B31/02Arrangements for the associated working of recording or reproducing apparatus with related apparatus with automatic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/005Non-interactive screen display of musical or status data
    • G10H2220/015Musical staff, tablature or score displays, e.g. for score reading during a performance.

Abstract

本发明为显示控制装置及方法,控制部分(10)对声音数据进行分析以获取表示多个属性(如音高和音量)的数据,并在显示屏幕(40)上显示表示所获取的音高和音量的图形。此时,控制部分(10)在显示屏幕上显示音高曲线,其中音高的值由垂直轴代表,而时间的经过由水平轴代表。此外,显示控制部分还基于音高曲线的显示位置在显示屏幕上的特定位置处显示音量图形,其中音量电平由音量图形在垂直轴方向上的长度或距离或宽度来代表。

Description

显示控制装置及方法
技术领域
本发明涉及对通过声音数据(如歌声数据)拥有的诸如音高和音量的多种属性进行可视显示的显示控制装置和方法。
背景技术
迄今已提出了各种卡拉OK装置,其具有对歌手的歌唱技巧或表现评分的功能。此外,在这样的卡拉OK装置中,亦已提以易于歌手掌握或理解的方式来利用代表乐曲旋律的可视图形形式来显示乐曲的旋律和歌手的演唱并且允许歌手检验其演唱表演的功能。另外,日本专利申请公开第2004-139124号(下文中称为“相关专利文献”)中公开了一种技术,用于不仅在五线谱上显示表示乐曲旋律的音符,还显示表示每个音符的音量变化和音高变化的图像或图形。
人声总会有音高和音量变化。不过根据相关专利文献中公开的技术,仅可以针对每个音符图示一条附加信息(即属性);即无法针对每个音符图示多个属性(如音高和音量)。
发明内容
鉴于上述现有技术中的问题,本发明的一个目的是提供一种技术,通过易于用户掌握属性的方式显示通过声音数据拥有的多个属性。
为了实现上述目的,本发明提供了一种改进的显示控制装置,其包括:获取部分,其配置为获取表示声音数据的两个或更多个属性的属性数据;显示控制部分,其配置为执行控制以显示由获取部分获取的两个或更多个属性数据所表示的属性的值随时间的变化,其中,在具有表示时间经过的第一轴和与所述第一轴相交的第二轴的坐标平面上,所述显示控制部分通过沿所述第二轴的坐标位置来显示所述两个或更多个属性中的第一属性的值,并且显示第一图形,在该第一图形中通过在所述第二轴的方向上延伸的长度来表示所述两个或更多个属性中的第二属性的值。根据以上述方式配置的本发明,能够以易于用户掌握属性的方式显示声音数据中包含的多个属性。
在本发明的一个优选实施例中,所述显示控制部执行控制以与上述坐标位置相关联地显示表示第一属性的值的第二图形。
在本发明的另一个优选实施例中,所述显示控制部执行控制以通过如下方式显示第一图形,其中使得在第一图形中表示第一属性的值的坐标位置位于所述第二轴方向上的中心或上端或下端。
在本发明的另一个优选实施例中,显示控制装置还包括接收部分,其配置为接收表示第一属性的模型值的模型属性数据,并且所述显示控制部执行控制以在所述坐标平面上显示代表由所述模型属性数据所表示的模型值的图形。
本发明不仅可以构造和实现为如上面所讨论的产品发明,还可以构造和实现为方法发明。此外,本发明可以被配置和实现为由处理器(诸如计算机或DSP)执行的软件程序,以及被配置和实现为存储这样的软件程序的非临时性存储介质。在这种情况下,该程序可以在存储介质中提供给用户,然后安装到用户的计算机,或从服务器装置通过通信网络传输到客户端的计算机,然后安装到客户端的计算机中。另外,在本发明中所使用的处理器可以包括具有内置在硬件中的专用逻辑的专用处理器以及能够运行期望的软件程序的计算机或其他通用处理器。
下面将描述本发明的实施例,但应理解本发明并不限于所描述的实施例,在不脱离基本原理的情况下可以实现本发明的各种变型。因此,本发明的范围仅由所附的权利要求确定。
附图说明
下文中将参照附图仅以示例的方式对本发明的某些优选实施例进行详细描述,其中:
图1是示出采用本发明实施例的系统的总体构造的示图;
图2是示出了图1系统中卡拉OK装置的硬件结构的框图;
图3是示出了图1系统中卡拉OK装置的功能配置示例的框图;
图4是示出了图1系统中卡拉OK装置的评分部分的功能配置示例的框图;
图5是示出在该卡拉OK装置的显示部分上显示的屏幕的示例的示图;
图6是示出了由该卡拉OK装置的控制部分所执行的示例操作序列的流程图;
图7是示出在显示部分上显示的屏幕示例的示图;
图8是示出在显示部分上显示的另一屏幕示例的示图;和
图9是表示在显示部分上显示的又一屏幕示例的示图。
具体实施方式
<实施例的总体构造>
图1是示出采用本发明实施例的系统的构造示图。该系统包括卡拉OK装置100、服务器装置200和网络NW。该卡拉OK设备100被构造成不仅根据用户的请求再现卡拉OK乐曲,还评价用户按照再现的卡拉OK乐曲的演唱。该卡拉OK装置100是本发明的显示控制装置的一个实施例。网络NW是用于在卡拉OK装置100和服务器装置200之间进行数据通信的LAN(局域网)或因特网。服务器装置200具有内部提供或外部提供的存储部分,如HDD(硬盘驱动器),其中存储有诸如与卡拉OK乐曲的内容数据有关的各种数据,并且服务器装置200构造成根据用户的请求将内容数据提供给卡拉OK装置100。在这里,每一个“内容”项包括卡拉OK乐曲的音频和视频的组合。即,每项内容数据包括所谓的伴奏数据和视频数据,伴奏数据表示乐曲旋律中除了歌声之外的伴奏和合唱,视频数据表示该乐曲的歌词和要在歌词的背景上显示的视频。注意,针对一个服务器装置200可能存在多个卡拉OK装置100。相反,针对一个卡拉OK装置100可能存在多个服务器装置200。注意,本文所用的术语“声音”是指任何不同类型的声音,例如人发出的话音和乐器的演奏声音。
图2是示出了图1系统中卡拉OK装置100的硬件结构的框图。如图所示,该卡拉OK装置100包括:控制部分10、存储部分20、操作部分30、显示部分40、通信控制部分50、声音处理部分60、麦克风61和扬声器62,各部分经由总线70互连。控制部分10包括CPU(中央处理单元)、RAM(随机存取存储器)、ROM(只读存储器)等。在控制部分10中,CPU通过读取存储在ROM或存储部20中的计算机程序并将读出的计算机程序加载到RAM来控制卡拉OK装置100的各部分。
操作部分30包括各种操作器,并将指示用户的各种操作的操作信号输出到控制部分10。显示部分40包括例如液晶面板,并且在控制部分10的控制下,显示部40显示对应于各卡拉OK乐曲的各种图像,如歌词字幕(telop)和背景视频。通信控制部分50以有线或无线方式将卡拉OK装置100和网络NM互连,并且控制卡拉OK装置100和服务器装置200之间经过网络NM进行的数据通信。
服务器装置200是包括CPU和各种存储器(图中未示出)的计算机;特别是,服务器装置200包括网络存储器210。网络存储器210是例如硬盘驱动器(HDD),其中存储例如卡拉OK乐曲的内容数据的各种数据。尽管图2所示的服务器装置200包括一个网络存储器210,但网络存储器210的数目并不限于此,服务器装置200可以包括多个网络存储器210。在由用户预订的卡拉OK乐曲的内容数据预先存储在网络存储210中的情况下,卡拉OK装置100在通信控制部分50的控制下与服务器装置200通信以执行流再现,其中在通过网络NW下载从网络存储器210读出的内容数据时,卡拉OK装置100顺序地再现内容数据的下载部分。
麦克风61将表示所拾取语音的音频信号输出到声音处理部分60。声音处理部分60包括A/D(模拟数字)转换器,用于将模拟音频信号转换成数字声音数据,并将数字声音数据输出到控制部分10,从而控制部分10接收数字声音数据。声音处理部分60还包括D/A(数字模拟)转换器,用于将从控制部分10接收的数字声音数据转换成模拟音频信号,并将转换后的模拟音频信号输出至扬声器62,从而扬声器62基于从声音处理部分60接收的模拟音频信号来可听地输出声音。注意,尽管本实施例中是针对麦克风61和扬声器62包含在卡拉OK装置100中的情况进行描述,但也可以在声音处理部分60内仅提供输入和输出端子,而不在该卡拉OK装置100中包括麦克风61和扬声器62;在这种情况下,外部麦克风可以通过音频电缆连接到声音处理部分60的输入端子,而外部扬声器可以通过音频电缆连接到声音处理部分60的输出端子。另外,尽管在本实施例中针对从麦克风61输出至扬声器62的音频信号是模拟音频信号的情况进行了描述,但也可以输出和输入数字音频信号。在这种情况下,不需要声音处理部分60来执行A/D转换和D/A转换。类似地,操作部分30和显示部分40也可以包括各自的外部输出端子,用于将其连接至外部监视器。
存储部分20是用于在其中存储各种数据的存储装置,例如硬盘驱动器或非易失性存储器。存储部分20包括多个存储区域,如伴奏数据存储区域21、视频数据存储区域22、引导旋律(以下称作“GM”)数据存储区域23和用户歌声数据存储区域25。
伴奏数据存储区域21中已预先存储了与表示各种乐曲的伴奏声音的伴奏数据有关的信息。每个伴奏数据(如MIDI(乐器数字接口)格式的数据文件)均被赋予了乐曲相关的信息,诸如唯一地识别所关注乐曲的乐曲编号和表示乐曲的名称的乐曲名称。视频数据存储区域22中预先存储了表示各种乐曲的歌词的歌词数据和表示要在歌词的背景上显示的背景视频的背景视频数据。在唱卡拉OK时,在显示部分40上随着乐曲的进行而将歌词数据所表示的歌词显示为歌词字幕。在唱卡拉OK时,在显示部分40上随着乐曲的进行而将背景视频数据所表示的背景图像显示为歌词字幕的背景。GM数据存储区域23中预先存储了表示乐曲的人声部分旋律的数据,即作为指定了要演唱的组成音符的数据的引导旋律数据(下文中称作“GM数据”)。也即,例如以MIDI格式描述的GM数据表示模型声音音高。这种GM数据被控制部分10用作在评估用户的演唱技巧或乐曲演奏时的比较标准或基准。由控制部分10执行的评价处理将在后文详细描述。
用户歌声数据存储区域25中存储了通过声音处理部分60将在相应伴奏数据的再现期间通过麦克风61拾取的用户歌声转换成数字数据所生成的针对卡拉OK演唱的每个乐曲的声音数据。在下文中将被称为“用户歌声数据”的这些声音数据存储为例如WAVE格式(RIFF波形音频格式)的数据文件。通过控制部分10将各个乐曲的用户歌声数据与乐曲的GM数据相关联。
图3是示出了卡拉OK装置100的功能配置示例的框图。在图3中,通过控制部分10的CPU读取预先存储在ROM或存储部分20中的计算机程序并将读出的计算机程序加载到RAM中,来实现再现部分11和评分部分12。再现部分11再现卡拉OK乐曲。具体而言,再现部分11不仅基于伴奏数据和GM数据可听地通过扬声器62输出声音,还基于视频数据通过显示部分40显示视频。
评分部分12对表示用户(歌手)的歌声的声音数据(用户歌声数据)进行评价。即,评分部分12根据歌声的音高和GM数据的音高之间的差异来评价用户的演唱表现。
图4是示出了评分部分12的功能配置示例的框图。在图4中,分析部分(属性数据获取部分)121针对两个或更多个语音(声音)属性分析用户歌声数据,并输出表示所分析的属性的属性数据。在本实施例中,将音高和音量用作语音属性(即,分别为第一和第二属性)。分析部分(属性数据获取部分)121包括音高获取部分121a和音量获取部分121b。音高获取部分121a分析存储在用户歌声数据存储区域25中的用户歌声数据,以检测歌声的音高。音高获取部分121a输出表示检测到的音高的数据(下文中称作“音高数据”)。音量获取部分121b检测存储在用户歌声数据存储区域25中的用户歌声数据的音量。音量获取部分121b输出表示检测到的音量的数据(下文中称作“音量数据”)。
比较部分122对通过音高获取部分121a获取的用户歌声数据的音高与GM数据的音高进行比较,并根据比较的音高之差来对用户歌声数据执行评分处理。更具体地,例如,在比较部分122对用户歌声数据所表示的语音的音高变化与GM数据所表示的引导旋律的音高变化进行比较,然后计算表示所比较的音高变化之间的一致程度的评价值。例如,对于一个给定的音符,如果音高差落在一个预定的允许范围之内,则评价值可以被计算为100%(意味着没有缺点或扣分点),或者如果音高差未落在预定的允许范围之内的时间段的长度是GM数据中音符的一半声音长度,则评价值可以被计算为50%。即,通过将音高差落在预定的允许范围之内的时间段的长度除以GM数据中音符的声音长度来计算音符的评价值。控制部分10基于所计算的评价值来确定扣分点。例如在对给定的音符预先分配了“二点”并且评价值计算为50%的情况下,控制部分10确定“1点”作为扣除点。或者,比较部分122也可以考虑通过音量获取部分121b获取的用户歌声数据的音量来执行评分处理。
显示控制部分123上在显示部分40上显示由比较部分122输出的评分结果。显示控制部分123不仅用作接收从分析部分121输出的属性数据的接收部分,还作为显示控制部分,用于在显示部分40上显示由所接收的属性数据表示的两个或更多的语音属性的值随着时间的变化(随时间变化)。以下参照附图描述由显示控制部分123执行的显示控制处理。
图5是示出了在显示控制部分123的控制下在显示部分40上显示的屏幕的示例的示图。在图5的屏幕中,横轴表示时间的经过,而垂直轴表示音高,该屏幕被构造成在具有表示时间经过的第一轴(水平轴)和与第一轴相交的表示音高的第二轴(垂直轴)的二轴坐标平面上进行与属性数据有关的显示。图中的每个实线300表示一个音符的用户歌声数据随时间的音高变化,并且将在下文称为“音高曲线300”。即,显示控制部分123利用沿着第二轴(音高轴)的坐标位置指示通过音高获取部分121a获取的音高(第一属性)的值。所指示的音高值的随时间变化构成了音高曲线300。如将在稍后描述的,音高曲线300作为在显示部分40上显示每个时间点的音量值(第二属性)的基准。在本实施例中,垂直轴(第二轴)用作音高轴和音量轴二者。即,音高(第一属性)的值由沿垂直轴(第二轴)的绝对值表示,而音量(第二属性)的值由沿着垂直轴(第二轴)的相对值表示,即由基于与该音量对应的坐标位置的相对值来表示。
此外,通过从音高曲线300在每个时间点的坐标位置在垂直轴方向上(即,所述第二轴的方向)延伸的长度,显示控制部分123显示表示该时间点的音量(第二属性)的值的音量图形(第一图形)500。在这种情况下,按照以音高曲线300在垂直轴方向上的绝对坐标位置作为音量图形500的中心坐标位置方式,显示控制部分123通过音高曲线300的相对值的方式显示音量图形500。作为示例,以模拟音量幅度波形的正负包络在幅度中心的正负方向上摆动的方式来显示音量图形(第一图形)500。即,音量图形500具有相对于音高曲线300竖直对称的形状,并且音量图形500在垂直轴方向上更大的振幅表示更大的音量。注意,在图5所示的示例中,音高曲线300不仅显示为基准,还用作可视曲线图形(第二图形)以可视地表示音高(第一属性)的值。
另外,在图5中,每个带形图形400表示GM数据(模型属性数据)的音高,并将在下文中将其称为“GM图形400”。GM数据(模型属性数据)表示音高(第一属性)的模型值。显示控制部分123还用作接收GM数据(模型属性数据)的接收部分。显示控制部分123在沿垂直和水平轴的位置(坐标)处显示代表由接收的GM数据表示的GM图形400。此外,显示控制部分123在图5的屏幕上靠近相应的GM图形400处显示表示歌词600的字母图形(以下称为“歌词图形600”)来作为相关信息。可替换地,显示控制部分123可以显示重叠或叠加到GM图形400中的歌词图形600。
<行为>
图6为示出由控制部分10执行的示例操作序列的流程图。一旦用户选择的乐曲被用户经由操作部分30预订(步骤S100中的肯定确定),则在步骤S102,控制部分10在存储部分20中搜索预订的乐曲。更具体地说,在步骤S102中,使用所选乐曲的乐曲编号或名称作为搜索关键词,控制部分10在伴奏数据存储区域21、视频数据存储区域22和GM数据存储区域23中搜索与乐曲相关的数据,并且将通过搜索搜出的数据(搜索出的数据)读出到RAM中。
然后,在步骤S104中,控制部分10基于上述存储在RAM中的伴奏数据、视频数据和GM数据再现卡拉OK乐曲。更具体地说,在步骤S104,控制部分10不仅基于伴奏数据和GM数据通过扬声器62可听地再现声音,还在显示部40上基于视频数据显示视频。然后,在步骤S106,控制部分10将声音处理部分60将通过麦克风61拾取的用户歌声转换成数字数据所生成的用户歌声数据存储到用户歌声数据存储区域25中。然后在步骤S108,在完成卡拉OK乐曲的再现后,控制部分10基于存储在用户歌声数据存储区域25中的用户歌声数据和GM数据对用户的演唱评分。然后在步骤S110,控制部分在显示部分40上显示用户的演唱评分结果。
在步骤S110中,控制部分10在显示部分40上显示表示评分结果的字母/字符和图像,以及图5所示的歌声的分析结果。在图5所示的屏幕上,使用共同的时间轴同时显示多个属性(音高和音量),来作为歌声的分析结果。由于音量是由叠加在音高曲线300上显示的音量图形500的显示宽度来表示的,因此用户通过用眼跟随音高曲线300可以很容易地直观掌握音量和音高二者。
<变型例>
上述实施例可以如下做出各种修改,并且这些变型例可以按需组合实施。
<变型例1>
尽管上面已经针对由控制部分10进行分析的声音属性为音量和音高的情况描述了优选实施例,不过由控制部分10分析的语音(声音)的属性可以是音量和音高之外的任何其它属性,如清晰发音或清晰度和声音产生定时(发声定时),只要该语音属性可以代表语音的特征或属性即可。在将语音的清晰度用作要分析的属性的情况下,例如,控制部分10可以使用FFT(快速傅立叶变换)技术从语音检测频谱,并基于电平变化出现共振峰的位置处的电平(即共振峰电平)与电平变化出现低谷的位置处的电平(低谷电平)之间的比例来计算清晰度。更具体地说,控制部分10可以例如执行清晰度计算处理,使得共振峰电平对低谷电平之比越大,则清晰度越高。此外,在将声音产生定时或发声定时用作要进行分析的属性的情况下,控制部分10可以从用户歌声数据检测每个歌词音素(音符)的发声定时并显示一个图形,在该图形中,检测到的发声定时和模型发声定时(由GM数据表示)之间的差值越大,则在垂直轴方向上的显示宽度越大。
<变型例2>
尽管在本实施例中将控制部分10描述为在显示部分40上显示彼此叠加的音高曲线300、GM图形400和音量图形500,但本发明并不限于此,控制部分10还可以显示彼此叠加的音高曲线300和音量图形500,而不显示GM图形400,如图7所示意性示出的。作为另一种替代方案,控制部分10可以仅显示音量图形500而不显示音高曲线300和GM图形400。另外,尽管上述实施例中的控制部分10被描述为除了音高曲线300、GM图形400和音量图形500,还显示表示歌词的歌词图形600,如图5所示,但控制部分10可以构造为不显示歌词图形。
<变型例3>
在上述实施例中,分析部分121被提供为控制部分10中的属性数据获取部分,用于分析用户歌声数据来生成表示歌声属性的属性数据,并由此获取属性数据。然而,本发明不限于此,控制部分10中的属性数据获取部分可以被构造成从经由通信网络连接的服务器装置等获取或接收属性数据,而不由控制部分10通过用户歌声数据分析来生成属性数据。
<变型例4>
此外,在上述实施例中,控制部分10构造为相对于音高曲线300垂直对称的显示音量图形500,即音量图形500具有位于音高曲线300的中心的向上和向下的垂直宽度。然而,音量图形500的显示并不限于此,控制部分10可以仅在音高曲线300上方显示音量图形500,如图8所示。在图8所示的示例中,音量电平由音量图形500的垂直宽度指示,因此,和上述实施例一样,音量图形500中更大的垂直宽度表示更大的音量电平。即,控制部分10可以通过使基准属性的坐标位置位于一个表示其它属性的图形的轴向上的中心或上端或者下端的方式,来显示表示与作为显示基准的属性(即,基准属性(在本实施例中为音高))不同的另一属性的图形。作为另一替代方案,音高曲线300和音量图形500可以如下方式彼此间隔预定距离进行显示,其中音高曲线300和音量图形500的显示位置在垂直轴方向上偏移预定的距离。控制部分10可以被构造为任何期望的方式,只要其通过沿着与表示时间经过的第一轴相交的第二轴的坐标来显示第一属性的值,并且通过在第二轴向上从该坐标位置(即上述实施例中音高曲线300的坐标位置)延伸的长度来显示表示第二属性的值的图形。
此外,尽管上述实施例已经针对显示两种类型的属性(即音量和音高)的情况进行了描述,但要显示的属性的数量并不限于两个,还可以是两个以上。例如,如图9所示,控制部分10可以使用共同的时间轴显示三种类型的属性,如音量、音高和清晰度。在图9示出的图像中,音高曲线300与上述实施例中的类似,音量图形500在垂直轴方向上显示在音高曲线300的上方,并且通过音量图形500在垂直方向上的宽度来表示音量电平。另外,在图9中,清晰度图形700代表语音的清晰度,来作为表示第三属性的值的第三图形;清晰度由清晰度图形700在垂直方向上的宽度来表示。清晰度图形700在垂直方向上的更大宽度表示更高的清晰度。以音高曲线300作为基准,清晰度图形700显示在音高曲线300的下方。此外,在要显示的属性的数量是三个或更多的情况下,所述三个或更多个属性中的任意两个可以显示在音高曲线300的上方和下方,并且所述三个或更多个属性中的另外一个可以在距离该音高曲线预定的距离处进行显示。
此外,尽管上述优选实施例以音高曲线300为基准位置(即基于音高曲线300的位置)显示音量图形500,但基准属性不限于音高,还可以是语音的任何其它适当的属性。例如,以水平轴表示时间并以垂直轴表示音量的音量曲线可以用作基准位置,并且通过在垂直轴方向上的显示宽度来表示音高的音高图形可以与音量曲线重叠地进行显示。总之,控制部分100只需要在由水平轴表示时间的经过并且由垂直轴表示第一属性的坐标平面上的位置处显示基准图形,并且在与参考图形的坐标位置对应的位置处显示由垂直轴方向上的长度来表示第二属性的值的图形。
此外,上述优选实施例描述为使用通过在垂直轴方向上的长度来表示音量(第二属性)的值的音量图形。作为一个变型例,该音量图形可以由通过颜色(色调、色深等)表示音量(第二属性)的值的音量图形来代替。在这种情况下,控制部分10可以如下方式显示音量图形500,其中图形500的颜色随着音量增大而变深,并且随着音量降低而变浅。或者,控制部分10可以以这样的方式显示音量图形500,其中随着音量增大而使图形500的颜色变得更偏红(通过在减少其他颜色元素的亮度的同时,增加红色元素的亮度),并随着音量降低而变得更偏蓝(通过在减少其他颜色元素的亮度的同时增加蓝色元素的亮度)。在这种情况下(即与上述实施例中一样),控制部分10在与音高曲线300的坐标对应的位置处显示图形。另外,在这种情况下,各个音量图形500在形状和尺寸上可以相同也可以不相同,也就是说,各个音量图形500之间在形状和尺寸上可以相同也可以不相同。即,在一个变型例中,通过沿垂直轴向的长度来表示音量(第二属性)的值的显示音量图形的方案可以与通过颜色(色调、色深等)表示音量的值的显示音量图形的方案组合;也即,可以通过形状和尺寸变化以及颜色变化的组合来显示音量图形。
此外,尽管上述优选实施例描述为以水平轴为时间轴并且以垂直轴为音高轴来显示音高曲线300与音量图形500,但本发明不限于此,可以任何其它方式设置水平轴和垂直轴,只要控制部分10能够以一个轴向上的显示位置表示基准属性的值并且通过时间轴表示时间经过来显示图形即可。
<变型例5>
在上述优选实施例中,控制部分10构造为将用户歌声数据存储到用户歌声数据存储区域25中,并且在用户演唱终止时执行分析结果显示处理。然而,本发明并不限于此,控制部分10可以在用户演唱期间实时执行分析结果显示处理。
另外,在上述优选实施例中,控制部分10不仅构造为再现卡拉OK乐曲和记录用户的歌声,还可以构造为在卡拉OK乐曲的再现终止时分析用户歌声数据来显示所分析的结果(即,用户歌声数据分析的结果)。然而,本发明不限于此,控制部分10可以被构造来对先前记录的用户歌声数据(即,预先存储在存储部分20中的语音数据)执行分析结果显示处理,然后执行分析结果显示处理。
此外,尽管上述优选实施例中的控制部分10被构造用来比较歌声的音高和GM数据的音高,并基于比较结果执行评价处理,但该评价处理还可以任何其他期望的方式执行。例如,控制部分10可以针对给定的评价项利用任何常规已知的方案(如使用FFT等的频率分析或音量分析)计算出评价值(即评价结果)。
此外,尽管在上述实施例中将控制部分10构造为对用户(歌手)的歌声进行分析,但控制部分10还可以分析和评价由用户演奏乐器所产生的演奏声音,而不是用户的歌声。即,如上所述,本文所用的术语“声音”是指任何类型的声音,例如人发出的语音以及通过乐器产生的演奏声音。
<变型例6>
作为另一变型例,经由通信网络相互连接的两个或多个装置可以共享本发明的优选实施例的卡拉OK装置100的功能,因此包括这些装置的系统可以实现该卡拉OK装置100。例如,包括麦克风、扬声器、显示装置、操作部分等的计算机装置以及执行声音分析处理的服务器装置可以经由通信网络相互连接构成一个系统。在这种情况下,计算机装置可将通过麦克风拾取的每个声音转换成音频信号,并将该音频信号发送到服务器装置,服务器装置可以分析所接收到的音频信号并将分析结果发送到计算机装置。
<变型例7>
此外,尽管上述实施例已经描述了将本发明的显示控制装置应用到不仅再现卡拉OK伴奏也对歌声评分的卡拉OK装置的情况,但本发明的显示控制装置还可以应用到卡拉OK装置以外的任何其他装置,只要该其他装置是对声音数据进行分析并对声音数据的分析结果进行显示的装置即可。即,本发明的显示控制装置可以适用于各种类型的装置,如显示声音分析结果的装置、进行声音合成和编辑的装置、以及具有支持语言学习功能的装置。在本发明的显示控制装置被应用到声音编辑装置中的情况下,例如通过使用共同的时间轴同时显示多个声音属性,用户可以直观地掌握多个声音属性,因此便于声音合成和编辑。
此外,尽管上述实施例已经描述了使用GM数据作为表示模型声音属性的模型属性数据,但GM数据以外的其他数据也可以用作模型属性数据。例如,在将本发明的显示控制装置应用到声音编辑装置的情况下,可以通过将分析结果舍入到12音阶所获得的数据用作模型属性数据。在这种情况下,与上述优选实施例相似,控制部分10显示表示所分析的属性的图形以及表示模型属性数据的图形,如图5所示。简言之,模型属性数据可以是任意数据,只要它表示模型声音的属性即可。
<变型例8>
本发明可以不仅实现为显示控制装置,还可以作为实现这样的显示控制装置的方法和用于使计算机实现显示控制功能的程序。该程序可以被提供在其中存储程序的存储介质(如光盘)中,或者可以通过互联网等被下载和安装到计算机来提供。

Claims (13)

1.一种显示控制装置,包括:
获取部分,其配置为获取表示声音数据的两个或更多个属性的属性数据;
显示控制部分,其配置为执行控制,以在显示部分上显示通过所述获取部分获取的属性数据所表示的两个或更多个属性的值随时间的变化,其中在具有表示时间经过的第一轴和与所述第一轴相交的第二轴的坐标平面上,所述显示控制部分通过沿所述第二轴的坐标位置来显示所述两个或更多个属性中的第一属性的值,并且显示第一图形,在该第一图形中通过在所述第二轴的方向上延伸的长度来表示所述两个或更多个属性中的第二属性的值。
2.如权利要求1所述的显示控制装置,其中所述显示控制部分执行控制以与所述坐标位置相关联地显示表示第一属性的值的第二图形。
3.如权利要求1或2所述的显示控制装置,其中所述显示控制部分执行控制以通过如下方式显示所述第一图形,其中使得在所述第一图形中表示第一属性的值的坐标位置位于所述第二轴方向上的中心或上端或下端。
4.如权利要求1或2所述的显示控制装置,还包括接收部分,其配置为接收表示所述第一属性的模型值的模型属性数据,并且
其中所述显示控制部分执行控制以在所述坐标平面上显示代表由所述模型属性数据所表示的模型值的图形。
5.如权利要求4所述的显示控制装置,其中所述显示控制部分还执行控制以在代表由所述模型属性数据所表示的模型值的图形附近显示相关信息。
6.如权利要求1或2所述的显示控制装置,其中所述显示控制部分执行控制以使得表示所述第一属性的值的坐标位置和所述第二图形的显示位置在所述第二轴的方向上彼此偏移预定的距离。
7.如权利要求1或2所述的显示控制装置,其中所述显示控制部分执行控制以使得表示所述第一属性的值的坐标位置在所述第二轴的方向上显示在所述第一图形的上方或下方,或者叠加在所述第一图形上。
8.如权利要求7所述的显示控制装置,其中所述显示控制部分执行控制以使得表示所述第一属性的值的坐标位置和所述第二图形的显示位置在所述第二轴的方向上彼此偏移预定的距离。
9.如权利要求1或2所述的显示控制装置,其中所述显示控制部分执行控制以与表示所述第一属性的值的坐标位置相关联地显示第三图形,所述第三图形表示所述两个或更多个属性中的第三属性。
10.如权利要求9所述的显示控制装置,其中所述显示控制部分执行控制以使得表示所述第一属性的值的坐标位置在所述第二轴的方向上显示在所述第三图形的上方或下方。
11.如权利要求10所述的显示控制装置,其中所述显示控制部分执行控制以使得表示所述第一属性的值的坐标位置和所述第三图形的显示位置在所述第二轴的方向上彼此偏移预定的距离。
12.如权利要求1或2所述的显示控制装置,其中所述显示控制部分执行控制以使得根据所述第二属性的值来改变所述第一图形的颜色。
13.一种计算机实现的方法,包括:
获取步骤,其中获取表示声音数据的两个或更多个属性的属性数据;
执行控制的步骤,其中执行控制以在显示部分上显示通过所述获取步骤获取的属性数据所表示的两个或更多个属性的值随时间的变化,其中在具有表示时间经过的第一轴和与所述第一轴相交的第二轴的坐标平面上,通过沿所述第二轴的坐标位置来显示所述两个或更多个属性中的第一属性的值,并且显示第一图形,在该第一图形中通过在所述第二轴的方向上延伸的长度来表示所述两个或更多个属性中的第二属性的值。
CN201210580106.4A 2011-12-27 2012-12-27 显示控制装置及方法 Active CN103187046B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-286727 2011-12-27
JP2011286727A JP5811837B2 (ja) 2011-12-27 2011-12-27 表示制御装置及びプログラム

Publications (2)

Publication Number Publication Date
CN103187046A true CN103187046A (zh) 2013-07-03
CN103187046B CN103187046B (zh) 2016-01-20

Family

ID=47720243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210580106.4A Active CN103187046B (zh) 2011-12-27 2012-12-27 显示控制装置及方法

Country Status (7)

Country Link
US (1) US9639966B2 (zh)
EP (1) EP2610859B1 (zh)
JP (1) JP5811837B2 (zh)
KR (1) KR101521451B1 (zh)
CN (1) CN103187046B (zh)
HK (1) HK1183739A1 (zh)
TW (1) TWI492216B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104347080A (zh) * 2013-08-09 2015-02-11 雅马哈株式会社 语音分析方法和装置、语音合成方法和装置、以及存储语音分析程序的介质
CN104361883A (zh) * 2014-10-10 2015-02-18 福建星网视易信息系统有限公司 歌唱评测标准文件制作方法和装置
WO2016141539A1 (zh) * 2015-03-09 2016-09-15 常平 一种ktv演唱时根据音高排名的方法
CN106057213A (zh) * 2016-06-30 2016-10-26 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
CN106463104A (zh) * 2014-03-17 2017-02-22 新贡公司 为用户提供关于卡拉ok歌曲表演的反馈的方法
CN110830619A (zh) * 2019-10-28 2020-02-21 维沃移动通信有限公司 一种显示方法及电子设备
CN110853675A (zh) * 2019-10-24 2020-02-28 广州大学 一种音乐联觉绘画的装置及其实现方法
CN112309428A (zh) * 2019-07-30 2021-02-02 微软技术许可有限责任公司 获得歌声检测模型
CN113314141A (zh) * 2021-05-21 2021-08-27 江苏第二师范学院 一种声乐演唱音量和音高的量化方法及量化设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8907195B1 (en) * 2012-01-14 2014-12-09 Neset Arda Erol Method and apparatus for musical training
JP6330325B2 (ja) * 2013-09-12 2018-05-30 ヤマハ株式会社 ユーザインタフェース装置及び音響制御装置
CN105023559A (zh) * 2015-05-27 2015-11-04 腾讯科技(深圳)有限公司 K歌处理方法及系统
JP6988343B2 (ja) * 2017-09-29 2022-01-05 ヤマハ株式会社 歌唱音声の編集支援方法、および歌唱音声の編集支援装置
JP7400220B2 (ja) * 2019-06-07 2023-12-19 ヤマハ株式会社 Av機器
WO2022040229A1 (en) * 2020-08-21 2022-02-24 SomniQ, Inc. Methods and systems for computer-generated visualization of speech

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868687A (en) * 1987-12-21 1989-09-19 International Business Machines Corporation Audio editor display interface
US6064964A (en) * 1997-11-04 2000-05-16 Fujitsu Limited Data processing apparatus having breath detecting function and image display control method using breath detection
US6245984B1 (en) * 1998-11-25 2001-06-12 Yamaha Corporation Apparatus and method for composing music data by inputting time positions of notes and then establishing pitches of notes
US20070168187A1 (en) * 2006-01-13 2007-07-19 Samuel Fletcher Real time voice analysis and method for providing speech therapy
JP2008165130A (ja) * 2007-01-05 2008-07-17 Yamaha Corp 歌唱音合成装置およびプログラム
JP2008225117A (ja) * 2007-03-13 2008-09-25 Yamaha Corp ピッチ表示制御装置
JP2010128158A (ja) * 2008-11-27 2010-06-10 Seiko Instruments Inc 音楽練習支援機器及び音楽練習支援プログラム
JP2011209459A (ja) * 2010-03-29 2011-10-20 Yamaha Corp 音響処理装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6038718B2 (ja) * 1979-12-13 1985-09-02 松下電器産業株式会社 歌唱自習器
US5287789A (en) * 1991-12-06 1994-02-22 Zimmerman Thomas G Music training apparatus
US6411289B1 (en) * 1996-08-07 2002-06-25 Franklin B. Zimmerman Music visualization system utilizing three dimensional graphical representations of musical characteristics
JP3972899B2 (ja) 2003-12-22 2007-09-05 ヤマハ株式会社 楽譜表示装置
JP4353018B2 (ja) * 2004-07-16 2009-10-28 ヤマハ株式会社 楽器演奏教習装置及びそのプログラム
JP2006276693A (ja) * 2005-03-30 2006-10-12 Yamaha Corp 歌唱評価表示装置およびプログラム
TW200826060A (en) * 2006-12-15 2008-06-16 Digiwell Technology Inc Embedded high-speed audio signal converting device
TWM360427U (en) * 2008-10-14 2009-07-01 Xcube Technology Inc All-purpose portable karaoke player
KR101025665B1 (ko) * 2009-10-16 2011-03-30 박상철 음악기반 언어 학습방법과 이를 활용한 학습장치
JP5122598B2 (ja) * 2010-03-30 2013-01-16 株式会社コナミデジタルエンタテインメント 音声入力評価システム、音声入力評価システムの制御方法、及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868687A (en) * 1987-12-21 1989-09-19 International Business Machines Corporation Audio editor display interface
US6064964A (en) * 1997-11-04 2000-05-16 Fujitsu Limited Data processing apparatus having breath detecting function and image display control method using breath detection
US6245984B1 (en) * 1998-11-25 2001-06-12 Yamaha Corporation Apparatus and method for composing music data by inputting time positions of notes and then establishing pitches of notes
US20070168187A1 (en) * 2006-01-13 2007-07-19 Samuel Fletcher Real time voice analysis and method for providing speech therapy
JP2008165130A (ja) * 2007-01-05 2008-07-17 Yamaha Corp 歌唱音合成装置およびプログラム
JP2008225117A (ja) * 2007-03-13 2008-09-25 Yamaha Corp ピッチ表示制御装置
JP2010128158A (ja) * 2008-11-27 2010-06-10 Seiko Instruments Inc 音楽練習支援機器及び音楽練習支援プログラム
JP2011209459A (ja) * 2010-03-29 2011-10-20 Yamaha Corp 音響処理装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104347080A (zh) * 2013-08-09 2015-02-11 雅马哈株式会社 语音分析方法和装置、语音合成方法和装置、以及存储语音分析程序的介质
CN104347080B (zh) * 2013-08-09 2018-08-10 雅马哈株式会社 语音分析方法和装置、语音合成方法和装置、以及存储语音分析程序的介质
CN106463104A (zh) * 2014-03-17 2017-02-22 新贡公司 为用户提供关于卡拉ok歌曲表演的反馈的方法
CN104361883A (zh) * 2014-10-10 2015-02-18 福建星网视易信息系统有限公司 歌唱评测标准文件制作方法和装置
WO2016141539A1 (zh) * 2015-03-09 2016-09-15 常平 一种ktv演唱时根据音高排名的方法
CN106057213A (zh) * 2016-06-30 2016-10-26 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
CN106057213B (zh) * 2016-06-30 2018-08-03 广州酷狗计算机科技有限公司 一种显示人声音高数据的方法和装置
CN112309428A (zh) * 2019-07-30 2021-02-02 微软技术许可有限责任公司 获得歌声检测模型
CN112309428B (zh) * 2019-07-30 2024-03-19 微软技术许可有限责任公司 获得歌声检测模型
CN110853675A (zh) * 2019-10-24 2020-02-28 广州大学 一种音乐联觉绘画的装置及其实现方法
CN110830619A (zh) * 2019-10-28 2020-02-21 维沃移动通信有限公司 一种显示方法及电子设备
CN113314141A (zh) * 2021-05-21 2021-08-27 江苏第二师范学院 一种声乐演唱音量和音高的量化方法及量化设备

Also Published As

Publication number Publication date
US9639966B2 (en) 2017-05-02
JP2013134475A (ja) 2013-07-08
EP2610859B1 (en) 2017-09-20
US20130162649A1 (en) 2013-06-27
EP2610859A3 (en) 2016-07-27
KR101521451B1 (ko) 2015-05-19
TW201329957A (zh) 2013-07-16
EP2610859A2 (en) 2013-07-03
HK1183739A1 (zh) 2014-01-03
KR20130075679A (ko) 2013-07-05
CN103187046B (zh) 2016-01-20
JP5811837B2 (ja) 2015-11-11
TWI492216B (zh) 2015-07-11

Similar Documents

Publication Publication Date Title
CN103187046A (zh) 显示控制装置及方法
US5889224A (en) Karaoke scoring apparatus analyzing singing voice relative to melody data
JP4949899B2 (ja) ピッチ表示制御装置
Müller et al. Interactive fundamental frequency estimation with applications to ethnomusicological research
JP2007256618A (ja) 検索装置
JP6288197B2 (ja) 評価装置及びプログラム
JP6102076B2 (ja) 評価装置
CN112669811A (zh) 一种歌曲处理方法、装置、电子设备及可读存储介质
JP2004102146A (ja) ビブラート採点機能を有するカラオケ採点装置
JP2008225116A (ja) 評価装置及びカラオケ装置
JP4839967B2 (ja) 指導装置及びプログラム
JP6024130B2 (ja) 音声評価装置
JP4891135B2 (ja) 評価装置
JP5585320B2 (ja) 歌唱音声評価装置
JP2016184112A (ja) アンサンブル評価装置
JP2008040258A (ja) 楽曲練習支援装置、動的時間整合モジュールおよびプログラム
JP6074835B2 (ja) 楽曲練習支援装置
JP4152502B2 (ja) 音響信号の符号化装置および符号データの編集装置
JP2007225916A (ja) オーサリング装置、オーサリング方法およびプログラム
JP2007233078A (ja) 評価装置、制御方法及びプログラム
CN115527512A (zh) 一种音乐评测方法和系统
KR101077664B1 (ko) 노래반주기의 악보를 이용한 채점 및 분석 방법
JP6175034B2 (ja) 歌唱評価装置
CN115547280A (zh) 一种乐器演奏评测方法和系统
JP2004102149A (ja) しゃくり上げ採点機能を有するカラオケ採点装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1183739

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1183739

Country of ref document: HK