JP2015034923A - 音高補正装置 - Google Patents
音高補正装置 Download PDFInfo
- Publication number
- JP2015034923A JP2015034923A JP2013166366A JP2013166366A JP2015034923A JP 2015034923 A JP2015034923 A JP 2015034923A JP 2013166366 A JP2013166366 A JP 2013166366A JP 2013166366 A JP2013166366 A JP 2013166366A JP 2015034923 A JP2015034923 A JP 2015034923A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- correction
- acoustic signal
- range
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012937 correction Methods 0.000 title claims abstract description 361
- 230000007423 decrease Effects 0.000 claims abstract description 17
- 230000008859 change Effects 0.000 claims description 57
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 56
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 463
- 238000000034 method Methods 0.000 description 25
- 238000009499 grossing Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/366—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/066—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/091—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for performance evaluation, i.e. judging, grading or scoring the musical qualities or faithfulness of a performance, e.g. with respect to pitch, tempo or other timings of a reference performance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/325—Musical pitch modification
- G10H2210/331—Note pitch correction, i.e. modifying a note pitch or replacing it by the closest one in a given scale
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/011—Files or data streams containing coded musical information, e.g. for transmission
- G10H2240/046—File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
- G10H2240/056—MIDI or other note-oriented file format
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【課題】音高の補正後の音響を聴感的に自然な音響とする。【解決手段】補正値設定部52は、音響信号XAの音高PAが、目標音高PREFを含む許容範囲外に位置する補正範囲の内側にある場合に音高PAの補正量が増加し、音響信号XAの音高PAが補正範囲の外側にある場合に音高の補正量が減少するように、補正量を規定する補正値Aを設定する。補正処理部54は、補正値設定部52が設定した補正値Aに応じて音響信号XAの音高PAを補正する。【選択図】図1
Description
本発明は、音声の音高(ピッチ)を補正する技術に関する。
利用者が発音した音声(典型的には楽曲の歌唱音)の音高を補正する技術が従来から提案されている。例えば特許文献1には、利用者が発音した音声の音高と楽曲を構成する各音符の音高との相違に応じて音声の音高を適正な音高に補正する構成が開示されている。
しかし、特許文献1の技術では、利用者が発音した音高が一律に楽曲の各音符の音高に正確に修正されるから、例えば、受聴者が実際には不快と知覚しない程度の音高の誤差や、利用者が歌唱表現(歌唱技巧)として意図的に付与した音高の誤差までも補正され、補正後の音声が聴感的に不自然な印象となる可能性がある。以上の事情を考慮して、本発明は、音高の補正後の音響を聴感的に自然な音響とすることを目的とする。
以上の課題を解決するために、本発明の第1態様に係る音高補正装置は、音響信号の音高を目標音高に応じて補正する要素であって、目標音高を含む許容範囲外に位置する補正範囲の内側に音響信号の音高がある場合に音高の補正量が増加し、音響信号の音高が補正範囲の外側にある場合に音高の補正量が減少するように、音響信号の音高を補正する音高補正部を具備する。以上の構成では、目標音高を含む許容範囲外に位置する補正範囲の内側に音響信号の音高がある場合に音高の補正量が増加するから、受聴者が特に不快感を知覚する補正範囲の内側に音響信号の音高が滞留することが抑制される。したがって、補正後の音声を、受聴者に不快感が知覚され難い聴感的に自然な音響とすることが可能である。
本発明の第2態様に係る音高補正装置は、音響信号の音高を目標音高に応じて補正する要素であって、目標音高を含む許容範囲外に位置する補正範囲の内側に音響信号の音高がある場合に音高の補正を実行し、音響信号の音高が補正範囲の外側にある場合に音高の補正を停止する音高補正部を具備する。以上の構成では、目標音高を含む許容範囲外に位置する補正範囲の内側に音響信号の音高がある場合に音高の補正が実行され、音響信号の音高が補正範囲の外側にある場合に音高の補正が停止されるから、受聴者が特に不快感を知覚する補正範囲の内側に音響信号の音高が滞留することが抑制される。したがって、補正後の音声を、受聴者に不快感が知覚され難い聴感的に自然な音響とすることが可能である。
本発明の好適な態様において、補正範囲は、許容範囲の低音側に位置する低音側補正範囲と、許容範囲の高音側に位置する高音側補正範囲とを含む。以上の態様では、許容範囲の低音側に低音側補正範囲が設定されるとともに許容範囲の高音側に高音側補正範囲が設定されるから、音響信号の音高が目標音高の低音側および高音側の何れにある場合も適切に補正することが可能である。低音側補正範囲と高音側補正範囲とで範囲幅を相違させた構成も好適である。
本発明の第1態様に係る音高補正装置の好適例において、音高補正部は、音響信号の音高の時間変換率の絶対値が閾値を下回るときには、音響信号の音高が補正範囲の内側にある場合に音高の補正量が増加し、音響信号の音高が補正範囲の外側にある場合に音高の補正量を減少させる一方、時間変化率の絶対値が閾値を上回るときには、音響信号の音高が補正範囲の内側にあるか否かに関わらず音高の補正量を減少させる。以上の態様では、音響信号の音高の時間変化率の絶対値が閾値を上回る場合(例えば音響信号の音高の変動が利用者の意図的な歌唱表現に起因すると推定される場合)には音高の補正が抑制される。したがって、意図的な歌唱表現を維持しながら音高を補正できるという効果が実現される。
本発明の第2態様に係る音高補正装置の好適例において、音高補正部は、音響信号の音高の時間変換率の絶対値が閾値を下回るときには、目標音高を含む許容範囲外に位置する補正範囲の内側に音響信号の音高がある場合に音高の補正を実行し、音響信号の音高が補正範囲の外側にある場合に音高の補正を停止する一方、時間変化率の絶対値が閾値を上回るときには、音響信号の音高が補正範囲の内側にあるか否かに関わらず音高の補正を停止する。以上の態様では、音響信号の音高の時間変化率の絶対値が閾値を上回る場合(例えば音響信号の音高の変動が利用者の意図的な歌唱表現に起因すると推定される場合)には音高の補正が停止される。したがって、意図的な歌唱表現を維持しながら音高を補正できるという効果が実現される。
本発明の好適な態様において、補正値設定部は補正範囲を可変に制御する。例えば、音響信号の音量、音響信号の音高、音響信号の音高と目標音高との関係の評価値、音響信号のビブラートの深度の少なくともひとつに応じて補正範囲を制御する構成が好適である。
以上の各態様に係る音高補正装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、本発明は、以上に説明した各態様に係る音高補正装置の動作方法(音高補正方法)としても特定される。
<第1実施形態>
図1は、本発明の第1実施形態に係る音高補正装置100のブロック図である。図1に例示される通り、音高補正装置100には収音装置12と放音装置14とが接続される。収音装置12は、利用者が発音した音声を収音することで音響信号XAを生成する。音響信号XAは、楽曲を歌唱した歌唱音の時間波形を表す音声信号である。音高補正装置100は、音響信号XAの音高(ピッチ)の補正を含む各種の音響処理で音響信号Zを生成する音響処理装置であり、利用者が楽曲の伴奏音のもとで歌唱するためのカラオケ装置として好適に利用される。放音装置14は、音高補正装置100が生成した音響信号Zに応じた音響を再生する。なお、収音装置12が生成した音響信号XAをアナログからデジタルに変換するA/D変換器や、音高補正装置100が生成した音響信号Zをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略した。
図1は、本発明の第1実施形態に係る音高補正装置100のブロック図である。図1に例示される通り、音高補正装置100には収音装置12と放音装置14とが接続される。収音装置12は、利用者が発音した音声を収音することで音響信号XAを生成する。音響信号XAは、楽曲を歌唱した歌唱音の時間波形を表す音声信号である。音高補正装置100は、音響信号XAの音高(ピッチ)の補正を含む各種の音響処理で音響信号Zを生成する音響処理装置であり、利用者が楽曲の伴奏音のもとで歌唱するためのカラオケ装置として好適に利用される。放音装置14は、音高補正装置100が生成した音響信号Zに応じた音響を再生する。なお、収音装置12が生成した音響信号XAをアナログからデジタルに変換するA/D変換器や、音高補正装置100が生成した音響信号Zをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略した。
図1に例示される通り、音高補正装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置24として任意に採用される。なお、第1実施形態では、収音装置12が生成した音響信号XAの音高を実時間的に補正する場合を例示するが、歌唱音を事前に収録した音響信号XAを記憶装置24に記憶して音高の補正対象とすることも可能である。
第1実施形態の記憶装置24は、楽曲データMを楽曲毎に記憶する。各楽曲の楽曲データMは、歌唱パートの旋律(ガイドメロディ)と伴奏パートの旋律とを指定する時系列データである。例えばMIDI(Musical Instrument Digital Interface)規格に準拠した形式で記述されたカラオケデータが楽曲データMとして好適に利用される。
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで各種の制御処理および演算処理を実行する。具体的には、演算処理装置22は、図1に例示される通り、音響信号XAから音響信号Zを生成するための複数の機能(再生処理部32,音響生成部34,音高補正部36,音響混合部38,音高検出部42,平滑処理部44,変化率算定部46)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、音響処理に専用される電子回路(例えばDSP)が演算処理装置22の各機能を実現する構成も採用され得る。
再生処理部32は、楽曲データMを処理するシーケンサである。具体的には、再生処理部32は、楽曲データMのうち伴奏パートの各音符を音響生成部34に対して順次に指示するとともに、楽曲データMのうち歌唱パートの各音符の音高(以下「目標音高」という)PREFを音高補正部36に対して順次に指示する。目標音高PREFは、楽曲の歌唱パートの模範的な音高に相当し、音響信号XAの音高の補正のために参照される(詳細は後述)。音響生成部34は、再生処理部32から順次に指示される伴奏パートの各音符の音響(すなわち伴奏音)を表す音響信号Yを生成する。
図1の音高補正部36は、収音装置12から供給される音響信号XAの音高を目標音高PREFに応じて補正することで音響信号XBを生成する。補正の具体的な内容は後述するが、概略的には、音響信号XAの音高が目標音高PREFに近付く(両者間の誤差が低減される)ように音響信号XAから音響信号XBが生成される。音響混合部38は、音高補正部36による補正後の音響信号XBと音響生成部34が生成した伴奏音の音響信号Yとを混合することで音響信号Zを生成する。音響混合部38が生成した音響信号Zが放音装置14に供給されることで、利用者が楽曲を歌唱した音声の音高を補正した歌唱音(音響信号XB)と当該楽曲の伴奏音(音響信号Y)とが放音装置14から再生される。
音高検出部42は、収音装置12から供給される音響信号XAの音高(基本周波数)P0を順次に検出する。音高P0の検出には公知の技術(ピッチ検出技術)が任意に採用され得る。平滑処理部44は、音高検出部42が検出した音高P0の時系列を時間軸上で平滑化するローパスフィルタである。平滑処理部44による平滑化で音高P0の過度な変動(例えばビブラートに起因した変動)が抑制される。変化率算定部46は、平滑処理部44による平滑化後の音高PAの時間変化率(絶対値)DPを順次に算定する。時間変化率DPは、単位時間内の音高PAの変化量を意味する。
図1に例示される通り、第1実施形態の音高補正部36は、補正値設定部52と補正処理部54とを含んで構成される。補正値設定部52は、音響信号XAの音高PAの補正に適用される補正値Aを、再生処理部32から順次に指示される目標音高PREFと音響信号XAの音高PAとに応じて順次に設定する。補正値Aは、音高PAの補正量を規定する変数であり、正数または負数に設定される。補正処理部54は、補正値設定部52が設定した補正値Aに応じて音響信号XAの音高PAを補正することで音響信号XBを生成する。具体的には、補正処理部54は、音響信号XAの音高PAに補正値Aを加算することで音響信号XBを生成する。したがって、補正値Aの絶対値が大きいほど音響信号XAの音高PAの補正量は増加する。
第1実施形態では、目標音高PREFと音響信号XAの音高PAとの関係に応じて音高PAの補正を制御する。図2は、目標音高PREFと音高PAとの関係の説明図である。図2に例示される通り、目標音高PREFを包含する所定の範囲(以下「許容範囲」という)Rが設定される。許容範囲Rは、目標音高PREFとの音高差が聴感的に知覚され難い音高PAの範囲(すなわち、目標音高PREFとの誤差が受聴者に許容され得る音高PAの範囲)に相当し、目標音高PREFに対して低音側の音高BL1と目標音高PREFに対して高音側の音高BH1との間の範囲である。具体的には、音高BL1は目標音高PREFに対して-20centの音高であり、音高BH1は目標音高PREFに対して+30centの音高である。すなわち、セント換算値に着目すると、音高BL1の絶対値は音高BH1の絶対値を下回る。
図2に例示される通り、許容範囲Rの外側には補正範囲Q(QL,QH)が設定される。第1実施形態の補正範囲Qは、許容範囲Rの低音側に位置する低音側補正範囲QLと、許容範囲Rの高音側に位置する高音側補正範囲QHとを包含する。低音側補正範囲QLは、許容範囲Rの下限値である音高BL1と音高BL1を下回る音高BL2との間の範囲であり、高音側補正範囲QHは、許容範囲Rの上限値である音高BH1と音高BH1を上回る音高BH2との間の範囲である。
目標音高PREFに対する音高PAの誤差と歌唱音の受聴者が知覚する不快度ξとの関係が図2には併記されている。不快度ξは、目標音高PREFとは相違する音高PAを受聴した受聴者が目標音高PREFと音高PAとの相違を不快と知覚する度合の指標である。図2から理解される通り、音高PAが許容範囲R内にある場合には不快度ξは最低値(ゼロ)に維持される。許容範囲Rの外側の範囲で目標音高PREFと音高PAとの音高差が拡大すると、許容範囲Rに近い範囲内では音高PAが目標音高PREFから乖離するほど不快度ξは増加するが、目標音高PREFと音高PAとの音高差が所定値に到達すると不快度ξは極大となり、以降は音高PAが目標音高PREFから乖離するほど不快度ξは減少する、という傾向がある。以上の傾向は、許容範囲Rの低音側および高音側の双方で観測される。
図2から理解される通り、低音側補正範囲QLおよび高音側補正範囲QHの各々は、不快度ξが極大となる音高PAを包含するように選定される。すなわち、低音側補正範囲QLおよび高音側補正範囲QHは、音高PAを受聴した受聴者が音高PAの誤差を不快と知覚する範囲に相当し、目標音高PREFとの相違を低減する(不快度ξを抑制する)ために音高PAを補正すべき範囲とも表現される。具体的には、低音側補正範囲QLの下限値に相当する音高BL2は、目標音高PREFに対して-200centの音高である。すなわち、低音側補正範囲QLは、目標音高PREFに対して-20cent(BL1)から-200cent(BL2)までの範囲(範囲幅180cent)である。他方、高音側補正範囲QHの上限値に相当する音高BH2は、目標音高PREFに対して+200centの音高である。すなわち、高音側補正範囲QHは、目標音高PREFに対して+30cent(BH1)から+200cent(BH2)までの範囲(範囲幅170cent)である。目標音高PREFに対して高音側の誤差のほうが低音側の誤差と比較して受聴者に知覚され難いという傾向を考慮して、第1実施形態では、以上の例示の通り、低音側補正範囲QLが高音側補正範囲QHと比較して広い範囲に設定される。図2から理解される通り、許容範囲Rのうち目標音高PREFの高音側の範囲が低音側の範囲と比較して広いと換言することも可能である。ただし、低音側補正範囲QLと高音側補正範囲QHとで範囲幅を共通させることも可能である。例えば、音高BL1と音高BH1とで絶対値が共通するとともに音高BL2と音高BH2とで絶対値が共通する構成(すなわち、目標音高PREFを対称軸として低音側補正範囲QLと音高側補正範囲QHとが線対称の関係にある構成)も採用され得る。
図1に例示される通り、第1実施形態の補正値設定部52は、状態制御部62と設定処理部64とを含んで構成される。状態制御部62は、再生処理部32から指示される目標音高PREFを含む許容範囲Rの外側の補正範囲Q(QL,QH)に音響信号XAの音高PAが包含されるか否かに応じて、音高PAの補正量の制御に関する動作状態を第1状態と第2状態とに選択的に設定する。第1状態は、音高PAの補正量を経時的に増加させる動作状態(すなわち音高PAの補正を促進する状態)であり、第2状態は、音高PAの補正量を経時的に減少させる動作状態(すなわち音高PAの補正を抑制する状態)である。具体的には、状態制御部62は、記憶装置24に記憶された補正情報Fを制御する。補正情報Fは、第1状態(F=1[ON])および第2状態(F=0[OFF])の何れかを指定する情報(フラグ)である。図1の設定処理部64は、状態制御部62が設定した動作状態(補正情報F)に応じて補正値Aを設定する。
図3は、補正値設定部52が補正値Aを設定するための処理(以下「補正制御処理」という)のフローチャートである。利用者からの指示(楽曲再生の指示)を契機として再生処理部32が楽曲データMの処理を開始すると、所定の時間毎に発生する割込を契機として図3の補正制御処理が順次に実行される。状態制御部62がステップSA1からステップSA5の処理を実行し、設定処理部64がステップSB1からステップSB5の処理を実行する。
補正制御処理を開始すると、状態制御部62は、楽曲の歌唱パートの目標音高PREFが存在するか否か(現時点が楽曲内の歌唱区間であるか否か)を再生処理部32からの指示に応じて判定する(SA1)。目標音高PREFが存在する場合(SA1:YES)、状態制御部62は、変化率算定部46が算定した時間変化率DPが所定の閾値DTHを下回るか否かを判定する(SA2)。
音響信号XAの音高PAと目標音高PREFとが相違する場合でも、両者間の相違(音高PAの誤差)が、歌唱技術の不足に起因した誤差ではなく、例えば利用者が意図した歌唱表現(例えばビブラート)に起因する場合には、音響信号XAの音高PAを補正すべきではない。他方、意図的な歌唱表現に起因した音高PAの変動は、歌唱技術の不足に起因した音高PAの変動と比較して、音高PAの時間変化率DPが大きい、という傾向がある。以上の説明から理解される通り、前述のステップSA2の判定は、目標音高PREFと音響信号XAの音高PAとの誤差が、意図的な歌唱表現と歌唱技術の不足との何れに起因するのかを推定する処理に相当する。すなわち、時間変化率DPが閾値DTHを下回る場合(SA2:YES)には目標音高PREFと音高PAとの誤差が歌唱技術の不足に起因する(したがって音高PAを補正すべきである)と推定され、時間変化率DPが閾値DTHを上回る場合(SA2:NO)には目標音高PREFと音高PAとの誤差が意図的な歌唱表現に起因する(したがって音高PAを補正すべきでない)と推定される。以上の説明から理解される通り、閾値DTHは、意図的な歌唱表現による音高PAの変動と歌唱技術の不足による音高PAの変動とを区別可能な適切な数値に設定される。具体的には、閾値DTHは、1200cent/sec以下の数値に好適に設定される。
時間変化率DPが閾値DTHを下回る場合(SA2:YES)、状態制御部62は、目標音高PREFを含む許容範囲Rの外側の補正範囲Q(低音側補正範囲QLおよび高音側補正範囲QHの何れか)に音響信号XAの音高PAが包含されるか否かを判定する(SA3)。図2を参照した前述の説明から理解される通り、ステップSA3の判定は、音響信号XAの音高PAが目標音高PREFとの関係で受聴者に不快と知覚されるか否かを判定する処理に相当する。音響信号XAの音高PAが補正範囲Qに包含される場合(SA3:YES)、状態制御部62は、記憶装置24に記憶された補正情報Fを1[ON]に設定することで動作状態を第1状態に設定する(SA4)。
他方、目標音高PREFが存在しない場合(SA1:NO)、時間変化率DPが閾値DTHを上回る場合(SA2:NO)、または、音高PAが補正範囲Q以外の範囲(許容範囲Rまたは補正範囲Qの外側の範囲)に包含される場合(SA3:NO)には、状態制御部62は、記憶装置24に記憶された補正情報Fを0[OFF]に設定することで動作状態を第2状態に設定する(SA5)。すなわち、音響信号XAの音高PAを補正すべき場合(SA3:YES)には動作状態が第1状態に設定され、音響信号XAの音高PAを補正すべきでない場合(SA1〜SA3:NO)には動作状態が第2状態に設定される。
以上の説明から理解される通り、第1実施形態の状態制御部62は、音響信号XAの音高PAが補正範囲Q内にある場合(SA3:YES)に動作状態を第1状態に設定し、音響信号XAの音高PAが補正範囲Q外にある場合(SA3:NO)に動作状態を第2状態に設定する要素として機能する。具体的には、状態制御部62は、音響信号XAの音高PAの時間変化率DP(絶対値)が閾値DTHを下回るとき(SA2:YES)に、音高PAが補正範囲Q内にある場合(SA3:YES)に動作状態を第1状態に設定し、音響信号XAの音高PAが補正範囲Q外にある場合(SA3:NO)に動作状態を第2状態に設定する一方、時間変化率DPが閾値DTHを上回るとき(SA2:NO)には、補正範囲Qに対する音高PAの内外に関わらず動作状態を第2状態に設定する。また、音響信号XAの音高PAが補正範囲Q内にあると仮定する(あるいは補正範囲Qに対する音高PAの内外を無視する)と、状態制御部62は、音響信号XAの音高PAの時間変化率DPが閾値DTHを下回る場合(SA2:YES)に動作状態を第1状態に設定し、時間変化率DPが閾値DTHを上回る場合(SA2:NO)に動作状態を第2状態に設定する要素としても表現される。以上が状態制御部62(SA1〜SA5)の動作である。
なお、第1実施形態では、音響信号XAの音高P0を平滑化した音高PAに応じて補正値Aが制御される。したがって、状態制御部62が制御する動作状態は、音響信号XAの音高P0の実際の変動から平滑化の時定数に応じた時間だけ遅延した時点で第1状態および第2状態の一方から他方に変動する。すなわち、平滑処理部44は、動作状態の変動の時点(音高P0の変動から動作状態の変動までの遅延量)を調整するための要素として機能する。平滑処理部44による平滑化の時定数は、例えば0.2秒程度に設定される。なお、入力装置(図示略)に対する利用者からの指示に応じて平滑化の時定数を可変に設定することも可能である。
設定処理部64は、以上の処理で状態制御部62が設定した動作状態(補正情報F)に応じて補正値Aを設定する。補正値Aは、例えば動作状態が第2状態から第1状態に変化した場合に所定値(例えば0)に初期化される。図3に例示される通り、設定処理部64は、現段階の動作状態が第1状態にあるか否か(補正情報Fが1であるか否か)を判定する(SB1)。動作状態が第1状態にある場合(SB1:YES)、すなわち、音響信号XAの音高PAを補正する必要がある場合、設定処理部64は、以下に詳述する通り、音響信号XAの音高PAの補正量が経時的に増加するように補正値Aを制御する(SB2〜SB4)
動作状態が第1状態にある場合(SB1:YES)、設定処理部64は、音響信号XAの音高PAが目標音高PREFを下回るか否かを判定する(SB2)。音高PAが目標音高PREFを下回る場合(SB2:YES)、すなわち、音高PAが低音側補正範囲QL内にある場合、設定処理部64は、補正値Aに所定の変化量δLを加算する(SB3)。すなわち、補正値Aが正数の範囲にて変化量δLだけ増加することで音高PAの高音側(目標音高PREFに近付く方向)への補正量が増加する。他方、音響信号XAの音高PAが目標音高PREFを上回る場合(SB2:NO)、すなわち、音高PAが高音側補正範囲QH内にある場合、設定処理部64は、補正値Aから所定の変化量δHを減算する(SB4)。すなわち、補正値Aが負数の範囲にて変化量δHだけ減少することで音高PAの低音側(目標音高PREFに近付く方向)への補正量が増加する。補正値Aの変化量δLと変化量δHとは、典型的には相等しい数値に設定されるが、各々を別個の数値に設定することも可能である。また、入力装置に対する利用者からの指示に応じて変化量δLや変化量δHを可変に制御する構成も採用される。
他方、動作状態が第2状態にある場合(SB1:NO)、設定処理部64は、補正値Aの絶対値を所定の変化量δ0だけ減少させる(すなわち0に近付ける)ことで音高PAの補正量を減少させる。具体的には、設定処理部64は、補正値Aが正数である場合には補正値Aから変化量δ0を減算し、補正値Aが負数である場合には補正値Aに変化量δ0を加算する。なお、補正値Aが0に到達した場合、設定処理部64は、補正値Aを0に維持する。以上が補正値設定部52(状態制御部62,設定処理部64)による補正制御処理の具体例である。
図4は、補正制御処理で設定される補正値Aを適用した音高PAの補正の具体例である。補正前の音響信号XAの音高PA(破線)と補正後の音響信号XBの音高PB(実線)とが図4に併記されている。図4では、音響信号XAの音高PAが、低音側補正範囲QLの下限値である音高BL2を下回る範囲から経時的に上昇しながら低音側補正範囲QLを通過して許容範囲R内に到達し、許容範囲R内で増加から減少に転換し、低音側補正範囲QLを通過して音高BL2を下回る範囲に到達する場合が例示されている。なお、図4では、時間変化率DPが閾値DTHを下回るように音高PAが変動する場合を便宜的に想定した。
図4に例示される通り、音響信号XAの音高PAが低音側補正範囲QLの下限値の音高BL2に到達して低音側補正範囲QL内に移行する時点t1において、動作状態は第2状態から第1状態に遷移する(SA4)。音高PAは目標音高PREFを下回る(SB2:YES)から、補正値Aは正数の範囲内で変化量δLずつ経時的に増加し(SB3)、補正後の音高PBは、音響信号XAの音高PAと比較して迅速に目標音高PREFに近付く。そして、音響信号XAの音高PAが許容範囲Rの下限値(低音側補正範囲QLの上限値)の音高BL1に到達して許容範囲R内に移行する時点t2において、動作状態は第1状態から第2状態に遷移する(SA5)。したがって、補正値Aの絶対値が変化量δ0ずつ減少する(SB5)ことで補正量(音高PAと音高PBとの相違)が減少し、補正値Aが0に到達することで音高PAと音高PBとが合致する。すなわち、音響信号XAの音高PAの補正が停止した状態となる。
音響信号XAの音高PAが許容範囲R内で低下し、許容範囲Rの下限値の音高BL1に到達して低音側補正範囲QL内に移行する時点t3において、動作状態は第2状態から第1状態に遷移する(SA4)。したがって、補正値Aは正数の範囲内で変化量δLずつ経時的に増加する(SB3)。補正値Aが増加する結果、補正後の音高PBは、補正前の音高PAが低音側補正範囲QL内に移行する時点t3から遅延した時点で低音側補正範囲QL内に移行する。そして、音響信号XAの音高PAが低音側補正範囲QLの下限値の音高BL2に到達して低音側補正範囲QL外に移行する時点t4において、動作状態は第1状態から第2状態に遷移する(SA5)。したがって、補正値Aの絶対値が変化量δ0ずつ減少する(SB5)。補正値Aが0に到達することで音高PAと音高PBとが合致して、音響信号XAの音高PAの補正が停止した状態となる。
以上に説明した通り、第1実施形態では、目標音高PREFを含む許容範囲Rの外側の補正範囲Q内に音響信号XAの音高PAがある場合に音高PAの補正量が増加し、音響信号XAの音高PAが補正範囲Q外にある場合に音高PAの補正量が減少するから、受聴者が不快感を知覚する補正範囲Q内に音高PAが滞留することが抑制される。例えば、図4の例示では、補正前の音高PAは期間TA1および期間TA2にて補正範囲Q内に滞留するのに対し、補正後の音高PBが補正範囲Q内にあるのは、期間TA1と比較して短い期間TB1および期間TA2と比較して短い期間TB2である。すなわち、第1実施形態によれば、音高PAの補正後の音声を、受聴者に不快感が知覚され難い聴感的に自然な音声とすることが可能である。
ところで、歌唱技術が充分でない初心者の歌唱には、歌唱者自身は音高PAが目標音高PREFに合致していると知覚しているけれども実際には音高PAが目標音高PREFを下回る音高に維持されるという現象(以下「フラットシンギング」という)が観測される。フラットシンギングでは、歌唱音の音高PAが補正範囲Q内(例えば目標音高PREFから50cent程度の低音)に維持され、結果的に受聴者に不快感を知覚させる可能性が高いという傾向がある。第1実施形態によれば、前述の通り、音響信号XAの音高PAが補正範囲Q内に滞留することが抑制されるから、フラットシンギングの矯正に格別に有効である。
また、第1実施形態では、音響信号XAの音高PAの時間変化率DPが閾値DTHを上回る場合(目標音高PREFと音高PAとの相違が意図的な歌唱表現に起因すると推定される場合)には音高PAの補正量が減少するように補正値Aが制御される。すなわち、音高PAの補正が抑制(ひいては停止)される。したがって、以下に詳述する通り、歌唱者が意図した歌唱表現を維持しながら音高PAを補正できるという効果が実現される。
図5は、補正前の音高PA(破線)と補正後の音高PB(実線)との時間的な変動の説明図である。第1実施形態との比較のために対比例1および対比例2が併記されている。対比例1は、歌唱音の音高PAを、平均律の複数の音高のうち当該音高PAに最も近い音高に補正(量子化)する構成であり、対比例2は、歌唱音の音高PAを目標音高PREFに強制的に補正する構成である。図5では、目標音高PREFが音高Gから音高Cに変化する旋律の歌唱音に着目し、利用者が、音高Gと音高Cとを円滑に連結するシャクリを付与するとともに音高Cの発音の途中からビブラートを付与した場合を例示する。
図5から理解される通り、対比例1では、離散的な複数の音高の何れかに歌唱音の音高PAが強制的に変更されるから、補正後の音高PBは時間的に不連続に変動する。したがって、音高PAを滑らかに変動させるシャクリやビブラートの効果が減殺され、聴感的にも不自然な音響となる。また、対比例2では、歌唱音の音高PAが目標音高PREFに強制的に変更されるから、歌唱者が意図したシャクリやビブラートの効果が完全に減殺されるとともに聴感的にも不自然な音響となる。他方、第1実施形態では、音高Cの発音の当初に目標音高PREFに対して僅かに低音に維持される音高PA(フラットシンギング)が補正により目標音高PREFに近付けられる一方、音高Cの発音の後半におけるビブラートは歌唱音のまま維持される。すなわち、以上に説明した第1実施形態によれば、対比例1や対比例2と比較して、歌唱者が意図した歌唱表現を維持しながら音高PAを補正できることが図5から把握できる。
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
第1実施形態の音高補正部36は、音響信号XAの音高PAが補正範囲Qの内側にある場合に音高PAの補正量が増加し、音響信号XAの音高PAが補正範囲Qの外側にある場合に音高PAの補正量が減少するように、音響信号XAの音高PAを補正した。第2実施形態の音高補正部36は、以下に詳述する通り、補正範囲Qに対する音高PAの内外に応じて音高PAの補正の有無(実行/停止)を制御する。
図6は、第2実施形態の音高補正部36が実行する処理のフローチャートである。第1実施形態の補正制御処理と同様に、音高補正部36は、目標音高PREFの有無の判定(SC1)と、時間変化率DPが閾値DTHを下回るか否かの判定(SC2)と、音響信号XAの音高PAが補正範囲Q(低音側補正範囲QLおよび高音側補正範囲QHの何れか)に包含されるか否かの判定(SC3)とを順次に実行する。
以上の各判定の結果が肯定である場合(SC3:YES)、音高補正部36は、音響信号XAの音高PAの補正を実行する(SC4)。具体的には、音高補正部36は、音高PAに所定の補正値Aを加算または減算することで音高PAを目標音高PREFに近付ける。第2実施形態の補正値Aは例えば所定の定数である。
他方、目標音高PREFが存在しない場合(SC1:NO)、時間変化率DPが閾値DTHを上回る場合(SC2:NO)、または、音高PAが補正範囲Q以外の範囲に包含される場合(SC3:NO)、音高補正部36は、音響信号XAの音高PAの補正を停止する(SC5)。したがって、音高PAに対する補正値Aの加算または減算は実行されない。以上の説明から理解される通り、第2実施形態の音高補正部36は、音高PAの時間変化率DPが閾値DTHを下回るとき(SC2:YES)には、音高PAが補正範囲Q内にある場合(SC3:YES)に音高PAの補正を実行し(SC4)、音高PAが補正範囲Q外にある場合(SC3:NO)に音高PAの補正を停止する一方(SC5)、音高PAの時間変化率DPが閾値DTHを上回るとき(SC2:NO)には、音高PAが補正範囲Qの内側にあるか否かに関わらず音高PAの補正を停止する(SC5)。
以上に説明した通り、第2実施形態では、目標音高PREFを含む許容範囲Rの外側の補正範囲Q内に音響信号XAの音高PAがある場合に音高PAの補正が実行され、音響信号XAの音高PAが補正範囲Q外にある場合に音高PAの補正が停止されるから、受聴者が不快感を知覚する補正範囲Q内に音高PAが滞留することが抑制される。したがって、第1実施形態と同様に、音高PAの補正後の音声を、受聴者に不快感が知覚され難い聴感的に自然な音声とすることが可能である。また、第2実施形態では、音響信号XAの音高PAの時間変化率DPが閾値DTHを上回る場合(目標音高PREFと音高PAとの相違が意図的な歌唱表現に起因すると推定される場合)には音高PAの補正が停止される。したがって、第1実施形態と同様に、歌唱者が意図した歌唱表現を維持しながら音高PAを補正できるという効果が実現される。
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
(1)補正範囲Qに対する音高PAの内外と音高PAの補正内容との関係は、第1実施形態や第2実施形態の例示に限定されない。例えば、第1実施形態において、音響信号XAの音高PAが補正範囲Qの内側にある場合の補正量と音高PAが補正範囲Qの外側にある場合の補正量とを所定値に固定した構成(各場合の補正値Aを所定値に固定して増減しない構成)も採用され得る。ただし、音高PAが補正範囲Qの内側にある場合の補正量(すなわち補正値Aの絶対値)は、音高PAが補正範囲Qの外側にある場合の補正量を上回る。また、第2実施形態において、音高PAの補正に適用される補正値Aを、第1実施形態と同様に可変に制御することも可能である。
第2実施形態における音高PAの補正の停止を、補正量(補正値A)をゼロに設定する処理で実現することも可能である。以上の説明から理解される通り、前述の各形態に係る音高補正部36は、補正範囲Qの内側に音響信号XAの音高PAがある場合の音高PAの補正量(補正値Aの絶対値)が、補正範囲Qの外側に音高PAがある場合の音高PAの補正量を上回るように、音響信号XAの音高PAを補正する要素として表現される。
(2)許容範囲Rや補正範囲Q(BL1,BL2,BH1,BH2)を補正値設定部52(状態制御部62)が可変に制御することも可能である。例えば、入力装置(図示略)に対する利用者からの指示に応じて許容範囲Rや補正範囲Qを可変に制御する構成が好適である。また、以下に例示する各態様も採用される。許容範囲Rや補正範囲Qの制御方法は任意であるが、例えば、低音側補正範囲QLの下限値の音高BL2や高音側補正範囲QHの上限値の音高BH2を維持したまま、許容範囲Rと低音側補正範囲QLとの境界の音高BL1や許容範囲Rと高音側補正範囲QHとの境界の音響BH1を変化させる構成が好適である。
[a]音響信号XAの音量に応じて許容範囲Rや補正範囲Qを制御する構成が採用される。例えば、歌唱音の音量が小さい場合には音高PAの誤差が聴感的に知覚され難いという傾向がある。以上の傾向を考慮すると、音響信号XAの音量が小さいほど、補正値設定部52(状態制御部62)が許容範囲Rを拡大する(補正範囲Qを縮小する)構成が好適である。また、音響信号XAの音量が閾値を下回る場合に音高補正部36の補正動作を停止することも可能である。
[b]音響信号XAの音高PA(歌唱音域)に応じて許容範囲Rや補正範囲Qを制御する構成が採用される。例えば、歌唱音の音高PAが低い場合には音高PAの誤差が聴感的に知覚され難いという傾向がある。以上の傾向を考慮すると、音響信号XAの音高PAや楽曲の目標音高PREFが低いほど、補正値設定部52(状態制御部62)が許容範囲Rを拡大する(補正範囲Qを縮小する)構成が好適である。例えば、目標音高PREF(または音響信号XAの音高PA)が音高C4(約523Hz)である場合には、許容範囲Rが、目標音高PREFに対して-20centから+30centまでの範囲に設定され、目標音高PREFが音高C4の2オクターブ下の音高D2である場合には、許容範囲Rの範囲幅が音高C4の場合の2倍(例えば-40centから+60centまでの範囲)に拡大される。また、音響信号XAの音高PAが閾値を下回る場合に音高補正部36の補正動作を停止することも可能である。
[c]音響信号XAの過去の音高PAと目標音高PREFとの関係(履歴)に応じて許容範囲Rや補正範囲Qを制御する構成が採用される。例えば、音響信号XAの音高PAと目標音高PREFとの異同(歌唱の巧拙)に応じた評価値を楽曲の歌唱中に順次に算定し、評価値が閾値を上回る場合(すなわち歌唱が上手で音高PAの補正の必要性が低い場合)には、補正値設定部52(状態制御部62)が許容範囲Rを拡大する(補正範囲Qを縮小する)構成が好適である。また、評価値が閾値を上回る場合に音高補正部36の補正動作を停止することも可能である。なお、音高PAと目標音高PREFとの異同(歌唱の巧拙)の評価には、公知の歌唱評価技術が任意に採用される。
[d]歌唱音に付与されたビブラートの深度(音高PAの変動の振幅)が大きい場合には音高PAの誤差が受聴者に知覚され難いという傾向がある。以上の傾向を考慮すると、音響信号XAのビブラートの深度が大きいほど、補正値設定部52(状態制御部62)が許容範囲Rを拡大する(補正範囲Qを縮小する)構成が好適である。また、音響信号XAのビブラートの深度が所定の閾値を上回る場合に音高補正部36の補正動作を停止することも可能である。
(3)前述の各形態では、許容範囲Rの低音側および高音側の双方に補正範囲Q(QL,QH)を設定したが、低音側補正範囲QLおよび高音側補正範囲QHの一方のみを設定することも可能である。例えば、目標音高PREFを僅かに下回る音高PAが維持される前述のフラットシンギングを補正対象とする構成では高音側補正範囲QHが省略され得る。
(4)前述の各形態では、補正後の音響信号XBを伴奏音の音響信号Yと混合して放音装置14から再生する場合を例示したが、補正後の音響信号XBの出力方法は適宜に変更される。例えば、音響信号XAの補正後の音響信号XBや音響信号XBに音響信号Yを混合した音響信号ZをCD等の可搬型の記録媒体に格納して利用者に提供することも可能である。また、補正前の音響信号XAと補正後の音響信号XBとを対比的に再生する構成や、補正前の音高PAの時間変化と補正後の音高PBの時間変化とを対比するための画像(例えば図4や図5と同様の画像)を表示装置に表示させる構成も採用される。
(5)前述の各形態では、音響信号XAの音高PAと補正範囲Qとの関係に応じて音高PAを補正する構成(以下「構成A」という)と、音高PAの時間変化率DPに応じて補正動作(動作状態)を制御する構成(以下「構成B」という)との双方を具備する構成を例示したが、構成Aと構成Bとは各々が独立に成立し得る。例えば、前述の各形態から構成Bを省略することも可能である。具体的には、変化率算定部46と図3のステップSA2とが省略され、音高補正部36は、音響信号XAの音高PAが補正範囲Q内にあるか否かに応じて動作状態を第1状態または第2状態に設定する。他方、前述の各形態から構成Aを省略することも可能である。具体的には、音高補正部36は、時間変化率DPが閾値DTHを下回る場合(音高PAの誤差が歌唱技術の不足に起因する場合)には音響信号XAの音高PAを補正し、時間変化率DPが閾値DTHを下回る場合(すなわち音高PAの誤差が意図的な歌唱表現に起因する場合)には音高PAの補正を停止する。
(6)前述の各形態では、音響信号XAの補正後の音響信号XBを伴奏音の音響信号Yに混合したが、伴奏音の再生(再生処理部32,音響生成部34,音響混合部38)は省略され得る。すなわち、音高補正部36による補正後の音響信号XBを放音装置14に供給して再生することも可能である。
(7)携帯電話機やパーソナルコンピュータ等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音高補正装置100を実現することも可能である。例えば、音高補正装置100は、端末装置から受信した音響信号XAから音響信号XBや音響信号Zを生成して端末装置に送信する。なお、音響信号XAの音高PAを端末装置から受信する構成(例えば端末装置が音高検出部42を具備する構成)では音高補正装置100から音高検出部42が省略され、音高PAの時間変化率DPを端末装置から受信する構成(例えば端末装置が変化率算定部46を具備する構成)では音高補正装置100から変化率算定部46が省略される。
以上に例示した各要素の変形や省略を総合的に考慮すると、前述の各形態に係る音高補正装置100は、図7に例示される通り、音響信号XAの音高PAを目標音高PREFに応じて補正することで音響信号XBを生成する音高補正部36を具備する装置として包括的に表現される。音高補正部36は、補正範囲Qの内側に音響信号XAの音高PAがある場合と補正範囲Qの外側に音高PAがある場合とで音高の補正動作を切替える要素として包括的に表現される。補正動作の切替は、音高PAの補正量の増加/減少を切替える第1実施形態の構成と、音高PAの補正の実行/停止を切替える第2実施形態の構成との双方を包含する。
100……音高補正装置、12……収音装置、14……放音装置、22……演算処理装置、24……記憶装置、32……再生処理部、34……音響生成部、36……音高補正部、38……音響混合部、42……音高検出部、44……平滑処理部、46……変化率算定部、52……補正値設定部、54……補正処理部、62……状態制御部、64……設定処理部。
Claims (5)
- 音響信号の音高を目標音高に応じて補正する要素であって、前記目標音高を含む許容範囲外に位置する補正範囲の内側に前記音響信号の音高がある場合に音高の補正量が増加し、前記音響信号の音高が前記補正範囲の外側にある場合に音高の補正量が減少するように、前記音響信号の音高を補正する音高補正部
を具備する音高補正装置。 - 音響信号の音高を目標音高に応じて補正する要素であって、前記目標音高を含む許容範囲外に位置する補正範囲の内側に前記音響信号の音高がある場合に音高の補正を実行し、前記音響信号の音高が前記補正範囲の外側にある場合に音高の補正を停止する音高補正部
を具備する音高補正装置。 - 前記補正範囲は、前記許容範囲の低音側に位置する低音側補正範囲と、前記許容範囲の高音側に位置する高音側補正範囲とを含む
請求項1または請求項2の音高補正装置。 - 前記音高補正部は、前記音響信号の音高の時間変換率の絶対値が閾値を下回るときには、前記音響信号の音高が前記補正範囲の内側にある場合に音高の補正量が増加し、前記音響信号の音高が前記補正範囲の外側にある場合に音高の補正量を減少させる一方、前記時間変化率の絶対値が前記閾値を上回るときには、前記音響信号の音高が前記補正範囲の内側にあるか否かに関わらず音高の補正量を減少させる
請求項1の音高補正装置。 - 前記補正値設定部は、前記音響信号の音量、前記音響信号の音高、前記音響信号の音高と前記目標音高との関係の評価値、前記音響信号のビブラートの深度の少なくともひとつに応じて前記補正範囲を制御する
請求項1から請求項4の何れかの音高補正装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013166366A JP2015034923A (ja) | 2013-08-09 | 2013-08-09 | 音高補正装置 |
PCT/JP2014/070565 WO2015020025A1 (ja) | 2013-08-09 | 2014-08-05 | 音高補正装置及び音高補正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013166366A JP2015034923A (ja) | 2013-08-09 | 2013-08-09 | 音高補正装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015034923A true JP2015034923A (ja) | 2015-02-19 |
Family
ID=52461356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013166366A Withdrawn JP2015034923A (ja) | 2013-08-09 | 2013-08-09 | 音高補正装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2015034923A (ja) |
WO (1) | WO2015020025A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017090546A (ja) * | 2015-11-04 | 2017-05-25 | Jeインターナショナル株式会社 | 音声補正方法、音声補正プログラム、音声補正装置および音声補正システム |
JP2018072698A (ja) * | 2016-11-02 | 2018-05-10 | ヤマハ株式会社 | 信号処理方法、および信号処理装置 |
CN108172232A (zh) * | 2018-01-19 | 2018-06-15 | 北京小唱科技有限公司 | 音频修正方法及装置 |
JP2020106766A (ja) * | 2018-12-28 | 2020-07-09 | ヤマハ株式会社 | 演奏補正方法および演奏補正装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108810075B (zh) * | 2018-04-11 | 2020-12-18 | 北京小唱科技有限公司 | 基于服务器端实现的音频修正系统 |
CN114402380A (zh) * | 2019-09-27 | 2022-04-26 | 雅马哈株式会社 | 音响信号解析方法、音响信号解析系统及程序 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143177A (ja) * | 1996-11-14 | 1998-05-29 | Yamaha Corp | カラオケ装置 |
JPH10161681A (ja) * | 1996-12-04 | 1998-06-19 | Xing:Kk | 楽音発生装置 |
JP2003036085A (ja) * | 2001-07-25 | 2003-02-07 | Daiichikosho Co Ltd | ピッチシフター付きカラオケ装置 |
JP2007316261A (ja) * | 2006-05-24 | 2007-12-06 | Casio Comput Co Ltd | カラオケ装置 |
JP2009169103A (ja) * | 2008-01-16 | 2009-07-30 | Yamaha Corp | 練習支援装置 |
JP2011221064A (ja) * | 2010-04-05 | 2011-11-04 | Brother Ind Ltd | カラオケシステム |
JP2013003430A (ja) * | 2011-06-20 | 2013-01-07 | Xing Inc | カラオケ装置 |
-
2013
- 2013-08-09 JP JP2013166366A patent/JP2015034923A/ja not_active Withdrawn
-
2014
- 2014-08-05 WO PCT/JP2014/070565 patent/WO2015020025A1/ja active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143177A (ja) * | 1996-11-14 | 1998-05-29 | Yamaha Corp | カラオケ装置 |
JPH10161681A (ja) * | 1996-12-04 | 1998-06-19 | Xing:Kk | 楽音発生装置 |
JP2003036085A (ja) * | 2001-07-25 | 2003-02-07 | Daiichikosho Co Ltd | ピッチシフター付きカラオケ装置 |
JP2007316261A (ja) * | 2006-05-24 | 2007-12-06 | Casio Comput Co Ltd | カラオケ装置 |
JP2009169103A (ja) * | 2008-01-16 | 2009-07-30 | Yamaha Corp | 練習支援装置 |
JP2011221064A (ja) * | 2010-04-05 | 2011-11-04 | Brother Ind Ltd | カラオケシステム |
JP2013003430A (ja) * | 2011-06-20 | 2013-01-07 | Xing Inc | カラオケ装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017090546A (ja) * | 2015-11-04 | 2017-05-25 | Jeインターナショナル株式会社 | 音声補正方法、音声補正プログラム、音声補正装置および音声補正システム |
JP2018072698A (ja) * | 2016-11-02 | 2018-05-10 | ヤマハ株式会社 | 信号処理方法、および信号処理装置 |
CN108172232A (zh) * | 2018-01-19 | 2018-06-15 | 北京小唱科技有限公司 | 音频修正方法及装置 |
JP2020106766A (ja) * | 2018-12-28 | 2020-07-09 | ヤマハ株式会社 | 演奏補正方法および演奏補正装置 |
CN113228158A (zh) * | 2018-12-28 | 2021-08-06 | 雅马哈株式会社 | 演奏校正方法及演奏校正装置 |
CN113228158B (zh) * | 2018-12-28 | 2023-12-26 | 雅马哈株式会社 | 演奏校正方法及演奏校正装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2015020025A1 (ja) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015020025A1 (ja) | 音高補正装置及び音高補正方法 | |
JP3179468B2 (ja) | カラオケ装置及びカラオケ装置における歌い手の歌唱の補正方法 | |
JP4237768B2 (ja) | 音声処理装置、音声処理プログラム | |
US8315855B2 (en) | Voice processing apparatus and method | |
JP6701864B2 (ja) | 音評価装置および音評価方法 | |
JP4481225B2 (ja) | 重唱曲における模範歌唱の再生制御に特徴を有するカラオケ装置 | |
JP4480650B2 (ja) | ピッチ制御装置及びピッチ制御プログラム | |
JP2011215292A (ja) | 歌唱判定装置およびカラオケ装置 | |
WO2020137829A1 (ja) | 演奏補正方法および演奏補正装置 | |
JP4525134B2 (ja) | 音圧周波数特性調整装置、プログラム、楽曲再生装置 | |
JP6737300B2 (ja) | 演奏解析方法、演奏解析装置およびプログラム | |
JPH04298793A (ja) | 自動演奏切替え機能付き音楽再生装置 | |
JP5618743B2 (ja) | 歌唱音声評価装置 | |
JP5585320B2 (ja) | 歌唱音声評価装置 | |
JP2016161831A (ja) | 歌唱評価装置およびプログラム | |
JP5703555B2 (ja) | 楽音信号処理装置及びプログラム | |
JP6497025B2 (ja) | 音声処理装置 | |
JP6295691B2 (ja) | 楽曲処理装置および楽曲処理方法 | |
JP5024136B2 (ja) | 音処理装置およびプログラム | |
JP2007033471A (ja) | 歌唱採点装置、及びプログラム | |
JP4168391B2 (ja) | カラオケ装置、音声処理方法及びプログラム | |
JP6654404B2 (ja) | 音声補正方法、音声補正プログラム、音声補正装置および音声補正システム | |
JP6175034B2 (ja) | 歌唱評価装置 | |
JP2000078685A (ja) | 音響装置 | |
JP5714774B2 (ja) | 振動信号生成装置及び方法、コンピュータプログラム、記録媒体並びに体感音響システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170822 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20180223 |