JP6634897B2 - 歌詞生成装置および歌詞生成方法 - Google Patents

歌詞生成装置および歌詞生成方法 Download PDF

Info

Publication number
JP6634897B2
JP6634897B2 JP2016045856A JP2016045856A JP6634897B2 JP 6634897 B2 JP6634897 B2 JP 6634897B2 JP 2016045856 A JP2016045856 A JP 2016045856A JP 2016045856 A JP2016045856 A JP 2016045856A JP 6634897 B2 JP6634897 B2 JP 6634897B2
Authority
JP
Japan
Prior art keywords
hand
specified
shape
lyrics
singing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016045856A
Other languages
English (en)
Other versions
JP2017162176A (ja
Inventor
入山 達也
達也 入山
竜之介 大道
竜之介 大道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2016045856A priority Critical patent/JP6634897B2/ja
Publication of JP2017162176A publication Critical patent/JP2017162176A/ja
Application granted granted Critical
Publication of JP6634897B2 publication Critical patent/JP6634897B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、歌詞データを生成する歌詞生成装置および歌詞生成方法に関する。
音声合成技術により歌唱音を合成する装置およびアプリケーションソフトウェアが広く用いられている。非特許文献1のポケットミク(登録商標)においては、模擬的に設けられた鍵盤にスタイラスを接触させることによって音高を指定することができる。また、ボタンの操作によって歌詞を構成する文字を指定することができる。指定された音高および文字に基づいて歌唱音が合成され、その歌唱音が出力される。
"歌うキーボードポケット・ミク|大人の科学.net"、[online]、株式会社学研プラス、[平成28年2月23日検索]、インターネット<URL:http://otonanokagaku.net/nsx39/>
しかしながら、上記のポケットミクでは、指定可能な文字が、「あ」、「い」、「う」、「え」および「お」の5つに限定されており、本格的な歌詞を生成することはできない。一方、指定可能な文字数が増やされると、文字を指定するための操作が煩雑になる。
本発明の目的は、煩雑な操作を要することなく、本格的な歌詞を生成することが可能な歌詞生成装置および歌詞生成方法を提供することである。
本発明に係る歌詞生成装置は、接触面に接触したユーザの手の形を認識する形認識手段と、歌詞を構成する歌唱文字のうち認識された手の形に対応する歌唱文字を特定する特定手段と、接触面に接触した手の位置に基づいて、音高を指定する音高指定手段と、特定された歌唱文字および指定された音高に対応する声音を合成する合成手段とを備える。この歌詞生成装置においては、対象物の形に基づいて歌唱文字が特定されるので、歌詞を生成するために煩雑な操作を行う必要がない。また、対象物の形を変化させることによって種々の歌唱文字を使用することができるため、本格的な歌詞を生成することができる。
接触面は、2次元状に配置された複数の操作子を含み、形認識手段は、ユーザの手により操作された操作子の位置および数に基づいて手の形を認識してもよい。この場合、接触面に接触するユーザの手の形によって操作される操作子の位置および数が異なる。そのため、操作される操作子の位置および数に基づいてユーザの手の形を容易に認識することができる。
本発明に係る歌詞生成方法は、接触面に接触したユーザの手の形を認識するステップと、歌詞を構成する歌唱文字のうち認識された手の形に対応する歌唱文字を特定するステップと、接触面に接触した手の位置に基づいて、音高を指定するステップと、特定された歌唱文字および指定された音高に対応する声音を合成するステップとを備える。接触面は、2次元状に配置された複数の操作子を含み、形状を認識するステップは、ユーザの手により操作された操作子の位置および数に基づいて手の形を認識することを含んでもよい。歌詞生成プログラムは、対象物の形を検出するステップと、検出された形に基づいて、歌詞を構成する歌唱文字を特定するステップとを、コンピュータに実行させる。この歌詞生成方法および歌詞生成プログラムによれば、煩雑な操作を要することなく、本格的な歌詞を生成することができる。
本発明によれば、煩雑な操作を要することなく、本格的な歌詞を生成することが可能となる。
本発明の実施の形態に係る歌詞生成装置を含む電子音楽装置の構成を示すブロック図である。 入力部の一例を示す図である。 歌詞生成装置の機能的な構成を示すブロック図である。 スイッチの操作例を示す図である。 歌唱文字の特定の例について説明するための図である。 歌唱文字の対応付けについて説明するための図である。 歌唱文字の対応付けについて説明するための図である。 操作されるスイッチの数と歌唱文字との対応関係の例を示す図である。 手の位置と音高との関係について説明するための図である。 補助スイッチの操作例について説明するための図である。 入力部の変形例を示す図である。 検出圧の一例を示す図である。 感圧センサを用いた場合のスイッチのオンオフの判定条件について説明するための図である。 歌詞生成処理の一例を示すフローチャートである。 入力部の他の操作例について説明するための図である。
以下、本発明の実施の形態に係る歌詞生成装置および歌詞生成方法について図面を用いて詳細に説明する。
(1)電子音楽装置の構成
図1は本発明の実施の形態に係る歌詞生成装置を含む電子音楽装置の構成を示すブロック図である。図1の電子音楽装置1は、入力部2、設定操作子4および表示部6を備える。入力部2、設定操作子4および表示部6はバス19に接続される。
入力部2は、例えばキーパッドからなる。ユーザが入力部2を操作することにより、歌詞を構成する文字(以下、歌唱文字と呼ぶ。)が入力される。入力部2の詳細については後述する。設定操作子4は、例えばオンオフ操作されるスイッチからなり、各種設定を行うために用いられる。表示部6は、例えば液晶ディスプレイを含み、入力または設定等に関する各種情報を表示する。表示部6がタッチパネルディスプレイにより構成されてもよい。
電子音楽装置1は、RAM(ランダムアクセスメモリ)9、ROM(リードオンリメモリ)10、CPU(中央演算処理装置)11、タイマ12、記憶装置13、通信I/F(インタフェース)14および音声出力部16をさらに備える。RAM9、ROM10、CPU11、記憶装置13および音声出力部16はバス19に接続され、タイマ12はCPU11に接続される。外部記憶装置15等の外部機器が通信I/F14を介してバス19に接続されてもよい。RAM9、ROM10、CPU11およびタイマ12がコンピュータを構成する。
RAM9は、例えば揮発性メモリからなり、CPU11の作業領域として用いられるとともに、各種データを一時的に記憶する。ROM10は、例えば不揮発性メモリからなり、システムプログラム、歌詞生成プログラム等のコンピュータプログラムを記憶する。CPU11は、ROM10に記憶された歌詞生成プログラムをRAM9上で実行することにより後述する歌詞生成処理を行う。また、CPU11は、音声合成技術により声音データを合成する。タイマ12は、時間情報をCPU11に与える。
記憶装置13は、ハードディスク、光学ディスク、磁気ディスクまたはメモリカード等の記憶媒体を含む。記憶装置13には、声音データの合成に用いられる音声素片データ群が記憶される。音声素片データ群は、種々の音声素片のサンプリング波形を表す複数の音声素片データを含む。上記の歌詞生成プログラムが記憶装置13に記憶されてもよい。外部記憶装置15は、記憶装置13と同様に、ハードディスク、光学ディスク、磁気ディスクまたはメモリカード等の記憶媒体を含む。音声素片データ群および歌詞生成プログラムが外部記憶装置15に記憶されてもよい。
歌詞生成プログラムは、コンピュータが読み取り可能な記録媒体に格納された形態で提供され、ROM10または記憶装置13にインストールされてもよい。また、通信I/F14が通信網に接続されている場合、通信網に接続されたサーバから配信された歌詞生成プログラムがROM10または記憶装置13にインストールされてもよい。同様に、音声素片データ群が記憶媒体から取得されてもよく、通信網に接続されたサーバから取得されてもよい。
音声出力部16は、デジタルアナログ(D/A)変換回路、増幅器およびスピーカを含み、合成された声音データに基づく声音を出力する。電子音楽装置1において、主として入力部2、RAM9、ROM10およびCPU11が歌詞生成装置100を構成する。
図2は、図1の入力部2の一例を示す図である。図2の入力部2は、ユーザの手(手のひらおよび指)が接触可能な接触面2aを有する。接触面2aには、押下式の複数のスイッチSWがマトリクス状に配置されるとともに、それらの複数のスイッチSWと隣り合うように複数の補助スイッチSWaが配置される。以下の説明においては、複数のスイッチSWの横の並びを行と呼び、縦の並びを列と呼ぶ。図2の例では、複数のスイッチSWが9つの行および9つの列を構成する。また、上の行から下の行へ順に第1行、第2行、・・・、第9行と呼び、左の列から右の列へ順に第1列、第2列、・・・、第9列と呼ぶ。上、下、右および左とは、ユーザが入力部2を平面視した場合の上、下、左および右を意味する。
(2)電子音楽装置の機能的な構成
図3は、歌詞生成装置100の機能的な構成を示すブロック図である。図3に示すように、歌詞生成装置100は、検出部31、特定部32、音高指定部33、合成部34、出力制御部35および補助操作検出部36を含む。検出部31は、操作検出部31aおよび形認識部31bを含む。操作検出部31aは、ユーザによる図2の入力部2のスイッチSWの操作を検出する。形認識部31bは、操作検出部31aにより検出された操作に基づいて、ユーザの手の形を認識する。特定部32は、認識された手の形に対応する歌唱文字を特定する。音高指定部33は、検出された操作に基づいてユーザの手の位置を推定し、推定された位置に基づいて音高を指定する。
合成部34は、特定された歌唱文字および指定された音高に基づいて、音声合成技術により声音データを合成する。具体的には、音声素片データ群から歌唱文字に対応する1または複数の音声素片データが抽出され、指定された音高に対応するように各音声素片データの音高が調整される。その1または複数の音声素片データから声音データが合成される。出力制御部35は、合成された声音データに基づく声音の出力を制御する。補助操作検出部36は、ユーザによる図2の補助スイッチSWaの操作を検出する。後述のように、特定部32、合成部34および出力制御部35は、補助スイッチSWaの操作に応じた処理を行う。
図1のCPU11がROM10または記憶装置13に記憶された歌詞生成プログラムを実行することにより、検出部31、特定部32、音高指定部33、合成部34、出力制御部35および補助操作検出部36が実現される。これらの機能部は、電子回路等のハードウエアにより実現されてもよい。
(3)歌唱文字の特定
ユーザは、図2の入力部2の接触面2aに手を接触させることにより、一部のスイッチSWを操作(押下)する。図4は、スイッチSWの操作例を示す図である。図4の例では、全ての指が伸ばされた状態の手が接触面2aに接触しており、手と重なる位置にある複数のスイッチSWが操作される。図4では、操作されるスイッチSWにハッチングが付される。本例においては、各スイッチSWに、2桁の識別番号が割り当てられる。各識別番号の十の位は行を表し、一の位は列を表す。例えば、“34”は、第3行第4列のスイッチSWを表す。
操作されたスイッチSWの位置および数に基づいてユーザの手の形が認識され、認識された形に対応する歌唱文字が特定される。図5は、歌唱文字の特定の例について説明するための図である。図5(a)の例では、図4の例と同じ状態の手が接触面2aに接触している。この場合、歌唱文字が例えば「ぱ」に特定される。図5(b)の例では、全ての指が折り畳まれた状態の手が接触面2aに接触している。この場合、歌唱文字が例えば「う」に特定される。図5(c)の例では、人差指が伸ばされ、他の指が折り畳まれた状態の手が接触面2aに接触している。この場合、歌唱文字が例えば「ち」に特定される。図5(d)の例では、親指、人差指および中指が伸ばされ、薬指および小指が折り畳まれた状態の手が接触面2aに接触している。この場合、歌唱文字が例えば「ちゃ」に特定される。
接触面2aに接触する手の形と、特定される歌唱文字との間には、相関があることが好ましい。図5の例では、手の広がりの程度が、特定される歌唱文字を発声するときの口の開きの程度と対応している。図5(a)の例のように手の広がりが大きい場合には、口の開きを大きくして発声される歌唱文字「ぱ」が特定され、図5(b)の例のように手の広がりが小さい場合には、口の開きを小さくして発声される歌唱文字「う」が特定される。図5(c)および図5(d)の例では、手の広がりの程度が、図5(a)の例より小さく図5(b)の例より大きい。そのため、口の開きを中程度にして発声される歌唱文字「ち」または「ちゃ」が特定される。
歌唱文字の特定方法について説明する。第1の例として、操作されたスイッチSWの組み合わせに基づいて、歌唱文字が特定される。本例において、入力部2は81個のスイッチWを有するので、操作されるスイッチSWの組み合わせは、理論上では281通り存在する。その全ての組み合わせについて、歌唱文字を対応付けることができる。図6および図7は、歌唱文字の対応付けについて説明するための図である。例えば、図6(a)および図6(b)では、手の形が互いに同じであるが、手の位置が異なる。このように手の位置が異なっても、特定されるべき歌唱文字は同じである。手の形が同じである場合には、操作される複数のスイッチSWの相対位置が同じである。そのため、複数のスイッチSWの相対位置が同じである場合には、スイッチSWの組み合わせが異なっても、共通の歌唱文字が対応付けられる。また、図7(a)の例と図7(b)の例とでは、手の大きさおよび指の位置に微小な差異がある。このような場合でも、特定されるべき歌唱文字は同じである。そのため、複数のスイッチSWの相対位置に微小な差異がある複数の組み合わせにも、共通の歌唱文字が対応付けられる。
複数のスイッチSWの組み合わせと歌唱文字との対応関係が、データベースとして例えば図1の記憶装置13に記憶される。このデータベースを参照することにより、接触面2aに接触する手の形に対応する歌唱文字を特定することができる。
第2の例として、操作されたスイッチSWの特徴量に基づいて、歌唱文字が特定される。特徴量として、例えば、操作されたスイッチSWの数が用いられる。手の広がりが大きいほど、操作されるスイッチSWの数が多い。そのため、操作されたスイッチSWの数に基づいて、手の広がりの程度を推定することができる。図8は、操作されるスイッチSWの数と、特定される歌唱文字との対応関係の例を示す図である。図8の例においても、手の広がりの程度が、特定される歌唱文字を発音するときの口の開きの程度と対応している。例えば、操作されたスイッチSWの数が29以上と多い場合には、口の開きを大きくして発声される「ぱ」が特定され、操作されたスイッチSWの数が1以上7以下と少ない場合には、口の開きを小さくして発声される「ち」が特定される。また、操作されたスイッチSWの数と、破裂音および鼻音等の音の種類とが対応付けられてもよい。例えば、操作されたスイッチSWの数が多い場合には、破裂音を表す歌唱文字が特定され、操作されたスイッチSWの数が少ない場合には、破擦音を表す歌唱文字が特定される。
特徴量として、操作された複数のスイッチSWに割り当てられた識別番号の最小値(図4の例では“33”)、最大値(図4の例では“96”)または平均値が用いられてもよい。あるいは、特徴量として、各列において操作されたスイッチSWの数、または各行において操作されたスイッチSWの数等が用いられてもよい。
(4)音高の指定
本例では、上下方向における接触面2a上での手の位置に基づいて、音高が指定される。図9は、手の位置と指定される音高との関係について説明するための図である。図9(a)〜図9(c)の例において、手の形は互いに同じである。一方、図9(a)の例と比べて、図9(b)の例では手が上方に位置し、図9(c)の例では手が下方に位置する。そのため、図9(a)の例では、音高が例えば“C3”に指定され、図9(b)の例では、音高が例えば“G3”に指定され、図9(c)の例では、音高が例えば“A2”に指定される。“C”、“G”および“A”は音名を表し、“2”および“3”はオクタープの高さを表す。この場合、手の位置の上下が音高の高低に対応する。
例えば、操作された複数のスイッチSWに割り当てられた識別番号の平均値が算出され、識別番号の平均値が大きいほど音高が低くなるように、算出された平均値に基づいて音高が指定される。ただし、手の形によって、操作されるスイッチSWの位置に偏りが生じる。例えば、図5(c)の例では、操作されるスイッチSWが接触面2aの下部に集中しやすいため、識別番号の平均値が大きくなりやすい。そのため、例えば手の形に応じた補正係数が、識別番号の平均値に乗算されることが好ましい。また、識別番号の平均値の代わりに、または識別番号の平均値に加えて、識別番号の最大値および最小値等が用いられてもよい。
このようにして、ユーザによるスイッチSWの操作に基づいて、歌唱文字が特定されるとともに音高が指定される。これらの歌唱文字および音高に基づいて声音データが合成される。合成された声音データに基づいて、特定された歌唱文字が指定された音高で声音として出力(発音)される。
(5)補助スイッチの操作
入力部2の補助スイッチSWa(図2)の操作例について説明する。例えば、手の形と歌唱文字との対応関係が異なる複数の歌詞モードが用意され、その複数の歌詞モードが複数の補助スイッチSWaにそれぞれ割り当てられる。いずれかの補助スイッチSWaが操作されると、その補助スイッチSWaに割り当てられた歌詞モードで歌唱文字が特定される。歌詞モードが異なると、手の形が同じであっても、特定される歌唱文字が異なる。補助スイッチSWaが操作されない場合には、デフォルトの歌詞モードで歌唱文字が特定される。
図10は、補助スイッチSWaの操作例について説明するための図である。図10においては、5つの補助スイッチSWaにそれぞれ符号SWa1,SWa2,SWa3,SWa4,SWa5が付される。図10(a)〜図10(c)の例では、接触面2aに接触する手の形が共通である。図10(a)の例では、補助スイッチSWa1〜SWa5が操作されていないため、デフォルトの歌詞モードで歌唱文字が特定される。特定される歌唱文字は例えば「ぱ」である。図10(b)の例では、親指により補助スイッチSWa2が操作される。そのため、補助スイッチSWa2に割り当てられた歌詞モードで歌唱文字が特定される。特定される歌唱文字は例えば「た」である。図10(c)の例では、親指により補助スイッチSWa3が操作される。そのため、補助スイッチSWa3に割り当てられた歌詞モードで歌唱文字が特定される。特定される歌唱文字は例えば「だ」である。このように、複数の歌詞モードが用意されることにより、歌唱文字の選択の幅が広がる。それにより、高い自由度で歌詞を生成することができる。
補助スイッチSWa1〜SWa5の操作によって、清音が濁音または半濁音に変換されてもよい。例えば、図10(a)の例のように、補助スイッチSWa1〜SWa5が操作されていない場合に、清音の歌唱文字(例えば「は」)が特定される。図10(b)の例のように、補助スイッチSWa2が操作されると、歌唱文字が濁音(例えば「ば」)に変換される。また、図10(c)の例のように、補助スイッチSWa3が操作されると、歌唱文字が半濁音(例えば「ぱ」)に変換される。
補助スイッチSWa1〜SWa5の操作によって声音の出力にエフェクトが付与されてもよい。例えば、補助スイッチSWa1〜SWa5のいずれかが操作されることにより、「ぱ−」という声音が「ぅぱ−」という声音に変換されてもよい。また、補助スイッチSWa1〜SWa5の操作によって音の長さ(音価)が調整されてもよい。例えば、補助スイッチSWa5にピアノのサステインペダルの機能が割り当てられる。この場合、補助スイッチSWa5が押下されている期間は声音の出力が継続される。図10の例では、共通の手(左手)によりスイッチSWおよび補助スイッチSWa1〜SWa5がそれぞれ操作されるが、一方の手(例えば左手)によりスイッチSWが操作され、他方の手(例えば右手)により補助スイッチSWa1〜SWa5が操作されてもよい。
(6)感圧センサ
図11は、図2の入力部2の変形例を示す図である。図11の入力部2が図2の例と異なる点は、各スイッチSWに感圧センサPSが設けられる点である。感圧センサPSは、ユーザの手から各スイッチSWに加わる圧力を検出する。感圧センサPSにより検出される圧力(以下、検出圧と呼ぶ。)を用いて、発音の強度(音量)および音色等を調整することができる。図12は、検出圧の一例を示す図である。図12においては、図4の操作例における各スイッチSWの検出圧が、各スイッチSWに重ねて示される。検出圧は、0以上100以下の相対値で表される。
例えば、操作されたスイッチSWにおける検出圧の平均値が算出される。検出圧の平均値が大きいほど発音の強度が高くなるように、算出された平均値に基づいて発音の強度が調整される。例えば、検出圧が50である場合に発音の強度が標準値に調整される。図12の例では、検出圧の平均値が約35.9であるので、発音の強度が標準値よりも低く調整される。また、操作された複数のスイッチSWにおける検出圧の偏りに基づいて、音色が調整されてもよい。例えば、最も大きな圧力が検出されたスイッチSWが特定され、そのスイッチSWの識別番号が小さいほど音色が明るくなるように、音色が調整される。図12の例では、操作された複数のスイッチSWのうち、“78”のスイッチSWにおける検出圧が80であり、最も大きい。この場合、音色がやや暗く調整される。また、上下方向における検出圧の偏りおよび左右方向における検出圧の偏りに基づいて、2つの音色パラメータが調整してもよい。例えば、上下方向における検出圧の偏りに基づいて音色の明るさが調整され、左右方向における検出圧の偏りに基づいて歪みの大きさが調整されてもよい。また、検出圧の変化に応じて発音の強度および音色等が変化されてもよい。
スイッチSWが操作されているか否かの判定(オンオフ判定)は、感圧センサPSによる検出圧の積算値に基づいて行われることが好ましい。図13は、スイッチSWのオンオフ判定について説明するための図である。図13において、横軸は時間を表し、縦軸は検出圧を表す。図13には、1つの感圧センサPSによる検出値の経時変化が示される。実線は、検出圧の瞬時値を表し、一点鎖線は、検出圧の積算値を表す。図13の例では、検出圧の瞬時値が、時点t1から時点t2までの期間に徐々に上昇し、時点t2から時点t3までの期間に微小な上下変化を繰り返し、時点t3から徐々に下降する。
検出圧の積算値に基づいてオンオフ判定が行われることが好ましい理由は次の通りである。例えば、瞬時値がしきい値より大きいか否かによってオンオフ判定が行われる場合、時点t2から時点t3までの期間のように、一定の範囲内で瞬時値が微小な上下変化を繰り返すことがある。このような瞬時値の微小な変化がしきい値付近で生じると、スイッチSWが断続的に操作されていると判定される可能性がある。声音の出力は、例えば、スイッチSWが操作されていると判定された時点で開始される。そのため、スイッチSWが断続的に操作されていると判定されると、声音が断続的に出力されることとなる。
一方、検出圧の積算値は、下降することなく継続的に上昇する。そこで、図13の例では、検出圧の積算値のしきい値THが設定され、検出圧の積算値がしきい値THを超えると、スイッチSWが操作されていると判定される。これにより、スイッチSWのオンオフ判定を適切に行うことができる。したがって、声音の出力が適切に行われる。検出圧の積算値は、例えば瞬時値が予め定められた下限値よりも低くなると、リセットされる。
なお、LPF(低域通過フィルタ)等によって高周波数成分が除去された瞬時値に基づいて、オンオフ判定が行われてもよい。この場合、瞬時値の微小変化によるオンオフ判定の不安定化を防止することができる。
(7)歌詞生成処理
図14は、図3の各機能部による歌詞生成処理の一例を示すフローチャートである。図14の歌詞生成処理は、図1のCPU11がROM10または記憶装置13に記憶された歌詞生成プログラムを実行することに行われる。
まず、検出部31が、操作検出部31aによりスイッチSWの操作が検出されたか否かを判定する(ステップS1)。スイッチSWの操作が検出されるまで、検出部31がステップS1を繰り返す。スイッチSWの操作が検出されると、検出部31の形認識部31bが、検出されたスイッチSWの操作に基づいて、接触面2aに接触する手の形を認識する(ステップS2)。次に、特定部32が、補助操作検出部36により補助スイッチSWaの操作が検出されたか否かを判定する(ステップS3)。図14の例では、補助スイッチSWaの操作によって歌詞モードが選択される。
補助スイッチSWaの操作が検出された場合、特定部32は、操作された補助スイッチSWaに割り当てられた歌詞モードで、認識された手の形に対応する歌唱文字を特定する(ステップS4)。一方、補助スイッチSWaの操作が検出されない場合、特定部32は、デフォルトの歌詞モードで、認識された手の形に対応する歌唱文字を特定する(ステップS5)。
次に、音高指定部33が、ステップS1で検出されたスイッチSWの操作に基づいて、音高を指定する(ステップS6)。次に、合成部34が、ステップS4またはステップS5で特定された歌唱文字、およびステップS6で指定された音高に基づいて、声音データを合成する(ステップS7)。合成部34は、補助スイッチSWaの操作に基づいて、声音データにおける音価を調整してもよい。次に、出力制御部35が、生成された声音データに基づく声音を出力する(ステップS8)。出力制御部35は、補助スイッチSWaの操作に基づいて、出力される声音にエフェクトを付与してもよい。このようなステップS1〜S8の処理が繰り返される。
(8)実施の形態の効果
本実施の形態に係る歌詞生成装置100においては、操作されたスイッチSWの位置および数に基づいてユーザの手の形が認識され、認識された手の形に対応する歌唱文字が特定される。そのため、ユーザは、操作する手の形を変化させることによって種々の歌唱文字を入力することができる。したがって、煩雑な操作を要することなく、本格的な歌詞を生成することが可能となる。
また、本実施の形態では、入力部2の接触面2aに接触する手の位置に基づいて音高が指定される。これにより、ユーザは、接触面2aに接触する手の位置を調整することにより、出力される声音の音高を容易に調整することができる。したがって、ユーザは、手の形および位置を連続的に変化させることにより、即興的に歌唱音を奏することが可能となる。
(9)他の操作例
(a)接触面2aに接触する手の移動が検出されてもよい。図15は、入力部2の他の操作例について説明するための図である。図15の例では、ユーザの手が接触面2aに接触しつつ左から右に移動する。この場合、ユーザの手が接触面2aに接触した時点で操作されたスイッチSWの位置および数に基づいて、上記実施の形態と同様にして、歌唱文字の特定および音高の指定が行われる。ユーザの手が移動すると、操作されるスイッチSWが連続的に変化する。操作されるスイッチSWの変化に基づいて、ユーザの手の移動が検出される。例えば、上記の識別番号の平均値を連続的に算出し、算出された平均値の変化に基づいて、ユーザの手の移動を検出することができる。
手の移動の検出に基づいて、声音の出力が制御される。例えば、手の移動中には、特定された歌唱文字の子音のみが出力され、手の移動が停止されると、特定された歌唱文字の母音が出力される。「さ」等の摩擦音は、子音の出力時間が長くても違和感が生じにくく、このような制御に適している。
また、接触面2aに接触するユーザの手の移動方向が検出されてもよい。この場合も、識別番号の平均値を用いることができる。検出された移動方向に基づいて、例えば音高が変化される。具体的には、ユーザの手が上に移動されると、音高が上昇され、ユーザの手が下に移動されると、音高が下降される。あるいは、ユーザの手の形およびユーザの手の移動方向に基づいて、歌唱文字が特定されてもよい。例えば、歌唱文字が日本語の五十音である場合、手の形に基づいて、「あ」行および「か」行等の行が特定され、手の移動方向に基づいて、「あ」段および「い」段等の段が特定されてもよい。
(b)入力部2に近接センサが設けられ、ユーザの手に被検出体(例えば、指輪)が取り付けられてもよい。この場合、近接センサによる被検出体の検出に基づいて、声音の出力を制御することができる。例えば、スイッチSWの操作に基づいてユーザの手の形および位置が認識され、近接センサによる被検出体の検出に基づいて、ユーザの手における被検出体の相対位置が特定される。特定された被検出体の相対位置に基づいて、出力される声音の音色が制御される。被検出体が指輪である場合、近接センサによる指輪の検出に基づいて、指輪が嵌められた指を特定することができる。例えば、指毎に音色の明るさが対応付けられ、出力される声音の音色が、特定された指に対応付けられた明るさに調整される。近接センサによってユーザの手と入力部2の接触面2aとの間の距離が検出され、検出された距離に基づいて、出力される声音にエフェクト(例えばビブラート)等が付与されてもよい。
(c)入力部2の接触面2aに右手が接触される場合と左手が接触される場合とで、異なる処理が行われてもよい。例えば、いずれの手が接触面2aに接触されるかによって、手の形と特定される歌唱文字との対応関係が異なってもよく、出力される声音の音色が異なってもよい。右手が接触面2aに接触される場合と、左手が接触面2aに接触される場合とで、操作される複数のスイッチSWの相対位置は、略左右対称となる。そのため、操作されたスイッチSWの数および位置に基づいて、右手が接触面2aに接触しているかあるいは左手が接触面2aに接触しているかを判定することができる。
(10)他の実施の形態
(a)上記実施の形態では、ユーザの手の形に基づいて歌唱文字が特定されるが、他の対象物の形に基づいて歌唱文字が特定されてもよい。他の対象物は、人体の他の部分(例えば口)であってもよく、または人体以外の他の物体であってもよい。
(b)上記実施の形態では、複数のスイッチSWの操作に基づいてユーザの手の形が検出されるが、光学センサ等を用いてユーザの手の形が非接触で検出されてもよく、撮像装置を用いてユーザの手が撮像され、画像解析によってユーザの手の形が検出されてもよい。あるいは、入力部2の接触面2aに、例えば静電容量方式のタッチパネルが用いられ、タッチパネルに接触するユーザの手の形が検出されてもよい。
(c)上記実施の形態では、接触面2aに接触する手の位置に基づいて各歌唱文字に対応する音高が指定されるが、ユーザが設定操作子4等を操作することにより音高が指定されてもよい。また、電子楽器等を用いて音高が指定されてもよい。あるいは、既存の楽曲の旋律データが用いられ、特定された歌唱文字が既存の楽曲の旋律に合わせて出力されてもよい。
(d)図1の音声出力部16は、歌詞生成装置100に搭載されてもよく、歌詞生成装置100の外部装置として設けられてもよい。歌詞生成装置100は、電子音楽装置1に限らず、パーソナルコンピュータ、スマートデバイス(smart device)、ゲーム機器等の電子機器に適用されてもよい。
(11)請求項の各構成要素と実施の形態の各部との対応
以下、請求項の各構成要素と実施の形態の各部との対応の例について説明するが、本発明は下記の例に限定されない。請求項の各構成要素として、請求項に記載されている構成または機能を有する他の種々の要素を用いることができる。
上記実施の形態では、歌詞生成装置100が歌詞生成装置の例であり、検出部31が検出手段の例であり、特定部32が特定手段の例であり、形認識部31bが形認識手段の例であり、音高指定部33が音高指定手段の例であり、合成部34が合成手段の例であり、スイッチSWが操作子の例である。
本発明は、歌詞の生成に用いられる種々の装置に有効に利用可能である。
1…電子音楽装置,2…入力部,2a…接触面,4…設定操作子,6…表示部,9…RAM,10…ROM,11…CPU,12…タイマ,13…記憶装置,16…音声出力部,19…バス,31…検出部,31a…操作検出部,31b…形認識部,32…特定部,33…音高指定部,34…合成部,35…出力制御部,36…補助操作検出部,100…歌詞生成装置,SW…スイッチ,SWa…補助スイッチ

Claims (4)

  1. 接触面に接触したユーザの手の形を認識する形認識手段と、
    歌詞を構成する歌唱文字のうち認識された手の形に対応する歌唱文字を特定する特定手段と、
    前記接触面に接触した手の位置に基づいて、音高を指定する音高指定手段と、
    特定された歌唱文字および指定された音高に対応する声音を合成する合成手段とを備える、歌詞生成装置。
  2. 前記接触面は、2次元状に配置された複数の操作子を含み、
    前記形認識手段は、ユーザの手により操作された操作子の位置および数に基づいて手の形を認識する、請求項記載の歌詞生成装置。
  3. 接触面に接触したユーザの手の形を認識するステップと、
    歌詞を構成する歌唱文字のうち認識された手の形に対応する歌唱文字を特定するステップと、
    前記接触面に接触した手の位置に基づいて、音高を指定するステップと、
    特定された歌唱文字および指定された音高に対応する声音を合成するステップとを備える、歌詞生成方法。
  4. 前記接触面は、2次元状に配置された複数の操作子を含み、
    前記形状を認識するステップは、ユーザの手により操作された操作子の位置および数に基づいて手の形を認識することを含む、請求項3記載の歌詞生成方法。
JP2016045856A 2016-03-09 2016-03-09 歌詞生成装置および歌詞生成方法 Active JP6634897B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016045856A JP6634897B2 (ja) 2016-03-09 2016-03-09 歌詞生成装置および歌詞生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016045856A JP6634897B2 (ja) 2016-03-09 2016-03-09 歌詞生成装置および歌詞生成方法

Publications (2)

Publication Number Publication Date
JP2017162176A JP2017162176A (ja) 2017-09-14
JP6634897B2 true JP6634897B2 (ja) 2020-01-22

Family

ID=59857787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016045856A Active JP6634897B2 (ja) 2016-03-09 2016-03-09 歌詞生成装置および歌詞生成方法

Country Status (1)

Country Link
JP (1) JP6634897B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013114282A (ja) * 2011-11-25 2013-06-10 Sharp Corp 入力システム
JP5935815B2 (ja) * 2014-01-15 2016-06-15 ヤマハ株式会社 音声合成装置およびプログラム
EP3159892B1 (en) * 2014-06-17 2020-02-12 Yamaha Corporation Controller and system for voice generation based on characters
JP6492629B2 (ja) * 2014-12-22 2019-04-03 カシオ計算機株式会社 歌唱生成装置、電子楽器、方法、およびプログラム

Also Published As

Publication number Publication date
JP2017162176A (ja) 2017-09-14

Similar Documents

Publication Publication Date Title
US9299330B2 (en) Apparatus and method to enhance the expressive qualities of digital music
JP7095246B2 (ja) 電子楽器、その制御方法及び制御プログラム
WO2015113457A1 (en) Apparatus and method to enhance expressive qualities of digital music
JP2017507349A (ja) デジタル音楽の表現品質を高めるための装置及び方法
US20150103019A1 (en) Methods and Devices and Systems for Positioning Input Devices and Creating Control
WO2020059245A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
McPherson et al. The space between the notes: adding expressive pitch control to the piano keyboard
JP5549521B2 (ja) 音声合成装置およびプログラム
JP4720563B2 (ja) 楽音制御装置
WO2017125006A1 (zh) 一种电声乐器节奏可控的方法及其对卡拉ok的改进
JP6634897B2 (ja) 歌詞生成装置および歌詞生成方法
JP5879682B2 (ja) 音声合成装置及びプログラム
JP2022001950A (ja) パラメータ制御装置、電子楽器、パラメータ制御方法及び制御プログラム
JP4765705B2 (ja) 楽音制御装置
JP5935815B2 (ja) 音声合成装置およびプログラム
JP5825056B2 (ja) 電子楽器
JP2021081601A (ja) 楽音情報出力装置、楽音発生装置、楽音情報生成方法およびプログラム
JP6149917B2 (ja) 音声合成装置および音声合成方法
JP5750597B1 (ja) 手指運動機能回復支援用の楽器および片手演奏用音楽譜面データの生成システム
JP7430166B2 (ja) 情報処理プログラム、情報処理装置および情報処理方法
JP6358554B2 (ja) 楽音制御装置、楽音制御方法およびプログラム
US8912420B2 (en) Enhancing music
JP7107720B2 (ja) 運指表示プログラム
KR101813557B1 (ko) 디지털 음악의 표현적 특성을 개선하는 장치 및 방법
KR101581138B1 (ko) 음성제어 영상표시 리듬게임 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R151 Written notification of patent or utility model registration

Ref document number: 6634897

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151