JP2019101273A - 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム - Google Patents
押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム Download PDFInfo
- Publication number
- JP2019101273A JP2019101273A JP2017232846A JP2017232846A JP2019101273A JP 2019101273 A JP2019101273 A JP 2019101273A JP 2017232846 A JP2017232846 A JP 2017232846A JP 2017232846 A JP2017232846 A JP 2017232846A JP 2019101273 A JP2019101273 A JP 2019101273A
- Authority
- JP
- Japan
- Prior art keywords
- data
- evaluation
- question
- unit
- comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 242
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 34
- 239000000284 extract Substances 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 60
- 230000008569 process Effects 0.000 claims description 19
- 230000002940 repellent Effects 0.000 claims description 14
- 239000005871 repellent Substances 0.000 claims description 14
- 238000012854 evaluation process Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 description 14
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 208000003028 Stuttering Diseases 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000001846 repelling effect Effects 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
Description
第1実施形態の全体構成について図1〜図5を参照して説明する。なお、図1においてはスマートフォン等の端末機器による実施形態を示しているが、これは一例である。すなわち、後述する押韻評価ロジックをその他、様々な形態で実施することが可能である。
図1に示すように、ユーザ端末100は、第1入出力部110、記憶部120、第1制御部C、表示部Dを含んで構成される。第1入出力部110は、入力部110aと、送受信部110bとを含む。入力部110aは、音声や文字入力信号等の外部入力を受けるデバイスである。例えば音声を検知するデバイス(マイクロフォン等)、または文字入力を行うデバイス(ソフトウェアキーボードまたはハードウェアキーボード)等が挙げられる。送受信部110bは、外部装置(例えば図1のサーバー200)との間でデータを送信し、また受信するためのインターフェースである。記憶部120は参照データや後述の押韻評価処理に関するコンピュータプログラム等を記憶する。また第1入出力部110は音声出力部110cを備えていてもよい。
・母音「a(あ)」、「i(い)」、「u(う)」、「e(え)」、「o(お)」、
・子音「k(カ行)」「s(サ行)」、「t(タ,テ,ト等)」、「c(チ,ツ等)」、「n(な行)」、「h(ハ行)」、「m(マ行)」、「r(ラ行)」、「g(ガ行)」、「z(ザ行)」、「d(ダ行)」、「b(バ行)」、「p(パ行)」、
・半母音「j(ヤ行)」、「w(ワ行)」、
・特殊モーラ「n(撥音)」、「q(促音)」、「h(長音)」
があり、このうち、登録された要素ごとに抽出された少なくとも母音が対応付けて付加されていてもよい。また例えば「的(まと)」と「マント」を区別するため、撥音が対応づけられていてもよい。また、例えば「遠く」と「トーク」を区別するため、長音と母音の重なりを識別するために、母音および撥音だけでなく、長音が対応付けられていてもよい。これらと同様に、促音や拗音を識別するように促音や拗音が対応付けられていてもよい。
出題部130は、押韻評価処理をするための「お題」としての出題データを決定し、ユーザに対する問題として出力する。この出力の一例として、出題部130は出題データに基づく文字列を表示部Dに表示させる。あるいは出題部130により、任意の音声出力デバイス(音声出力部110cや外部デバイス等)を介して出題データが音声として出力されてもよい。
生成部140は、第1入出力部110の入力部110aが検知した外部入力に基づき、対比データを生成する。この外部入力としては、ユーザが発声した音声、キーボード等のハードウェアキーの移動または押圧、タッチパネルのいずれかの検出位置に対する指またはタッチペン等の接触、タッチパネルのいずれかの検出位置に対する指またはタッチペン等の近接等が挙げられる。
対比データ判定部150は、記憶部120に記憶された対比データを読み出す。日本語を基礎とした押韻評価処理プログラムにしたがう場合、対比データ判定部150は、参照データを参照した上で、読み出した対比データにおける自立語の存在の有無、またはラップ用語の存在の有無を判定する。これらのいずれかが存在する場合、対比データ判定部150は、他に付属語および接辞があるか判定する。このようにして、対比データ判定部150は、対比データを構成する形態素を識別する。
抽出部160は、対比データの母音や撥音等を評価データとして抽出する。この抽出のタイミングは、対比データの判定処理の後でもよく、あるいは生成部140による対比データの作成処理に並行して行うことも可能である。例えば、音声認識であれば検知した音声の波形から、生成部140が音響モデル等を用いて音素を識別して音声認識することが考えられる。この場合、対比データの生成において、すでに母音や撥音等に相当する音素(評価データ)が識別されているので、抽出部160は、すでに対比データ内の音素の識別が済んでいる状態で、容易に母音等のみを抽出することができる。したがって、抽出部160は対比データの作成処理に並行して、母音および撥音、あるいは母音、撥音、拗音、促音および長音のうち予め設定された音素を抽出してもよい。
評価部170は、押韻評価処理プログラムにしたがって、評価対象として特定された音素の種別(例えば母音または撥音)に基づき、評価データと出題データとを次のように対比する。上記のように、ユーザに対しての問いともいえる出題データの音素は、一例として予め出題データの付帯情報として付加されている。評価部170は、そのうち評価対象として特定された音素の種別のみを抽出する。出題データの付帯情報において、すでに評価対象種別の音素のみが抽出された状態で付加されていれば評価部170は付帯情報そのものを取得する。
第1基準によると、評価部170は、出題データの母音等と評価データの完全一致をもって押韻の評価、すなわち適否のみを判定する。具体的には対比の結果、出題データの母音等と評価データとの間で「音数が一致しており」、かつ「音素の並び順通りに同じ音が配列されている」という条件の双方が成就すれば完全一致となる。評価部170は、完全一致の場合のみ「押韻成功」という判定をし、その旨の内容を任意の方法で出力する。完全一致でない場合は「押韻失敗」という判定をし、その旨の内容を任意の方法で出力する。例えば出題データ(問い)が「つくえ」であるのに対し、対比データ(答え)が「するめ」であれば、両者とも評価対象となる母音等は「う」、「う」、「え」となる。つまり両者とも「3音」であり、第1音目が「う」、第2音目が「う」、第3音目が「え」という点で、一致する音の並び順も合致している(全体が同音同配列)ので、評価は「押韻成功」となる。
第2基準によると、評価部170は押韻の適否のみの2段階で評価を行う点で同様であるが、出題データの母音等と評価データの完全一致がなくても、評価が「押韻成功」となる場合がある点において、第1基準と異なる。第2基準において評価部170は、「評価データの音数が、出題データの音数以上」であり、かつ「評価データの少なくとも一部において出題データの母音等の並び順通りに同じ音が配列されている」という条件の双方が成就すれば「押韻成功」という判定をし、その旨の内容を任意の方法で出力する。この条件であれば、完全一致だけでなく、両者の音数にずれがあっても、押韻成功となる可能性がある。例えば出題データ(問い)が「つくえ」であれば、出題データの母音等は「う」、「う」、「え」となる。これに対し、対比データ(答え)が「こむすめ」であれば音数は前者が「3音」であるのに対し、評価データの音数は「4音」であり音数にはずれがある。しかし、「評価データにおいて出題データの音数以上」という第1の条件は成就する。また出題データの第1音目が「う」、第2音目が「う」、第3音目が「え」に対し、評価データを2音目から対比すると、同じく「う」、「う」、「え」と一致する音の並び順が合致しているので、評価データの一部が同音同配列となり、第2の条件も成就する。したがって、第2基準における評価は「押韻成功」となる。
第3基準は、第2基準の変形例である。第3基準によると、評価部170は押韻の適否のみの2段階で評価を行う点で同様であるが、音数の条件が異なる。つまり第3基準においては、第1の条件が「評価データの音数が、出題データの音数以下」であり、かつ第2の条件が「出題データの母音等の並び順を基準として、出題データの音数の1/2以上においてその並び通りに同じ音が配列されている」である。第3基準ではこれら条件の双方が成就すれば「押韻成功」という判定をし、その旨の内容を任意の方法で出力する。この基準によれば、上記の対比データ(答え)が「こむすめ」である場合に第1の条件を満たさず(問題が「つくえ」であれば3音以下が条件)「押韻失敗」となる。
第4基準は、第2基準の変形例である。第4基準においても、評価部170は押韻の適否のみの2段階で評価を行う点において、第2基準と同様である。第4基準において第1の条件は「評価データの音数が、出題データの音数以上」である。第2の条件は「出題データの母音等の並び順を基準として、出題データの音数の1/2以上において連続してその並び通りに同じ音が配列されている」という条件である。さらに第3の条件として「評価データにおいて、出題データの母音等の並び順の第1音目および第2音目のうち少なくとも一方に同じ音が配列されている」という条件が付加される。第4基準は第1の条件〜第3の条件のすべてが成就すれば「押韻成功」という判定をし、その旨の内容を任意の方法で出力する。この条件であれば、第2・第3基準に対して押韻成功となる範囲が異なる。
第5基準は、第1〜第4基準と異なり、押韻成功と押韻失敗の評価のほかに、出題データの母音等と評価データの合致度を算定して、その度合いに応じた複数のランク分けによる評価もともなう。例えば、出題データの母音等と評価データの合致度が100%であればSランク、100%未満かつ75%以上であればAランク、75%未満かつ66%以上であればBランク、66%未満・50%以上であればCランクとする。これらのランクはすべて「押韻成功」とし評価ランクとともに出力される。また合致度が50%未満であれば「押韻失敗」と判定する。さらにこのランク分けの変形例として、音数の多さごとに高ランクとなるための条件を厳しくしてもよい。例えば、出題データが8音であるときは、合致度が60%以上でAランクとなるという条件があるときに、出題データが4音であるときはAランクに分類されるための合致度を75%以上必要とするといった条件が考えられる。
第6基準は、第5基準を変形し、2語以上を含む評価データの評価を行うためのものである。この基準において、例えば単語ごとに「3音以上連続して同音で並び順が合致していれば合致と評価する」という第1の条件を成就するか評価する。また第6基準においては、第1の条件を満たさずとも、出題データの単語ごとに第4基準の第2の条件「出題データの母音等の並び順を基準として、出題データの音数の1/2以上において連続してその並び通りに同じ音が配列されている」および第4基準の第3の条件「評価データにおいて、出題データの母音等の並び順の第1音目と第2音目の少なくとも一方に同じ音が配列されている」の双方を満たすかどうか評価し、双方を満たせば合致度を算定する。さらに出題データが単語(または自立語。以下同じ)A+Bによって構成され、評価データが単語C+Dによって構成されていれば、AとCの対比、AとDの対比、BとCの対比、BとDの対比を行い、合致度が高い方の2つの評価を抽出して平均値を算定する構成であってもよい。これは3語以上の対比であれば抽出する評価数は3でその平均値が算定される。
第6基準は、評価データについて単語境界を識別して評価データの判定をする方法であるが、第7基準は単独で自然言語としての意味を有するブロックに分割するのではなく、既定の文字数ごとに分割して評価を行う。なお、第7基準は、自然言語の基準において評価データ、出題データを複数ブロックに分割するのではなく、既定の音素数ごとに分割して評価を行う全ての方法を含むものである。つまり、第7基準では評価データにおいて連続する2音素以上のブロックを複数作成し、その各ブロックを、同様に分割した出題データの音素のブロックそれぞれと対比(探索)していき、あらかじめ設定した合致数や合致度を満たすかについて判定する。以下の説明はその一例を示すものである。
評価データの分割数が「2」と設定されていれば、評価部170は評価データを「おお(とっきょ)」、「おい(ちょうに)」、「うお(にゅうちょう)」、「うう(する)」と分割する。その上で評価部170は、1番目のブロックの後に続く2番目のブロック「おい」の先頭の1文字を1番目のブロックの末尾に結合する。同様に、2番目のブロックの後に続く3番目のブロック「おい」の先頭の1文字を2番目のブロックの末尾に結合する。このようにして評価データを分割し、一部結合するという処理が繰り返されると、「おおお(とっきょちょ)」、「おいう(ちょうににゅ)」、「うおう(にゅうちょうす」、「うう(する)」という4つのブロックが作成される。
第7基準は、押韻成功と押韻失敗の評価のほかに、第1基準〜第6基準のいずれかにおいて出題データの母音等と評価データとの合致数を評価として計数し、それをポイントとして出力(文字による表示または音声出力)する。第7基準においては、評価の度にポイントを記憶部120等に記憶させ、加算していく。この場合、後述の図8(B)に示すように、ユーザごとの累計ポイントのランキングを表示する構成であってもよい。
図1に示すように、サーバー200は、第2入出力部210、サーバー記憶部220、第2制御部SCを含んで構成される。第2入出力部210は、端末装置(例えば図1のユーザ端末100)との間でデータを送信し、また受信するためのインターフェースである。サーバー記憶部220は、参照データや後述の押韻評価処理に関するコンピュータプログラム等を記憶しており、第2制御部SCが、ユーザ端末100からのデータ取得要求に応じて参照データおよび押韻評価処理に関するコンピュータプログラムや、これらの更新データを第2入出力部210を介して送信する。
図7は、実施形態に係る押韻評価プログラムによる押韻評価処理の流れを示すフローチャートである。例えば第1制御部Cは、以下の動作を示す押韻評価プログラムを実行する。なお、以下の動作(S01〜S11)の前提として例えば次のような処理が行われる。ユーザ端末100において入力部110aを介して押韻評価プログラムの起動操作がなされると、第1制御部Cは、第1記憶部120に記憶された押韻評価プログラムを読み出し、実行する。第1制御部Cは押韻評価プログラムの開始を促すメッセージ文章が含まれた画面データに基づき、初期画面(例えば図2(A))を表示部Dに表示させる。次に入力部110aを介して押韻評価プログラムの開始操作がなされると(図2(A)の「START」キーの選択操作等)、第1制御部Cは、押韻評価プログラムの処理モードの選択等を促すメッセージ文章が含まれた画面データに基づき、モード選択画面を表示部Dに表示させる(例えば図2(B))。次に押韻評価プログラムの処理モードの選択がなされると(図2(B)の「PRACTICE」キーの選択操作等)、第1制御部Cは、プログラムにしたがって、所定間隔でカウントダウンをする画面データ(例えば3段階の画面遷移がなされる (例えば図3(A)〜(C))を順次読み出して表示部Dに表示させる。このような画面遷移を経て、図3の例であれば次の4段階目の画面遷移で次の出題データの表示処理(図4)に移行される。
第1実施形態の押韻評価プログラムによれば、従来の歌唱評価技術と異なる評価軸において評価されるラップ音楽、ヒップホップといった楽曲の評価をすることが可能となる。さらに、フリースタイルラップとなると、ジャズと同じく、即興で演奏される音楽という側面がある。つまりフリースタイルラップでは一つの正解が予め存在する音楽と違い、従来の歌唱評価技術による評価は非常に困難であったが、実施形態の押韻評価プログラムによれば、押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
第2実施形態にかかるユーザ端末100およびサーバー200について図9および図10を参照して説明する。以下の説明において、第1実施形態と重複する説明は割愛する。
第2実施形態におけるユーザ端末100は、第1制御部Cにおいて出題機能、生成機能、対比データ判定機能、評価機能、および抽出機能を実行せず、これら機能はサーバー200の第2制御部SCにより実行される。また第1実施形態の記憶部120に記憶されていた、参照データ、出題データ、各種画像を生成するための画像フレーム等はサーバー200のサーバー記憶部220に記憶される。
第2実施形態のサーバー200は、第2制御部SCにおいて出題部130A、生成部140A、対比データ判定部150A、抽出部160A、および評価部170Aを含んで構成される。これら各機能は、ユーザ端末100側の入力部110aへの入力に基づき、そのデータが第1入出力部110および第2入出力部210を介して第2制御部SCが受信することにより実行される。この点を除き、これら各機能は第1実施形態と概ね同様であり説明が重複するため割愛する。
図10は、第2実施形態に係る押韻評価プログラムによる押韻評価処理の流れを示すフローチャートである。例えば、第2制御部SCは、以下の動作を示す押韻評価プログラムを実行する。なお、以下の動作(S21〜S31)の前提として第1実施形態同様に例えば次のような処理が行われる。ユーザ端末100において入力部110aを介して押韻評価プログラムの起動操作がなされると、第1制御部Cは、送受信部110bを介して第2制御部SCに押韻評価プログラムの起動要求をする。第2制御部SCは、サーバー記憶部220に記憶された押韻評価プログラムと初期画面の画像フレームとを読み出し、第2入出力部210を介してユーザ端末100へ送信する。第1制御部Cは、受信した押韻評価プログラムを起動し、さらにサーバー200側で作成された初期画面の表示データを受け表示部Dに表示させる。その後も、第1実施形態における入力部110aを介した指示が押韻評価処理プログラムの進行にしたがって実行される。その結果、送受信部110bを介して第2制御部SCにその進行状況に応じた指示要求が送信され、第1実施形態と同様の処理が実行される。したがって、第1実施形態と同様にサーバー200の各機能の実行により図3のような画面遷移を経て、4段階目の画面遷移で次の出題データの表示処理(図4)に移行される。
第2実施形態の押韻評価プログラムによれば、従来の歌唱評価技術と異なる評価軸において評価されるラップ音楽、ヒップホップといった楽曲の評価をすることが可能となる。さらに、フリースタイルラップとなると、ジャズと同じく、即興で演奏される音楽という側面がある。つまりフリースタイルラップでは一つの正解が予め存在する音楽と違い、従来の歌唱評価技術による評価は非常に困難であったが、実施形態の押韻評価プログラムによれば、押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
第3実施形態にかかるユーザ端末100、サーバー200、ウェブサーバー300、APIサーバー400およびアプリケーションサーバー500について図11を参照して説明する。以下の説明において、第2実施形態と重複する説明は割愛する。
全体のシステムとしては、次のように構成される。ユーザ端末100は、ウェブサーバー300と接続されており、サーバー200およびアプリケーションサーバー500に対して、ウェブサーバー300とAPIサーバー400とが接続されている。第3実施形態では、ユーザ端末100がユーザに対する直接的な入出力機能(文字入力機能や音声入力機能と、表示機能)を実行する。ウェブサーバー300は、各装置に対しウェブインターフェース機能を提供する。サーバー200はアプリケーションサーバー500が提供するアプリケーション(例えばゲームや学習プログラム)の一部の機能として、押韻評価処理を実行する。アプリケーションサーバー500は、サーバー200が実行する押韻評価処理を一部の機能として有するアプリケーションをウェブサーバー300を介してユーザ端末100に提供する機能を実行する。APIサーバー400は、アプリケーションサーバー500が提供するアプリケーションにおいて、サーバー200における押韻評価処理プログラムを利用するためのアプリケーション間のインターフェース機能を実行する。
アプリケーションサーバー500が提供するアプリケーションを実行するために入力部110aと、送受信部110b、音声出力部110cと表示部Dと、これらを制御する第1制御部Cとを含んで構成される。
ウェブサーバー300は、第3入出力部310と第3制御部WCを含んで構成される。第3入出力部310は、例えば第1制御部Cにより実行されるウェブブラウザを介し、ユーザ端末100のユーザの操作に応じたゲームプログラム等の実行指示を受ける。第3制御部WCは、第3入出力部310を介してアプリケーションサーバー500に対し、当該実行指示を送信する。なお、ウェブサーバー300を介さず、ユーザ端末100にアプリケーションサーバー500からアプリケーションが提供されてもよい。
アプリケーションサーバー500は、第5入出力部510と第5制御部WCを含んで構成される。第5入出力部510は、例えばウェブサーバー300からゲームプログラム等の実行指示を受ける。第5制御部ASCは、当該実行指示に基づき、外部装置(図示しないデータベースサーバー等)または内部の記憶装置(不図示)からゲームプログラム等と初期画面の画像フレームとを読み出し、ウェブサーバー300を介してユーザ端末100に当該プログラムの初期画面の表示用データを送信する。また、後述のようにゲームプログラム等において押韻評価処理のリクエストがあった場合、第5制御部ASCは、APIサーバー400を介してサーバー200が提供する押韻評価機能をゲームプログラム等において利用する。
第4入出力部410と第4制御部APCを含んで構成される。第4入出力部410は、アプリケーションサーバー500から押韻評価処理の実行指示を受信する。第4制御部APCは、その実行指示に基づき、ゲームプログラム等において、押韻評価処理プログラムを利用するための各処理を実行する。第4制御部APCは、第4入出力部410を介して押韻評価処理プログラムの実行指示をサーバー200に送る。なお、APIサーバー400を設けず、サーバー200にアプリケーション間のインターフェース機能を設けてもよい。
第3実施形態のサーバー200の構成は概ね第2実施形態と同様である。すなわち、第2制御部SCにおいて出題部130A、生成部140A、対比データ判定部150A、抽出部160A、および評価部170Aの各機能が実行される。第2制御部SCは処理結果を、APIサーバー400を介してアプリケーションサーバー500に送信する。なお、第3実施形態においては、図11に示す一例として参照データや出題データ等が外部装置である参照データベースに記憶されている。サーバー200は、押韻評価処理プログラムの各機能の実行において参照データベースにおける参照データや出題データ等を参照して当該各機能を実行する。
第3実施形態においてもサーバー200において押韻評価処理を実行している。この処理結果が、アプリケーションサーバー500が提供するアプリケーションプログラムによりユーザに提供される。このような構成によれば、従来の歌唱評価技術と異なる評価軸において評価されるラップ音楽、ヒップホップといった楽曲の評価をすることが可能となる。さらに、フリースタイルラップとなると、ジャズと同じく、即興で演奏される音楽という側面がある。つまりフリースタイルラップでは一つの正解が予め存在する音楽と違い、従来の歌唱評価技術による評価は非常に困難であったが、実施形態の押韻評価プログラムによれば、押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
第4実施形態は、上記第1実施形態〜第3実施形態のいずれかにおける押韻評価処理の実行において、対比データが文字入力によって行われる場合についてのものである。以下、図12、図13および図14を用い、第1実施形態の構成に基づいた第4実施形態の動作について説明する。
第4実施形態の押韻評価プログラムによれば、従来の歌唱評価技術と異なる評価軸において評価されるラップ音楽、ヒップホップといった楽曲の評価をすることが可能となる。さらに、フリースタイルラップとなると、ジャズと同じく、即興で演奏される音楽という側面がある。つまりフリースタイルラップでは一つの正解が予め存在する音楽と違い、従来の歌唱評価技術による評価は非常に困難であったが、実施形態の押韻評価プログラムによれば、押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
上記第1実施形態〜第4実施形態の変形例1について説明する。上記実施形態の説明においては、一例としていずれもユーザ端末100に表示部Dを備えている構成について図面を参照して説明した。しかしながら表示部Dを備えている構成に限られない。例えば、表示部Dがユーザ端末100に接続された外部装置である場合が考えられる。また、図15に示すようにAIスピーカー700(スマートスピーカー(登録商標))のように、上記押韻評価プログラムにおけるユーザに向けた出題の出力においても、対比データの入力においても、押韻の成否の判定結果の出力においても、すべて音声出力によることが可能であり、視覚的な表示は上記第1実施形態〜第4実施形態に必ずしも必要とされない。この変形例においても、ラップ音楽等の評価をすることが可能であり、さらに、フリースタイルラップのような即興で演じられる押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
上記第1実施形態〜第4実施形態の変形例2について説明する。上記実施形態の説明においては、システム、プログラムにおいて出題データが設定されている例について説明したがこの構成に限られない。例えば、2人以上のユーザが、互いに文字入力または音声入力により、他者に対する出題データを入力し、出題部130はそれを出題部データとして設定してもよい。一方のユーザ端末100において入力された出題データは、例えばLANまたはWANを介して他方のユーザ端末に送られ、当該データを受信した端末の出題部130が受信データに基づいて問題を設定する。この変形例においても、ラップ音楽等の評価をすることが可能であり、さらに、フリースタイルラップのような即興で演じられる押韻の技量をさまざまな評価基準で評価可能であるので、自由度の高いフリースタイルラップであっても、評価することが可能である。
110 入出力部
120 記憶部
C 制御部
130 出題部
140 生成部
150 対比データ判定部
160 抽出部
170 評価部
Claims (5)
- 単語または節を出題データとして設定する出題部と、
外部入力に基づき、前記出題データと対比される対比データを生成する生成部と、
前記対比データと参照データを比較して、前記出題データと対比可能であるか判定する対比データ判定部と、
前記対比データの母音または撥音を評価データとして抽出する抽出部と、
前記評価データと前記出題データの母音または撥音とを対比し、評価基準データに基づき評価処理を行う評価部と
を具備する押韻評価装置。 - コンピュータの制御方法であって、
単語または節を出題データとして設定する工程と、
入力デバイスからの入力に基づき、前記出題データと対比される対比データを生成する工程と、
前記対比データと参照データを比較させて、前記出題データと対比可能であるか判定させ、その前もしくは後または並列に前記対比データの母音または撥音を評価データとして抽出する工程と、
前記評価データと前記出題データの母音または撥音とを対比する工程と、
評価基準データに基づき評価処理を行う工程と、
を具備するコンピュータの制御方法。 - コンピュータに、
単語または節を出題データとして設定する出題機能と、
入力デバイスからの入力に基づき、前記出題データと対比される対比データを生成する生成機能と、
前記対比データと参照データを比較して、前記出題データと対比可能であるか判定し、その前もしくは後または並列に前記対比データの母音または撥音を評価データとして抽出する判定抽出機能と、
前記評価データと前記出題データの母音または撥音とを対比する対比機能と、
対比結果評価基準データに基づき評価処理を行う評価機能と、
を実行させる押韻評価プログラム。 - 前記参照データには、少なくともいずれか1つの言語における形態素と、該言語を使用する地域におけるラップ用語が含まれ、
前記判定抽出機能は、前記対比データと、前記参照データを対比することにより、前記対比データが、ラップにおける歌詞として成立する場合に前記出題データと対比可能と判定することを特徴とする請求項3記載の押韻評価プログラム。 - 前記対比機能は、前記出題データを構成する形態素を基準として、前記対比データの母音、または撥音と対比していき、
前記評価機能は、前記対比機能による前記対比の結果、その合致数または合致度を求め、評価基準として設定された許容合致数または許容合致度に基づき、前記評価処理を行うことを特徴とする請求項3または4に記載の押韻評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017232846A JP2019101273A (ja) | 2017-12-04 | 2017-12-04 | 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017232846A JP2019101273A (ja) | 2017-12-04 | 2017-12-04 | 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019101273A true JP2019101273A (ja) | 2019-06-24 |
Family
ID=66976888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017232846A Pending JP2019101273A (ja) | 2017-12-04 | 2017-12-04 | 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019101273A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110146478A1 (en) * | 2009-12-22 | 2011-06-23 | Keith Michael Andrews | System and method for policy based automatic scoring of vocal performances |
JP2013020220A (ja) * | 2011-07-13 | 2013-01-31 | Highware Co Ltd | 音声認識装置、自動応答方法及び、自動応答プログラム |
JP2013130678A (ja) * | 2011-12-21 | 2013-07-04 | Ricoh Co Ltd | 手書き文字評価装置及びこれを備えた文字学習支援装置 |
-
2017
- 2017-12-04 JP JP2017232846A patent/JP2019101273A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110146478A1 (en) * | 2009-12-22 | 2011-06-23 | Keith Michael Andrews | System and method for policy based automatic scoring of vocal performances |
JP2013020220A (ja) * | 2011-07-13 | 2013-01-31 | Highware Co Ltd | 音声認識装置、自動応答方法及び、自動応答プログラム |
JP2013130678A (ja) * | 2011-12-21 | 2013-07-04 | Ricoh Co Ltd | 手書き文字評価装置及びこれを備えた文字学習支援装置 |
Non-Patent Citations (1)
Title |
---|
【新作】リズムにノッて韻を踏もう!誰でもいますぐラッパーになれる『イントリズム』, JPN6021038006, 13 April 2016 (2016-04-13), ISSN: 0004735579 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108962217B (zh) | 语音合成方法及相关设备 | |
CN108806656B (zh) | 歌曲的自动生成 | |
Jansen et al. | Rihanna Works Her Multivocal Pop Persona: A Morpho-syntactic and Accent Analysis of Rihanna's Singing Style: Pop culture provides rich data that demonstrate the complex interplay of World Englishes | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
KR100593757B1 (ko) | 외국어 학습효율을 향상시키는 외국어 학습장치 및 이를이용한 온라인 외국어 학습시스템 | |
KR20140071070A (ko) | 음소기호를 이용한 외국어 발음 학습방법 및 학습장치 | |
JP2012037790A (ja) | 音声対話装置 | |
Rakib et al. | Ood-speech: A large bengali speech recognition dataset for out-of-distribution benchmarking | |
Yamamoto et al. | Livo: Sing a song with a vowel keyboard | |
JP2019101273A (ja) | 押韻評価装置、コンピュータの制御方法、及び押韻評価プログラム | |
JP6693176B2 (ja) | 歌詞生成装置および歌詞生成方法 | |
JP2009271117A (ja) | 音声検索装置および音声検索方法 | |
CN111429886B (zh) | 一种语音识别方法及系统 | |
KR101250897B1 (ko) | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 | |
JP2019087123A (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
JP6849977B2 (ja) | テキスト表示用同期情報生成装置および方法並びに音声認識装置および方法 | |
JP6341050B2 (ja) | 演奏支援装置 | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP6538399B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
KR102258386B1 (ko) | 음소 발음 차이를 이용한 가창 가능 여부 판단 방법 및 장치 | |
JP6287754B2 (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
US20240161737A1 (en) | Real-time natural language processing and fulfillment | |
Peters | The relevance of sarcasm in resolving ambiguous references in spoken discourse | |
CN113658609B (zh) | 关键字匹配信息的确定方法、装置、电子设备和介质 | |
KR20020079021A (ko) | 끝말 이어가기 게임 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20200730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20200730 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211004 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220328 |