JP7082549B2 - カラオケ装置 - Google Patents

カラオケ装置 Download PDF

Info

Publication number
JP7082549B2
JP7082549B2 JP2018161624A JP2018161624A JP7082549B2 JP 7082549 B2 JP7082549 B2 JP 7082549B2 JP 2018161624 A JP2018161624 A JP 2018161624A JP 2018161624 A JP2018161624 A JP 2018161624A JP 7082549 B2 JP7082549 B2 JP 7082549B2
Authority
JP
Japan
Prior art keywords
karaoke
user
score
voice
voiceprint data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018161624A
Other languages
English (en)
Other versions
JP2020034750A (ja
Inventor
政之 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daiichikosho Co Ltd
Original Assignee
Daiichikosho Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daiichikosho Co Ltd filed Critical Daiichikosho Co Ltd
Priority to JP2018161624A priority Critical patent/JP7082549B2/ja
Publication of JP2020034750A publication Critical patent/JP2020034750A/ja
Application granted granted Critical
Publication of JP7082549B2 publication Critical patent/JP7082549B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明はカラオケ装置に関する。
カラオケ装置は、利用者によるカラオケ歌唱を評価し、採点結果を提示する採点機能を有する。カラオケ歌唱の評価は、マイクにより入力された歌唱音声から抽出した歌唱音声データと、カラオケ演奏された楽曲の主旋律を示すリファレンスデータとを比較することにより行う。採点機能を利用することで、利用者同士で採点結果を競い合ったり、カラオケ歌唱の練習成果を確認したりすることができる。
或いは、接待や職場の飲み会のような場においても、場を盛り上げるために採点機能を利用することがある。しかし、従来の採点機能では客観的かつ機械的な採点が行われるため、たとえ接待相手や会社の上司であってもカラオケ歌唱が上手くない場合には、低い採点結果が提示される。そのため、場の雰囲気が悪くなる可能性があった。
そこで、特許文献1には、歌唱者に気づかれることなく操作して採点結果を割り増しする機能を有するカラオケ装置が開示されている。
特開2002-108368号公報
しかし、特許文献1のカラオケ装置によれば、利用者がカラオケ歌唱を行う都度、割り増し採点コマンドを入力する必要があるため、利用者が採点値の割り増しに気づく可能性があった。
本発明の目的は、カラオケ歌唱を行った利用者に気づかれることなく、当該カラオケ歌唱の採点結果を補正可能なカラオケ装置を提供することにある。
上記目的を達成するための主たる発明は、利用者によるカラオケ歌唱を評価し、採点結果を提示する採点機能を有するカラオケ装置であって、所定範囲内に居る全ての利用者の会話音声を集音可能な集音部と、前記カラオケ装置を制御する制御部と、を有し、前記制御部は、集音した前記会話音声から、各利用者の声紋データを抽出する抽出手段、集音した前記会話音声に基づいて各声紋データの序列を決定し、当該序列の情報を当該各声紋データと紐付けて記憶させる決定手段、ある利用者がカラオケ歌唱を行った場合、当該ある利用者の歌唱音声から抽出された声紋認証用データと一致する前記声紋データを特定し、特定された声紋データに紐付けられている前記序列の情報に基づいて、当該ある利用者のカラオケ歌唱の採点結果を補正する補正手段、として機能するカラオケ装置である。
本発明の他の特徴については、後述する明細書及び図面の記載により明らかにする。
本発明によれば、カラオケ歌唱を行った利用者に気づかれることなく、当該カラオケ歌唱の採点結果を補正できる。
第1実施形態に係るカラオケ装置を示す図である。 第1実施形態に係るカラオケ本体のハードウェア構成例を示す図である。 第1実施形態に係る序列の例を示す図である。 第1実施形態に係るカラオケ装置の処理を示すフローチャートである。 第2実施形態に係るカラオケ本体のハードウェア構成例を示す図である。 第2実施形態に係る第1の記憶手段に記憶されているテーブルデータの例を示す図である。 第2実施形態に係る序列の例を示す図である。 第2実施形態に係るカラオケ装置の処理を示すフローチャートである。 第3実施形態に係るカラオケ装置が設置されているカラオケルームを示す図である。 第3実施形態に係るカラオケ本体のハードウェア構成例を示す図である。 第3実施形態に係る第1の記憶手段に記憶されているテーブルデータの例を示す図である。 第3実施形態に係る序列の例を示す図である。 第3実施形態に係るカラオケ装置の処理を示すフローチャートである。
<第1実施形態>
図1~図4を参照して、第1実施形態に係るカラオケ装置について説明する。
==カラオケ装置==
カラオケ装置1は、カラオケ演奏及び利用者がカラオケ歌唱を行うための装置である。カラオケ装置1は、たとえばカラオケ店舗の各部屋(カラオケルーム)に設置される。カラオケ装置1は、利用者によるカラオケ歌唱を評価し、採点結果を提示する採点機能を有する(詳細は後述)。
図1に示すように、カラオケ装置1は、カラオケ本体10、スピーカ20、表示装置30、マイク40、及びリモコン装置50を備える。
カラオケ本体10は、選曲されたカラオケ楽曲の演奏制御、歌詞や背景映像等の表示制御、マイク40を通じて入力された音声信号の処理といった、カラオケ演奏やカラオケ歌唱に関する各種の制御を行う。スピーカ20はカラオケ本体10からの放音信号に基づいて放音するための構成である。表示装置30はカラオケ本体10からの信号に基づいて映像や画像を画面に表示するための構成である。マイク40は利用者の歌唱音声をアナログの音声信号に変換してカラオケ本体10に入力するための構成である。リモコン装置50は、カラオケ本体10に対する各種操作をおこなうための装置である。
ここで、本実施形態に係るマイク40は、所定範囲内に居る全ての利用者の会話音声を集音可能な「集音部」としても用いられる。所定範囲は、集音部によって会話音声の集音が可能となる範囲である。たとえば、カラオケ装置1が設置されているカラオケルーム内は、「所定範囲内」の一例である。マイク40は、カラオケ歌唱が開始される前に、カラオケルーム内において交わされる会話音声を集音する。
マイク40は、集音した会話音声(会話音声データ)をカラオケ本体10に出力する。なお、集音部はマイク40とは別に設けられていてもよい。また、集音部は複数設けられていてもよい
==カラオケ本体10==
図2に示すように、本実施形態に係るカラオケ本体10は、記憶部10a、通信部10b、入力部10c、及び制御部10dを備える。各構成はインターフェース(図示なし)を介してバスBに接続されている。
[記憶部、通信部、入力部]
記憶部10aは、カラオケ演奏を行うための楽曲データ等、各種のデータを記憶する大容量の記憶装置である。通信部10bは、カラオケ本体10とカラオケ装置1の他の構成との通信を行うためのインターフェースを提供する。入力部10cは、利用者が各種の指示入力を行うための構成である。なお、表示装置30やリモコン装置50の表示画面に表示された各種アイコンを選択することで、各種の指示入力を行うことも可能である。この場合、表示装置30やリモコン装置50が入力部10cとして機能する。
[制御部]
制御部10dは、カラオケ装置1における各種の制御を行う。制御部10dは、CPUおよびメモリ(いずれも図示無し)を備える。CPUは、メモリに記憶されたプログラムを実行することにより各種の機能を実現する。本実施形態においてはCPUがメモリに記憶されるプログラムを実行することにより、制御部10dは、抽出手段100、決定手段200、採点手段300、補正手段400、及び提示手段500として機能する。
(抽出手段)
抽出手段100は、集音した会話音声から、各利用者の声紋データを抽出する。
会話音声から声紋データを抽出する方法は、公知の技術を利用することができる。また、利用者が複数いる場合に、一の集音部で集音した会話音声の中から利用者毎の音声を分離する方法についても、公知の技術(たとえば、三菱電機株式会社HP “http://www.mitsubishielectric.co.jp/news/2017/0524-e.html”)を利用することができる。
具体例として、株式会社XのA部長とB社員(役職無し)が、取引先であるY株式会社のC部長とD課長を接待することになり、二次会でカラオケルームに入室したとする。この場合、A部長、B社員、C部長、D課長は、カラオケ装置1の利用者に相当する。
マイク40は、各利用者がカラオケルームに入室した時点から会話音声の集音を行い、抽出手段100に出力する。抽出手段100は、会話音声から、利用者それぞれの声紋データを抽出する。この例では、利用者が4名いるため、通常は4つの声紋データ(声紋データV1~声紋データV4)が抽出される。なお、カラオケ装置1は、抽出された各声紋データがどの利用者の声紋データであるかは識別できない。
(決定手段)
決定手段200は、集音した会話音声に基づいて各声紋データの序列を決定し、当該序列の情報を当該各声紋データと紐付けて記憶させる。
本実施形態において、決定手段200は、集音した会話音声を処理して得られた敬語情報に基づいて序列を決定する。敬語情報は、各利用者が会話で使用した敬語に対応する情報である。たとえば、敬語情報は、会話の中で使用された場合に利用者間の上位下位が反映される3分類(尊敬語、謙譲語、丁寧語)や5分類(尊敬語、謙譲語、丁重語、丁寧語、美化語)に含まれる語に相当する。本実施形態における「序列」は、役職及び立場に起因するものである。たとえば、序列が高い利用者は、役職がより高い者であったり、接待される側(接待相手)であったりする。
敬語情報の取得及び序列の決定は、公知の方法を利用することができる。
具体例として、決定手段200は、一の会話音声を音声認識処理することでテキストデータを生成する(特開2014-026603号公報等参照)。決定手段200は、テキスト化された会話音声の中から敬語を検出し、全文字数における敬語の文字数の占める割合をスコアとして算出する。
たとえば、テキスト化された会話音声が「いつもたいへんおせわになっております」であった場合、全文字数が18文字、敬語(「お」「おります」)の文字数が計5文字である。従って、決定手段200は、(5/18)×100=27.82(点)というスコアを算出する。一方、テキスト化された会話音声が「いやいや、こちらこそどうも」であった場合、敬語の文字数は0文字である。この場合、決定手段200は、当該会話音声については0(点)というスコアを算出する。
決定手段200は、声紋データ毎にスコアを算出する。一の声紋データについて複数の会話音声が存在する場合、決定手段200は、全会話音声の文字数と全敬語の文字数に基づいてスコアを算出する。
決定手段200は、スコアの低い順、すなわち敬語を使う頻度が少ない順に、声紋データの序列を決定する。
図3は、本実施形態において算出された、声紋データ毎のスコア、及び決定された序列を示した図である。図3においては、声紋データV1に対応するスコアが16(点)、声紋データV2に対応するスコアが38(点)、声紋データV3に対応するスコアが10(点)、声紋データV4に対応するスコアが18(点)となっている。また、決定手段200により、声紋データのスコアの低い順に、声紋データV3、声紋データV1、声紋データV4、声紋データV2という序列が決定されている。
なお、スコアの算出方法は、上記例に限られない。たとえば、決定手段200は、全文字数における敬語の数の割合をスコアとして算出してもよい。たとえば、テキスト化された会話音声が「いつもたいへんおせわになっております」であれば、決定手段200は、敬語の数(「お」、「おります」の2つ)に応じて(2/18)×100=11.11(点)というスコアを算出する。また、決定手段200は、敬語の分類を区別して検出し、分類ごとに重み付けをしたテーブル(たとえば尊敬語:1.5、謙譲語:1.3、丁寧語1.0)を参照してスコアを算出してもよい。
決定手段200は、決定した序列の情報を各声紋データと紐付けて記憶部10aに記憶させる。図3の例において、決定手段200は、声紋データV3に序列「1位」を紐付け、声紋データV1に序列「2位」を紐付け、声紋データV4に序列「3位」を紐付け、声紋データV2に序列「4位」を紐付けて記憶部10aに記憶させる。
(採点手段)
採点手段300は、利用者によるカラオケ歌唱を評価し、採点結果を得る。具体的に、採点手段300は、利用者の歌唱音声から抽出した歌唱音声データを、音高、音量及び歌唱技法の少なくとも一つに基づいて採点を行う。採点結果は、たとえば具体的な数値(100点を満点とする数値)として求めることができる。
カラオケ歌唱の評価は、公知の技術を利用することができる。たとえば、採点手段300は、マイク40から入力された歌唱音声信号から、ピッチ(音高)データ、音量データ等の歌唱音声データを抽出し、カラオケ歌唱を行った楽曲のリファレンスデータと比較することにより、採点値を得ることができる。採点手段300は、得られた採点結果を補正手段400に出力する。
(補正手段)
補正手段400は、ある利用者がカラオケ歌唱を行った場合、当該ある利用者の歌唱音声から抽出された声紋認証用データと一致する声紋データを特定し、特定された声紋データに紐付けられている序列の情報に基づいて、当該ある利用者のカラオケ歌唱の採点結果を補正する。
声紋認証用データは、カラオケ歌唱を行う利用者の歌唱音声から抽出した声紋データである。たとえば、上記例において、A部長、B社員、C部長、D課長がカラオケルームに入室した後、順番にカラオケ歌唱を行ったとする。抽出手段100は、カラオケ楽曲の演奏開始に伴ってカラオケ歌唱を行う利用者の歌唱音声を解析することにより、ある利用者の声紋データを声紋認証用データとして抽出する。
採点結果の補正は、予め設定され記憶部10aに記憶されている補正情報に基づいて行う。補正情報は、たとえば、「序列1位の利用者の採点結果に対して10点をプラスする」といった具体的な数値を示すものや、「序列1位の利用者の採点結果を10%アップする」といったものでもよい。但し、採点結果の上限値(たとえば100点)がある場合、当該上限値を越えないように調整することが好ましい。また、序列1位の利用者の採点結果に対してのみの補正ではなく、序列に応じて加点に差を付けたり、序列によっては減点する補正を行ってもよい。たとえば、「序列1位は+10点、序列2位は+5点、序列3位は±0点、序列4位は-5点」といった補正情報であってもよい。なお、採点結果を減点する場合、実際のカラオケ歌唱が上手く聞こえるにも関わらず、採点結果が低くなることがありうる。このような状況が生じると、採点結果に疑念を持たれる可能性(採点結果が操作されていることを知られてしまう可能性)がある。よって、採点手段300による採点値が一定値以上の場合(たとえば、90点以上)、仮に減点対象となる序列であっても減点しないことが好ましい。
補正手段400は、記憶部10aに記憶されている声紋データの中から、声紋認証用データと一致する声紋データを特定する。
たとえば、B社員がカラオケ歌唱を行ったとする。この場合、補正手段400は、B社員の声紋認証用データに基づいて記憶部10aの中から一の声紋データを特定する。ここでは、図3に示した音声データV2がB社員の声紋データとして特定されたとする。
B社員がカラオケ歌唱を終了し、採点手段300は、B社員のカラオケ歌唱の採点結果として「80点」を算出したとする。補正手段400は、採点結果「80点」に対し、特定した一の声紋データV2に紐付けられている序列の情報に基づいて、採点結果の補正を行う。ここで、補正情報が「序列1位の利用者の採点結果に対して10点をプラスする」となっていたとする。この場合、図3の例によれば、特定した一の声紋データV2の序列は1位ではない。よって、補正手段400は、採点結果「80点」の補正を行うことなく、そのまま、提示手段500に出力する。
一方、たとえば、C部長がカラオケ歌唱を行ったとする。この場合、補正手段400は、C部長の声紋認証用データに基づいて記憶部10aの中から一の声紋データを特定する。ここでは、図3に示した音声データV3がC部長の声紋データとして特定されたとする。
C部長がカラオケ歌唱を終了し、採点手段300は、C部長のカラオケ歌唱の採点結果として「85点」を算出したとする。補正手段400は、採点結果「85点」に対し、特定した一の声紋データV3に紐付けられている序列の情報に基づいて、採点結果の補正を行う。上記と同様、補正情報が「序列1位の利用者の採点結果に対して10点をプラスする」となっていたとする。この場合、図3の例によれば、特定した一の声紋データV3の序列は1位である。よって、補正手段400は、採点結果「85点」に「10点」を加えた「95点」をC部長の採点結果とし、提示手段500に出力する。
[提示手段]
提示手段500は、採点手段300で得られた採点結果、或いは補正手段400で補正された採点結果を利用者に対して提示する。
採点結果の提示方法は様々な手法が可能である。たとえば、提示手段500は、採点結果を表示装置30の表示画面に表示させることができる。或いは、提示手段500は、スピーカ20を介して採点結果を放音させることができる。
==カラオケ装置における処理について==
次に、図4を参照して本実施形態に係るカラオケ装置1における処理の具体例について述べる。図4は、カラオケ装置1における処理例を示すフローチャートである。
利用者がカラオケルームに入室した後、マイク40は、カラオケルーム内に居る全ての利用者の会話音声を集音する(会話音声の集音。ステップ10)。
抽出手段100は、ステップ10で集音した会話音声から、各利用者の声紋データを抽出する(声紋データの抽出。ステップ11)。
決定手段200は、ステップ10で集音した会話音声に基づいて各声紋データの序列を決定する(声紋データの序列を決定。ステップ12)。
決定手段200は、ステップ12で決定した序列の情報を、ステップ11で抽出された声紋データと紐付けて記憶部10aに記憶させる(序列の情報及び声紋データの記憶。ステップ13)。
ここで、ある利用者がカラオケ歌唱を行った場合(ステップ14でYの場合)、マイク40は、当該ある利用者の歌唱音声を集音する(歌唱音声の集音。ステップ15)。抽出手段100は、歌唱音声からある利用者の声紋データ(声紋認証用データ)を抽出する(声紋認証用データの抽出。ステップ16)。
補正手段400は、ステップ16で抽出された声紋認証用データと一致する声紋データを、ステップ13で記憶された声紋データの中から特定する(声紋データの特定。ステップ17)。
採点手段300は、ある利用者のカラオケ歌唱の評価を行い、採点結果を得る(カラオケ歌唱の採点。ステップ18)。
補正手段400は、ステップ17で特定された声紋データに紐付けられている序列の情報に基づいて、ステップ18で得られた、ある利用者のカラオケ歌唱の採点結果を補正する(採点結果の補正。ステップ19)。
提示手段500は、ステップ19で補正された採点結果を提示する(採点結果の提示。ステップ20)。
このように、本実施形態に係るカラオケ装置1は、利用者によるカラオケ歌唱を評価し、採点結果を提示する採点機能を有する。カラオケ装置1は、所定範囲内に居る全ての利用者の会話音声を集音可能なマイク40と、カラオケ装置1を制御する制御部10dを有する。制御部10dは、集音した会話音声から、各利用者の声紋データを抽出する抽出手段100、集音した会話音声に基づいて各声紋データの序列を決定し、当該序列の情報を当該各声紋データと紐付けて記憶させる決定手段200、ある利用者がカラオケ歌唱を行った場合、当該ある利用者の歌唱音声から抽出された声紋認証用データと一致する声紋データを特定し、特定された声紋データに紐付けられている序列の情報に基づいて、当該ある利用者のカラオケ歌唱の採点結果を補正する補正手段400、として機能する。
このようなカラオケ装置1によれば、ある利用者がカラオケ歌唱を行った場合、自動的に決定された声紋データの序列に応じて採点結果を補正することができる。この場合、序列の高い相手(たとえば接待相手)の方が良い採点結果が得られる傾向にあるため、採点機能を利用して場を盛り上げることができる。すなわち、本実施形態に係るカラオケ装置1によれば、カラオケ歌唱を行った利用者に気づかれることなく、当該カラオケ歌唱の採点結果を補正できる。
また、本実施形態に係る決定手段200は、集音した会話音声を処理して得られた敬語情報に基づいて算出したスコアにより序列を決定することを特徴とする。一般的なビジネスマナーとして、立場が上の者に対しては敬語を使用することが好ましいとされている。よって、そのような敬語情報に基づいて算出したスコアを利用して序列を決定することにより、より正確に声紋データの序列を決定できる。
<第2実施形態>
次に、図5~図8を参照して、第2実施形態に係るカラオケ装置について説明する。本実施形態では、会話音声に含まれる各利用者の敬称情報を利用して、声紋データの序列を決定する例について説明する。なお、第1実施形態と同様の構成については詳細な説明を省略する。
(第1の記憶手段)
図5に示すように、本実施形態における記憶部10aの記憶領域の一部は、第1の記憶手段600として機能する。第1の記憶手段600は、利用者の敬称と所定のスコアとを対応付けた敬称スコアテーブルを記憶する。敬称は、ある者が相手に対して敬意、尊敬の念を込めて用いられる名前等の後ろに付ける接尾語(「さん」、「さま」、「くん」等)、またはその語自体で相手を表現する代名詞(「部長」、「先生」等)である。
スコアは、敬称毎に所定の値が対応付けられている。ここで、敬称の中でも上の者が下の者に使う傾向が高い語(「くん」、「ちゃん」等)、と下の者が上の者に使う傾向が高い語(「さん」、「さま」等)がある。本実施形態におけるスコアは、敬称の中でも上の者が下の者に使う傾向が高い語について高く、下の者が上の者に使う傾向が高い語について低く設定されている。
図6は、敬称スコアテーブルの一例である。この例では、「さま」、「さん」、「くん」、「ちゃん」の順でスコアが低くなるようにテーブルを構成している。
(決定手段)
本実施形態に係る決定手段200は、集音した会話音声を処理して得られた敬称情報と敬称スコアテーブルとに基づいて算出したスコアにより、序列を決定する。
具体例として、A部長がB社員を連れて、Y会社の接待の反省会と称して、行きつけのカラオケスナックを訪れたとする。このカラオケスナックにおいては、一台のカラオケ本体10に対し、複数のマイク40が設けられている。各マイクは、カラオケ本体10と通信可能となっている。マイク40は、カラオケスナックの各テーブルに少なくとも一本ずつ置かれている。マイク40は、それが置かれたテーブル近傍の会話音声を収集する。本実施形態における「所定範囲」は、マイク40が置かれたテーブル近傍に相当する。
決定手段200は、会話音声を音声認識処理することで、一の会話音声に含まれる敬称情報を検出する。決定手段200は、検出した敬称情報を敬称スコアテーブルに当てはめ、一の会話音声におけるスコアを求める。決定手段200は、声紋データ毎にスコアを合計し、合計したスコアに応じて序列を決定する。
たとえば、A部長とB社員の会話音声を処理した結果、声紋データVaには、敬称「さま」が1回、「さん」が2回、「くん」が12回、「ちゃん」が3回含まれていたとする。決定手段200は、敬称スコアテーブルを参照して敬称毎のスコアと回数を乗算し、乗算した敬称毎のスコアを合計することで総合点「88点」を求める。一方、声紋データVbには、敬称「さま」が1回、「さん」が10回、「くん」が2回、「ちゃん」が0回含まれていたとする。決定手段200は、敬称スコアテーブルを参照して敬称毎のスコアと回数を乗算し、乗算した敬称毎のスコアを合計することで総合点「41点」を求める。この場合、決定手段200は、声紋データVaの序列を「1位」、声紋データVbの序列を「2位」として決定する(図7参照)。なお、スコアの算出方法は、上記例に限られない。たとえば、決定手段200は、敬称毎のスコアの合計を敬称の回数で除して比較してもよい。具体的には、声紋データVaには敬称が全部で1+2+12+3=18回含まれ、総合点が「88点」であった場合、決定手段200は、スコアを88/18=4.89点と算出する。また、声紋データVbには敬称が全部で1+10+2+0=13回含まれ、総合点が「41点」であった場合、決定手段200は、スコアを41/13=3.15点と算出する。そして、決定手段200は、算出したスコアを比較することにより、声紋データVaの序列を「1位」、声紋データVbの序列を「2位」として決定できる。
==カラオケ装置における処理について==
次に、図8を参照して本実施形態に係るカラオケ装置1における処理の具体例について述べる。図8は、カラオケ装置1における処理例を示すフローチャートである。本実施形態における第1の記憶手段600は、敬称スコアテーブルを記憶している。
利用者がカラオケルームに入室した後、マイク40は、カラオケルーム内に居る全ての利用者の会話音声を集音する(会話音声の集音。ステップ30)。
抽出手段100は、ステップ30で集音した会話音声から、各利用者の声紋データを抽出する(声紋データの抽出。ステップ31)。
決定手段200は、ステップ30で集音した会話音声を処理して得られた敬称情報と敬称スコアテーブルとに基づいて算出したスコアにより、各声紋データの序列を決定する(敬称情報等に基づいて声紋データの序列を決定。ステップ32)。
決定手段200は、ステップ32で決定した序列の情報を、ステップ31で抽出された声紋データと紐付けて記憶部10aに記憶させる(序列の情報及び声紋データの記憶。ステップ33)。
ステップ34以降の処理は、第1実施形態におけるステップ14以降の処理と同様であるため詳細な説明を省略する。
このように、本実施形態に係るカラオケ装置1は、利用者の敬称と所定のスコアとを対応付けた敬称スコアテーブルを記憶する第1の記憶手段600を有し、決定手段200は、集音した会話音声を処理して得られた敬称情報と敬称スコアテーブルとに基づいて算出したスコアにより、序列を決定する。このように会話音声に含まれる敬称情報を利用することにより、より確実に序列を決定することができる。
<第3実施形態>
次に、図9~図13を参照して、第3実施形態に係るカラオケ装置について説明する。本実施形態では、各利用者の着席位置を利用して、声紋データの序列を決定する例について説明する。なお、第1実施形態または第2実施形態と同様の構成については詳細な説明を省略する。
本実施形態に係る集音部は、各利用者の着席位置にそれぞれ設けられた複数の指向性マイクロフォンである。
図9は、カラオケ装置1が設置されたカラオケルームR内を示した図である。カラオケルームRは、所謂、「VIPルーム」であり、接待等、特別な場面での利用に適した部屋である。カラオケルームR内には、カラオケ装置1と共に、5つの座席(座席S1~S5)、2つのテーブル(テーブルT1、T2)、及び1つのディスプレイDが設置されている。図9の例において、表示装置30は、カラオケルームRの壁に設置されたディスプレイDに相当する。
図9の例において、各座席の近傍には、それぞれ指向性マイクロフォンM1~M5が設置されている。指向性マイクロフォンは、座席に座った利用者の会話音声のみを集音することができる。
(第2の記憶手段)
図10に示すように、本実施形態における記憶部10aの記憶領域の一部は、第2の記憶手段700として機能する。第2の記憶手段700は、所定範囲内における利用者の着席位置と所定のスコアとを対応付けた着席位置スコアテーブルを記憶する。
着席位置スコアテーブルは、所定範囲毎に設けられている。図9の例であれば、カラオケルームRが、所定範囲に相当する。
図11は、カラオケルームRにおける着席位置スコアテーブルを示している。図9に示したように、カラオケルームRについては、座席S1~S5が設置されている。ここで、一般的なビジネスマナーにおいては、部屋の入り口から遠い席に序列の高い者が座ることが好ましいとされている。そこで、カラオケルームRの入り口から遠い座席から順(座席S1、S2、S3、S4、S5の順)にスコアが高く(40点、30点、20点、10点、0点の順)なるようにテーブルを構成している。
(決定手段)
本実施形態に係る決定手段200は、集音した会話音声に対応する着席位置と着席位置スコアテーブルとに基づいて算出したスコアにより、序列を決定する。
具体例として、株式会社XのA部長とB社員(役職無し)が、取引先であるY株式会社のC部長とD課長を接待することになり、二次会でカラオケルームRに入室したとする。また、C部長が座席S2に着席し、D課長が座席S3に着席し、A部長が座席S4に着席し、B社員が座席S5に着席したとする。この場合、A部長、B社員、C部長、D課長は、カラオケ装置1の利用者に相当する。
指向性マイクロフォンM1~M5は、各利用者が座席に着席した時点から会話音声の集音を行い、抽出手段100に出力する。抽出手段100は、会話音声から、座席毎の声紋データを抽出する。この例では、利用者が4名いるため、通常は4つの声紋データが抽出される。なお、カラオケ装置1は、各座席に着席している利用者が誰か、及び抽出された各声紋データがどの利用者の声紋データであるかは識別できない。
ここで、指向性マイクロフォンと座席は一対一に対応している。従って、たとえば指向性マイクロフォンM1により集音された会話音声から抽出した声紋データV11は、序列が最も高い利用者の声紋データであると判断できる。この例では、指向性マイクロフォンM2~M5が収集した会話音声から、声紋データV12~V15が抽出される。
決定手段200は、各利用者の着席位置(すなわち、各指向性マイクロフォンの設置位置)を、着席位置スコアテーブルに当てはめ、集音された声紋データ毎のスコアを算出する。決定手段200は、声紋データ毎のスコアに応じて序列を決定する。
たとえば、声紋データV12は、座席位置S2に設置された指向性マイクロフォンM2で集音した会話音声から抽出される。よって、決定手段200は、声紋データV12について、座席位置S2及び着席位置スコアテーブルからスコア「30点」を算出する。同様に、声紋データV13は、座席位置S3に設置された指向性マイクロフォンM3で集音した会話音声から抽出される。よって、決定手段200は、声紋データV13について、座席位置S3及び着席位置スコアテーブルからスコア「20点」を算出する。声紋データV14は、座席位置S4に設置された指向性マイクロフォンM4で集音した会話音声から抽出される。よって、決定手段200は、声紋データV13について、座席位置S4及び着席位置スコアテーブルからスコア「10点」を算出する。声紋データV15は、座席位置S5に設置された指向性マイクロフォンM5で集音した会話音声から抽出される。よって、決定手段200は、声紋データV15について、座席位置S5及び着席位置スコアテーブルからスコア「0点」を算出する。
この場合、決定手段200は、声紋データV12の序列を「1位」、声紋データV13の序列を「2位」、声紋データV14の序列を「3位」、声紋データV15の序列を「4位」として決定する(図12参照)。
==カラオケ装置における処理について==
次に、図13を参照して本実施形態に係るカラオケ装置1における処理の具体例について述べる。図13は、カラオケ装置1における処理例を示すフローチャートである。本実施形態では、複数の利用者が図9に示したカラオケルームRに入室し、各自が座席に着席したとする。本実施形態における第2の記憶手段700は、着席位置スコアテーブルを記憶している。
利用者が着席した後、各指向性マイクロフォンは、座席毎に利用者の会話音声を集音する(座席毎に会話音声を集音。ステップ50)。
抽出手段100は、ステップ50で集音した会話音声から、各利用者の声紋データを抽出する(声紋データの抽出。ステップ51)。
決定手段200は、ステップ50で集音した会話音声に対応する着席位置と着席位置スコアテーブルとに基づいて算出したスコアにより、各声紋データの序列を決定する(着席位置等に基づいて声紋データの序列を決定。ステップ52)。
決定手段200は、ステップ52で決定した序列の情報を、ステップ51で抽出された声紋データと紐付けて記憶部10aに記憶させる(序列の情報及び声紋データの記憶。ステップ53)。
ステップ54以降の処理は、第1実施形態におけるステップ14以降の処理と同様であるため詳細な説明を省略する。
このように、本実施形態に係るカラオケ装置1は、所定範囲内における利用者の着席位置と所定のスコアとを対応付けた着席位置スコアテーブルを記憶する第2の記憶手段700を有し、集音部は、各利用者の着席位置にそれぞれ設けられた複数の指向性マイクロフォンM1~M5である。決定手段200は、集音した会話音声に対応する着席位置と着席位置スコアテーブルとに基づいて算出したスコアにより、序列を決定する。このように会話音声に対応する着席位置を利用することにより、より確実に序列を決定することができる。
なお、上記実施形態では、各座席に設置された指向性マイクロフォンを利用する例について説明したがこれに限られない。たとえば、二本のマイクロフォンを用いて複数の利用者の会話音声をステレオ信号で集音する。カラオケ装置1は、集音した会話音声を音源分離し、各会話音声の定位や音量を検出することで、各利用者の位置(着席した座席)を求めてもよい。なお、音源分離、及び会話音声の定位や音量の検出は公知の技術を利用できる。
また、決定手段200は、集音された会話音声から公知の技術を用いて性別情報を取得し、座席位置の情報と併せて序列を決定してもよい。たとえば、ある利用者が異性の隣に着席している場合、当該ある利用者はコンパニオンの接客を受けており、接待される側すなわち序列の高い利用者であるとみなすことができる。
<その他>
第1実施形態~第3実施形態は、適宜組み合わせて実施することが可能である。たとえば、決定手段200は、声紋データ毎に、テキスト化された会話音声の中から敬語を検出し、全文字数における敬語の文字数の占める割合によるスコア(第1実施形態参照)と、検出した敬称情報を敬称スコアテーブルに当てはめて算出したスコア(第2実施形態)と、集音した会話音声に対応する着席位置と着席位置スコアテーブルとに基づいて算出したスコア(第3実施形態)とを合計したスコアを求め、当該合計したスコアに基づいて序列を決定してもよい。
上記実施形態は、例として提示したものであり、発明の範囲を限定するものではない。上記の構成は、適宜組み合わせて実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 カラオケ装置
100 抽出手段
200 決定手段
300 採点手段
400 補正手段
500 提示手段
600 第1の記憶手段
700 第2の記憶手段

Claims (4)

  1. 利用者によるカラオケ歌唱を評価し、採点結果を提示する採点機能を有するカラオケ装置であって、
    所定範囲内に居る全ての利用者の会話音声を集音可能な集音部と、
    前記カラオケ装置を制御する制御部と、
    を有し、
    前記制御部は、
    集音した前記会話音声から、各利用者の声紋データを抽出する抽出手段、
    集音した前記会話音声に基づいて各声紋データの序列を決定し、当該序列の情報を当該各声紋データと紐付けて記憶させる決定手段、
    ある利用者がカラオケ歌唱を行った場合、当該ある利用者の歌唱音声から抽出された声紋認証用データと一致する前記声紋データを特定し、特定された声紋データに紐付けられている前記序列の情報に基づいて、当該ある利用者のカラオケ歌唱の採点結果を補正する補正手段、
    として機能するカラオケ装置。
  2. 前記決定手段は、集音した前記会話音声を処理して得られた敬語情報に基づいて算出したスコアにより前記序列を決定することを特徴とする請求項1記載のカラオケ装置。
  3. 利用者の敬称と所定のスコアとを対応付けた敬称スコアテーブルを記憶する第1の記憶手段を有し、
    前記決定手段は、集音した前記会話音声を処理して得られた敬称情報と前記敬称スコアテーブルとに基づいて算出したスコアにより、前記序列を決定することを特徴とする請求項1または2記載のカラオケ装置。
  4. 前記所定範囲内における利用者の着席位置と所定のスコアとを対応付けた着席位置スコアテーブルを記憶する第2の記憶手段を有し、
    前記集音部は、複数の指向性マイクロフォンであり、
    前記決定手段は、集音した前記会話音声に対応する着席位置と前記着席位置スコアテーブルとに基づいて算出したスコアにより、前記序列を決定することを特徴とする請求項1から3のいずれか一つに記載のカラオケ装置。
JP2018161624A 2018-08-30 2018-08-30 カラオケ装置 Active JP7082549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018161624A JP7082549B2 (ja) 2018-08-30 2018-08-30 カラオケ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018161624A JP7082549B2 (ja) 2018-08-30 2018-08-30 カラオケ装置

Publications (2)

Publication Number Publication Date
JP2020034750A JP2020034750A (ja) 2020-03-05
JP7082549B2 true JP7082549B2 (ja) 2022-06-08

Family

ID=69667945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018161624A Active JP7082549B2 (ja) 2018-08-30 2018-08-30 カラオケ装置

Country Status (1)

Country Link
JP (1) JP7082549B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008164966A (ja) 2006-12-28 2008-07-17 Daiichikosho Co Ltd 歌唱採点機能を備えるカラオケシステム
JP2015143751A (ja) 2014-01-31 2015-08-06 株式会社第一興商 歌唱採点システム
JP2017009825A (ja) 2015-06-23 2017-01-12 トヨタ自動車株式会社 会話状況分析装置および会話状況分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008164966A (ja) 2006-12-28 2008-07-17 Daiichikosho Co Ltd 歌唱採点機能を備えるカラオケシステム
JP2015143751A (ja) 2014-01-31 2015-08-06 株式会社第一興商 歌唱採点システム
JP2017009825A (ja) 2015-06-23 2017-01-12 トヨタ自動車株式会社 会話状況分析装置および会話状況分析方法

Also Published As

Publication number Publication date
JP2020034750A (ja) 2020-03-05

Similar Documents

Publication Publication Date Title
US20140324458A1 (en) Method and Apparatus for Predicting Outcome of Hearing Device Implantation
JP6153255B2 (ja) 歌唱パート決定システム
JP6501344B2 (ja) 聴取者評価を考慮したカラオケ採点システム
JP7082549B2 (ja) カラオケ装置
JP2018091982A (ja) カラオケシステム
JP6937675B2 (ja) カラオケ装置
JP6944357B2 (ja) 通信カラオケシステム
JP6210638B2 (ja) 携帯マイクの音声信号出力制御システム
WO2021106512A1 (ja) 楽曲生成方法および楽曲生成システム
JP6352164B2 (ja) 聴取者評価を考慮したカラオケ採点システム
JP2013164642A (ja) 検索手段制御装置、検索結果出力装置及びプログラム
JP6920135B2 (ja) カラオケ装置
JP6944391B2 (ja) カラオケ装置
JP7478077B2 (ja) カラオケ装置
JP7082543B2 (ja) カラオケ装置
KR20110007352A (ko) 노래 추천 시스템 및 추천 방법
JP6894766B2 (ja) カラオケ装置
WO2015140412A1 (en) Method for adjusting the complexity of a chord in an electronic device
JP2020134901A (ja) カラオケシステム
JP6892800B2 (ja) カラオケ装置
JP6876170B1 (ja) カラオケ装置
KR102258386B1 (ko) 음소 발음 차이를 이용한 가창 가능 여부 판단 방법 및 장치
JP7308135B2 (ja) カラオケシステム
JP6864571B2 (ja) 歌詞テロップ色替えデータ作成装置
JP6508567B2 (ja) カラオケ装置、カラオケ装置用プログラム、およびカラオケシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220527

R150 Certificate of patent or registration of utility model

Ref document number: 7082549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150