WO2021171933A1

WO2021171933A1 - 音出力装置及びプログラム

Info

Publication number: WO2021171933A1
Application number: PCT/JP2021/003765
Authority: WO
Inventors: 龍成若林; 真史山田; 翔星野
Original assignee: 株式会社neumo
Priority date: 2020-02-28
Filing date: 2021-02-02
Publication date: 2021-09-02
Also published as: US20230084900A1; JP2021135456A; EP4099307A1; EP4099307A4; JP7437742B2

Abstract

ユーザにとって飽きの来にくい音出力装置及びプログラムを提供すること。所定の階を出力する音出力装置１であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部１３と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部１６と、出力される音階に基づいてユーザによって入力される音階の変化に対する回答を回答情報として取得する回答情報取得部１９と、取得された回答情報の正誤を判定する正誤判定部２０と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部２１と、を備える。

Description

音出力装置及びプログラム

　本発明は、音出力装置及びプログラムに関する。

　従来より、音に対する人間の感覚は、「音感」として知られている。音感には、例えば、音の高さに対する感覚、音の長さに対する感覚、音の色彩に対する感覚、音の強さに対する感覚、及び音の方向に対する感覚等がある。音の高さに対する感覚であれば、例えば、人による違いが、半音を１００セントとする単位で示される。一般的な人であれば、１０セント～２０セントを聞き分けることができると言われている。また、音楽に携わっている人であれば、数セントを聞き分けることができると言われている。

　このような音感は、トレーニングすることで鍛えることができる。このように、音のトレーニングを可能にする装置として、出題された音を再現する音あてクイズシステムが提案されている（例えば、特許文献１参照）。

特開２０１９－１８０４４５号公報

　ところで、特許文献１のように、所定の音を再生して、再生された音から判断される音をユーザに回答させることは、音感をトレーニングする点で有用である。一方、単に音を再生して回答を受け付けるだけでは、ユーザにとって飽きやすい場合がある。そこで、ユーザにとって飽きの来にくいトレーニングを実施することができれば好適である。

　本発明は、ユーザにとって飽きの来にくい音出力装置及びプログラムを提供することを目的とする。

　本発明者は、所定の音を出力する音出力装置であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部と、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部と、取得された回答情報の正誤を判定する正誤判定部と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部と、を備える音出力装置に関する。

　また、音出力装置１は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部と、選択された背景音楽を音の出力に合わせて出力する背景音楽出力部と、をさらに備えるのが好ましい。

　また、背景音楽出力部は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力するのが好ましい。

　また、音出力部は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び音の間の時間間隔の少なくとも一つをさらに変化させた音を出力するのが好ましい。

　また、回答情報取得部は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得するのが好ましい。

　ユーザの音感をトレーニングする音出力装置としてコンピュータを機能させるプログラムであって、コンピュータを、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部、出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部、取得された選択情報の正誤を判定する正誤判定部、判定結果に基づいて、ユーザのレベルを判断するレベル判断部、として機能させるプログラムに関する。
に関する。

　ユーザにとって飽きの来にくい音出力装置及びプログラムを提供することができる。

本発明の一実施形態に係る音出力装置の画面を示す概略図である。一実施形態の音出力装置の構成を示すブロック図である。一実施形態の音出力装置の処理の流れを示すフローチャートである。

　以下、本発明の一実施形態に係る音出力装置１及びプログラムについて、図１から図３を参照して説明する。
　まず、一実施形態に係る音出力装置１の概要について説明する。

　音出力装置１は、ユーザの音感をトレーニングする装置である。音出力装置１は、例えば、スマートフォン又はタブレット等のコンピュータ（携帯端末）である。具体的には、音出力装置１は、コンピュータによるアプリケーションの実行により実現される。音出力装置１は、背景音楽の出力に重ねて、所定の音の高さ、所定の音と音との幅（以下、ピッチともいう）、所定の音の長さ、及び所定の音の間の時間間隔で生成された複数の音（以下、課題音ともいう）を再生（出力）する。音出力装置１は、図１に示すように、複数の音の出力に合わせて、ユーザに、前の音に対する音高の変化を「ＵＰ（高い）」、「ＳＡＭＥ（同じ）」、「ＤＯＷＮ（低い）」で選択させる表示を実行する。また、音出力装置１は、ユーザの回答（選択）を受け付ける。音出力装置１は、ユーザの回答に応じてユーザのレベルを判定するとともに、判定結果に応じて次に出力される音の音の高さ、音と音との幅、音の長さ、及び時間間隔を変化させる。

　次に、本実施形態に係る音出力装置１の構成について説明する。
　音出力装置１は、例えば、図２に示すように、レベル情報格納部１１と、背景音楽格納部１２と、レベル情報取得部１３と、音生成部１４と、背景音楽選択部１５と、音出力部１６と、背景音楽出力部１７と、入力部１８と、回答情報取得部１９と、正誤判定部２０と、レベル判断部２１と、を備える。

　レベル情報格納部１１は、例えば、ＳＳＤ（Solid State Drive）等の記録媒体である。レベル情報格納部１１は、ユーザの音感レベルをレベル情報として格納する。レベル情報格納部１１は、例えば、判断可能な音の高さ、ピッチ、音の長さ、及び音の間の時間間隔をレベル情報として格納する。また、レベル情報格納部１１は、レベル情報として、ユーザの苦手な能力（音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも１つ）を含んでもよい。ここで、音の高さとは、音の周波数を意味する。また、ピッチとは、２つの音の高さの幅を意味する。また、音の長さとは、音の鳴っている時間間隔を意味する。また、時間間隔とは、２つの音の間の時間的ずれの長さを意味する。

　背景音楽格納部１２は、例えば、ＳＳＤ（Solid State Drive）等の記録媒体である。背景音楽格納部１２は、ユーザに対して出力する音に重ねて出力する背景音楽を格納する。背景音楽格納部１２は、例えば、両耳から微妙に周波数の異なる音を聞かせて脳波引き込みを引き起こすバイノーラルビートを格納する。また、背景音楽格納部１２は、例えば、ミッシングファンダメンタルを引き起こす背景音楽を格納する。

　レベル情報取得部１３は、例えば、ＣＰＵが動作することにより実現される。レベル情報取得部１３は、ユーザの音感のレベルをレベル情報として取得する。レベル情報取得部１３は、例えば、レベル情報格納部１１に格納されているレベル情報を取得する。

　音生成部１４は、例えば、ＣＰＵが動作することにより実現される。音生成部１４は、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する。音生成部１４は、例えば、レベル情報に含まれる音の高さ、ピッチ、音の長さ、及び時間間隔に基づいて、音高を変化させた音を出力する。音生成部１４は、例えば、ユーザの苦手とする音の高さに近い音高を用いて音を生成することで難易度を向上する。また、音生成部１４は、例えば、ピッチを近づけることで難易度を向上する。また、音出力部１６は、例えば、音の長さを短くすることで難易度を向上する。また、音生成部１４は、時間間隔を長くすることで、前の音の記憶を必要とさせて難易度を向上する。また、音生成部１４は、ユーザにとって不得意な音の高さ、ピッチ、音の長さ、又は時間間隔の音を生成することで難易度を向上する。また、音生成部１４は、ユーザに応じて相対的に異なる聞きやすさに応じて難易度を向上する。

　背景音楽選択部１５は、例えば、ＣＰＵが動作することにより実現される。背景音楽選択部１５は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する。背景音楽選択部１５は、例えば、レベル情報に含まれるユーザの音感レベルに応じて、背景音楽を選択する。背景音楽選択部１５は、背景音楽格納部１２に格納されている複数の背景音楽から、選択された背景音楽を取得する。

　音出力部１６は、例えば、ＣＰＵが動作することにより実現される。音出力部１６は、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する。すなわち、音出力部１６は、音生成部１４によって生成された音を出力する。音出力部１６は、例えば、音生成部１４によって生成された音について、設定されたピッチ及び音の長さで出力する。また、音出力部１６は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも一つをさらに変化させた音を出力してもよい。また、音出力部１６は、ユーザに対して音の変化を回答させるための表示（「高い」「同じ」「低い」）を実行する。

　背景音楽出力部１７は、例えば、ＣＰＵが動作することにより実現される。背景音楽出力部１７は、選択された背景音楽を音の出力に合わせて出力する。すなわち、背景音楽出力部１７は、背景音楽選択部１５によって選択された背景音楽を生成する。また、背景音楽出力部１７は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する。背景音楽出力部１７は、例えば、背景音楽の音量を上げて出力することにより、音高の聞き取りの難易度を向上する。

　入力部１８は、例えば、タッチ式の入力装置等のユーザインタフェースである。入力部１８は、ユーザによる音高の変化を回答する入力を取得する。

　回答情報取得部１９は、例えば、ＣＰＵが動作することにより実現される。回答情報取得部１９は、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する。回答情報取得部１９は、例えば、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する。また、回答情報取得部１９は、例えば、（１つの）音の出力ごとに、所定の時間の間、回答情報の入力を受け付ける。

　正誤判定部２０は、例えば、ＣＰＵが動作することにより実現される。正誤判定部２０は、取得された回答情報の正誤を判定する。正誤判定部２０は、例えば、音生成部１４によって生成された音と、回答情報取得部１９によって取得された回答情報との正誤を判定する。また、正誤判定部２０は、判定した結果を蓄積する。正誤判定部２０は、例えば、音生成部１４によって生成された全ての音の出力が完了するまで判定した結果を蓄積する。

　レベル判断部２１は、例えば、ＣＰＵが動作することにより実現される。レベル判断部２１は、判定結果に基づいて、ユーザの音感のレベルを判断する。レベル判断部２１は、例えば、正答率に基づいて、ユーザの音感のレベルを判断する。レベル判断部２１は、例えば、音の高さ、ピッチ、音の長さ、及び時間間隔のそれぞれについて、ユーザの音感のレベルを判断する。具体的には、レベル判断部２１は、特定の音の高さについて苦手であることをユーザの音感のレベルとして判断する。また、レベル判断部２１は、特定のピッチについて、苦手であることをユーザのピッチのレベルとして判断する。また、レベル判断部２１は、特定の音の長さについて苦手であることをユーザの音感レベルとして判断する。

　次に、音出力装置１の動作について、図３を参照して説明する。
　まず、レベル情報取得部１３は、ユーザのレベル情報を取得する（ステップＳ１）。次いで、音生成部１４は、取得されたレベル情報に基づいて、出力される音を生成する（ステップＳ２）。次いで、背景音楽生成部は、取得されたレベル情報に基づいて、背景音楽を選択する（ステップＳ３）。

　次いで、音出力部１６は、生成された音を出力する（ステップＳ４）。また、背景音楽出力部１７は、出力される音に重ねて背景音楽を出力する。音生成部１４は、音の出力に合わせて、ユーザの回答を受け付ける表示を表示する。

　次いで、回答情報取得部１９は、音の出力に対してユーザから入力された回答を回答情報として取得する（ステップＳ５）。正誤判定部２０は、取得された回答情報について正誤を判定する（ステップＳ６）。

　ステップＳ７において、正誤判定部２０は、音の出力が全て終了するまで正誤判定を繰り返す。音の出力が完了した場合（ステップＳ７：ＹＥＳ）、処理は、ステップＳ８に進む。一方、音の出力が完了していない場合（ステップＳ７：ＮＯ）、処理は、ステップＳ４に戻る。

　ステップＳ８において、レベル判断部２１は、正誤の結果（判定結果）に基づいて、ユーザのレベルを判断する。レベル判断部２１は、判断結果をユーザ情報格納部に格納する。これにより、本フローによる処理は終了する。

　次に、プログラムについて説明する。
　音出力装置１に含まれる各構成は、ハードウェア、ソフトウェア又はこれらの組み合わせによりそれぞれ実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。

　プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば、光磁気ディスク）、ＣＤ－ＲＯＭ(Read Only Memory)、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ(Programmable ROM)、ＥＰＲＯＭ(Erasable PROM)、フラッシュＲＯＭ、ＲＡＭ(random access memory）)を含む。また、表示プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上の本実施形態に係る音出力装置１及びプログラムによれば、以下の効果を奏する。
（１）ユーザの音感をトレーニングする音出力装置１であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部１３と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部１６と、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部１９と、取得された回答情報の正誤を判定する正誤判定部２０と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部２１と、を備える。
　また、所定の音を出力する音出力装置１としてコンピュータを機能させるプログラムであって、コンピュータを、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部１３、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部１６、出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部１９、取得された選択情報の正誤を判定する正誤判定部２０、判定結果に基づいて、ユーザのレベルを判断するレベル判断部２１、として機能させる。
　これにより、ユーザの音感のレベルに応じて出力される音を変化させることができるので、ユーザにとって飽きの来にくい音出力装置１を提供することができる。また、ユーザの弱点に合わせて音を出力することができるので、よりユーザライクな装置を提供することができる。

（２）音出力装置１は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部１５と、選択された背景音楽を音の出力に合わせて出力する背景音楽出力部１７と、をさらに備える。これにより、ユーザにとってより飽きの来にくい音出力装置１を提供することができる。

（３）背景音楽出力部１７は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する。これにより、例えば、背景音楽の音量を大きくすることで音の聞き取りが難しくなる。周囲の音から狙った音を選択して聞き取る能力が求められるので、選択的な聞き取り能力をトレーニングすることができる。

（４）音出力部１６は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも一つをさらに変化させた音を出力する。これにより、音の高さ、ピッチ、音の長さ、及び時間間隔のうち、ユーザの課題点を克服するようなトレーニングを実施することができる。したがって、ユーザの音感をより効果的に鍛えることができる。

（５）回答情報取得部１９は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する。これにより、出力された音高がいずれであるのかを詳細に当てる場合に比べ、ユーザにとってより容易にトレーニングを開始することができる。したがって、初心者のユーザであっても、すぐにトレーニングを開始することができる。

　以上、本発明の音出力装置１及びプログラムの好ましい一実施形態につき説明したが、本発明は、上述の実施形態に制限されるものではなく、適宜変更が可能である。
　例えば、上記実施形態において、レベル情報として、ユーザによって選択される「高い」「同じ」「低い」のそれぞれの正答率を含んでもよい。音生成部１４は、正答率に基づいて、出願確率を操作した音を生成してもよい。音生成部１４は、例えば、正答率の低い選択肢について、出現確率を多くする音を生成してもよい。これにより、ユーザの弱点を克服する、よりユーザライクな音出力装置１を提供することができる。

　また、上記実施形態において、音出力装置１は、耳年齢を提示するようにしてもよい。例えば、レベル情報は、ユーザ毎の高音域及び低音域の音高の聞き取り率を含んでもよい。音生成部１４は、高音域及び低音域の音を生成してもよい。レベル判断部２１は、正答率に基づいて、ユーザ毎の耳年齢を判断してもよい。レベル判断部２１は、年齢ごとに異なる正答率に応じて耳年齢を判断してもよい。また、レベル判断部２１は、他のユーザの正答率と比較するとともに、他のユーザの年齢に基づいて、ユーザの耳年齢を提示するようにしてもよい。

　また、上記実施形態において、レベル情報取得部１３及び背景音楽取得部は、レベル情報格納部１１又は背景音楽格納部１２からレベル情報又は背景音楽を取得するとしたが、これに制限されない。レベル情報取得部１３及び背景音楽取得部の少なくとも一方は、外部からレベル情報又は背景音楽を取得するようにしてもよい。

　また、上記実施形態において、レベル判断部２１は、正しい回答に対して点数を付加するようにしてもよい。レベル判断部２１は、音生成部１４によって生成される音の難易度に応じて、高い点数を付加するようにしてもよい。これにより、ゲーム性を高めることができ、ユーザの飽きを来にくくすることができる。

　また、上記実施形態において、音出力装置１は、音として、純音や楽器の音、人の声、動物の鳴き声、又は生活音等を出力してもよい。すなわち、音出力装置１は、様々な種類の音を出力してよい。

　１　音出力装置
　１３　レベル情報取得部
　１５　背景音楽選択部
　１６　音出力部
　１７　背景音楽出力部
　１９　回答情報取得部
　２０　正誤判定部
　２１　レベル判断部

Claims

　所定の音を出力する音出力装置であって、
　ユーザの音感のレベルをレベル情報として取得するレベル情報取得部と、
　取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部と、
　出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部と、
　取得された回答情報の正誤を判定する正誤判定部と、
　判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部と、
を備える音出力装置。
　出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部と、
　選択された背景音楽を音の出力に合わせて出力する背景音楽出力部と、
をさらに備える請求項１に記載の音出力装置。
　背景音楽出力部は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する請求項２に記載の音出力装置。
　音出力部は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び音の間の時間間隔の少なくとも一つをさらに変化させた音を出力する請求項１から３のいずれかに記載の音出力装置。
　回答情報取得部は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する請求項１から４のいずれかに記載の音出力装置。
　ユーザの音感をトレーニングする音出力装置としてコンピュータを機能させるプログラムであって、
　コンピュータを、
　ユーザの音感のレベルをレベル情報として取得するレベル情報取得部、
　取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部、
　出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部、
　取得された選択情報の正誤を判定する正誤判定部、
　判定結果に基づいて、ユーザのレベルを判断するレベル判断部、
として機能させるプログラム。