WO2021171933A1 - 音出力装置及びプログラム - Google Patents

音出力装置及びプログラム Download PDF

Info

Publication number
WO2021171933A1
WO2021171933A1 PCT/JP2021/003765 JP2021003765W WO2021171933A1 WO 2021171933 A1 WO2021171933 A1 WO 2021171933A1 JP 2021003765 W JP2021003765 W JP 2021003765W WO 2021171933 A1 WO2021171933 A1 WO 2021171933A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
pitch
level
user
unit
Prior art date
Application number
PCT/JP2021/003765
Other languages
English (en)
French (fr)
Inventor
龍成 若林
真史 山田
翔 星野
Original Assignee
株式会社neumo
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社neumo filed Critical 株式会社neumo
Priority to EP21761183.9A priority Critical patent/EP4099307A4/en
Priority to US17/798,011 priority patent/US20230084900A1/en
Publication of WO2021171933A1 publication Critical patent/WO2021171933A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B15/00Teaching music

Definitions

  • the present invention relates to a sound output device and a program.
  • the human sense of sound is known as "sound."
  • the sensation of sound includes, for example, a sensation of pitch, a sensation of sound length, a sensation of sound color, a sensation of sound intensity, and a sensation of sound direction.
  • a sense of pitch for example, the difference between people is shown in units of 100 cents per semitone. It is said that the average person can distinguish between 10 cents and 20 cents. Also, it is said that anyone involved in music can distinguish a few cents.
  • Patent Document 1 it is useful to reproduce a predetermined sound and have the user answer the sound judged from the reproduced sound in terms of training the sense of pitch.
  • simply playing a sound and accepting an answer may be easy for the user to get bored. Therefore, it is preferable if the training can be carried out so that the user does not get tired of it.
  • An object of the present invention is to provide a sound output device and a program that are hard for users to get tired of.
  • the present inventor is a sound output device that outputs a predetermined sound, and changes the pitch under a predetermined condition based on a level information acquisition unit that acquires the level of the user's sense of pitch as level information and the acquired level information.
  • the sound output unit that outputs the sound that has been made, the answer information acquisition unit that acquires the answer to the change in pitch input by the user based on the output sound as answer information, and the correctness of the acquired answer information are determined.
  • the present invention relates to a sound output device including a correctness determination unit for determining the correctness and error, and a level determination unit for determining the level of the user's sound sensation based on the determination result.
  • the sound output device 1 outputs a background music selection unit that selects background music to be output superimposed on the sound output according to the output sound, and outputs the selected background music in accordance with the sound output. It is preferable to further include a background music output unit.
  • the background music output unit outputs the background music by changing the volume according to the acquired level information.
  • the sound output unit outputs a sound in which at least one of the pitch, the pitch, the length of the sound, and the time interval between the sounds is further changed based on the level information of the user. ..
  • the answer information acquisition unit acquires from the user the difference in pitch of the next output sound with respect to the immediately preceding sound or the selection of the same pitch.
  • a program that functions a computer as a sound output device that trains the user's sound sensation The computer has a level information acquisition unit that acquires the user's sound sensation level as level information, and sounds under predetermined conditions based on the acquired level information.
  • a sound output unit that outputs a sound with a changed pitch, an answer information acquisition unit that acquires selection information indicating a change in sound pitch input by the user based on the output sound, and a judgment of correctness of the acquired selection information.
  • the present invention relates to a program that functions as a correct / incorrect judgment unit and a level judgment unit that judges a user's level based on a judgment result. Regarding.
  • the sound output device 1 is a device for training the user's sense of sound.
  • the sound output device 1 is, for example, a computer (mobile terminal) such as a smartphone or a tablet. Specifically, the sound output device 1 is realized by executing an application by a computer.
  • the sound output device 1 superimposes on the output of background music, and has a predetermined pitch, a predetermined width between sounds (hereinafter, also referred to as pitch), a predetermined sound length, and a predetermined sound interval. Plays (outputs) a plurality of sounds (hereinafter, also referred to as task sounds) generated at the time interval of. As shown in FIG.
  • the sound output device 1 allows the user to change the pitch with respect to the previous sound by "UP (high)”, “SAME (same)", and “DOWN” according to the output of a plurality of sounds. Execute the display to be selected by "(Low)”. Further, the sound output device 1 accepts a user's answer (selection). The sound output device 1 determines the level of the user according to the answer of the user, and the pitch, the width between the sounds, the length of the sound, and the length of the sound to be output next according to the determination result. Change the time interval.
  • the sound output device 1 includes a level information storage unit 11, a background music storage unit 12, a level information acquisition unit 13, a sound generation unit 14, a background music selection unit 15, and a sound. It includes an output unit 16, a background music output unit 17, an input unit 18, an answer information acquisition unit 19, a correctness determination unit 20, and a level determination unit 21.
  • the level information storage unit 11 is, for example, a recording medium such as an SSD (Solid State Drive).
  • the level information storage unit 11 stores the user's sense of pitch level as level information.
  • the level information storage unit 11 stores, for example, a determinable pitch, pitch, sound length, and time interval between sounds as level information.
  • the level information storage unit 11 may include the ability (at least one of pitch, pitch, sound length, and time interval) that the user is not good at as level information.
  • the pitch of a sound means the frequency of a sound.
  • the pitch means the width of the pitch of two notes.
  • the length of the sound means the time interval during which the sound is sounding.
  • the time interval means the length of time lag between two sounds.
  • the background music storage unit 12 is, for example, a recording medium such as an SSD (Solid State Drive).
  • the background music storage unit 12 stores background music to be output superimposed on the sound output to the user.
  • the background music storage unit 12 stores, for example, a binaural beat that causes brain wave attraction by listening to sounds having slightly different frequencies from both ears. Further, the background music storage unit 12 stores, for example, background music that causes a missing fundamental.
  • the level information acquisition unit 13 is realized, for example, by operating the CPU.
  • the level information acquisition unit 13 acquires the level of the user's sense of pitch as level information.
  • the level information acquisition unit 13 acquires, for example, the level information stored in the level information storage unit 11.
  • the sound generation unit 14 is realized, for example, by operating the CPU.
  • the sound generation unit 14 outputs a sound whose pitch is changed under predetermined conditions based on the acquired level information.
  • the sound generation unit 14 outputs, for example, a sound whose pitch is changed based on the pitch, pitch, sound length, and time interval included in the level information.
  • the sound generation unit 14 improves the difficulty level by generating a sound using, for example, a pitch close to the pitch that the user is not good at. Further, the sound generation unit 14 improves the difficulty level by, for example, bringing the pitches closer to each other. Further, the sound output unit 16 improves the difficulty level by, for example, shortening the length of the sound.
  • the sound generation unit 14 needs to memorize the previous sound by lengthening the time interval, and improves the difficulty level. Further, the sound generation unit 14 improves the difficulty level by generating sounds having a pitch, pitch, sound length, or time interval, which is not good for the user. In addition, the sound generation unit 14 improves the difficulty level according to the ease of listening, which is relatively different depending on the user.
  • the background music selection unit 15 is realized, for example, by operating the CPU.
  • the background music selection unit 15 selects the background music to be output superimposed on the sound output according to the output sound.
  • the background music selection unit 15 selects background music according to, for example, the user's sense of pitch level included in the level information.
  • the background music selection unit 15 acquires the selected background music from the plurality of background music stored in the background music storage unit 12.
  • the sound output unit 16 is realized, for example, by operating the CPU.
  • the sound output unit 16 outputs a sound whose pitch is changed under predetermined conditions based on the acquired level information. That is, the sound output unit 16 outputs the sound generated by the sound generation unit 14.
  • the sound output unit 16 outputs, for example, the sound generated by the sound generation unit 14 at a set pitch and sound length. Further, the sound output unit 16 may output a sound in which at least one of the pitch, the pitch, the length of the sound, and the time interval is further changed based on the level information of the user.
  • the sound output unit 16 executes a display (“high”, “same”, “low”) for the user to answer the change in sound.
  • the background music output unit 17 is realized, for example, by operating the CPU.
  • the background music output unit 17 outputs the selected background music in accordance with the sound output. That is, the background music output unit 17 generates the background music selected by the background music selection unit 15. Further, the background music output unit 17 changes the volume of the background music and outputs it according to the acquired level information.
  • the background music output unit 17 improves the difficulty of hearing the pitch by, for example, increasing the volume of the background music and outputting it.
  • the input unit 18 is, for example, a user interface of a touch-type input device or the like.
  • the input unit 18 acquires an input for responding to a change in pitch by the user.
  • the answer information acquisition unit 19 is realized, for example, by operating the CPU.
  • the answer information acquisition unit 19 acquires the answer to the change in pitch input by the user based on the output sound as answer information.
  • the answer information acquisition unit 19 acquires from the user, for example, the difference in pitch of the next output sound with respect to the immediately preceding sound or the selection of the same pitch. Further, the answer information acquisition unit 19 accepts input of answer information for a predetermined time for each output of (one) sound, for example.
  • the correctness determination unit 20 is realized, for example, by operating the CPU.
  • the correctness determination unit 20 determines the correctness of the acquired answer information.
  • the correctness determination unit 20 determines, for example, the correctness of the sound generated by the sound generation unit 14 and the answer information acquired by the answer information acquisition unit 19.
  • the correctness determination unit 20 accumulates the determination results.
  • the correctness determination unit 20 accumulates the determination results until, for example, the output of all the sounds generated by the sound generation unit 14 is completed.
  • the level determination unit 21 is realized, for example, by operating the CPU.
  • the level determination unit 21 determines the level of the user's sense of pitch based on the determination result.
  • the level determination unit 21 determines the level of the user's sense of pitch based on, for example, the correct answer rate.
  • the level determination unit 21 determines the level of the user's sense of pitch with respect to each of the pitch, pitch, sound length, and time interval, for example. Specifically, the level determination unit 21 determines that the user is not good at a specific pitch as the level of the user's sense of pitch. Further, the level determination unit 21 determines that the user is not good at a specific pitch as the level of the user's pitch. Further, the level determination unit 21 determines that the user is not good at a specific sound length as the user's sense of pitch level.
  • the level information acquisition unit 13 acquires the level information of the user (step S1).
  • the sound generation unit 14 generates an output sound based on the acquired level information (step S2).
  • the background music generation unit selects the background music based on the acquired level information (step S3).
  • the sound output unit 16 outputs the generated sound (step S4). Further, the background music output unit 17 outputs background music on top of the output sound.
  • the sound generation unit 14 displays a display that accepts the user's answer in accordance with the sound output.
  • the response information acquisition unit 19 acquires the response input from the user to the sound output as response information (step S5).
  • the correctness determination unit 20 determines the correctness of the acquired answer information (step S6).
  • step S7 the correctness determination unit 20 repeats the correctness determination until all the sound outputs are completed.
  • step S7: YES the process proceeds to step S8.
  • step S7: NO the process returns to step S4.
  • step S8 the level determination unit 21 determines the user's level based on the correct / incorrect result (determination result).
  • the level determination unit 21 stores the determination result in the user information storage unit. As a result, the processing by this flow is completed.
  • Each configuration included in the sound output device 1 can be realized by hardware, software, or a combination thereof.
  • what is realized by software means that it is realized by a computer reading and executing a program.
  • Non-temporary computer-readable media include various types of tangible storage media.
  • Examples of non-temporary computer-readable media include magnetic recording media (eg, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical disks), CD-ROMs (Read Only Memory), CD- Includes R, CD-R / W, and semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (random access memory)).
  • the display program may also be supplied to the computer by various types of transient computer readable medium.
  • Examples of temporary computer-readable media include electrical, optical, and electromagnetic waves.
  • the temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
  • the sound output unit 16 that outputs the sound that has been made, the answer information acquisition unit 19 that acquires the answer to the change in pitch input by the user based on the output sound as answer information, and the correctness of the acquired answer information.
  • the correct / incorrect determination unit 20 for determining the above, and the level determination unit 21 for determining the level of the user's sound sensation based on the determination result are provided.
  • a program that functions a computer as a sound output device 1 that outputs a predetermined sound, the level information acquisition unit 13 that acquires the level of the user's sound feeling as level information, and a predetermined level based on the acquired level information.
  • Sound output unit 16 that outputs a sound whose pitch is changed under the conditions of, and answer information acquisition unit 19 that acquires selection information indicating a change in pitch input by the user based on the output sound. It functions as a correctness determination unit 20 for determining the correctness of the selection information, and a level determination unit 21 for determining the user's level based on the determination result.
  • the sound to be output can be changed according to the level of the user's sense of sound, so that it is possible to provide the sound output device 1 that is less likely to get tired of the user. Further, since the sound can be output according to the weak point of the user, a more user-like device can be provided.
  • the sound output device 1 has a background music selection unit 15 that selects background music to be output superimposed on the sound output according to the output sound, and a background music selection unit 15 that matches the selected background music with the sound output.
  • a background music output unit 17 for output is further provided. This makes it possible to provide the sound output device 1 that is less likely to get tired of the user.
  • the background music output unit 17 changes the volume of the background music and outputs it according to the acquired level information. This makes it difficult to hear the sound, for example, by increasing the volume of the background music. Since the ability to select and listen to the target sound from the surrounding sounds is required, it is possible to train the selective listening ability.
  • the sound output unit 16 outputs a sound in which at least one of the pitch, the pitch, the length of the sound, and the time interval is further changed based on the level information of the user. This makes it possible to carry out training that overcomes the problems of the user among the pitch, pitch, sound length, and time interval. Therefore, the user's sense of pitch can be trained more effectively.
  • the response information acquisition unit 19 acquires from the user the difference in pitch or the selection of the same pitch of the next output sound with respect to the immediately preceding sound. This makes it easier for the user to start training than in the case of guessing in detail which pitch is output. Therefore, even a novice user can start training immediately.
  • the level information may include the correct answer rates of "high”, “same", and "low” selected by the user.
  • the sound generation unit 14 may generate a sound in which the application probability is manipulated based on the correct answer rate. For example, the sound generation unit 14 may generate a sound having a high appearance probability for an option having a low correct answer rate. This makes it possible to provide a more user-like sound output device 1 that overcomes the weaknesses of the user.
  • the sound output device 1 may present the ear age.
  • the level information may include the listening rate of treble and bass pitches for each user.
  • the sound generation unit 14 may generate high-pitched sound and low-pitched sound.
  • the level determination unit 21 may determine the ear age for each user based on the correct answer rate.
  • the level determination unit 21 may determine the ear age according to the correct answer rate that differs depending on the age. Further, the level determination unit 21 may present the ear age of the user based on the age of the other user while comparing with the correct answer rate of the other user.
  • the level information acquisition unit 13 and the background music acquisition unit acquire the level information or the background music from the level information storage unit 11 or the background music storage unit 12, but the present invention is not limited to this. At least one of the level information acquisition unit 13 and the background music acquisition unit may acquire level information or background music from the outside.
  • the level determination unit 21 may add points to the correct answer.
  • the level determination unit 21 may add a high score according to the difficulty level of the sound generated by the sound generation unit 14. As a result, the game quality can be enhanced and the user can be less likely to get bored.
  • the sound output device 1 may output a pure tone, a sound of a musical instrument, a human voice, an animal bark, a living sound, or the like as a sound. That is, the sound output device 1 may output various types of sounds.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

ユーザにとって飽きの来にくい音出力装置及びプログラムを提供すること。 所定の階を出力する音出力装置1であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部13と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部16と、出力される音階に基づいてユーザによって入力される音階の変化に対する回答を回答情報として取得する回答情報取得部19と、取得された回答情報の正誤を判定する正誤判定部20と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部21と、を備える。

Description

音出力装置及びプログラム
 本発明は、音出力装置及びプログラムに関する。
 従来より、音に対する人間の感覚は、「音感」として知られている。音感には、例えば、音の高さに対する感覚、音の長さに対する感覚、音の色彩に対する感覚、音の強さに対する感覚、及び音の方向に対する感覚等がある。音の高さに対する感覚であれば、例えば、人による違いが、半音を100セントとする単位で示される。一般的な人であれば、10セント~20セントを聞き分けることができると言われている。また、音楽に携わっている人であれば、数セントを聞き分けることができると言われている。
 このような音感は、トレーニングすることで鍛えることができる。このように、音のトレーニングを可能にする装置として、出題された音を再現する音あてクイズシステムが提案されている(例えば、特許文献1参照)。
特開2019-180445号公報
 ところで、特許文献1のように、所定の音を再生して、再生された音から判断される音をユーザに回答させることは、音感をトレーニングする点で有用である。一方、単に音を再生して回答を受け付けるだけでは、ユーザにとって飽きやすい場合がある。そこで、ユーザにとって飽きの来にくいトレーニングを実施することができれば好適である。
 本発明は、ユーザにとって飽きの来にくい音出力装置及びプログラムを提供することを目的とする。
 本発明者は、所定の音を出力する音出力装置であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部と、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部と、取得された回答情報の正誤を判定する正誤判定部と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部と、を備える音出力装置に関する。
 また、音出力装置1は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部と、選択された背景音楽を音の出力に合わせて出力する背景音楽出力部と、をさらに備えるのが好ましい。
 また、背景音楽出力部は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力するのが好ましい。
 また、音出力部は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び音の間の時間間隔の少なくとも一つをさらに変化させた音を出力するのが好ましい。
 また、回答情報取得部は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得するのが好ましい。
 ユーザの音感をトレーニングする音出力装置としてコンピュータを機能させるプログラムであって、コンピュータを、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部、出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部、取得された選択情報の正誤を判定する正誤判定部、判定結果に基づいて、ユーザのレベルを判断するレベル判断部、として機能させるプログラムに関する。
に関する。
 ユーザにとって飽きの来にくい音出力装置及びプログラムを提供することができる。
本発明の一実施形態に係る音出力装置の画面を示す概略図である。 一実施形態の音出力装置の構成を示すブロック図である。 一実施形態の音出力装置の処理の流れを示すフローチャートである。
 以下、本発明の一実施形態に係る音出力装置1及びプログラムについて、図1から図3を参照して説明する。
 まず、一実施形態に係る音出力装置1の概要について説明する。
 音出力装置1は、ユーザの音感をトレーニングする装置である。音出力装置1は、例えば、スマートフォン又はタブレット等のコンピュータ(携帯端末)である。具体的には、音出力装置1は、コンピュータによるアプリケーションの実行により実現される。音出力装置1は、背景音楽の出力に重ねて、所定の音の高さ、所定の音と音との幅(以下、ピッチともいう)、所定の音の長さ、及び所定の音の間の時間間隔で生成された複数の音(以下、課題音ともいう)を再生(出力)する。音出力装置1は、図1に示すように、複数の音の出力に合わせて、ユーザに、前の音に対する音高の変化を「UP(高い)」、「SAME(同じ)」、「DOWN(低い)」で選択させる表示を実行する。また、音出力装置1は、ユーザの回答(選択)を受け付ける。音出力装置1は、ユーザの回答に応じてユーザのレベルを判定するとともに、判定結果に応じて次に出力される音の音の高さ、音と音との幅、音の長さ、及び時間間隔を変化させる。
 次に、本実施形態に係る音出力装置1の構成について説明する。
 音出力装置1は、例えば、図2に示すように、レベル情報格納部11と、背景音楽格納部12と、レベル情報取得部13と、音生成部14と、背景音楽選択部15と、音出力部16と、背景音楽出力部17と、入力部18と、回答情報取得部19と、正誤判定部20と、レベル判断部21と、を備える。
 レベル情報格納部11は、例えば、SSD(Solid State Drive)等の記録媒体である。レベル情報格納部11は、ユーザの音感レベルをレベル情報として格納する。レベル情報格納部11は、例えば、判断可能な音の高さ、ピッチ、音の長さ、及び音の間の時間間隔をレベル情報として格納する。また、レベル情報格納部11は、レベル情報として、ユーザの苦手な能力(音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも1つ)を含んでもよい。ここで、音の高さとは、音の周波数を意味する。また、ピッチとは、2つの音の高さの幅を意味する。また、音の長さとは、音の鳴っている時間間隔を意味する。また、時間間隔とは、2つの音の間の時間的ずれの長さを意味する。
 背景音楽格納部12は、例えば、SSD(Solid State Drive)等の記録媒体である。背景音楽格納部12は、ユーザに対して出力する音に重ねて出力する背景音楽を格納する。背景音楽格納部12は、例えば、両耳から微妙に周波数の異なる音を聞かせて脳波引き込みを引き起こすバイノーラルビートを格納する。また、背景音楽格納部12は、例えば、ミッシングファンダメンタルを引き起こす背景音楽を格納する。
 レベル情報取得部13は、例えば、CPUが動作することにより実現される。レベル情報取得部13は、ユーザの音感のレベルをレベル情報として取得する。レベル情報取得部13は、例えば、レベル情報格納部11に格納されているレベル情報を取得する。
 音生成部14は、例えば、CPUが動作することにより実現される。音生成部14は、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する。音生成部14は、例えば、レベル情報に含まれる音の高さ、ピッチ、音の長さ、及び時間間隔に基づいて、音高を変化させた音を出力する。音生成部14は、例えば、ユーザの苦手とする音の高さに近い音高を用いて音を生成することで難易度を向上する。また、音生成部14は、例えば、ピッチを近づけることで難易度を向上する。また、音出力部16は、例えば、音の長さを短くすることで難易度を向上する。また、音生成部14は、時間間隔を長くすることで、前の音の記憶を必要とさせて難易度を向上する。また、音生成部14は、ユーザにとって不得意な音の高さ、ピッチ、音の長さ、又は時間間隔の音を生成することで難易度を向上する。また、音生成部14は、ユーザに応じて相対的に異なる聞きやすさに応じて難易度を向上する。
 背景音楽選択部15は、例えば、CPUが動作することにより実現される。背景音楽選択部15は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する。背景音楽選択部15は、例えば、レベル情報に含まれるユーザの音感レベルに応じて、背景音楽を選択する。背景音楽選択部15は、背景音楽格納部12に格納されている複数の背景音楽から、選択された背景音楽を取得する。
 音出力部16は、例えば、CPUが動作することにより実現される。音出力部16は、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する。すなわち、音出力部16は、音生成部14によって生成された音を出力する。音出力部16は、例えば、音生成部14によって生成された音について、設定されたピッチ及び音の長さで出力する。また、音出力部16は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも一つをさらに変化させた音を出力してもよい。また、音出力部16は、ユーザに対して音の変化を回答させるための表示(「高い」「同じ」「低い」)を実行する。
 背景音楽出力部17は、例えば、CPUが動作することにより実現される。背景音楽出力部17は、選択された背景音楽を音の出力に合わせて出力する。すなわち、背景音楽出力部17は、背景音楽選択部15によって選択された背景音楽を生成する。また、背景音楽出力部17は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する。背景音楽出力部17は、例えば、背景音楽の音量を上げて出力することにより、音高の聞き取りの難易度を向上する。
 入力部18は、例えば、タッチ式の入力装置等のユーザインタフェースである。入力部18は、ユーザによる音高の変化を回答する入力を取得する。
 回答情報取得部19は、例えば、CPUが動作することにより実現される。回答情報取得部19は、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する。回答情報取得部19は、例えば、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する。また、回答情報取得部19は、例えば、(1つの)音の出力ごとに、所定の時間の間、回答情報の入力を受け付ける。
 正誤判定部20は、例えば、CPUが動作することにより実現される。正誤判定部20は、取得された回答情報の正誤を判定する。正誤判定部20は、例えば、音生成部14によって生成された音と、回答情報取得部19によって取得された回答情報との正誤を判定する。また、正誤判定部20は、判定した結果を蓄積する。正誤判定部20は、例えば、音生成部14によって生成された全ての音の出力が完了するまで判定した結果を蓄積する。
 レベル判断部21は、例えば、CPUが動作することにより実現される。レベル判断部21は、判定結果に基づいて、ユーザの音感のレベルを判断する。レベル判断部21は、例えば、正答率に基づいて、ユーザの音感のレベルを判断する。レベル判断部21は、例えば、音の高さ、ピッチ、音の長さ、及び時間間隔のそれぞれについて、ユーザの音感のレベルを判断する。具体的には、レベル判断部21は、特定の音の高さについて苦手であることをユーザの音感のレベルとして判断する。また、レベル判断部21は、特定のピッチについて、苦手であることをユーザのピッチのレベルとして判断する。また、レベル判断部21は、特定の音の長さについて苦手であることをユーザの音感レベルとして判断する。
 次に、音出力装置1の動作について、図3を参照して説明する。
 まず、レベル情報取得部13は、ユーザのレベル情報を取得する(ステップS1)。次いで、音生成部14は、取得されたレベル情報に基づいて、出力される音を生成する(ステップS2)。次いで、背景音楽生成部は、取得されたレベル情報に基づいて、背景音楽を選択する(ステップS3)。
 次いで、音出力部16は、生成された音を出力する(ステップS4)。また、背景音楽出力部17は、出力される音に重ねて背景音楽を出力する。音生成部14は、音の出力に合わせて、ユーザの回答を受け付ける表示を表示する。
 次いで、回答情報取得部19は、音の出力に対してユーザから入力された回答を回答情報として取得する(ステップS5)。正誤判定部20は、取得された回答情報について正誤を判定する(ステップS6)。
 ステップS7において、正誤判定部20は、音の出力が全て終了するまで正誤判定を繰り返す。音の出力が完了した場合(ステップS7:YES)、処理は、ステップS8に進む。一方、音の出力が完了していない場合(ステップS7:NO)、処理は、ステップS4に戻る。
 ステップS8において、レベル判断部21は、正誤の結果(判定結果)に基づいて、ユーザのレベルを判断する。レベル判断部21は、判断結果をユーザ情報格納部に格納する。これにより、本フローによる処理は終了する。
 次に、プログラムについて説明する。
 音出力装置1に含まれる各構成は、ハードウェア、ソフトウェア又はこれらの組み合わせによりそれぞれ実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
 プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、表示プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
 以上の本実施形態に係る音出力装置1及びプログラムによれば、以下の効果を奏する。
(1)ユーザの音感をトレーニングする音出力装置1であって、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部13と、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部16と、出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部19と、取得された回答情報の正誤を判定する正誤判定部20と、判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部21と、を備える。
 また、所定の音を出力する音出力装置1としてコンピュータを機能させるプログラムであって、コンピュータを、ユーザの音感のレベルをレベル情報として取得するレベル情報取得部13、取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部16、出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部19、取得された選択情報の正誤を判定する正誤判定部20、判定結果に基づいて、ユーザのレベルを判断するレベル判断部21、として機能させる。
 これにより、ユーザの音感のレベルに応じて出力される音を変化させることができるので、ユーザにとって飽きの来にくい音出力装置1を提供することができる。また、ユーザの弱点に合わせて音を出力することができるので、よりユーザライクな装置を提供することができる。
(2)音出力装置1は、出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部15と、選択された背景音楽を音の出力に合わせて出力する背景音楽出力部17と、をさらに備える。これにより、ユーザにとってより飽きの来にくい音出力装置1を提供することができる。
(3)背景音楽出力部17は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する。これにより、例えば、背景音楽の音量を大きくすることで音の聞き取りが難しくなる。周囲の音から狙った音を選択して聞き取る能力が求められるので、選択的な聞き取り能力をトレーニングすることができる。
(4)音出力部16は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び時間間隔の少なくとも一つをさらに変化させた音を出力する。これにより、音の高さ、ピッチ、音の長さ、及び時間間隔のうち、ユーザの課題点を克服するようなトレーニングを実施することができる。したがって、ユーザの音感をより効果的に鍛えることができる。
(5)回答情報取得部19は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する。これにより、出力された音高がいずれであるのかを詳細に当てる場合に比べ、ユーザにとってより容易にトレーニングを開始することができる。したがって、初心者のユーザであっても、すぐにトレーニングを開始することができる。
 以上、本発明の音出力装置1及びプログラムの好ましい一実施形態につき説明したが、本発明は、上述の実施形態に制限されるものではなく、適宜変更が可能である。
 例えば、上記実施形態において、レベル情報として、ユーザによって選択される「高い」「同じ」「低い」のそれぞれの正答率を含んでもよい。音生成部14は、正答率に基づいて、出願確率を操作した音を生成してもよい。音生成部14は、例えば、正答率の低い選択肢について、出現確率を多くする音を生成してもよい。これにより、ユーザの弱点を克服する、よりユーザライクな音出力装置1を提供することができる。
 また、上記実施形態において、音出力装置1は、耳年齢を提示するようにしてもよい。例えば、レベル情報は、ユーザ毎の高音域及び低音域の音高の聞き取り率を含んでもよい。音生成部14は、高音域及び低音域の音を生成してもよい。レベル判断部21は、正答率に基づいて、ユーザ毎の耳年齢を判断してもよい。レベル判断部21は、年齢ごとに異なる正答率に応じて耳年齢を判断してもよい。また、レベル判断部21は、他のユーザの正答率と比較するとともに、他のユーザの年齢に基づいて、ユーザの耳年齢を提示するようにしてもよい。
 また、上記実施形態において、レベル情報取得部13及び背景音楽取得部は、レベル情報格納部11又は背景音楽格納部12からレベル情報又は背景音楽を取得するとしたが、これに制限されない。レベル情報取得部13及び背景音楽取得部の少なくとも一方は、外部からレベル情報又は背景音楽を取得するようにしてもよい。
 また、上記実施形態において、レベル判断部21は、正しい回答に対して点数を付加するようにしてもよい。レベル判断部21は、音生成部14によって生成される音の難易度に応じて、高い点数を付加するようにしてもよい。これにより、ゲーム性を高めることができ、ユーザの飽きを来にくくすることができる。
 また、上記実施形態において、音出力装置1は、音として、純音や楽器の音、人の声、動物の鳴き声、又は生活音等を出力してもよい。すなわち、音出力装置1は、様々な種類の音を出力してよい。
 1 音出力装置
 13 レベル情報取得部
 15 背景音楽選択部
 16 音出力部
 17 背景音楽出力部
 19 回答情報取得部
 20 正誤判定部
 21 レベル判断部

Claims (6)

  1.  所定の音を出力する音出力装置であって、
     ユーザの音感のレベルをレベル情報として取得するレベル情報取得部と、
     取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部と、
     出力される音に基づいてユーザによって入力される音高の変化に対する回答を回答情報として取得する回答情報取得部と、
     取得された回答情報の正誤を判定する正誤判定部と、
     判定結果に基づいて、ユーザの音感のレベルを判断するレベル判断部と、
    を備える音出力装置。
  2.  出力される音に応じて、音の出力に重ねて出力される背景音楽を選択する背景音楽選択部と、
     選択された背景音楽を音の出力に合わせて出力する背景音楽出力部と、
    をさらに備える請求項1に記載の音出力装置。
  3.  背景音楽出力部は、取得されたレベル情報に応じて、背景音楽の音量を変化させて出力する請求項2に記載の音出力装置。
  4.  音出力部は、ユーザのレベル情報に基づいて、音の高さ、ピッチ、音の長さ、及び音の間の時間間隔の少なくとも一つをさらに変化させた音を出力する請求項1から3のいずれかに記載の音出力装置。
  5.  回答情報取得部は、直前の音に対して次に出力される音の音高の違い又は同じであることの選択をユーザから取得する請求項1から4のいずれかに記載の音出力装置。
  6.  ユーザの音感をトレーニングする音出力装置としてコンピュータを機能させるプログラムであって、
     コンピュータを、
     ユーザの音感のレベルをレベル情報として取得するレベル情報取得部、
     取得されたレベル情報に基づく所定の条件で音高を変化させた音を出力する音出力部、
     出力される音に基づいてユーザによって入力される音高の変化を示す選択情報を取得する回答情報取得部、
     取得された選択情報の正誤を判定する正誤判定部、
     判定結果に基づいて、ユーザのレベルを判断するレベル判断部、
    として機能させるプログラム。
PCT/JP2021/003765 2020-02-28 2021-02-02 音出力装置及びプログラム WO2021171933A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP21761183.9A EP4099307A4 (en) 2020-02-28 2021-02-02 Sound ouput device and program
US17/798,011 US20230084900A1 (en) 2020-02-28 2021-02-02 Sound ouput device and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-033781 2020-02-28
JP2020033781A JP7437742B2 (ja) 2020-02-28 2020-02-28 音出力装置及びプログラム

Publications (1)

Publication Number Publication Date
WO2021171933A1 true WO2021171933A1 (ja) 2021-09-02

Family

ID=77490094

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/003765 WO2021171933A1 (ja) 2020-02-28 2021-02-02 音出力装置及びプログラム

Country Status (4)

Country Link
US (1) US20230084900A1 (ja)
EP (1) EP4099307A4 (ja)
JP (1) JP7437742B2 (ja)
WO (1) WO2021171933A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713480A (ja) * 1993-06-24 1995-01-17 Casio Comput Co Ltd 教習制御装置
JP2001100630A (ja) * 1999-09-30 2001-04-13 Kawai Musical Instr Mfg Co Ltd 聴音訓練装置
JP2004246231A (ja) * 2003-02-17 2004-09-02 Casio Comput Co Ltd 音楽教習装置および音楽教習プログラム
JP2011164547A (ja) * 2010-02-15 2011-08-25 Casio Computer Co Ltd 練習装置およびプログラム
US20150269852A1 (en) * 2014-03-20 2015-09-24 Pearson Education, Inc. Sound assessment and remediation
JP2019124907A (ja) * 2018-01-11 2019-07-25 和碩聯合科技股▲ふん▼有限公司Pegatron Corporation 学習支援システム
JP2019180445A (ja) 2018-03-31 2019-10-24 誠 木部 音あてクイズシステム、プログラム及びプログラムを記録した記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6511324B1 (en) * 1998-10-07 2003-01-28 Cognitive Concepts, Inc. Phonological awareness, phonological processing, and reading skill training system and method
US20110313315A1 (en) * 2009-02-02 2011-12-22 Joseph Attias Auditory diagnosis and training system apparatus and method
JP6121606B1 (ja) * 2016-08-25 2017-04-26 フロンティアマーケット株式会社 聴覚トレーニング装置、聴覚トレーニング装置の作動方法、およびプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713480A (ja) * 1993-06-24 1995-01-17 Casio Comput Co Ltd 教習制御装置
JP2001100630A (ja) * 1999-09-30 2001-04-13 Kawai Musical Instr Mfg Co Ltd 聴音訓練装置
JP2004246231A (ja) * 2003-02-17 2004-09-02 Casio Comput Co Ltd 音楽教習装置および音楽教習プログラム
JP2011164547A (ja) * 2010-02-15 2011-08-25 Casio Computer Co Ltd 練習装置およびプログラム
US20150269852A1 (en) * 2014-03-20 2015-09-24 Pearson Education, Inc. Sound assessment and remediation
JP2019124907A (ja) * 2018-01-11 2019-07-25 和碩聯合科技股▲ふん▼有限公司Pegatron Corporation 学習支援システム
JP2019180445A (ja) 2018-03-31 2019-10-24 誠 木部 音あてクイズシステム、プログラム及びプログラムを記録した記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4099307A4

Also Published As

Publication number Publication date
US20230084900A1 (en) 2023-03-16
JP2021135456A (ja) 2021-09-13
EP4099307A1 (en) 2022-12-07
EP4099307A4 (en) 2023-06-28
JP7437742B2 (ja) 2024-02-26

Similar Documents

Publication Publication Date Title
US10790919B1 (en) Personalized real-time audio generation based on user physiological response
US10235898B1 (en) Computer implemented method for providing feedback of harmonic content relating to music track
JP2008146094A (ja) 音声イントネーション較正方法
WO2018038235A1 (ja) 聴覚トレーニング装置、聴覚トレーニング方法、およびプログラム
JP2018534631A (ja) オーディオコンテンツのダイナミック変更
US20180116565A1 (en) Method and Device for Administering a Hearing Test
WO2021171933A1 (ja) 音出力装置及びプログラム
JP6520162B2 (ja) 伴奏教習装置および伴奏教習プログラム
JP5704368B2 (ja) 楽音演奏装置及び楽音演奏処理プログラム
JP2014041319A (ja) 音楽表現力の教育装置及び方法並びに音楽演奏評価装置
JP2014035436A (ja) 音声処理装置
JP2022191521A (ja) 録音再生装置、録音再生装置の制御方法及び制御プログラム並びに電子楽器
JP2008092093A (ja) 楽音再生装置及びプログラム
JP4171680B2 (ja) 音楽再生装置の情報設定装置、情報設定方法、及び情報設定プログラム
US20080000345A1 (en) Apparatus and method for interactive
Greeff The influence of perception latency on the quality of musical performance during a simulated delay scenario
US20230042477A1 (en) Reproduction control method, control system, and program
JP5469330B2 (ja) 音楽練習支援機器及び音楽練習支援プログラム
JP2009000248A (ja) ゲーム機
CN117043848A (zh) 声音编辑装置、声音编辑方法以及声音编辑程序
JP2006091804A (ja) 自動演奏装置及びプログラム
JP3933013B2 (ja) 音量制御装置及びプログラム
JP6819236B2 (ja) 音処理装置、音処理方法、及びプログラム
KR20210007748A (ko) 디지털 기반 악기 복합연주 시스템
JP2023071043A (ja) カラオケシステム、ガイド音声制御方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21761183

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021761183

Country of ref document: EP

Effective date: 20220829

NENP Non-entry into the national phase

Ref country code: DE