JP2022522456A

JP2022522456A - 歌の録音方法、音声補正方法、および電子デバイス

Info

Publication number: JP2022522456A
Application number: JP2021550197A
Authority: JP
Inventors: ▲凱▼ 陶; 明▲ジエ▼ 尹; 延奇李; ▲徳▼著徐; 恒杰戴; 海波 ▲ミアオ▼
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-02-28
Filing date: 2020-02-21
Publication date: 2022-04-19
Anticipated expiration: 2040-02-21
Also published as: EP3905246A1; EP3905246A4; US20220130360A1; CN110010162A; JP7222112B2; WO2020173391A1

Abstract

本出願の実施形態は、歌の録音方法、音声補正方法、および電子デバイスを提供し、音声技術の分野に関連する。対応する歌唱スキルをユーザが録音した歌に追加し得、ユーザがカラオケアプリケーションを使用するときの録音効果および使用体験を改善する。方法は、電子デバイスによって、第１のインターフェースを表示することであって、第１のインターフェースは、第１の歌を録音するために使用される録音ボタンを含むことと、ユーザが録音ボタンを選択した操作に応答して、電子デバイスによって、第１の歌の伴奏および元の歌手のアカペラの特徴情報を取得することであって、元の歌手のアカペラの特徴情報は、元の歌手が第１の歌を歌うときに元の歌手の歌唱特徴を反映するために使用され得ることと、電子デバイスによって、第１の歌の伴奏の再生を開始し、ユーザによって歌われるユーザのアカペラの録音を開始することと、ユーザのアカペラを録音するプロセスにおいて、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、第２のインターフェース上にガイダンス情報を表示することであって、ガイダンス情報は、ユーザの歌唱中に息継ぎおよびビブラートの１つまたは複数をガイドするために使用されることとを含む。

Description

この出願は、音声技術の分野、特に、歌の録音方法、音声補正方法、および電子デバイスに関連する。

この出願は、2019年2月28日に中国国家知識産権局に提出された「歌の録音方法、音声補正方法、および電子デバイス」と題された中国特許出願第201910152655.3号の優先権を主張し、参照によりその全体が本明細書に組み込まれる。

歌うことが好きなユーザにとって、カラオケアプリケーションは、携帯電話やタブレットコンピュータなどの電子デバイスにインストールされた人気のあるアプリケーションになっている。例えば、カラオケアプリケーションを開いた後、ユーザは、録音される必要のある歌を選択し得る。さらに、カラオケアプリケーションは、歌の伴奏をロードし得、かつ携帯電話のマイクなどの音声ピックアップコンポーネントを呼び出して、ユーザが歌を歌った後に取得される音声を録音し、それによって、ユーザ自身の歌声を、カラオケアプリケーションによって提供される伴奏に統合し得る。

現在、カラオケアプリケーションを使用するユーザの歌唱体験を向上させるために、一部のカラオケアプリケーションは、ユーザによって録音された歌の音声補正機能を提供している。例えば、カラオケアプリケーションは、ユーザによって録音された歌Ａを歌Ａの元の音声と比較し得、ユーザによって録音された歌声のイントネーションおよびリズムを元の音声のイントネーションおよびリズムに変更し得、それによって、ユーザが歌を録音するときに発生するイントネーションおよびリズムの問題を補正する。

しかしながら、イントネーションおよびリズムの問題に加えて、一般的なユーザは通常、プロの音声音楽トレーニングを受けていない。そのため、歌唱スキルが不十分なユーザは依然として、歌を録音するときに良好な録音効果を得ることができない。

この出願は、歌の録音方法、音声補正方法、および電子デバイスを提供し、ユーザが歌を録音するときに対応する歌唱スキルを使用するようにユーザをガイドし、それによってユーザがカラオケアプリケーションを使用するときの録音効果および使用体験を改善する。

前述の目的を達成するために、この出願では次の技術的解決策が使用される。

第１の態様によれば、この出願は、歌の録音方法を提供し、当該方法は、電子デバイスによって、第１のインターフェースを表示することであって、第１のインターフェースは、第１の歌を録音するために使用される録音ボタンを含むことと、ユーザが録音ボタンを選択したことが検出された場合、電子デバイスによって、第１の歌の伴奏と元の歌手のアカペラの特徴情報とを取得することであって、元の歌手のアカペラの特徴情報は、元の歌手が第１の歌を歌うときに元の歌手の歌唱の特徴を反映するために使用され得ることと、さらに、電子デバイスによって、第１の歌の伴奏の再生を開始することと、ユーザによって歌われるユーザのアカペラの録音を開始することと、ユーザのアカペラを記録するプロセスにおいて、元の歌手のアカペラの特徴情報に基づいて、電子デバイスによって第２のインターフェース上にガイダンス情報を表示することであって、ガイダンス情報は、ユーザの歌唱中の１つまたは複数の息継ぎとビブラートをガイドするために使用されることとを含む。言い換えれば、ユーザが歌を録音しているとき、電子デバイスは、元の歌手の歌唱特徴に基づいてガイダンス情報を表示し得、ユーザの歌唱中に息継ぎまたはビブラートなどの１つまたは複数の歌唱スキルをガイドし、それによって、ユーザが歌を録音するときの録音効果と使用経験を改善する。

可能な実装において、元の歌手のアカペラの特徴情報は、元の歌手のアカペラ内の息継ぎ位置を含み、この場合、ガイダンス情報は、息継ぎプロンプトを含み得る。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて第２のインターフェース上でガイダンス情報を表示することは、電子デバイスによって、元の歌手のアカペラの息継ぎ位置に基づいて第２のインターフェース上に、元の歌手のアカペラの息継ぎ位置に対応する息継ぎプロンプトを表示し、ユーザが歌う際にユーザが息継ぎの変化を制御するのを助け、それによって録音された歌の比較的明白で無秩序な息継ぎ音を減らし、録音された歌のリスニング品質を向上させる。

例えば、第２のインターフェースは、第１の歌の歌詞を含み得る。この場合、第２のインターフェース上の電子デバイスによって、元の歌手のアカペラの息継ぎ位置に基づいて、元の歌手のアカペラの息継ぎ位置に対応する息継ぎプロンプトを表示することは、電子デバイスによって、歌詞の第１の位置で息継ぎプロンプトを表示することであって、第１の位置は、元の歌手のアカペラの息継ぎ位置と同じであることを含む。

あるいは、第２のインターフェースは、歌唱ツールを含み得、歌唱ツールは、録音されている歌詞の各単語のメモを表示するように構成される。この場合、第２のインターフェース上の電子デバイスによって、元の歌手のアカペラの息継ぎ位置に基づいて、元の歌手のアカペラの息継ぎ位置に対応する息継ぎプロンプトを表示することは、電子デバイスによって、歌唱ツールの第２の位置で息継ぎプロンプトを表示することであって、第２の位置は、元の歌手のアカペラの息継ぎ位置と同じであることを含む。

可能な実装において、元の歌手のアカペラの特徴情報は、元の歌手のアカペラのビブラート特徴を含み、この場合、対応するガイダンス情報は、ビブラートプロンプトを含む。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて第２のインターフェース上にガイダンス情報を表示することは、電子デバイスによって、元の歌手のアカペラのビブラート特徴に基づいて第２のインターフェース上に元の歌手のアカペラのビブラート特徴に対応するビブラートプロンプトを表示することを含む。このように、歌を録音するとき、ユーザは、歌詞で促されたビブラート位置に基づいてビブラートで歌うことができ、ユーザが歌っているときの歌の階層感および歌唱スキルを改善し、それによって、録音された歌のリスニング品質を改善する。

例えば、ビブラート特徴はビブラート位置を含み、第２のインターフェースは第１の歌の歌詞を含む。この場合、電子デバイスによって、元の歌手のアカペラのビブラート特徴に基づいて第２のインターフェース上に、元の歌手のアカペラのビブラート特徴に対応するビブラートプロンプトを表示することは、電子デバイスによって、歌詞の第３の位置でビブラートプロンプトを表示することであって、第３の位置は元の歌手のアカペラのビブラート位置と同じであることを含む。

あるいは、ビブラート特徴はビブラート位置を含み、第２のインターフェースは歌唱ツールを含み、歌唱ツールは、録音されている歌詞の各単語の音符を表示するように構成される。この場合、電子デバイスによって、元の歌手のアカペラのビブラート特徴に基づいて第２のインターフェース上に、元の歌手のアカペラのビブラート特徴に対応するビブラートプロンプトを表示することは、電子デバイスによって、歌唱ツールの第４の位置でビブラートプロンプトを表示することであって、第４の位置は元の歌手のアカペラのビブラート位置と同じであることを含む。

例えば、元の歌手のアカペラの特徴情報は、元の歌手のアカペラの基本周波数情報をさらに含み得、電子デバイスは、元の歌手のアカペラの基本周波数情報に基づいてイントネーションプロンプトを生成し、第２のインターフェース上にイントネーションプロンプトを表示し得、歌唱中にユーザのイントネーションをガイドする。

可能な実装では、ユーザのアカペラを録音するプロセスにおいて、方法はさらに、電子デバイスによって、ユーザのアカペラからユーザのアカペラの特徴情報を抽出することであって、ユーザのアカペラは、ユーザが第１の歌を歌うときにユーザの歌唱特徴を反映するために使用されることと、電子デバイスによって、ユーザのアカペラの特徴情報を元の歌手のアカペラの特徴情報と比較することによって、第２のインターフェース上に評価結果を表示することとを含む。

ユーザの歌の録音プロセスにおいて、電子デバイスが、元の歌手のアカペラの特徴情報に基づいて、ユーザの歌唱のイントネーション、ビブラート、および息継ぎなどの１つまたは複数の歌唱スキルをリアルタイムで評価し得ることを学ぶことができる。イントネーションのみに基づいてユーザの歌唱レベルを評価するのと比較して、本出願の本実施形態では、ユーザの歌唱の評価時に、ユーザの息継ぎやビブラートなどの要素も考慮され、したがって、得られた評価結果はより正確であり、より豊富であり、より客観的である。さらに、電子デバイスは、ユーザの歌唱の評価結果を第２のインターフェース上でリアルタイムにユーザにフィードバックし得、その結果、ユーザは、ユーザの現在の歌唱効果を時間内に学習し、後続の録音プロセスで時間内に歌唱方法を調整することができる。

可能な実装において、ユーザのアカペラの特徴情報は、ユーザのアカペラ内の息継ぎ位置を含み、元の歌手のアカペラの特徴情報は、元の歌手のアカペラ内の息継ぎ位置を含む。電子デバイスによって、ユーザのアカペラの特徴情報を元の歌手のアカペラの特徴情報と比較することによって第２のインターフェース上に評価結果を表示することは、電子デバイスによって、ユーザのアカペラ内の息継ぎ位置を元の歌手のアカペラ内の息継ぎ位置と比較することによって第２のインターフェース上に息継ぎスキルの評価結果を表示することを含む。

例えば、電子デバイスによって、ユーザのアカペラの息継ぎ位置を元の歌手のアカペラの息継ぎ位置と比較することによって第２のインターフェース上に息継ぎスキルの評価結果を表示することは、ユーザのアカペラの息継ぎ位置が元の歌手のアカペラの息継ぎ位置と同じである場合に、電子デバイスによって、正確な息継ぎを示すプロンプトを第２のインターフェース上に表示すること、または、ユーザのアカペラの息継ぎ位置が元の歌手のアカペラの息継ぎ位置と異なる場合に、電子デバイスによって、息継ぎエラーを示すプロンプトを第２のインターフェース上に表示することを含む。

可能な実装において、ユーザのアカペラの特徴情報は、ユーザのアカペラのビブラート特徴を含み、元の歌手のアカペラの特徴情報は、元の歌手のアカペラのビブラート特徴を含む。電子デバイスによって、ユーザのアカペラの特徴情報を元の歌手のアカペラの特徴情報と比較することによって第２のインターフェース上に評価結果を表示することは、電子デバイスによって、ユーザのアカペラのビブラート特徴を元の歌手のアカペラのビブラート特徴と比較することによって第２のインターフェース上にビブラートスキルの評価結果を表示することを含む。

例えば、電子デバイスによって、ユーザのアカラのビブラート特徴を元の歌手のアカペラのビブラート特徴と比較することによって第２のインターフェース上にビブラートスキルの評価結果を表示することは、電子デバイスによって、ユーザのアカペラのビブラート特徴が元の歌手のアカペラのビブラート特徴と同じである場合、電子デバイスによって、正確なビブラートを示すプロンプトを第２のインターフェース上に表示すること、または、ユーザのアカペラのビブラート特徴が元の歌手のアカペラのビブラート特徴と異なる場合に、電子デバイスによって、ビブラートエラーを示すプロンプトを第２のインターフェース上に表示することを含む。

可能な実装では、電子デバイスによって、第２のインターフェース上に評価結果を表示することは、電子デバイスによって、第２のインターフェース上に歌詞内で評価結果を表示すること、または、電子デバイスによって、第２のインターフェース上に歌唱ツール内で評価結果を表示することを含む。

可能な実装では、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて第２のインターフェース上にガイダンス情報を表示した後、方法はさらに、第１の歌の録音が終了した後、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいてユーザのアカペラに現れる歌唱の問題を補正することを含み、歌唱の問題は、１つまたは複数の息継ぎの問題およびビブラートの問題を含む。このように、プロの声楽訓練を受けていない一般のユーザも、比較的良好なリスニング品質で歌声を録音することができ、それにより、ユーザが歌を録音するときの録音効果および使用体験を改善する。

第２の態様によれば、この出願は、音声補正方法を提供し、当該方法は、電子デバイスによって、第１のインターフェースを表示することであって、第１のインターフェースは、第１の歌を録音するために使用される録音ボタンを含むこと、ユーザが録音ボタンを選択したことが検出された場合、電子デバイスによって、第１の歌の伴奏と元の歌手のアカペラの特徴情報とを取得することであって、元の歌手のアカペラの特徴情報は、元の歌手が第１の歌を歌うときの元の歌手の歌唱特徴を反映するために使用されることと、さらに、電子デバイスによって、第１の歌の伴奏を再生し始め、ユーザによって歌われるユーザのアカペラを録音し始めることと、第１の歌の録音が終了した後、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、録音されたユーザのアカペラに現れる歌唱の問題を補正することであって、歌唱の問題は、１つまたは複数の息継ぎの問題およびビブラートの問題を含むことを含む。言い換えれば、電子デバイスは、ユーザによって録音された歌の息継ぎまたはビブラートなどの歌唱スキルの問題を補正し得る。このように、プロの声楽訓練を受けていない一般のユーザも、比較的良好なリスニング品質で歌声を録音することができ、それにより、ユーザが歌を録音するときの録音効果および使用体験を改善する。

可能な実装では、歌唱の問題は息継ぎの問題である。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れる歌唱の問題を補正することは、電子デバイスによって、ユーザのアカペラからユーザアカペラの息継ぎ音を抽出することと、電子デバイスによって、ユーザのアカペラの息継ぎ音のエネルギーと周波数応答を低減して、ユーザのアカペラに現れる息継ぎの問題を弱め、それによって、録音された歌のリスニング品質を改善することとを含む。

可能な実装では、歌唱の問題はビブラートの問題である。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れる歌唱の問題を補正することは、電子デバイスによって、ユーザのアカペラからユーザのアカペラのビブラート特徴を抽出することと、ユーザのアカペラのビブラート特徴が元の歌手のアカペラの特徴情報のビブラート特徴と一致しない場合、例えば、ユーザのアカペラのビブラート位置、ビブラート振幅、ビブラート周波数、および安定傾向項目のうちの１つが元の歌手のアカペラと一致しない場合、電子デバイスによって、元のアカペラのビブラート特徴を使用することによってユーザのアカペラのビブラート特徴を補正して、ユーザのアカペラに現れるビブラートの問題を補正することとを含む。例えば、電子デバイスは、元の歌手のアカペラ内の対応するビブラートのビブラート振幅、ビブラート周波数、または安定傾向項目を使用することによって、ユーザのアカペラ内の新しいビブラートを合成し得、ユーザのアカペラに現れるビブラート音声効果を改善する。

確かに、歌唱の問題は、あるいはイントネーションの問題であり得る。電子デバイスは、ユーザのアカペラで音調が過度に高い位置で音調降下処理を実行し得、ユーザのアカペラで音調が過度に低い位置で音調上昇処理を実行し得、ユーザのアカペラの音調が元の歌手のアカペラの音調と同じかまたはそれに近いようにする。

可能な実装において、第１の歌の録音が終了した後、方法は、電子デバイスによって、第２のインターフェースを表示することをさらに含み、第２のインターフェースは、音声補正スイッチを含む。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れる歌唱の問題を補正することは、ユーザが音声補正スイッチをオンにしたことが検出された場合、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいてユーザのアカペラに現れる歌唱の問題を補正することを含む。

可能な実装では、第１の歌の録音が終了した後、方法はさらに、電子デバイスによって、第２のインターフェースを表示することを含み、第２のインターフェースは音声補正オプションを含み、音声補正オプションは、イントネーション補正オプション、息継ぎ補正オプション、およびビブラート補正オプションを含む。電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れる歌唱の問題を補正することは、ユーザによって選択された音声補正オプションに応答して、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、音声補正オプションに対応し、ユーザのアカペラに現れる歌唱の問題を補正することを含む。

可能な実装では、第１の歌の録音が終了した後、方法はさらに、電子デバイスによって、第２のインターフェースを表示することであって、第２のインターフェースは、単一文補正オプションを含むことと、単一文補正オプションのユーザの選択に応答して、電子デバイスによって、第３のインターフェースを表示することであって、第３のインターフェースは、第１の歌の歌詞のＮ（Ｎ＞１）個の文を含むことを含む。この場合、電子デバイスによって、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れる歌唱の問題を補正することは特に、ユーザがＮ個の文から第１の歌詞を選択した場合に、電子デバイスによって、元の歌手のアカペラにあり、元の歌手が第１の歌詞を歌った後に得られる特徴情報に基づいて、第１の歌詞に対応し、ユーザのアカペラに現れる歌唱の問題を補正することを含む。このようにして、ユーザは、今回録音されたユーザのアカペラに現れる歌唱の問題を一文ずつ補正し得、ユーザによって録音された歌を、ユーザがより満足する歌唱効果に補正する。

さらに、第３のインターフェースを表示するとき、電子デバイスは、第３のインターフェース上の歌詞のＮ個の文において、歌唱の問題が現れる位置をさらにマークし得る。このようにして、ユーザは、ユーザが歌詞のそれぞれの文を歌うときに現れる特定の問題を直感的に見ることができる。

第３の態様によれば、この出願は、タッチスクリーン、１つまたは複数のプロセッサ、１つまたは複数のメモリ、１つまたは複数のマイクロフォン、および１つまたは複数のコンピュータプログラムを含む電子デバイスを提供する。プロセッサは、タッチスクリーン、メモリ、およびマイクロフォンに接続される。１つまたは複数のコンピュータプログラムは、メモリに保存される。電子デバイスが稼働すると、プロセッサは、メモリに格納された１つまたは複数のコンピュータプログラムを実行し、その結果、電子デバイスは、前述の実装のいずれか１つに従って、歌の録音方法または音声補正方法を実行する。

第４の態様によれば、この出願は、コンピュータ命令を含むコンピュータ記憶媒体を提供する。コンピュータ命令が電子デバイス上で実行されると、電子デバイスは、第１の態様の任意の実装に従って、歌の録音方法または音声補正方法を実行することができる。

第５の態様によれば、この出願は、コンピュータプログラム製品を提供する。コンピュータプログラム製品が電子デバイス上で実行されると、電子デバイスは、第１の態様の任意の実装に従って、歌の録音方法または音声補正方法を実行することができる。

第６の態様によれば、この出願は、グラフィカルユーザインターフェース（ＧＵＩ）を提供し、グラフィカルユーザインターフェースは、電子デバイスに格納され、電子デバイスは、タッチスクリーン、メモリ、およびプロセッサを含む。プロセッサは、メモリに格納されている１つまたは複数のコンピュータプログラムを実行するように構成される。グラフィカルユーザインターフェースは、タッチスクリーンに表示される第１のＧＵＩを含み、第１のＧＵＩは、第１の歌を録音するために使用される録音ボタン、記録ボタンのタッチイベントに応答してタッチスクリーンに表示される第２のＧＵＩを含み、第２のＧＵＩは、第１の歌を録音するための録音インターフェースであり、第２のＧＵＩは、ユーザに第１の歌を歌うように案内するためのガイダンス情報を含み、ガイダンス情報は、息継ぎプロンプトおよび／またはビブラートプロンプトを含み得る。

例えば、第２のＧＵＩは、歌唱中のユーザの息継ぎスキルおよび／またはビブラートスキルの評価結果をさらに含み得る。

例えば、第２のＧＵＩがタッチスクリーンに表示された後、ＧＵＩはさらに、第１の歌の録音が終了した後にタッチスクリーンに表示される第３のＧＵＩであって、第３のＧＵＩは第１の歌の音声補正インターフェースであり、第３のＧＵＩは音声補正スイッチを含み、音声補正スイッチがユーザによってオンにされると、電子デバイスは、ユーザのアカペラに現れる息継ぎの問題および／またはビブラートの問題を補正する。

第３の態様で提供される電子デバイス、第４の態様で提供されるコンピュータ記憶媒体、第５の態様で提供されるコンピュータプログラム製品、および第６の態様で提供されるＧＵＩはすべて、上記で提供された対応する方法を実行するように構成されることが理解され得る。したがって、達成できる有益な効果については、上記で提供された対応する方法の有益な効果を参照されたい。詳細については、ここでは再度説明しない。

本出願の一実施形態による電子デバイスの概略構造図１である。本出願の一実施形態による、電子デバイス内のオペレーティングシステムの概略アーキテクチャ図である。本出願の一実施形態による、歌の録音方法および音声補正方法の概略フローチャートである。本出願の一実施形態による歌の録音方法のシナリオの概略図１である。本出願の一実施形態による歌の録音方法のシナリオの概略図２である。本出願の一実施形態による歌の録音方法のシナリオの概略図３である。本出願の一実施形態による歌の録音方法のシナリオの概略図４である。本出願の一実施形態による歌の録音方法のシナリオの概略図５である。本出願の一実施形態による歌の録音方法のシナリオの概略図６である。本出願の一実施形態による歌の録音方法のシナリオの概略図６である。本出願の一実施形態による歌の録音方法のシナリオの概略図７である。本出願の一実施形態による歌の録音方法のシナリオの概略図７である。本出願の一実施形態による歌の録音方法のシナリオの概略図７である。本出願の一実施形態による歌録音方法のシナリオの概略図８である。本出願の一実施形態による歌録音方法のシナリオの概略図８である。本出願の一実施形態による歌録音方法のシナリオの概略図９である。本出願の一実施形態による歌録音方法のシナリオの概略図９である。本出願の一実施形態による音声補正方法のシナリオの概略図１である。本出願の一実施形態による音声補正方法のシナリオの概略図２である。本出願の一実施形態による音声補正方法のシナリオの概略図３である。本出願の一実施形態による音声補正方法のシナリオの概略図３である。本出願の一実施形態による音声補正方法のシナリオの概略図４である。本出願の一実施形態による音声補正方法のシナリオの概略図４である。本出願の一実施形態による電子デバイスの概略構造図２である。

以下は、添付の図面を参照して、実施形態の実装を詳細に説明する。

例えば、本出願の実施形態で提供される歌の録音方法および音声補正方法は、携帯電話、タブレットコンピュータ、音符ブックコンピュータ、ウルトラモバイルパーソナルコンピュータ（ultra-mobile personal computer, UMPC）、ハンドヘルドコンピュータ、ネットブック、携帯情報端末（personal digital assistant, PDA）、ウェアラブル電子デバイス、および仮想現実デバイスなどの電子デバイスに適用され得る。これは、この出願の実施形態に限定されない。

例えば、図１は、電子デバイス１００の概略構造図である。

電子デバイス１００は、プロセッサ１１０、外部メモリインターフェース１２０、内部メモリ１２１、ユニバーサルシリアルバス（universal serial bus, USB）インターフェース１３０、充電管理モジュール１４０、電力管理モジュール１４１、バッテリ１４２、アンテナ１、アンテナ２、移動体通信モジュール１５０、無線通信モジュール１６０、音声モジュール１７０、ラウドスピーカー１７０Ａ、電話受信機１７０Ｂ、マイクロフォン１７０Ｃ、ヘッドセットインターフェース１７０Ｄ、センサモジュール１８０、ボタン１９０、モータ１９１、インジケータ１９２、カメラ１９３、ディスプレイ１９４、および加入者識別モジュール（subscriber identification module, SIM）カードインターフェース１９５を含み得る。センサモジュール１８０は、圧力センサ１８０Ａ、ジャイロセンサ１８０Ｂ、気圧センサ１８０Ｃ、磁気センサ１８０Ｄ、加速度センサ１８０Ｅ、距離センサ１８０Ｆ、光近接センサ１８０Ｇ、指紋センサ１８０Ｈ、温度センサ１８０Ｊ、タッチセンサ１８０Ｋ、環境光センサ１８０Ｌ、骨伝導センサ１８０Ｍなどを含み得る。

本出願のこの実施形態に示される構造は、電子デバイス１００を特に限定しないことが理解され得る。この出願の他のいくつかの実施形態では、電子デバイス１００は、図に示されるものよりも多いまたは少ない部品を含み得るか、いくつかの部品を組み合わせ得るか、いくつかの部品を分割し得るか、または異なる部品配置を有し得る。図に示されている部品は、ハードウェア、ソフトウェア、またはソフトウェアとハードウェアの組み合わせを使用することによって実装され得る。

プロセッサ１１０は、１つまたは複数の処理ユニットを含み得る。例えば、プロセッサ１１０は、アプリケーションプロセッサ（application processor, AP）、モデムプロセッサ、グラフィックス処理ユニット（graphics processing unit, GPU）、画像信号プロセッサ（image signal processor, ISP）、コントローラ、ビデオコーデック、デジタル信号プロセッサ（digital signal processor, DSP）、ベースバンドプロセッサ、および／またはニューラルネットワーク処理ユニット（neural-network processing unit, NPU）を含み得る。異なる処理ユニットは、独立したコンポーネントであり得、あるいは１つまたは複数のプロセッサに統合され得る。

コントローラは、命令動作コードおよび時系列信号に基づいて動作制御信号を生成し得、フェッチ命令および実行命令を制御する。

メモリは、プロセッサ１１０内にさらに配置し得、命令およびデータを格納するように構成される。いくつかの実施形態では、プロセッサ１１０内のメモリはキャッシュメモリである。メモリは、プロセッサ１１０によってちょうど使用されるか、または周期的に使用される命令またはデータを格納し得る。プロセッサ１１０が命令またはデータを再び使用する必要がある場合、プロセッサ１１０は、メモリから命令またはデータを直接呼び出し得、それにより、繰り返しアクセスを回避し、プロセッサ１１０の待機時間を短縮する。したがって、システム効率が向上する。

いくつかの実施形態では、プロセッサ１１０は、１つまたは複数のインターフェースを含み得る。インターフェースは、集積回路間（inter-integrated circuit, I2C）インターフェース、集積回路間音（inter-integrated circuit sound, I2S）インターフェース、パルスコード変調（pulse code modulation, PCM)インターフェース、ユニバーサル非同期受信機／送信機（universal asynchronous receiver/transmitter, UART）インターフェース、モバイル産業プロセッサーインターフェース（mobile industry processor interface, MIPI）、汎用入力/出力（general-purpose input/output, GPIO）インターフェース、加入者識別モジュール（subscriber identity module, SIM）インターフェース、ユニバーサルシリアルバス（universal serial bus, USB）インターフェースなどを含み得る。

Ｉ２Ｃインターフェースは双方向同期シリアルバスであり、１つのシリアルデータライン（serial data line, SDA）と１つのシリアルクロックライン（derail clock line, SCL）を含む。いくつかの実施形態では、プロセッサ１１０は、複数のＩ２Ｃバスを含み得る。プロセッサ１１０は、異なるＩ２Ｃバスインターフェースを使用することによって、タッチセンサ１８０Ｋ、充電器、カメラフラッシュ、カメラ１９３などに別々に結合され得る。例えば、プロセッサ１１０は、Ｉ２Ｃインターフェースを使用することによってタッチセンサ１８０Ｋに結合され得、その結果、プロセッサ１１０は、Ｉ２Ｃバスインターフェースを使用することによってタッチセンサ１８０Ｋと通信し、電子デバイス１００のタッチ機能を実装する。

Ｉ２Ｓインターフェースは音声通信に使用され得るいくつかの実施形態では、プロセッサ１１０は、複数のＩ２Ｓバスを含み得る。プロセッサ１１０は、Ｉ２Ｓバスを使用することによって音声モジュール１７０に結合され得、プロセッサ１１０と音声モジュール１７０との間の通信を実装する。いくつかの実施形態では、音声モジュール１７０は、Ｉ２Ｓインターフェースを使用することによって音声信号を無線通信モジュール１６０に送信し得、ブルートゥースヘッドセットを使用することによって電話に出る機能を実装する。

ＰＣＭインターフェースは、音声通信、アナログ信号のサンプリング、量子化、および符号化にも使用され得る。いくつかの実施形態では、音声モジュール１７０は、ＰＣＭバスインターフェースを使用することによって無線通信モジュール１６０に結合され得る。いくつかの実施形態では、音声モジュール１７０はまた、ＰＣＭインターフェースを使用することによって音声信号を無線通信モジュール１６０に送信し得、ブルートゥースヘッドセットを使用することによって電話に出る機能を実装する。Ｉ２ＳインターフェースとＰＣＭインターフェースの両方が音声通信に使用され得る。

ＵＡＲＴインターフェースはユニバーサルシリアルデータバスであり、非同期通信に使用される。バスは双方向通信バスであり得る。バスは、シリアル通信とパラレル通信の間で送信されるデータを変換する。いくつかの実施形態では、ＵＡＲＴインターフェースは通常、プロセッサ１１０を無線通信モジュール１６０に接続するように構成される。例えば、プロセッサ１１０は、ＵＡＲＴインターフェースを使用することによって無線通信モジュール１６０内のブルートゥースモジュールと通信して、ブルートゥース機能を実装する。いくつかの実施形態では、音声モジュール１７０は、ＵＡＲＴインターフェースを使用することによって音声信号を無線通信モジュール１６０に送信し得、ブルートゥースヘッドセットを使用することによって音楽を再生する機能を実装する。

ＭＩＰＩインターフェースは、プロセッサ１１０をディスプレイ１９４またはカメラ１９３などの周辺コンポーネントに接続するように構成され得る。ＭＩＰＩインターフェースは、カメラシリアルインターフェース（camera serial interface, CSI）、ディスプレイシリアルインターフェース（display serial interface, DSI）などを含む。いくつかの実施形態では、プロセッサ１１０は、ＣＳＩインターフェースを使用することによってカメラ１９３と通信して、電子デバイス１００の写真撮影機能を実装する。プロセッサ１１０は、ＤＳＩインターフェースを使用することによってディスプレイ１９４と通信し、電子デバイス１００の表示機能を実装する。

ＧＰＩＯインターフェースは、ソフトウェアを使用することによって構成され得る。ＧＰＩＯインターフェースは、制御信号として構成され得、あるいはデータ信号として構成され得る。いくつかの実施形態では、ＧＰＩＯインターフェースは、プロセッサ１１０をカメラ１９３、ディスプレイ１９４、無線通信モジュール１６０、音声モジュール１７０、センサモジュール１８０などに接続するように構成され得る。ＧＰＩＯインターフェースは、代替的に、Ｉ２Ｃインターフェース、Ｉ２Ｓインターフェース、ＵＡＲＴインターフェース、ＭＩＰＩインターフェースなどとして構成され得る。

本発明の本実施形態に示されるモジュール間のインターフェース接続関係は、単に概略的な説明であり、電子デバイス１００の構造を限定しないことが理解され得る。本出願の他のいくつかの実施形態では、電子デバイス１００は、代替的に、前述の実施形態とは異なるインターフェース接続方法を使用し得るか、または複数のインターフェース接続方法の組み合わせを使用し得る。

充電管理モジュール１４０は、充電器から充電入力を受け取るように構成される。充電器は、無線充電器または有線充電器であり得る。有線充電のいくつかの実施形態では、充電管理モジュール１４０は、ＵＳＢインターフェース１３０を使用することによって有線充電器の充電入力を受け取り得る。無線充電のいくつかの実施形態では、充電管理モジュール１４０は、電子デバイス１００の無線充電コイルを使用することによって無線充電入力を受け取り得る。バッテリ１４２を充電している間、充電管理モジュール１４０は、電力管理モジュール１４１を使用することによって、電子デバイスにさらに電力を供給し得る。

電力管理モジュール１４１は、バッテリ１４２、充電管理モジュール１４０、およびプロセッサ１１０を接続するように構成される。電力管理モジュール１４１は、バッテリ１４２および／または充電管理モジュール１４０の入力を受け取り、プロセッサ１１０、内部メモリ１２１、ディスプレイ１９４、カメラ１９３、無線通信モジュール１６０などに電力を供給する。電力管理モジュール１４１は、バッテリ容量、バッテリサイクル時間の量、およびバッテリの健康状態（漏電またはインピーダンス）などのパラメータを監視するようにさらに構成され得る。いくつかの他の実施形態では、電力管理モジュール１４１は、代替的に、プロセッサ１１０内に配置され得る。いくつかの他の実施形態では、電力管理モジュール１４１および充電管理モジュール１４０は、代替的に同じ構成要素に配置され得る。

電子デバイス１００の無線通信機能は、アンテナ１、アンテナ２、移動体通信モジュール１５０、無線通信モジュール１６０、モデムプロセッサ、ベースバンドプロセッサなどを使用することによって実装され得る。

アンテナ１およびアンテナ２は、電磁波信号を送受信するように構成される。電子デバイス１００の各アンテナは、単一の通信周波数帯域または複数の通信周波数帯域をカバーするように構成され得る。アンテナの利用を向上させるために、異なるアンテナがさらに多重化され得る。例えば、アンテナ１は、無線ローカルエリアネットワークのダイバーシティアンテナとして多重化され得る。いくつかの他の実施形態では、アンテナは、調整スイッチと組み合わせて使用され得る。

移動体通信モジュール１５０は、電子デバイス１００に適用される２Ｇ／３Ｇ／４Ｇ／５Ｇなどを含む無線通信のための解決策を提供し得る。移動体通信モジュール１５０は、１つまたは複数のフィルタ、１つまたは複数のスイッチ、１つまたは複数の電力増幅器、１つまたは複数の低雑音増幅器（low noise amplifier, LNA）などを含み得る。移動体通信モジュール１５０は、アンテナ１を使用することによって電磁波を受信し得、受信した電磁波に対してフィルタリングまたは増幅などの処理を行い得、復調のために電磁波をモデムプロセッサに送信し得る。移動体通信モジュール１５０は、モデムプロセッサによって変調された信号をさらに増幅し得、アンテナ１を使用することによって信号を電磁波に変換し得、電磁波を放射し得る。いくつかの実施形態では、移動体通信モジュール１５０の少なくともいくつかの機能モジュールは、プロセッサ１１０内に配置され得る。いくつかの実施形態では、移動体通信モジュール１５０内の少なくともいくつかの機能モジュールおよびプロセッサ１１０内の少なくともいくつかのモジュールは、同じ構成要素に配置され得る。

モデムプロセッサは、変調器および復調器を含み得る。変調器は、送信される低周波数ベースバンド信号を中高周波数信号に変調するように構成される。復調器は、受信した電磁波信号を低周波ベースバンド信号に復調するように構成される。次に、復調器は、復調によって得られた低周波ベースバンド信号を、処理のためにベースバンドプロセッサに送信する。低周波ベースバンド信号は、ベースバンドプロセッサによって処理され、次いで、アプリケーションプロセッサに送信される。アプリケーションプロセッサは、音声デバイス（ラウドスピーカー１７０Ａ、電話受信機１７０Ｂなどに限定されない）を使用することによって音声信号を出力するか、またはディスプレイ１９４を使用することによって画像またはビデオを表示する。いくつかの実施形態では、モデムプロセッサは、独立したコンポーネントであり得る。いくつかの他の実施形態では、モデムプロセッサは、プロセッサ１１０から独立し得、移動体通信モジュール１５０または別の機能モジュールと同じコンポーネントに配置される。

無線通信モジュール１６０は、電子デバイス１００に適用される、無線ローカルエリアネットワーク（wireless local area networks, WLAN）（ワイヤレスフィデリティ（wireless fidelity, Wi-Fi）ネットワークなど）、ブルートゥース（Bluetooth, BT）、グローバルナビゲーション衛星システム（global navigation satellite system, GNSS）、周波数変調（frequency modulation, FM）、近距離通信（near field communication, NFC）技術、赤外線（infrared, IR）技術などを含む無線通信のための解決策を提供し得る。無線通信モジュール１６０は、１つまたは複数の通信処理モジュールと統合された１つまたは複数のコンポーネントであり得る。無線通信モジュール１６０は、アンテナ２を使用することによって電磁波を受信し、電磁波信号に対して周波数変調およびフィルタリング処理を実行し、処理された信号をプロセッサ１１０に送信する。無線通信モジュール１６０はさらに、プロセッサ１１０から送信される信号を受信し、信号に対して周波数変調を実行して信号を増幅し、アンテナ２を使用することによって信号を電磁波に変換し、電磁波を放射し得る。

いくつかの実施形態では、電子デバイス１００のアンテナ１および移動体通信モジュール１５０が結合され、アンテナ２および無線通信モジュール１６０が結合され、その結果、電子デバイス１００は、無線通信技術を使用することによってネットワークおよび別のデバイスと通信し得る。無線通信技術は、移動体通信のためのグローバルシステム（global system for mobile communications, GSM）、一般的なパケット無線サービス（general packet radio service, GPRS）、符号分割多元接続（code division multiple access, CDMA）、広帯域符号分割多元接続（wideband code division multiple access, WCDMA）、時分割符号分割多元接続（time-division code division multiple access, TD-SCDMA）、ロングタームエボリューション（long term evolution, LTE）、BT、GNSS、WLAN、NFC、FM、IR技術などを含み得る。GNSSは、全地球測位システム（global positioning system, GPS）、全地球測位衛星システム（global navigation satellite system, GLONASS）、BeiDou航法衛星システム（beidou navigation satellite system, BDS）、準天頂衛星システム（quasi-zenith satellite system, QZSS））、および/または衛星ベースの増強システム（satellite based augmentation systems, SBAS）を含み得る。

電子デバイス１００は、ＧＰＵ、ディスプレイ１９４、アプリケーションプロセッサなどを使用することによって表示機能を実装する。ＧＰＵは、画像処理のためのマイクロプロセッサであり、ディスプレイ１９４およびアプリケーションプロセッサに接続される。ＧＰＵは、数学的および幾何学的計算を実行するように構成され、画像のレンダリングに使用される。プロセッサ１１０は、表示情報を生成または変更するためのプログラム命令を実行する１つまたは複数のＧＰＵを含み得る。

ディスプレイ１９４は、画像、ビデオなどを表示するように構成される。ディスプレイ１９４は、ディスプレイパネルを含む。ディスプレイパネルは、液晶ディスプレイ（liquid crystal display, LCD）、有機発光ダイオード（organic light-emitting diode, OLED）、アクティブマトリックス有機発光ダイオードまたはアクティブマトリックス有機発光ダイオード（active-matrix organic light emitting diode, AMOLED）、フレキシブル発光ダイオード（flex light-emitting diode, FLED）、ミニLED、マイクロLED、マイクロOLED、量子ドット発光ダイオード（quantum dot light emitting diodes, QLED）などを使用し得る。いくつかの実施形態では、電子デバイス１００は、１つまたはＮ個のディスプレイ１９４を含み得、Ｎは、１より大きい正の整数である。

電子デバイス１００は、ＩＳＰ、カメラ１９３、ビデオコーデック、ＧＰＵ、ディスプレイ１９４、アプリケーションプロセッサなどを使用することによって、写真撮影機能を実装し得る。

ＩＳＰは、カメラ１９３によってフィードバックされたデータを処理するように構成される。例えば、撮影中、シャッターが有効になり、レンズを介してカメラの感光性要素に光が送信され、光信号が電気信号に変換され、カメラの感光性要素が処理のために電気信号をＩＳＰに送信し、電気信号を見ることができる画像に変換する。ＩＳＰはさらに、画像のノイズ、輝度、および肌の色のアルゴリズム最適化を実行し得る。ＩＳＰは、撮影シーンの露出や色温度などのパラメータをさらに最適化し得る。いくつかの実施形態では、ＩＳＰは、カメラ１９３内に配置され得る。

カメラ１９３は、静止画像またはビデオをキャプチャするように構成される。物体の光学画像は、レンズを使用することによって生成され、感光性要素に投影される。感光性要素は、電荷結合デバイス（charge coupled device, CCD）または相補型金属酸化膜半導体（complementary metal-oxide-semiconductor, CMOS）光電トランジスタであり得る。感光性要素は、光信号を電気信号に変換し、次に電気信号をＩＳＰに送信して、電気信号をデジタル画像信号に変換する。ＩＳＰは、デジタル画像信号を処理のためにＤＳＰに出力する。ＤＳＰは、デジタル画像信号をＲＧＢまたはＹＵＶなどの標準形式の画像信号に変換する。いくつかの実施形態では、電子デバイス１００は、１つまたはＮ個のカメラ１９３を含み得、Ｎは、１より大きい正の整数である。

デジタル信号プロセッサは、デジタル信号を処理するように構成され、デジタル画像信号に加えて別のデジタル信号をさらに処理し得る。例えば、電子デバイス１００が周波数を選択するとき、デジタル信号プロセッサは、周波数エネルギーに対してフーリエ変換などを実行するように構成される。

ビデオコーデックは、デジタルビデオを圧縮または解凍するように構成される。電子デバイス１００は、１つまたは複数のビデオコーデックをサポートすることができる。このように、電子デバイス１００は、複数の符号化フォーマット、例えば、動画専門家グループ（moving picture experts group, MPEG）１、ＭＰＥＧ２、ＭＰＥＧ３、およびＭＰＥＧ４でビデオを再生または記録することができる。

ＮＰＵはニューラルネットワーク（neural-network, NN）コンピューティングプロセッサであり、例えば人間の脳のニューロン間の伝達モードを参照するなど、生物学的ニューラルネットワーク構造を参照することによって入力情報を迅速に処理し、さらに継続的に自己学習を実行できる。電子デバイス１００のインテリジェント認識などのアプリケーションは、画像認識、顔認識、音声認識、およびテキスト理解などのＮＰＵを使用することによって実装することができる。

外部メモリインターフェース１２０は、電子デバイス１００の記憶能力を拡張するために、マイクロＳＤカードなどの外部記憶カードに接続するように構成され得る。外部記憶カードは、外部メモリインターフェース１２０を使用することによってプロセッサ１１０と通信し、データ記憶機能を実装して、例えば、音楽またはビデオなどのファイルを外部記憶カードに記憶する。

内部メモリ１２１は、１つまたは複数のコンピュータプログラムを格納するように構成され得、１つまたは複数のコンピュータプログラムは、命令を含む。プロセッサ１１０は、内部メモリ１２１に記憶された命令を実行し得、電子デバイス１００が、この出願のいくつかの実施形態で提供されるコンタクト、様々な機能アプリケーション、データ処理などをインテリジェントに推奨する方法を実行できるようにする。内部メモリ１２１は、プログラム記憶領域およびデータ記憶領域を含み得る。プログラム記憶領域は、オペレーティングシステムを記憶し得る。プログラム記憶領域は、１つまたは複数のアプリケーションプログラム（ギャラリーおよび連絡先など）をさらに記憶し得る。データ記憶領域は、電子デバイス１０１の使用中に作成されたデータ（写真や連絡先など）を記憶し得る。さらに、内部メモリ１２１は、高速ランダムアクセスメモリを含み得、さらに、１つまたは複数のディスクストレージコンポーネント、フラッシュコンポーネント、またはユニバーサルフラッシュストレージ（universal flash storage, UFS）などの、不揮発性メモリを含み得る。いくつかの他の実施形態では、プロセッサ１１０は、内部メモリ１２１に記憶された命令および／またはプロセッサに配置されたメモリに記憶された命令を実行して、電子デバイス１００が、この出願の実施形態で提供される番号をインテリジェントに推奨する方法、さまざまな機能アプリケーション、およびデータ処理を実行できるようにする。

電子デバイス１００は、音声モジュール１７０、ラウドスピーカー１７０Ａ、電話受信機１７０Ｂ、マイクロフォン１７０Ｃ、ヘッドセットインターフェース１７０Ｄ、アプリケーションプロセッサなどを使用することによって、音楽の再生または録音などの音声機能を実装し得る。

音声モジュール１７０は、デジタル音声情報をアナログ音声信号に変換し、アナログ音声信号を出力するように構成され、また、アナログ音声入力をデジタル音声信号に変換するように構成される。音声モジュール１７０は、音声信号を符号化および復号するようにさらに構成され得る。いくつかの実施形態では、音声モジュール１７０は、プロセッサ１１０内に配置され得るか、または音声モジュール１７０のいくつかの機能モジュールが、プロセッサ１１０内に配置され得る。

「スピーカー」とも呼ばれるラウドスピーカー１７０Ａは、音声電気信号を音声信号に変換するように構成される。電子デバイス１００は、ラウドスピーカー１７０Ａを使用することによって、ハンズフリーモードで音楽を再生したり、電話に応答したりし得る。

「イヤピース」とも呼ばれる電話受信機１７０Ｂは、音声電気信号を音声信号に変換するように構成される。電子デバイス１００を使用することによって電話に出たり、音声情報を聞いたりする場合、音声を聞くために、電話受信機１７０Ｂを人間の耳に近づけ得る。

「マイクロフォン」または「マイクロフォン」とも呼ばれるマイクロフォン１７０Ｃは、音声信号を電気信号に変換するように構成される。電話をかけるとき、または音声情報を送信するとき、ユーザは、口をマイクロフォン１７０Ｃに近づけて、音声信号をマイクロフォン１７０Ｃに入力することによって音を出し得る。１つまたは複数のマイクロフォン１７０Ｃは、電子デバイス１００に配置され得る。いくつかの他の実施形態では、２つのマイクロフォン１７０Ｃが電子デバイス１００に配置され得、音声信号を収集することに加えて、ノイズ低減機能をさらに実装し得る。いくつかの他の実施形態では、代わりに、３つ、４つ、またはそれ以上のマイクロフォン１７０Ｃが電子デバイス１００に配置され得、音声信号を収集し、ノイズを低減し、さらに音源を識別し、指向性録音機能などを実装する。

この出願のこの実施形態では、電子デバイス１００がカラオケアプリケーションを実行するとき、マイクロフォン１７０Ｃは、ユーザのアカペラ、具体的には、ユーザが歌を歌うときの音楽のない純粋な人間の声を収集するために使用され得る。さらに、音声モジュール１７０は、対応する音声補正アルゴリズムを使用し得、収集されたユーザのアカペラを補正する。

例えば、比較的明白なまたは無秩序な息継ぎ音が、ユーザによって録音された歌Ａのユーザのアカペラに現れる場合、音声モジュール１７０は、ユーザのアカペラ内の対応する位置で息継ぎ音に対して弱化処理を実行し得、歌のリスニング品質を向上させる。

別の例では、ビブラートが歌Ａの元の歌手のアカペラに現れる場合、音声モジュール１７０は、ユーザによって録音された歌Ａのユーザのアカペラの対応する位置でもビブラートが使用されているかどうかを検出し得る。ユーザによって使用されるビブラート効果が良くない場合、音声モジュール１７０は、歌のリスニング品質を改善するために、ユーザのアカペラ内の対応する位置でビブラートを補正し得る。

別の例では、音声モジュール１７０は、歌Ａのユーザのアカペラを元の歌手のアカペラと比較することによって、ユーザのアカペラにおいて「調子外れ」が発生する位置を識別し得、さらに、音声モジュール１７０は、ユーザのアカペラで「調子外れ」が発生する位置で対応するトーン上昇またはトーン下降を実行し得、それによって、ユーザのアカペラのイントネーションの問題を補正する。電子デバイス１００によって、マイクロフォン１７０Ｃによって収集されたユーザのアカペラを補正するための特定の方法が、後続の実施形態で詳細に説明される。したがって、ここでは詳細を説明しない。

この出願のこの実施形態では、電子デバイスは、ユーザによって録音された歌のイントネーションを較正することに加えて、ユーザによって録音された歌の息継ぎまたはビブラートなどの歌唱スキルの問題をさらに解決し得ることが学習され得る。このように、プロの声楽訓練を受けていない一般のユーザも、比較的良好なリスニング品質で歌声を録音することができ、それにより、ユーザがカラオケアプリケーションを使用するときの録音効果および使用体験を改善する。

ヘッドセットインターフェース１７０Ｄは、有線ヘッドセットに接続するように構成される。ヘッドセットインターフェース１７０Ｄは、ＵＳＢインターフェース１３０であり得るか、あるいは３．５ｍｍのオープンモバイル端末プラットフォーム（open mobile terminal platform, OMTP）標準インターフェースまたは米国のセルラー通信工業会（cellular telecommunications industry association of the USA, CTIA）の標準インターフェースであり得る。

センサ１８０は、圧力センサ１８０Ａ、ジャイロセンサ１８０Ｂ、気圧センサ１８０Ｃ、磁気センサ１８０Ｄ、加速度センサ１８０Ｅ、距離センサ１８０Ｆ、光近接センサ１８０Ｇ、指紋センサ１８０Ｈ、温度センサ１８０Ｊ、タッチセンサ１８０Ｋ、環境光センサ１８０Ｌ、骨伝導センサ１８０Ｍなどを含み得る。

ボタン１９０は、電源ボタン、音量ボタンなどを含む。ボタン１９０は、機械的ボタンであり得るか、またはタッチボタンであり得る。電子デバイス１００は、ボタン入力を受信し得、電子デバイス１００のユーザ設定および機能制御に関連するボタン信号入力を生成し得る。

モータ１９１は、振動プロンプトを生成し得る。モータ１９１は、着信振動プロンプトに使用され得、タッチ振動フィードバックにも使用され得る。例えば、さまざまなアプリケーション（写真撮影や音声再生など）で実行されるタッチ操作は、さまざまな振動フィードバック効果に対応し得る。モータ１９１はまた、ディスプレイ１９４の異なる領域で実行されるタッチ操作のための異なる振動フィードバック効果に対応し得る。さまざまなアプリケーションシナリオ（例えば、時間リマインダー、情報受信、目覚まし時計、ゲーム）も、さまざまな振動フィードバック効果に対応し得る。タッチ振動フィードバック効果のカスタマイズがさらにサポートされ得る。

インジケータ１９２は、充電状態および電力変化を示すために使用され得るインジケータライトであり得るか、またはメッセージ、不在着信、通知などを示すために使用され得る。

ＳＩＭカードインターフェース１９５は、ＳＩＭカードに接続するように構成される。ＳＩＭカードは、ＳＩＭカードインターフェース１９５に挿入されるか、またはＳＩＭカードインターフェース１９５から引き抜かれて、電子デバイス１００と接触するか、または電子デバイス１００から分離され得る。電子デバイス１００は、１つまたはＮ個のＳＩＭカードインターフェースをサポートし得、Ｎは、１より大きい正の整数である。ＳＩＭカードインターフェース１９５は、ナノＳＩＭカード、マイクロＳＩＭカード、ＳＩＭカードなどをサポートし得る。複数のカードが同時に同じＳＩＭカードインターフェース１９５に挿入され得る。複数のカードは、同じタイプであっても、異なるタイプであってもよい。ＳＩＭカードインターフェース１９５はまた、異なるタイプのＳＩＭカードと互換性があり得る。ＳＩＭカードインターフェース１９５はまた、外部記憶カードと互換性があり得る。電子デバイス１００は、ＳＩＭカードを使用することによってネットワークと相互作用し、通話機能、データ通信機能などを実装する。いくつかの実施形態では、電子デバイス１００は、ｅＳＩＭ、すなわち、埋め込まれたＳＩＭカードを使用する。ｅＳＩＭカードは、電子デバイス１００に埋め込まれてもよく、電子デバイス１００から分離することはできない。

電子デバイス１００のソフトウェアシステムは、階層的アーキテクチャ、イベント駆動型アーキテクチャ、マイクロコアアーキテクチャ、マイクロサービスアーキテクチャ、またはクラウドアーキテクチャを使用し得る。この出願のこの実施形態では、階層アーキテクチャのアンドロイドシステムが、電子デバイス１００のソフトウェア構造を説明するための例として使用される。

図２は、本出願の実施形態による電子デバイス１００のソフトウェア構造のブロック図である。

階層アーキテクチャでは、ソフトウェアはいくつかの層に分割され、各層は明確な役割とタスクを有する。レイヤーは、ソフトウェアインターフェースを使用して相互に通信する。いくつかの実施形態では、アンドロイドシステムは４つの層、すなわち、上から下へ、アプリケーションプログラム層、アプリケーションプログラムフレームワーク層、アンドロイドランタイム（Android runtime）およびシステムライブラリ、ならびにカーネル層に分割される。

アプリケーションプログラム層は、一連のアプリケーションパッケージを含み得る。

図２に示されるように、アプリケーションパッケージは、通話、連絡先、カメラ、ギャラリー、カレンダー、地図、ナビゲーション、ブルートゥース、音楽、ビデオ、およびメッセージなどのＡＰＰ（アプリケーション、アプリケーション）を含み得る。

この出願のこの実施形態では、「Changba」APPまたは「WeSing」APPなどのカラオケアプリケーションは、アプリケーションプログラム層にさらにインストールされ得る。ユーザは、カラオケアプリケーションを使用して歌を録音し得、ユーザの歌声をカラオケアプリケーションによって提供される伴奏に統合する。

アプリケーションプログラムフレームワーク層は、アプリケーションプログラミングインターフェース（application programming interface, API）と、アプリケーションプログラム層でのアプリケーションプログラムのプログラミングフレームワークを提供する。アプリケーションプログラムフレームワーク層は、いくつかの事前定義された機能を含む。

図２に示されるように、アプリケーションプログラムフレームワーク層は、ウィンドウマネージャ、コンテンツプロバイダ、ビューシステム、リソースマネージャ、通知マネージャなどを含み得る。

ウィンドウマネージャは、ウィンドウプログラムを管理するように構成される。ウィンドウマネージャは、表示サイズを取得し得、ステータスバー、ロック画面、画面キャプチャなどがあるかどうかを判断し得る。コンテンツプロバイダは、データを保存および取得し、アプリケーションプログラムがデータにアクセスできるようにするように構成される。データは、ビデオ、画像、音声、発信および応答された通話、閲覧履歴およびブックマーク、名簿などを含み得る。ビューシステムは、テキストを表示するためのコントロールおよび画像を表示するためのコントロールなどの視覚的コントロールを含む。ビューシステムは、アプリケーションプログラムを構築するように構成され得る。表示インターフェースは、１つまたは複数のビューを含み得る。例えば、ショートメッセージングサービスメッセージ通知アイコンを含む表示インターフェースは、テキストを表示するためのビューおよび画像を表示するためのビューを含み得る。リソースマネージャは、アプリケーションプログラムのローカライズされた文字列、アイコン、画像、レイアウトファイル、ビデオファイルなどのさまざまなリソースを提供する。通知マネージャは、アプリケーションプログラムがステータスバーに通知情報を表示できるようにし、タイプ通知メッセージを伝達するように構成され得る。タイプ通知メッセージは、少し間を置いて自動的に消えてもよく、ユーザの操作は必要ない。例えば、通知マネージャは、ダウンロードの完了、メッセージプロンプトなどを通知するように構成される。あるいは、通知マネージャは、グラフまたはスクロールバーテキストの形式でシステムの上部ステータスバーに現れる通知、例えば、バックグラウンドで実行されているアプリケーションプログラムの通知であり得、またはダイアログウィンドウの形式で画面上に現れる通知であり得る。例えば、テキスト情報がステータスバーに表示されたり、プロンプト音が鳴ったり、電子デバイスが振動したり、インジケータライトが点滅したりする。

システムライブラリは、表面マネージャ（surface manager）、メディアライブラリ（Media Libraries）、３次元グラフィックス処理ライブラリ（例えば、OpenGL ES）、および２Ｄグラフィックスエンジン（例えば、SGL）などの複数の機能モジュールを含み得る。

表面マネージャは、ディスプレイサブシステムを管理し、複数のアプリケーションプログラムに２Ｄおよび３Ｄレイヤーの融合を提供するように構成される。メディアライブラリは、一般的に使用される複数の音声およびビデオフォーマット、静止画像ファイルなどの再生および記録をサポートする。メディアライブラリは、MPEG4、H.264、MP3、AAC、AMR、JPG、PNGなどの複数の音声およびビデオ符号化フォーマットをサポートし得る。三次元グラフィックス処理ライブラリは、三次元グラフィックス描画、画像レンダリング、合成、レイヤー処理などを実装するように構成される。２Ｄグラフィックスエンジンは、２Ｄ描画用の描画エンジンである。

この出願のこの実施形態では、依然として図２に示されるように、本出願のこの実施形態で提供される関連する音声補正アルゴリズムは、動的アルゴリズムライブラリ（dynamic link library, DLL）の形態でシステムライブラリに設定され得る。例えば、音声補正アルゴリズムの動的アルゴリズムライブラリは、system/libディレクトリに記憶され得る。カラオケアプリケーションがアプリケーションプログラム層で実行されると、カラオケアプリケーションは、音声補正アルゴリズムの動的アルゴリズムライブラリを呼び出して、ユーザのアカペラのイントネーション、ビブラート、息継ぎ音などの問題を補正し得、それによって音声補正機能を実装する。

アンドロイドランタイムは、カーネルライブラリと仮想マシンを含む。アンドロイドランタイムは、アンドロイドシステムのスケジューリングと管理を担当する。

カーネルライブラリは、Java言語によって呼び出す必要のある関数とアンドロイドのカーネルライブラリとの２つの部分を含む。

アプリケーションプログラム層とアプリケーションプログラムフレームワーク層は、仮想マシンで実行される。仮想マシンは、アプリケーションプログラム層とアプリケーションプログラムフレームワーク層でJavaファイルをバイナリファイルとして実行する。仮想マシンは、オブジェクトのライフサイクル管理、スタック管理、スレッド管理、セキュリティと例外の管理、ガベージコレクションなどの機能を実行するように構成される。

カーネル層は、ハードウェアとソフトウェアとの間の層である。カーネル層は、少なくともディスプレイドライブ、カメラドライブ、音声ドライブ、センサドライブなどを含む。これは、この出願のこの実施形態では限定されない。

以下の電子デバイスの一例として、添付の図面を参照して本出願の実施形態で提供される歌の録音方法および音声補正方法を詳細に説明するために、携帯電話が使用される。図３に示されるように、方法は、以下のステップＳ３０１からＳ３０６を含む。

Ｓ３０１。カラオケアプリケーションを実行すると、携帯電話は、ユーザによって、歌Ａを録音することを選択する操作を受け取る。

カラオケアプリケーションは、歌のリクエスト、歌の録音、音声補正などの機能をユーザに提供できるアプリケーションソフトウェアである。例えば、カラオケアプリケーションは「WeSing」APPまたは「Changba」APPであり得る。これは、この出願のこの実施形態では限定されない。

携帯電話がユーザによるカラオケアプリケーションを開く操作を検出した場合、図４に示すように、携帯電話はカラオケアプリケーションの実行を開始し得、カラオケアプリケーションの第１のインターフェース４０１を表示し得る。ユーザは、ユーザが好きな歌について第１のインターフェース４０１を検索し、その歌を録音し得る。あるいは、ユーザは、検索バー４０２で手動で検索を実行し、記録する必要のある歌を選択し得る。確かに、ユーザは、代わりに、カラオケアプリケーションの別の画面から、今回録音する必要がある歌を選択し得る。これは、この出願のこの実施形態では限定されない。

依然として図４に示されるように、ユーザが歌「Red Bean」を録音したい場合、ユーザは、第１のインターフェース４０１上で歌「Red Bean」の録音ボタン４０３をタップし得る。この場合、携帯電話は、ユーザが歌「Red Bean」を録音することを選択する操作を受け取り得る。ユーザが歌「Red Bean」を録音することを選択する操作に応じて、携帯電話は、引き続き以下のステップＳ３０２～Ｓ３０６を実行して、歌の録音および音声補正などのプロセスを完了し得る。

Ｓ３０２。携帯電話は、歌Ａの伴奏と元の歌手のアカペラの特徴情報とを取得する。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。ユーザが歌「Red Bean」の録音ボタン４０３をタップしたことを検出した後、携帯電話は、歌「Red Bean」の伴奏をサーバからダウンロードし得る。確かに、携帯電話が今回、歌「Red Bean」の伴奏を記憶すれば、携帯電話はローカルメモリから伴奏を取得し得る。一般に、人間の声以外の歌の一部は伴奏と呼ばれることがあり、一部の伴奏はさらにハーモニー、背景音などを含むことがある。

この出願のこの実施形態では、ユーザが歌「Red Bean」の録音ボタン４０３をタップしたことを検出した後、携帯電話はさらに、歌「Red Bean」の元の歌手のアカペラの特徴情報をサーバからダウンロードし得る。特徴情報は、歌「Red Bean」を歌うときの元の歌手（例えば、Faye Wong）の歌唱の特徴を反映し得る。例えば、特徴情報は、元の歌手のアカペラの１つまたは複数の基本周波数情報、息継ぎ位置、およびビブラート特徴を含み得る。ビブラート特徴は、ビブラート位置、ビブラートの基本周波数安定性情報、ビブラート周波数、およびビブラート振幅のうちの１つまたは複数を含み得る。

基本周波数情報は、音の基本的なトーンを反映し得る。図５に示すように、サーバは、歌「Red Bean」の元の歌手のアカペラから基本周波数－時間変動曲線ｆ（ｔ）をフレームごとに事前に抽出し得、変動曲線ｆ（ｔ）は歌「Red Bean」の基本周波数情報である。依然として図５に示されるように、サーバは、元の歌手のアカペラで元の歌手が息継ぎする位置をさらに検出し得、元の歌手が息継ぎする瞬間を特徴情報の一部として使用し得る。同様に、依然として図５に示されるように、サーバは、元の歌手のアカペラにビブラートが現れる位置をさらに検出し得、ビブラートが現れる瞬間を特徴情報の一部として使用し得る。

一般的に、ビブラートは周期的なピッチ変動として現れる。ビブラート特徴を有する基本周波数曲線から、振動振幅Ａ（ｔ）、振動周波数Φ（ｔ）、安定傾向項目Ｖ（ｔ）の３つの時変特徴を抽出することができる。例えば、ビブラート１は、歌「RedBean」の元の歌手のアカペラの３番目の文に現れる。ビブラート１に対応する基本周波数曲線は、ｆ３（ｔ）＝Ｖ（ｔ）＋Ａ（ｔ）ｃｏｓ（Φ（ｔ））であり、ｔは［８ｓ、１０ｓ］の範囲内にある。Ｖ（ｔ）はビブラート１の基本周波数安定性情報であり、Φ（ｔ）はビブラート１のビブラート周波数であり、Ａ（ｔ）はビブラート１のビブラート振幅である。サーバは、歌「Red Bean」の各ビブラートの基本周波数安定性情報、ビブラート周波数、およびビブラート振幅を特徴情報として携帯電話に送信し得る。

例えば、新しい歌がサーバ内の歌ライブラリに追加されるたびに、サーバは、新しい歌の元の歌手のアカペラに基づいて対応する特徴情報を抽出し得、抽出された特徴情報をサーバに記憶し得る。続いて、ユーザが携帯電話で歌を録音することを選択した場合、携帯電話は、サーバから歌の伴奏を取得し得、さらに、サーバから、歌に対応する元の歌手のアカペラの特徴情報を取得し得る。元の歌手のアカペラの得られた特徴情報は、ユーザが歌を録音するように案内するために使用され得、また、ユーザが録音した歌を補正するための音声補正基準としても使用され得る。

Ｓ３０３。カラオケアプリケーションの録音インターフェースを表示するとき、携帯電話は歌Ａの伴奏を再生し、ユーザが歌うユーザのアカペラを録音する。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。携帯電話が歌「Red Bean」の伴奏を取得した後、携帯電話は歌「Red Bean」の伴奏を再生し始め得る。さらに、携帯電話は、ユーザが歌「Red Bean」を歌った後に得られるユーザのアカペラをマイクロフォンが録音し始めることを可能にし得る。

図６に示すように、歌「Red Bean」を録音するプロセスで、携帯電話は、歌「Red Bean」の録音インターフェース６０１を表示し得る。録音インターフェース６０１は、歌「Red Bean」の歌詞６０２を表示し得、録音されている歌詞の位置は、歌詞６０２にリアルタイムでマークされ得、その結果、ユーザは、歌詞６０２のプロンプトに基づいて歌を録音することができる。

Ｓ３０４。歌Ａを録音しているとき、携帯電話は、元の歌手のアカペラの特徴情報に基づいて、イントネーション、息継ぎ、ビブラートなどの歌唱方法を調整するようにユーザに指示する。

例えば、ユーザがカラオケアプリケーションを用いて歌を録音する場合、歌詞６０２を表示する際に、携帯電話は、ステップＳ３０２で取得された特徴情報に基づいて、ユーザに歌を歌うように案内し、例えば、イントネーション、息継ぎ、またはビブラートなどのユーザの歌唱方法を案内し得る。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。ユーザのアカペラであり、携帯電話によって取得される特徴情報は、息継ぎ位置およびビブラート位置などの情報を含む。この場合、図７に示すように、歌「Red Bean」の歌詞６０２をリアルタイムで表示するとき、携帯電話は、元の歌手のアカペラの特徴情報に記録された息継ぎ位置に基づいて、歌詞６０２の対応する位置に息継ぎ位置７０１（すなわち、息継ぎプロンプト）をマークし得る。このように、歌「Red Bean」を録音するとき、ユーザは、歌詞６０２でプロンプトされた息継ぎ位置７０１に基づいて息継ぎし得、ユーザが歌う間の息継ぎの変化を制御するのを助け、それによって、録音された歌の比較的明白で無秩序な息継ぎ音を低減し、録音された歌のリスニング品質を改善する。

別の例では、依然として図７に示されるように、歌「Red Bean」の歌詞６０２をリアルタイムで表示する場合、携帯電話は、元の歌手のアカペラの特徴情報に記録されたビブラート位置に基づいて、歌詞６０２の対応する位置にビブラート位置７０２（すなわち、ビブラートプロンプト）をさらにマークし得る。このように、歌「Red Bean」を録音するとき、ユーザは、歌詞６０２でプロンプトされたビブラート位置７０２に基づいてビブラートで歌い得、ユーザが歌っているときの歌の階層感および歌唱スキルを改善し、それによって、録音された歌のリスニング品質を改善する。

いくつかの他の実施形態では、リアルタイムで表示される歌詞において、ユーザが歌うように案内することに加えて、携帯電話は、録音インターフェース上に歌唱ツールをさらに設定し得る。携帯電話は、歌唱ツールにおいて、イントネーション、息継ぎ、またはビブラートなどの歌唱方法を調整するようにユーザを案内し得る。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。図８に示されるように、録音インターフェース６０１を表示するとき、携帯電話は、録音インターフェース６０１上に歌唱ツール８０１を設定し得る。歌唱ツール８０１は、現在録音されている歌詞の文中の各単語の音符を表示し得る。例えば、携帯電話は、元の歌手のアカペラの基本周波数情報に基づいて、歌唱ツール８０１にトーンライン８０２（すなわち、イントネーションプロンプト）をリアルタイムで表示し得る。現在の音符のより高いトーンは、トーンライン８０２のより高い位置につながる。別の例では、携帯電話は、元の歌手のアカペラ内のビブラート位置に基づいて、歌唱ツール８０１にビブラート音符８０３（すなわち、ビブラートプロンプト）を表示し得る。ビブラート音符８０３は、特定の色のブレークラインまたはラインセグメントによって表され得る。ビブラート音符８０３が現れる位置は、元の歌手のアカペラにビブラートが現れる位置と同じである。別の例では、現在の歌詞の文に対応する元の歌手のアカペラに息継ぎ音が現れる場合、携帯電話は、元の歌手のアカペラの息継ぎ位置に基づいて、歌唱ツール８０１に息継ぎ音符８０４（すなわち、息継ぎプロンプト）を表示し得る。息継ぎ音符８０４は、三角形または円などの指定された形状のグラフによって表され得る。息継ぎ音符８０４が現れる位置は、元の歌手のアカペラに息継ぎ音が現れる位置と同じである。

このように、歌を録音するとき、ユーザは、リアルタイムで歌唱ツール８０１に表示されるトーンラインに基づいて人間の声のイントネーションを調整するか、またはリアルタイムで歌唱ツールに表示されるビブラート音符に基づいて対応する位置でビブラートを用いて歌うか、またはリアルタイムで歌唱ツール８０１に表示される息継ぎ音符に基づいて対応する位置で息継ぎし得、録音プロセスにおけるユーザの歌唱中のイントネーション、ビブラート、および息継ぎなどの歌唱スキルを案内し、それにより、歌の録音品質を改善する。

ユーザが歌を録音するとき、録音インターフェースに表示される歌詞および歌唱ツールにおいて、ユーザが歌うように案内することに加えて、ユーザが歌を録音しているとき、当業者は、元の歌手のアカペラの特徴情報を使用することによって、実際の経験または実際の適用シナリオに基づいて、ユーザが歌をよりよく歌うようにさらに案内し得ることを理解し得る。これは、この出願のこの実施形態では限定されない。

Ｓ３０５。歌Ａが録音されているとき、携帯電話は、元の歌手のアカペラの特徴情報をユーザのアカペラの特徴情報と比較することによって、ユーザの歌唱を評価する。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。歌「Red Bean」が録音されているとき、携帯電話は、元の歌手のアカペラの特徴情報に基づいて、ユーザの現在の歌唱をリアルタイムでさらに評価し得る。例えば、携帯電話は、歌詞中の単語、句、または文を粒度として使用することによって、ユーザの歌唱を評価し得る。図９Ａおよび図９Ｂに示されるように、携帯電話は、ユーザが「I believe an end comes at a time」と歌った後に得られるユーザのアカペラを収集した後、この文のユーザのアカペラの特徴情報を抽出し得る。元の歌手のカペラの特徴情報と同様に、携帯電話は、最初に、この文のユーザのカペラの基本周波数情報を抽出し、ユーザのアカペラの基本周波数情報に基づいて、ユーザの息継ぎ位置、ビブラート位置、ビブラートの基本周波数安定性情報、ビブラート周波数、およびビブラート振幅などの１つまたは複数の特徴情報を検出し得る。

この場合、「I believe an end comes at a time」と歌うときの元の歌手の特徴情報１と、「I believe an end comes at a time」と歌うときのユーザの特徴情報２とを比較することにより、この文を歌うときのユーザのイントネーション、ビブラート、および息継ぎなどの歌唱スキルの評価結果を決定し得る。

例えば、ユーザのアカペラの基本周波数情報と元の歌手のアカペラの基本周波数情報との差がしきい値未満である場合、この文を歌うときのユーザのイントネーションが元の歌手のそれに一致することを示す。図１０（ａ）に示されるように、携帯電話は、録音インターフェース６０１上に「イントネーションエキスパート」というプロンプト１００１を表示し得、この文を歌うときにユーザがイントネーションにおいて正しいことをユーザに通知する。ユーザのアカペラのビブラート位置が元の歌手のアカペラのビブラート位置と同じであり、ユーザのアカペラのビブラートのビブラート特徴（具体的には、ビブラート周波数、ビブラート振幅、および基本周波数安定性情報）と元の歌手のアカペラの対応するビブラート特徴との差がしきい値未満である場合、この文を歌うときにユーザが行ったビブラートが元の歌手のそれと一致することを示す。図１０（ｂ）に示されるように、携帯電話は、録音インターフェース６０１上に「ビブラートクイーン」のプロンプト１００２を表示し得る。ユーザのアカペラの息継ぎ音の位置が元の歌手のアカペラの息継ぎ音の位置と同じである場合、この文を歌うときのユーザの息継ぎ調整が元の歌手のそれと一致することを示す。図１０（ｃ）に示されるように、携帯電話は、録音インターフェース６０１上に「息継ぎ取得」というプロンプト１００３を表示し得る。

テキストを用いてリアルタイムで現在の評価結果をユーザに通知することに加えて、携帯電話は、色、振動、特殊効果などを用いてリアルタイムでユーザに現在の評価結果を表示し得る。

例えば、図１１（ａ）に示されるように、「I believe an end comes at a time」という歌詞を歌うときにユーザが使用するビブラートが、元の歌手がこの文を歌うときに使用するビブラートと矛盾する場合、ビブラートに対応する歌詞「end」１１０１を表示するときに、携帯電話は、「end」１１０１を他の歌詞とは異なる色としてマークしたり、異なるフォントを使用したりし得る。別の例では、図１１（ｂ）に示されるように、この文を歌うときのユーザの息継ぎ位置が、この文を歌うときの元の歌手の息継ぎ位置と矛盾する場合、携帯電話は、息継ぎ位置に対応する歌詞を表示するときに息継ぎエラーサイン１１０２をマークし得る。

あるいは、携帯電話は、ユーザに対して、および録音インターフェース６０１上の歌唱ツール８０１において、携帯電話によって決定された評価結果をさらに表示し得る。例えば、図１２（ａ）に示されるように、ユーザが「comes」という単語を歌うとき、携帯電話は、元の歌手が「comes」と歌ったときに得られるトーンライン１２０１を、歌唱ツール８０１においてリアルタイムで表示し得るだけでなく、同時に、今回、ユーザが「comes」という単語を歌ったときに得られるトーンライン１２０２を表示してもよい。ユーザが「comes」という単語を歌うときに使用される基本周波数が、元の歌手が「comes」という単語を歌うときに使用される基本周波数よりも低い場合、「comes」と歌うときのユーザのトーンが「comes」と歌うときの元の歌手トーンよりも低く、かつ携帯電話によって表示されるトーンライン１２０２は、トーンライン１２０１よりも低いことを示す。同様に、「comes」という単語を歌うときのユーザのトーンが、「comes」という単語を歌うときの元の歌手のトーンよりも高いことが検出された場合、携帯電話によって表示されるトーンライン１２０２は、トーンライン１２０１より高くあり得る。さらに、「comes」という単語を歌うときのユーザのトーンが「comes」という単語を歌うときの元の歌手のトーンと同じであることが検出された場合、歌唱ツール８０１のトーンライン１２０２は、トーンライン１２０１と一致する。このように、ユーザは、リアルタイムの歌唱中に歌唱ツール８０１から現在の歌唱のイントネーション状況を学習し得る。

別の例として、図１２（ｂ）に示されるように、携帯電話は、歌唱ツール８０１において、元の歌手がビブラート１を歌うときに得られるビブラート音符１２０３を表示し得る。ユーザがビブラート１を歌うときにユーザのアカペラを検出した後、携帯電話は、比較を通じて、ユーザがビブラート１を歌ったときに得られるビブラート位置、ビブラート振幅Ａ（ｔ）、ビブラート周波数Φ（ｔ）、および安定傾向項目Ｖ（ｔ）が、元の歌手がビブラート１を歌ったときに得られるビブラート位置、ビブラート振幅Ａ（ｔ）、ビブラート周波数Φ（ｔ）、および安定傾向項目Ｖ（ｔ）と一致するかどうかを決定し得る。ユーザがビブラート１を歌ったときに得られるビブラート位置、ビブラート振幅A（t）、ビブラート周波数Φ（t）、および安定傾向項目V（t）が、元の歌手がビブラート1を歌ったときに得られるビブラート位置、ビブラート振幅A（ t）、ビブラート周波数Φ（t）、および安定傾向項目V（t）と一致しない場合、ユーザが今回ビブラート1を歌ったときに、事前設定されたビブラート効果が達成されていないことを示し、かつ、携帯電話が、点線などの表示効果としてビブラート音符１２０３を表示し得る。同様に、ユーザがビブラート１を歌ったときに得られるビブラート位置、ビブラート振幅Ａ（ｔ）、ビブラート周波数Φ（ｔ）、および安定傾向項目Ｖ（ｔ）が、元の歌手がビブラート1を歌ったときに得られるビブラート位置、ビブラート振幅Ａ（ t）、ビブラート周波数Φ（t）、および安定傾向項目V（t）と一致する場合、ユーザが今回ビブラート1を歌ったときに、事前設定されたビブラート効果が達成されたことを示し、図１２（ｂ）に示されるように、携帯電話は、ビブラート音符１２０３を太字または強調表示し得、その結果、ユーザは、リアルタイムの歌唱プロセスにおいて、歌唱ツール８０１から現在のビブラート歌唱効果を学習することができる。

当業者は、実際の経験または実際の適用シナリオに基づいて、かつ、元の歌手のアカペラの特徴情報に基づいて、歌を録音するときにリアルタイムでユーザが歌うユーザのアカペラをさらに評価し得、息継ぎスキル、ビブラートスキル、またはイントネーションの評価結果をユーザに表示し得、例えば、携帯電話は、元の歌手のアカペラの特徴情報に基づいてユーザのアカペラを採点し得、かつ、採点結果をユーザに表示し得ることが理解され得る。これは、この出願のこの実施形態では限定されない。

この出願のこの実施形態では、ユーザの歌の録音プロセスにおいて、イントネーション、ビブラート、または息継ぎなどのユーザの１つまたは複数の歌唱スキルが、元の歌手のアカペラの特徴情報に基づいてリアルタイムで評価され得ることが学習することができる。イントネーションのみに基づいてユーザの歌唱レベルを評価することと比較して、本出願の本実施形態では、ユーザの歌唱の評価時に、ユーザの息継ぎやビブラートなどの要素も考慮され、したがって、得られた評価結果はより正確であり、より豊富であり、より客観的である。さらに、携帯電話は、録音プロセスにおいてリアルタイムでユーザの歌唱の評価結果をユーザにフィードバックし得、その結果、ユーザは、ユーザの現在の歌唱効果を時間内に学習し、後続の録音プロセスにおいて時間内に歌唱方法を調整することができる。

Ｓ３０６。歌Ａの録音が終了した後、携帯電話は、元の歌手のアカペラの特徴情報およびユーザのアカペラの特徴情報に基づいて、ユーザのアカペラを補正する。

携帯電話が歌Ａの伴奏の再生を終了するか、または、ユーザが入力した録音を終了する操作を検出すると、携帯電話はマイクロフォンを無効にし得、ユーザが行ったアカペラの収集を停止する。また、歌Ａの録音が終了した後、図１３に示されるように、携帯電話は、カラオケアプリケーションの音声補正インターフェース１３０１を表示し得る。音声補正インターフェース１３０１は、音声補正スイッチ１３０２を含み得る。ユーザが音声補正スイッチ１３０２をオンにしたことが検出された場合、携帯電話は、歌Ａの元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラに現れ、ユーザが今回歌Ａを録音するときに収集される歌唱の問題（例えば、イントネーション、ビブラート、息継ぎ音などの１つまたは複数の歌唱の問題）を補正し得る。

ユーザが歌「Red Bean」を録音することは、依然として例として使用される。ユーザが録音インターフェース上で「Red Bean」の歌を録音した後、携帯電話は、図１３に示される音声補正インターフェース１３０１を表示し得る。ユーザが音声補正インターフェース１３０１上の音声補正スイッチ１３０２をオンにしたことが検出された場合、携帯電話は、元の歌手のアカペラの特徴情報に基づいて、今回収集されたユーザのアカペラのイントネーション、息継ぎ音、およびビブラートを補正し得る。

例えば、携帯電話は、元の歌手のアカペラの基本周波数情報を、今回ユーザが録音した歌「Red Bean」の基本周波数情報と比較し得、今回のユーザのアカペラに現れるイントネーションの問題を補正する。例えば、ユーザのアカペラの１０秒目から２０秒目のトーンが、元の歌手のアカペラの１０秒目から２０秒目のトーンよりも低い場合、携帯電話は、ユーザのアカペラのこの部分のトーン上昇処理を実行し得、これにより、ユーザのアカペラのこの部分のトーンは、元の歌手のアカペラのトーンと同じか、またはそれに近くなる。例えば、ユーザのアカペラの１分１２秒目から１分２７秒目のトーンが、元の歌手のアカペラの１分１２秒目から１分２７秒目のトーンよりも高い場合、携帯電話は、ユーザのアカペラのこの部分の音色に対してトーン低下処理を実行し得、これにより、ユーザのアカペラのこの部分のトーンは、元の歌手のアカペラのトーンと同じか、またはそれに近くなる。

別の例として、携帯電話は、ユーザが今回録音した歌「Red Bean」のユーザのアカペラから息継ぎ音の位置を抽出し得る。例えば、携帯電話は、事前設定された息継ぎ検出モデルを使用することによって、息継ぎ音がユーザのアカペラの１４秒目および７８秒目の両方に現れることを検出し得る。さらに、携帯電話は、１４秒目および７８秒目でのユーザのアカペラのエネルギーおよび周波数応答を低減し得、それにより、１４秒目および７８秒目で現れる息継ぎ音を弱め、録音された歌のリスニング品質を改善する。

別の例として、携帯電話は、元の歌手のアカペラのビブラート特徴を、今回ユーザが録音した歌「Red Bean」のビブラート特徴と比較し得、今回のユーザのアカペラのビブラート効果が低いビブラートを補正する。例えば、携帯電話は、事前設定されたビブラート検出モデルを使用することによって、ビブラートがユーザのアカペラに現れる位置を検出し得る。例えば、ビブラート１は、ユーザのアカペラにおいて１５秒目に検出され、ビブラート1の振動振幅A1（t）、振動周波数Φ1（t）、および安定傾向項目V1（t）が、元の歌手のアカペラの１５秒目でのビブラート2の振動振幅A2（t）、振動周波数Φ2（t）、および安定傾向項目V2（t）と一致する場合、ユーザが歌うビブラート1の効果が基本的に元の歌手のそれと同じであることを示し、携帯電話はビブラート1を補正する必要はない。同様に、ビブラート１の振動振幅Ａ１（ｔ）、振動周波数Φ１（ｔ）、および安定傾向項目Ｖ１（ｔ）が、元の歌手のアカペラの15秒目でのビブラート2の振動振幅Ａ２（ｔ）、振動周波数Φ２（ｔ）、および安定傾向項目V2（t）と一致しない場合、携帯電話は、ビブラート２の振動振幅 A2（t）、振動周波数Φ2（t）、および安定傾向項目V2（t）を使用して、15秒目でのユーザのアカペラの新しいビブラートを合成し得、ユーザのアカペラに現れるビブラート音声効果を改善する。

いくつかの実施形態では、図１４に示されるように、ユーザが音声補正インターフェース１３０１上の音声補正スイッチ１３０２をオンにしたことを検出した後、携帯電話は、イントネーションを補正するための音声補正オプション１４０１、息継ぎ音を補正するための音声補正オプション１４０２、およびビブラートを補正するための音声補正オプション１４０３をさらに表示し得る。このように、ユーザは、音声補正インターフェース１３０１上で、今回記録されたユーザのアカペラのイントネーションの問題、息継ぎ音の問題、またはビブラートの問題を補正することを手動で選択し得る。

他のいくつかの実施形態では、今回ユーザによって録音された歌「Red Bean」のユーザのアカペラを収集した後、携帯電話は、ユーザのアカペラのイントネーション、息継ぎ音、およびビブラートなどの問題をさらに自動的に補正し得、録音した歌を後で再生するときの歌のリスニング品質を改善する。例えば、依然として図１４に示されるように、再生ボタン１４０４は、音声補正インターフェース１３０１上に配置される。ユーザが再生ボタン１４０４をタップしたことが検出された場合、携帯電話は、元の歌手のアカペラの特徴情報に基づいて、ユーザのアカペラのイントネーション、息継ぎ音、およびビブラートなどの問題を自動的に補正し得、補正されたユーザのアカペラを歌「Red Bean」の伴奏に再生するために統合する。

いくつかの実施形態では、図１５（ａ）に示されるように、単一文改良オプション１５０１が、カラオケアプリケーションの音声補正インターフェース１３０１上でさらに設定され得る。ユーザがオプション１５０１をタップしたことが検出された場合、図１５（ｂ）に示されるように、携帯電話は、改良インターフェース１５０２を表示し得る。改良インターフェース１５０２上で、携帯電話は、歌「Red Bean」においてユーザによって歌われた歌詞の各文を表示し得、ユーザが選択するためのオプションとして歌詞の各文を使用し得る。例えば、ユーザは歌詞1503「I believe an end comes at a time」を選択する。ユーザが歌詞１５０３を選択した後、携帯電話は、歌詞１５０３に対応する歌の録音された部分を再生し得る。イントネーションボタン１５０４、ビブラートボタン１５０５、および息継ぎボタン１５０６は、音声補正インターフェース１３０１上にさらに設定される。ユーザは、改良インターフェース１５０２上で、ユーザのアカペラに現れ、かつ歌詞１５０３に対応するイントネーション、ビブラート、または息継ぎ音などの１つまたは複数の歌唱問題を補正するかどうかを手動で選択し得る。ユーザが歌詞１５０３を選択した後、ビブラートボタン１５２５およびイントネーションボタン１５０４をタップすると、携帯電話は、歌詞１５０３に対応するユーザのアカペラのイントネーション問題およびビブラート問題を補正し得、補正されたユーザのアカペラを再生するために対応する伴奏へ統合し得る。このように、ユーザは、今回録音されたユーザのアカペラに現れる歌唱問題を一文ずつ補正し得、ユーザは、補正の前後に達成された録音効果を一文ずつ比較し得、ユーザがより満足する歌唱効果のためにユーザが録音した歌を補正する。

いくつかの実施形態では、図１６（ａ）に示されるように、単一文編集オプション１６０１が、カラオケアプリケーションの音声補正インターフェース１３０１上でさらに設定され得る。ユーザがオプション１６０１をタップしたことが検出された場合、図１６（ｂ）に示されるように、携帯電話は、編集インターフェース１６０２を表示し得る。編集インターフェース１６０２上で、携帯電話は、歌「Red Bean」においてユーザによって歌われた歌詞の各文を表示し得る。さらに、携帯電話は、歌詞の各文を表示するときに、歌詞の対応する位置で、ユーザが歌詞の文を歌うときに現れる歌唱の問題、例えば、不正確なトーン、比較的高い息継ぎ音、不安定なビブラート、またはビブラートの欠如をさらにプロンプトし得る。このように、ユーザは、ユーザが歌詞の各文を歌うときに現れる特定の問題を直感的に見ることができる。

さらに、依然として図１６（ｂ）に示されるように、歌詞の各文に対応する編集ボタン１６０３を、編集インターフェース１６０２上にさらに設定し得る。ユーザが歌詞の特定の文に対応する編集ボタン１６０３をタップしたことが検出された場合、携帯電話は、歌詞に対応する伴奏を再生し得、マイクロフォンがユーザが歌詞を再び歌った後に得られるユーザのアカペラを収集できるようにする。携帯電話が、ユーザが歌詞を再び歌った後に得られるユーザのアカペラを収集した後、録音された歌「Red Bean」に対応するユーザのアカペラは、今回再び録音したユーザのアカペラに置き換えられ得る。携帯電話は、歌詞が編集インターフェース１６０２上に表示されると、ユーザが歌詞を歌うときに現れる特定の歌の問題をユーザに通知した。したがって、ユーザが歌詞を再び歌うとき、ユーザは、歌詞が最後に記録されたときに現れる歌唱の問題を補正するために、時間内に歌唱方法を調整し得る。このように、歌唱品質と録音品質が改善される。

図１７に示されるように、本出願の実施形態は、電子デバイスを開示し、当該電子デバイスは、タッチスクリーン１７０１であって、タッチセンシティブ表面１７０６およびディスプレイ１７０７を含むタッチスクリーン１７０１、１つまたは複数のプロセッサ１７０２、メモリ１７０３、１つまたは複数のマイクロフォン１７０８、および１つまたは複数のコンピュータプログラム１７０４を含む。前述の構成要素は、１つまたは複数の通信バス１７０５を使用することによって接続され得る。１つまたは複数のコンピュータプログラム１７０４は、メモリ１７０３に記憶され、１つまたは複数のプロセッサ１７０２によって実行されるように構成される。１つまたは複数のコンピュータプログラム１７０４は命令を含み、命令は、前述の実施形態のステップを実行するために使用され得る。

例えば、プロセッサ１７０２は、具体的には、図１に示されるプロセッサ１１０であり得、メモリ１７０３は、具体的には、図１に示される内部メモリ１２１および／または外部メモリ１２０であり得、ディスプレイ１７０７は、具体的には、図１に示されるディスプレイ１９４であり得、マイクロフォン１７０８は、具体的には、図１に示されるマイクロフォン１７０Ｃであり得、タッチセンシティブ表面１７０６は、具体的には、図１に示されるセンサモジュール１８０内のタッチセンサ１８０Ｋであり得る。これは、この出願のこの実施形態では限定されない。

いくつかの実施形態では、このアプリケーションは、グラフィカルユーザインターフェース（ＧＵＩ）をさらに提供し、グラフィカルユーザインターフェースは、電子デバイスに格納され得る。例えば、電子デバイスは、図１または図１７に示される電子デバイスであり得る。

例えば、グラフィカルユーザインターフェースは、タッチスクリーンに表示される第１のＧＵＩを含む。図４に示されるように、第１のＧＵＩは、カラオケアプリケーションのインターフェース４０１であり得、第１のＧＵＩは、第１の歌を録音するために使用される録音ボタン４０３を含む。録音ボタンのタッチイベントに応答して、電子デバイスは、タッチスクリーン上に第２のＧＵＩを表示し得る。図７または図８に示されるように、第２のＧＵＩは、ユーザによって第１の歌を録音するための録音インターフェース６０１であり得る。第２のＧＵＩは、ユーザが第１の歌を歌うように案内するための案内情報を含み得、案内情報は、息継ぎプロンプトおよび／またはビブラートプロンプトを含む。例えば、図７に示されるように、録音インターフェース６０１上に表示される歌詞６０２は、息継ぎプロンプト７０１およびビブラートプロンプト７０２を含む。別の例として、図８に示されるように、録音インターフェース６０１上に表示される歌唱ツール８０１は、イントネーションプロンプト８０２、息継ぎプロンプト８０４、およびビブラートプロンプト８０３を有する。第２のＧＵＩ上の案内情報は、元の歌手のアカペラの特徴情報に基づいて電子デバイスによって生成される。

いくつかの実施形態では、第２のＧＵＩは、歌唱中のユーザの息継ぎスキルおよび／またはビブラートスキルの評価結果をさらに含み得る。例えば、図１０（ａ）から図１０（ｃ）に示されるように、録音インターフェース６０１は、ユーザの息継ぎスキルの評価結果１００１、ユーザのビブラートスキルの評価結果１００２、およびユーザのイントネーションの評価結果１００３を含む。別の例として、図１２（ａ）から図１２（ｂ）に示されるように、ユーザのイントネーションの評価結果１２０２、ユーザのビブラートスキルの評価結果１２０３などは、録音インターフェース６０１上の歌唱ツールに表示され得る。これは、この出願のこの実施形態では限定されない。

いくつかの実施形態では、第１の歌の録音が終了した後、電子デバイスは、タッチスクリーン上に第３のＧＵＩを表示し得る。図１３または図１４に示されるように、第３のＧＵＩは、第１の歌の音声補正インターフェース１３０１であり得、第３のＧＵＩは、音声補正スイッチ１３０２を含む。ユーザが音声補正スイッチ１３０２をオンにすると、電子デバイスは、ユーザのアカペラに現れる息継ぎの問題および／またはビブラートの問題などの歌唱問題を補正し得る。

実装に関する前述の説明により、当業者が、便利で簡単な説明を容易にするために、前述の機能モジュールの分割が説明の例として使用されることを明確に理解することができる。実際のアプリケーションでは、前述の機能は、必要に応じて実装するために異なるモジュールに割り当てられ得、すなわち、装置の内部構造は、上記の機能のすべてまたは一部を実装するために異なる機能モジュールに分割される。前述のシステム、装置、およびユニットの詳細な作業プロセスについては、前述の方法の実施形態における対応するプロセスを参照し、詳細はここでは再度説明しない。

この出願の実施形態における機能ユニットは、１つの処理ユニットに統合され得るか、またはユニットのそれぞれが物理的に単独で存在し得るか、または２つ以上のユニットが１つのユニットに統合される。統合されたユニットは、ハードウェアの形で実装されてもよく、ソフトウェア機能ユニットの形で実装されてもよい。

統合されたユニットがソフトウェア機能ユニットの形で実装され、独立した製品として販売または使用される場合、統合されたユニットは、コンピュータ可読記憶媒体に記憶され得る。そのような理解に基づいて、本出願の実施形態の技術的解決策、または先行技術に寄与する部分、または技術的解決策のすべてまたは一部は、ソフトウェア製品の形で実装され得る。ソフトウェア製品は、記憶媒体に格納され、コンピュータデバイス（パーソナルコンピュータ、サーバ、またはネットワークデバイスであり得る）に、本出願の実施形態で説明された方法のステップのすべてまたはいくつかを実行するように指示するためのいくつかの命令を含む。前述の記憶媒体は、フラッシュメモリ、リムーバブルハードディスク、読み取り専用メモリ、ランダムアクセスメモリ、磁気ディスク、または光ディスクなどの、プログラムコードを記憶することができる任意の媒体を含む。

上記は、本出願の実施形態の単なる特定の実装であるが、本出願の実施形態の保護範囲は、それに限定されない。この出願の実施形態で開示された技術的範囲内の変更または置換は、この出願の実施形態の保護範囲内にあるものとする。したがって、本出願の実施形態の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims

歌の録音方法であって、
電子デバイスによって、第１のインターフェースを表示することであって、前記第１のインターフェースは、第１の歌を録音するために使用される録音ボタンを備えることと、
ユーザが録音ボタンを選択する操作に応答して、前記電子デバイスによって、元の歌手のアカペラの前記第１の歌の伴奏および特徴情報を取得することであって、前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手が前記第１の歌を歌うときに前記元の歌手の歌唱特徴を反映するために使用され得ることと、
前記電子デバイスによって、前記第１の歌の前記伴奏の再生を開始し、前記ユーザが歌う前記ユーザのアカペラの録音を開始することと、
前記ユーザの前記アカペラを録音するプロセスにおいて、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、第２のインターフェース上にガイダンス情報を表示することであって、前記ガイダンス情報は、前記ユーザの歌唱中の息継ぎおよびビブラートの１つまたは複数をガイドするために使用されることと
を含む方法。
前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手の前記アカペラの息継ぎ位置を含み、前記ガイダンス情報は、息継ぎプロンプトを含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、第２のインターフェース上にガイダンス情報を表示することは、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記息継ぎ位置に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記息継ぎ位置に対応する前記息継ぎプロンプトを表示することを含む、請求項１に記載の方法。
前記第２のインターフェースは、前記第１の歌の歌詞を含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記息継ぎ位置に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記息継ぎ位置に対応する前記息継ぎプロンプトを表示することは、
前記電子デバイスによって、前記歌詞の第１の位置に前記息継ぎプロンプトを表示することであって、前記第１の位置は、前記元の歌手の前記アカペラの前記息継ぎ位置と同じである、請求項２に記載の方法。
前記第２のインターフェースは、歌唱ツールを含み、前記歌唱ツールは、録音されている歌詞の各単語の音符を表示するように構成され、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記息継ぎ位置に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記息継ぎ位置に対応する前記息継ぎプロンプトを表示することは、
前記電子デバイスによって、前記歌唱ツールの第２の位置に前記息継ぎプロンプトを表示することであって、前記第２の位置は、前記元の歌手の前記アカペラの前記息継ぎ位置と同じである、請求項２に記載の方法。
前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手の前記アカペラのビブラート特徴を含み、前記ガイダンス情報は、ビブラートプロンプトを含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、第２のインターフェース上にガイダンス情報を表示することは、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記ビブラート特徴に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記ビブラート特徴に対応するビブラートプロンプトを表示することを含む、請求項１に記載の方法。
前記ビブラート特徴はビブラート位置を含み、前記第２のインターフェースが前記第１の歌の歌詞を含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記ビブラート特徴に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記ビブラート特徴に対応するビブラートプロンプトを表示することは、
前記電子デバイスによって、前記歌詞の第３の位置に前記ビブラートプロンプトを表示することであって、前記第３の位置は、前記元の歌手の前記アカペラの前記ビブラート位置と同じである、請求項５に記載の方法。
前記ビブラート特徴はビブラート位置を含み、前記第２のインターフェースが歌唱ツールを含み、前記歌唱ツールが、録音されている歌詞の各単語の音符を表示するように構成され、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記ビブラート特徴に基づいて、前記第２のインターフェース上に、前記元の歌手の前記アカペラの前記ビブラート特徴に対応するビブラートプロンプトを表示することは、
前記電子デバイスによって、前記歌唱ツールの第４の位置に前記ビブラートプロンプトを表示することであって、前記第４の位置は、前記元の歌手の前記アカペラの前記ビブラート位置と同じである、請求項５に記載の方法。
前記ユーザの前記アカペラを録音する前記プロセスにおいて、
前記電子デバイスによって、前記ユーザの前記アカペラから前記ユーザの前記アカペラの特徴情報を抽出することであって、前記ユーザの前記アカペラの前記特徴情報は、前記ユーザが前記第１の歌を歌うときの前記ユーザの歌唱特徴を反映するために使用されることと、
前記電子デバイスによって、前記ユーザの前記アカペラの前記特徴情報を前記元の歌手の前記アカペラの前記特徴情報と比較することにより、前記第２のインターフェース上に評価結果を表示することと
をさらに含む、請求項１乃至７のいずれか１項に記載の方法。
前記ユーザの前記アカペラの前記特徴情報は、前記ユーザの前記アカペラの息継ぎ位置を含み、前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手の前記アカペラの前記息継ぎ位置を含み、
前記電子デバイスによって、前記ユーザの前記アカペラの前記特徴情報を前記元の歌手の前記アカペラの前記特徴情報と比較することにより、前記第２のインターフェース上に評価結果を表示することは、
前記電子デバイスによって、前記ユーザの前記アカペラの前記息継ぎ位置を前記元の歌手の前記アカペラの前記息継ぎ位置と比較することにより、前記第２のインターフェース上に息継ぎスキルの評価結果を表示することを含む、請求項８に記載の方法。
前記電子デバイスによって、前記ユーザの前記アカペラの前記息継ぎ位置を前記元の歌手の前記アカペラの前記息継ぎ位置と比較することにより、前記第２のインターフェース上に息継ぎスキルの評価結果を表示することは、
前記ユーザの前記アカペラの前記息継ぎ位置が前記元の歌手の前記アカペラの前記息継ぎ位置と同じである場合、前記電子デバイスによって、前記第２のインターフェース上に正確な息継ぎを示すプロンプトを表示すること、または、
前記ユーザの前記アカペラの前記息継ぎ位置が前記元の歌手の前記アカペラの前記息継ぎ位置と異なる場合、前記電子デバイスによって、前記第２のインターフェース上に息継ぎエラーを示すプロンプトを表示することを含む、請求項９に記載の方法。
前記ユーザの前記アカペラの前記特徴情報は、前記ユーザの前記アカペラのビブラート特徴を含み、前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手の前記アカペラのビブラート特徴を含み、
前記電子デバイスによって、前記ユーザの前記アカペラの前記特徴情報を前記元の歌手の前記アカペラの前記特徴情報と比較することにより、前記第２のインターフェース上に評価結果を表示することは、
前記電子デバイスによって、前記ユーザの前記アカペラの前記ビブラート特徴を前記元の歌手の前記アカペラの前記ビブラート特徴と比較することにより、前記第２のインターフェース上に評価結果を表示することを含む、請求項８に記載の方法。
前記電子デバイスによって、前記ユーザの前記アカペラの前記ビブラート特徴を前記元の歌手の前記アカペラの前記ビブラート特徴と比較することにより、前記第２のインターフェース上に評価結果を表示することは、
前記ユーザの前記アカペラの前記ビブラート特徴が前記元の歌手の前記アカペラの前記ビブラート特徴と同じである場合、前記電子デバイスによって、前記第２のインターフェース上に正確なビブラートを示すプロンプトを表示すること、または、
前記ユーザの前記アカペラの前記ビブラート特徴が前記元の歌手の前記アカペラの前記ビブラート特徴と異なる場合、前記第２のインターフェース上にビブラートエラーを示すプロンプトを表示することを含む、請求項１１に記載の方法。
前記電子デバイスによって、前記第２のインターフェース上に評価結果を表示することは、
前記電子デバイスによって、前記第２のインターフェース上に前記歌詞内で前記評価結果を表示すること、または、
前記電子デバイスによって、前記第２のインターフェース上に前記歌唱ツール内で前記評価結果を表示することであって、前記歌唱ツールは、前記歌詞内で各単語の音符を表示することを含む、請求項８乃至１２のいずれか１項に記載の方法。
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、第２のインターフェース上にガイダンス情報を表示することの後に、
前記第１の歌の録音が終了した後、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することであって、前記歌唱問題は、息継ぎ問題およびビブラート問題の１つまたは複数を含むこと
をさらに含む請求項１乃至１３のいずれか１項に記載の方法。
音声補正方法であって、
電子デバイスによって、第１のインターフェースを表示することであって、前記第１のインターフェースは、第１の歌を録音するために使用される録音ボタンを含むことと、
ユーザが前記録音ボタンを選択する操作に応答して、前記電子デバイスによって、前記第１の歌の伴奏、および元の歌手のアカペラの特徴情報を取得することであって、前記元の歌手の前記アカペラの前記特徴情報は、前記元の歌手が前記第１の歌を歌うときに、前記元の歌手の歌唱特徴を反映するために使用され得ることと、
前記電子デバイスによって、前記第１の歌の前記伴奏の再生を開始し、前記ユーザが歌う前記ユーザのアカペラの録音を開始することと、
前記第１の歌の録音が終了した後、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することであって、前記歌唱問題は、息継ぎ問題およびビブラート問題の１つまたは複数を含む、方法。
前記歌唱問題は息継ぎ問題であり、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することは、
前記電子デバイスによって、前記ユーザの前記アカペラから前記ユーザの前記アカペラの息継ぎ音を抽出することと、
前記電子デバイスによって、前記ユーザの前記アカペラに現れる前記息継ぎ問題を補正するために、前記ユーザの前記アカペラの前記息継ぎ音のエネルギーおよび周波数応答を低減することと
を含む、請求項１５に記載の方法。
前記歌唱問題はビブラート問題であり、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することは、
前記電子デバイスによって、前記ユーザの前記アカペラから前記ユーザの前記アカペラのビブラート特徴を抽出することと、
前記ユーザの前記アカペラの前記ビブラート特徴が前記元の歌手の前記アカペラの前記特徴情報のビブラート特徴と一致しない場合、前記電子デバイスによって、前記ユーザの前記アカペラに現れる前記ビブラート問題を補正するために、前記元の歌手の前記アカペラの前記ビブラート特徴を使用することによって、前記ユーザの前記アカペラの前記ビブラート特徴を補正することと
を含む、請求項１５に記載の方法。
前記第１の歌の録音が終了した後、
前記電子デバイスによって、第２のインターフェースを表示することであって、前記第２のインターフェースは、音声補正スイッチを含むことをさらに含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することは、
前記ユーザが前記音声補正スイッチをオンにしたことが検出された場合、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる前記歌唱問題を補正することを含む、請求項１５乃至１７のいずれか１項に記載の方法。
前記第１の歌の録音が終了した後、
前記電子デバイスによって、第２のインターフェースを表示することであって、前記第２のインターフェースは、音声補正オプションを含み、前記音声補正オプションは、イントネーション補正オプション、息継ぎ音声補正オプション、およびビブラート補正オプションを含むことをさらに含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題の補正することは、
前記ユーザが選択した前記音声補正オプションに応じて、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記音声補正オプションに対応し、前記ユーザの前記アカペラに現れる歌唱問題を補正することを含む、請求項１５乃至１７のいずれか１項に記載の方法。
前記第１の歌の録音が終了した後、
前記電子デバイスによって、第２のインターフェースを表示することであって、前記第２のインターフェースは、単一文改良オプションを含むことと、
前記単一文改良オプションの前記ユーザの選択に応答して、前記電子デバイスによって、第３のインターフェースを表示することであって、前記第３のインターフェースは、前記第１の歌の歌詞のＮ個の文を含み、Ｎ＞１であることと
をさらに含み、
前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記ユーザの前記アカペラに現れる歌唱問題を補正することは、
前記ユーザが前記歌詞の前記Ｎ個の文から第１の歌詞を選択する場合、前記電子デバイスによって、前記元の歌手の前記アカペラの前記特徴情報に基づいて、前記第１の歌詞に対応し、前記ユーザの前記アカペラに現れる歌唱問題を補正することを含む、請求項１５乃至１７のいずれか１項に記載の方法。
前記電子デバイスによって、第３のインターフェースを表示することは、
前記電子デバイスによって、前記第３のインターフェース上で前記歌詞の前記Ｎ個の文の電子デバイスによって、前記歌唱の問題が発生する位置をマークすることを含む、請求項２０に記載の方法。
電子デバイスであって、
タッチスクリーンであって、タッチセンシティブ表面およびディスプレイを備えるタッチスクリーンと、
１つまたは複数のプロセッサと、
１つまたは複数のメモリと、
１つまたは複数のマイクロフォンと、
１つまたは複数のコンピュータプログラムとを備え、前記1つまたは複数のコンピュータプログラムは前記１つまたは複数のメモリに格納され、前記１つまたは複数のコンピュータプログラムは命令を含み、前記命令が前記電子デバイスによって実行されるとき、請求項１乃至１４のいずれか１項に記載の歌の録音方法、または請求項１５乃至２１のいずれか１項に記載の音声補正方法を実行することができる、電子デバイス。
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体が命令を記憶し、前記命令が電子デバイス上で実行されるとき、前記電子デバイスは、請求項１から１４のいずれか１項による歌録音方法、または、請求項１５から２１のいずれか１項による音声補正方法を実施することができる、コンピュータ可読記憶媒体。
命令を含むコンピュータプログラム製品であって、前記コンピュータプログラム製品が電子デバイス上で実行されると、前記電子デバイスは、請求項１から１４のいずれか１項による前記歌の録音方法、または請求項１５から２１のいずれか１項による音声補正方法を実行することができる、コンピュータプログラム製品。
グラフィカルユーザインターフェースＧＵＩであって、前記グラフィカルユーザインターフェースは電子デバイスに格納され、前記電子デバイスがタッチスクリーン、メモリ、およびプロセッサを含み、前記プロセッサが前記メモリに格納された１つまたは複数のコンピュータプログラムを実行するように構成され、
前記グラフィカルユーザインターフェースは、
前記タッチスクリーンに表示される第１のＧＵＩであって、第１の歌を録音するために使用される録音ボタンを備える、前記第１のＧＵＩと、
前記録音ボタンのタッチイベントに応答して前記タッチスクリーンに表示される第２のＧＵＩであって、前記第２のＧＵＩは、前記第１の歌を録音するための録音インターフェースであり、前記第２のＧＵＩは、ユーザに前記第１の歌を歌うようにガイドするためのガイダンス情報を含み、前記ガイダンス情報は、息継ぎプロンプトおよび／またはビブラートプロンプトを含む、前記第２のＧＵＩと
を含む、ＧＵＩ。
前記第２のＧＵＩは、歌唱中の前記ユーザの息継ぎスキルおよび／またはビブラートスキルの評価結果をさらに含む、請求項２５に記載のＧＵＩ。
前記第２のＧＵＩが前記タッチスクリーン上に表示された後、前記ＧＵＩは、
前記第１の歌の録音が終了した後に前記タッチスクリーンに表示される第３のＧＵＩであって、前記第３のＧＵＩは第１の歌の音声補正インターフェースであり、前記第３のＧＵＩは音声補正スイッチを備え、前記音声補正スイッチがオンにされると、前記電子デバイスは、前記ユーザのアカペラに現れる息継ぎ問題および／またはビブラート問題を補正する、前記第３のＧＵＩをさらに備える、請求項２５または２６に記載のＧＵＩ。