JP2017514392A - ユーザ端末ならびに端末の音量を調整する方法および装置 - Google Patents

ユーザ端末ならびに端末の音量を調整する方法および装置 Download PDF

Info

Publication number
JP2017514392A
JP2017514392A JP2016563102A JP2016563102A JP2017514392A JP 2017514392 A JP2017514392 A JP 2017514392A JP 2016563102 A JP2016563102 A JP 2016563102A JP 2016563102 A JP2016563102 A JP 2016563102A JP 2017514392 A JP2017514392 A JP 2017514392A
Authority
JP
Japan
Prior art keywords
volume
user terminal
voice
audio
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016563102A
Other languages
English (en)
Other versions
JP6381153B2 (ja
Inventor
冬 ▲劉▼
冬 ▲劉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2017514392A publication Critical patent/JP2017514392A/ja
Application granted granted Critical
Publication of JP6381153B2 publication Critical patent/JP6381153B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/02Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone
    • H04M19/04Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone the ringing-current being generated at the substations
    • H04M19/042Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone the ringing-current being generated at the substations with variable loudness of the ringing tone, e.g. variable envelope or amplitude of ring signal
    • H04M19/044Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone the ringing-current being generated at the substations with variable loudness of the ringing tone, e.g. variable envelope or amplitude of ring signal according to the level of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices

Abstract

本発明は、音量調整方法および装置、ならびに端末を開示する。ユーザ端末の周囲の音声信号が収集された後に、音声信号の組成情報を取得するために、収集した音声信号の分析が実行され、組成情報は、音声信号に含まれる音声タイプ、および様々なタイプの音声の比率を含み、音声タイプは、無音、人声、およびノイズを含み、音声信号の組成情報に従って、ユーザ端末の現在のシーンモードを決定し、ユーザ端末の音量は、決定したシーンモードに従って調整される。ユーザ端末の現在のシーンモードが決定されると、音声信号の組成情報の基準が追加されるため、対応する現在のシーンが実際のシーンに近くなり、ユーザが置かれているシーンにより正確に整合することができ、これによって、再生音量の調整がシーンに合致しないという、シーンの判定の誤りによって引き起こされる事態の発生を大幅に削減し、ユーザの使用感を向上させる。

Description

本発明は、通信技術の分野に関し、特に、ユーザ端末、ならびに端末の音量を調整する方法ならびに装置に関する。
通信技術の継続的な発展に伴い、携帯電話やタブレットコンピュータ等の携帯ユーザ端末は、人々の生活や仕事に欠くことのできない所持品となっている。人々は、いつでもどこでも、電話をかけたり受けたりすることができる。電話を受けるときに、通常は場合により着信音量の設定を変えることが必要になる。携帯電話のユーザは通常、オフィス等の静かな環境では、他のオフィス職員の通常業務に影響を及ぼすような、比較的大きい音を出すことを避けるために、比較的低い音量の着信音を使用したいと考えている。しかしながら、ショッピングモールや駅等の騒音の多い公共の場では、かかってきた電話を遅れることなく確実に受けられるように、比較的大きい音量の着信音が必要になる。
現在、多くの携帯電話の着信音量および受話器の通話音量は、通常はユーザが手動で調整し、あるいは多くの携帯電話は、屋内モードや屋外モードのような特定のシーン等の、単純な自己感知のシーンモードを組み込んでいる。
携帯電話の着信音の再生音量を調整するために自己感知のシーンモードが使用されるときは、環境音のデシベルは一般に、電話がかかってきたときに音声検出モジュールを用いることによって抽出されて判定され、次に、音声デシベル量とかかってきた電話の着信音量との間の予め記憶した対応関係に従って、着信音量および受話音量が調整される。上述の音量調整方法では、着信音の最終的な音量、および受話器の最終的な音量は、環境音のデシベルのみに従って決定されるが、環境音のデシベルは、ユーザが置かれている状況を正確に反映することはできず、また、抽出された環境音が、比較的活発な議論を伴う会議、討論会、または発表会等の比較的大きい人声を含む場合は、抽出された環境音が誤ってノイズとみなされる場合がある。このような状況では、音量は下げられるべきであるが、環境音のデシベルに従って決定された音量は比較的大きい。結果的に、携帯電話の音量の調整は実際のシーンに合致しておらず、その精度は高いものではない。
本発明の実施形態は、携帯電話の音量が、ユーザが置かれている状況に適応し、かつより正確に整合して、ユーザの使用感を高めるように、ユーザ端末、ならびに端末の音量を調整する方法および装置を提供する。
第1の態様によれば、ユーザ端末の音量を調整する方法が提供され、この方法は、
ユーザ端末の周囲の音声信号を収集するステップと、
音声信号の組成情報を取得するために、収集した音声信号の分析を実行するステップであって、組成情報は、音声信号に含まれる音声タイプ、および様々なタイプの音声の比率を含み、音声タイプは、無音、人声、およびノイズを含む、分析を実行するステップと、
音声信号の組成情報に従って、ユーザ端末の現在のシーンモードを決定するステップと、
決定したシーンモードに従って、ユーザ端末の音量を調整するステップとを含む。
第1の態様に関連する、第1の可能な実施方法において、ユーザ端末の周囲の音声信号を収集するステップは、
呼び出し信号の到達が検出されたときに、ユーザ端末が置かれている現在の環境の音声信号を収集すること、または、
ユーザ端末が置かれている現在の環境の音声信号を定期的に収集することを具体的に含む。
第1の態様または第1の態様の第1の可能な実施方法に関連する、第2の可能な実施方法において、決定したシーンモードに従って、ユーザ端末の音量を調整するステップは、
決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って、音量調整係数を決定することと、音量調整係数に従って、ユーザ端末の音量を調整することとを含む。
第1の態様の第2の可能な実施方法に関連する、第3の可能な実施方法において、ユーザ端末の音量は、着信音量および受話音量を含み、音量調整係数は、着信音量調整係数、および受話音量調整係数を含み、
音量調整係数に従って、ユーザ端末の音量を調整するステップは、
着信音量調整係数に従って、ユーザ端末の着信音量を調整することと、受話音量調整係数に従って、ユーザ端末の受話音量を調整することとを含む。
第1の態様、第1の態様の第1の可能な実施方法、第1の態様の第2の可能な実施方法、あるいは第1の態様の第3の可能な実施方法に関連する、第4の可能な実施方法において、
呼び出し信号の接続が検出された後に、この方法は、
ユーザ端末のマイク音量をリアルタイムで取得するステップと、
取得したマイク音量が、予め記憶した基準音量よりも大きいときは、ユーザ端末の受話音量を大きくするステップと、
取得したマイク音量が、予め記憶した基準音量よりも小さいときは、ユーザ端末の受話音量を小さくするステップとをさらに含む。
第1の態様の第4の可能な実施方法に関連する、第5の可能な実施方法において、呼び出し信号の接続が検出された後に、この方法は、
ユーザ端末の周囲の音声信号を定期的に収集するステップ、および音声信号の組成情報を得るために、収集した音声信号の分析を実行するステップと、
音声信号の組成情報に従って、音声信号が人声を含むかどうか、および1人のみの声を含むかどうかを判定するステップをさらに含み、音声信号が人声を含み、音声信号が人声を含み、かつ1人のみの声1人のみの声を含む場合は、音声信号の音量を計算し、音声信号の計算した音量と、予め記憶した基準音量との平均値を取り、平均値を新たな基準音量として記憶する。
第1の態様、第1の態様の第1の可能な実施方法、第1の態様の第2の可能な実施方法、あるいは第1の態様の第3の可能な実施方法、第1の態様の第4の可能な実施方法、または第1の態様の第5の可能な実施方法に関連する、第6の可能な実施方法において、音声信号の組成情報を取得するために、収集した音声信号の分析を実行するステップは、
収集した音声信号を複数の音声データに分割することと、
各音声データの音声周波数を計算すること、ならびに計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類することと、
全ての音声データの無音、人声、およびノイズの比率の統計を収集することを具体的に含み、
人声と識別された音声データについては、人声の音声データのメル周波数ケプストラム係数を計算し、人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集する。
第1の態様の第6の可能な実施方法に関連して、第7の可能な実施方法において、計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類するステップは、
各音声データの音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを判定することを具体的に含み、
音声データの前記音声周波数が、20Hz〜20000Hzの範囲内にあると判定されたときは、音声データの基本周波数を計算し、
基本周波数が、85Hz〜255Hzの範囲内にあると判定されたときは、音声データは人声であるとみなし、基本周波数が、85Hz〜255Hzの範囲外にあると決定されたときは、音声データはノイズであるとみなし、
音声データの音声周波数が、20Hz〜20000Hzの範囲外にあると判定されたときは、音声データは無音であるとみなす。
第2の態様によれば、ユーザ端末の音量を調整する装置が提供され、この装置は、
ユーザ端末の周囲の音声信号を収集するように構成された、収集ユニットと、
音声信号の組成情報を取得するために、収集した音声信号の分析を実行するように構成された分析ユニットであって、組成情報は、音声信号に含まれる音声タイプ、および様々なタイプの音声の比率を含み、音声タイプは、無音、人声、およびノイズを含む、分析ユニットと、
音声信号の組成情報に従って、ユーザ端末の現在のシーンモードを決定するように構成された、シーンモード決定ユニットと、
決定したシーンモードに従って、ユーザ端末の音量を調整するように構成された、音量調整ユニットとを備える。
第2の態様に関連する、第1の可能な実施方法において、収集ユニットは、呼び出し信号の到達が検出されたときに、ユーザ端末が置かれている現在の環境の音声信号を収集するように、または、ユーザ端末が置かれている現在の環境の音声信号を定期的に収集するように具体的に構成される。
第2の態様、または第2の態様の第1の可能な実施方法に関連する、第2の可能な実施方法において、音量調整ユニットは、決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って、音量調整係数を決定するように、かつ音量調整係数に従って、ユーザ端末の音量を調整するように、具体的に構成される。
第2の態様の第2の可能な実施方法に関連する、第3の可能な実施方法において、ユーザ端末の音量は、着信音量および受話音量を含み、音量調整ユニットの音量調整係数は、着信音量調整係数、および受話音量調整係数を具体的に含み、
音量調整ユニットは、着信音量調整係数に従って、ユーザ端末の着信音量を調整するように、かつ受話音量調整係数に従って、ユーザ端末の受話音量を調整するように具体的に構成される。
第2の態様、第2の態様の第1の可能な実施方法、第2の態様の第2の可能な実施方法、または第2の態様の第3の可能な実施方法に関連する、第4の可能な実施方法において、この装置は、
呼び出し信号が接続されたことが検出された後に、ユーザ端末のマイク音量をリアルタイムで取得するように構成された取得ユニットと、
取得したマイク音量と、予め記憶した基準音量との大きさを比較するように構成された、比較ユニットをさらに備え、
音量調整ユニットは、取得したマイク音量が、予め記憶した基準音量よりも大きいときは、ユーザ端末の受話音量を大きくし、取得したマイク音量が、予め記憶した基準音量よりも小さいときは、ユーザ端末の受話音量を小さくするようにさらに構成される。
第2の態様の第4の可能な実施方法に関連する、第5の可能な実施方法において、収集ユニットは、呼び出し信号の接続が検出された後に、ユーザ端末の周囲の音声信号を定期的に収集し、
分析ユニットは、音声信号の組成情報を得るために、呼び出し信号の接続が検出された後に、収集モジュールによって定期的に収集された音声信号の分析を実行するように、かつ音声信号の組成情報に従って、音声信号が人声を含むかどうか、および1人のみの声を含むかどうかを判定するようにさらに構成され、音声信号が人声を含み、音声信号が人声を含み、音声信号が人声を含み、かつ1人のみの声1人のみの声を含む場合は、音声信号の音量を計算し、音声信号の計算した音量と、予め記憶した基準音量との平均値を取り、平均値を新たな基準音量として記憶する。
第2の態様、第2の態様の第1の可能な実施方法、第2の態様の第2の可能な実施方法、第2の態様の第3の可能な実施方法、第2の態様の第4の可能な実施方法、または第2の態様の第5の可能な実施方法に関連する、第6の可能な実施方法において、分析ユニットは、
収集した音声信号を複数の音声データに分割するように構成された、第1の処理ユニットと、
各音声データの音声周波数を計算し、計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類するように構成された、第2の処理ユニットと、
全ての音声データの無音、人声、およびノイズの比率の統計を収集するように構成された、第3の処理ユニットと、
人声と識別された音声データについては、メル周波数ケプストラム係数を計算し、人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集するように構成された、第4の処理ユニットとを具体的に含む。
第2の態様の第6の可能な実施方法に関連する、第7の可能な実施方法において、第2の処理ユニットは、各音声データの音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを判定し、音声データの音声周波数が、20Hz〜20000Hzの範囲内にあると判定されたときは、音声データの基本周波数を計算し、基本周波数が、85Hz〜255Hzの範囲内にあると判定されたときは、音声データは人声であるとみなし、基本周波数が、85Hz〜255Hzの範囲外にあると判定されたときは、音声データはノイズであるとみなし、音声データの音声周波数が、20Hz〜20000Hzの範囲外にあると判定されたときは、音声データは無音であるとみなすように具体的に構成される。
第3の態様によれば、スピーカおよび受話器を備え、本発明の実施形態による、上述の音量調整装置をさらに備える、端末が提供される。
本発明の実施形態で提供される、ユーザ端末の音量を調整する方法および装置、ならびに端末は、以下の有益な効果を奏する。
ユーザ端末の現在のシーンモードが決定されると、音声信号の組成情報の基準が追加されるため、対応する現在のシーンが実際のシーンに近くなり、ユーザが置かれているシーンにより正確に整合することができ、これによって、再生音量の調整がシーンに合致しないという、シーンの判定の誤りによって引き起こされる事態の発生を大幅に削減し、ユーザの使用感を向上させる。
本発明の実施形態による、音量調整方法の概略的なフローチャート1である。 本発明の実施形態による、音量調整方法の概略的なフローチャート2である。 本発明の実施形態による、音量調整方法の概略的なフローチャート3である。 本発明の実施形態による、音量調整方法の概略的なフローチャート4である。 本発明の実施形態による、音量調整方法の概略的なフローチャート5である。 本発明の実施形態による、音量調整装置の概略的な構造図である。 本発明の実施形態による、ユーザ端末の概略的な構造図である。
ユーザ端末が、周囲の環境に応じて自動的に音量を調整するときに、シーンを識別する精度が低いために、調整済みの音量が実際のシーンと整合しないという既存の問題を解決するために、ユーザ端末の音量を調整する方法および装置、ならびに端末が本発明の実施形態で提供され、これは、環境音の正確な分析を実行することができ、その結果、整合された現在のシーンが実際のシーンに近く、調整によって適切な音量がさらに得られることにより、シーンの判定の誤りによって引き起こされる、音量調整がシーンに合致しない事態の発生を大幅に削減する。以下、本発明の実施形態の技術的解決策について、本発明の実施形態の添付の図面を参照しながら、より明確かつ完全に説明する。説明されている実施形態は、本発明の実施形態の全てではなく、一部にすぎないことは明らかである。本発明の実施形態に基づいて、当業者によって創造的な努力をすることなく提案された他の実施形態は、本発明の保護の範囲に属する。
本発明の実施形態で提供される、ユーザ端末の音量を調整する方法は、携帯電話またはトランシーバ等の通信端末の通信用に主に用いることができる。例えば、呼び出し信号が到達したときに、携帯電話が直ちに鳴らない場合があるが、本発明の実施形態で提供される音量調整方法を用いて音量を決定した後は、適切な着信音量制御を行い、かつ電話が繋がった後に適切な受話音量制御を行うことができる。本発明の実施形態で提供される、音量調整方法は、例えば、番組を放映するためにバスや地下鉄に取り付けられた移動テレビ端末に用いることもできる。例えば、バスの移動テレビ端末は、本発明の実施形態で提供される音量調整方法を用いることによって、乗客の数およびバス内の音量に従って番組の音量を自動的に調整することができる。
図1を参照すると、本発明の実施形態は、ユーザ端末の音量を調整する方法を提供し、本方法は、以下のステップを含む。
S101.ユーザ端末の周囲の音声信号を収集する。
具体的な実施において、音声信号を収集する時間は、音量調整を行う装置の処理能力に応じて制御することができる。例えば、装置の処理能力が比較的高いときは、ユーザ端末が置かれている現在の環境の音声信号は、呼び出し信号の到達が検出されたときのみ収集されてもよく、それから後続の手順が行われ、装置の処理能力が比較的低いときは、ユーザ端末が置かれている現在の環境の音声信号は定期的に収集されてもよく、それから後続の手順が行われる。呼び出し信号が到達すると、調整済みの音量を直接用いて、着信音が再生される。
具体的な実施において、現在の環境の音声信号は、端末のマイク等の構成部品を用いて収集することができ、あるいは、現在の環境の音声信号を収集するために、別の音声センサが端末に構成されてもよく、これは本明細書において限定されない。
S102.音声信号の組成情報を得るために、収集した音声信号の分析を実行し、組成情報は、音声信号に含まれる音声タイプ、ならびに様々なタイプの音声の比率を含み、音声タイプは、無音(blank sound)、人声、およびノイズを含む。
具体的な実施において、音声信号は、無音、人声、および人声でない音声(ノイズ)等に分けることができる。無音とは、人間の耳で認識できない音声信号のことを言う。一般に、20Hz〜20000Hzの範囲外にある音声周波数を伴う音声信号は、無音とみなすことができる。ノイズとは人声以外の、人間の耳で認識できる音声信号のことを言う。一般に、20Hz〜85Hzの範囲内、および255Hz〜20000Hzの範囲内にある音声周波数を伴う音声信号は、ノイズとみなすことができる。収集した音声信号の分析を実行することによって、音声信号に含まれる無音の比率、ノイズの比率、および人声の比率が計算されて、その結果、後続のシーンモードの識別が実行される。
S103.音声信号の組成情報に従って、ユーザ端末の現在のシーンモードを決定する。
ユーザ端末のシーンモードは、静かな図書館、議論が交わされている会議室、静かな寝室、または騒音のある道路等、ユーザ端末が置かれている環境状況を示すのに用いられる。具体的な実施において、音声信号の3種類の音声間の比率の大小関係に対して、対応するシーンモードの対応関係が確立され、すなわち、比率の異なる音声信号は異なるシーンモードに対応し、各シーンモードは、相当する音量に対応する。また、対応関係が確立されると、人声の量の基準も追加することができ、その結果、対応するシーンモードが実際の環境に近いことによって、環境の判定の誤りによって引き起こされる、音量調整が環境と合致しない事態の発生を大幅に削減する。
S104.決定したシーンモードに従って、ユーザ端末の音量を調整する。
具体的な実施において、音量調整係数は、決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って決定することができ、ユーザ端末の音量は、音量調整係数に従って調整される。
具体的な実施において、携帯電話等の通信端末に適用されたときに、ユーザ端末の音量は、具体的には呼び出し音(着信音(ring tone)とも呼ばれる)の音量および受話音量を含んでもよく、音量調整係数には具体的には2種類が含まれ、すなわち、着信音量調整係数および受話音量調整係数である。
これに応じて、ユーザ端末の着信音量は、ユーザ端末の着信音量調整係数に従って調整することができ、ユーザ端末の受話音量は、受話音量調整係数に従って調整することができる。
表1は、次の複数のシーンモードで、異なる人数に対して設定された着信音量調整係数および受話音量調整係数を示す。各シーンにおいて、スラッシュ(「/」)で区切られた2つの値がそれぞれ示すのは、左から右に、着信音量調整係数、および受話音量調整係数である。
音量調整は、10のレベル、すなわち0.1〜1.0に分割されるものとする。「d」付きの項目は、環境音の強度(デシベル)に従って、さらに決定が必要な係数値を示し、ここでdは、環境音量の強度レベルを示す。具体的には、例えば、人間の耳で聞くことのできる妥当な音量範囲は、20〜120デシベル(120デシベルを超える音量は全て120として計算)であり、環境音量もまた、10デシベル毎に1レベル上昇するという規則に従って10のレベルに分割することができ、すなわちdの値の範囲は、1、2、〜10となる。d付きのいくつかの項目については、計算結果は、0.1〜1.0の10個の値に正確に対応していなくてもよく、近くてより大きい値が選択され、計算結果が0.1未満、あるいは1.0よりも大きい場合は、これら2つの境界値が選択される。
具体的な実施において、図2に示されているような、本発明の実施形態で提供される、音声信号の組成情報を得るために収集した音声信号の分析を実行する上述のステップS102は、具体的には次の方法で実施することができる。
S201.収集した音声信号を、複数の音声データ、例えばS1、S2、〜Snのn個に分割する。
S202.各音声データの音声周波数を計算して、計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類する。
S203.全ての音声データの無音、人声、およびノイズの比率の統計を収集する。具体的には、各種の音声データの量は個別に計算され、比率を得るために、音声データの全量と比較される。
S204.人声として区別された音声データについては、メル周波数ケプストラム係数(MFCC、Mel−Frequency Cepstral Coefficients)を計算し、次に、人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集する。
具体的には、人声として区別された音声データについては、MFCC特徴の計算を実行することができ、次に、2つのMFCC特徴マトリックス毎の類似性が計算される。結果が類似している複数のMFCC特徴は、1人の声とみなすことができるが、逆に言えば、複数のMFCC特徴は違う人の声であり、したがって、N個のサンプルに含まれる人数に関する情報は、統計収集によって得ることができる。
本発明のこの実施形態は、収集した音声信号の組成情報を決定するために、主に周波数およびスペクトル分析に基づいていることが理解されよう。他の類似の周波数/スペクトル分析法も、この目的を全て実現することができるが、本明細書では1つずつ列挙されない。
具体的には、図3に示すような、計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類する前述のステップS202は、次の手順を用いて実施することができる。
S301.各音声データの音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを判定し、各音声データの音声周波数が、20Hz〜20000Hzの範囲内にある場合は、ステップS302を行い、各音声データの音声周波数が、20Hz〜20000Hzの範囲内にない場合は、ステップS306を行う。
S302.音声データの基本周波数を計算する。発音体が振動による音を発するとき、その音は一般に、複数の純正弦波に分解することができる。つまり、あらゆる自然音は基本的に、異なる周波数の多くの正弦波で形成され、最低周波数の正弦波は、基本周波数(fundamental frequency)であり、基本周波数は、異なる発音体を区別するのに用いることができる。
S303.基本周波数が85Hz〜255Hzの範囲内にあるかどうかを判定し、基本周波数が85Hz〜255Hzの範囲内にある場合はステップS304を行い、基本周波数が85Hz〜255Hzの範囲内にない場合は、ステップS305を行う。
S304.音声データを人声とみなす。
S305.音声データをノイズとみなす。
S306.音声データを無音とみなす。
また、本発明のこの実施形態で提供される、決定されたシーンモードに従ってユーザ端末の音量を調整する上述のステップS104が行われた後、および通話の際にユーザが呼び出し信号を接続した後に、通話が(静かな環境で)妨げられることなく進行する場合は、音声の強度は一般に固定される。通話者が、周囲環境の騒音が比較的多いとみなせば、通話者は無意識に通話の声の強度を大きくし、あるいは、通話者が現在の環境が非常に静かである(例えば、先ほどまでは複数人が話していたが、1人が電話に出ると他の全員が話すのをやめた)とみなせば、通話の声が他の人の邪魔になることを望まず、あるいは、会話に個人的な情報が含まれていると、通話者は他の人に会話の内容を聞かれたくないため、通常の場合に比べて通話の声の強度は小さくなる。上述の事例では、本発明のこの実施形態で提供される音量調整方法で、呼び出し信号の接続が検出された後で、再生音量を2回微調整するためのスキームがさらに提供され、その結果、受話音量が現在の状況に合致するように調整されるという効果が得られる。
これに基づき、図4に示すような、本発明のこの実施形態で提供される上述の音量調整方法は、次のステップをさらに含む。
S401.呼び出し信号の接続が検出された後に、リアルタイムでユーザ端末のマイク音量を取得する。
S402.取得したマイク音量と、予め記憶した基準音量との大きさを比較して、取得したマイク音量が予め記憶した基準音量よりも大きいときは、ステップS403を実行し、取得したマイク音量が予め記憶した基準音量よりも小さいときは、ステップS404を実行し、取得したマイク音量が予め記憶した基準音量と等しいときは、手順を終了する。
S403.ユーザ端末の受話音量を大きくする。
S404.ユーザ端末の受話音量を小さくする。
具体的な実施において、S402で、取得したマイク音量が予め記憶した基準音量と比較されるときに、予め記憶した基準音量は、単一の数値に設定されてもよく、あるいは数値範囲に設定されてもよい。取得したマイク音量がこの値範囲内にあるうちは、取得したマイク音量は基準音量と等しいとみなすことができ、受話器の再生音量は、調整する必要がない。
上述のステップS401〜S404の実行は、予め記憶した基本音量に基づいて実施される。基本音量は、一般に固定値であり、かつ現在の通話の前の通話の過程で決定され記憶される。無論、基本音量は、図5に示すように更新することもでき、これは、次のステップを用いて実施することができる。
S501.呼び出し信号の接続が検出された後に、ユーザ端末の周囲の音声信号を定期的に収集する。
S502.音声信号の組成情報を得るために、収集した音声信号の分析を実行する。具体的な実施における、具体的な実行するステップについては、ステップS201〜S204を参照されたい。
S503.音声信号の組成情報に従って、音声信号が人声を含み、かつ1人のみの人声を含むかどうかを判定し、音声信号が人声を含み、かつ音声信号が人声を含み、1人のみの声1人のみの声を含む場合は、ステップS504を実行し、音声信号が人声を含まず、1人のみの声を含まない場合は、再生音量の微調整のためのスキームを2回実行、すなわち、ステップS401〜S404を実行する。
S504.音声信号の音量を計算し、音声信号の計算した音量と予め記憶した基準音量との平均値を取り、平均値を新たな基準音量として記憶する。
本発明のこの実施形態で提供される、上述の音量調整方法では、ユーザ端末の現在のシーンモードが決定されると、音声信号の組成情報の基準が追加されるため、対応する現在のシーンが実際のシーンに近くなり、ユーザが置かれているシーンにより正確に整合することができ、これによって、再生音量の調整がシーンに合致しないという、シーンの判定の誤りによって引き起こされる事態の発生を大幅に削減し、ユーザの使用感を向上させる。
同一の発明概念に基づき、本発明は、図6に示すようなユーザ端末の音量を調整する装置をさらに提供し、これは、
ユーザ端末の周囲の音声信号を収集するように構成された収集ユニット601と、
音声信号の組成情報を得るために、収集した音声信号の分析を実行するように構成された分析ユニット602であって、組成情報は、音声信号に含まれる音声タイプ、および各種音声の比率を含み、音声タイプは、無音、人声、およびノイズを含む、分析ユニット602と、
音声信号の組成情報に従ってユーザ端末の現在のシーンモードを決定するように構成された、シーンモード決定ユニット603と、
決定されたシーンモードに従ってユーザ端末の音量を調整するように構成された音量調整ユニット604とを備える。
具体的には、本発明のこの実施形態で提供される上述の装置において、収集ユニット601は、
呼び出し信号の到達が検出されたときに、ユーザ端末が置かれている現在の環境の音声信号を収集する、あるいはユーザ端末が置かれている現在の環境の音声信号を定期的に収集するように具体的に構成される。
具体的には、本発明のこの実施形態で提供される上述の装置において、音量調整ユニット604は、決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って音量調整係数を決定し、音量調整係数に従ってユーザ端末の音量を調整するように具体的に構成される。
具体的には、本発明のこの実施形態で提供される上述の装置において、ユーザ端末の音量は、着信音量および受話音量を含み、音量調整ユニット604の音量調整係数は、具体的には、着信音量調整係数および受話音量調整係数を含む。
音量調整ユニット604は、具体的には、着信音量調整係数に従ってユーザ端末の着信音量を調整し、かつ受話音量調整係数に従ってユーザ端末の受話音量を調整するように構成される。
具体的には、図6に示すような、本発明のこの実施形態で提供される上述の装置は、
呼び出し信号の接続が検出された後に、ユーザ端末のマイク音量をリアルタイムで取得するように構成された取得ユニット605と、
取得したマイク音量と、予め記憶した基準音量との大きさを比較するように構成された比較ユニット606とをさらに備え、
音量調整ユニット604は、取得したマイク音量が予め記憶した基準音量よりも大きいときは、ユーザ端末の受話音量を大きくし、取得したマイク音量が予め記憶した基準音量よりも小さいときは、ユーザ端末の受話音量を小さくするようにさらに構成される。
具体的には、本発明のこの実施形態で提供される上述の装置において、収集ユニット601は、呼び出し信号の接続が検出された後に、ユーザ端末の周囲の音声信号を定期的に収集するように具体的に構成される。
分析ユニット602は、音声信号の組成情報を取得するために、呼び出し信号の接続が検出された後に、収集モジュール601によって定期的に収集された音声信号の分析を実行し、音声信号の組成情報に従って、音声信号が人声を含むかどうか、および1人のみの声を含むかどうかを判定し、音声信号が人声を含み、音声信号が人声を含み、かつ1人のみの声1人のみの声を含む場合は、音声信号の音量を計算し、音声信号の計算した音量と、予め記憶した基準音量との平均値を取り、平均値を新たな基準音量として記憶するようにさらに構成される。
具体的には、本発明のこの実施形態で提供される上述の装置において、分析ユニット602は、
収集した音声信号を複数の音声データに分割するように構成された、第1の処理ユニットと、
各音声データの音声周波数を計算し、かつ計算した音声データに従って、各音声データを無音、人声、およびノイズに分類するように構成された、第2の処理ユニットと、
全ての音声データの、無音、人声、およびノイズの比率の統計を収集するように構成された、第3の処理ユニットと、
人声と識別された音声データについては、人声の音声データのメル周波数ケプストラム係数を計算し、人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集するように構成された、第4の処理ユニットとを具体的に備える。
具体的には、本発明のこの実施形態で提供される上述の装置において、第2の処理ユニットは、各音声データの音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを判定し、
音声データの音声周波数が、20Hz〜20000Hzの範囲内にあると決定されたときは、音声データの基本周波数を計算し、基本周波数が、85Hz〜255Hzの範囲内にあると判定されたときは、音声データは人声であるとみなし、基本周波数が、85Hz〜255Hzの範囲外にあると判定されたときは、音声データはノイズであるとみなし、音声データの音声周波数が、20Hz〜20000Hzの範囲外にあると判定されたときは、音声データは無音であるとみなすように具体的に構成される。
本発明のこの実施形態で提供される、上述の音量調整装置によれば、ユーザ端末の現在のシーンモードが決定されると、音声信号の組成情報の基準が追加されるため、対応する現在のシーンが実際のシーンに近くなり、ユーザが置かれているシーンにより正確に整合することができ、これによって、再生音量の調整がシーンに合致しないという、シーンの判定の誤りによって引き起こされる事態の発生を大幅に削減し、ユーザの使用感を向上させる。
同一の発明の概念に基づき、本発明の実施形態は、スピーカ、受話器、および本発明の実施形態で提供される上述の音量調整装置を備える端末をさらに提供し、音量調整装置は、スピーカの音量、および受話器の音量を調整するように構成される。具体的には、この端末は、携帯電話、トランシーバ、タブレットコンピュータ、テレビ、ディスプレイ、またはノートパソコン等の、再生機能を有する任意の製品または構成部品であってもよい。端末での実施については、再生音量を制御する装置の上述の実施形態を参照されたく、重複する部分はここでは再度説明されない。図7に示すような、別の端末を提供する本発明の実施形態は、
ユーザ端末100の周囲の音声信号を収集するように構成された音声センサ150、呼び出し信号がユーザ端末100に到達したときに、かかってきた電話の着信音(ring tone)を発するように構成されたスピーカ130を備え、スピーカ130は、音楽等の音声データを再生するようにさらに構成されてもよく、
受話器170は、ユーザがユーザ端末100を用いて相手方と通話しているときに、相手方の声を再生するように構成されることが理解されよう。
端末100は、ディスプレイユニット140をさらに備え、ディスプレイユニット140は、ユーザが入力した情報、またはユーザに提供された情報、および端末100の様々なメニューインターフェースを表示するように構成することができる。ディスプレイユニット140は、ディスプレイパネル141を含むことができ、必要に応じて、ディスプレイパネル141は、LCD(Liquid Crystal Display、液晶ディスプレイ)、OLED(Organic Light−Emitting Diode、有機発光ダイオード)等であってもよい。
いくつかの実施方法では、メモリ120は、実行可能なモジュールまたはデータ構造、あるいはそのサブセットまたはその拡張セットを記憶する。
本発明のこの実施形態では、メモリ120に記憶されたプログラムまたは命令を呼び出すことにより、プロセッサ160は、音声信号の組成情報を得るために、音声センサ150によって収集された音声信号の分析を実行するように構成され、組成情報は、音声信号に含まれる音声タイプ、および様々なタイプの音声の比率を含み、音声タイプは、無音、人声、およびノイズを含み、音声信号の組成情報に従ってユーザ端末の現在のシーンモードを決定し、決定したシーンモードに従って、スピーカ130の音量および/または受話器170の音量を調整する。
必要に応じて、一実施形態として、音声センサ150は、呼び出し信号の接続が検出された後に、マイク110の音量を取得する。
プロセッサ160は、
取得したマイク音量が予め記憶した基準音量よりも大きいときは、ユーザ端末の受話音量を大きくし、取得したマイク音量が予め記憶した基準音量よりも小さいときは、ユーザ端末の受話音量を小さくするようにさらに構成される。
音声センサ150は、音声信号を収集するように構成されたユニットであり、音声センサ150は、具体的にはマイク110に統合されてもよく、または本発明で限定されない、別の構成部品であってもよいことに留意されたい。
また、端末装置100は、図1〜図5の方法および実施形態をさらに実行することができ、詳細は、本発明のこの実施形態において、本明細書で再度説明はされない。
本発明のこの実施形態で提供される、上述のユーザ端末によれば、ユーザ端末の現在のシーンモードが決定されると、音声信号の組成情報の基準が追加されるため、対応する現在のシーンが実際のシーンに近くなり、ユーザが置かれているシーンにより正確に整合することができ、これによって、再生音量の調整がシーンに合致しないという、シーンの判定の誤りによって引き起こされる事態の発生を大幅に削減し、ユーザの使用感を向上させる。
実施方法の上述の説明に基づき、本発明の実施形態は、必要とされる一般的なハードウェアプラットフォームに加えて、ハードウェアによって、またはソフトウェアによって実施できることが、当業者は明確に理解することができよう。このような理解に基づき、本発明の実施形態における技術的解決策は、ソフトウェア製品の形態で実施することができる。ソフトウェア製品は、不揮発性記憶媒体(CD−ROM、USBフラッシュドライブ、リムーバブルハードディスク等であってもよい)に記憶でき、本発明の実施形態で説明された方法のいくつかの方法を実行するように、コンピュータ機器(例えばパーソナルコンピュータ、サーバ、またはネットワーク装置)に指示するいくつかの命令を含んでいる。
添付の図面は、例示的な実施形態の単なる概略図であり、添付の図面のモジュールまたは工程は、本発明の実施に必ずしも必要でないことを当業者は理解するであろう。
本実施形態で提供される装置のモジュールは、実施形態の説明に従って装置に分散して配置されてもよく、または本実施形態で説明されたものとは異なる1つ以上の装置に配置されてもよいことを、当業者は理解するであろう。上述の実施形態のモジュールは、1つのモジュールに組み合わせられ、あるいは複数のサブモジュールに分けられてもよい。
本発明の上述の実施形態の連続番号は、単に例示目的であって、実施形態の優先度を示すことは意図されていない。
当業者であれば、本発明の精神および範囲から逸脱することなく、本発明に様々な修正および変形を加えられることは言うまでもない。本発明は、このような修正および変形が、以下の特許請求の範囲、およびその等価の技術によって定義される保護の範囲内であれば、これらを網羅することが意図されている。
100 ユーザ端末
110 マイク
120 メモリ
130 スピーカ
140 ディスプレイユニット
141 ディスプレイパネル
150 音声センサ
160 プロセッサ
170 受話器
601 収集ユニット
602 分析ユニット
603 シーンモード決定ユニット
604 音量調整ユニット
605 取得ユニット
606 比較ユニット
上述のステップS401〜S404の実行は、予め記憶した基準音量に基づいて実施される。基準音量は、一般に固定値であり、かつ現在の通話の前の通話の過程で決定され記憶される。無論、基準音量は、図5に示すように更新することもでき、これは、次のステップを用いて実施することができる。
具体的には、本発明のこの実施形態で提供される上述の装置において、分析ユニット602は、
収集した音声信号を複数の音声データに分割するように構成された、第1の処理ユニットと、
各音声データの音声周波数を計算し、かつ計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類するように構成された、第2の処理ユニットと、
全ての音声データの、無音、人声、およびノイズの比率の統計を収集するように構成された、第3の処理ユニットと、
人声と識別された音声データについては、人声の音声データのメル周波数ケプストラム係数を計算し、人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集するように構成された、第4の処理ユニットとを具体的に備える。

Claims (17)

  1. ユーザ端末の音量を調整する方法であって、
    前記ユーザ端末の周囲の音声信号を収集するステップと、
    前記音声信号の組成情報を取得するために、前記収集した音声信号の分析を実行するステップであって、前記組成情報は、前記音声信号に含まれる音声タイプ、および前記様々なタイプの音声の比率を含み、前記音声タイプは、無音、人声、およびノイズを含む、分析を実行するステップと、
    前記音声信号の前記組成情報に従って、前記ユーザ端末の現在のシーンモードを決定するステップと、
    前記決定したシーンモードに従って、前記ユーザ端末の前記音量を調整するステップとを含む、方法。
  2. 前記ユーザ端末の周囲の音声信号を収集する前記ステップが、具体的に、
    呼び出し信号の到達が検出されたときに、前記ユーザ端末が置かれている現在の環境の音声信号を収集すること、または、
    前記ユーザ端末が置かれている現在の環境の音声信号を定期的に収集することを含む、請求項1に記載の方法。
  3. 前記決定したシーンモードに従って、前記ユーザ端末の前記音量を調整する、前記ステップが、
    前記決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って、音量調整係数を決定することと、前記音量調整係数に従って、前記ユーザ端末の前記音量を調整することとを含む、請求項1または2に記載の方法。
  4. 前記ユーザ端末の前記音量が、着信音量および受話音量を含み、前記音量調整係数が、着信音量調整係数、および受話音量調整係数を含み、
    前記音量調整係数に従って、前記ユーザ端末の前記音量を調整する前記ステップが、
    前記着信音量調整係数に従って、前記ユーザ端末の前記着信音量を調整することと、前記受話音量調整係数に従って、前記ユーザ端末の前記受話音量を調整することとを含む、請求項3に記載の方法。
  5. 前記呼び出し信号の接続が検出された後に、
    前記ユーザ端末のマイク音量をリアルタイムで取得するステップと、
    前記取得したマイク音量が、予め記憶した基準音量よりも大きいときに、前記ユーザ端末の前記受話音量を大きくするステップと、
    前記取得したマイク音量が、前記予め記憶した基準音量よりも小さいときに、前記ユーザ端末の前記受話音量を小さくするステップとをさらに含む、請求項1〜4のいずれか一項に記載の方法。
  6. 前記呼び出し信号の接続が検出された後に、
    前記ユーザ端末の周囲の前記音声信号を定期的に収集するステップ、および前記音声信号の前記組成情報を取得するために、前記収集した音声信号の分析を実行するステップと、
    前記音声信号の前記組成情報に従って、前記音声信号が人声を含むかどうか、および1人のみの声を含むかどうかを判定するステップであって、前記音声信号が、人声を含み、かつ1人のみの声を含む場合は、前記音声信号の音量を計算し、前記音声信号の前記計算した音量と前記予め記憶した基準音量との平均値を取り、前記平均値を新たな基準音量として記憶する、判定するステップとをさらに含む、請求項5に記載の方法。
  7. 前記音声信号の組成情報を取得するために、前記収集した音声信号の分析を実行する、前記ステップが、具体的に、
    前記収集した音声信号を複数の音声データに分割することと、
    前記各音声データの音声周波数を計算すること、ならびに前記計算した音声周波数に従って、前記各音声データを無音、人声、およびノイズに分類することと、
    全ての音声データの無音、人声、およびノイズの比率の統計を収集することであって、
    人声と識別された音声データについては、人声の音声データのメル周波数ケプストラム係数を計算し、前記人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計を収集することとを含む、請求項1〜6のいずれか一項に記載の方法。
  8. 前記計算した音声周波数に従って、各音声データを無音、人声、およびノイズに分類する、前記ステップが、具体的に、
    前記各音声データの前記音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを決定することであって、
    前記音声データの前記音声周波数が、20Hz〜20000Hzの前記範囲内にあると決定されたときは、前記音声データの基本周波数を計算し、
    前記基本周波数が、85Hz〜255Hzの範囲内にあると決定されたときは、前記音声データは人声であるとみなし、
    前記基本周波数が、85Hz〜255Hzの前記範囲外にあると決定されたときは、前記音声データはノイズであるとみなし、
    前記音声データの前記音声周波数が、20Hz〜20000Hzの前記範囲外にあると決定されたときは、前記音声データは無音であるとみなす、決定することを含む、請求項7に記載の方法。
  9. ユーザ端末の音量を調整する装置であって、
    前記ユーザ端末の周囲の音声信号を収集するように構成された、収集ユニットと、
    前記音声信号の組成情報を取得するために、前記収集した音声信号の分析を実行するように構成された分析ユニットであって、前記組成情報は、前記音声信号に含まれる音声タイプ、および前記様々なタイプの音声の比率を含み、前記音声タイプは、無音、人声、およびノイズを含む、分析ユニットと、
    前記音声信号の前記組成情報に従って、前記ユーザ端末の現在のシーンモードを決定するように構成された、シーンモード決定ユニットと、
    前記決定したシーンモードに従って、前記ユーザ端末の前記音量を調整するように構成された、音量調整ユニットとを備える、装置。
  10. 前記収集ユニットが、具体的に、
    呼び出し信号の到達が検出されたときに、前記ユーザ端末が置かれている現在の環境の音声信号を収集するように、または、
    前記ユーザ端末が置かれている現在の環境の音声信号を定期的に収集するように構成される、請求項9に記載の装置。
  11. 前記音量調整ユニットが、具体的に、前記決定したシーンモード、ならびにシーンモードと音量調整係数との間の予め記憶した対応関係に従って、音量調整係数を決定し、前記音量調整係数に従って、前記ユーザ端末の前記音量を調整するように構成される、請求項9または10に記載の装置。
  12. 前記ユーザ端末の前記音量が、着信音量および受話音量を含み、前記音量調整ユニットの前記音量調整係数が、具体的に、着信音量調整係数、および受話音量調整係数を含み、
    前記音量調整ユニットが、具体的に、前記着信音量調整係数に従って、前記ユーザ端末の前記着信音量を調整し、前記受話音量調整係数に従って、前記ユーザ端末の前記受話音量を調整する、音量調整係数、および受話音量調整係数を含む、請求項11に記載の装置。
  13. 前記呼び出し信号の接続が検出された後に、前記ユーザ端末のマイク音量をリアルタイムで取得するように構成された取得ユニットと、
    前記取得したマイク音量の大きさと、予め記憶した基準音量とを比較するように構成された比較ユニットであって、
    前記音量調整ユニットが、前記取得したマイク音量が、前記予め記憶した基準音量よりも大きいときに、前記ユーザ端末の前記受話音量を大きくし、前記取得したマイク音量が、前記予め記憶した基準音量よりも小さいときに、前記ユーザ端末の前記受話音量を小さくするようにさらに構成された、比較ユニットをさらに含む、請求項9〜12のいずれか一項に記載の装置。
  14. 前記収集ユニットが、具体的に、前記呼び出し信号の接続が検出された後に、前記ユーザ端末の周囲の前記音声信号を定期的に収集するように構成され、
    前記分析ユニットが、前記音声信号の前記組成情報を取得するために、前記呼び出し信号の接続が検出された後に、前記収集モジュールによって定期的に収集された前記音声信号の分析を実行するように、かつ前記音声信号の前記組成情報に従って、前記音声信号が、人声を含むかどうか、ならびに1人のみの声を含むかどうかを決定するようにさらに構成され、前記音声信号が、人声を含み、かつ1人のみの声を含む場合は、前記音声信号の音量を計算し、前記前記音声信号の前記計算した音量と、前記予め記憶した基準音量との平均値を取り、前記平均値を新たな基準音量として記憶する、請求項13に記載の装置。
  15. 前記分析ユニットが、具体的に、
    前記収集した音声信号を複数の音声データに分割するように構成された、第1の処理ユニットと、
    前記各音声データの音声周波数を計算し、かつ前記計算した音声周波数に従って、前記各音声データを無音、人声、およびノイズに分類するように構成された、第2の処理ユニットと、
    全ての音声データの、無音、人声、およびノイズの比率の統計を収集するように構成された、第3の処理ユニットと、
    人声と識別された音声データについては、メル周波数ケプストラム係数を計算し、前記人声に含まれる人数についての情報を判定するために、メル周波数ケプストラム係数が同一の音声データを1人の声として統計値を収集する、第4の処理ユニットとを備える、請求項9〜14のいずれか一項に記載の装置。
  16. 前記第2の処理ユニットが、具体的に、
    前記各音声データの前記音声周波数が、20Hz〜20000Hzの範囲内にあるかどうかを判定し、
    前記音声データの前記音声周波数が、20Hz〜20000Hzの前記範囲内にあると判定されたときは、前記音声データの基本周波数を計算し、
    前記基本周波数が、85Hz〜255Hzの範囲内にあると判定されたときは、前記音声データは人声であるとみなし、
    前記基本周波数が、85Hz〜255Hzの前記範囲外にあると判定されたときは、前記音声データはノイズであるとみなし、
    前記音声データの前記音声周波数が、20Hz〜20000Hzの前記範囲外にあると判定されたときは、前記音声データは無音であるとみなすように構成される、請求項15に記載の装置。
  17. スピーカおよび受話器を備え、請求項9〜16のいずれか一項に記載の前記音量調整装置をさらに備える、端末。
JP2016563102A 2014-04-16 2015-02-12 ユーザ端末ならびに端末の音量を調整する方法および装置 Active JP6381153B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410152521.9 2014-04-16
CN201410152521.9A CN103945062B (zh) 2014-04-16 2014-04-16 一种用户终端的音量调节方法、装置及终端
PCT/CN2015/072906 WO2015158182A1 (zh) 2014-04-16 2015-02-12 一种用户终端的音量调节方法、装置及终端

Publications (2)

Publication Number Publication Date
JP2017514392A true JP2017514392A (ja) 2017-06-01
JP6381153B2 JP6381153B2 (ja) 2018-08-29

Family

ID=51192536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016563102A Active JP6381153B2 (ja) 2014-04-16 2015-02-12 ユーザ端末ならびに端末の音量を調整する方法および装置

Country Status (7)

Country Link
US (6) US9866707B2 (ja)
EP (2) EP3611910B1 (ja)
JP (1) JP6381153B2 (ja)
KR (1) KR101884709B1 (ja)
CN (1) CN103945062B (ja)
TW (1) TWI570624B (ja)
WO (1) WO2015158182A1 (ja)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103945062B (zh) 2014-04-16 2017-01-18 华为技术有限公司 一种用户终端的音量调节方法、装置及终端
CN105406828A (zh) * 2014-08-22 2016-03-16 小米科技有限责任公司 音响调节方法及装置
US9508344B2 (en) * 2014-10-15 2016-11-29 Delphi Technologies, Inc. Automatic volume control based on speech recognition
CN104657072B (zh) * 2015-01-15 2018-06-12 小米科技有限责任公司 一种触发执行操作指令的方法和装置
CN105895092B (zh) * 2015-01-26 2020-12-18 阿里巴巴集团控股有限公司 一种处理环境声音的方法和装置
US9678708B2 (en) 2015-04-24 2017-06-13 Sonos, Inc. Volume limit
CN104954555B (zh) 2015-05-18 2018-10-16 百度在线网络技术(北京)有限公司 一种音量调节方法及系统
CN106469040B (zh) * 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
CN106486132A (zh) * 2015-08-26 2017-03-08 天津三星电子有限公司 一种调节显示终端音量的方法及其显示终端
CN105306673A (zh) * 2015-09-07 2016-02-03 惠州Tcl移动通信有限公司 移动终端及其自动调整情景模式的方法
CN105260642A (zh) * 2015-10-30 2016-01-20 宁波萨瑞通讯有限公司 一种隐私保护方法及移动终端
KR20170051856A (ko) * 2015-11-02 2017-05-12 주식회사 아이티매직 사운드 신호에서 진단 신호를 추출하는 방법 및 진단 장치
CN105677289A (zh) * 2015-12-31 2016-06-15 联想(北京)有限公司 一种信息处理方法及电子设备
CN106060236A (zh) * 2016-05-05 2016-10-26 广东小天才科技有限公司 一种提高通话质量的方法及系统
CN106126177A (zh) * 2016-06-21 2016-11-16 中国农业大学 一种目标声音的音量调节系统及方法
CN106231123A (zh) * 2016-09-09 2016-12-14 珠海市魅族科技有限公司 语音通话方法及装置
CN106535042B (zh) * 2016-10-27 2019-05-07 广州视源电子科技股份有限公司 车载扬声器的音量控制方法、装置及系统
CN106782625B (zh) * 2016-11-29 2019-07-02 北京小米移动软件有限公司 音频处理方法和装置
CN106487410B (zh) * 2016-12-13 2019-06-04 北京奇虎科技有限公司 一种消息免打扰的权限控制方法及装置
CN106598541A (zh) * 2016-12-21 2017-04-26 深圳Tcl数字技术有限公司 声音调节方法和系统
US10469800B2 (en) * 2017-01-26 2019-11-05 Antimatter Research, Inc. Always-on telepresence device
CN106992012A (zh) * 2017-03-24 2017-07-28 联想(北京)有限公司 语音处理方法及电子设备
US10558421B2 (en) * 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
CN107343095B (zh) * 2017-06-30 2020-10-09 Oppo广东移动通信有限公司 通话音量控制方法、装置、存储介质及终端
CN107690025B (zh) * 2017-07-05 2020-11-10 山东兴创信息科技有限公司 一种参数调节方法及终端
CN107277260A (zh) * 2017-07-07 2017-10-20 珠海格力电器股份有限公司 一种情景模式调整方法、装置和移动终端
CN107295196A (zh) * 2017-07-24 2017-10-24 上海斐讯数据通信技术有限公司 一种智能调整移动终端输出音量的方法及系统
CN107562403A (zh) * 2017-08-09 2018-01-09 深圳市汉普电子技术开发有限公司 一种音量调节方法、智能设备及存储介质
CN107371102B (zh) * 2017-08-18 2020-06-26 Oppo广东移动通信有限公司 音频播放音量的控制方法、装置及存储介质和移动终端
CN107483731A (zh) * 2017-08-18 2017-12-15 广东欧珀移动通信有限公司 音频播放音量的控制方法、装置及存储介质和移动终端
CN107484000A (zh) * 2017-09-29 2017-12-15 北京奇艺世纪科技有限公司 一种终端的音量调节方法、装置及语音遥控器
CN109660653A (zh) * 2017-10-11 2019-04-19 成都鼎桥通信技术有限公司 音量控制方法和装置
KR101986905B1 (ko) 2017-10-31 2019-06-07 전자부품연구원 신호 분석 및 딥 러닝 기반의 오디오 음량 제어 방법 및 시스템
WO2019100371A1 (zh) * 2017-11-27 2019-05-31 深圳传音通讯有限公司 一种通话音量调节方法和装置
CN110049403A (zh) * 2018-01-17 2019-07-23 北京小鸟听听科技有限公司 一种基于场景识别的自适应音频控制装置和方法
US10979814B2 (en) 2018-01-17 2021-04-13 Beijing Xiaoniao Tingling Technology Co., LTD Adaptive audio control device and method based on scenario identification
CN108521521B (zh) * 2018-04-19 2021-04-02 Oppo广东移动通信有限公司 音量调节方法、移动终端及计算机可读存储介质
CN110753288B (zh) * 2018-07-23 2021-08-17 中国电信股份有限公司 音箱音量自动调节的方法和系统
CN109034897A (zh) * 2018-07-24 2018-12-18 王耀资 一种网吧运营管理方法及装置
CN108920129A (zh) 2018-07-27 2018-11-30 联想(北京)有限公司 信息处理方法和信息处理系统
CN109348047A (zh) * 2018-09-28 2019-02-15 东莞市欧珀精密电子有限公司 响铃控制方法及相关装置
CN112151025A (zh) * 2019-06-28 2020-12-29 百度在线网络技术(北京)有限公司 音量调节方法、装置、设备和存储介质
CN110290468B (zh) * 2019-07-04 2020-09-22 英华达(上海)科技有限公司 虚拟隔音通信方法、装置、系统、电子设备、存储介质
CN110677717B (zh) * 2019-09-18 2021-08-31 深圳创维-Rgb电子有限公司 一种音频补偿方法、智能电视及存储介质
CN110995925A (zh) * 2019-11-27 2020-04-10 广东以诺通讯有限公司 一种调节音量大小的方法、系统、移动终端及存储介质
CN111081275B (zh) * 2019-12-20 2023-05-26 惠州Tcl移动通信有限公司 基于声音分析的终端处理方法、装置、存储介质及终端
CN111897510A (zh) * 2020-07-30 2020-11-06 成都新潮传媒集团有限公司 多媒体设备的音量调节方法、装置及计算机可读存储介质
CN112291672B (zh) * 2020-10-30 2023-09-01 维沃移动通信有限公司 扬声器的控制方法、控制装置以及电子设备
CN114827337B (zh) * 2021-01-19 2023-08-18 博泰车联网(南京)有限公司 音量调整的方法、装置、设备及存储介质
CN113038256A (zh) * 2021-02-08 2021-06-25 深圳创维-Rgb电子有限公司 电子设备的音频输出方法、智能电视及可读存储介质
TWI792205B (zh) 2021-03-02 2023-02-11 瑞昱半導體股份有限公司 基於超聲波的音訊播放方法及基於超聲波的電子裝置
CN113055784A (zh) * 2021-03-15 2021-06-29 北京达佳互联信息技术有限公司 音量调节方法及装置
CN115462098A (zh) * 2021-03-22 2022-12-09 北京小米移动软件有限公司 控制指示方法和装置、行为控制方法和装置
CN113380244A (zh) * 2021-05-28 2021-09-10 幻境虚拟现实(广州)智能科技研究院有限公司 一种设备播放音量的智能调节方法和系统
CN113709625B (zh) * 2021-06-04 2023-12-29 北京工业大学 自适应的音量调节方法
CN113345447B (zh) * 2021-08-09 2021-10-29 北京百瑞互联技术有限公司 防止广告干扰的音频编解码方法、系统、发射器及接收器
CN113889154B (zh) * 2021-09-30 2024-03-19 广州维梦科技有限公司 声音录制方法、终端、存储介质
CN114071220B (zh) * 2021-11-04 2024-01-19 深圳Tcl新技术有限公司 音效调节方法、装置、存储介质及电子设备
CN115495040A (zh) * 2022-10-09 2022-12-20 湖南捷力泰科技有限公司 基于场景类型的声音控制方法及相关装置
CN117061927B (zh) * 2023-08-30 2024-03-22 江西瑞声电子有限公司 一种耳机播放的控制方法、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10136058A (ja) * 1996-10-25 1998-05-22 Oki Electric Ind Co Ltd 音響調整装置
JP2001223767A (ja) * 2000-02-07 2001-08-17 Hitachi Ltd 携帯電話装置
JP2003023474A (ja) * 2001-07-06 2003-01-24 Nec Corp 移動体端末及びその着信鳴動方法
US20050282590A1 (en) * 2004-06-17 2005-12-22 Ixi Mobile (R&D) Ltd. Volume control system and method for a mobile communication device
JP2010258687A (ja) * 2009-04-23 2010-11-11 Fujitsu Ltd 無線通信装置
US20130143543A1 (en) * 2011-12-02 2013-06-06 Samsung Electronics Co., Ltd. Method and device for automatically switching a profile of a mobile phone

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990026882A (ko) 1997-09-26 1999-04-15 김덕중 음량 제어 장치
ES2286017T3 (es) * 1999-03-30 2007-12-01 Qualcomm Incorporated Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil.
DE20000409U1 (de) * 2000-01-12 2000-04-06 Hocker Thomas Telefon mit automatischer Klingellautstärkenanpassung
CN1507293A (zh) * 2002-12-09 2004-06-23 Ӣҵ�O�ţ��Ϻ������Ӽ������޹�˾ 智能化调节移动通讯装置耳机音量的方法
US20040127197A1 (en) * 2002-12-30 2004-07-01 Roskind James A. Automatically changing a mobile device configuration
US20050026568A1 (en) 2003-08-01 2005-02-03 Hawker Larry E. System and method of acoustically safe automatic handsfree volume adjustment
US7469155B2 (en) * 2004-11-29 2008-12-23 Cisco Technology, Inc. Handheld communications device with automatic alert mode selection
CN1783892A (zh) * 2004-12-02 2006-06-07 华为技术有限公司 移动终端中自动切换情景模式的实现方法及其装置
TWI263435B (en) 2005-07-29 2006-10-01 Inventec Appliances Corp Communication apparatus with automatic ring adjustment
CN101304455A (zh) * 2008-06-26 2008-11-12 中兴通讯股份有限公司 一种移动终端声环境自适应调整装置和方法
CN101771390B (zh) * 2008-12-30 2013-03-06 英业达股份有限公司 声音输出输入系统及其音量输出调整方法
TWI384845B (zh) 2008-12-31 2013-02-01 Inventec Appliances Corp 可攜式通訊裝置及其來電告知控制方法
CN103139351B (zh) * 2011-11-24 2016-10-05 联想(北京)有限公司 音量控制方法、装置及通信终端
KR20130062228A (ko) 2011-12-02 2013-06-12 삼성전자주식회사 휴대단말기의 프로파일 자동 전환 방법 및 장치
CN103187081A (zh) * 2011-12-28 2013-07-03 鸿富锦精密工业(深圳)有限公司 音量调节方法及系统
CN103259907A (zh) 2012-02-15 2013-08-21 深圳富泰宏精密工业有限公司 情景模式切换系统及方法
CN103002106B (zh) * 2012-10-16 2016-12-21 东莞宇龙通信科技有限公司 移动终端和移动终端音量的调节方法
CN103618835A (zh) * 2013-12-13 2014-03-05 惠州Tcl移动通信有限公司 一种根据周围噪音大小自动切换情景模式的方法及系统
CN103945062B (zh) * 2014-04-16 2017-01-18 华为技术有限公司 一种用户终端的音量调节方法、装置及终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10136058A (ja) * 1996-10-25 1998-05-22 Oki Electric Ind Co Ltd 音響調整装置
JP2001223767A (ja) * 2000-02-07 2001-08-17 Hitachi Ltd 携帯電話装置
JP2003023474A (ja) * 2001-07-06 2003-01-24 Nec Corp 移動体端末及びその着信鳴動方法
US20050282590A1 (en) * 2004-06-17 2005-12-22 Ixi Mobile (R&D) Ltd. Volume control system and method for a mobile communication device
JP2010258687A (ja) * 2009-04-23 2010-11-11 Fujitsu Ltd 無線通信装置
US20130143543A1 (en) * 2011-12-02 2013-06-06 Samsung Electronics Co., Ltd. Method and device for automatically switching a profile of a mobile phone

Also Published As

Publication number Publication date
US10200545B2 (en) 2019-02-05
US20210274049A1 (en) 2021-09-02
US11483434B2 (en) 2022-10-25
TWI570624B (zh) 2017-02-11
EP3611910B1 (en) 2022-11-30
CN103945062B (zh) 2017-01-18
EP3133799B1 (en) 2019-07-24
TW201541344A (zh) 2015-11-01
US20200145539A1 (en) 2020-05-07
EP3133799A4 (en) 2017-05-10
WO2015158182A1 (zh) 2015-10-22
US11044369B2 (en) 2021-06-22
US10554826B2 (en) 2020-02-04
CN103945062A (zh) 2014-07-23
US20190132453A1 (en) 2019-05-02
US10516788B2 (en) 2019-12-24
US20170034362A1 (en) 2017-02-02
US20190149668A1 (en) 2019-05-16
KR101884709B1 (ko) 2018-08-02
US9866707B2 (en) 2018-01-09
KR20160145730A (ko) 2016-12-20
EP3611910A1 (en) 2020-02-19
EP3133799A1 (en) 2017-02-22
US20180084116A1 (en) 2018-03-22
JP6381153B2 (ja) 2018-08-29

Similar Documents

Publication Publication Date Title
JP6381153B2 (ja) ユーザ端末ならびに端末の音量を調整する方法および装置
JP6489563B2 (ja) 音量調節方法、システム、デバイス及びプログラム
KR101626438B1 (ko) 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템
US10978085B2 (en) Doppler microphone processing for conference calls
US10121491B2 (en) Intelligent volume control interface
US8259954B2 (en) Enhancing comprehension of phone conversation while in a noisy environment
US11432065B2 (en) Automatic keyword pass-through system
US20130079908A1 (en) Electronic device with automatic pause function and method thereof
WO2015030642A1 (en) Volume reduction for an electronic device
CN111696566B (zh) 语音处理方法、装置和介质
CN110827851B (zh) 调节音量的方法、电子设备及计算机存储介质
CN111694539A (zh) 在听筒和扬声器之间切换的方法、装置及介质
CN104754120B (zh) 一种终端
US20220256278A1 (en) Automatic keyword pass-through system
CN111696564A (zh) 语音处理方法、装置和介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180730

R150 Certificate of patent or registration of utility model

Ref document number: 6381153

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250