JP6948275B2 - 通話装置、及び通話装置の制御方法 - Google Patents
通話装置、及び通話装置の制御方法 Download PDFInfo
- Publication number
- JP6948275B2 JP6948275B2 JP2018029387A JP2018029387A JP6948275B2 JP 6948275 B2 JP6948275 B2 JP 6948275B2 JP 2018029387 A JP2018029387 A JP 2018029387A JP 2018029387 A JP2018029387 A JP 2018029387A JP 6948275 B2 JP6948275 B2 JP 6948275B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- voice
- language
- determination
- mother tongue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephone Function (AREA)
Description
そこで、本発明は、手動スイッチ等を使用しなくても母語発話者と非母語発話者とが通話し易くすることを目的とする。
また、上記構成において、前記第二の発話者であると判定された前記他の話者の電話番号を記憶する記憶部を有し、通話開始時に、前記他の話者の電話番号が前記記憶部に記憶済みの場合、前記判定部が判定を行わずに、前記音声処理部が、前記他の話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行ってもよい。
(第一実施形態)
図1は本発明の第一実施形態に係る通話装置21を含む通話システム10の構成を示した図である。
通話装置21は、自動車等の車両に配置され、車両の乗員であるユーザー(所定の話者)がいわゆるハンズフリー通話を行うために使用するハンズフリー通話装置である。通話装置21は、無線通信機能を備える機器と無線通信するための通信モジュール22を備える。通話装置21は、この通信モジュール22により、ユーザーが所有する携帯電話23(電話端末とも称する)と無線通信することによって、電話網を介して他の電話端末25との間で通信する。これによって、通話装置21と他の電話端末25との間で通話の音声信号が入出力される。
携帯電話23は、移動通信網(図示略)を介して他の携帯電話や固定電話と通信する機能を有し、内蔵スピーカー、内蔵マイク、電話通信のための通信部に加え、通話装置21と近距離無線通信を行うための通信モジュールを備えている。なお、携帯電話23と通話装置21とは無線で接続される場合に限らず、有線で接続される構成でもよい。
マイク33は、通話装置21のユーザーである話者(以下、第一話者Xと言う)の音声(ハンズフリー通話の際の送話音声に相当)を集音する集音部として機能する。スピーカー35は、車両内の第一話者Xに向けて、他の電話端末25のユーザーである話者(以下、第二話者Yと言う)の音声を放音する放音部として機能する。なお、マイク33及びスピーカー35は、通話装置専用のマイク及びスピーカーでもよいし、車載装置27等が音声の入出力に使用するマイク及びスピーカーを兼用したものでもよい。
また、図2は成人の場合の一例を示している。この図に示すように、日本語を母語とする者は相対的に第0フォルマント周波数が低い範囲となり、英語やイタリア語を母語とする者は相対的に第0フォルマント周波数が高い範囲となる傾向がある。
なお、記憶部32には、図2に記載の傾向に基づき、複数種類の言語と、各言語を母語とする者のフォルマント周波数とを関係付けた言語別周波数情報32Aが記憶され、この言語別周波数情報32Aを利用することによって、第0フォルマント周波数から母語を容易に特定可能である。
一方、車載装置27の設定言語27Aは、必ずしも母語に設定されてはいない。なぜなら、実際の道路標識が母語以外の場合、車載装置27の設定言語27Aを母語に設定していると、実際の道路標識の文字を車載装置27側で正確に認識できず、ナビゲーション処理や地図等の表示に不備を招くおそれがあるからである。このため、車載装置27の設定言語27Aは、実際の道路標識の言語に設定されていることが多い。
そこで、本構成では、母語判定精度を更に向上させるために、第一演算部43が、制御部31の制御の下、少なくとも携帯電話23の設定言語23Aに基づいて、携帯電話23のユーザーである第一話者Xの母語を特定し、特定した結果に基づき第一話者Xが母語発話者か語学学習者か否かを判定する第二の判定処理を行う。
そこで、本構成では、母語判定精度を更に向上させるために、第一演算部43が、制御部31の制御の下、第一話者Xの音声の無音部分の情報を取得し、取得した情報に基づき第一話者Xが母語発話者か語学学習者か否かを判定する第三の判定処理を行う。
また、制御部31は、第二話者Yが語学学習者の場合、マイク33から入力した音声信号(送話音声の信号に相当)に対し、語学学習者向けの所定の音声処理を行う。具体的には、制御部31は、所定の音声処理として、音声をスロー再生させる処理(再生速度を遅くする処理に相当)を行う。つまり、マイク33と第一演算部43との間には、サンプリング・レート・コンバーター(以下、SRC47)が配置され、制御部31は、マイク33から入力した音声信号に対するサンプリング周波数をn倍にし、且つ、サンプリング後のデータを適宜に間引くことによって、スロー再生される音声信号に変換する。
このようにして、SRC47は、スロー再生させる音声処理を行う第一スロー再生部として機能する。この場合、再生速度を段階的に遅くすることによって、聞く側(第二話者Y側)の違和感を抑えることが好ましい。なお、スロー再生させる構成はSRC47に限定されない。また、語学学習者向けの所定の音声処理は、スロー再生に限定しなくてもよく、語学学習者が聞き取り易くなる音声処理(語学学習者向けの音声処理に相当)を広く適用可能である。
第二演算部53は、制御部31の制御の下、第二話者Yの音声の第0フォルマント周波数から、第二話者Yの母語を判定し、判定結果に基づき第二話者Yが母語発話者(第一の発話者に相当)か語学学習者(第二の発話者に相当)か否かを判定する第一の判定処理を行う。
また、第二演算部53は、母語判定精度を更に向上させるために、制御部31の制御の下、第二話者Yの音声の無音部分の情報を取得し、取得した情報に基づき第二話者Yが母語発話者か語学学習者か否かを判定する第三の判定処理を行う。
但し、通話装置21と他の電話端末25との間の通信によって、第二話者Yが使用する他の電話端末25の設定言語が判るようにした場合、通話装置21側(第二演算部53)にて、その設定言語に基づき第二話者Yが母語発話者か語学学習者か否かを判定する第二の判定処理を行ってもよい。
なお、上述した第二及び第三の判定処理は制御部31が行ってもよい。
つまり、通信モジュール22には、サンプリング・レート・コンバーター(以下、SRC57)が接続され、制御部31は、SRC57を利用して上述と同様にして、第二話者Yの音声信号を、スロー再生される音声信号に選択的に変換する。この場合も、スロー再生される音声信号は、再生速度を段階的に遅くすることによって、聞く側(第一話者X側)の違和感を抑えるものであることが好ましい。また、図1中、符号58はSRC57の出力側に配置されるローパルフィルタ(LPF)である。
なお、スロー再生させる構成はSRC57に限定されない。また、語学学習者向けの所定の音声処理は、スロー再生させる音声処理に限定されず、語学学習者向けの音声処理を広く適用可能である。
通話装置21は、第一検出部41によって、マイク33に発話音声が入力されたことを検出すると(ステップS1A)、第一演算部43によって、上述した第一の判定処理(ステップS2A)と、第二の判定処理(ステップS3A)と、第三の判定処理(ステップS4A)とを実行する。
第一の判定処理では、第一演算部43は、第一話者Xの音声の第0フォルマント周波数を特定した後、記憶部32に記憶される言語別周波数情報32Aを参照することによって、第一話者Xの母語を特定する。次いで、特定した母語から第一話者Xが母語発話者か語学学習者か否かを判定する。
また、母語発話者と語学学習者の通話が比較的多いことを踏まえて、第一話者Xの音声の無音部分の回数と、通信モジュール22を介して入力される第二話者Yの音声の無音部分の回数とを比較し、回数が多い方を語学学習者と判定する方法でもよい。
第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先順位が高い判定結果を優先する。本構成では、第一の判定結果を最優先とする。なお、第一の判定結果を取得できなかった場合(例えば、図2中の1kHz〜1.5kHzのような複数の母語に含まれる第0フォルマント周波数の場合も含む)、第二及び第三判定処理の判定結果を利用することで、1つの母語を特定し易くなる。なお、優先順位は変更してもよい。
一方、ステップS5Aの判定で第一話者Xが語学学習者であると判定した場合(ステップS5A;NO)、通話装置21は、SRC57を利用して、受話音声である第二話者Yの音声信号をスロー再生させる(ステップS6A、音声処理ステップに相当)。これにより、語学学習者と判定された第一話者Xには、第二話者Yの音声がゆっくり聞こえ、音声を聞き取り易くなる。
通話装置21は、第二検出部51によって、通信モジュール22を介して携帯電話23から受話音声(第二話者Yの音声)が入力されたことを検出すると(ステップS1B)、第二演算部53によって、上述した第一の判定処理(ステップS2B)と、第三の判定処理(ステップS4B)とを実行する。
この第一の判定処理では、第二演算部53は、第二話者Yの音声の第0フォルマント周波数を特定した後、記憶部32に記憶される言語別周波数情報32Aを参照することによって、第二話者Yの母語を特定する。次いで、特定した母語から第二話者Yが母語発話者か語学学習者か否かを判定する。なお、この第一の判定処理は、第二話者Yの音声を利用する点を除いて、第一演算部43によって実行される第一の判定処理と同様の処理である。
第一及び第三の判定処理の判定結果が異なる場合、予め定めた優先順位が高い判定結果を優先する。本構成では、第一の判定結果を最優先とする。なお、優先順位は変更してもよい。
一方、ステップS5Bの判定で第二話者Yが語学学習者であると判定した場合(ステップS5B;YES)、通話装置21は、SRC47を利用して、送話音声である第一話者Xの音声信号をスロー再生させる(ステップS6B、音声処理ステップに相当)。これにより、語学学習者と判定された第二話者Yには、第一話者Xの音声がゆっくり聞こえ、音声を聞き取り易くなる。なお、ステップS1B〜S5Bまでの処理は数秒程度の短時間で終了し、スロー再生は短時間で開始される。
また、図4に示すフローチャートにおいて、ステップS4Bの処理(第3の判定処理)を省略してもよい。
また、制御部31及びSRC57によって、判定部の判定結果に基づき、語学学習者であると判定された第一話者Xに向けて出力される音声信号(第二話者Yの音声)に対し、スロー再生処理(語学学習者向けの所定の音声処理に相当)を行う音声処理部が構成される。
これにより、手動スイッチ等を使用しなくても、第一話者Xが母語発話者か語学学習者か否かを自動的に特定し、第一話者Xが語学学習者であっても第二話者Yと通話し易くなる。
また、制御部31及びSRC47によって、判定部の判定結果に基づき、語学学習者であると判定された第二話者Yに向けて出力される音声信号(第一話者Xの音声)に対し、スロー再生処理(語学学習者向けの所定の音声処理に相当)を行う音声処理部が構成される。
これにより、手動スイッチ等を使用しなくても、第二話者Yが母語発話者か語学学習者か否かを自動的に特定し、第二話者Yが語学学習者であっても第一話者Xと通話し易くなる。
例えば、高齢者の場合、母語発話者であっても無音区間が多い場合があり、この場合は、第三の判定処理で語学学習者と判定される場合が生じる。また、個体差によって、母語発話者であっても、第一の判定処理等で語学学習者と判定される場合もある。いずれも判定基準を適宜に調整することによって、母語発話者又は語学学習者と判定される範囲を調整可能である。
すなわち、第一〜第三の判定処理において、母語発話者相当の第一の発話者か語学学習者相当の第二の発話者か否かを判定すればよい。
また、第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先度に従って第一の発話者か第二の発話者か否かを判定するので、これによっても判定精度を向上し易くなる。
マイク33及びスピーカー35が別体の場合は、通話装置21は、集音部として、マイク33からの音声を入力する音声入力部を備え、放音部として、スピーカー35に向けて音声を出力する音声出力部を備えればよい。
なお、第一話者X及び第二話者Yが第一の発話者か第二の発話者か否かを判定し、各話者X、Yが第二の発話者である場合に各話者が通話を聞き取り易くする場合を説明したが、これに限定されず、いずれか一方(例えば、第一話者X)だけについて、第一の発話者か第二の発話者か否かを判定し、第二の発話者である場合に、その一方の話者が通話を聞き取り易くするようにしてもよい。
図5は第二実施形態に係る通話装置21の動作を説明するフローチャートであり、車両外の話者(第二話者Y)に対する通話装置21の動作を示している。
第二実施形態では、通話装置21の記憶部32に、語学学習者と判定された通話相手(第二話者Y)の電話番号が記憶される点、及び、通話相手の電話番号が記憶部32に記憶される場合は、判定処理を行うことなく、ステップS6Aの処理に移行する点が第一実施形態と異なる。
以下、第一実施形態と重複する説明は省略する。
なお、電話番号の取得方法は、通話装置21側(携帯電話23)からの発信時は、その発信に使用した電話番号を取得すればよく、他の電話端末25からの着信時は、他の電話端末25から電話網を介して通知される電話番号を取得すればよい。
このため、以降、同じ第二話者Yと通話する場合、ステップS11Bの判定が肯定結果となり(ステップS11B;YES)、図5に示すように、ステップS6Bの処理に移行する。これにより、第一及び第三の判定処理(判定ステップに相当)を省略することができ、ステップS6Bのスロー再生の開始をより早めることが可能になる。
例えば、図1に示す通話装置21、及びその制御方法に本発明を適用する場合を説明したが、これに限定されない。例えば、車載に限定されない通話装置、及びその制御方法に本発明を適用してもよい。さらに、一対一で通話する通話装置21に限定されず、特許文献1に記載した会議支援装置といった、3人以上で通話可能な通話装置に本発明を適用してもよい。
21 通話装置
22 通信モジュール
23 携帯電話
23A、27A 設定言語
25 他の電話端末
27 車載装置
31 制御部(判定部、音声処理部)
32 記憶部
32A 言語別周波数情報
33 マイク(集音部)
35 スピーカー(放音部)
41 第一検出部(判定部)
43 第一演算部(判定部)
45 エコーキャンセラー
47、57 SRC(音声処理部)
51 第二検出部(判定部)
53 第二演算部(判定部)
58 ローパスフィルタ(LPF)
X 第一話者
Y 第二話者
Claims (11)
- 複数の話者が互いに通話可能に、各話者の音声に対応する音声信号を入出力する通話装置において、
前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定部と、
前記判定部の判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理部と、
を備えることを特徴とする通話装置。 - 前記判定部は、前記話者の音声から、前記話者の母語を特定可能な所定の周波数情報を取得し、取得した周波数情報に基づいて母語を特定し、特定した母語を利用して前記第一の発話者か前記第二の発話者か否かを判定する第一の判定処理を行うこと特徴とする請求項1に記載の通話装置。
- 前記所定の周波数情報は、第0フォルマント周波数であり、
前記判定部は、複数種類の言語と、各言語を母語とする者の第0フォルマント周波数とを関係付けた言語別周波数情報に基づき、母語を特定することを特徴とする請求項2に記載の通話装置。 - 当該通話装置が通話に使用するユーザー固定の装置に設定された言語を利用して、そのユーザー固定の装置のユーザーとみなせる話者が前記第一の発話者か前記第二の発話者か否かを判定する第二の判定処理を行うことを特徴とする請求項2又は3のいずれかに記載の通話装置。
- 前記第二の判定処理では、前記ユーザー固定の装置に設定された言語が、当該通話装置に接続される車載装置に設定された言語と一致する場合、その言語を母語と特定し、一致しない場合、前記ユーザー固定の装置に設定された言語を母語と特定し、特定した母語を利用して前記第一の発話者か前記第二の発話者か否かを判定することを特徴とする請求項4に記載の通話装置。
- 前記判定部は、前記話者の音声から、音声の無音部分の情報を取得し、取得した情報に基づいて前記第一の発話者か前記第二の発話者か否かを判定する第三の判定処理を行うことを特徴とする請求項4又は5のいずれかに記載の通話装置。
- 前記第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先度に従って、前記第一の発話者か第二の発話者かを判定することを特徴とする請求項6に記載の通話装置。
- 前記通話装置は、前記複数の話者の中の所定の話者の音声を集音する集音部と、前記所定の話者に向けて、他の話者の音声を放音する放音部とを備え、
前記音声処理部は、前記所定の話者が、前記第二の発話者であると判定された場合、前記放音部により放音させる音声に対応する音声信号に、語学学習者向けの所定の音声処理を行うことを特徴とする請求項1〜7のいずれかに記載の通話装置。 - 前記通話装置は、前記所定の話者がハンズフリー通話に使用するハンズフリ−通話装置であることを特徴とする請求項8に記載の通話装置。
- 前記第二の発話者であると判定された前記他の話者の電話番号を記憶する記憶部を有し、
通話開始時に、前記他の話者の電話番号が前記記憶部に記憶済みの場合、前記判定部が判定を行わずに、前記音声処理部が、前記他の話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行うことを特徴とする請求項8又は9に記載の通話装置。 - 複数の話者が互いに通話可能に、各話者の音声に対応する音声信号を入出力する通話装置の制御方法において、
前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定ステップと、
前記判定ステップの判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理ステップと、
を実行することを特徴とする通話装置の制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029387A JP6948275B2 (ja) | 2018-02-22 | 2018-02-22 | 通話装置、及び通話装置の制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029387A JP6948275B2 (ja) | 2018-02-22 | 2018-02-22 | 通話装置、及び通話装置の制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019146055A JP2019146055A (ja) | 2019-08-29 |
JP6948275B2 true JP6948275B2 (ja) | 2021-10-13 |
Family
ID=67774035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018029387A Active JP6948275B2 (ja) | 2018-02-22 | 2018-02-22 | 通話装置、及び通話装置の制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6948275B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002304392A (ja) * | 2001-04-04 | 2002-10-18 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 音声翻訳システム |
JP3741025B2 (ja) * | 2001-10-30 | 2006-02-01 | 株式会社デンソー | 電話システム、電話機およびコンピュータプログラム |
KR100457974B1 (ko) * | 2002-01-31 | 2004-11-18 | 강영식 | 무선 네트워크 오디오 단말기 |
JP2009251388A (ja) * | 2008-04-08 | 2009-10-29 | Denso Corp | 母国語発話装置 |
JP2011087196A (ja) * | 2009-10-16 | 2011-04-28 | Nec Saitama Ltd | 電話機、及び電話機の話速変換方法 |
JP2013034057A (ja) * | 2011-08-01 | 2013-02-14 | Nec Casio Mobile Communications Ltd | 電子機器、音響再生方法、及びプログラム |
JP5889162B2 (ja) * | 2012-10-23 | 2016-03-22 | 日本電信電話株式会社 | 会議支援装置、会議支援システム、その方法及びプログラム |
-
2018
- 2018-02-22 JP JP2018029387A patent/JP6948275B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019146055A (ja) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11044369B2 (en) | Method and apparatus for adjusting volume of user terminal, and terminal | |
KR101327112B1 (ko) | 주변 소리 정보를 이용하여 다양한 사용자 인터페이스를 제공하는 단말기 및 그 제어방법 | |
KR20230136707A (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US20090023479A1 (en) | Method and system for routing phone call audio through handset or headset | |
US8223961B2 (en) | Method and device for answering an incoming call | |
JP4520596B2 (ja) | 音声認識方法および音声認識装置 | |
JP2011227199A (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム | |
WO2019228329A1 (zh) | 个人听力装置、外部声音处理装置及相关计算机程序产品 | |
JPH1152976A (ja) | 音声認識装置 | |
KR102350890B1 (ko) | 휴대용 청력검사장치 | |
JPH1117779A (ja) | 音声認識通話装置の音声認識率向上方法 | |
JP6948275B2 (ja) | 通話装置、及び通話装置の制御方法 | |
JP5979303B2 (ja) | 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
KR102000282B1 (ko) | 청각 기능 보조용 대화 지원 장치 | |
CN111694539A (zh) | 在听筒和扬声器之间切换的方法、装置及介质 | |
US20150201057A1 (en) | Method of processing telephone voice output and earphone | |
JP2015002386A (ja) | 通話装置、音声変更方法、及び音声変更プログラム | |
JP7571111B2 (ja) | 通信端末、情報処理装置、通信方法及びプログラム | |
JP2007194833A (ja) | ハンズフリー機能を備えた携帯電話 | |
JP2023168010A (ja) | 音声信号処理装置および音声信号処理方法 | |
JPH11109987A (ja) | 音声認識装置 | |
CN114979896A (zh) | 一种音量控制方法、装置及蓝牙耳机 | |
JPH11298382A (ja) | ハンズフリー装置 | |
JP2012217125A (ja) | 車載用ハンズフリー通話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201217 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210825 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6948275 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |