JP2019146055A - Telephone call device and control method therefor - Google Patents
Telephone call device and control method therefor Download PDFInfo
- Publication number
- JP2019146055A JP2019146055A JP2018029387A JP2018029387A JP2019146055A JP 2019146055 A JP2019146055 A JP 2019146055A JP 2018029387 A JP2018029387 A JP 2018029387A JP 2018029387 A JP2018029387 A JP 2018029387A JP 2019146055 A JP2019146055 A JP 2019146055A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- language
- voice
- native
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、通話装置、及び通話装置の制御方法に関する。 The present invention relates to a call device and a control method for the call device.
複数の話者を通話可能にする通話装置として、母語を話す者(母語発話者と言う)の発話に対する音声信号を、非母語を話す者(非母語発話者又は語学学習者と言う)の発話に対する音声信号よりも遅延させる会議支援装置が開示されている(例えば、特許文献1参照)。この会議支援装置では、母語発話者用の端末と非母語発話者用の端末とを予め設ける方法、又は、スイッチ等により発話者が手動で各端末を母語者端末または非母語者端末と設定する方法等によって、母語発話者の音声信号であるか否かを判定可能にしている。 As a communication device that allows multiple speakers to talk, voice signals for the utterances of native speakers (referred to as native speakers) are spoken by non-native speakers (referred to as non-native speakers or language learners). A conference support apparatus is disclosed that delays the audio signal from the voice signal for the above (see, for example, Patent Document 1). In this conference support apparatus, a method for providing a terminal for a native speaker and a terminal for a non-native speaker in advance, or a speaker manually sets each terminal as a native speaker terminal or a non-native speaker terminal using a switch or the like. It is possible to determine whether or not it is a voice signal of a native speaker by a method or the like.
しかし、従来の構成は、母語発話者用と非母語発話者用とで別々の端末を製作する必要や、端末を母語発話者用か非母語発話者用に切り替える手動スイッチが必要になる、といった制約がある。このため、従来の会議支援装置の機能を、例えば、車両等に搭載されるハンズフリー装置に適用し難い、といった事態が生じる。
そこで、本発明は、手動スイッチ等を使用しなくても母語発話者と非母語発話者とが通話し易くすることを目的とする。
However, the conventional configuration requires the production of separate terminals for native speakers and non-native speakers, and manual switches that switch the terminal for native speakers or non-native speakers. There are limitations. For this reason, the situation where it is difficult to apply the function of the conventional meeting assistance apparatus to the hands-free apparatus mounted in a vehicle etc. arises, for example.
Therefore, an object of the present invention is to make it easy for a native speaker and a non-native speaker to talk without using a manual switch or the like.
上記目的を達成するために、本発明は、複数の話者が互いに通話可能に、各話者の音声に対応する音声信号を入出力する通話装置において、前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定部と、前記判定部の判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理部と、を備えることを特徴とする。 In order to achieve the above object, the present invention provides a communication device that inputs and outputs audio signals corresponding to the voices of the respective speakers so that a plurality of speakers can talk to each other, based on at least the voices of the speakers, A determination unit that determines whether the speaker is a first speaker equivalent to a native speaker or a second speaker equivalent to a language learner, and the second speaker based on the determination result of the determination unit And a voice processing unit that performs predetermined voice processing for language learners on a voice signal output to a speaker determined to be.
上記構成において、前記判定部は、前記話者の音声から、前記話者の母語を特定可能な所定の周波数情報を取得し、取得した周波数情報に基づいて母語を特定し、特定した母語を利用して前記第一の発話者か前記第二の発話者か否かを判定する第一の判定処理を行ってもよい。 In the above configuration, the determination unit obtains predetermined frequency information capable of specifying the speaker's mother tongue from the speaker's voice, specifies the mother tongue based on the acquired frequency information, and uses the specified mother tongue And you may perform the 1st determination process which determines whether it is said 1st speaker or said 2nd speaker.
また、上記構成において、前記所定の周波数情報は、第0フォルマント周波数であり、前記判定部は、複数種類の言語と、各言語を母語とする者の第0フォルマント周波数とを関係付けた言語別周波数情報に基づき、母語を特定してもよい。 Further, in the above configuration, the predetermined frequency information is a 0th formant frequency, and the determination unit is classified by language that associates a plurality of types of languages with a 0th formant frequency of a person whose native language is each language. The native language may be specified based on the frequency information.
また、上記構成において、当該通話装置が通話に使用するユーザー固定の装置に設定された言語を利用して、そのユーザー固定の装置のユーザーとみなせる話者が前記第一の発話者か前記第二の発話者か否かを判定する第二の判定処理を行ってもよい。 Further, in the above configuration, the speaker that can be regarded as the user of the user-fixed device using the language set in the user-fixed device that the call device uses for the call is the first speaker or the second speaker. You may perform the 2nd determination process which determines whether it is a speaker.
また、上記構成において、前記第二の判定処理では、前記ユーザー固定の装置に設定された言語が、当該通話装置に接続される車載装置に設定された言語と一致する場合、その言語を母語と特定し、一致しない場合、前記ユーザー固定の装置に設定された言語を母語と特定し、特定した母語を利用して前記第一の発話者か前記第二の発話者か否かを判定してもよい。 In the above configuration, in the second determination process, when the language set in the user-fixed device matches the language set in the in-vehicle device connected to the call device, the language is set as the native language. If it is identified and does not match, the language set in the user-fixed device is identified as a native language, and the identified native language is used to determine whether the first speaker or the second speaker is used. Also good.
また、上記構成において、前記判定部は、前記話者の音声から、音声の無音部分の情報を取得し、取得した情報に基づいて前記第一の発話者か前記第二の発話者か否かを判定する第三の判定処理を行ってもよい。 Further, in the above configuration, the determination unit acquires information on a silent portion of the voice from the voice of the speaker, and whether the first speaker or the second speaker is based on the acquired information. You may perform the 3rd determination process which determines.
また、上記構成において、前記第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先度に従って、前記第一の発話者か第二の発話者かを判定してもよい。 Moreover, in the said structure, when the determination result of said 1st-3rd determination process differs, you may determine whether it is said 1st speaker or a 2nd speaker according to a predetermined priority.
また、上記構成において、前記通話装置は、前記複数の話者の中の所定の話者の音声を集音する集音部と、前記所定の話者に向けて、他の話者の音声を放音する放音部とを備え、前記音声処理部は、前記所定の話者が、前記第二の発話者であると判定された場合、前記放音部により放音させる音声に対応する音声信号に、語学学習者向けの所定の音声処理を行ってもよい。 Further, in the above configuration, the call device is configured to collect a voice of a predetermined speaker among the plurality of speakers and a voice of another speaker toward the predetermined speaker. A sound output unit that emits sound, and the sound processing unit is configured to output sound corresponding to the sound to be emitted by the sound output unit when the predetermined speaker is determined to be the second speaker. The signal may be subjected to predetermined speech processing for language learners.
また、上記構成において、前記通話装置は、前記所定の話者がハンズフリー通話に使用するハンズフリ−通話装置でもよい。
また、上記構成において、前記第二の発話者であると判定された前記他の話者の電話番号を記憶する記憶部を有し、通話開始時に、前記他の話者の電話番号が前記記憶部に記憶済みの場合、前記判定部が判定を行わずに、前記音声処理部が、前記他の話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行ってもよい。
In the above configuration, the call device may be a hands-free call device used by the predetermined speaker for a hands-free call.
Further, in the above configuration, a storage unit that stores a telephone number of the other speaker determined to be the second speaker is provided, and the telephone number of the other speaker is stored in the memory at the start of a call. The voice processing unit performs predetermined voice processing for a language learner on the voice signal output to the other speaker without making the determination. May be.
また、複数の話者が互いに通話可能に、各話者の音声に対応する音声信号を入出力する通話装置の制御方法において、前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定ステップと、前記判定ステップの判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理ステップと、を実行することを特徴とする。 Further, in a control method for a communication device for inputting / outputting a voice signal corresponding to each speaker's voice so that a plurality of speakers can talk to each other, the speaker can speak a native language based on at least the voice of the speaker. A determination step for determining whether the speaker is a first speaker equivalent to a speaker or a second speaker corresponding to a language learner, and a story determined to be the second speaker based on the determination result of the determination step A voice processing step for performing predetermined voice processing for a language learner on a voice signal output to the learner.
本発明によれば、手動スイッチ等を使用しなくても母語発話者と非母語発話者とが通話し易くすることができる。 According to the present invention, it is possible to facilitate communication between a native speaker and a non-native speaker without using a manual switch or the like.
以下、図面を参照して本発明の実施の形態について説明する。
(第一実施形態)
図1は本発明の第一実施形態に係る通話装置21を含む通話システム10の構成を示した図である。
通話装置21は、自動車等の車両に配置され、車両の乗員であるユーザー(所定の話者)がいわゆるハンズフリー通話を行うために使用するハンズフリー通話装置である。通話装置21は、無線通信機能を備える機器と無線通信するための通信モジュール22を備える。通話装置21は、この通信モジュール22により、ユーザーが所有する携帯電話23(電話端末とも称する)と無線通信することによって、電話網を介して他の電話端末25との間で通信する。これによって、通話装置21と他の電話端末25との間で通話の音声信号が入出力される。
Embodiments of the present invention will be described below with reference to the drawings.
(First embodiment)
FIG. 1 is a diagram showing a configuration of a
The
通信モジュール22は、Bluetooth(登録商標)規格に従って近距離無線通信を行うための通信モジュールである。なお、Bluetooth以外の近距離無線通信を行うものでもよい。
携帯電話23は、移動通信網(図示略)を介して他の携帯電話や固定電話と通信する機能を有し、内蔵スピーカー、内蔵マイク、電話通信のための通信部に加え、通話装置21と近距離無線通信を行うための通信モジュールを備えている。なお、携帯電話23と通話装置21とは無線で接続される場合に限らず、有線で接続される構成でもよい。
The
The
また、車両内には、車載装置27が配置されており、この車載装置27は、通話装置21と通信可能に接続されている。車載装置27は、ナビゲーション機能、ラジオ受信機能、又はオーディオ再生機能等を具備する装置であり、通話装置21は、例えば車載装置27が有する操作パネルを介して当該通話装置21への各種指示を入力する。なお、通話装置21と車載装置27とが一体に構成されていてもよい。
An in-
ここで、携帯電話23及び車載装置27には、各装置23、27の表示等に使用する言語(以下、設定言語)23A、27Aが設定されている。通常、携帯電話23の設定言語23Aは、携帯電話23の所有者によって設定され、車載装置27の設定言語27Aは、車両の所有者によって設定される。なお、携帯電話23の所有者と車両の所有者は、一致する場合もあるし、不一致の場合もある。
Here, the
図1に示すように、通話装置21において、制御部31は、CPUを備え、この通話装置21の各部を制御するコンピュータとして機能する。また、記憶部32は、制御部31によって実行される制御プログラム、及び各種のデータを記憶する。
マイク33は、通話装置21のユーザーである話者(以下、第一話者Xと言う)の音声(ハンズフリー通話の際の送話音声に相当)を集音する集音部として機能する。スピーカー35は、車両内の第一話者Xに向けて、他の電話端末25のユーザーである話者(以下、第二話者Yと言う)の音声を放音する放音部として機能する。なお、マイク33及びスピーカー35は、通話装置専用のマイク及びスピーカーでもよいし、車載装置27等が音声の入出力に使用するマイク及びスピーカーを兼用したものでもよい。
As shown in FIG. 1, in the
The
第一検出部41は、マイク33を介して入力した第一話者Xの音声から、この話者Xの母語を特定可能な周波数として、フォルマント周波数を検出する。より具体的には、フォルマント周波数のうちの最も低い第0フォルマント周波数(第一フォルマント周波数、又は基底周波数と言う場合もある)を検出する。例えば、第一検出部41は、線形予想分析(LPC)の後にピークピッキングでピークを抽出し、バンドパスフィルタにて後述する図2に記載のバンド毎にピークの有無を検出する。これにより、バンド毎にフォルマント周波数の有無を検出し、検出結果を第一演算部43又は制御部31に出力する。なお、フォルマント周波数の検出方法は、公知の方法を広く適用可能である。
The
図2は、複数種類の言語と、各言語を母語とする者(母語発話者)の第0フォルマント周波数との関係の一例を示した図である。なお、図2は音声帯域に相当する0〜15kHzまでの周波数帯を9つのバンドに区切り、言語毎に第0フォルマント周波数のバンドを暗部で表記している。
また、図2は成人の場合の一例を示している。この図に示すように、日本語を母語とする者は相対的に第0フォルマント周波数が低い範囲となり、英語やイタリア語を母語とする者は相対的に第0フォルマント周波数が高い範囲となる傾向がある。
FIG. 2 is a diagram illustrating an example of a relationship between a plurality of types of languages and the 0th formant frequency of a person who speaks each language as a mother tongue (speaker of native language). In FIG. 2, the frequency band from 0 to 15 kHz corresponding to the voice band is divided into nine bands, and the band of the 0th formant frequency is shown in a dark part for each language.
FIG. 2 shows an example of an adult. As shown in this figure, those whose native language is Japanese have a relatively low range of 0th formant frequency, and those whose native language is English or Italian tend to have a relatively high range of 0th formant frequency. There is.
このように、言語と第0フォルマント周波数とは相関関係がある。このため、例えば、日本語を母語とする者が英語を話した場合、その英語音声の第0フォルマント周波数は、日本語の周波数帯域である低い範囲(図2中、0〜1.25kHz)になり易い。また、イギリス英語を母語とする者が日本語を話した場合、日本語音声の第0フォルマント周波数は、イギリス英語の周波数帯域である高い範囲(図2中、2kHz〜15kHz)の範囲になり易い。 Thus, there is a correlation between the language and the 0th formant frequency. For this reason, for example, when a person whose mother tongue is Japanese speaks English, the 0th formant frequency of the English voice is in a low range (0 to 1.25 kHz in FIG. 2) which is a Japanese frequency band. Easy to be. In addition, when a person whose native language is British English speaks Japanese, the 0th formant frequency of Japanese speech tends to be in a high range (2 kHz to 15 kHz in FIG. 2), which is the frequency band of British English. .
本構成では、この相関関係(第0フォルマント周波数が母語に影響されること)を利用して、第一演算部43が、制御部31の制御の下、第一話者Xの音声の第0フォルマント周波数から、第一話者Xの母語を判定し、判定結果に基づき第一話者Xが母語発話者(第一の発話者に相当)か語学学習者(第二の発話者に相当)か否かを判定する第一の判定処理を行う。
なお、記憶部32には、図2に記載の傾向に基づき、複数種類の言語と、各言語を母語とする者のフォルマント周波数とを関係付けた言語別周波数情報32Aが記憶され、この言語別周波数情報32Aを利用することによって、第0フォルマント周波数から母語を容易に特定可能である。
In this configuration, using this correlation (the 0th formant frequency is influenced by the native language), the
The
携帯電話23は、第一話者Xが常に使用する事が前提であるため、ユーザー固定の装置である。このため、携帯電話23の設定言語23Aは母語に設定されていることが多い。
一方、車載装置27の設定言語27Aは、必ずしも母語に設定されてはいない。なぜなら、実際の道路標識が母語以外の場合、車載装置27の設定言語27Aを母語に設定していると、実際の道路標識の文字を車載装置27側で正確に認識できず、ナビゲーション処理や地図等の表示に不備を招くおそれがあるからである。このため、車載装置27の設定言語27Aは、実際の道路標識の言語に設定されていることが多い。
そこで、本構成では、母語判定精度を更に向上させるために、第一演算部43が、制御部31の制御の下、少なくとも携帯電話23の設定言語23Aに基づいて、携帯電話23のユーザーである第一話者Xの母語を特定し、特定した結果に基づき第一話者Xが母語発話者か語学学習者か否かを判定する第二の判定処理を行う。
The
On the other hand, the
Therefore, in this configuration, in order to further improve the native language determination accuracy, the
また、通話は、母語発話者同士の通話の次に、母語発話者と語学学習者の通話が比較的多いと考えられる。母語発話者が発話した場合は一回の文章が長く途切れる回数が少ないが、語学学習者の場合は、単語や文法を考えながら発話する為、どうしても無音区間が多くなる傾向となる。
そこで、本構成では、母語判定精度を更に向上させるために、第一演算部43が、制御部31の制御の下、第一話者Xの音声の無音部分の情報を取得し、取得した情報に基づき第一話者Xが母語発話者か語学学習者か否かを判定する第三の判定処理を行う。
In addition, it is considered that there are relatively many calls between native speakers and language learners after calls between native speakers. When a native speaker speaks, the number of times a sentence is interrupted for a long time is small. However, in the case of a language learner, the speech is uttered while considering words and grammar.
Therefore, in this configuration, in order to further improve the native language determination accuracy, the
エコーキャンセラー45は、マイク33からの音声信号に対し、エコーキャンセル処理を施すことにより、スピーカー35から発する音をマイク33でひろってしまうことで発生するエコーをキャンセルする。
また、制御部31は、第二話者Yが語学学習者の場合、マイク33から入力した音声信号(送話音声の信号に相当)に対し、語学学習者向けの所定の音声処理を行う。具体的には、制御部31は、所定の音声処理として、音声をスロー再生させる処理(再生速度を遅くする処理に相当)を行う。つまり、マイク33と第一演算部43との間には、サンプリング・レート・コンバーター(以下、SRC47)が配置され、制御部31は、マイク33から入力した音声信号に対するサンプリング周波数をn倍にし、且つ、サンプリング後のデータを適宜に間引くことによって、スロー再生される音声信号に変換する。
The
In addition, when the second speaker Y is a language learner, the
この音声信号は、通信モジュール22を介して他の電話端末25に送信され、他の電話端末25からスロー再生された音声が放音される。なお、サンプリング周波数等をデフォルト値にすることで、他の電話端末25から実速度で音声が放音される。
このようにして、SRC47は、スロー再生させる音声処理を行う第一スロー再生部として機能する。この場合、再生速度を段階的に遅くすることによって、聞く側(第二話者Y側)の違和感を抑えることが好ましい。なお、スロー再生させる構成はSRC47に限定されない。また、語学学習者向けの所定の音声処理は、スロー再生に限定しなくてもよく、語学学習者が聞き取り易くなる音声処理(語学学習者向けの音声処理に相当)を広く適用可能である。
This audio signal is transmitted to the
In this way, the
通話装置21において、第二検出部51は、通信モジュール22を介して入力した第二話者Yの音声(ハンズフリー通話の際の受話音声に相当)から、この話者Yの母語を特定可能な周波数として、フォルマント周波数(本構成では第0フォルマント周波数)を検出する。この第二検出部51には、第一検出部41と同様のものを適用可能である。
第二演算部53は、制御部31の制御の下、第二話者Yの音声の第0フォルマント周波数から、第二話者Yの母語を判定し、判定結果に基づき第二話者Yが母語発話者(第一の発話者に相当)か語学学習者(第二の発話者に相当)か否かを判定する第一の判定処理を行う。
また、第二演算部53は、母語判定精度を更に向上させるために、制御部31の制御の下、第二話者Yの音声の無音部分の情報を取得し、取得した情報に基づき第二話者Yが母語発話者か語学学習者か否かを判定する第三の判定処理を行う。
In the
Under the control of the
Further, in order to further improve the native language determination accuracy, the
ところで、第一演算部43は、第一話者Xが使用する携帯電話23の設定言語23Aに基づいて、第一話者Xの母語を判定し、判定結果に基づき第一話者Xが母語発話者か語学学習者か否かを判定する第二の判定処理を行っていたが、通話装置21側では、第二話者Yが使用する他の電話端末25の設定言語等は判らないため、第二演算部53では第二の判定処理は実行されない。
但し、通話装置21と他の電話端末25との間の通信によって、第二話者Yが使用する他の電話端末25の設定言語が判るようにした場合、通話装置21側(第二演算部53)にて、その設定言語に基づき第二話者Yが母語発話者か語学学習者か否かを判定する第二の判定処理を行ってもよい。
なお、上述した第二及び第三の判定処理は制御部31が行ってもよい。
By the way, the
However, when the setting language of the
Note that the
制御部31は、第一話者Xが語学学習者の場合、通信モジュール22を介して入力した第二話者Yの音声信号に対し、語学学習者向けの所定の音声処理を行う。この所定の音声処理は、音声をスロー再生させる処理である。
つまり、通信モジュール22には、サンプリング・レート・コンバーター(以下、SRC57)が接続され、制御部31は、SRC57を利用して上述と同様にして、第二話者Yの音声信号を、スロー再生される音声信号に選択的に変換する。この場合も、スロー再生される音声信号は、再生速度を段階的に遅くすることによって、聞く側(第一話者X側)の違和感を抑えるものであることが好ましい。また、図1中、符号58はSRC57の出力側に配置されるローパルフィルタ(LPF)である。
なお、スロー再生させる構成はSRC57に限定されない。また、語学学習者向けの所定の音声処理は、スロー再生させる音声処理に限定されず、語学学習者向けの音声処理を広く適用可能である。
When the first speaker X is a language learner, the
That is, a sampling rate converter (hereinafter referred to as SRC 57) is connected to the
Note that the slow playback configuration is not limited to the
図3は車両側の話者(第一話者X)に対する通話装置21の動作を示すフローチャートである。
通話装置21は、第一検出部41によって、マイク33に発話音声が入力されたことを検出すると(ステップS1A)、第一演算部43によって、上述した第一の判定処理(ステップS2A)と、第二の判定処理(ステップS3A)と、第三の判定処理(ステップS4A)とを実行する。
第一の判定処理では、第一演算部43は、第一話者Xの音声の第0フォルマント周波数を特定した後、記憶部32に記憶される言語別周波数情報32Aを参照することによって、第一話者Xの母語を特定する。次いで、特定した母語から第一話者Xが母語発話者か語学学習者か否かを判定する。
FIG. 3 is a flowchart showing the operation of the
When the
In the first determination process, the
母語から母語発話者か語学学習者か否かを判定する方法には、様々な方法を適用可能である。例えば、母語が、この通話装置21が利用される国の公用語と同じ言語であった場合に第一話者Xを母語発話者と判定し、別の言語の場合に語学学習者と判定してもよい。また、音声認識技術を適用して第一話者Xの音声の言語を特定し、母語が特定した言語と同じ言語の場合、第一話者Xを母語発話者と判定し、別の言語の場合に語学学習者と判定する方法を適用してもよい。
Various methods can be applied to the method of determining whether the speaker is a native speaker or a language learner from the native language. For example, if the native language is the same language as the official language of the country in which the
第二の判定処理では、第一演算部43は、携帯電話23及び車載装置27の設定言語23A、27Aを比較して母語を特定し、特定した母語から第一話者Xが母語発話者か語学学習者か否かを判定する。設定言語23A、27Aが一致する場合は、その言語を母語と特定し、一致しない場合は、携帯電話23の設定言語23Aを母語と特定する。また、車載装置27の設定言語27Aを特定できない場合に、携帯電話23の設定言語23Aを母語と特定してもよい。また、特定した母語から母語発話者か語学学習者か否かを判定する方法は、第一判定処理と同様の判定方法でもよいし、異なる判定方法でもよい。
In the second determination process, the
第三の判定処理では、第一演算部43は、マイク33を介して入力した第一話者Xの音声から、無音部分の回数を計数し、計数結果に基づいて第一話者Xが母語発話者か語学学習者か否かを判定する。この判定方法にも複数の方法が挙げられる。例えば、無音部分の回数が、所定時間内で予め定めた閾値よりも大の場合に語学学習者と判定し、小の場合に母語発話者と判定する方法でもよい。
また、母語発話者と語学学習者の通話が比較的多いことを踏まえて、第一話者Xの音声の無音部分の回数と、通信モジュール22を介して入力される第二話者Yの音声の無音部分の回数とを比較し、回数が多い方を語学学習者と判定する方法でもよい。
In the third determination process, the
In addition, the number of silent parts of the voice of the first speaker X and the voice of the second speaker Y input via the
第一演算部43は、第一から第三の判定処理を並列的に行うことによって、それぞれの判定結果を取得した後、これら判定結果に基づき第一話者Xが母語発話者か語学学習者か否かを判定する(ステップS5A)。これらステップS2A〜S5Aまでの処理が判定ステップに相当する。
第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先順位が高い判定結果を優先する。本構成では、第一の判定結果を最優先とする。なお、第一の判定結果を取得できなかった場合(例えば、図2中の1kHz〜1.5kHzのような複数の母語に含まれる第0フォルマント周波数の場合も含む)、第二及び第三判定処理の判定結果を利用することで、1つの母語を特定し易くなる。なお、優先順位は変更してもよい。
The
When the determination results of the first to third determination processes are different, priority is given to a determination result having a high priority. In this configuration, the first determination result is given the highest priority. When the first determination result cannot be obtained (for example, including the case of the 0th formant frequency included in a plurality of native languages such as 1 kHz to 1.5 kHz in FIG. 2), the second and third determinations are made. By using the processing determination result, it becomes easy to specify one native language. The priority order may be changed.
ステップS5Aの判定で第一話者Xが母語発話者である(つまり、語学学習者でない)と判定した場合(ステップS5A;NO)、通話装置21は、制御部31によって当該処理(車両側の話者(第一話者X)に対する動作に相当)を終了する。
一方、ステップS5Aの判定で第一話者Xが語学学習者であると判定した場合(ステップS5A;NO)、通話装置21は、SRC57を利用して、受話音声である第二話者Yの音声信号をスロー再生させる(ステップS6A、音声処理ステップに相当)。これにより、語学学習者と判定された第一話者Xには、第二話者Yの音声がゆっくり聞こえ、音声を聞き取り易くなる。
When it is determined in step S5A that the first speaker X is a native speaker (that is, not a language learner) (step S5A; NO), the
On the other hand, when it is determined in step S5A that the first speaker X is a language learner (step S5A; NO), the
なお、ステップS1A〜S5Aまでの処理は数秒程度の短時間で終了し、スロー再生は短時間で開始される。また、第一話者Xが母語発話者である(つまり、語学学習者でない)と判定された場合、ステップS6Aの処理が実行されないので、母語発話者である第一話者Xには、第二話者Yの音声が実速度で聞こえることになる。 Note that the processing from step S1A to S5A is completed in a short time of about several seconds, and the slow reproduction is started in a short time. If it is determined that the first speaker X is a native speaker (that is, not a language learner), the process of step S6A is not executed. The voice of the two speaker Y can be heard at the actual speed.
図4は車両外の話者(第二話者Y)に対する通話装置21の動作を示すフローチャートである。
通話装置21は、第二検出部51によって、通信モジュール22を介して携帯電話23から受話音声(第二話者Yの音声)が入力されたことを検出すると(ステップS1B)、第二演算部53によって、上述した第一の判定処理(ステップS2B)と、第三の判定処理(ステップS4B)とを実行する。
この第一の判定処理では、第二演算部53は、第二話者Yの音声の第0フォルマント周波数を特定した後、記憶部32に記憶される言語別周波数情報32Aを参照することによって、第二話者Yの母語を特定する。次いで、特定した母語から第二話者Yが母語発話者か語学学習者か否かを判定する。なお、この第一の判定処理は、第二話者Yの音声を利用する点を除いて、第一演算部43によって実行される第一の判定処理と同様の処理である。
FIG. 4 is a flowchart showing the operation of the
When the second detecting
In this first determination process, the
第三の判定処理では、第一演算部43は、第二話者Yの音声から、無音部分の回数を計数し、計数結果に基づいて第二話者Yが母語発話者か語学学習者か否かを判定する。なお、この第三の判定処理は、第二話者Yの音声を利用する点を除いて、第一演算部43によって実行される第三の判定処理と同様の処理である。
In the third determination process, the
第一演算部43は、第一及び第三の判定処理を並列的に行うことによって、それぞれの判定結果を取得した後、これら判定結果に基づき第二話者Yが母語発話者か語学学習者か否かを判定する(ステップS5B)。これらステップS2B〜S5Bまでの処理が判定ステップに相当する。
第一及び第三の判定処理の判定結果が異なる場合、予め定めた優先順位が高い判定結果を優先する。本構成では、第一の判定結果を最優先とする。なお、優先順位は変更してもよい。
The
When the determination results of the first and third determination processes are different, priority is given to a determination result having a high priority. In this configuration, the first determination result is given the highest priority. The priority order may be changed.
ステップS5Bの判定で第二話者Yが母語発話者である(つまり、語学学習者でない)と判定した場合(ステップS5B;NO)、通話装置21は、制御部31によって当該処理(車両外の話者(第二話者Y)に対する動作に相当)を終了する。
一方、ステップS5Bの判定で第二話者Yが語学学習者であると判定した場合(ステップS5B;YES)、通話装置21は、SRC47を利用して、送話音声である第一話者Xの音声信号をスロー再生させる(ステップS6B、音声処理ステップに相当)。これにより、語学学習者と判定された第二話者Yには、第一話者Xの音声がゆっくり聞こえ、音声を聞き取り易くなる。なお、ステップS1B〜S5Bまでの処理は数秒程度の短時間で終了し、スロー再生は短時間で開始される。
When it is determined in step S5B that the second speaker Y is a native speaker (that is, not a language learner) (step S5B; NO), the
On the other hand, when it is determined in step S5B that the second speaker Y is a language learner (step S5B; YES), the
また、第二話者Yが母語発話者である(つまり、語学学習者でない)と判定された場合、ステップS6Bの処理が実行されないので、母語発話者である第二話者Yには、第一話者Xの音声が実速度で聞こえることになる。
また、図4に示すフローチャートにおいて、ステップS4Bの処理(第3の判定処理)を省略してもよい。
If it is determined that the second speaker Y is a native speaker (that is, not a language learner), the process of step S6B is not executed. The voice of the speaker X can be heard at the actual speed.
Further, in the flowchart shown in FIG. 4, the process of step S4B (third determination process) may be omitted.
以上説明したように、本実施形態では、第一検出部41、第一演算部43及び制御部31によって、第一話者Xの少なくとも音声に基づいて、第一話者Xが、母語発話者か語学学習者か否かを判定する判定部が構成される。
また、制御部31及びSRC57によって、判定部の判定結果に基づき、語学学習者であると判定された第一話者Xに向けて出力される音声信号(第二話者Yの音声)に対し、スロー再生処理(語学学習者向けの所定の音声処理に相当)を行う音声処理部が構成される。
これにより、手動スイッチ等を使用しなくても、第一話者Xが母語発話者か語学学習者か否かを自動的に特定し、第一話者Xが語学学習者であっても第二話者Yと通話し易くなる。
As described above, in the present embodiment, the first speaker X, the
Moreover, with respect to the voice signal (the voice of the second speaker Y) output by the
This automatically identifies whether the first speaker X is a native speaker or a language learner without using a manual switch or the like, and even if the first speaker X is a language learner. It becomes easy to talk with the two speaker Y.
また、第二検出部51、第二演算部53及び制御部31によって、第二話者Yの少なくとも音声に基づいて、第二話者Yが、母語発話者か語学学習者か否かを判定する判定部が構成される。
また、制御部31及びSRC47によって、判定部の判定結果に基づき、語学学習者であると判定された第二話者Yに向けて出力される音声信号(第一話者Xの音声)に対し、スロー再生処理(語学学習者向けの所定の音声処理に相当)を行う音声処理部が構成される。
これにより、手動スイッチ等を使用しなくても、第二話者Yが母語発話者か語学学習者か否かを自動的に特定し、第二話者Yが語学学習者であっても第一話者Xと通話し易くなる。
In addition, the
Moreover, with respect to the voice signal (the voice of the first speaker X) output by the
This automatically identifies whether the second speaker Y is a native speaker or a language learner without using a manual switch or the like, and even if the second speaker Y is a language learner. It becomes easier to talk to the speaker X.
本実施形態において、母語発話者は、厳密な意味の母語発話者に限定しなくてもよく、母語発話者に似た発話を行う者を含んでもよい。また、語学学習者についても、厳密な意味の語学学習者に限定しなくてもよく、語学学習者に似た発話を行う者を含んでもよい。
例えば、高齢者の場合、母語発話者であっても無音区間が多い場合があり、この場合は、第三の判定処理で語学学習者と判定される場合が生じる。また、個体差によって、母語発話者であっても、第一の判定処理等で語学学習者と判定される場合もある。いずれも判定基準を適宜に調整することによって、母語発話者又は語学学習者と判定される範囲を調整可能である。
すなわち、第一〜第三の判定処理において、母語発話者相当の第一の発話者か語学学習者相当の第二の発話者か否かを判定すればよい。
In the present embodiment, the native speaker may not be limited to a native speaker with a strict meaning, but may include a person who speaks similar to the native speaker. Further, the language learner does not have to be limited to a language learner having a strict meaning, and may include a person who speaks similar to the language learner.
For example, in the case of an elderly person, even if it is a native speaker, there may be many silent sections, and in this case, it may be determined as a language learner in the third determination process. Further, depending on individual differences, even a native speaker may be determined as a language learner in the first determination process or the like. In any case, the range determined to be a native speaker or a language learner can be adjusted by appropriately adjusting the determination criteria.
That is, in the first to third determination processes, it may be determined whether the first speaker corresponding to the native speaker or the second speaker corresponding to the language learner.
また、第一の発話者か第二の発話者か否かを判定する方法として、第一の判定処理を行うので、つまり、第一話者X及び第二話者Yの音声から、各話者X、Yの母語を特定可能な所定の周波数情報である第0フォルマント周波数を取得し、取得した第0フォルマント周波数に基づいて母語を特定し、特定した母語を利用して第一の発話者か第二の発話者か否かを判定するので、言語と第0フォルマント周波数との相関関係を利用して、高精度に各話者X、Yの母語を特定できる。 In addition, as a method for determining whether the speaker is the first speaker or the second speaker, the first determination process is performed. That is, each speech is determined from the voices of the first speaker X and the second speaker Y. The 0th formant frequency, which is predetermined frequency information that can identify the native language of the person X, Y, is acquired, the native language is specified based on the acquired 0th formant frequency, and the first speaker is used using the specified native language Therefore, it is possible to specify the native language of each speaker X and Y with high accuracy using the correlation between the language and the 0th formant frequency.
なお、第一の判定処理において、第0フォルマント周波数を利用する場合を説明したが、第0フォルマント周波数に限定しなくてもよい。例えば、第0フォルマント周波数以外のフォルマント周波数から話者X、Yの母語を特定可能であれば、そのフォルマント周波数を利用してもよい。さらに、フォルマント周波数以外に、話者X、Yの母語を特定可能な周波数情報があれば、その周波数情報を利用してもよい。 In the first determination process, the case where the 0th formant frequency is used has been described. However, the first formant frequency may not be limited to the 0th formant frequency. For example, if the native language of the speakers X and Y can be identified from formant frequencies other than the 0th formant frequency, the formant frequency may be used. In addition to the formant frequency, if there is frequency information that can identify the native language of the speakers X and Y, the frequency information may be used.
また、本実施形態では、複数種類の言語と、各言語を母語とする者のフォルマント周波数とを関係付けた言語別周波数情報32Aを記憶し、この言語別周波数情報32Aに基づき母語を特定するので、母語の特定が容易である。
Further, in the present embodiment, language-
また、本実施形態では、第二の判定処理を行うので、つまり、通話装置21が通話に使用するユーザー固定の装置である携帯電話23に設定された設定言語23Aを利用して、その携帯電話23のユーザーとみなせる第一話者Xが第一の発話者か第二の発話者か否かを判定するので、第一話者Xが第一の発話者か第二の発話者か否かの判定精度を向上し易くなる。
In the present embodiment, since the second determination process is performed, that is, by using the
さらに、第二の判定処理では、携帯電話23の設定言語23Aが、この通話装置21に接続される車載装置27の設定言語27Aと一致する場合は、その言語を母語と特定し、一致しない場合は、携帯電話23の設定言語23Aを母語と特定し、特定した母語を利用して第一話者Xが第一の発話者か第二の発話者か否かを判定する。これにより、第一の発話者か第二の発話者か否かの判定精度を向上し易くなる。なお、この第二の判定処理は、第一話者Xについてのみ行うので、第一話者Xの方が、第二話者Yよりも判定精度が向上し易くなる。
Furthermore, in the second determination process, when the
また、本実施形態では、第三の判定処理を行うので、つまり、第一話者X及び第二話者Yの音声から、各話者X、Yの音声の無音部分の情報を取得し、取得した情報に基づいて各話者X、Yが第一の発話者か第二の発話者かを判定するので、各話者X、Yが第一の発話者か第二の発話者か否かの判定精度をより向上し易くなる。
また、第一〜第三の判定処理の判定結果が異なる場合、予め定めた優先度に従って第一の発話者か第二の発話者か否かを判定するので、これによっても判定精度を向上し易くなる。
In the present embodiment, since the third determination process is performed, that is, from the voices of the first speaker X and the second speaker Y, information on the silent part of the voices of the speakers X and Y is acquired. Since it is determined whether each speaker X, Y is the first speaker or the second speaker based on the acquired information, whether each speaker X, Y is the first speaker or the second speaker is determined. It becomes easier to improve the determination accuracy.
In addition, when the determination results of the first to third determination processes are different, it is determined whether the speaker is the first speaker or the second speaker according to a predetermined priority. It becomes easy.
また、通話装置21は、複数の話者X、Yの中の第一話者Xの音声を集音する集音部として機能するマイク33と、第一話者X(所定の話者に相当)に向けて第二話者Yの音声を放音する放音部として機能するスピーカー35とを備える。そして、第一話者Xが、語学学習者相当の第二の発話者と判定された場合、スピーカー35により放音させる音声に対応する音声信号に、スロー再生処理(語学学習者向けの所定の音声処理に相当)を行う。これにより、マイク33とスピーカー35を利用する第一話者Xが通話を聞き取り易くなる。
マイク33及びスピーカー35が別体の場合は、通話装置21は、集音部として、マイク33からの音声を入力する音声入力部を備え、放音部として、スピーカー35に向けて音声を出力する音声出力部を備えればよい。
In addition, the
When the
また、この通話装置21は、第一話者Xがハンズフリー通話に使用するハンズフリ−通話装置であるので、通話装置21の直接のユーザーである第一話者Xが通話を聞き取り易くなる。
なお、第一話者X及び第二話者Yが第一の発話者か第二の発話者か否かを判定し、各話者X、Yが第二の発話者である場合に各話者が通話を聞き取り易くする場合を説明したが、これに限定されず、いずれか一方(例えば、第一話者X)だけについて、第一の発話者か第二の発話者か否かを判定し、第二の発話者である場合に、その一方の話者が通話を聞き取り易くするようにしてもよい。
Further, since the
It is determined whether the first speaker X and the second speaker Y are the first speaker or the second speaker, and each speaker X, Y is the second speaker. However, the present invention is not limited to this, and it is determined whether only one (for example, the first speaker X) is the first speaker or the second speaker. However, when the speaker is the second speaker, the other speaker may make it easy to hear the call.
(第二実施形態)
図5は第二実施形態に係る通話装置21の動作を説明するフローチャートであり、車両外の話者(第二話者Y)に対する通話装置21の動作を示している。
第二実施形態では、通話装置21の記憶部32に、語学学習者と判定された通話相手(第二話者Y)の電話番号が記憶される点、及び、通話相手の電話番号が記憶部32に記憶される場合は、判定処理を行うことなく、ステップS6Aの処理に移行する点が第一実施形態と異なる。
以下、第一実施形態と重複する説明は省略する。
(Second embodiment)
FIG. 5 is a flowchart for explaining the operation of the
In the second embodiment, the
Hereinafter, the description which overlaps with 1st embodiment is abbreviate | omitted.
図5に示すように、通話装置21は、携帯電話23から受話音声(第二話者Yの音声)が入力されると(ステップS1B)、通話相手である第二話者Yの電話番号が、語学学習者の電話番号として記憶部32に記憶されているか否かを判定する(ステップS11B)。
なお、電話番号の取得方法は、通話装置21側(携帯電話23)からの発信時は、その発信に使用した電話番号を取得すればよく、他の電話端末25からの着信時は、他の電話端末25から電話網を介して通知される電話番号を取得すればよい。
As shown in FIG. 5, when the received voice (second speaker Y's voice) is input from the mobile phone 23 (step S1B), the
Note that the telephone number can be acquired by acquiring the telephone number used for the outgoing call when making a call from the telephone device 21 (mobile phone 23). What is necessary is just to acquire the telephone number notified from the
ここで、通話装置21において、通話相手である第二話者Yとの通話が初めての場合、又は、同じ第二話者Yとの過去の通話時において、第二話者Yが母語発話者であると判定されている場合、この第二話者Yの電話番号は記憶部32に記憶されていない。このため、ステップS11Bの判定は否定結果となり(ステップS11B;NO)、次のステップS2Bの処理に移行する。
Here, in the
その後、ステップS5Bの判定で第二話者Yが語学学習者と判定した場合(ステップS5B;YES)、通話装置21は、第一話者Xの音声信号をスロー再生させると共に(ステップS6B)、第二話者Yの電話番号を、語学学習者の電話番号として記憶部32に記憶する(ステップS12B)。
このため、以降、同じ第二話者Yと通話する場合、ステップS11Bの判定が肯定結果となり(ステップS11B;YES)、図5に示すように、ステップS6Bの処理に移行する。これにより、第一及び第三の判定処理(判定ステップに相当)を省略することができ、ステップS6Bのスロー再生の開始をより早めることが可能になる。
Thereafter, when it is determined in step S5B that the second speaker Y is a language learner (step S5B; YES), the
For this reason, after that, when talking with the same second speaker Y, the determination in step S11B is affirmative (step S11B; YES), and the process proceeds to step S6B as shown in FIG. As a result, the first and third determination processes (corresponding to the determination step) can be omitted, and the start of the slow playback in step S6B can be accelerated.
なお、ステップS12Bにおいて、同じ電話番号が既に記憶部32に記憶済みの場合、その電話番号は新たに記憶されない。これにより、同じ電話番号が記憶部32に二重登録される事態が回避される。
If the same telephone number has already been stored in the
このように、本実施の形態では、記憶部32に、語学学習者(第二の発話者)と判定された第二話者Yの電話番号を記憶し、通話開始時に、第二話者Yの電話番号が記憶部32に記憶済みの場合、第一及び第三の判定処理を行わずに、第一話者Xの音声信号をスロー再生させる。これにより、速やかにスロー再生させることができる。
As described above, in the present embodiment, the
上述の実施形態は、あくまでも本発明の一実施の態様を例示するものであって、本発明の趣旨を逸脱しない範囲で任意に変形、及び応用が可能である。
例えば、図1に示す通話装置21、及びその制御方法に本発明を適用する場合を説明したが、これに限定されない。例えば、車載に限定されない通話装置、及びその制御方法に本発明を適用してもよい。さらに、一対一で通話する通話装置21に限定されず、特許文献1に記載した会議支援装置といった、3人以上で通話可能な通話装置に本発明を適用してもよい。
The above-described embodiments are merely illustrative of one embodiment of the present invention, and can be arbitrarily modified and applied without departing from the spirit of the present invention.
For example, although the case where this invention is applied to the
また、上述の実施形態では、制御プログラムを記憶部32に予め記憶しておく場合について説明したが、この制御プログラムを、磁気記録媒体、光記録媒体、半導体記録媒体等のコンピュータが読み取り可能な記録媒体に格納し、コンピュータが記録媒体からこの制御プログラムを読み取って実行するようにしてもよい。また、この制御プログラムを電気通信回線を介して通信ネットワーク上の配信サーバー等からダウンロードできるようにしてもよい。
In the above-described embodiment, the case where the control program is stored in the
10 通話システム
21 通話装置
22 通信モジュール
23 携帯電話
23A、27A 設定言語
25 他の電話端末
27 車載装置
31 制御部(判定部、音声処理部)
32 記憶部
32A 言語別周波数情報
33 マイク(集音部)
35 スピーカー(放音部)
41 第一検出部(判定部)
43 第一演算部(判定部)
45 エコーキャンセラー
47、57 SRC(音声処理部)
51 第二検出部(判定部)
53 第二演算部(判定部)
58 ローパスフィルタ(LPF)
X 第一話者
Y 第二話者
DESCRIPTION OF
32
35 Speaker (sound emission part)
41 1st detection part (determination part)
43 First operation unit (determination unit)
45
51 2nd detection part (determination part)
53 Second operation unit (determination unit)
58 Low-pass filter (LPF)
X First speaker Y Second speaker
Claims (11)
前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定部と、
前記判定部の判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理部と、
を備えることを特徴とする通話装置。 In a call device that inputs and outputs audio signals corresponding to each speaker's voice so that multiple speakers can talk to each other,
A determination unit for determining whether the speaker is a first speaker equivalent to a native speaker or a second speaker equivalent to a language learner based on at least the voice of the speaker;
A voice processing unit that performs predetermined voice processing for a language learner on a voice signal output toward a speaker determined to be the second speaker based on the determination result of the determination unit;
A call device comprising:
前記判定部は、複数種類の言語と、各言語を母語とする者の第0フォルマント周波数とを関係付けた言語別周波数情報に基づき、母語を特定することを特徴とする請求項2に記載の通話装置。 The predetermined frequency information is a 0th formant frequency,
3. The determination unit according to claim 2, wherein the determination unit specifies a native language based on language-specific frequency information in which a plurality of types of languages are associated with a 0th formant frequency of a person whose native language is each language. Telephone device.
前記音声処理部は、前記所定の話者が、前記第二の発話者であると判定された場合、前記放音部により放音させる音声に対応する音声信号に、語学学習者向けの所定の音声処理を行うことを特徴とする請求項1〜7のいずれかに記載の通話装置。 The call device includes: a sound collection unit that collects voices of a predetermined speaker among the plurality of speakers; and a sound emission unit that emits voices of other speakers toward the predetermined speaker And
When the predetermined speaker is determined to be the second speaker, the voice processing unit generates a predetermined voice signal for a language learner in a voice signal corresponding to the voice to be emitted by the sound emitting unit. The call device according to any one of claims 1 to 7, wherein voice processing is performed.
通話開始時に、前記他の話者の電話番号が前記記憶部に記憶済みの場合、前記判定部が判定を行わずに、前記音声処理部が、前記他の話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行うことを特徴とする請求項8又は9に記載の通話装置。 A storage unit for storing a telephone number of the other speaker determined to be the second speaker;
When the telephone number of the other speaker has already been stored in the storage unit at the start of the call, the voice processing unit outputs the voice to the other speaker without making the determination The call device according to claim 8 or 9, wherein predetermined speech processing for language learners is performed on the signal.
前記話者の少なくとも音声に基づいて、その話者が、母語発話者相当の第一の発話者か、語学学習者相当の第二の発話者かを判定する判定ステップと、
前記判定ステップの判定結果に基づき、前記第二の発話者であると判定された話者に向けて出力される音声信号に対し、語学学習者向けの所定の音声処理を行う音声処理ステップと、
を実行することを特徴とする通話装置の制御方法。 In a control method of a call device that inputs and outputs audio signals corresponding to each speaker's voice so that a plurality of speakers can talk to each other,
A determination step of determining whether the speaker is a first speaker equivalent to a native speaker or a second speaker equivalent to a language learner based on at least the voice of the speaker;
An audio processing step for performing predetermined audio processing for a language learner on an audio signal output toward the speaker determined to be the second speaker based on the determination result of the determination step;
A method for controlling a communication device, characterized in that:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029387A JP6948275B2 (en) | 2018-02-22 | 2018-02-22 | Calling device and control method of calling device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029387A JP6948275B2 (en) | 2018-02-22 | 2018-02-22 | Calling device and control method of calling device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019146055A true JP2019146055A (en) | 2019-08-29 |
JP6948275B2 JP6948275B2 (en) | 2021-10-13 |
Family
ID=67774035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018029387A Active JP6948275B2 (en) | 2018-02-22 | 2018-02-22 | Calling device and control method of calling device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6948275B2 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002304392A (en) * | 2001-04-04 | 2002-10-18 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | Voice translation system |
JP2003143299A (en) * | 2001-10-30 | 2003-05-16 | Denso Corp | Telephone system, telephone set and computer program |
KR20030065230A (en) * | 2002-01-31 | 2003-08-06 | 강영식 | Wireless network audio terminal |
JP2009251388A (en) * | 2008-04-08 | 2009-10-29 | Denso Corp | Native language utterance device |
JP2011087196A (en) * | 2009-10-16 | 2011-04-28 | Nec Saitama Ltd | Telephone set, and speech speed conversion method of telephone set |
JP2013034057A (en) * | 2011-08-01 | 2013-02-14 | Nec Casio Mobile Communications Ltd | Electronic apparatus, audio reproduction method, and program |
JP2014086832A (en) * | 2012-10-23 | 2014-05-12 | Nippon Telegr & Teleph Corp <Ntt> | Conference support device, and method and program for the same |
-
2018
- 2018-02-22 JP JP2018029387A patent/JP6948275B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002304392A (en) * | 2001-04-04 | 2002-10-18 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | Voice translation system |
JP2003143299A (en) * | 2001-10-30 | 2003-05-16 | Denso Corp | Telephone system, telephone set and computer program |
KR20030065230A (en) * | 2002-01-31 | 2003-08-06 | 강영식 | Wireless network audio terminal |
JP2009251388A (en) * | 2008-04-08 | 2009-10-29 | Denso Corp | Native language utterance device |
JP2011087196A (en) * | 2009-10-16 | 2011-04-28 | Nec Saitama Ltd | Telephone set, and speech speed conversion method of telephone set |
JP2013034057A (en) * | 2011-08-01 | 2013-02-14 | Nec Casio Mobile Communications Ltd | Electronic apparatus, audio reproduction method, and program |
JP2014086832A (en) * | 2012-10-23 | 2014-05-12 | Nippon Telegr & Teleph Corp <Ntt> | Conference support device, and method and program for the same |
Also Published As
Publication number | Publication date |
---|---|
JP6948275B2 (en) | 2021-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10251009B2 (en) | Audio scene apparatus | |
EP1953735B1 (en) | Voice control system and method for voice control | |
KR101327112B1 (en) | Terminal for providing various user interface by using surrounding sound information and control method thereof | |
US10872605B2 (en) | Translation device | |
JP2012093641A (en) | Portable electronic apparatus | |
CN110366156B (en) | Communication processing method, device, equipment, storage medium and audio management system | |
KR20150018727A (en) | Method and apparatus of low power operation of hearing assistance | |
US20070047708A1 (en) | Voice call reply using voice recognition and text to speech | |
JP2009178783A (en) | Communication robot and its control method | |
US20240096343A1 (en) | Voice quality enhancement method and related device | |
JPH1152976A (en) | Voice recognition device | |
US11516599B2 (en) | Personal hearing device, external acoustic processing device and associated computer program product | |
JP2019184809A (en) | Voice recognition device and voice recognition method | |
KR20090019474A (en) | Bluetooth headset for hearing aid and displaying conversation through communication and method thereof | |
JP6948275B2 (en) | Calling device and control method of calling device | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
WO2014141574A1 (en) | Voice control system, voice control method, program for voice control, and program for voice output with noise canceling | |
US20210183363A1 (en) | Method for operating a hearing system and hearing system | |
KR102000282B1 (en) | Conversation support device for performing auditory function assistance | |
EP3288035B1 (en) | Personal audio analytics and behavior modification feedback | |
KR102114102B1 (en) | Voice amplfying system through neural network | |
WO2024058147A1 (en) | Processing device, output device, and processing system | |
US20230239617A1 (en) | Ear-worn device and reproduction method | |
JP2023168010A (en) | Voice signal processing device and voice signal processing method | |
JPH11109987A (en) | Speech recognition device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201217 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210825 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210917 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6948275 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |