JP2020194021A - 音声処理装置、音声処理方法およびプログラム - Google Patents
音声処理装置、音声処理方法およびプログラム Download PDFInfo
- Publication number
- JP2020194021A JP2020194021A JP2019098186A JP2019098186A JP2020194021A JP 2020194021 A JP2020194021 A JP 2020194021A JP 2019098186 A JP2019098186 A JP 2019098186A JP 2019098186 A JP2019098186 A JP 2019098186A JP 2020194021 A JP2020194021 A JP 2020194021A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- user
- conversation device
- volume
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims description 3
- 230000000694 effects Effects 0.000 abstract description 18
- 238000000034 method Methods 0.000 abstract description 13
- 239000012141 concentrate Substances 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 description 45
- 238000004891 communication Methods 0.000 description 43
- 238000004364 calculation method Methods 0.000 description 32
- 230000005540 biological transmission Effects 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000001133 acceleration Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
まず、本発明の第1の実施形態について説明する。
本発明の第1の実施形態に係る音声会話システムの構成例について説明する。
本発明の第1の実施形態に係る音声会話システム1の動作例について説明する。
上記したように、第1の音声会話装置10の通話制御部140は、利用者が操作可能な操作部および表示部(画面)を含んでいる。利用者は、画面を見ながら、音声コミュニケーションの相手となる第2の音声会話装置20、音声コミュニケーションの開始、音声コミュニケーションの切断それぞれの指定を操作部に対して行う。
続いて、第1の音声会話装置10の利用者が発言すると、第1の音声会話装置10の音声入力部110が、第1の音声会話装置10の利用者の発言に相当する音声信号(音響振動)をマイクロフォンによって入力する。第1の音声会話装置10の音声入力部110は、入力した音声信号(音響振動)をアナログデータからデジタルデータに変換し、デジタルデータを音声入力データとして音声送信部120および音量検出部130それぞれに出力する。
第2の音声会話装置20の利用者が発言すると、「(1)音声コミュニケーションの開始」と同様な動作を経て、第1の音声会話装置10の音声受信部150は、第2の音声ストリームデータを受信する。第1の音声会話装置10の音声受信部150は、第2の音声ストリームデータを音声信号に相当するデジタルデータに復号し、音声復号データとして音量制御部160に出力する。
一方、第1の音声会話装置10の音量検出部130は、音声入力データを入力すると、音量入力データに基づいて所定期間(例えば、10秒間)毎に音量を計算し、音量データとして音量制御部160に出力する。音量の計算方法としては、公知の方法が用いられてよいが、本発明の実施形態では、音声入力データからスペクトルエントロピー法を用いて音声区間検出を行い、検出した音声区間の音声入力データのRMS(Root Mean Square)を計算し、計算したRMSを音量データとして使用する場合を想定する。
本発明の実施形態においては、第1の音声会話装置10と第2の音声会話装置20との間の音声コミュニケーションが常時接続された状態で運用されることを想定する。しかし、例えば、第1の音声会話装置10の利用者は、音声コミュニケーションを切断する場合には、第1の音声会話装置10の通話制御部140の操作画面に対して、音声コミュニケーションの切断を指定すればよい。このとき、第1の音声会話装置10の通話制御部140は、音声コミュニケーションの切断に必要な情報を第1の通話制御データとして生成し、ネットワークを介して通話制御サーバー30に出力する。
以上のように、本発明の第1の実施形態によれば、第1の音声会話装置10に入力される音声の音量に基づいて、第2の音声会話装置20に入力される音声の音量が調整され、音量調整後の音声が第1の音声会話装置10から出力される。一例として、他者が集中して活動を行っている空間においては、音声会話装置の利用者は当該他者の集中を妨げないよう小さい声で発言する場合が想定されるが、かかる場合には、遠隔地に存在する相手の発言も当該空間において小さい音量で聞こえるので、他者は会話音声を耳障りに感じにくく、自分自身の活動に集中できるという効果がある。
続いて、本発明の第2の実施形態について説明する。
本発明の第2の実施形態に係る音声会話システムの構成例について説明する。
本発明の第2の実施形態に係る音声会話システム2の動作例について説明する。
集中度検出システム40は、所定期間(例えば、1分)毎に第1の集中度データを計算し、第1の音声会話装置10の音量制御部180に出力する。以下、集中度検出システム40の動作について、図5を参照しながら詳細に説明する。
以上のように、本発明の第2の実施形態によれば、集中度検出システム40によって検出される第1の音声会話装置12の周囲の第1の集中度データに基づいて、第2の音声会話装置22に入力される音声の音量が調整され、音量調整後の音声が第1の音声会話装置12から出力される。一例として、他者が集中して活動を行っている空間においては、遠隔地に存在する相手の発言も当該空間において小さい音量で聞こえるので、他者は会話音声を耳障りに感じにくく、自分自身の活動に集中できるという効果がある。
続いて、本実施形態に係る音声会話装置の例としてのデータ処理装置のハードウェア構成例について説明する。図8は、本実施形態に係る音声会話装置の例としてのデータ処理装置のハードウェア構成を示す図である。なお、通話制御サーバー30、センサ端末42、集中度計算装置43および会話者特定装置44それぞれのハードウェア構成も、図8に示されたデータ処理装置90のハードウェア構成と同様に実現されてよい。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
10、12 第1の音声会話装置
20、22 第2の音声会話装置
30 通話制御サーバー
40 集中度検出システム
42 センサ端末
43 集中度計算装置
44 会話者特定装置
110 音声入力部
120 音声送信部
130 音量検出部
140 通話制御部
150 音声受信部
160、180 音量制御部
161、181 ゲイン計算部
162、182 音声データ変換部
170 音声出力部
Claims (11)
- 第1の音声会話装置が置かれた空間に関する情報と、第2の音声会話装置に入力された第2の利用者の音声信号の音の特徴とに基づいて、前記第1の音声会話装置から第1の利用者に出力される前記第2の利用者の前記音声信号の音の特徴を制御する制御部を備える、
音声処理装置。 - 前記空間に関する情報は、前記第1の利用者の音声信号の音の特徴を含む、
請求項1に記載の音声処理装置。 - 前記制御部は、前記第1の利用者の音声信号の音の特徴に適合するように、前記第2の利用者の前記音声信号の音の特徴を制御する、
請求項2に記載の音声処理装置。 - 前記第1の利用者および前記第2の利用者それぞれの音声信号の音の特徴は、音量、音のトーン、音のピッチまたは音の抑揚である、
請求項2または3に記載の音声処理装置。 - 前記空間に関する情報は、前記第1の音声会話装置の周囲の集中度データを含む、
請求項1に記載の音声処理装置。 - 前記空間に関する情報は、前記集中度データに対応する目標の音の特徴に適合するように、前記第2の利用者の前記音声信号の音の特徴を制御する、
請求項5に記載の音声処理装置。 - 前記集中度データに対応する目標の音の特徴および前記第2の利用者の音声信号の音の特徴それぞれは、音量、音のトーン、音のピッチまたは音の抑揚である、
請求項5または6に記載の音声処理装置。 - 前記音声処理装置は、前記第1の音声会話装置または前記第2の音声会話装置の内部に存在する、
請求項1〜7のいずれか一項に記載の音声処理装置。 - 前記音声処理装置は、前記第1の音声会話装置および前記第2の音声会話装置とは異なる装置の内部に存在する、
請求項1〜7のいずれか一項に記載の音声処理装置。 - 第1の音声会話装置が置かれた空間に関する情報と、第2の音声会話装置に入力された第2の利用者の音声信号の音の特徴とに基づいて、前記第1の音声会話装置から第1の利用者に出力される前記第2の利用者の前記音声信号の音の特徴を制御することを含む、
音声処理方法。 - コンピュータを、
第1の音声会話装置が置かれた空間に関する情報と、第2の音声会話装置に入力された第2の利用者の音声信号の音の特徴とに基づいて、前記第1の音声会話装置から第1の利用者に出力される前記第2の利用者の前記音声信号の音の特徴を制御する制御部を備える、
音声処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019098186A JP7293863B2 (ja) | 2019-05-27 | 2019-05-27 | 音声処理装置、音声処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019098186A JP7293863B2 (ja) | 2019-05-27 | 2019-05-27 | 音声処理装置、音声処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020194021A true JP2020194021A (ja) | 2020-12-03 |
JP7293863B2 JP7293863B2 (ja) | 2023-06-20 |
Family
ID=73546364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019098186A Active JP7293863B2 (ja) | 2019-05-27 | 2019-05-27 | 音声処理装置、音声処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7293863B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018046452A (ja) * | 2016-09-15 | 2018-03-22 | 沖電気工業株式会社 | 信号処理装置、プログラム及び方法、並びに、通話装置 |
-
2019
- 2019-05-27 JP JP2019098186A patent/JP7293863B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018046452A (ja) * | 2016-09-15 | 2018-03-22 | 沖電気工業株式会社 | 信号処理装置、プログラム及び方法、並びに、通話装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7293863B2 (ja) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101176732B1 (ko) | 이동장치 상의 음성 향상 복합 센서에 대한 방법 및 장치 | |
US12015874B2 (en) | System and methods to determine readiness in video collaboration | |
CN111147444B (zh) | 一种交互方法及电子设备 | |
WO2016178329A1 (ja) | 情報処理システム、制御方法、および記憶媒体 | |
US10405096B2 (en) | Directed audio system for audio privacy and audio stream customization | |
CN110035250A (zh) | 音频处理方法、处理设备、终端及计算机可读存储介质 | |
KR101555828B1 (ko) | 청진 신호의 환경 잡음을 감소시키고, 전자 청진기로 환자를 청진하면서 코멘트들을 기록하기 위한 애플리케이션 서버 | |
WO2016157993A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2020194021A (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP2020086027A (ja) | 音声再生システムおよびプログラム | |
WO2018168247A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
Olaosun et al. | Assistive technology for hearing and speech disorders | |
JP2005151002A (ja) | 遠隔会議システム | |
RU2660600C2 (ru) | Способ общения глухих (слабослышащих) со слышащими | |
JPH11308591A (ja) | 情報通信システム | |
JP2020086048A (ja) | 音声認識システム、及び音声認識方法 | |
JP3227725U (ja) | 文字表示機能付き補聴システム | |
JP2023009574A (ja) | 制御装置、制御システム、方法および利用者端末 | |
JPWO2020148978A1 (ja) | 情報処理装置及び情報処理方法 | |
KR20230014424A (ko) | 비대면 율동 교육 장치 및 비대면 율동 교육 방법 | |
CN117714426A (zh) | 用于视听会议中的可穿戴音频设备的动态音频馈送 | |
WO2017187674A1 (ja) | 情報処理装置、情報処理システム、及びプログラム | |
JP2018133652A (ja) | 通信装置、方法およびプログラム | |
JP2019191473A (ja) | カラオケシステム | |
Swann | Helpful vibrations: Assistive devices in hearing loss |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7293863 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |