JP6813176B2 - 音声抑制システム及び音声抑制装置 - Google Patents
音声抑制システム及び音声抑制装置 Download PDFInfo
- Publication number
- JP6813176B2 JP6813176B2 JP2016203591A JP2016203591A JP6813176B2 JP 6813176 B2 JP6813176 B2 JP 6813176B2 JP 2016203591 A JP2016203591 A JP 2016203591A JP 2016203591 A JP2016203591 A JP 2016203591A JP 6813176 B2 JP6813176 B2 JP 6813176B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- signal
- mouth
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims description 41
- 230000006854 communication Effects 0.000 claims description 45
- 238000004891 communication Methods 0.000 claims description 44
- 238000000605 extraction Methods 0.000 claims description 32
- 230000033001 locomotion Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 18
- 230000005540 biological transmission Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 5
- 210000005069 ears Anatomy 0.000 claims description 2
- 238000000034 method Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 6
- 210000003128 head Anatomy 0.000 description 3
- 210000003027 ear inner Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Description
以下、本発明にかかる音声抑制システムの一実施の形態について図面を参照しながら説明する。
以下、制御部30の各構成部の機能について図4を参照して説明する。図4は、制御部30の構成例を示す図である。
<読唇通信における通話処理の内容>
以下、読唇通信における通話処理の内容を、図5を参照して説明する。図5は、読唇通信における連続通話処理の流れを示すフローチャートである。まず、携帯端末装置10のタッチパネル50に発信画面を表示させ、通話先の電話番号の入力と発信ボタンの選択を促す(ステップS101)。
文字抽出部110が、所定時間以上唇の動きが停止したと判定した場合(ステップS111で「YES」の場合)、文字抽出部110は処理をステップS105に戻す。文字抽出部110が、所定時間以上唇の動きが停止したと判定しない場合(ステップS111で「NO」の場合)、文字抽出部110は処理をステップS107に戻し、再度文字抽出処理を行う。
上記した文字抽出処理の方法について、特に文字抽出の対象となる辞書情報と、読唇処理での辞書情報の使用方法について図6を参照して説明する。図6は読唇処理手順の概要を示す図である。
本実施の形態では、カメラユニット8が発話者の口元の画像を取得し、文字抽出部110により口元の画像から文字が抽出され、音声生成部120により文字から音声が生成される。通信部140は生成された音声を通話先に送信する。これにより、例え発話者が発声しなくとも、発話者が口の動きで示した文字を通話先に伝えることができるので、発話者自身の発話音声が周囲に漏れず、又は他人に聞き取れない程度の音量で発話することができるので、周辺環境を気にすることなく通話することができる。
以下、本発明に係る音声抑制装置の一実施の形態について図7を参照しながら説明する。
本実施の形態では、カメラユニット8が発話者の口元の画像を取得し、ヘッドセット2内の制御部により口元の画像から抽出された文字から音声が生成され、その音声が通話先に送信される。ヘッドセット単体で、発声しなくとも発話者が口の動きで示した文字を通話先に伝えることができるので、発話者自身の発話音声が周囲に漏れず、又は他人に聞き取れない程度の音量で発話することができる。
また、文字抽出部110が制御部30内にあり、音声生成部120と、表示部130と、通信部140と、入力部150と、音声取得部160は携帯端末装置10側の制御部にあっても良い(図示省略)。例えば、携帯端末装置10のアプリケーションが音声生成部120の役割を果たすことができる。この場合、制御部30内の文字抽出部110にて読唇結果が文字テキストに変換されているので、通信量としては単なるテキストメッセージを送るのと同じ量となる。そのため、通信時のデータ送信が軽くて済み、ユーザに取っても通信コストが下がり、使い勝手の良いものとなる。また、本アイデアは通話を前提にしているが、音声を生成するとともに文字テキストを表示、記録することも可能である。また、機能によっては音声を生成せずに文字テキストを表示、記録することも、使い方としては可能である。
2 ヘッドセット(送受話装置)
3 アーム部
4 ハウジング部
8 カメラユニット
10 携帯端末装置
11 送話マイク
13 通信部
15 スピーカ
20 入出力I/F(入力I/F)
21 入出力I/F(出力I/F)
28 加算器
30 制御部
40 記憶部
50 タッチパネル
60 CPU
65 メモリ
70 補助記憶装置
80 ネットワークI/F
100 携帯端末装置
110 文字抽出部
118 音声取得部
120 音声生成部
130 表示部
140 通信部
150 入力部
160 音声取得部
200 辞書情報
201 レコード
210 読唇エンジン
221 動画像
222 推定結果
300 音声抑制装置
A,B,C 動画像
S2 :受話信号
Claims (7)
- 発話音声を抑制する音声抑制システムであって、
発話者の耳元に配置されたスピーカと、
発話者の口元周辺に配置され、口の動きの画像を取得する画像取得手段と、
自己の音声により発話したいときに用いられ、発話音源に向かう方向に指向性を有し、自己の音声信号を入力する第1のマイクと、
を備えた送受話装置と、
前記画像取得手段により取得された前記画像に基づいて前記口の動きに対応する音声信号を生成する生成手段と、
生成された前記音声信号を相手側携帯端末に送信する送信手段とを、
備えた携帯端末とを有し、
前記相手側携帯端末から送信された受話信号が前記携帯端末を介して前記スピーカに入力され、
前記第1のマイクと前記画像取得手段は所定間隔離れて配置され、
前記第1のマイクから取得された音声が所定の音量以上である場合、前記送信手段は発話者に対して警告音を送信して注意を促す、
ことを特徴とする音声抑制システム。 - 前記携帯端末は、
前記画像取得手段により取得された前記画像に基づいて、前記口の動きに対応する文字を抽出する文字抽出部と、
前記文字抽出部により抽出された前記文字に対応する音声信号を生成する音声生成部とを更に有し、
前記送信手段は、生成された前記音声信号を前記相手側携帯端末に送信し、
前記音声生成部は、あらかじめ記憶部に記憶された発話者の文章や単語に基づいてアクセント又はイントネーションのついた音声信号として生成する、
ことを特徴とする請求項1に記載の音声抑制システム。 - 前記送受話装置と前記携帯端末との間の無線接続は、Bluetooth(登録商標)規格に準拠することを特徴とする請求項1又は2に記載の音声抑制システム。
- 前記スピーカは耳を収容するハウジング内に配置され、ハウジングには口元まで延在する屈曲自在なアームが形成され、該アームの表面であって前記口元の周辺に前記画像取得手段が装着されている、
ことを特徴とする請求項1〜3のいずれか一項に記載の音声抑制システム。 - 前記スピーカ周辺の音と前記受話信号を検出する第2のマイクと、
前記第2のマイクで検出された信号と前記受話信号の差分信号を位相反転させた信号を生成し、前記スピーカに入力する信号処理手段とを有する、
ことを特徴とする請求項1〜4のいずれか一項に記載の音声抑制システム。 - 発話音声を抑制する音声抑制装置であって、
発話者の耳元に配置されたスピーカと、
発話者の口元周辺に配置され、口の動きの画像を取得する画像取得手段と、
自己の音声により発話したいときに用いられ、発話音源に向かう方向に指向性を有し、自己の音声信号を入力するマイクと、
前記画像取得手段により取得された前記画像に基づいて前記口の動きに対応する音声信号を生成する生成手段と、
生成された前記音声信号を相手側の通話端末に送信する音声通信手段とを有し、
前記相手側の通話端末からの受話信号が前記音声通信手段を介して前記スピーカに入力され、
前記マイクと前記画像取得手段は所定間隔離れて配置され、
前記マイクから取得された音声が所定の音量以上である場合、前記音声通信手段は発話者に対して警告音を送信して注意を促す、
ことを特徴とする音声抑制装置。 - 前記画像取得手段により取得された前記画像に基づいて前記口の動きに対応する文字を抽出する文字抽出部と、
前記文字抽出部により抽出された前記文字を用いて音声信号を生成する音声生成部とを更に有し、
前記音声生成部は、あらかじめ記憶部に記憶された発話者の文章や単語に基づいてアクセント又はイントネーションのついた音声信号として生成する、
ことを特徴とする請求項6に記載の音声抑制装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016203591A JP6813176B2 (ja) | 2016-10-17 | 2016-10-17 | 音声抑制システム及び音声抑制装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016203591A JP6813176B2 (ja) | 2016-10-17 | 2016-10-17 | 音声抑制システム及び音声抑制装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018066780A JP2018066780A (ja) | 2018-04-26 |
JP6813176B2 true JP6813176B2 (ja) | 2021-01-13 |
Family
ID=62087086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016203591A Active JP6813176B2 (ja) | 2016-10-17 | 2016-10-17 | 音声抑制システム及び音声抑制装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6813176B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019208138A (ja) * | 2018-05-29 | 2019-12-05 | 住友電気工業株式会社 | 発話認識装置、及びコンピュータプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000068882A (ja) * | 1998-08-17 | 2000-03-03 | Matsushita Electric Ind Co Ltd | 無線通信装置 |
JP2003018278A (ja) * | 2001-07-02 | 2003-01-17 | Sony Corp | 通信装置 |
JP2009017175A (ja) * | 2007-07-04 | 2009-01-22 | Victor Co Of Japan Ltd | ヘッドホン |
JP2015220684A (ja) * | 2014-05-20 | 2015-12-07 | 株式会社ニコン | 携帯端末装置および読唇処理プログラム |
TWI576826B (zh) * | 2014-07-28 | 2017-04-01 | jing-feng Liu | Discourse Recognition System and Unit |
-
2016
- 2016-10-17 JP JP2016203591A patent/JP6813176B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018066780A (ja) | 2018-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105814913B (zh) | 对名字敏感的收听装置 | |
US9628596B1 (en) | Electronic device including a directional microphone | |
US9336786B2 (en) | Signal processing device, signal processing method, and storage medium | |
CN114080589A (zh) | 自动主动降噪(anr)控制以改善用户交互 | |
US20190138603A1 (en) | Coordinating Translation Request Metadata between Devices | |
JPWO2010150475A1 (ja) | 補聴器 | |
CN109360549B (zh) | 一种数据处理方法、穿戴设备和用于数据处理的装置 | |
JP2017527148A (ja) | 音質改善のための方法及びヘッドセット | |
US20140314242A1 (en) | Ambient Sound Enablement for Headsets | |
US11893997B2 (en) | Audio signal processing for automatic transcription using ear-wearable device | |
US20210090548A1 (en) | Translation system | |
JP6268033B2 (ja) | 携帯端末 | |
KR101693483B1 (ko) | 헤드셋의 하울링 및 에코 제거 방법 및 컴퓨터 프로그램 | |
JP6813176B2 (ja) | 音声抑制システム及び音声抑制装置 | |
US20230143588A1 (en) | Bone conduction transducers for privacy | |
KR101693482B1 (ko) | 하울링 및 에코 제거 기능을 갖는 헤드셋 | |
CN113596662B (zh) | 啸叫声的抑制方法、啸叫声的抑制装置、耳机及存储介质 | |
JP6813169B2 (ja) | 音声抑制装置 | |
CN115278441A (zh) | 语音检测方法、装置、耳机及存储介质 | |
JP2015220684A (ja) | 携帯端末装置および読唇処理プログラム | |
CN111694539B (zh) | 在听筒和扬声器之间切换的方法、装置及介质 | |
CN115065921A (zh) | 一种防止助听器啸叫的方法及装置 | |
CN111343420A (zh) | 一种语音增强方法及穿戴设备 | |
JP2019056893A (ja) | 会話装置 | |
US20230209239A1 (en) | Wireless headphone system with standalone microphone functionality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6813176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |