JP2016507772A - 音声データの伝送方法及び装置 - Google Patents
音声データの伝送方法及び装置 Download PDFInfo
- Publication number
- JP2016507772A JP2016507772A JP2015549951A JP2015549951A JP2016507772A JP 2016507772 A JP2016507772 A JP 2016507772A JP 2015549951 A JP2015549951 A JP 2015549951A JP 2015549951 A JP2015549951 A JP 2015549951A JP 2016507772 A JP2016507772 A JP 2016507772A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- vocabulary
- adjusted
- voice
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000005540 biological transmission Effects 0.000 title claims abstract description 30
- 238000012544 monitoring process Methods 0.000 claims abstract description 76
- 230000002996 emotional effect Effects 0.000 abstract description 55
- 230000002159 abnormal effect Effects 0.000 abstract description 34
- 230000000694 effects Effects 0.000 abstract description 25
- 238000004891 communication Methods 0.000 abstract description 15
- 230000008451 emotion Effects 0.000 description 68
- 230000008569 process Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 14
- 238000012937 correction Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000002889 sympathetic effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6025—Substation equipment, e.g. for use by subscribers including speech amplifiers implemented as integrated speech networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/18—Comparators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/20—Aspects of automatic or semi-automatic exchanges related to features of supplementary services
- H04M2203/2055—Line restrictions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/357—Autocues for dialog assistance
Abstract
Description
プリセットの調整しようとするセンテンスデータベースに基づいて、送信端が送信する必要がある音声データをモニタリングすることと、
上記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、上記音声データを調整することと、
調整した音声データを受信端に伝送することと、を含む。
上記音声データにおける特徴パラメータを抽出し、上記特徴パラメータと上記調整しようとするセンテンスデータベースに記憶された第1特徴パラメータとがマッチングするかどうかに基づいて、上記音声データをモニタリングすること、及び/又は、
上記音声データでの語彙を抽出し、上記語彙と上記調整しようとするセンテンスデータベースに記憶されたプリセット語彙とがマッチングするかどうかに基づいて、上記音声データをモニタリングすること、を含む。
上記音声データの基本周波数パラメータを取得し、設定した標準の音声フォーマットに従って、時間領域同期アルゴリズムと基本周波数調整パラメータにより上記音声データの基本周波数パラメータを調整すること、及び/又は、
上記音声データの音声エネルギーを取得し、設定した標準の音声フォーマットに従って、エネルギー調整パラメータにより上記音声エネルギーを調整すること、及び/又は、
設定した標準の音声フォーマットに従って上記音声データのセンテンスのタイムスパンを延長すること、を含む。
上記調整しようとするセンテンスデータベースにおいて上記プリセット語彙に対応する礼儀語彙が存在するかどうかを検索することと、
前記プリセット語彙に対応する礼儀語彙が存在する場合、上記礼儀語彙で上記プリセット語彙を引き替えることと、を含む。
プリセットの調整しようとするセンテンスデータベースに基づいて、送信端が送信する必要がある音声データをモニタリングするように設定されるモニタリングモジュール、
上記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、上記音声データを調整するように設定される調整モジュール、
調整した音声データを受信端に伝送するように設定される伝送モジュール、を含む。
上記音声データにおける特徴パラメータを抽出し、上記特徴パラメータと上記調整しようとするセンテンスデータベースに記憶された第1特徴パラメータとがマッチングするかどうかに基づいて、上記音声データをモニタリングするように設定される第1モニタリングユニット、及び/又は、
上記音声データでの語彙を抽出し、上記語彙と上記調整しようとするセンテンスデータベースに記憶されたプリセット語彙とがマッチングするかどうかに基づいて、上記音声データをモニタリングするように設定される第2モニタリングユニット、を含む。
警報信号を送信するように設定される警報モジュールを更に含む。
上記音声データの基本周波数パラメータを取得し、設定した標準の音声フォーマットに従って、時間領域同期アルゴリズムと基本周波数調整パラメータにより上記音声データの基本周波数パラメータを調整するように設定される第1調整ユニット、及び/又は、
上記音声データの音声エネルギーを取得し、設定した標準の音声フォーマットに従って、エネルギー調整パラメータにより上記音声エネルギーを調整するように設定される第2調整ユニット、及び/又は、
設定した標準の音声フォーマットに従って上記音声データのセンテンスのタイムスパンを延長するように設定される第3調整ユニット、を含む。
上記調整しようとするセンテンスデータベースにおいて上記プリセット語彙に対応する礼儀語彙が存在するかどうかを検索するように設定される検索ユニット、
上記検索ユニットの搜索結果がはいである場合、上記礼儀語彙で上記プリセット語彙を引き替えるように設定される切替ユニット、を更に含む。
プリセットの調整しようとするセンテンスデータベースに基づいて、送信端が送信する必要がある音声データをモニタリングするステップS102と、
上記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、上記音声データを調整するステップS104と、
調整した音声データを受信端に伝送するステップS106と、を含む。
調整モジュール20はモニタリングモジュール10に接続され、上記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、上記音声データを調整するように設定され、
伝送モジュール30は調整モジュール20に接続され、調整した音声データを受信端に伝送するように設定される。
第2モニタリングユニット14は、上記音声データでの語彙を抽出し、上記語彙と上記調整しようとするセンテンスデータベースに記憶されたプリセット語彙とがマッチングするかどうかに基づいて、上記音声データをモニタリングするように設定される。
第2調整ユニット24は第1調整ユニット22に接続され、上記音声データの音声エネルギーを取得し、設定した標準の音声フォーマットに従って、エネルギー調整パラメータにより上記音声エネルギーを調整するように設定され、及び/又は、
第3調整ユニット26は第2調整ユニット24に接続され、設定した標準の音声フォーマットに従って上記音声データのセンテンスのタイムスパンを延長するように設定される。
怒る際の音声の基音周期を抽出し、基音標記を行う第1ステップ、
感情音声データベースにおける基本周波数調整因子により、怒る際のセンテンス全体の基本周波数を正常な音声の際の基本周波数に調整する第2ステップ、
修正した基本要素を一定のスムージングアルゴリズムによりスプライシングする第3ステップ、という3つのステップに分けられて基音周波数の調整を完成することができる。
Claims (10)
- プリセットの調整しようとするセンテンスデータベースに基づいて、送信端の送信する必要がある音声データをモニタリングすることと、
前記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、前記音声データを調整することと、
調整した音声データを受信端に伝送することと、を含む音声データの伝送方法。 - プリセットの調整しようとするセンテンスデータベースに基づいて、送信端により送信される音声データをモニタリングするステップは、
前記音声データにおける特徴パラメータを抽出し、前記特徴パラメータと前記調整しようとするセンテンスデータベースに記憶された第1特徴パラメータとがマッチングするかどうかに基づいて、前記音声データをモニタリングすること、及び/又は、
前記音声データの中の語彙を抽出し、前記語彙と前記調整しようとするセンテンスデータベースに記憶されたプリセット語彙とがマッチングするかどうかに基づいて、前記音声データをモニタリングすること、を含む請求項1に記載の方法。 - 前記音声データを調整する必要があることをモニタリングしたステップの後、警報信号を送信することを更に含む請求項1に記載の方法。
- 設定した標準の音声フォーマットに従って前記音声データを調整するステップは、
前記音声データの基本周波数パラメータを取得し、設定した標準の音声フォーマットに従って、時間領域同期アルゴリズムと基本周波数調整パラメータにより前記音声データの基本周波数パラメータを調整すること、及び/又は、
前記音声データの音声エネルギーを取得し、設定した標準の音声フォーマットに従って、エネルギー調整パラメータにより前記音声エネルギーを調整すること、及び/又は、
設定した標準の音声フォーマットに従って前記音声データのセンテンスのタイムスパンを延長すること、を含む請求項1に記載の方法。 - 設定した標準の音声フォーマットに従って前記音声データを調整するステップは、
前記調整しようとするセンテンスデータベースにおいて前記プリセット語彙に対応する礼儀語彙が存在するかどうかを検索することと、
前記プリセット語彙に対応する礼儀語彙が存在する場合、前記礼儀語彙で前記プリセット語彙を引き替えることと、を含む請求項2に記載の方法。 - プリセットの調整しようとするセンテンスデータベースに基づいて、送信端の送信する必要がある音声データをモニタリングするように設定されるモニタリングモジュールと、
前記音声データを調整する必要があることをモニタリングした場合、設定した標準の音声フォーマットに従って、前記音声データを調整するように設定される調整モジュールと、
調整した音声データを受信端に伝送するように設定される伝送モジュールと、を含む音声データの伝送装置。 - 前記モニタリングモジュールは、
前記音声データにおける特徴パラメータを抽出し、前記特徴パラメータと前記調整しようとするセンテンスデータベースに記憶された第1特徴パラメータとがマッチングするかどうかに基づいて、前記音声データをモニタリングするように設定される第1モニタリングユニット、及び/又は、
前記音声データの中の語彙を抽出し、前記語彙と前記調整しようとするセンテンスデータベースに記憶されたプリセット語彙とがマッチングするかどうかに基づいて、前記音声データをモニタリングするように設定される第2モニタリングユニット、を含む請求項6に記載の装置。 - 警報信号を送信するように設定される警報モジュールを更に含む請求項6に記載の装置。
- 前記調整モジュールは、
前記音声データの基本周波数パラメータを取得し、設定した標準の音声フォーマットに従って、時間領域同期アルゴリズムと基本周波数調整パラメータにより前記音声データの基本周波数パラメータを調整するように設定される第1調整ユニット、及び/又は、
前記音声データの音声エネルギーを取得し、設定した標準の音声フォーマットに従って、エネルギー調整パラメータにより前記音声エネルギーを調整するように設定される第2調整ユニット、及び/又は、
設定した標準の音声フォーマットに従って前記音声データのセンテンスのタイムスパンを延長するように設定される第3調整ユニット、を含む請求項6に記載の装置。 - 前記調整モジュールは、
前記調整しようとするセンテンスデータベースにおいて前記プリセット語彙に対応する礼儀語彙が存在するかどうかを検索するように設定される検索ユニットと、
前記検索ユニットの搜索結果が存在するの場合、前記礼儀語彙で前記プリセット語彙を引き替えるように設定される切替ユニットとを更に含む請求項7に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210578430.2 | 2012-12-27 | ||
CN201210578430.2A CN103903627B (zh) | 2012-12-27 | 2012-12-27 | 一种语音数据的传输方法及装置 |
PCT/CN2013/079201 WO2013182118A1 (zh) | 2012-12-27 | 2013-07-11 | 一种语音数据的传输方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016507772A true JP2016507772A (ja) | 2016-03-10 |
JP6113302B2 JP6113302B2 (ja) | 2017-04-12 |
Family
ID=49711406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015549951A Active JP6113302B2 (ja) | 2012-12-27 | 2013-07-11 | 音声データの伝送方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20160196836A1 (ja) |
EP (1) | EP2928164A4 (ja) |
JP (1) | JP6113302B2 (ja) |
CN (1) | CN103903627B (ja) |
WO (1) | WO2013182118A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018159788A (ja) * | 2017-03-22 | 2018-10-11 | カシオ計算機株式会社 | 情報処理装置、方法及びプログラム |
JP2020126125A (ja) * | 2019-02-04 | 2020-08-20 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104113634A (zh) * | 2013-04-22 | 2014-10-22 | 三星电子(中国)研发中心 | 一种对语音进行处理的方法 |
CN104299622A (zh) * | 2014-09-23 | 2015-01-21 | 深圳市金立通信设备有限公司 | 一种音频处理方法 |
CN104284018A (zh) * | 2014-09-23 | 2015-01-14 | 深圳市金立通信设备有限公司 | 一种终端 |
CN105741854A (zh) * | 2014-12-12 | 2016-07-06 | 中兴通讯股份有限公司 | 一种语音信号的处理方法及终端 |
CN104538043A (zh) * | 2015-01-16 | 2015-04-22 | 北京邮电大学 | 一种通话中实时情感提示装置 |
WO2016133319A1 (en) * | 2015-02-16 | 2016-08-25 | Samsung Electronics Co., Ltd. | Method and device for providing information |
CN104616666B (zh) * | 2015-03-03 | 2018-05-25 | 广东小天才科技有限公司 | 一种基于语音分析改善对话沟通效果的方法及装置 |
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
CN105244026B (zh) * | 2015-08-24 | 2019-09-20 | 北京意匠文枢科技有限公司 | 一种语音处理方法及装置 |
CN105261362B (zh) * | 2015-09-07 | 2019-07-05 | 科大讯飞股份有限公司 | 一种通话语音监测方法及系统 |
CN106502938B (zh) * | 2015-09-08 | 2020-03-10 | 北京百度网讯科技有限公司 | 用于实现图像和语音交互的方法和装置 |
CN106572067B (zh) * | 2015-10-12 | 2020-05-12 | 阿里巴巴集团控股有限公司 | 语音流传送的方法及系统 |
CN105448300A (zh) * | 2015-11-12 | 2016-03-30 | 小米科技有限责任公司 | 用于通话的方法及装置 |
CN105681546A (zh) * | 2015-12-30 | 2016-06-15 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音处理的方法、装置以及终端 |
US10157626B2 (en) * | 2016-01-20 | 2018-12-18 | Harman International Industries, Incorporated | Voice affect modification |
CN105611026B (zh) * | 2016-01-22 | 2019-07-09 | 胡月鹏 | 一种调节通话音量的方法、装置及电子设备 |
JP6755304B2 (ja) * | 2016-04-26 | 2020-09-16 | 株式会社ソニー・インタラクティブエンタテインメント | 情報処理装置 |
US10734103B2 (en) * | 2016-08-29 | 2020-08-04 | Panasonic Intellectual Property Management Co., Ltd. | Stress management system and stress management method |
WO2018050212A1 (en) * | 2016-09-13 | 2018-03-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Telecommunication terminal with voice conversion |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
CN106992005A (zh) * | 2017-03-16 | 2017-07-28 | 维沃移动通信有限公司 | 一种语音输入方法及移动终端 |
EP3392884A1 (en) * | 2017-04-21 | 2018-10-24 | audEERING GmbH | A method for automatic affective state inference and an automated affective state inference system |
US10659404B2 (en) * | 2017-08-21 | 2020-05-19 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method, information processing device, and recording medium storing information processing program |
CN107886963B (zh) * | 2017-11-03 | 2019-10-11 | 珠海格力电器股份有限公司 | 一种语音处理的方法、装置及电子设备 |
CN108494952B (zh) * | 2018-03-05 | 2021-07-09 | Oppo广东移动通信有限公司 | 语音通话处理方法及相关设备 |
CN108630224B (zh) * | 2018-03-22 | 2020-06-09 | 云知声智能科技股份有限公司 | 控制语速的方法及装置 |
CN112334981A (zh) | 2018-05-31 | 2021-02-05 | 舒尔获得控股公司 | 用于自动混合的智能语音启动的系统及方法 |
EP3804356A1 (en) | 2018-06-01 | 2021-04-14 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
CN109005272B (zh) * | 2018-07-24 | 2021-01-29 | Oppo(重庆)智能科技有限公司 | 语音拾取方法及相关产品 |
US10896689B2 (en) * | 2018-07-27 | 2021-01-19 | International Business Machines Corporation | Voice tonal control system to change perceived cognitive state |
CN109274819A (zh) * | 2018-09-13 | 2019-01-25 | 广东小天才科技有限公司 | 通话时用户情绪调整方法、装置、移动终端及存储介质 |
CN112889296A (zh) | 2018-09-20 | 2021-06-01 | 舒尔获得控股公司 | 用于阵列麦克风的可调整的波瓣形状 |
CN109545200A (zh) * | 2018-10-31 | 2019-03-29 | 深圳大普微电子科技有限公司 | 编辑语音内容的方法及存储装置 |
JP2022526761A (ja) | 2019-03-21 | 2022-05-26 | シュアー アクイジッション ホールディングス インコーポレイテッド | 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置 |
EP3942842A1 (en) | 2019-03-21 | 2022-01-26 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
CN109977411B (zh) * | 2019-03-28 | 2022-03-25 | 联想(北京)有限公司 | 一种数据处理方法、装置及电子设备 |
CN109951607B (zh) * | 2019-03-29 | 2021-01-26 | 努比亚技术有限公司 | 一种内容处理方法、终端及计算机可读存储介质 |
EP3942552A1 (en) * | 2019-04-05 | 2022-01-26 | Huawei Technologies Co., Ltd. | Methods and systems that provide emotion modifications during video chats |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
EP3977449A1 (en) | 2019-05-31 | 2022-04-06 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
CN110138654B (zh) * | 2019-06-06 | 2022-02-11 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
WO2021041275A1 (en) | 2019-08-23 | 2021-03-04 | Shore Acquisition Holdings, Inc. | Two-dimensional microphone array with improved directivity |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
JP7248615B2 (ja) * | 2020-03-19 | 2023-03-29 | ヤフー株式会社 | 出力装置、出力方法及び出力プログラム |
US11706562B2 (en) | 2020-05-29 | 2023-07-18 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
JP2024505068A (ja) | 2021-01-28 | 2024-02-02 | シュアー アクイジッション ホールディングス インコーポレイテッド | ハイブリッドオーディオビーム形成システム |
CN112860213B (zh) * | 2021-03-09 | 2023-08-25 | 腾讯科技(深圳)有限公司 | 音频的处理方法和装置、存储介质及电子设备 |
CN113113047A (zh) * | 2021-03-17 | 2021-07-13 | 北京大米科技有限公司 | 一种音频处理的方法、装置、可读存储介质和电子设备 |
CN113254250B (zh) * | 2021-06-16 | 2022-01-04 | 阿里云计算有限公司 | 数据库服务器异常成因检测方法、装置、设备和存储介质 |
CN117316191A (zh) * | 2023-11-30 | 2023-12-29 | 天津科立尔科技有限公司 | 一种情绪监测分析方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000503511A (ja) * | 1996-11-14 | 2000-03-21 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | テレビジョン番組表示の内容による禁止 |
JP2007003700A (ja) * | 2005-06-22 | 2007-01-11 | Oki Electric Ind Co Ltd | 商品販売支援装置 |
WO2009011021A1 (ja) * | 2007-07-13 | 2009-01-22 | Panasonic Corporation | 話速変換装置及び話速変換方法 |
JP2010103751A (ja) * | 2008-10-23 | 2010-05-06 | Yahoo Japan Corp | 禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ |
JP2012181469A (ja) * | 2011-03-03 | 2012-09-20 | Sony Corp | 送信装置、受信装置、送信方法、受信方法、通信システム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6463415B2 (en) * | 1999-08-31 | 2002-10-08 | Accenture Llp | 69voice authentication system and method for regulating border crossing |
US7085719B1 (en) * | 2000-07-13 | 2006-08-01 | Rockwell Electronics Commerce Technologies Llc | Voice filter for normalizing an agents response by altering emotional and word content |
TWI221574B (en) * | 2000-09-13 | 2004-10-01 | Agi Inc | Sentiment sensing method, perception generation method and device thereof and software |
EP1282113B1 (en) * | 2001-08-02 | 2005-01-12 | Sony International (Europe) GmbH | Method for detecting emotions from speech using speaker identification |
US6996526B2 (en) * | 2002-01-02 | 2006-02-07 | International Business Machines Corporation | Method and apparatus for transcribing speech when a plurality of speakers are participating |
FR2839836B1 (fr) * | 2002-05-16 | 2004-09-10 | Cit Alcatel | Terminal de telecommunication permettant de modifier la voix transmise lors d'une communication telephonique |
CN1645363A (zh) * | 2005-01-04 | 2005-07-27 | 华南理工大学 | 便携式即时方言互译装置及其方法 |
US7706510B2 (en) * | 2005-03-16 | 2010-04-27 | Research In Motion | System and method for personalized text-to-voice synthesis |
US20070286386A1 (en) * | 2005-11-28 | 2007-12-13 | Jeffrey Denenberg | Courteous phone usage system |
US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
WO2007120734A2 (en) * | 2006-04-11 | 2007-10-25 | Noise Free Wireless, Inc. | Environmental noise reduction and cancellation for cellular telephone and voice over internet packets (voip) communication devices |
WO2010041507A1 (ja) * | 2008-10-10 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 会話における特定状況を抽出するシステムおよび方法 |
CN101420665A (zh) * | 2008-12-11 | 2009-04-29 | 北京邮电大学 | 基于情绪检测技术实现情绪检测与指导业务的系统和方法 |
CN101662546A (zh) * | 2009-09-16 | 2010-03-03 | 中兴通讯股份有限公司 | 情绪监控的方法及装置 |
CN101789990A (zh) * | 2009-12-23 | 2010-07-28 | 宇龙计算机通信科技(深圳)有限公司 | 一种在通话过程中判断对方情绪的方法及移动终端 |
US20120189129A1 (en) * | 2011-01-26 | 2012-07-26 | TrackThings LLC | Apparatus for Aiding and Informing a User |
JP5602653B2 (ja) * | 2011-01-31 | 2014-10-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、情報処理方法、情報処理システム、およびプログラム |
CN102184731A (zh) * | 2011-05-12 | 2011-09-14 | 北京航空航天大学 | 一种韵律类和音质类参数相结合的情感语音转换方法 |
US20170006161A9 (en) * | 2013-03-15 | 2017-01-05 | Genesys Telecommunications Laboratories, Inc. | Intelligent automated agent for a contact center |
US10405786B2 (en) * | 2013-10-09 | 2019-09-10 | Nedim T. SAHIN | Systems, environment and methods for evaluation and management of autism spectrum disorder using a wearable data collection device |
-
2012
- 2012-12-27 CN CN201210578430.2A patent/CN103903627B/zh active Active
-
2013
- 2013-07-11 JP JP2015549951A patent/JP6113302B2/ja active Active
- 2013-07-11 WO PCT/CN2013/079201 patent/WO2013182118A1/zh active Application Filing
- 2013-07-11 EP EP13800387.6A patent/EP2928164A4/en not_active Withdrawn
- 2013-07-11 US US14/655,442 patent/US20160196836A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000503511A (ja) * | 1996-11-14 | 2000-03-21 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | テレビジョン番組表示の内容による禁止 |
JP2007003700A (ja) * | 2005-06-22 | 2007-01-11 | Oki Electric Ind Co Ltd | 商品販売支援装置 |
WO2009011021A1 (ja) * | 2007-07-13 | 2009-01-22 | Panasonic Corporation | 話速変換装置及び話速変換方法 |
JP2010103751A (ja) * | 2008-10-23 | 2010-05-06 | Yahoo Japan Corp | 禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ |
JP2012181469A (ja) * | 2011-03-03 | 2012-09-20 | Sony Corp | 送信装置、受信装置、送信方法、受信方法、通信システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018159788A (ja) * | 2017-03-22 | 2018-10-11 | カシオ計算機株式会社 | 情報処理装置、方法及びプログラム |
JP2020126125A (ja) * | 2019-02-04 | 2020-08-20 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
JP7230545B2 (ja) | 2019-02-04 | 2023-03-01 | 富士通株式会社 | 音声処理プログラム、音声処理方法および音声処理装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103903627A (zh) | 2014-07-02 |
WO2013182118A1 (zh) | 2013-12-12 |
EP2928164A1 (en) | 2015-10-07 |
CN103903627B (zh) | 2018-06-19 |
US20160196836A1 (en) | 2016-07-07 |
EP2928164A4 (en) | 2015-12-30 |
JP6113302B2 (ja) | 2017-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6113302B2 (ja) | 音声データの伝送方法及び装置 | |
JP6945695B2 (ja) | 発話分類器 | |
JP6374028B2 (ja) | 音声プロファイルの管理および発話信号の生成 | |
WO2017206256A1 (zh) | 一种语速自动调节的方法及终端 | |
US9711135B2 (en) | Electronic devices and methods for compensating for environmental noise in text-to-speech applications | |
WO2021051506A1 (zh) | 语音交互方法、装置、计算机设备及存储介质 | |
JP5750380B2 (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
US20220122579A1 (en) | End-to-end speech conversion | |
JP2023022150A (ja) | 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム | |
CN102903361A (zh) | 一种通话即时翻译系统和方法 | |
US11587547B2 (en) | Electronic apparatus and method for controlling thereof | |
KR102056330B1 (ko) | 통역장치 및 그 방법 | |
US9208798B2 (en) | Dynamic control of voice codec data rate | |
JP2020071675A (ja) | 対話要約生成装置、対話要約生成方法およびプログラム | |
JP2020071676A (ja) | 対話要約生成装置、対話要約生成方法およびプログラム | |
JP6599828B2 (ja) | 音処理方法、音処理装置、及びプログラム | |
CN110767233A (zh) | 一种语音转换系统及方法 | |
WO2014077182A1 (ja) | 携帯情報端末、シャドー音声管理方法及びコンピュータプログラム | |
KR101959439B1 (ko) | 통역방법 | |
KR102056329B1 (ko) | 통역방법 | |
JP2016186646A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP2015187738A (ja) | 音声翻訳装置、音声翻訳方法および音声翻訳プログラム | |
JP2003233389A (ja) | アニメーション画像生成装置、及び同装置を内蔵した携帯電話、並びにアニメーション画像生成方法 | |
JP6918471B2 (ja) | 対話補助システムの制御方法、対話補助システム、及び、プログラム | |
KR20230153854A (ko) | 사용자 단말, 사용자 단말의 제어 방법 및 대화 관리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6113302 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |