JP6807491B1 - 補聴器用合成音声セットの修正方法 - Google Patents
補聴器用合成音声セットの修正方法 Download PDFInfo
- Publication number
- JP6807491B1 JP6807491B1 JP2020536900A JP2020536900A JP6807491B1 JP 6807491 B1 JP6807491 B1 JP 6807491B1 JP 2020536900 A JP2020536900 A JP 2020536900A JP 2020536900 A JP2020536900 A JP 2020536900A JP 6807491 B1 JP6807491 B1 JP 6807491B1
- Authority
- JP
- Japan
- Prior art keywords
- voice
- synthetic
- inspection
- processing
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007689 inspection Methods 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 74
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims description 175
- 238000003672 processing method Methods 0.000 claims description 86
- 230000008569 process Effects 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 abstract description 11
- 238000003786 synthesis reaction Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 29
- 238000012937 correction Methods 0.000 description 24
- 238000004891 communication Methods 0.000 description 13
- 230000010365 information processing Effects 0.000 description 13
- 230000004044 response Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/70—Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Abstract
Description
図1は、本発明の実施形態に係る音声処理装置1の構成の一例を示す図である。音声処理装置1は、合成音声方式又は入力音声加工方式により、入力された音声(例えば、話者の発話音声)に基づく音声出力を行う装置である。ここで、合成音声方式は、所定の合成音声データに基づいて音声合成を行う方式である。また、入力音声加工方式は、入力された音声自体に対して所定の加工処理を行い、当該加工処理によって生成される音声を出力する方式である。
(2−1)語音検査
図3は、音声処理装置1による語音検査処理を説明するための動作フロー図の一例である。当該処理では、音声処理装置1は、検査用合成音声セットに基づいた検査用合成音声や加工検査用合成音声を出力した上で使用者からの回答を受け付ける。
図5Aは、補聴器用合成音声セットの修正処理に係る動作フロー図の一例を示す図である。
図5Bは、図2Cに示す音素ラベル毎の加工処理方法セットの修正処理に係る動作フロー図の一例を示す図である。
例えば処理部7は、上記「(2−1)語音検査」の回答に基づいてm図2Dに示す子音グループ毎の加工処理方法セットを生成することができる。例えば、処理部7は、語音検査において「(1)無声子音」に属する検査用合成音声に対する複数の回答に基づいて、「(1)無声子音」に対応する加工処理方法F(1)を生成してもよい。この際、不正解の回答が多いほど、加工処理の度合いを強めてもよい。加工処理は、子音の音素の音圧の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、及び話速の変換等であってよい。
図6Aは、合成音声方式による補聴処理に係る動作フロー図の一例を示す図である。
図6Bは、入力音声加工方式による補聴処理に係る動作フロー図の一例を示す図である。
図6Cは、入力音声加工方式による補聴処理に係る動作フロー図の他の一例を示す図である。
本発明の他の実施形態においては、語音検査装置1Aと補聴器1Bとが個別の情報処理装置として構成されてもよい。このように語音検査装置1Aと補聴器1Bとを個別の情報処理装置として構成することにより、補聴器1Bを小型化できるという利点がある。特に、本発明の種々の実施形態においては、入力された音声の音響分析をするため、補聴器1Bの容量を小型化できる。
Claims (12)
- 複数の音素ラベルのそれぞれについて検査用合成音声を出力するための検査用合成音声データが対応付けられた検査用合成音声セットを用いた検査の結果に基づいて、前記複数の音素ラベルのそれぞれについて補聴器用合成音声を出力するための補聴器用合成音声データが対応付けられた補聴器用合成音声セットを修正する方法であって、
前記検査用合成音声セットにおいて第1音素ラベルに対応付けられた第1検査用合成音声データに基づいて、第1検査用合成音声を出力するステップと、
出力された前記第1検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第1回答を受け付けるステップと、
前記検査用合成音声セットにおいて第2音素ラベルに対応付けられた第2検査用合成音声データに基づいて第2検査用合成音声を出力するステップと、
出力された前記第2検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第2回答を受け付けるステップと、
前記第1回答が前記第2音素ラベルに一致し、且つ前記第2回答が前記第2音素ラベルに一致しない場合、前記補聴器用合成音声セットにおいて、前記第2音素ラベルに対応付けられた第2補聴器用合成音声データに代えて前記第1音素ラベルに対応付けられた第1補聴器用合成音声データを前記第2音素ラベルに対応付けるステップと、を含む、方法。 - 前記第2検査用合成音声データを加工処理した加工検査用合成音声データに基づいて加工検査用合成音声を出力するステップと、
出力された前記加工検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第3回答を受け付けるステップと、
前記第3回答が前記第2音素ラベルに一致する場合、前記補聴器用合成音声セットにおいて、前記第2音素ラベルに対応付けられた前記第2補聴器用合成音声データに対して前記加工処理と同一の加工処理を行うステップと、を更に含む、請求項1に記載の方法。 - 前記加工処理は、前記検査用合成音声データの子音の音素の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、及び話速の変換の少なくともいずれかを含む、請求項2に記載の方法。
- 出力された前記加工検査用合成音声が不快である旨の第4回答を受け付けるステップと、
前記第1回答が前記第2音素ラベルに一致し、前記第2回答が前記第2音素ラベルに一致せず、且つ前記第4回答が受け付けられた場合、前記補聴器用合成音声セットにおいて、前記第2補聴器用合成音声データに代えて前記第1補聴器用合成音声データを前記第2音素ラベルに対応付けるステップと、を更に含む、請求項2又は3に記載の方法。 - 前記音素ラベルは、子音の音素、母音の音素、及び、子音と母音とを組合せた音素のうちいずれかを示す、請求項1から4のいずれか一項に記載の方法。
- 音声の入力を受け付けるステップ、
音声を解析してテキストを生成するステップ、
生成されたテキストに該当する
請求項1から5のいずれか一項に記載の方法により修正された合成音声セットにおいて、前記生成されたテキストに該当する前記音素ラベルに対応付けられた合成音声データに基づいて、音声出力するステップと、
を含む、補聴方法。 - 複数の音素ラベルのそれぞれについて検査用合成音声を出力するための検査用合成音声データが対応付けられた検査用合成音声セットを用いた検査の結果に基づいて、入力された音声のうち所定の音ラベルに対応する部分に対して行う加工処理を規定した加工処理方法セットを修正する方法であって、
前記検査用合成音声セットにおいて第1音素ラベルに対応付けられた検査用合成音声データに基づいて、検査用合成音声を出力するステップと、
出力された前記検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第1回答を受け付けるステップと、
前記検査用合成音声セットにおいて前記第1音素ラベルに対応付けられた検査用合成音声データを所定の加工処理方法によって加工処理した加工検査用合成音声データに基づいて加工検査用合成音声を出力するステップと、
出力された前記加工検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第2回答を受け付けるステップと、
前記第1回答が前記第1音素ラベルに一致せず、且つ前記第2回答が前記第1音素ラベルに一致する場合、前記加工処理方法セットにおいて、前記第1音素ラベルに対応付けられた加工処理に対して、前記所定の加工処理方法を合成するステップと、を含む方法。 - 話者が発した音声の入力を受け付けるステップと、
前記話者が発した音声を解析するステップと、
前記話者が発した音声の解析の結果に応じて、前記話者が発した音声を所定の加工処理方法によって加工処理するステップと、
加工処理された前記音声を出力するステップと、を含む補聴方法。 - 前記話者が発した音声を解析するステップでは、前記話者が発した音声に混入する周囲騒音を軽減するための解析ではなく、前記話者が発した音声の特徴を強調するための解析が実行される、請求項8に記載の補聴方法。
- 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記話者が発した音声の音響分析処理を行うことにより、前記話者が発した音声の子音の特徴を示す子音グループを判別し、
前記話者が発した音声を加工処理するステップでは、前記子音グループに対応する前記所定の加工処理方法により前記話者が発した音声を加工処理する、請求項8又は9に記載の補聴方法。 - 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記音声のテキスト認識処理を行うことにより、前記話者が発した音声に対応するテキストを判別し、
前記話者が発した音声を加工処理するステップでは、前記テキストに対応する前記所定の加工処理方法により前記話者が発した音声を加工処理する、請求項8又は9に記載の補聴方法。 - 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記請求項7に記載の前記所定の加工処理方法によって前記話者が発した音声を加工処理する、請求項8から11のいずれか一項に記載の補聴方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/004766 WO2021157052A1 (ja) | 2020-02-07 | 2020-02-07 | 補聴器用合成音声セットの修正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6807491B1 true JP6807491B1 (ja) | 2021-01-06 |
JPWO2021157052A1 JPWO2021157052A1 (ja) | 2021-08-12 |
Family
ID=73992875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020536900A Active JP6807491B1 (ja) | 2020-02-07 | 2020-02-07 | 補聴器用合成音声セットの修正方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230038118A1 (ja) |
JP (1) | JP6807491B1 (ja) |
CN (1) | CN115380326A (ja) |
WO (1) | WO2021157052A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5879400A (ja) * | 1981-11-06 | 1983-05-13 | Gen Eng:Kk | 補聴器 |
JPH0739540A (ja) * | 1993-07-30 | 1995-02-10 | Sony Corp | 音声解析装置 |
US20050027537A1 (en) * | 2003-08-01 | 2005-02-03 | Krause Lee S. | Speech-based optimization of digital hearing devices |
US20160111111A1 (en) * | 2014-10-20 | 2016-04-21 | Audimax Llc | Systems, methods, and devices for intelligent speech recognition and processing |
JP2018036320A (ja) * | 2016-08-29 | 2018-03-08 | 株式会社テクノリンク | 音処理方法、音処理装置、及びプログラム |
JP2019213001A (ja) * | 2018-06-01 | 2019-12-12 | 学校法人北里研究所 | 補聴器及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103039092B (zh) * | 2011-07-08 | 2017-02-15 | 松下电器产业株式会社 | 助听适合度判断装置及助听适合度判断方法 |
-
2020
- 2020-02-07 US US17/760,256 patent/US20230038118A1/en active Pending
- 2020-02-07 CN CN202080099498.5A patent/CN115380326A/zh active Pending
- 2020-02-07 WO PCT/JP2020/004766 patent/WO2021157052A1/ja active Application Filing
- 2020-02-07 JP JP2020536900A patent/JP6807491B1/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5879400A (ja) * | 1981-11-06 | 1983-05-13 | Gen Eng:Kk | 補聴器 |
JPH0739540A (ja) * | 1993-07-30 | 1995-02-10 | Sony Corp | 音声解析装置 |
US20050027537A1 (en) * | 2003-08-01 | 2005-02-03 | Krause Lee S. | Speech-based optimization of digital hearing devices |
US20160111111A1 (en) * | 2014-10-20 | 2016-04-21 | Audimax Llc | Systems, methods, and devices for intelligent speech recognition and processing |
JP2018036320A (ja) * | 2016-08-29 | 2018-03-08 | 株式会社テクノリンク | 音処理方法、音処理装置、及びプログラム |
JP2019213001A (ja) * | 2018-06-01 | 2019-12-12 | 学校法人北里研究所 | 補聴器及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2021157052A1 (ja) | 2021-08-12 |
JPWO2021157052A1 (ja) | 2021-08-12 |
CN115380326A (zh) | 2022-11-22 |
US20230038118A1 (en) | 2023-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4946293B2 (ja) | 音声強調装置、音声強調プログラムおよび音声強調方法 | |
WO2007010680A1 (ja) | 声質変化箇所特定装置 | |
US9131876B2 (en) | Portable sound source playing apparatus for testing hearing ability and method of testing hearing ability using the apparatus | |
Hansen et al. | On the issues of intra-speaker variability and realism in speech, speaker, and language recognition tasks | |
JP2016535305A (ja) | 自閉症における言語処理向上のための装置 | |
Astolfi et al. | Duration of voicing and silence periods of continuous speech in different acoustic environments | |
JP2007140200A (ja) | 語学学習装置およびプログラム | |
Birkholz et al. | Manipulation of the prosodic features of vocal tract length, nasality and articulatory precision using articulatory synthesis | |
WO2018038235A1 (ja) | 聴覚トレーニング装置、聴覚トレーニング方法、およびプログラム | |
JP2009003395A (ja) | 音声読み上げのための装置、プログラム及び方法 | |
Vojtech et al. | The effects of modulating fundamental frequency and speech rate on the intelligibility, communication efficiency, and perceived naturalness of synthetic speech | |
JP6599828B2 (ja) | 音処理方法、音処理装置、及びプログラム | |
JP4883750B2 (ja) | 音響評定装置、およびプログラム | |
JP6807491B1 (ja) | 補聴器用合成音声セットの修正方法 | |
US8938077B2 (en) | Sound source playing apparatus for compensating output sound source signal and method of compensating sound source signal output from sound source playing apparatus | |
Deka et al. | Development of assamese text-to-speech system using deep neural network | |
JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
Klein et al. | Perceptuo-motor interactions across and within phonemic categories. | |
JP2017198790A (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP5518621B2 (ja) | 音声合成装置およびコンピュータプログラム | |
Lukkarila | Developing a conversation assistant for the hearing impaired using automatic speech recognition | |
US11368799B2 (en) | Hearing device customization systems and methods | |
KR20160074952A (ko) | 사용자 단말기를 이용한 보이스 컨설팅 제공 방법 | |
KR102350890B1 (ko) | 휴대용 청력검사장치 | |
EP4293660A1 (en) | Electronic device and method for controlling same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200701 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200730 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6807491 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |