JP6807491B1 - 補聴器用合成音声セットの修正方法 - Google Patents

補聴器用合成音声セットの修正方法 Download PDF

Info

Publication number
JP6807491B1
JP6807491B1 JP2020536900A JP2020536900A JP6807491B1 JP 6807491 B1 JP6807491 B1 JP 6807491B1 JP 2020536900 A JP2020536900 A JP 2020536900A JP 2020536900 A JP2020536900 A JP 2020536900A JP 6807491 B1 JP6807491 B1 JP 6807491B1
Authority
JP
Japan
Prior art keywords
voice
synthetic
inspection
processing
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020536900A
Other languages
English (en)
Other versions
JPWO2021157052A1 (ja
Inventor
博 小野
博 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Techno Link Co Ltd
Original Assignee
Techno Link Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Techno Link Co Ltd filed Critical Techno Link Co Ltd
Application granted granted Critical
Publication of JP6807491B1 publication Critical patent/JP6807491B1/ja
Publication of JPWO2021157052A1 publication Critical patent/JPWO2021157052A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本発明の一態様に係る補聴器用合成音声セットの修正方法は、検査用合成音声セットにおいて第1音素ラベルに対応付けられた第1検査用合成音声データに基づいて、第1検査用合成音声を出力するステップと、使用者により選択された第1回答を受け付けるステップと、検査用合成音声セットにおいて第2音素ラベルに対応付けられた第2検査用合成音声データに基づいて第2検査用合成音声を出力するステップと、使用者により選択された第2回答を受け付けるステップと、第1回答が第2音素ラベルに一致し、且つ第2回答が第2音素ラベルに一致しない場合、補聴器用合成音声セットにおいて、第2補聴強合成音声データに代えて第1補聴器用合成音声データを第2音素ラベルに対応付けるステップと、を含む。

Description

本発明は、補聴器用合成音声セットの修正方法に関する。
従来から、入力された人間の音声をテキスト解析した上で、所定の合成音声データを合成することにより、音声を人工的に作り出す音声合成技術が用いられている。音声合成技術は、例えば、難聴者の聞き取りを補助するための補聴器の分野などにおいて利用されている。
例えば、特許文献1には、テキストの解析を行う言語処理手段と、音声を母音/子音/母音の連鎖などの所望の合成単位で記憶しておく素片データベースと、言語処理手段より入力された読み情報等に基づいて素片データベースに記憶された音声を合成する音声合成部と、を備える音声処理装置が記載されている。ここで、当該音声処理装置は、更に、素片データベースに記憶された合成単位に強調処理を施す音韻強調処理手段と、使用者の聴覚特性を測定する聴覚測定手段と、測定された聴覚特性に基づいて強調処理の設定を決定する声質制御手段とを備える。これにより、当該音声処理装置は、使用者の聴覚特性に応じた合成音声を出力することが可能となる。
特開2004−004952号公報
しかしながら、強調処理によって得られる合成音声は、使用者が正しく認識できる可能性は高まるものの、元の音声波形の振幅や周波数を操作する余り、使用者にとって不快になる場合がある。合成音声方式は(1)波形方式、(2)HMM方式、(3)DNN方式と発展してきたが、合成音声には子音や母音の特性について規格がない等の理由により、各社の合成音声を比較すると、現状では、健聴者でも異聴する場合がある。特に、難聴者の聞き取りには大きな差があることが分かっている。
そこで、本発明は、使用者が正しく認識でき且つ不快度が低減された補聴方式を提供することを目的とする。
本発明の一態様に係る補聴器用合成音声セットの修正方法は、複数の音素ラベルのそれぞれについて検査用合成音声を出力するための検査用合成音声データが対応付けられた検査用合成音声セットに基づいて、複数の音素ラベルのそれぞれについて補聴器用合成音声を出力するための補聴器用合成音声データが対応付けられた補聴器用合成音声セットを修正する方法であって、検査用合成音声セットにおいて第1音素ラベルに対応付けられた第1検査用合成音声データに基づいて、第1検査用合成音声を出力するステップと、出力された第1検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第1回答を受け付けるステップと、検査用合成音声セットにおいて第2検査用音素ラベルに対応付けられた第2検査用合成音声データに基づいて第2検査用合成音声を出力するステップと、出力された第2検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第2回答を受け付けるステップと、第1回答が第2音素ラベルに一致し、且つ第2回答が第2音素ラベルに一致しない場合、補聴器用合成音声セットにおいて、第2音素ラベルに対応付けられた第2補聴器用合成音声データに代えて第1音素ラベルに対応付けられた第1補聴器用合成音声データを第2音素ラベルに対応付けるステップと、を含む。
この態様によれば、補聴器用合成音声セットに含まれる第2音素ラベルに対応付けられた第2補聴器用合成音声データに基づいて出力される第2補聴器用合成音声を使用者が正しく聞き取れない場合であっても、検査用合成音声セットにおいて他の第1音素ラベルに対応付けられた第1検査用合成音声データに基づいて出力される第1検査用合成音声を第2音素ラベルが示す音素であると認識できる場合は、補聴器用合成音声セットにおいて当該第2音素ラベルに対応付けられた第2補聴器用合成音声データを新たに第1音素ラベルに対応付けることができる。これにより、補聴器用合成音声セットについて、補聴器用合成音声データを加工処理することを必要とせずに、使用者が正しく聞き取れるように補聴器用合成音声データを修正することが可能となる。以て、使用者が正しく認識でき且つ不快度が低減された合成音声を出力することが可能となる。
本発明によれば、使用者にとっての不快度が低減された補聴器用合成音声を出力することを可能とする補聴器用合成音声セットを提供することができる。
本発明の実施形態に係る音声処理装置1の構成の一例を示す図である。 検査用合成音声セットのデータ構造の一例を示す概念図である。 補聴器用合成音声セットのデータ構造の一例を示す概念図である。 加工処理方法セットのデータ構造の一例を示す概念図である。 加工処理方法セットのデータ構造の一例を示す概念図である。 音声処理装置1による語音検査処理を説明するための動作フロー図の一例である。 テスト画面の一例を示す図である。 補聴器用合成音声セットの修正処理に係る動作フロー図の一例を示す図である。 加工処理方法セットの修正処理に係る動作フロー図の一例を示す図である。 合成音声方式による補聴処理に係る動作フロー図の一例を示す図である。 入力音声加工方式による補聴処理に係る動作フロー図の一例を示す図である。 入力音声加工方式による補聴処理に係る動作フロー図の他の一例を示す図である。 本発明の他の実施形態に係る語音検査装置1Aの構成の一例を示す図である。 本発明の他の実施形態に係る補聴器1Bの構成の一例を示す図である。
添付図面を参照して、本発明の好適な実施形態について説明する。(なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。)
(1)構成
図1は、本発明の実施形態に係る音声処理装置1の構成の一例を示す図である。音声処理装置1は、合成音声方式又は入力音声加工方式により、入力された音声(例えば、話者の発話音声)に基づく音声出力を行う装置である。ここで、合成音声方式は、所定の合成音声データに基づいて音声合成を行う方式である。また、入力音声加工方式は、入力された音声自体に対して所定の加工処理を行い、当該加工処理によって生成される音声を出力する方式である。
後述するように、音声処理装置1は、合成音声方式に用いる後述する補聴器用合成音声セットを、検査用合成音声セットに基づいた使用者の語音検査の結果に応じて修正することができる。また、同様に音声処理装置1は、入力音声加工方式に用いる後述する加工処理方法セットを、検査用合成音声セットに基づいた使用者の語音検査の結果に応じて修正することができる。
なお、以下では、音声処理装置1は、一の情報処理装置によって構成されるものとして説明するが、音声処理装置1は複数の情報処理装置によってシステムとして構成されてもよい。ここで、情報処理装置は、本開示に記載される機能および方法を実現できる情報処理装置であればどのような情報処理装置であってもよく、例えば、スマートフォン、携帯電話(フィーチャーフォン)、コンピュータ、サーバ装置、ハンドヘルドコンピュータデバイス、ウェアラブル端末(例えば、メガネ型デバイス、時計型デバイスなど)、その他の任意のコンピュータであってよい。情報処理装置は、例えば、バスを介して相互に接続されたプロセッサと、メモリと、ストレージと、入出力インタフェース(入力装置及び出力装置)と、通信インタフェースとを含む。
図1に示すとおり、音声処理装置1は、例えば、操作部2と、音声入力部3と、表示部5と、音声出力部4と、記憶部6と、処理部7と、を備える。
操作部2は、例えば、タッチパネルやキーボタン等の入力装置で構成され、ユーザによる文字、数字、記号等の入力の操作を受け付け、当該操作に対応する信号を処理部7に供給する。
音声入力部3は、例えば、マイクロフォン等で構成され、ユーザの音声等を電気信号による音声波形に変換して、処理部7に供給する。
音声出力部4は、例えば、スピーカ等で構成され、合成音声データ(検査用合成音声データ及び補聴器用合成音声データ等)に基づいて音声を出力する。特に、音声出力部4は、検査用合成音声データに基づいて検査用合成音声を出力し、加工検査用合成音声データに基づいて加工検査用合成音声を出力する。また、音声出力部4は、補聴器用合成音声データに基づいて補聴器用合成音声を出力する。
表示部5は、例えば、液晶ディスプレイや有機EL(Electro−Luminescence)ディスプレイ等の出力装置で構成され、処理部7から供給された表示データに基づいた画像等を表示する。
記憶部6は、例えば、磁気テープ装置、磁気ディスク装置、及び光ディスク装置等のストレージを備え、処理部7での処理に用いられるコンピュータプログラム、データ等を記憶する。また、記憶部6は、後述する検査用合成音声セット、補聴器用合成音声セット、及び加工処理方法セットを記憶する。なお、本開示の各実施形態のプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。プログラムは、限定でなく例として、ソフトウェアプログラムやコンピュータプログラムを含む。
図2Aは、検査用合成音声セットのデータ構造の一例を示す概念図である。検査用合成音声セットは、音素ラベル毎に、検査用音声合成の元となる検査用合成音声データが対応付けられている。図2Aに示す例では、左列には音素ラベルが、右列には当該音素ラベルに対応付けられた検査用合成音声データが、それぞれ示されている。ここで、音素ラベルとは、音素を識別するためのラベルである。ここで、音素は、音声を構成する単位(必ずしも最小単位でなくてもよい)となる音であって、子音、母音、子音と母音との組合せ等のであってよい。音素ラベルは、これらに限定されるものではないが、例えば、表音文字(例えば、日本語の仮名文字等)であってもよいし、発音記号であってもよい。本例では、音素ラベルは「[ka]」などと表され、検査用合成音声データは、「S[ka]」などと表されるものとする。特に、検査用合成音声セットの初期状態においては、通常の聴覚を有する利用者(健常者)が、当該音素ラベルが示す音であると十分に認識可能な検査用合成音声を出力するための検査用合成音声データが、各音素ラベルに対応付けられている。
図2Bは、補聴器用合成音声セットのデータ構造の一例を示す概念図である。補聴器用合成音声セットは、音素ラベル毎に、補聴器用音声合成の元となる補聴器用合成音声データが対応付けられている。図2Bに示す例では、左列には音素ラベルが、右列には当該音素ラベルに対応付けられた補聴器用合成音声データが、それぞれ示されている。ここで、補聴器用合成音声セットの音素ラベルの少なくとも一部は、検査用合成音声セットの音素ラベルの少なくとも一部と一致する。また、補聴器用合成音声セットの音素ラベルは、検査用合成音声セットの音素ラベルに完全に一致してもよい。本例では、音素ラベルは「[ka]」などと表され、補聴器用合成音声データは、「H[ka]」などと表されるものとする。特に、補聴器用合成音声セットの初期状態においては、通常の聴覚を有する利用者(健常者)が、当該音素ラベルが示す音であると十分に認識可能な補聴器用合成音声を出力するための補聴器用合成音声データが、各音素ラベルに対応付けられている。
図2Cは、音素ラベル毎の加工処理方法セットのデータ構造の一例を示す概念図である。図2Cに示す例では、音素ラベル毎に、入力された音声(例えば話者の音声)に対して行う加工処理方法が対応付けられている。図2Cに示す例では、左列には音素ラベルが、右列には当該音素ラベルに対応付けられた加工処理方法が、それぞれ示されている。加工処理方法セットに含まれる各加工処理方法は、初期設定等においては、強調等をしない最低限の加工処理(入力された音声をそのまま出力するような加工処理を含む)であってよい。ここで、加工処理方法セットの音素ラベルの少なくとも一部は、検査用合成音声セットの音素ラベルの少なくとも一部と一致する。また、加工処理方法セットの音素ラベルは、検査用合成音声セットの音素ラベルに完全に一致してもよい。本例では、音素ラベルは「[ka]」などと表され、加工処理方法は、「F[ka]」などと表されるものとする。特に、加工処理方法セットの初期状態においては、入力された音声をそのまま(忠実に)出力するための最低限の加工処理方法が、各音素ラベルに対応付けられている。また、加工処理方法セットの初期状態においては、全ての音素ラベルについての加工処理方法が互いに同一であってよい。
図2Dは、子音グループ毎の加工処理方法セットのデータ構造の一例を示す概念図である。図2Dに示す例では、子音グループ毎に、入力された音声(例えば話者の音声)に対して行う加工処理方法が対応付けられている。図2Dに示す例では、左列には子音グループが、右列には当該子音グループに対応付けられた加工処理方法が、それぞれ示されている。子音グループは、例えば、図2Dに示すとおり、大分類として「(1)無声子音」、「(2)有声子音」、「(3)濁音の頭子音」を含んでもよい。加工処理方法セットにおいて、これら子音グループにはそれぞれ、加工処理方法F(1)、F(2)、F(3)が対応付けられている。そして、例えば、当該加工処理方法セットを用いて、例えば入力された音声に「(1)無声子音」が含まれていれば、入力された音声の当該(1)無声子音に対応する部分音声に対して加工処理方法F(1)による加工処理を行うことができる。また、「(1)無声子音」は、小分類としての「(1−1)狭義の清音の頭子音」、「(1−2)無声破裂音/k, ky, t, p, py/」、「(1−3)無声破擦音/ch, ts/」、「(1−4)無声摩擦音/s, sh, h, hy/」に細分化されてもよい。また、「(2)有声子音」は、小分類としての「(2−1)鼻音/s, sh, h, hy/」、「(2―2)半母音/y, w/」、「(2−3)有声破裂音/r, ry/」に細分化されてもよい。また、「(3)濁音の頭子音」は、小分類としての「(3−1)有声破裂音・有声摩擦音 /d, b, by/」、「(3−2)有声破裂音・有声摩擦音 /g, gy/」、「(3−3)有声破擦音・有声摩擦音 /z, j/」に細分化されてもよい。加工処理方法セットにおいて、これら細分化された子音グループ毎に、加工処理方法F(1−1)等を設けてもよい。そして、例えば、例えば入力された音声に「(1−1)狭義の清音の頭子音」が含まれていれば、入力された音声の当該「(1−1)狭義の清音の頭子音」に対応する部分音声に対して加工処理方法F(1−1)による加工処理を行うことができる。なお、加工処理方法セットにおける上述した子音グループの分類の仕方や細かさは一例であって、他の仕方や細かさで加工処理方法セットを設定してもよい。
処理部7は、一又は複数個のプロセッサ及びその周辺回路を備える。処理部7は、例えばCPUであり、音声処理装置1の全体的な動作を統括的に制御する。処理部7は、記憶部6に記憶されているプログラム等に基づいて音声処理装置1の各種処理が適切な手順で実行されるように、操作部2等の動作を制御する。処理部7は、記憶部6に記憶されているコンピュータプログラムに基づいて処理を実行する。
処理部7は、例えば、検査部71と、修正部72と、補聴処理部73と、表示制御部74と、を備える。検査部71は、音素ラベル選択部71aと、合成音声出力部71bと、回答受付部71cと、判定部71dと、加工処理部71eと、を含む。修正部72は、補聴器用合成音声セット修正部72aと、加工処理方法セット修正部72bとを含む。補聴処理部73は、入力音声処理部73aと、出力音声処理部73bとを含む。入力音声処理部73aは、テキスト認識処理部73a1と、音響認識処理部73a2とを含む。出力音声処理部73bは、音声合成部73b1と、入力音声加工部と73b2とを含む。
音素ラベル選択部71aは、語音検査処理において、検査用合成音声セットから例えばテストが終了していない音素ラベルを選択する。合成音声出力部71bは、音声出力部4を制御して、合成音声データ(検査用合成音声データ及び補聴器用合成音声データ等)や加工検査用合成音声データに基づく合成音声(検査用合成音声及び補聴器用合成音声等)や加工検査用合成音声を出力させる。回答受付部71cは、使用者が操作部2を操作することにより入力した回答を受け付ける。回答は、例えば、出力された音声に対応する音素ラベルの選択や、出力された音声が不快である旨の回答を含む。判定部71dは、語音検査処理において、種々の判定を行う。加工処理部71eは、所定の条件下において、検査用合合成音声データを加工処理することにより、加工検査用合成音声データを生成する。補聴器用合成音声セット修正部72aは、補聴器用合成音声セットにおいて、所定の条件下において、音素ラベルに対応付けられた補聴器用合成音声データのすげ替え処理及び/又はの加工処理を行う。加工処理方法セット修正部72bは、語音検査の結果に応じて、加工処理方法セットを修正する。テキスト認識処理部73a1は、入力された音声を解析して、当該音声に対応するテキストを生成する、音響認識処理部73a2は、入力された音声に対して音響認識処理を行う。ここで、音響認識処理は、例えば、予め子音グループや母音毎に規定された音響的特徴等(記憶部6等に記憶されていてもよい)を参照することにより、入力された音声が有する音響的特徴を判定し、当該音声に対応する子音グループや母音等を判別する。子音グループは、例えば図2Dを参照して説明した子音グループであってよい。音声合成部73b1は、補聴器用合成音声セットを用いて、生成されたテキストに対応する合成音声を音声出力部4から出力させる。入力音声加工部73b2は、加工処理方法セットを用いて入力された音声に対して加工処理を行った上で、当該音声を音声出力部4から出力させる。表示制御部74は、所定の表示データに基づいて、表示部5に種々の画面等を表示させる。音声解析部7iは、音声入力部3に入力された音声を解析して、当該音声を表すテキストデータを生成する。音声合成部7jは、補聴器用合成音声セットに基づいて、音声解析部7i等により生成されたテキストデータを表す音声を合成し、音声出力部4に当該音声を出力させる。
(2)動作
(2−1)語音検査
図3は、音声処理装置1による語音検査処理を説明するための動作フロー図の一例である。当該処理では、音声処理装置1は、検査用合成音声セットに基づいた検査用合成音声や加工検査用合成音声を出力した上で使用者からの回答を受け付ける。
(S101)まず、音素ラベル選択部71aは、記憶部6に記憶された検査用合成音声セットに含まれる音素ラベルから、テストが終了していない任意の音素ラベル(テスト中音素ラベル)を選択する。
(S102)次に、合成音声出力部7bは、検査用合成音声セットにおいてテスト中音素ラベルに対応付けられた検査用合成音声データに基づいて、音声出力部4を介して検査用合成音声を出力する。
(S103)次に、使用者が、操作部2を操作することにより、例えば図5に示すテスト画面に表示された音素ラベルの選択部から、S2で出力された音声(検査用合成音声)が表すと感じた音素ラベルの選択部を選択すると、回答受付部7cは、当該選択を検査用合成音声に対する回答として受け付ける。受け付けられた回答は、例えば、記憶部6に記憶される。
(S104)次に、判定部7dは、S3で受け付けられた回答が正解であるか否かを判定する。具体的には、判定部7dは、S3で受け付けられた回答に係る音素ラベルとテスト中音素ラベルとが同一であれば正解であると判定し、異なれば不正解であると判定する。
(S105)S103で受け付けられた回答が正解であると判定部7dが判定した場合(S4;Yes)、判定部7dは、検査用合成音声セットに含まれる全ての音素ラベルについてテストが終了したか否かを判定する。
(S106)S103で受け付けられた回答が不正解であると判定部7dが判定した場合(S4;No)、加工処理部7eは、検査用合成音声データ(ただし、テスト中音素ラベルに対応付けられた検査用合成音声データについて、既に当該S6の処理が行われている場合は、最新の加工検査用合成音声データ)を加工処理することにより、加工検査用合成音声データを生成する。
ここで、加工処理は、複数の加工処理方法のうちから予め選択された一の加工処理方法によるものであってよい。複数の加工処理方法は、これらに限定されるものではないが、例えば、子音の音素の音圧の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、及び話速の変換等を含んでもよい。
また、例えば、S106の加工処理を少なくとも一度経ることにより生成された加工検査用合成音声データによる加工合成音声について、後述するように使用者が不快である旨の回答を選択した場合、再びS106において実行される加工処理に用いられる加工処理方法を変更してもよい。また、複数の加工処理方法の変更の順序は、任意に設定することができるが、例えば、後述する子音の音素の音圧の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、話速の変換の順序で、加工処理方法を変更することが望ましい。また、複数の加工処理方法の変更の順序は、子音の種類(破裂子音(有声・無声)、摩擦子音(有声・無声)、鼻音子音等)に応じて異なるように設定してもよい。
(S107)次に、合成音声出力部7bは、S106で生成された加工検査用合成音声データに基づいて、音声出力部4を介して加工検査用合成音声を出力する。
(S108)次に、回答受付部7cは、S107で出力された加工検査用合成音声に対する回答を受け付ける。具体的には、回答受付部7cは、S7で出力された音声が表すと感じた音素ラベルを選択すると、当該選択を回答として受け付ける。或いは、回答受付部7cは、S7で出力された加工検査用合成音声が不快である旨を使用者が選択すると、当該選択を回答として受け付ける。受け付けられた回答は、例えば、記憶部6に記憶される。
(S109)次に、判定部7dは、S108で受け付けられた加工検査用合成音声に対する回答が正解であるか否かを判定する。具体的には、判定部7dは、S8で受け付けられた回答が音素ラベルを選択するものであって、且つ当該回答に係る音素ラベルとテスト中音素ラベルとが同一であれば、正解であると判定し、そうでなければ不正解であると判定する。S108で受け付けられた回答が正解であると判定部7dが判定した場合(S109;Yes)、処理はステップS105に進む。
(S110)S108で受け付けられた回答が正解ではないと判定部7dが判定した場合(S109;No)、判定部7dは、S108において出力された加工検査用合成音声が不快である旨の回答が受け付けられたか否かを判定する。当該不快である旨の回答が受け付けられていないと判定された場合(S110;No)、処理はS106に進む。
(S111)S108において出力された加工検査用合成音声が不快である旨の回答が受け付けられたと判定部7dが判定した場合(S110;Yes)、判定部7dは、予め設定された複数の加工処理方法のうち、まだ実行していない他の加工処理方法があるか否かを判定する。そして、当該判定の結果が肯定的であった場合(S111;Yes)、処理はS106に進み、当該判定の結果が否定的であった場合(S111;No)、処理はS105に進む。以上で語音検査が終了する。
図4は、上述した語音検査処理において、例えば表示部5に表示されるテスト画面の一例を示す図である。当該テスト画面は、例えば、記憶部6に記憶された表示データに基づいて表示制御部74が表示部5に表示させる。図4に示すとおり、テスト画面には、合成音声セットに含まれる各音素ラベル(例えば、[a]、[ka]、[sa]等)の選択部が表示される。当該選択部は、使用者が音声出力部4により出力される音声を聞いた後に当該音声が表すと感じられる音素ラベルを回答する際に選択することができる。また、使用者は、音素ラベルの選択に代えて、或いは音素ラベルの選択と併せて、出力された音声が不快である旨を回答するために、「不快」と表示された選択部を選択することができる。
(2−2−1)補聴器用合成音声セットの修正
図5Aは、補聴器用合成音声セットの修正処理に係る動作フロー図の一例を示す図である。
(S201)まず、補聴器用合成音声セット修正部72aは、記憶部6を参照して、上述したS103で受け付けた検査用合成音声に対する回答が不正解である任意の音素ラベルを選択する。
(S202)次に、補聴器用合成音声セット修正部72aは、S201で選択された音素ラベルとは異なる他の音素ラベルについての検査用合成音声に対する回答のうち、S201で選択された音素ラベルに一致するものがあるか否かを判定する。
(S203)補聴器用合成音声セット修正部72aは、S202における判定の結果が肯定的であった場合(S202;Yes)、補聴器用合成音声セットにおいて、当該他の音素ラベルに対応付けられた補聴器用合成音声データを、S201で選択された音素ラベルに新たに対応付ける。その後、処理はステップS206に進む。
(S204)補聴器用合成音声セット修正部72aは、S202における判定の結果が否定的であった場合(S202;No)、上述したS108で受け付けた加工検査用合成音声に対する回答が正解であるか否かを判定する。
(S205)補聴器用合成音声セット修正部72aは、上述したS108で受け付けた加工検査用合成音声に対する回答が正解であると判定された場合(S204;Yes)、補聴器用合成音声セットにおいて、S201で選択された音素ラベルに対応付けられた補聴器用合成音声データに対して、S106と同様の加工処理(ただし、最後に実行された処理)を実行する。そして、補聴器用合成音声セット修正部72aは、補聴器用合成音声セットにおいて、加工処理された補聴器用合成音声データをS201で選択された音素ラベルに新たに対応付ける。
上述したS108で受け付けた加工検査用合成音声に対する回答が正解でないと判定された場合(S204;No)、処理はS206に進む。
(S206)次に、補聴器用合成音声セット修正部72aは、上述したS103で受け付けた検査用合成音声に対する回答が不正解である全ての音素ラベルについてS201〜S205の処理が終了したか否かを判定する。判定の結果が肯定的であった場合(S206;Yes)、処理は終了し、判定の結果が否定的であった場合(S206;No)、処理はS201に進む。
(2−2−2−1)音素ラベル毎の加工処理方法セットの修正
図5Bは、図2Cに示す音素ラベル毎の加工処理方法セットの修正処理に係る動作フロー図の一例を示す図である。
(S301)まず、加工処理方法セット修正72bは、記憶部6を参照して、上述したS103で受け付けた検査用合成音声に対する回答が不正解である任意の音素ラベルを選択する。
(S302)加工処理方法セット修正部72bは、S301で選択された音素ラベルについて、上述したS108で受け付けた加工検査用合成音声に対する回答が正解であるか否かを判定する。
(S303)加工処理方法セット修正部72bは、上述したS108で受け付けられた加工検査用合成音声に対する回答が正解であると判定された場合(S302;Yes)、音素ラベル毎の加工処理方法セットにおいて、S301で選択された音素ラベルに対応付けられた加工処理方法に対して、S106と同様の加工処理方法(ただし、最後に実行された処理に係る加工処理方法)を合成する。そして、加工処理方法セット修正部72bは、加工処理方法セットにおいて、合成された新たな加工処理方法をS301で選択された音素ラベルに新たに対応付ける。
(S304)次に、加工処理方法セット修正部72bは、上述したS103で受け付けた検査用合成音声に対する回答が不正解である全ての音素ラベルについてS301〜S303の処理が終了したか否かを判定する。判定の結果が肯定的であった場合(S304;Yes)、処理は終了し、判定の結果が否定的であった場合(S304;No)、処理はS201に進む。
(2−2−2−2)子音グループ毎の加工処理方法セットの生成
例えば処理部7は、上記「(2−1)語音検査」の回答に基づいてm図2Dに示す子音グループ毎の加工処理方法セットを生成することができる。例えば、処理部7は、語音検査において「(1)無声子音」に属する検査用合成音声に対する複数の回答に基づいて、「(1)無声子音」に対応する加工処理方法F(1)を生成してもよい。この際、不正解の回答が多いほど、加工処理の度合いを強めてもよい。加工処理は、子音の音素の音圧の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、及び話速の変換等であってよい。
(2−3−1)補聴処理/合成音声方式
図6Aは、合成音声方式による補聴処理に係る動作フロー図の一例を示す図である。
(S401)まず、話者が音声入力部3に向けて音声を発することにより音声入力部3が当該音声に基づく信号を処理部7に供給すると、入力音声処理部73aのテキスト認識処理部73a1は、当該音声に対してテキスト認識処理を行う。これにより、入力された音声の各部分に対応するテキストが生成される。
(S402)次に、音声合成部73b1は、例えば聞き手が被験者となって行われた上記「(2−2−1)補聴器用合成音声セットの修正」の処理により修正された補聴器用合成音声セットを用いて、生成されたテキストに対応する合成音声を音声出力部4から出力させる。これにより、聞き手は、当該聞き手の聴力に応じて適宜すげ替え処理及び/又は加工処理された合成音声データに基づく合成音声を聞くことができる。
(2−3−2−1)補聴処理/音素ラベル毎の入力音声加工処理方式
図6Bは、入力音声加工方式による補聴処理に係る動作フロー図の一例を示す図である。
(S501)まず、話者が音声入力部3に向けて音声を発することにより音声入力部3が当該音声に基づく信号を処理部7に供給すると、入力音声処理部73aのテキスト認識処理部73a1は、当該音声に対してテキスト認識処理を行う。これにより、入力された音声の各部分に対応するテキストが生成される。更に、入力音声処理部73aは、入力音声から単語と助詞(例えば、「は」、「が」、「を」等)とを分離した上で、これら単語及び助詞から子音部分を検出する。
(S502)次に、出力音声処理部73bの入力音声加工部73b2は、加工処理方法セットを用いて、入力された音声の各部分に対して加工処理を実行し、音声出力部4を制御して生成された音声を出力する。このとき例えば、入力音声加工部73b2は、図2Cに示す音素ラベル毎の加工処理方法セットを用いて、入力された音声に含まれる音素ラベル毎に異なる加工処理を実行してもよい。或いは、例えば、入力音声加工部73b2は、図2Dに示す子音グループ毎の加工処理方法セットを用いて、入力された音声に含まれる音素ラベルに該当する子音グループを特定した上で、特定された子音グループに対応する加工処理方法による加工処理を実行してもよい。或いは、例えば、入力音声加工部73b2は、各単語の先頭の子音のみを、当該子音が属する子音グループに対応する加工処理方法による加工処理を実行してもよい。具体的には、例えば、単語「かみひこうき」には、「か」、「み」、「ひ」、「こ」、及び「き」が子音である。この場合、先頭の子音「か」だけに対して、子音「か」が属する子音グループに対応する加工処理方法によって加工処理を実行してもよい。これにより、単語全体の長さをあまり長くし過ぎることなく、聞き手の聞き取りが向上する場合が多い。
(2−3−2−2)補聴処理/子音グループ毎に入力音声加工処理方式
図6Cは、入力音声加工方式による補聴処理に係る動作フロー図の他の一例を示す図である。
(S601)まず、話者が音声入力部3に向けて音声を発することにより音声入力部3が当該音声に基づく信号を処理部7に供給すると、入力音声処理部73aの音響認識処理部73a2は、当該音声に対して音響処理を行うことにより、当該音声の音響的特徴に基づいて入力された音声に含まれる子音グループを判別する。当該音響処理は、同一の子音グループに属する子音は音響特性が近似していることを利用しており、例えば、各子音グループについて予め規定されたスペクトル等と、入力音声のスペクトル等との差分が所定の閾値以内であるか否かにより、当該音声が当該子音グループに属する音であるか否かが判定されてもよい。或いは、音声波形を周波数領域に変換した上で、ベイズ推定によって、摩擦音らしい音韻、破裂音らしい音韻、鼻音らしい音韻、母音らしい音韻を検出してもよい。これにより、当該音声の各部分に対応する子音グループが生成される。
(S602)次に、出力音声処理部73bの入力音声加工部73b2は、図2Dに示す子音グループ毎の加工処理方法セットを用いて、入力音声のうち所定の子音グループに対応する部分音声に対して、加工処理方法セットにおいて当該子音グループに対応付けられた加工処理を行い、音声出力部4を制御して生成された音声を出力する。これにより、話者の入力音声に対して子音グループ毎の加工処理方法によって加工処理がなされた上で、加工処理された当該入力音声が出力される。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
(3)その他
本発明の他の実施形態においては、語音検査装置1Aと補聴器1Bとが個別の情報処理装置として構成されてもよい。このように語音検査装置1Aと補聴器1Bとを個別の情報処理装置として構成することにより、補聴器1Bを小型化できるという利点がある。特に、本発明の種々の実施形態においては、入力された音声の音響分析をするため、補聴器1Bの容量を小型化できる。
図7は、本発明の他の実施形態に係る語音検査装置1Aの構成の一例を示す図である。語音検査装置1Aは、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット端末、及び専用端末等の任意の情報処理装置として構成されてよい。語音検査装置1Aは、例えば、操作部2と、音声入力部3と、音声出力部4と、表示部5と、記憶部6と、処理部7とを備える。処理部7は、例えば、検査部71と、修正部72と、表示制御部74とを備える。
語音検査装置1Aは、例えば、更に通信部8Aを備える。ここで、通信部8Aは、Bluetooth(登録商標)等の近距離無線通信や任意のモバイル通信等によって、語音検査装置1Aを補聴器1B等の他の情報処理装置に接続するための通信インタフェース回路を有する。通信部8Aは、補聴器1B等の情報処理装置から受信したデータを処理部7に供給する。また、通信部8Aは、処理部7から供給されたデータを補聴器1B等に送信する。
図8は、本発明の他の実施形態に係る補聴器1Bの構成の一例を示す図である。補聴器1Bは、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット端末、及び専用端末等の任意の情報処理装置として構成されてよい。補聴器1Bは、例えば、操作部2と、音声入力部3と、音声出力部4と、表示部5と、記憶部6と、処理部7とを備える。処理部7は、例えば、補聴処理部73と、表示制御部74とを備える。記憶部6は、補聴器用合成音声セットや加工処理方法セットを記憶している。
補聴器1Bは、例えば、更に通信部8Bを備える。ここで、通信部8Aは、Bluetooth(登録商標)等の近距離無線通信や任意のモバイル通信等によって、補聴器1Bを語音検査装置1A等の他の情報処理装置に接続するための通信インタフェース回路を有する。通信部8Aは、語音検査装置1A等の情報処理装置から受信したデータを処理部7に供給する。また、通信部8Aは、処理部7から供給されたデータを語音検査装置1A等に送信する。
本発明の更に他の実施形態においては、語音検査装置1Aは被験者の音声を検知した上で、予め規定された複数のモデル音声のそれぞれと比較した上で、個別の音素ラベルや子音グループ毎ではなく、音声合成又は強調加工の全体的な微修正の程度を決定してもよい。
1…音声処理装置、2…操作部、3…音声入力部、4…音声出力部4…表示部、6…記憶部、7…処理部、7a…音素ラベル選択部、7b…合成音声出力部、7c…回答受付部、7d…判定部、7e…加工処理部、7f…補聴器用合成音声セット修正部、7g…すげ替え処理部、74…表示制御部、7i…音声解析部、7j…音声合成部、1A…語音検査装置、1B…補聴器

Claims (12)

  1. 複数の音素ラベルのそれぞれについて検査用合成音声を出力するための検査用合成音声データが対応付けられた検査用合成音声セットを用いた検査の結果に基づいて、前記複数の音素ラベルのそれぞれについて補聴器用合成音声を出力するための補聴器用合成音声データが対応付けられた補聴器用合成音声セットを修正する方法であって、
    前記検査用合成音声セットにおいて第1音素ラベルに対応付けられた第1検査用合成音声データに基づいて、第1検査用合成音声を出力するステップと、
    出力された前記第1検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第1回答を受け付けるステップと、
    前記検査用合成音声セットにおいて第2音素ラベルに対応付けられた第2検査用合成音声データに基づいて第2検査用合成音声を出力するステップと、
    出力された前記第2検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第2回答を受け付けるステップと、
    前記第1回答が前記第2音素ラベルに一致し、且つ前記第2回答が前記第2音素ラベルに一致しない場合、前記補聴器用合成音声セットにおいて、前記第2音素ラベルに対応付けられた第2補聴器用合成音声データに代えて前記第1音素ラベルに対応付けられた第1補聴器用合成音声データを前記第2音素ラベルに対応付けるステップと、を含む、方法。
  2. 前記第2検査用合成音声データを加工処理した加工検査用合成音声データに基づいて加工検査用合成音声を出力するステップと、
    出力された前記加工検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第3回答を受け付けるステップと、
    前記第3回答が前記第2音素ラベルに一致する場合、前記補聴器用合成音声セットにおいて、前記第2音素ラベルに対応付けられた前記第2補聴器用合成音声データに対して前記加工処理と同一の加工処理を行うステップと、を更に含む、請求項1に記載の方法。
  3. 前記加工処理は、前記検査用合成音声データの子音の音素の拡大、子音の持続時間の伸張、子音と母音との間への無音時間の挿入、及び話速の変換の少なくともいずれかを含む、請求項2に記載の方法。
  4. 出力された前記加工検査用合成音声が不快である旨の第4回答を受け付けるステップと、
    前記第1回答が前記第2音素ラベルに一致し、前記第2回答が前記第2音素ラベルに一致せず、且つ前記第4回答が受け付けられた場合、前記補聴器用合成音声セットにおいて、前記第2補聴器用合成音声データに代えて前記第1補聴器用合成音声データを前記第2音素ラベルに対応付けるステップと、を更に含む、請求項2又は3に記載の方法。
  5. 前記音素ラベルは、子音の音素、母音の音素、及び、子音と母音とを組合せた音素のうちいずれかを示す、請求項1から4のいずれか一項に記載の方法。
  6. 音声の入力を受け付けるステップ、
    音声を解析してテキストを生成するステップ、
    生成されたテキストに該当する
    請求項1から5のいずれか一項に記載の方法により修正された合成音声セットにおいて、前記生成されたテキストに該当する前記音素ラベルに対応付けられた合成音声データに基づいて、音声出力するステップと、
    を含む、補聴方法。
  7. 複数の音素ラベルのそれぞれについて検査用合成音声を出力するための検査用合成音声データが対応付けられた検査用合成音声セットを用いた検査の結果に基づいて、入力された音声のうち所定の音ラベルに対応する部分に対して行う加工処理を規定した加工処理方法セットを修正する方法であって、
    前記検査用合成音声セットにおいて第1音素ラベルに対応付けられた検査用合成音声データに基づいて、検査用合成音声を出力するステップと、
    出力された前記検査用合成音声が表すと感じられる音素ラベルであるとして使用者により選択された第1回答を受け付けるステップと、
    前記検査用合成音声セットにおいて前記第1音素ラベルに対応付けられた検査用合成音声データを所定の加工処理方法によって加工処理した加工検査用合成音声データに基づいて加工検査用合成音声を出力するステップと、
    出力された前記加工検査用合成音声が表すと感じられる音素ラベルであるとして前記使用者により選択された第2回答を受け付けるステップと、
    前記第1回答が前記第1音素ラベルに一致せず、且つ前記第2回答が前記第1音素ラベルに一致する場合、前記加工処理方法セットにおいて、前記第1音素ラベルに対応付けられた加工処理に対して、前記所定の加工処理方法を合成するステップと、を含む方法。
  8. 話者が発した音声の入力を受け付けるステップと、
    前記話者が発した音声を解析するステップと、
    前記話者が発した音声の解析の結果に応じて、前記話者が発した音声を所定の加工処理方法によって加工処理するステップと、
    加工処理された前記音声を出力するステップと、を含む補聴方法。
  9. 前記話者が発した音声を解析するステップでは、前記話者が発した音声に混入する周囲騒音を軽減するための解析ではなく、前記話者が発した音声の特徴を強調するための解析が実行される、請求項8に記載の補聴方法。
  10. 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記話者が発した音声の音響分析処理を行うことにより、前記話者が発した音声の子音の特徴を示す子音グループを判別し、
    前記話者が発した音声を加工処理するステップでは、前記子音グループに対応する前記所定の加工処理方法により前記話者が発した音声を加工処理する、請求項8又は9に記載の補聴方法。
  11. 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記音声のテキスト認識処理を行うことにより、前記話者が発した音声に対応するテキストを判別し、
    前記話者が発した音声を加工処理するステップでは、前記テキストに対応する前記所定の加工処理方法により前記話者が発した音声を加工処理する、請求項8又は9に記載の補聴方法。
  12. 前記話者が発した音声を所定の加工処理方法によって解析するステップでは、前記請求項7に記載の前記所定の加工処理方法によって前記話者が発した音声を加工処理する、請求項8から11のいずれか一項に記載の補聴方法。
JP2020536900A 2020-02-07 2020-02-07 補聴器用合成音声セットの修正方法 Active JP6807491B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/004766 WO2021157052A1 (ja) 2020-02-07 2020-02-07 補聴器用合成音声セットの修正方法

Publications (2)

Publication Number Publication Date
JP6807491B1 true JP6807491B1 (ja) 2021-01-06
JPWO2021157052A1 JPWO2021157052A1 (ja) 2021-08-12

Family

ID=73992875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020536900A Active JP6807491B1 (ja) 2020-02-07 2020-02-07 補聴器用合成音声セットの修正方法

Country Status (4)

Country Link
US (1) US20230038118A1 (ja)
JP (1) JP6807491B1 (ja)
CN (1) CN115380326A (ja)
WO (1) WO2021157052A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5879400A (ja) * 1981-11-06 1983-05-13 Gen Eng:Kk 補聴器
JPH0739540A (ja) * 1993-07-30 1995-02-10 Sony Corp 音声解析装置
US20050027537A1 (en) * 2003-08-01 2005-02-03 Krause Lee S. Speech-based optimization of digital hearing devices
US20160111111A1 (en) * 2014-10-20 2016-04-21 Audimax Llc Systems, methods, and devices for intelligent speech recognition and processing
JP2018036320A (ja) * 2016-08-29 2018-03-08 株式会社テクノリンク 音処理方法、音処理装置、及びプログラム
JP2019213001A (ja) * 2018-06-01 2019-12-12 学校法人北里研究所 補聴器及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103039092B (zh) * 2011-07-08 2017-02-15 松下电器产业株式会社 助听适合度判断装置及助听适合度判断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5879400A (ja) * 1981-11-06 1983-05-13 Gen Eng:Kk 補聴器
JPH0739540A (ja) * 1993-07-30 1995-02-10 Sony Corp 音声解析装置
US20050027537A1 (en) * 2003-08-01 2005-02-03 Krause Lee S. Speech-based optimization of digital hearing devices
US20160111111A1 (en) * 2014-10-20 2016-04-21 Audimax Llc Systems, methods, and devices for intelligent speech recognition and processing
JP2018036320A (ja) * 2016-08-29 2018-03-08 株式会社テクノリンク 音処理方法、音処理装置、及びプログラム
JP2019213001A (ja) * 2018-06-01 2019-12-12 学校法人北里研究所 補聴器及びプログラム

Also Published As

Publication number Publication date
WO2021157052A1 (ja) 2021-08-12
JPWO2021157052A1 (ja) 2021-08-12
CN115380326A (zh) 2022-11-22
US20230038118A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
JP4946293B2 (ja) 音声強調装置、音声強調プログラムおよび音声強調方法
WO2007010680A1 (ja) 声質変化箇所特定装置
US9131876B2 (en) Portable sound source playing apparatus for testing hearing ability and method of testing hearing ability using the apparatus
Hansen et al. On the issues of intra-speaker variability and realism in speech, speaker, and language recognition tasks
JP2016535305A (ja) 自閉症における言語処理向上のための装置
Astolfi et al. Duration of voicing and silence periods of continuous speech in different acoustic environments
JP2007140200A (ja) 語学学習装置およびプログラム
Birkholz et al. Manipulation of the prosodic features of vocal tract length, nasality and articulatory precision using articulatory synthesis
WO2018038235A1 (ja) 聴覚トレーニング装置、聴覚トレーニング方法、およびプログラム
JP2009003395A (ja) 音声読み上げのための装置、プログラム及び方法
Vojtech et al. The effects of modulating fundamental frequency and speech rate on the intelligibility, communication efficiency, and perceived naturalness of synthetic speech
JP6599828B2 (ja) 音処理方法、音処理装置、及びプログラム
JP4883750B2 (ja) 音響評定装置、およびプログラム
JP6807491B1 (ja) 補聴器用合成音声セットの修正方法
US8938077B2 (en) Sound source playing apparatus for compensating output sound source signal and method of compensating sound source signal output from sound source playing apparatus
Deka et al. Development of assamese text-to-speech system using deep neural network
JP6289950B2 (ja) 読み上げ装置、読み上げ方法及びプログラム
Klein et al. Perceptuo-motor interactions across and within phonemic categories.
JP2017198790A (ja) 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム
JP5518621B2 (ja) 音声合成装置およびコンピュータプログラム
Lukkarila Developing a conversation assistant for the hearing impaired using automatic speech recognition
US11368799B2 (en) Hearing device customization systems and methods
KR20160074952A (ko) 사용자 단말기를 이용한 보이스 컨설팅 제공 방법
KR102350890B1 (ko) 휴대용 청력검사장치
EP4293660A1 (en) Electronic device and method for controlling same

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200701

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200730

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201207

R150 Certificate of patent or registration of utility model

Ref document number: 6807491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250