JP2015007683A

JP2015007683A - 音声処理器具、音声処理方法

Info

Publication number: JP2015007683A
Application number: JP2013132343A
Authority: JP
Inventors: 貴文甲斐; Takafumi Kai
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2013-06-25
Filing date: 2013-06-25
Publication date: 2015-01-15

Abstract

【課題】話し手が一定の話速、且つ連続的に話すときでも、補聴器のユーザ（聞き手）の理解度を向上させる。ここでの「連続的に話す」とは、例えば「じゅういちねんかんかんがえているからからかわれそうです」のように、話し手が、話の一部に五十音（例えば、「かん」や「から」）を繰り返し、息継ぎすることなく話すことを意味する。【解決手段】音声処理器具は、入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する。【選択図】図９

Description

本発明は、音声処理器具、音声処理方法に関し、特に、聞き手の理解度を向上させる為に音声処理を行う音声処理器具、音声処理方法に関する。

一般的に、音声処理を行い、聞き手の理解度を向上させる補聴器が知られている。音声処理を行う補聴器としては、以下の特許文献１が開示されている。

特許文献１の補聴器は、話し手の発した声が音声信号として入力される。特許文献１の補聴器は、音声信号が入力されると、最初の母音の長さを測定する。例えば、「おはよう」という音声信号が入力された場合には、最初の母音「お」の長さを測定する。次に、特許文献１の補聴器は、測定した母音の長さに基づいて、入力された音声信号の話速を検出し、入力された音声信号の話速を所定の目標話速に変換するための変換比率を算出する。特許文献１の補聴器は、先頭の音節の母音「お」後の音声信号「はよう」の話速を、算出した変換比率で変換して出力する。

上述の構成や動作の通り、特許文献１の補聴器は、入力された音声信号の話速を所定の目標話速となるように変換することができ、聞き手の理解度を向上させる。

特開平１０−７０７９０号公報

しかし、特許文献１の補聴器は、話し手が一定の音調で連続的に話すときには、補聴器のユーザ（聞き手）の理解度を向上させることができないという課題があった。ここでの「連続的に話す」とは、例えば「じゅういちねんかんかんがえているからからかわれそうです」のように、話し手が、話の一部に五十音（例えば、「かん」や「から」）を繰り返し、息継ぎすることなく話すことを意味する。

上述の課題が生じる理由としては、話し手が一定の音調で連続的に話す場合であっても特許文献１の補聴器は、話し手が発した音を所定の速度に変換するだけであり、変換された音を聞いた聞き手は、どこまでが意味のある音なのか、切れ目が分からないからである。その結果、聞き手は、話し手の話す内容を理解できず、理解度を向上させることができなかった。なお、上述の例の場合、話し手は、「１１年間、考えているから揶揄われそうです」と話したつもりである。

本発明は、上記課題を解決する音声処理器具、音声処理方法を提供することを目的とする。

上記目的を達成するために、本発明の音声処理器具は、入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する。

上記目的を達成するために、本発明の音声処理方法は、入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する。

本発明によれば、音声処理器具は、話し手が一定の音調で連続的に話す場合であっても、音声処理器具のユーザ（聞き手）に話し手が話した内容を理解させることができ、音声処理器具のユーザ（聞き手）の理解度を向上させることができる。

本発明の第１の実施の形態における補聴器の構成例を示す図である。本発明の第１の実施の形態における補聴器の動作を説明する為の図である。本発明の第１の実施の形態における補聴器が、入力された音声信号を信号処理した一例を示した図である。本発明の第１の実施の形態における補聴器に周囲の音を遮断する構成を付加した図（その１）である。本発明の第１の実施の形態における補聴器に周囲の音を遮断する構成を付加した図（その２）である。本発明の第１の実施の形態における補聴器に音声信号を出力する時間を調整する為の構成を付加した図である。本発明の第２の実施の形態における補聴器の構成例を示す図である。本発明の第２の実施の形態における補聴器の動作を説明する為の図である。本発明の第３の実施の形態における音声処理器具に入出力される信号を説明する為の図である。

次に本発明の実施形態について、図面を参照して詳細に説明する。

［第１の実施の形態］
本発明の第１の実施の形態における補聴器は、意味のある音を聞き手が認識できるよう、入力された音声信号を文節毎に分け、分けた音声信号を所定の時間、間をおいて出力する。例えば、「じゅういちねんかんかんがえているからからかわれそうです」と音声が入力された場合、本実施形態の補聴器は、「じゅういちねんかん（１１年間）」「かんがえているから（考えているから）」「からかわれそうです」と文節毎に分ける。まず、以下に、本発明の第１の実施の形態における補聴器の構成や機能、動作について説明する。

［構成の説明］
まず、本発明の第１の実施の形態における補聴器の構成と機能について説明する。

（１）本発明の第１の実施の形態における補聴器の構成
図１は、本発明の第１の実施の形態における補聴器の構成例を示す図である。図１に示されるように、本実施形態の補聴器１は、マイク１０と、Ａ／Ｄ変換部１１と、記憶部１２と、信号処理部１３と、データベース１４と、Ｄ／Ａ変換部１５と、アンプ１６と、スピーカー１７を備える。

Ａ／Ｄ変換部１１は、マイク１０と記憶部１２に接続される。また、信号処理部１３は、記憶部１２、データベース１４、およびＤ／Ａ変換部１５に接続される。アンプ１６は、Ｄ／Ａ変換部１５とスピーカー１７に接続される。

（２）本発明の第１の実施形態における補聴器を構成する各部位の機能
マイク１０は、一般的なマイクである。マイク１０は、入力された音声を音声信号に変換して出力する。音声信号は、アナログ信号である。

Ａ／Ｄ変換部１１は、入力された音声信号等のアナログ信号をデジタル信号に変換して出力する。

記憶部１２は、入力されたデジタル信号を、入力された順に自身に備わるメモリに記憶する。記憶部１２は、所定のタイミングになると、記憶するデジタル信号のうち、信号レベルが所定値以上となったデジタル信号（以下、「信号Ａ」という）と、その後、所定値以下になったデジタル信号（以下、「信号Ｂ」という）を求める。記憶部１２は、記憶しているデジタル信号に中から、信号Ａを記憶してから信号Ｂを記憶するまでの間に記憶されたデジタル信号を、話し手から発せられた音声に対応するデジタル信号と判別して、信号処理部１３に出力する。所定のタイミングは、一定間隔毎のタイミングであってもよく、本実施形態の補聴器１のユーザによって記憶部１２に設定される。なお、記憶部１２は、デジタル信号を出力すると、記憶するデジタル信号をメモリから消去する。

信号処理部１３は、一般的な音声認識機能を有する。信号処理部１３は、音声に対応するデジタル信号が入力されると、一般的な音声認識機能により、入力されたデジタル信号を文字列に変換し、変換した文字列を処理上の文とみなし、出力する。信号処理部１３は、文を出力した結果、文節に対応する文字列と処理終了に対応する信号が入力される。信号処理部１３は、処理終了に対応する信号が入力されると、文節に対応する文字列をデジタル信号として出力する。但し、信号処理部１３は、各デジタル信号を出力する際、所定時間、間をおいて出力する。上述の所定時間は、本実施形態の補聴器１のユーザによって、信号処理部１３に設定される。

データベース１４は、文節に対応する文字列（以下、「文節文字列」という）が、本実施形態の補聴器１のユーザによって設定されている。本実施形態の補聴器１のユーザは、文節に対応する文字列として「じゅういちねんかん」、「かんがえているから」や「からかわれそうです」を設定してもよい。データベース１４は、文（例えば、「じゅういちねんかんかんがえているからからかわれそうです」）が入力されると、上述の文節文字列を参照しながら文を文節毎に分け、各文節に対応する文字列を出力する。文を文節毎に分ける動作の詳細については、後述の［動作の説明］に記載する。データベース１４は、文を文節毎に分け終わると、処理終了に対応する信号を出力する。

Ｄ／Ａ変換部１５は、入力されたデジタル信号をアナログ信号に変換して出力する。

アンプ１６は、一般的なアンプである。すなわち、アンプ１６は、入力される音声信号を増幅して出力する。

スピーカー１７は、一般的なスピーカーである。すなわち、スピーカー１７は、入力されるアナログ信号を音声として出力する。

Ａ／Ｄ変換部１１とＤ／Ａ変換部１５は、電子回路やＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）を用いて実現することができる。また、信号処理部１３は、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）やＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等の演算処理装置を用いて実現することができる。さらに、記憶部１２とデータベース１４は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）やＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等の演算処理装置を用いて実現することができる。

［動作の説明］
図２は、本発明の第１の実施の形態における補聴器の動作を説明する為の図である。図３は、本発明の第１の実施の形態における補聴器が、入力された音声信号を信号処理した一例を示した図である。

図２、図３を用いて、本実施形態の補聴器の動作を以下に説明する。

（１）本実施形態の補聴器の動作
まず、話し手から発せられた音声が本実施形態の補聴器のマイク１０に入力したとする。

マイク１０は、話し手から発せられた音声が入力されると、その音声を音声信号に変換し、図２に示されるように、変換した音声信号をＡ／Ｄ変換部１１に出力する。音声信号は、アナログ信号である。

次に、Ａ／Ｄ変換部１１は、図２に示されるように、マイク１０から入力された音声信号をデジタル信号に変換して、記憶部１２に出力する（Ｓ１）。

次に、記憶部１２は、Ａ／Ｄ変換部１１から入力されたデジタル信号を、入力された順に自身に備わるメモリに記憶する（Ｓ２）。

次に、記憶部１２は、所定のタイミングになると、記憶しているデジタル信号の中に、話し手から発せられた音声に対応するデジタル信号があるか判別し、話し手から発せられた音声に対応するデジタル信号があれば、その信号を信号処理部１３に出力する（Ｓ３）。

具体的には、記憶部１２は、所定のタイミングになると、記憶するデジタル信号のうち、信号レベルが所定値以上となったデジタル信号（以下、「信号Ａ」という）と、その後、所定値以下になったデジタル信号（以下、「信号Ｂ」という）を求める。記憶部１２は、記憶しているデジタル信号に中から、信号Ａを記憶してから信号Ｂを記憶するまでの間に記憶されたデジタル信号を、話し手から発せられた音声に対応するデジタル信号と判別して、信号処理部１３に出力する。なお、上述の所定のタイミングは、一定間隔毎のタイミングであってもよく、本実施形態の補聴器１のユーザによって記憶部１２に設定される。なお、記憶部１２は、デジタル信号を出力すると、記憶するデジタル信号をメモリから消去する。

次に、信号処理部１３は、記憶部１２から音声に対応するデジタル信号が入力されると、一般的な音声認識機能により、入力されたデジタル信号を文字列に変換し、変換した文字列を処理上の文とみなす（Ｓ４）。

次に、信号処理部１３は、Ｓ４で求めた文を所定の文節毎に分ける（Ｓ５）。

具体的には、信号処理部１３は、以下の（Ｉ）〜（ＩＩＩ）の処理を行う。

（Ｉ）まず、信号処理部１３は、Ｓ４で求めた文（例えば、「じゅういちねんかんかんがえているからからかわれそうです」）をデータベース１４に出力する。

なお、データベース１４には、文節に対応する文字列が、本実施形態の補聴器１のユーザによって設定されている。文節は、一般的に終助詞の「ね」を挟みうるかどうかで判断できることが知られており、本実施形態の補聴器１のユーザは、終助詞の「ね」を付けて意味の通る語句を、文節に対応する文字列（以下、「文節文字列」という）として設定する。例えば、本実施形態の補聴器１のユーザは、文節文字列として「じゅういちねんかん」、「かんがえているから」や「からかわれそうです」をデータベース１４に設定してもよい。

（ＩＩ）次に、データベース１４は、文（例えば、「じゅういちねんかんかんがえているからからかわれそうです」）が入力されると、以下の処理Ａ〜Ｃを繰り返し実施して文を文節毎に分け、各文節に対応する文字列を出力する。

（処理Ａ）データベース１４は、入力された文から、文字数が少なくとも１文字以上で文の先頭の文字から始まる文字列（例えば、「じ」、「じゅ」「じゅう」「じゅういちねんかん」等）を全て抽出する。

（処理Ｂ）次に、データベース１４は、抽出した文字列のうち、文節文字列と一致するものがあるかを判別し、一致する文字列があれば、その文字列（例えば、「じゅういちねんかん」）を信号処理部１３に出力する。

（処理Ｃ）次に、データベース１４は、出力した文字列（以下、「出力文字列」という）後の文（例えば「じゅういちねんかん」後の「かんかんがえているからからかわれそうです」）を、入力された文とみなし、その文について再度処理Ａを実施する。

なお、データベース１４は、上述の処理Ａにおいて、文節文字列と一致する文字列が見つからなければ、そのとき認識していた文を信号処理部１３に出力し、処理Ａ〜Ｃを終了する。また、データベース１４は、上述の処理Ｃにおいて、出力文字列後の文がなければ、処理Ａ〜Ｃを終了する。

（ＩＩＩ）次に、データベース１４は、処理Ａ〜Ｃを終了すると、処理終了に対応する信号を信号処理部１３に出力する。

上述の（Ｉ）〜（ＩＩＩ）の処理を実施した結果、データベース１４は、出力文字列「じゅういちねんかん」、「かんかんがえているから」および「からかわれそうです」を信号処理部１３に出力したものとして以下の説明を続ける。

次に、信号処理部１３は、処理終了に対応する信号がデータベース１４から入力されると、それまでにデータベース１４から入力された出力文字列（例えば、「じゅういちねんかん」）をデジタル信号としてＤ／Ａ変換部１５に出力する。但し、信号処理部１３は、各デジタル信号を出力する際、所定時間、間をおいてＤ／Ａ変換部１５に出力する（Ｓ６）。上述の所定時間は、本実施形態の補聴器１のユーザによって、信号処理部１３に設定される。

なお、信号処理部１３は、デジタル信号が出力されない上述の所定の時間の間、信号レベルが所定値以下の小さなノイズデータ、若しくは無音データを出力してもよい。所定値は、本実施形態の補聴器１のユーザによって選択される。ノイズデータや無音データは、デジタル信号である。

次に、Ｄ／Ａ変換部１５は、デジタル信号が信号処理部１３から入力されると、アナログの音声信号に変換してアンプ１６に出力する（Ｓ７）。

次に、アンプ１６は、Ｄ／Ａ変換部１５から音声信号が入力されると、その信号を増幅し、スピーカー１７に出力する。

スピーカー１７は、アンプ１６から入力される音声信号を音声として出力する。

上述の動作の結果、話し手が一定の音調で連続的に話す場合であっても、本実施形態の補聴器１を使用するユーザ（聞き手）は、文節毎に分けられた音声を聞く事ができる。例えば、話し手が一定の音調で連続的に「じゅういちねんかんかんがえているからからかわれそうです」と話す場合であっても、本実施形態の補聴器１のユーザは、「じゅういちねんかん」「かんがえているから」「からかわれそうです」と文節毎に分けて聞く事ができる。その結果、本実施形態の補聴器１を使用するユーザ（聞き手）は、話し手が話した内容を容易に理解することができる。

図３では、本実施形態の補聴器１が、入力された音声信号を文節分けした他の一例を示している。図３では、本実施形態の補聴器１が、入力された音声信号「あなたがいる」を「あなたが」「いる」と文節分けし、「あなたが」と「いる」を間をおいて出力した様子を示している。

なお、上述のＳ６では、信号処理部１３は、各デジタル信号を所定時間、間をおいて出力したが、各デジタル信号を出力する毎に、その信号レベルを一定以上変動させ、間をおかずに出力してもよい。なぜなら、本実施形態の補聴器１を使用するユーザ（聞き手）は、間がなくても、信号レベルが一定以上異なった音声信号を聞くことで、各文節を認識することができるからである。

具体的には、信号処理部１３は、各デジタル信号を出力する際に、出力するデジタル信号の信号レベルを、直近に出力したデジタル信号の信号レベルよりも所定値以上大きな、若しくは小さな信号レベルにして出力する。信号処理部１３は、デジタル信号を出力すると、そのデジタル信号の信号レベルを、直近に出力したデジタル信号の信号レベルとして記憶する。上述の所定値や所定の信号レベルは、本実施形態の補聴器１のユーザによって信号処理部１３に設定される。なお、信号処理部１３は、初めてデジタル信号を出力する場合には、所定の信号レベルで出力する。

（２）本実施形態の補聴器に付加される機能
本実施形態の補聴器１には、周囲の音を遮断する構成が付加されてもよい。図４は、本発明の第１の実施の形態における補聴器に周囲の音を遮断する構成を付加した図（その１）である。

本実施形態の補聴器１は、図４に示されるように、周囲の音を遮断する構成として、耳栓を付加することができる。本実施形態の補聴器１は、耳栓によって、マイク１０以外から耳に入ってくる周囲の音を物理的に遮断することができる。

図５は、本発明の第１の実施の形態における補聴器に周囲の音を遮断する構成を付加した図（その２）である。

本実施形態の補聴器１は、図５に示されるように、周囲の音を遮断する構成として、一般的な負帰還回路を付加することができる。一般的な負帰還回路は、入力された音声信号のＳＮ（ＳｉｇｎａｌｔｏＮｏｉｓｅ）比を改善することができる。その為、本実施形態の補聴器１は、マイク１０の後に一般的な負帰還回路を付加することで、入力される音声信号のＳＮ比が改善し、音声信号に対してノイズである周囲の音を抑えることができる。本実施形態の補聴器１は、上述の耳栓と負帰還回路の両方を備えてもよい。

図６は、本発明の第１の実施の形態における補聴器に音声信号を出力する時間を調整する為の構成を付加した図である。本実施形態の補聴器１は、図６に示されるように、上述のＳ６で用いた所定時間を信号処理部１３に設定する機能部（以下、「再生時間コントローラ１８」という）を付加することができる。再生時間コントローラ１８は、数字キーとエンターキーを備え、エンターキーが本実施形態の補聴器１のユーザによって押下されると、それまでに押下された数字キーに対応する数値を所定時間として信号処理部１３に設定する。本実施形態の補聴器１のユーザは、再生時間コントローラ１８によって、文節毎に分けられた音声信号を出力する間を調整することができる。

［効果の説明］
本実施形態によれば、補聴器は、話し手が一定の音調で連続的に話す場合であっても、音声処理器具のユーザ（聞き手）に話し手が話した内容を容易に理解させることができ、音声処理器具のユーザ（聞き手）の理解度を向上させることができる。

その理由は、本実施形態の補聴器が、入力された音声信号を所定の文節毎に分け、分けた音声信号各々を所定時間、間をとりながら、又は、分けた音声信号各々の信号レベルを変動させながら出力するからである。本実施形態の補聴器１を使用するユーザ（聞き手）は、文節毎に分けられた音声を聞くことで、意味のある音を認識でき、話し手が話した内容を理解することができるので、理解度を向上させることができる。

［第２の実施の形態］
次に、本発明の第２の実施の形態について説明する。

一般的に外国語、特に英語は、話し手によって発話される時、単語一つ一つが発話されるのではなく、複数の単語が連続して発話される。これは、一般的にリエゾンと呼ばれる。例えば、ＣａｎＩｈｅｌｐｙｏｕ？が発話されるときには、キャンアイヘルプユーと発話されるのではなく、ＣａｎＩが連続的に発話され、キャナイヘルプユーと発話される。リエゾンに慣れていない者は、辞書に示されている単語の音とは違った音になる為に、話し手が話す外国語を理解することは難しい。第２の実施の形態の補聴器は、翻訳機として動作し、リエゾンが用いられた外国語の音声が入力された場合であっても、その意味を聞き手に理解させるものである。

以下、本発明の第２の実施の形態の補聴器の構成と動作について説明する。

［構成の説明］
図７は、本発明の第２の実施の形態における補聴器の構成例を示す図である。第２の実施の形態における補聴器２は、図７に示されるように、信号処理部１３と、データベース１４の代わりに、信号処理部２３と、データベース２４を備える。

信号処理部２３は、認識した文（例えば、「キャナイヘルプユー」）を出力した結果、文を構成する単語、若しくはリエゾンにより連結した語句について、その意味を示すデータが入力される。また、信号処理部２３は、処理終了に対応する信号が入力されると、それまでに入力された意味を示す各データをデジタル信号として出力する。但し、信号処理部２３は、各デジタル信号を出力する際、所定時間、間をおいて出力する。上述の所定時間は、本実施形態の補聴器２のユーザによって、信号処理部２３に設定される。

データベース２４は、単語、若しくはリエゾンにより連結した語句に対応する文字列（以下、「分割候補文字列」という）と、その意味に対応するデータ（以下、「意味データ」という）とが関連づけられて、本実施形態の補聴器２のユーザによって設定される。例えば、本実施形態の補聴器２のユーザは、分割候補文字列として「キャナイ」、「ヘルプ」、「ユー」をデータベース２４に設定してもよい。また、本実施形態の補聴器２のユーザは、意味データとして「私はできる」、「助ける」、「あなたを」を示すデータを各分割候補文字列と関連づけてデータベース２４に設定してもよい。データベース２４は、文（例えば、「キャナイヘルプユー」）が入力されると、その文を単語、若しくはリエゾンにより連結した語句に分け、その意味を示すデータ、すなわち意味データを出力する。文を単語、若しくはリエゾンにより連結した語句に分け、その意味を示すデータを出力する動作の詳細については、後述の［動作の説明］に記載する。データベース２４は、意味データを出力し終わると、処理終了に対応する信号を信号処理部２３に出力する。

なお、上述した以外の構成や機能は、第１の実施の形態における無線通信端末を適用した補聴器と同じであるので、同一の符号を付して説明を省略する。

［動作の説明］
次に、本実施形態における補聴器２の動作を説明する。図８は、本発明の第２の実施の形態における補聴器の動作を説明する為の図である。

まず、補聴器２の信号処理部２３は、図８に示されるように、上述のＳ４を実施し、文を求めると、その文を単語、若しくはリエゾンにより連結した語句毎に分け、さらにその意味を示すデータを出力する（Ｓ１５）。

具体的には、信号処理部２３は、以下の（ｉ）〜（ｉｉｉ）の処理を行う。

（ｉ）まず、信号処理部２３は、上述のＳ４によって求められた文（例えば、「キャナイヘルプユー」）をデータベース２４に出力する。

なお、データベース２４には、単語、若しくはリエゾンにより連結した語句に対応する文字列（以下、「分割候補文字列」という）と、その意味に対応するデータ（以下、「意味データ」という）とが関連づけられて、本実施形態の補聴器２のユーザにより設定されている。例えば、本実施形態の補聴器２のユーザは、分割候補文字列として「キャナイ」、「ヘルプ」、「ユー」をデータベース２４に設定してもよい。また、本実施形態の補聴器２のユーザは、意味データとして「私はできる」、「助ける」、「あなたを」を示すデータを各分割候補文字列と関連づけてデータベース２４に設定してもよい。

（ｉｉ）次に、データベース２４は、文（例えば、「キャナイヘルプユー」）が入力されると、以下の処理ａ〜処理ｃを、繰り返し実施して文を単語、若しくはリエゾンにより連結した語句に分け、その意味を示すデータを出力する。

（処理ａ）まず、データベース２４は、入力された文から、文字数が少なくとも１文字以上で文の先頭の文字から始まる文字列（例えば、「キ」、「キャ」「キャナ」「キャナイ」等）を全て抽出する。

（処理ｂ）次に、データベース２４は、抽出した文字列のうち、一致文字列（例えば、「キャナイ」）があれば、その文字列に関連づけられている意味データ（例えば、「私はできる」を示すデータ）を信号処理部２３に出力する。

（処理ｃ）次に、データベース２４は、上述の一致文字列後の文（例えば「キャナイ」後の「ヘルプユー」）を、入力された文とみなし、その文について再度処理ａを実施する。

なお、データベース２４は、上述の処理ａにおいて、一致文字列がなければ、そのとき認識していた文を信号処理部２３に出力し、処理ａ〜ｃを終了する。また、データベース１４は、上述の処理ｃにおいて、一致文字列後の文がなければ、処理ａ〜ｃを終了する。
（ｉｉｉ）データベース２４は、処理ａ〜ｃを終了すると、処理終了に対応する信号を信号処理部２３に出力する。

上述の（ｉ）〜（ｉｉｉ）の処理を実施した結果、データベース２４は、「私はできる」、「助ける」、及び「あなたを」を示す意味データを信号処理部２３に出力したとして、以下の説明を続ける。

次に、信号処理部２３は、処理終了に対応する信号がデータベース１４から入力されると、それまでにデータベース２４から入力された意味データ（例えば、「私はできる」「助ける」「あなたを」を示すデータ）をデジタル信号としてＤ／Ａ変換部１５に出力する。但し、信号処理部２３は、各デジタル信号を出力する際には、所定時間、間をおいてＤ／Ａ変換部１５に出力する（Ｓ１６）。上述の所定時間は、本実施形態の補聴器２のユーザによって、信号処理部２３に設定される。

その結果、本実施形態の補聴器は、リエゾンが用いられた外国語の音声（例えば、「キャナイヘルプユー」）が入力された場合であっても、その意味「私はできる」、「助ける」、「あなたを」を間をあけながら出力し、聞き手に外国語を理解させることができる。

その他の動作については、第１の実施の形態の動作と同様である為、詳細の説明を省略する。

［効果の説明］
本実施形態によれば、補聴器は、リエゾンが用いられた外国語の音声が入力された場合であっても、その意味を聞き手に理解させることができる。

その理由として、本実施形態の補聴器は、入力された外国語の音声信号を単語、若しくはリエゾンにより連結した語句に分け、分けた単語や語句の意味を求め、求めた各意味を聞き手が聞きやすいように間をとりながら音声信号として出力するからである。

［第３の実施の形態］
次に、本発明の第３の実施の形態について説明する。

［構成の説明］
図９は、本発明の第３の実施の形態における音声処理器具に入出力される信号を説明する為の図である。

第３の実施の形態における音声処理器具は、図９に示されるように、音声信号が入力される。また、本実施形態の音声処理器具は、入力された音声信号を発音上の単位毎に分け、分けた音声信号各々に所定の処理をして出力する。

所定の処理は、分けた音声信号各々を所定の時間、間をおく処理であってもよい。その結果、本実施形態の音声処理器具は、分けた音声信号各々を所定の時間、間をおいて出力することができる。所定の時間は、本実施形態の音声処理器具のユーザによって設定される。

また、上述の発音上の単位は、文節であってもよい。また、上述の所定時間は、本実施形態の音声処理器具のユーザによって設定される。

[動作の説明]
第３の実施の形態における音声処理器具は、入力された音声信号を発音上の単位毎、例えば文節毎に分け、分けた音声信号各々に所定の処理をして出力する。

その理由は、本実施形態の補聴器が、入力された音声信号を発音上の単位、例えば文節毎に分け、分けた音声信号各々を聞き手が聞きやすいように所定時間、間をおく等、所定の処理をして出力するからである。本実施形態の補聴器１を使用するユーザ（聞き手）は、発音上の単位毎に分けられた音声を聞くことで、意味のある音を認識でき、話し手が話した内容を理解することができるので、理解度を向上させることができる。

なお、上述した実施の形態は、その形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々変更可能である。

さらに、上記の各実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
（付記１）
入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する、
ことを特徴とする音声処理器具。
（付記２）
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする付記１に記載の音声処理器具。
（付記３）
前記発音上の単位は、文節である、
ことを特徴とする付記１乃至２のいずれか１項に記載の音声処理器具。
（付記４）
前記発音上の単位は、単語、若しくは前記単語がリエゾンにより連結した語句であり、前記所定の処理は、分けた前記音声信号各々を所定の音声信号に変換して出力する処理である、
ことを特徴とする付記１乃至３のいずれか１項に記載の音声処理器具。
（付記５）
入力された音声信号に対応する第１の文字列から抽出した、文字数が少なくとも１文字以上で前記第１の文字列の先頭の文字から始まる文字列のうち、発音上の単位に対応する所定の第２の文字列と一致する前記文字列を出力し、さらに、出力した前記文字列後の前記第１の文字列を、新たな前記第１の文字列とみなす出力処理を繰り返すデータ処理部と、
入力される前記文字列各々に所定の処理をして出力する信号処理部と、を備える、
ことを特徴とする音声処理器具。
（付記６）
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする付記５に記載の音声処理器具。
（付記７）
前記データ処理部は、一致した前記文字列に対応する所定のデータを出力し、
前記信号処理部は、入力される前記所定のデータ各々を、所定時間、間をおいて前記音声信号として出力する、
ことを特徴とする付記５乃至６のいずれか１項に記載の音声処理器具。
（付記８）
前記データ処理部は、前記所定の第２の文字列と一致する前記文字列がない場合、若しくは、前記信号処理部に出力した前記文字列後の前記第１の文字列がない場合に、前記出力処理を終了する、
ことを特徴とする付記５乃至７のいずれか１項に記載の音声処理器具。
（付記９）
入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する、
ことを特徴とする音声処理方法。
（付記１０）
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする付記９に記載の音声処理方法。
（付記１１）
入力された音声信号に対応する第１の文字列から抽出した、文字数が少なくとも１文字以上で前記第１の文字列の先頭の文字から始まる文字列のうち、発音上の単位に対応する所定の第２の文字列と一致する前記文字列を求め、さらに、一致した前記文字列後の前記第１の文字列を新たな前記第１の文字列とみなすことを、前記所定の第２の文字列と一致する前記文字列が求められなくなるまで繰り返し、求めた前記文字列各々に所定の処理をして出力する、
ことを特徴とする音声処理方法。
（付記１２）
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする付記１１に記載の音声処理方法。
（付記１３）
一致した前記文字列に対応する所定のデータ各々を、所定時間、間をおいて前記音声信号として出力する、
ことを特徴とする付記１１乃至１２のいずれか１項に記載の音声処理方法。
（付記１４）
前記所定の処理は、分けた前記音声信号を各々出力する際、出力する前記音声信号の信号レベルを、少なくとも直近に出力した前記音声信号の前記信号レベルとは所定値以上異なる前記信号レベルにする処理である、
ことを特徴とする付記１に記載の音声処理器具。
（付記１５）
負帰還回路を備え、入力された前記音声信号を前記負帰還回路に入力し、その結果、出力された前記音声信号を発音上の単位毎に分ける、
ことを特徴とする付記１乃至４のいずれか１項、又は付記１４に記載の音声処理器具。
（付記１６）
前記間には、無音、若しくは所定値以下のノイズに対応する前記音声信号を出力する、
ことを特徴とする付記１乃至４のいずれか１項、又は付記６乃至８のいずれか１項、又は付記１４乃至１５のいずれか１項に記載の音声処理器具。
（付記１７）
前記音声処理器具は、補聴器や翻訳機である、
ことを特徴とする付記１乃至８のいずれか１項、又は付記１４乃至１６のいずれか１項に記載の音声処理器具。
（付記１８）
耳栓を備える、
ことを特徴とする付記１乃至８のいずれか１項、又は付記１４乃至１７のいずれか１項に記載の音声処理器具。

１補聴器
２補聴器
１０マイク
１１Ａ／Ｄ変換部
１２記憶部
１３信号処理部
１４データベース
１５Ｄ／Ａ変換部
１６アンプ
１７スピーカー
２３信号処理部
２４データベース

Claims

入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する、
ことを特徴とする音声処理器具。
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする請求項１に記載の音声処理器具。
前記発音上の単位は、文節である、
ことを特徴とする請求項１乃至２のいずれか１項に記載の音声処理器具。
前記発音上の単位は、単語、若しくは前記単語がリエゾンにより連結した語句であり、前記所定の処理は、分けた前記音声信号各々を所定の音声信号に変換して出力する処理である、
ことを特徴とする請求項１乃至３のいずれか１項に記載の音声処理器具。
入力された音声信号に対応する第１の文字列から抽出した、文字数が少なくとも１文字以上で前記第１の文字列の先頭の文字から始まる文字列のうち、発音上の単位に対応する所定の第２の文字列と一致する前記文字列を出力し、さらに、出力した前記文字列後の前記第１の文字列を、新たな前記第１の文字列とみなす出力処理を繰り返すデータ処理部と、
入力される前記文字列各々に所定の処理をして出力する信号処理部と、を備える、
ことを特徴とする音声処理器具。
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする請求項５に記載の音声処理器具。
前記データ処理部は、一致した前記文字列に対応する所定のデータを出力し、
前記信号処理部は、入力される前記所定のデータ各々を、所定時間、間をおいて前記音声信号として出力する、
ことを特徴とする請求項５乃至６のいずれか１項に記載の音声処理器具。
前記データ処理部は、前記所定の第２の文字列と一致する前記文字列がない場合、若しくは、前記信号処理部に出力した前記文字列後の前記第１の文字列がない場合に、前記出力処理を終了する、
ことを特徴とする請求項５乃至７のいずれか１項に記載の音声処理器具。
入力された音声信号を発音上の単位毎に分け、分けた前記音声信号各々に所定の処理をして出力する、
ことを特徴とする音声処理方法。
前記所定の処理は、分けた前記音声信号各々を所定の時間、間をおく処理である、
ことを特徴とする請求項９に記載の音声処理方法。