JP2019023674A - 過大音混入対応音声入力装置 - Google Patents

過大音混入対応音声入力装置 Download PDF

Info

Publication number
JP2019023674A
JP2019023674A JP2017142382A JP2017142382A JP2019023674A JP 2019023674 A JP2019023674 A JP 2019023674A JP 2017142382 A JP2017142382 A JP 2017142382A JP 2017142382 A JP2017142382 A JP 2017142382A JP 2019023674 A JP2019023674 A JP 2019023674A
Authority
JP
Japan
Prior art keywords
sound
input
voice
excessive
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017142382A
Other languages
English (en)
Inventor
孝之 香高
Takayuki Kadaka
孝之 香高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Systec KK
Original Assignee
Systec KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Systec KK filed Critical Systec KK
Priority to JP2017142382A priority Critical patent/JP2019023674A/ja
Publication of JP2019023674A publication Critical patent/JP2019023674A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】意図せず入力する過大音が発生しても呼吸音と同程度又はそれより小さい音圧領域の発話音を入力する音声入力装置を提供する。【解決手段】マイクロフォンに入力された音声データの中で、呼吸音より大きな所定の音圧閾値より大きく、意図せず入力した過大音を判別する過大音判別手段を備える入力音判別装置と、判別に基づき、過大音の入力以前の箇所より再度の音声入力を促す再入力指示手段と、再入力した音声(又は音声データ)を過大音の入力以前の箇所より置き換える再入力音声(音声データ)置換手段とを備える再入力処理装置と、を有する。【選択図】図1

Description

本発明は、音声入力装置を使用する場合に、他者の発話音が騒音となったり、他から意図しない過大な音となって、自己の音声入力装置へ入力し、所望の音声データが破壊されることを回避・対応した手段を提供する過大音混入対応音声入力装置に関するものである。
従来、音声入力する場合は、マイクロフォンから発話音を入力するが、通常行われているように、発話音は、通常耳にする音圧レベル(約60dB付近を中心とする)のものであり、周辺からの雑音の音圧レベルはこれより小さいので問題がない。しかし、一人で個室での作業では問題にならないが、多数の作業者が同室で発話するのは、極めてうるさく、他人の発話は雑音になりやすい。
また、携帯電話などでは、多数の人のいる空間(たとえば、列車内や会議場など)では、うるさいので、使用しないように電源を切っておくか、マナーとして、その空間を出て使用するようになっている。また、相互の発話音が、互いの入力装置に入ってしまい意図しない情報漏えいや騒音になる危険もある。
音声入力による文字や符号、図形への変換装置においても、隣同士の音声の混入は不要な雑音になって、変換結果に誤りが生じ、又、情報漏えいに繋がり、このような場合には、オフィスのような複数者が同居する空間では不都合な状態となる。また、一人の音声入力においても、他の過大音雑音が入ってくる場合もあった。
このような不都合は避ける必要があった。特に、携帯電話や音声入力により文字変換装置のような複数者が使用する環境では、音声入力処理は、このような意図しない過大音入力への対応処理を行わないと上記の不都合が生じて使えない環境として、使われないか、マナーとして使用が規制されていた。
音声処理装置は、電話機能や音声文字変換機能自体は、機能として有益なものであるが、複数話者の間や、過大音環境では、騒音となって使いにくいものであった。しかしながら、今後、これらの装置を騒音とならずに規制なく自由に使用できるようにすることは、極めて歓迎すべきことである。
このような中で、特許文献1には、非発話音と発話音を区別するためにフラクタル次元数(数学的理論に基づた計算処理を行う)を計算する手法が示されている。非発話を特定して、その結果、非発話音中の溜息を判別し、これを検出して運転士の集中力の低下を検出するものであるが、微小音や極微小音の発話を対象にしたものではない。
又、本出願人が先に出願した特許文献2、特許文献3のものがある。
特許文献2において、発明者は極微小音領域において、音圧の閾値により、呼吸音を除去する装置を提案した。特許文献3においては、発話音の音圧が、呼吸音と同程度又はそれより小さい音圧領域の発話音の入力において、呼吸音と発話音の判別手段と発話音の選択する装置を提供した。この中で、発話音の音圧が、呼吸音と同程度又はそれより小さい音圧領域の発話音よりはるかに過大な通常音(〜60db)が、これらの発話音と同時に入力すると、小さな発話音は判別不能になってしまうことに対して、過大音の判断と発話音の再入力が必要であることを示し、これらへの具体的な対応が望まれてきた。
特開2007−264567 特許第6061069号 特開2015−228002
本発明の課題は、呼吸音と同程度又はそれより小さい音圧領域の発話音を入力する場合に、
過大音の入力を判別し、過大音の入力以前の箇所より、音声の再入力を音声又は文字表示により指示し、再入力があったら、再入力音声以降の音声を過大音の入力以前の箇所の音声以降に置き換える音声入力装置を提供する。
過大音混入対応音声入力装置は、音を入力するマイクロフォンを含む音声入力装置と、入力音判別装置と、再入力処理装置と、音声信号処理装置と、音声データメモリと、これらを制御する制御手段とを備え、
発話音の音圧が呼吸音と同程度または、それより小さい音圧領域の音声をマイクロフォンに入力する場合に、入力音判別装置は、マイクロフォンに入力された音声データの中で、呼吸音より大きな所定の音圧閾値より大きく、意図せず入力した過大音を判別する過大音判別手段を備え、
再入力処理装置は、判別に基づき、過大音の入力以前の箇所より再度の音声入力を促す再入力指示手段と、再入力した音声(又は音声データ)を過大音の入力以前の箇所より置き換える再入力音声(音声データ)置換手段とを備えるものである。
以下詳述する。
請求項1記載の発明は、過大音混入対応音声入力装置であって、
音を入力するマイクロフォンを含む音声入力装置と、入力音判別装置と、再入力処理装置と、音声データメモリと、これらを制御する制御手段とを備え、発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力する場合に、前記入力音判別装置は、前記マイクロフォンに入力された音声データの中で、前記呼吸音より大きな所定の音圧閾値より大きく、意図せず入力した過大音を判別する過大音判別手段を備え、前記再入力処理装置は、前記過大音が入力したという前記過大音判別手段による判別に基づき、再度の音声入力を促す再入力指示手段と、前記指示に対応して再入力した音声(又は音声データ)を前記過大音の入力以前の音声集団又は音声区間より置き換える再入力音声(音声データ)置換手段とを備えることを特徴とする。
請求項2記載の発明は、請求項1記載の過大音混入対応音声入力装置において、
前記音声から文字・符号・図形変換する手段を含む音声信号処理装置を備えることを特徴とする。
請求項3記載の発明は、請求項1又は請求項2記載の過大音混入対応音声入力装置において、前記再入力指示手段は、前記過大音の入力以前の前記音声集団又は音声区間又はその一部を音声又は文字で示して、再度の音声入力を促すことを特徴とする。
請求項4記載の発明は、請求項1から請求項3のいずれか1つに記載の過大音混入対応音声入力装置において、前記再入力音声(音声データ)置換手段は、前記再入力された音声データと前記過大音入力以前の音声データを比較して、前記置き換えるべき前記音声データの前記音声集団又は音声区間を特定することを可能とした置換データ照合手段を備えることを特徴とする。
請求項5記載の発明は、請求項1から請求項4のいずれか1つに記載の過大音混入対応音声入力装置において、
前記発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力するところの微小発話音、極微小発話音をモニターする場合に、聞くことができる程度に前記過大音の区間の音圧を抑制してモニター出力させる過大音抑圧手段を有することを特徴とする。
請求項6記載の発明は、請求項1から請求項5のいずれか1つに記載の過大音混入対応音声入力装置において、
前記発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力するところの微小発話音、極微小発話音を対象にした音声入力から通常発話音を対象にした音声入力に切り替える発話音切替手段を備えることを特徴とする。
請求項7記載の発明は、請求項6記載の過大音混入対応音声入力装置において、
前記微小発話音、前記極微小発話音を対象にした音声入力時に前記通常発話音が入った場合には、前記通常発話音の区間は前記発話音切替手段を自動で切り替えて、前記通常発話音を聞くことが可能な音圧にすることを特徴とする。
以上のように構成されているので本発明の過大音混入対応音声入力装置では、
発話音の音圧が呼吸音と同程度または、それより小さい領域において音声入力を行う場合に、所定の閾値より音圧の大きな過大音が入力した場合に、これを判別し再入力の指示を行い、再入力音声を過大音の入力以前の箇所の音声以降に置き換えるので、偶々、過大音が入っても、確実な音声入力が実現できる。
本発明の過大音混入対応音声入力装置の一実施態様を示す図である。 音声入力の発話音と呼吸音の音圧レベルを示す図である。 本発明の過大音混入対応音声入力装置の動作の一実施態様を示す図である。 本発明の過大音混入対応音声入力装置の再入力指示手段の一実施態様を示す図である。
音声入力処理装置として、必須なことは、発話音の音圧を下げる試みが必要となることである。発話音の音圧を下げると、今まで気にならなかった呼吸音と同程度、又はそれ以下の音圧に近づく。
呼吸音は、呼吸している本人が気にして聞こうとしないと感じない程度なので、少し離れた(隣の)他人には聞こえない。このような状態の音圧レベルならば、他人からの干渉を受けず又は他人に干渉(うるさがられる)を与えずに音声入力を行える。
装置の中では発話音のみ(呼吸音は医療機器の場合のみあり)を処理或いは、増幅して処理しなければならない。そのためには、呼吸音と発話音の判別が必要となる。呼吸音と発話音の判別の方法は、多くの手段があるが、一例では、音圧の閾値で判別する、或いは、特許文献1等で知られている非発話音と発話音を区別するためにフラクタル次元数(数学的理論に基づた計算処理を行う)を計算する手法などを用いることができる。
このような、微小な(呼吸音音圧程度)或いは極微小な(呼吸音音圧以下)の音圧の音声入力によって、従来、複数話者の間では相互干渉雑音となるため使用できなかった装置の機能が複数話者の環境でもできるということが新たに実現可能となった。因みに、特許文献1には、非発話音と発話音を区別するためにフラクタル次元数(数学的理論に基づいた計算処理を行う)を計算する手法が示されている。特許文献1は、非発話を特定して、その結果、非発話音中の溜息を判別し、これを検出して運転士の集中力の低下を検出するものである。そして、本願では、呼吸音より大きな所定の音圧閾値より大きな過大音の入力時に対応した音声入力装置を過大音混入対応音声入力装置として提供する。以下その内容を説明する。
図2は音声入力の発話音と呼吸音の音圧レベルを示す図である。
マイクロフォン(特に都合がよいのは、単一指向性のマイクロフォン)を話者の口先又は特別の場合は、口腔内、又は口の周りに閉じた閉区間に設置して発話する。2−Bに示すように、通常会話の発話音圧は60dB程度で行われている。これに対して、人間が呼吸をしているときの呼吸音圧は、10〜20dBと言われている。通常会話の発話音圧では、呼吸音圧が極めて小さいので気にならず、又、音圧での区別が容易である。
通常会話の音圧から、どんどん音圧を下げてゆく(小さい声にしてゆく)と、微小発話音として示したように発話音圧が呼吸音とほぼ同じかやや大きい程度になり、他人の耳には聞こえない。そして音圧のみでの両者の区別は難しくなる。ここでの区別は、カオス解析などの数学的アプローチの手段が従来行われるが、計算処理が複雑で重たい処理である。
処理を簡単にする手段として、発話音と呼吸音の空気の流れの揺らぎを含む特性の違いに基づいて区別することが提案できる。
この微小発話音より更に音圧を下げていった場合、極微小発話音と記述したように呼吸音圧より小さいので、ここでも当然、隣にいる他人の耳には聞こえない。且つ、呼吸音よりは小さいが、マイクロフォンには発話音が取得できる。しかし、所望の発話音より呼吸音が大きいので、自分の入力した内容をモニタする場合、呼吸音が聞くに堪えない大きさである。医学分野を除けば、データ処理としても呼吸音は必要とする場合は少ない。これらの音圧領域は通常は常識外の範囲なので使用されることが無かったが、多人数で行っても他者の迷惑にならない静かな音声入力にこだわると、他者に聞こえないという利点を享受できる。しかしながら弱点もある。
たまたま、他人の大きな発話などが入った場合は、これが邪魔になる。
本願は、微小発話音、極微小発話音を対象にして音声入力を行うことで、複数話者のいる環境で相互の雑音或いは、単独でも意図しない他の過大音の入力を回避することで、通常は使用がされなかった他者の邪魔にならない小さい音圧での音声入力を可能とすることができる。2−Aには上に述べたことが表にして示している。
図1は、本発明の過大音混入対応音声入力装置の一実施態様を示す図である。
1−Aにおいて、過大音混入対応音声入力装置100は、音を入力するマイクロフォン111を含む音声入力装置110と、入力音判別装置120と、再入力処理装置130と、音声信号処理装置140と、音声データメモリ150と、これらを制御する制御手段160とを備え、発話音の音圧が呼吸音と同程度または、それより小さい音圧領域の音声をマイクロフォン111に入力する場合に、入力音判別装置120は、マイクロフォン111に入力された音声データの中で、呼吸音より大きな所定の音圧閾値より大きく、意図せず入力した過大音を判別する過大音判別手段121を備え、再入力処理装置130は、過大音が入力した判別に基づき、過大音の入力以前の箇所より再度の音声入力を促す再入力指示手段131と、再入力した音声(又は音声データ)を過大音の入力以前の箇所より置き換える再入力音声(音声データ)置換手段132とを備えるものである。
更に詳述すると、
音声は、マイクロフォン111から入力した後、アナログ信号として処理する場合もあるが、多くは、ディジタル信号として処理するために、AD変換器112を介してディジタルデータとし、音声データメモリ150に格納することができる。
過大音判別手段121は、入力した音声の音圧が、呼吸音より大きな所定の音圧閾値より大きいかどうかを常時比較判断し、大きい場合は、過大音が入力したとして再入力指示手段131を動作させる。比較判断のためには、アナログ入力でもいいが、音声データメモリ150に格納されたディジタルデータが用いることができる。再入力指示手段131及び、再入力音声(データ)置換手段132の動作は、図3及び図4で詳細に記述する。
尚、入力音判別装置120は、過大音判別手段121以外に、呼吸音と発話音を区別する
呼吸音/発話音判別手段122を備えることができる。呼吸音/発話音判別手段122は、入力した音声が、呼吸音であるか発話音であるかを判別して、各々に対して処理を分けるためのものである。勿論、呼吸音と発話音の間には無音区間があることは当然である。
呼吸音・発話音判別手段122において、入力されたアナログの音データを直接に判別してもよいが、一旦、AD変換器112にてAD変換し、これをディジタル処理で判断するか、更に、一旦、音声データメモリ150に格納した後、読みだして判別してもよい。
アナログ処理では、AD変換器112と音声データメモリ150は、処理の前には必要ではないことは当然である。その代り、アナログ処理後にAD変換することが必要になる。一般的には、判別は、最初にAD変換器112と音声データメモリ150を介してからディジタル処理で判別する方が処理が容易である。
音圧の強度から閾値で判別する場合は、アナログ処理でも可能だが、これも含め、他の判別ではディジタル処理の方が容易である。
尚、図1内には、二つの切替スイッチA、Bを表示したが、両者は、アナログの音声をAD変換器を通じてディジタルデータにして次の処理をするか、アナログデータのままで処理するかを切り替えるもので、システムの構成により任意である。
音種(呼吸音か発話音か)の判別においては、
音圧を閾値で判別することが可能な場合は、閾値1より大きいかを判断する。閾値1は、呼吸音と極微小音の間の音圧値に設定される。例えば、図2の2−Bを参照すると、10dB周辺が適当である。この値は、音声入力の測定値を実際に測定し、呼吸音と発話音の間の適度な値に設定してもよい。音圧が閾値1より小さい場合は、極微小発話音と判断する。音圧が閾値1より大きい場合は、2)音圧が閾値2より大きいかを判断する。閾値2は、呼吸音と通常発話音の間の音圧値に設定される。例えば30dB等が適当である。
音圧が閾値2より小さい場合は、呼吸音と微小発話音は、閾値のみでは判断は難しい。
この場合は、フラクタル分析、フーリエ周波数スペクトル分析や、後述の<音声の特性>を参照にして判断が可能となる。
音圧が閾値2より大きい場合は、通常発話音が混入したと判断され、「適正レベルで再度入力してください」という指示を出す。時間の進行に沿って、音声入力に対してこの判断処理を繰り返し行う。
以上のようにして過大音が混入した音声入力が有っても、再入力処理装置130で再入力音声が置き換わり、音声データメモリ150に置き換わったデータや、発話音のみのデータなど必要な形態で格納される。そして、音声信号処理装置140は、携帯電話手段や音声⇒文字・符号・図形変換手段など各種の音声処理を行うものである。音声信号処理装置140は、過大音混入対応音声入力装置100の本質的構成に含めずに別にしてもよいことは勿論である。
勿論、これらへの入力は、音声信号を電気信号の形で受け渡しているのであって、音声で受け渡しているわけではないことは当然である。
1−Bには、上記の過大音混入対応音声入力装置100の動作フローを示す。音声入力→過大音、呼吸音/発話音判別→過大音ありなら再入力処理→音声信号処理の順で音声入力に対して行われる。
尚、1つの吸気、呼気、発話の集団を特定するには、取得したデータを1〜2秒程度又はそれより小さい読み取り時間間隔で読み取り、集団付けることを行う。時間間隔ごとに読まれたデータは、呼吸音か発話音かという音種の変化を検出して集団分けし、音種集団毎に同一処理に委ねることが可能である。呼吸音も吸気、呼気は、その間は無音区間で隔てられ、それぞれ一つの集団と扱ってよい。又、発話音は、呼気の区間に発せられ、複数の語が連続しているか、又は、1語1語の間が無音区間で隔てられているかのいずれかである。連続している場合は、その区間は、同じ集団として同じ処理が可能である。又、1つの集団内で連続しない場合は、異なる集団に分けることも可能である。
このような集団分けをしておくと、過大音があった場合にその前の音区間を直前の個々の小集団で与えることができて、再入力処理にとって好都合である。
尚、集団分けや処理の判断には、以下の音声の特性を考慮して行うことも可能である。
<音声の特性>
・ 発話は呼気(空気の流れは外向き)の始めからが多い。呼気の途中から始まるのは意図的な場合以外は極めて少ない。
呼気の最初のパターンが現われたら、そこから呼気と次の吸気の区間までは、呼吸音と判断できる。呼気の最初のパターンが現われずに発話になった場合は、発話区間になる。
・ 吸気(空気の流れは内向き)では発話しない。(吸気で発話する言語は世界中で1つ)
・ 呼吸音は、空気の流れが1方向であり、発話に比べ揺らぎがなく、また、時間的長さや繰り返し周期もほぼ一定している。発話は、時間的長さは発話文の長さに依存する。
・ 呼吸音の音圧は、同一個人ではいつも同じような呼吸をしていることで、発話音に比べてばらつきが少ない。
・ 鼻からの呼気では発話しない。
・ 発話音は500Hz以上の成分が多い。呼吸音は500Hz以下の成分が多い。
尚、マイクロフォン111は、発話音圧が呼吸音とほぼ同じ程度の微小音声、又は
呼吸音より小さい極微小音声を取得する場合は、口先又は特別の場合は口腔内又は、口の周りに閉じた閉区間に設置され、周囲からの音を拾わないように単一指向性のマイクロフォンが好都合である。口腔内又は、口の周りに閉じた閉区間では単一指向性のマイクロフォンでなくとも使用できる。
図3は、本発明の過大音混入対応音声入力装置の動作の一実施態様を示す図である。
音声入力に対してアナログにせよディジタルにせよ、呼吸音/発話音(両者間に無音区間)、過大音の判別を行うことを前述した。3−Aには、横軸に時間を、縦軸に音圧をとり、呼吸音(吸気音、呼気音」、発話音、過大音の入力状態を概念的に示す。一つの種別の音域の始端データと終端データが検出されるので、始端データと終端データの間のデータ集団が、一つの種別の音域(例えば、呼吸音か発話音かという音種集団)となる。
3−Bには、再入力処理手段130の再入力指示手段131と再入力の結果、再入力音声(データ)置換手段132の動作を示す。過大音混入区間では、過大音が過大音判別手段121により判別されると、再入力指示手段131により、再入力指示が出される。指示に対して再入力をすると、再入力音声(データ)置換手段132により、過大音が混入以前の音区間から音声データが置き換わる。
3−Cには、置き換わった音声データを示す。3−Dには、発話音のみのデータを示す。データメモリ150にどちらの形態で格納しているかは任意である。両者とも過大音が無かった場合と同じ音声データとなる。
図4は、本発明の過大音混入対応音声入力装置の再入力指示手段の一実施態様を示す図である。
図の例では、「イチゴは赤い リンゴもあ」と入力したあと、過大音が混有している。過大音の検出を受けて、再入力指示手段131は、過大音混入直前の「リンゴもあ」を参照して、再入力を音声又は文字表示で指示している。発話者は、これを受けて、「リンゴも赤い・・・」と発話入力すると「リンゴもあ」の区間に「リンゴも赤い・・・」が置き換わる。尚、直前の区間を1つ前とするか2つ前など複数にするかは任意である。また、直前より前の区間を示して行うことも任意である。

尚、再入力音声(データ)置換手段132には、再入力された音声のデータと過大音混入以前の音声データを比較して、置き換えるべき音声データの集団又は区間を特定する置換データ照合手段を備えることもできる。これにより、過大音混入以前の直前の音声データを開示することは、再入力指示にとって必ずしも必要としなくなる。
尚、音声データとしては、音声として入力した音声以外に、音声を文字変換手段を介して文字データとしたものも格納される。これにより、再入力指示手段での文字表示や、音声信号処理装置140の音声⇒文字・符号・図形変換手段の処理に対応可能である。

また、指示の形態として、過大音の区間を報知するか、マイクロフォンで入力した音声をモニタ可能にして、入力者が過大音とその区間を知ることを可能にして、結果、再入力させ、置き換えを実現することも可能である。そして、発話音の音圧が呼吸音と同程度または、呼吸音より小さい音圧領域の音声をマイクロフォンに入力するところの微小発話音、極微小発話音を対象にして音声入力を行っている場合は、過大音の区間でのモニターする音は、聞く耳にとっては極めて大きな、聞くに堪えないものであるため、これを聞くことができる程度に音圧を抑制して、モニター出力させる過大音抑圧手段を有することが好都合である。これにより、過大音区間は、意味の不明な音になる場合もあるが、やや大きな音で、微小発話音、極微小発話音の区間と区別してモニター可能となり、過大音区間を認識して再入力が可能となる。

尚、過大音混入対応音声入力装置は、使用者が音声入力し、それを文字変換する等のデータ化する応用以外に、通信機能により他者との間で、関係者以外に聞かれない状態で会話することもできる。
また、周りに他者がいない場合等では、微小発話音、極微小発話音を対象にした音声入力から通常発話音を対象にした音声入力に切り替える発話音切替手段を備えると好都合である。そして、場合によっては、微小発話音、極微小発話音を対象にした音声入力時に通常発話音が入った場合には、通常発話音の間は発話音切替手段を自動で切り替えて、聞くことが可能な音圧にすることも可能である。
以上のように構成されているため、本発明の過大音混入対応音声入力装置においては、偶々過大音が混入しても、再度音声入力とデータ置換が確実に行えるので、産業上利用性が極めて大きい。
100 過大音混入対応音声入力装置
110 音声入力装置
111 マイクロフォン
112 AD変換器
120 入力音判別装置
121 過大音判別手段
122 呼吸音/発話音判別手段
130 再入力処理装置
131 再入力指示手段
132 再入力音声(データ)置換手段
140 音声信号処理装置
150 音声データメモリ
160 制御手段

Claims (7)

  1. 音を入力するマイクロフォンを含む音声入力装置と、入力音判別装置と、再入力処理装置と、音声データメモリと、これらを制御する制御手段とを備え、発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力する場合に、前記入力音判別装置は、前記マイクロフォンに入力された音声データの中で、前記呼吸音より大きな所定の音圧閾値より大きく、意図せず入力した過大音を判別する過大音判別手段を備え、前記再入力処理装置は、前記過大音が入力したという前記過大音判別手段による判別に基づき、再度の音声入力を促す再入力指示手段と、前記指示に対応して再入力した音声(又は音声データ)を前記過大音の入力以前の音声集団又は音声区間より置き換える再入力音声(音声データ)置換手段とを備えることを特徴とする過大音混入対応音声入力装置。
  2. 前記音声から文字・符号・図形変換する手段を含む音声信号処理装置を備えることを特徴とする請求項1記載の過大音混入対応音声入力装置。
  3. 前記再入力指示手段は、前記過大音の入力以前の前記音声集団又は音声区間又はその一部を音声又は文字で示して、再度の音声入力を促すことを特徴とする請求項1又は請求項2記載の過大音混入対応音声入力装置。
  4. 前記再入力音声(音声データ)置換手段は、前記再入力された音声データと前記過大音入力以前の音声データを比較して、前記置き換えるべき前記音声データの前記音声集団又は音声区間を特定することを可能とした置換データ照合手段を備えることを特徴とする請求項1から請求項3のいずれか1つに記載の過大音混入対応音声入力装置。
  5. 前記発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力するところの微小発話音、極微小発話音をモニターする場合に、聞くことができる程度に前記過大音の区間の音圧を抑制してモニター出力させる過大音抑圧手段を有することを特徴とする請求項1から請求項4のいずれか1つに記載の過大音混入対応音声入力装置。
  6. 前記発話音の音圧が呼吸音と同程度または、前記呼吸音より小さい音圧領域の音声を前記マイクロフォンに入力するところの微小発話音、極微小発話音を対象にした音声入力から通常発話音を対象にした音声入力に切り替える発話音切替手段を備えることを特徴とする請求項1から請求項5のいずれか1つに記載の過大音混入対応音声入力装置。
  7. 前記微小発話音、前記極微小発話音を対象にした音声入力時に前記通常発話音が入った場合には、前記通常発話音の区間は前記発話音切替手段を自動で切り替えて、前記通常発話音を聞くことが可能な音圧にすることを特徴とする請求項6記載の過大音混入対応音声入力装置。

JP2017142382A 2017-07-24 2017-07-24 過大音混入対応音声入力装置 Pending JP2019023674A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017142382A JP2019023674A (ja) 2017-07-24 2017-07-24 過大音混入対応音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017142382A JP2019023674A (ja) 2017-07-24 2017-07-24 過大音混入対応音声入力装置

Publications (1)

Publication Number Publication Date
JP2019023674A true JP2019023674A (ja) 2019-02-14

Family

ID=65368482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017142382A Pending JP2019023674A (ja) 2017-07-24 2017-07-24 過大音混入対応音声入力装置

Country Status (1)

Country Link
JP (1) JP2019023674A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0870338A (ja) * 1994-08-30 1996-03-12 Nec Eng Ltd キー操作式電話機
JP2008180801A (ja) * 2007-01-23 2008-08-07 Kyushu Institute Of Technology 自動回答装置および方法
JP2014063018A (ja) * 2012-09-21 2014-04-10 Systec:Kk 極微小音声入力装置
JP2015099253A (ja) * 2013-11-19 2015-05-28 東芝テック株式会社 音声認識装置、音声認識方法、音声認識プログラム
JP2015228002A (ja) * 2014-06-03 2015-12-17 株式会社システック 複数者間干渉音声雑音を回避した音声入力処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0870338A (ja) * 1994-08-30 1996-03-12 Nec Eng Ltd キー操作式電話機
JP2008180801A (ja) * 2007-01-23 2008-08-07 Kyushu Institute Of Technology 自動回答装置および方法
JP2014063018A (ja) * 2012-09-21 2014-04-10 Systec:Kk 極微小音声入力装置
JP2015099253A (ja) * 2013-11-19 2015-05-28 東芝テック株式会社 音声認識装置、音声認識方法、音声認識プログラム
JP2015228002A (ja) * 2014-06-03 2015-12-17 株式会社システック 複数者間干渉音声雑音を回避した音声入力処理装置

Similar Documents

Publication Publication Date Title
KR101735665B1 (ko) 음성-대-텍스트 변환의 햅틱 증대를 위한 시스템들 및 방법들
JP4713111B2 (ja) 発話区間検出装置、音声認識処理装置、送信システム、信号レベル制御装置、発話区間検出方法
US20060210028A1 (en) System and method for personalized text-to-voice synthesis
US9560316B1 (en) Indicating sound quality during a conference
JP2008242318A (ja) 対話を検出する装置、方法およびプログラム
JP4940414B2 (ja) 音声処理方法、音声処理プログラム、音声処理装置
CN110072021A (zh) 电话会议中的在感知上连续的混合
CN108986839A (zh) 减少音频信号中的噪声
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
US20240221718A1 (en) Systems and methods for providing low latency user feedback associated with a user speaking silently
CN110545504A (zh) 个人听力装置、外部声音处理装置及相关计算机程序产品
JP6061069B2 (ja) 極微小音声入力装置
JP6296291B2 (ja) 会話音声レベル通知システム及び会話音声レベル通知方法
KR102350890B1 (ko) 휴대용 청력검사장치
US11388514B2 (en) Method for operating a hearing device, and hearing device
JP2015228002A (ja) 複数者間干渉音声雑音を回避した音声入力処理装置
JP2019023674A (ja) 過大音混入対応音声入力装置
US20100094619A1 (en) Audio frequency remapping
JP7331976B2 (ja) 情報処理装置、プログラム、及び情報処理システム
JP2006171226A (ja) 音声処理装置
JP3829485B2 (ja) 音声通話装置、音声通話システム、および音声通話方法
Dekens et al. A Multi-sensor Speech Database with Applications towards Robust Speech Processing in hostile Environments.
JP7410109B2 (ja) 電気通信装置、電気通信システム、電気通信装置を動作させる方法、およびコンピュータプログラム
JP2020161884A (ja) 音声処理装置、音声処理方法、および音声処理システム
JP2020030271A (ja) 会話音声レベル通知システム及び会話音声レベル通知方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170725

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20211109