明 細 書
音声入力装置
技術分野
[0001] 本発明は、声帯振動による発声を伴わずに音声を入力できる音声入力装置に関す るものである。
背景技術
[0002] 従来、携帯電話等の通信手段においては、発声した音声を、マイクを介して取得し 、通話対象に送出すると共に、通話対象より得られる音声をスピーカより出力すること により、音声による各種の情報を送受信して、通話対象との間で会話が行えるように なされている。しかし、電話等による通信の際に、周囲の人に音声が聞こえることによ つて迷惑を及ぼすとともに、発信者においても通信の秘密が確保されない問題があ る。また、コンピュータ等へテキストデータ入力や操作コマンド入力を音声で行う場合 、空中に漏れる音声が周囲に対して騒音となったり、入力内容の秘密性が保てなか つたりする問題があった。さらに、通常音声による音声入力では声質の個人差により 、コンピュータに誤入力することがあり、そのためにェンロール作業(個人の音声の登 録作業)を必要としている。
[0003] 第一の従来技術として、携帯電話使用者がゴム又は合成樹脂等の柔軟弾性を有 する外被体内に発声することによって、極力音声を外部に漏れないようにした携帯電 話用消音器がある (特許文献 1参照)。
[0004] 第二の従来技術として、使用頻度の高い会話内容を示すメッセージがカテゴリ別に 分類して予め登録されており、適当なメッセージを選択してメッセージの音声データ を記録部から再生して、該再生された音声データを、通信部を介して通信相手先に 送出する携帯電話装置がある (特許文献 2参照)。
特許文献 1 :特許公開 2000 - 244622号公報 (第 1頁、図 1等)
特許文献 2 :特許公開 2001— 211250号公報 (第 1頁、図 1等)
発明の開示
発明が解決しょうとする課題
[0005] 携帯電話等の通信手段において話者は必ず発声を必要とされる。このため、外部 に漏れる音声により電車内等の公共の場では他人に迷惑をかけずに通信する事が 困難である。さらに、外部に漏れた音声により通信内容、入力内容が他人に漏れると レ、うおそれがあった。このような問題を解決するために、上記の第一、および第二の 従来技術が提案された。
[0006] し力、しながら、第一の従来技術では、音声が外部に漏れることを完全には防げず、 声帯の振動による音声の大きさをほどよく制御することは困難である。したがって、第 一の従来技術を利用した場合には、電車内等、騒音の激しい場所ではついつぃ大 きな声を出してしまい周囲に迷惑をかける可能性がある。また静かな環境で用いて他 人に話しの内容がわからないように音声の強さを制御することも困難である。
[0007] 第二の従来技術は、会話内容を登録しておく必要があるため、 自由な会話はでき ず、リアルタイムで情報を相互に送受することが困難である。
以上のように、従来技術において、音声が外部に聞こえず、話声を入力することは できなかった。
課題を解決するための手段
[0008] 以上の課題を解決するために、本発明は、声帯の代わりとなって原音を作る振動体 と、前記振動体の振動をエネルギー源として、ユーザが構音動作をすることによって 作り出される話声を集音するマイクロホンを備えることを特徴とする音声入力装置で ある。力、かる音声入力装置によれば、声帯振動を必要とせずに音声入力が可能とな る。
[0009] 具体的には、本発明における音声入力装置は、声帯振動の代わりとなる振動体に よって発生させた振動を口腔内に伝え、舌や口、 口唇の位置や形を変えることによつ て構音を行なレ、、発生した音を集音するマイクロホンを備えてレ、る。
[0010] 本音声入力装置において、電気振動を強くすれば外部に音声が漏れるが、外部に 音声が漏れないレベルまたは周囲の人がほとんど音声を認識できない程度に振動 体の出力を調整し、構音された話声をマイクロホンで集音する。そして、集音された 話声は電気信号に変換され、通常、通信媒体またはコンピュータ等の入力先に送ら れる。原音の使用周波数は入力先等に応じて最適のものを使用する。このとき使用
周波数は複数であってもよい。また使用周波数は状況によって変更できるように可変 としても良い。ここで、振動体として、電気式人工喉頭等で用いられる電気振動体 (圧 電式発音体又は電子式発音体など)が使用可能であるが、その他の機構による振動 体でもよい。
また、マイクロホンとして、皮膚に接触して使用する接触型マイクロホン (骨伝導マイク 口ホンとも呼ばれる)が好適である力 口唇の近傍に指向性マイクを用いるなど、その 他の種類のマイクロホンでもよレ、。
[0011] 声帯の代わりとなる振動体によって原音を発するため、発生される音声の声質の個 人差が小さくなる。そのためコンピュータ等への音声入力にあたって声質の個人差が 原因で誤った音声認識がなされるのを防ぐことができ、ェンロール作業 (個人音声の 登録作業)を省略または簡略化できる。
[0012] また、振動体が作り出す原音の音圧を制御する機構、または/および振動体の周 波数を制御する機構をさらに有する音声入力装置により、ユーザ特性や入力先の特 性に対応できる音声入力装置を提供できる。力かる振動体が作り出す原音の音圧を 制御する機構は、暗騒音上 20dB以下の音圧に制御することが好適である。つまり、 上記振動体が作り出す原音の音圧を制御する機構は、周囲に居る健常者に聞こえ ない程度の音圧に制御することが好適である。
また、マイクロホンは、接触型マイクロホンであることにより、外部に音を漏らす可能 性が極めて低い、性能の良い音声入力装置を提供できる。
また、上述の音声入力装置を具備する電話機により、上記の課題を解決する電話 機を提供し得る。ここで、電話機は、携帯電話、固定電話、 PHSなどを含む。
また、上記の振動体を、たとえば、市販の携帯電話等に取り付ける構成により、音 声入力装置を構成しても良い。
さらに、上述の音声入力装置を具備する情報処理装置により、上記の課題を解決 する情報処理装置を提供し得る。ここで、情報処理装置は、パーソナルコンピュータ 、ワークステーション、大型計算機、 PDA,ワープロなどを含む。
発明の効果
[0013] 本発明の音声入力装置によれば、いわゆる発声をせずに音声入力ができる。
発明を実施するための最良の形態
[0014] 以下、本発明の音声入力装置の実施形態について図面を参照して説明する。なお
、以下の各実施の形態の説明において、同じ構成要素には同じ番号を付与し、再度 の説明を省く場合がある。
なお、以下、主として携帯電話とパソコン用音声入力装置を例にとり説明する。ただ し、下記の技術は、携帯電話、パソコン用音声入力装置だけでなぐ固定電話、無線
、トランシーバ等の通信装置やワープロ、ワークステーション、大型計算機、 PDAなど の情報処理装置等への音声入力、音声による制御に利用可能である。また、携帯電 話には PHSを含む事は言うまでもない。
[0015] 図 1は本発明の実施の形態に係る音声入力装置 10を含み、かつ、携帯電話等各 種機器での音声の流れを示す一例のブロック図である。音声入力装置 10は、振動 体 12と接触型マイク 17を有する。なお、皮膚 13、 口腔 14、皮膚 16は、ユーザの体 の一部である。なお、図 1では接触型マイクを使用した場合の例をあげた力 マイクの 種類はこれ以外のものでもよい。
まず、携帯電話等各種機器 11に取り付けた振動体 12で振動を発生させる。なお、 声帯の代用となる振動体は人工喉頭として実用化されているので、ここでの詳細な説 明は省略する。
[0016] 次に、振動体 12で発生させた振動が頸部または顔面等の皮膚 13を通り口腔内 14 に達する。 口腔内 14に伝わった振動が話者の舌や口の形等によって任意の音声に 構音 15される。構音 15された音は再び皮膚 16を通過し携帯電話等各種機器 11に 取り付けた接触型マイク 17によって集音される。集音された音は電気信号に変換さ れ通信等に供される。携帯電話等各種機器 11は、音を電気信号に変換する機構を 有する。力かる機構も公知技術であるので、詳細な説明は省略する。なお、本例では 、振動体もマイクも体外にあり皮膚に接触して使用する場合を示したが、振動体やマ イクの位置は本例に拘束されるものではない。振動体が体外、口腔内、外耳道内等 に設置可能であり、マイクも体外、 口腔内、外耳道内等に設置が可能である。
[0017] 図 2は、携帯電話に取り付けた時の一例の正面概略図である。携帯電話 21の本体 下部 25に振動体 22、接触型マイク 23を設置する。通常、振動体と接触型マイクはュ
一ザの皮膚に接触させて使用するが、振動体と接触型マイクの取り付け位置は本実 施例に拘束されるものではない。例えば、本体内にあってもよい。また、振動体や接 触型マイクと本体をつなぐ支持部は皮膚にほどよく接触できるように柔軟性のある材 質で作成されていても良いし、携帯電話のアンテナのごとく伸縮できるものであっても よい。つまり、支持部の材質等は問わない。また、マイクも接触型以外のものも使用可 能である。
[0018] 図 3は、図 2の本体下半分を側面から見た図である。本図では本発明に力かる音声 入力装置の使用時に振動体 22、接触型マイク 23をより類部に密着させるために先 端を湾曲させているが、マイクの形状やマイクの種類は本実施例に拘束されるもので はない。マイクの形状は、例えば、口を覆い隠すような形状でも良い。
[0019] 図 4は、パソコン用音声入力装置に取り付けた時の一例である。ヘッドセット部分 41 から伸びたアームが先端で二つに分割される。それぞれの先端に振動体 22、接触 型マイク 23が備わっている。振動体 22と接触型マイク 23を支えるアーム 24は振動体 22と接触型マイク 23が適切な位置に移動できるように伸縮自在となっている。ただし 、マイクの形状や構造ならびにマイクの種類は本実施例に拘束されるものではない。
[0020] 以上、本実施の形態における音声入力装置は、原音を作る振動体と、構音動作を することによって作り出される話声を集音するマイクロホンを備えることを特徴とする音 声入力装置であり、かかる音声入力装置により、いわゆる発声を伴わずに音声を入 力できる。
また、本音声入力装置を携帯電話等の通信機器やコンピュータに利用すれば、発 声を必用としないため、公共の場でも他人に迷惑をかけることなぐかつ、他人に通 信内容等を知られることなぐ通信機器やコンピュータに音声入力ができる。また、本 音声入力装置を携帯電話等の通信機器やコンピュータに利用すれば、騒音の中で も快適に通信機器、コンピュータ等への音声入力ができる。さらに、通信機器等の使 用時は従来と同様の姿勢で、上述の効果を得られる。
[0021] また、本音声入力装置において、人工喉頭等で用いられる電気振動体を使用して いるため、喉頭切除等で発声に障害を持つ人にも快適な通信機器、コンピュータ等 への音声入力が行える。
また、本音声入力装置をコンピュータ等への音声入力に用いた場合、複数の人が 同時使用しても、隣の声が騒音となることがない。
また、本音声入力装置を、音声認識機能を有するコンピュータ等への音声入力手 段として用いた場合、原音はピッチ変化のない電気的な音声で、音声の声質に個人 差が少なぐ音声認識過程での要素が減少することによって、音声の誤認識が低減 される。さらに、本音声入力装置をコンピュータ等への音声入力手段として用いた場 合、音声認識のためェンロール作業を簡略化することができる。
また、本音声入力装置を、音声の入力を受け付け、記録する ICレコーダや、録音 装置などに用いても良い。かかる場合、周りの人に迷惑をかけずに、音声の記録が できる。
[0022] なお、本実施の形態における音声入力装置は、振動体が作り出す原音の音圧を制 御する機構、または Zおよび振動体の周波数を制御する機構をさらに有することが 好適である。振動体が作り出す原音の音圧を制御する機構を有すれば、ユーザの皮 膚の厚さなどのユーザ特性に対応でき、どのようなユーザが音声入力装置を使用し ても、外部に音声が聞こえずに、かつ、容易に音声入力が可能になり得る。また、振 動体の周波数を制御する機構を有すれば、同様に、種々のユーザ特性や入力先の 特性に対応できる音声入力装置を提供できる。なお、振動体が作り出す原音の音圧 を制御する機構、振動体の周波数を制御する機構は公知技術であるので、詳細な説 明を省略する。また、外部に音声が聞こえないために、振動体が作り出す原音の音 圧を制御する機構は、振動体が作り出す原音の音圧を喑騒音上 20dB以下の音圧 に制御することが好適である。
さらに、上記の振動体を、たとえば、市販の携帯電話等に取り付ける構成により、音 声入力装置を構成しても良い。つまり、上記の振動体は、携帯電話等のアタッチメン トであっても良い。具体的には、振動体 22または振動体 12が、音声入力装置から分 離されていても良い。
産業上の利用可能性
[0023] 本発明は、例えば、携帯電話等無線による各種通信装置(トランシーバー、無線な ど)、電話機等有線による各種通信装置、ならびにコンピュータ、 PDA等各種機器へ
の音声入力を行う装置において有用である。
図面の簡単な説明
[図 1]本発明の実施の形態に係る音声の流れを示したブロック図
[図 2]本発明の実施の形態における携帯電話全体の正面概略図
[図 3]本発明の実施の形態における携帯電話下部の側面概略図
[図 4]本発明の実施の形態におけるコンピュータ等への音声入力装置の概略図