JP2015025902A

JP2015025902A - 通信端末、プログラム

Info

Publication number: JP2015025902A
Application number: JP2013154504A
Authority: JP
Inventors: ▲高▼橋　誠; 誠 ▲高▼橋; Makoto Takahashi; 昌克塚本; Masakatsu Tsukamoto; 怜史河村; Reiji Kawamura
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2013-07-25
Filing date: 2013-07-25
Publication date: 2015-02-05
Anticipated expiration: 2033-07-25
Also published as: JP6216560B2

Abstract

【課題】低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。
【解決手段】予め定めた生活場面を区分する複数種類のモードのうち、何れか１つのモードを選択するモード選択部と、モードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶する音響モデル記憶部と、音声信号を取得するマイクロホンと、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する解析部と、モードごとに予め定めた報知情報をキーワードに対応させて記憶する報知情報記憶部と、解析結果に前記キーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する報知情報出力部とを含む。
【選択図】図１

Description

本発明は、聞き取りが困難なユーザをサポートする通信端末、プログラムに関する。

聴覚に障害を持つ人は、日本国内に数百万人規模で存在するといわれている。電車内、施設内などで音声でアナウンスがなされた場合、聴覚障害者は音声アナウンスの内容を知ることができないばかりでなく、音声アナウンスがなされたこと自体にも気がつかないことがある。特許文献１にはこのような聴覚障害者や視覚障害者の利便性の向上を図ることを目的とした携帯電話装置が開示されている。特許文献１の携帯電話装置は、マイクに入力された言葉又は通話相手の言葉を音声認識する音声認識手段と、音声認識手段にて音声認識された言葉の意味を個別辞書データベースの検索により判別する意味判別手段と、意味判別手段にて判別された言葉の意味を表示する表示手段と、意味判別手段にて判別された言葉の意味を音声出力する音声出力手段とを含む。この構成によれば、マイクに向かって話した言葉と通話相手の言葉の意味が判別され、その結果が表示手段にて表示されるとともに、音声出力される。従って、特許文献１の携帯電話装置によれば、音声でアナウンスがなされた場合であっても、音声アナウンスをマイクにより収音できれば、音声アナウンスの内容を音声認識し、個別辞書データベース検索により意味判別し、判別された音声アナウンスの意味を表示することができるため、聴覚障害者は音声アナウンスの内容を知ることができる。

特開２００４−９４７２１号公報

上述の特許文献１のような携帯電話装置を実現する場合、アナウンスが行われる環境、アナウンスを行う話者、アナウンスの内容が全て不特定であることに十分に対応するためには、莫大なコストをかけて音響モデルを学習する必要がある。開発コストを低くするために音響モデルとしてすでに存在する汎用のモデルを流用する場合、認識率が低くなり、システムのデータ量が膨大になることが問題であった。辞書データベースについても不特定なアナウンス内容に対応可能とするためにデータ量が膨大となることが避けられなかった。このように、携帯電話装置に従来の音声認識を組み込むことで聴覚障害者をサポートする考え方は、システム構築のコストおよびシステムの容量の観点で課題があった。

そこで、本発明では低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる通信端末を提供することを目的とする。

本発明の通信端末は、モード選択部と、音響モデル記憶部と、マイクロホンと、解析部と、報知情報記憶部と、報知情報出力部とを含む。

モード選択部は、予め定めた生活場面を区分する複数種類のモードのうち、何れか１つのモードを選択する。音響モデル記憶部は、モードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶する。マイクロホンは、音声信号を取得する。解析部は、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する。報知情報記憶部は、モードごとに予め定めた報知情報をキーワードに対応させて記憶する。報知情報出力部は、解析結果に前記キーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する。

本発明の通信端末によれば、低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。

本発明の実施例１の通信端末の構成を示すブロック図。本発明の実施例１の通信端末の音声認識動作を示すフローチャート。本発明の実施例１の通信端末の音響モデル更新動作を示すフローチャート。第１モードにおけるキーワードと報知情報の対応関係を例示する図。第２モードにおけるキーワードと報知情報の対応関係を例示する図。第３モードにおけるキーワードと報知情報の対応関係を例示する図。第４モードにおけるキーワードと報知情報の対応関係を例示する図。車内アナウンスおよび当該アナウンスに含まれるキーワードの例を示す図。図８のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第１の表示例を示す図。図８のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第２の表示例を示す図。店内放送および当該放送に含まれるキーワードの例を示す図。図１１の放送の解析結果に含まれるキーワードと対応する報知情報の第１の表示例を示す図。図１１の放送の解析結果に含まれるキーワードと対応する報知情報の第２の表示例を示す図。

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

＜通信端末＞
通信端末とは、電話機、特に携帯電話機やＰＨＳ電話機、又は通信機能を備えたＰＤＡなどの総称である。

以下、図１、図２を参照して実施例１の通信端末について説明する。図１は本実施例の通信端末１の構成を示すブロック図である。図２は本実施例の通信端末１の音声認識動作を示すフローチャートである。図１に示すように、本実施例の通信端末１は、モード選択部１１と、音響モデル記憶部１２と、マイクロホン１３と、解析部１４と、報知情報記憶部１５と、報知情報出力部１６と、情報報知部１７と、モデル受信部１８と、モデル更新部１９とを含む。

音響モデル記憶部１２は、第１モード音響モデル記憶部１２−１、第２モード音響モデル記憶部１２−２、…、第Ｎモード音響モデル記憶部１２−Ｎを含む。Ｎは２以上の整数とする。情報報知部１７は、例えば図１に示すように表示画面１７−１と、バイブレータ１７−２と、ＬＥＤ素子１７−３を含む。モデル受信部１８は音響モデルを管理する音響モデルサーバ８とＮＷ９を介して通信可能に接続されている。音響モデル記憶部１２には、モードごとに予め定めた音声パターンを解析可能な音響モデルがモードごとに記憶されている。より詳細には、第１モード音響モデル記憶部１２−１には、第１のモードに対して予め定めた音声パターンを解析可能な音響モデルである第１モード音響モデルが記憶されている。同様に、１≦ｎ≦Ｎを充たす任意の整数ｎについて、第ｎモード音響モデル記憶部１２−ｎには、第ｎのモードに対して予め定めた音声パターンを解析可能な音響モデルである第ｎモード音響モデルが記憶されている。報知情報記憶部１５には、モードごとに予め定めた報知情報がキーワードに対応させて記憶されている。

モード選択部１１は、予め定めた生活場面を区分する複数種類のモードのうち、何れか１つのモードを選択する（Ｓ１１）。ここでモードとは、生活場面として数種類〜数十種類程度に区分できる各場面のことである。特に音声アナウンスが発生しやすい生活場面をモードとして定義しておくのが好適である。音声アナウンスが発生しやすい生活場面として、例えば電車内、自動車運転中、病院や薬局などの待合室、ショッピングモールや公園などの施設内が挙げられる。本実施例では第１モードを電車、第２モードを自動車運転中、第３モードを待合室、第４モードを施設内として具体的に説明する。モード選択部１１は、複数種類のモードのうち、好ましくはユーザ操作により指定された１つのモードを選択する。例えば、本発明の通信端末１が音声認識に用いるユーザインターフェースを含むものとし、ユーザは、当該ユーザインターフェースに表示されるモード選択画面において、ユーザ操作を介して１つのモードを指定するものとし、モード選択部１１はユーザ操作により指定された１つのモードを選択するようにすれば好適である。この場合、ユーザは電車乗降時、施設への入出時など、予め定義したモードへの入出時に限りユーザインタフェースを介してモードを設定し直せばよい。

前述したように第ｎモード音響モデル記憶部１２−ｎには、第ｎのモードに対して予め定めた音声パターンを解析可能な音響モデルである第ｎモード音響モデルが記憶されている。第ｎモード音響モデルを第ｎのモードに対して予め定めた音声パターンのみを解析可能に学習しておけば、音響モデルの学習コストが削減され、音響モデルのデータ量も削減されるため好適である。

例えば、第１モード／電車の場合、第１モード音響モデル記憶部１２−１には、第１のモードである電車内や駅構内におけるアナウンス中に含まれる数種類、または十数種類程度の音声パターンのみを解析可能な音響モデルである第１モード音響モデルが記憶される。電車内や駅構内におけるアナウンス中には、例えば「白線の内側に下がってお待ちください」など定型的で重要性の低いアナウンスも存在するし、一方「上下線とも運転見合わせ」、「信号機故障」、「人身事故」、「運転再開の目途」など、電車が平常に運行されていない場合の現状説明、事故原因、運転再開の見通しなどについて重要な情報を提供するアナウンスも存在する。従って、第１モード／電車に対して予め定めておく音声パターンとしては、例えば「キンキュウテイシ」「タチイリ」「シンゴウ」「ボタン」「ヒジョウテイシ」「コショウ」が発話されたときの音声パターンなど重要な情報を提供している可能性が高い音声パターンとするのが好適である。

マイクロホン１３は、音声信号を取得する（Ｓ１３）。マイクロホン１３は、本発明の音声認識のための専用のものを追加実装することとしてもよいし、通信端末１にもともと組み込まれているマイクロホンを流用してもよい。

解析部１４は、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する（Ｓ１４）。前述したように各モードの音響モデルは、対応するモードに対して予め定めた音声パターンのみを解析可能に学習しておくことが望ましい。予め定めた音声パターンの数が少なければ、マイクロホン１３から取得した音声信号の大部分には、予め定めた音声パターンが含まれていないことになる。従って、解析部１４は、音響モデルを用いても、音声信号の全体を解析することはできない。解析部１４は、音声信号のうち、予め定めた音声パターンが含まれる一部分のみを解析することができる。

前述したように報知情報記憶部１５には、モードごとに予め定めた報知情報がキーワードに対応して記憶されている。例えば、第１モード／電車の場合、キーワードは「キンキュウテイシ」「タチイリ」「シンゴウ」「ボタン」「ヒジョウテイシ」「コショウ」などとしておく。報知情報出力部１６は、解析結果にキーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する（Ｓ１６）。報知情報の例については、詳細は後述するが、例えばキーワード「キンキュウテイシ」に対応する報知情報としてテキスト情報「電車が緊急停止します」、あるいは「設定キーワードである「緊急停止」を検出しました」などを対応付けてもよい。報知情報はテキスト情報に限らず、例えば通信端末１の振動パターンなどでもよい。例えばキーワード「キンキュウテイシ」に対して短い時間間隔で５回連続して振動を与える振動パターンを割り当ててもよい。あるいは、報知情報をＬＥＤ素子の発光パターンとして、キーワード「キンキュウテイシ」に対して赤色光の発光パターンを割り当ててもよい。より好ましくは報知情報はテキスト情報に振動パターンや発光パターンを組み合わせて構成する。テキスト情報に振動パターン、発光パターンを組み合わせることにより、ユーザが通信端末を見ていなくても、振動や光によって、まず何らかのキーワードを含むアナウンスがなされたことを的確に通知することができ、テキスト情報によってキーワードの詳細を報知することができるため好適である。

情報報知部１７は、出力された報知情報を表示する（Ｓ１７）。前述したように情報報知部１７は、例えば表示画面１７−１と、バイブレータ１７−２と、ＬＥＤ素子１７−３を含む構成とすることができる。例えば表示画面１７−１はキーワード「キンキュウテイシ」に対して割り当てられた報知情報であるテキスト情報「電車が緊急停止します」を表示し、バイブレータ１７−２はキーワード「キンキュウテイシ」に対して割り当てられた報知情報である５回連続振動の振動パターンを実行し、ＬＥＤ素子１７−３は、キーワード「キンキュウテイシ」に対して割り当てられた報知情報である赤色光の発光パターンを実行する。

以下、引き続き図１を、新たに図３を参照して本実施例の通信端末１の音響モデル更新動作について説明する。詳細は後述するが、生活場面によってユーザは自分の名前を呼びだされるアナウンスを受けることがある。典型的な例は病院の待合室である。このような場合、前述の電車の例とは異なり、通信端末１の解析部１４は、ユーザの名前が発話されたときの音声パターンを解析できることが望ましい。

これを実現するために、ユーザは音響モデルを管理する音響モデルサーバ８に自分の名前などの個人情報のテキストデータを送信する。音響モデルサーバ８はテキストデータを受信し、当該テキストデータを解析可能に学習された追加の音響モデルである追加音響モデルと、当該追加音響モデルが何れのモードに追加されるかを示すモード識別番号とを通信端末１に送信する。モデル受信部１８は、音響モデルサーバ８から、ユーザ要求に応じて送信された追加音響モデルと、モード識別番号とを受信する（Ｓ１８）。モデル更新部１９は、追加音響モデルを用いて対応するモードの音響モデルを更新する（Ｓ１９）。

以下、図４、図５、図６、図７を参照して、第１モード／電車、第２モード／自動車運転中、第３モード／待合室、第４モード／施設内とした場合の、各モードにおけるキーワードと報知情報の対応関係の具体例を説明する。図４、図５、図６、図７はそれぞれ、第１、第２、第３、第４モードにおけるキーワードと報知情報の対応関係を例示する図である。図４に示すように、第１モード／電車の場合、電車の運転見合わせに関するキーワードや、次の停車駅に関するキーワードを設定することができる。キーワードと報知情報は必ずしも１対１に対応付けられていなくてもよい。例えば緊急停止時の車内アナウンスが「緊急停車します」という日本語のアナウンスの後に「The emergency brake has been applied」という英語のアナウンスが必ずあるような場合には、検出するキーワードを「キンキュウテイシ」「The emergency brake」の二つに設定し、何れのキーワードを検出した場合であっても同一の報知情報（テキスト情報）である「電車が緊急停車します」を対応付けてもよい。ここで報知情報（テキスト情報）は、なるべく断定を避け、推定表現を用いれば好適である。例えば図４では、キーワード「タチイリ」「タチイッタ」「センロニヒト」に対し、「線路に人が立ち入ったようです」のように、推定表現を用いた報知情報を対応させている。この報知情報を「線路に人が立ち入っています」のように推定表現を含まない表現とすると、情報の誤認や錯誤が発生する可能性がないとはいえないからである。あるいは、情報誤認を防ぐため、検出したキーワードのみを単純に表示することとしてもよい。この場合、キーワード「センロニヒト」に対し、例えば、報知情報「設定キーワードである「線路に人」を検知しました」を対応付ければよい。

なお、図４に示すようにキーワード「ツギハ○○○」「マモナク○○○」に対して報知情報「次の停車駅は○○○です」が対応付けられている。○○○は駅名である。また、キーワード「×××ニハトマリマセン」「×××ヲツウカ」「×××ハツウカ」に対して報知情報「×××駅には停まらないようです」が対応付けられている。×××は駅名である。このように、次の停車駅や通過駅に関するアナウンスを取得する場合、駅名が発話されたときの音声パターンを解析することができる追加音響モデルを前述の音響モデルサーバ８からダウンロードすればよい。例えば追加音響モデルは中央線、埼京線、湘南新宿ラインなど路線ごとに学習されて音響モデルサーバ８において管理されているものとし、ユーザが使用する路線ごとに追加音響モデルを選択することとしてもよい。

なお、本発明において対象となる音声パターンは人の発話音声に限定されるものではない。例えば第２モードは自動車運転中という生活場面に対応するモードであるが、自動車運転中には、発話音声以外の様々な音情報が重要になる場合がある。例えば、パトカー、救急車、消防車のサイレン音等が挙げられる。従って、第２モード／自転車運転中の場合、第２モード音響モデルは、各種の緊急車両のサイレン音の解析を実行可能であることが望ましい。さらに好ましくは、第２モード音響モデルは、音のドップラー効果による周波数の時系列変化を検出して、緊急車両が前方、後方のいずれの方角から接近しているかまでを特定する。例えば図５の例では、パトカーのサイレン音を、その周波数の時系列変化から三種類に分類し、パトカーのサイレン音１については報知情報「パトカーが後方から接近しているようです」を対応させ、パトカーのサイレン音２については報知情報「パトカーが前方から接近しているようです」を対応させ、パトカーのサイレン音３については方角の特定が困難であった場合として、報知情報「パトカーが接近しているようです」を対応させている。

なお、サイレン音のように音声パターンが発話以外の音声パターンである場合には、解析部１４は、当該発話以外の音声パターンに対して予め定めた音の名称をキーワードとする解析結果を出力する。図５の例では、音の名称である「パトカーのサイレン音１」「白バイのサイレン音１」などがキーワードとして出力される。

なお、第２モード／自転車運転中では、サイレン音のみならず、自動車からのアナウンス情報なども検出できるようにしてもよい。例えば、昨今はＥＴＣカードが未挿入であれば、「ＥＴＣカードが挿入されていません」などのアナウンスを行う自動車が多い。そこで、第２モード音響モデルを、このアナウンスの少なくとも「イーティーシー」の部分だけ音声認識することができるように学習しておき、解析部１４の解析結果にキーワード「イーティーシー」が含まれる場合に、報知情報出力部１６は、対応する報知情報（テキスト情報）である「ＥＴＣカードに問題があるようです」あるいは「設定キーワードである「ＥＴＣ」を検知しました」を出力すればよい。

また、前述したように生活場面によってユーザは自分の名前などユーザの個人情報を呼びだされるアナウンスを受けることがあり、これに対応するためには音響モデルをユーザ向けにカスタマイズする必要がある。例えば、第３モード／待合室の場合、図６に示すようにユーザ本人の名字「ドコモダ」、フルネーム「ドコモダタロウ」、子どものフルネームである「ドコモダイチロウ」、配偶者のフルネームである「ドコモダハナコ」を解析可能とする追加音響モデルを音響モデルサーバ８からダウンロードして、当該追加音響モデルを用いて、予め第３音響モデル記憶部１２−３を更新しておく。このように個人情報に対する音声認識が実行されるように音響モデル更新動作を事前に行っておくことで、例えば病院などにおいても本発明を活用することが可能となる。個人情報は、ユーザの名前に限らず、例えばユーザ所有の車のナンバーであってもよい。例えば、第４モード／施設内の場合、ユーザ所有の車のナンバーである「ヨコハマ○○○−××−▲▲」が解析できるように、第４音響モデル記憶部１２−４が更新されており、図７に示すように、キーワード「ヨコハマ○○○−××−▲▲」に対して報知情報「お車について館内放送があったようです」を対応付けておけば、本実施例の通信端末１は、ユーザの車についての館内放送の報知などにも応用することができる。

以下、図８、図９、図１０を参照して具体的なアナウンスがされた場合の本実施例の通信端末１の動作例（その１）について説明する。図８は車内アナウンスおよび当該アナウンスに含まれるキーワードの例を示す図である。図９は図８のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第１の表示例を示す図である。図１０は図８のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第２の表示例を示す図である。図８は、中央線で人身事故が発生した場合の車内アナウンスの例を示したものである。

モード選択部１１は、ユーザ指示に従って、複数種類のモードのうち第１モード／電車を選択する（Ｓ１１）。マイクロホン１３は、音声信号を取得する（Ｓ１３）。解析部１４は、選択されたモードである第１モード／電車に対応する第１モード音響モデルを用いて、音声信号を解析して解析結果を出力する（Ｓ１４）。図８に示すように解析結果は少なくともキーワード「ジンシン」「ノボリセンクダリセントモ」「ミアワセ」を含んでいる。報知情報出力部１６は、解析結果に含まれるキーワード「ジンシン」「ノボリセンクダリセントモ」「ミアワセ」と対応する報知情報を出力する（Ｓ１６）。情報報知部１７は、出力された報知情報を表示する（Ｓ１７）。表示結果は例えば図９のようになる。図９に示すように各テキスト情報１５−１、１５−２、１５−３に対して「Ａｌａｒｍ！」の表記を付加することもできる。また音声信号の取得をユーザ契機としたい場合には、ＳＣＡＮ開始アイコン２１、ＳＣＡＮ停止アイコン２２などを表示してもよい。また、現在のモードをユーザに通知し、押下によって現在のモードを変更することができるようにモードアイコン３１を表示してもよい。また、前述したキーワードを設定し、当該キーワードを解析可能な追加音響モデルを音響モデルサーバ８からダウンロードする画面に遷移するためのキーワード設定アイコン４１を表示してもよい。なお、図１０の各テキスト情報１５−４、１５−５、１５−６のように、キーワードの検知のみを報知することとしてもよい。

以下、図１１、図１２、図１３を参照して具体的なアナウンスがされた場合の本実施例の通信端末１の動作例（その２）について説明する。図１１は店内放送および当該放送に含まれるキーワードの例を示す図である。図１２は図１１の放送の解析結果に含まれるキーワードと対応する報知情報の第１の表示例を示す図である。図１３は図１１の放送の解析結果に含まれるキーワードと対応する報知情報の第２の表示例を示す図である。

モード選択部１１は、ユーザ指示に従って、複数種類のモードのうち第４モード／施設内を選択する（Ｓ１１）。マイクロホン１３は、音声信号を取得する（Ｓ１３）。解析部１４は、選択されたモードである第４モード／施設内に対応する第４モード音響モデルを用いて、音声信号を解析して解析結果を出力する（Ｓ１４）。図１１に示すように解析結果は少なくともキーワード「ヨコハマ○○○−××−▲▲」を含んでいる。報知情報出力部１６は、解析結果に含まれるキーワード「ヨコハマ○○○−××−▲▲」と対応する報知情報を出力する（Ｓ１６）。情報報知部１７は、出力された報知情報を表示する（Ｓ１７）。表示結果は例えば図１２、図１３のようになる。

本実施例の通信端末１によれば、生活場面を区分するモードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶しておくことにより、低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。

上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。

なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

予め定めた生活場面を区分する複数種類のモードのうち、何れか１つのモードを選択するモード選択部と、
前記モードごとに予め定めた音声パターンを解析可能な音響モデルを前記モードごとに記憶する音響モデル記憶部と、
音声信号を取得するマイクロホンと、
前記選択されたモードに対応する前記音響モデルを用いて、前記音声信号を解析して解析結果を出力する解析部と、
前記モードごとに予め定めた報知情報をキーワードに対応させて記憶する報知情報記憶部と、
前記解析結果に前記キーワードが含まれる場合に、当該キーワードおよび前記モードと対応する報知情報を出力する報知情報出力部と、
を含む通信端末。
請求項１に記載の通信端末であって、
前記音響モデルを管理する音響モデルサーバから、ユーザ要求に応じて送信された追加の音響モデルである追加音響モデルと、当該追加音響モデルが何れのモードに追加されるかを示すモード識別番号とを受信するモデル受信部と、
前記追加音響モデルを用いて対応するモードの音響モデルを更新するモデル更新部と、
をさらに含む通信端末。
請求項１に記載の通信端末であって、
前記報知情報の種別がテキスト情報、振動パターン情報、発光素子の発光パターン情報の何れか、またはこれらの組み合わせである
通信端末。
請求項１から３の何れかに記載の通信端末であって、
前記モードごとに予め定めた音声パターンに発話以外の音声パターンを含む
通信端末。
請求項４に記載の通信端末であって、
前記解析部は、
前記解析結果が発話以外の音声パターンである場合に、当該発話以外の音声パターンに対して予め定めた音の名称をキーワードとする解析結果を出力する
通信端末。
請求項２に記載の通信端末であって、
前記追加音響モデルは、
ユーザが予め登録した個人情報の発話音声の音声パターンを解析可能である
通信端末。
コンピュータを、請求項１から６の何れかに記載の通信端末として機能させるためのプログラム。