JP2015025902A - 通信端末、プログラム - Google Patents

通信端末、プログラム Download PDF

Info

Publication number
JP2015025902A
JP2015025902A JP2013154504A JP2013154504A JP2015025902A JP 2015025902 A JP2015025902 A JP 2015025902A JP 2013154504 A JP2013154504 A JP 2013154504A JP 2013154504 A JP2013154504 A JP 2013154504A JP 2015025902 A JP2015025902 A JP 2015025902A
Authority
JP
Japan
Prior art keywords
mode
acoustic model
communication terminal
keyword
notification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013154504A
Other languages
English (en)
Other versions
JP6216560B2 (ja
Inventor
▲高▼橋 誠
誠 ▲高▼橋
Makoto Takahashi
昌克 塚本
Masakatsu Tsukamoto
昌克 塚本
怜史 河村
Reiji Kawamura
怜史 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2013154504A priority Critical patent/JP6216560B2/ja
Publication of JP2015025902A publication Critical patent/JP2015025902A/ja
Application granted granted Critical
Publication of JP6216560B2 publication Critical patent/JP6216560B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。
【解決手段】予め定めた生活場面を区分する複数種類のモードのうち、何れか1つのモードを選択するモード選択部と、モードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶する音響モデル記憶部と、音声信号を取得するマイクロホンと、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する解析部と、モードごとに予め定めた報知情報をキーワードに対応させて記憶する報知情報記憶部と、解析結果に前記キーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する報知情報出力部とを含む。
【選択図】図1

Description

本発明は、聞き取りが困難なユーザをサポートする通信端末、プログラムに関する。
聴覚に障害を持つ人は、日本国内に数百万人規模で存在するといわれている。電車内、施設内などで音声でアナウンスがなされた場合、聴覚障害者は音声アナウンスの内容を知ることができないばかりでなく、音声アナウンスがなされたこと自体にも気がつかないことがある。特許文献1にはこのような聴覚障害者や視覚障害者の利便性の向上を図ることを目的とした携帯電話装置が開示されている。特許文献1の携帯電話装置は、マイクに入力された言葉又は通話相手の言葉を音声認識する音声認識手段と、音声認識手段にて音声認識された言葉の意味を個別辞書データベースの検索により判別する意味判別手段と、意味判別手段にて判別された言葉の意味を表示する表示手段と、意味判別手段にて判別された言葉の意味を音声出力する音声出力手段とを含む。この構成によれば、マイクに向かって話した言葉と通話相手の言葉の意味が判別され、その結果が表示手段にて表示されるとともに、音声出力される。従って、特許文献1の携帯電話装置によれば、音声でアナウンスがなされた場合であっても、音声アナウンスをマイクにより収音できれば、音声アナウンスの内容を音声認識し、個別辞書データベース検索により意味判別し、判別された音声アナウンスの意味を表示することができるため、聴覚障害者は音声アナウンスの内容を知ることができる。
特開2004−94721号公報
上述の特許文献1のような携帯電話装置を実現する場合、アナウンスが行われる環境、アナウンスを行う話者、アナウンスの内容が全て不特定であることに十分に対応するためには、莫大なコストをかけて音響モデルを学習する必要がある。開発コストを低くするために音響モデルとしてすでに存在する汎用のモデルを流用する場合、認識率が低くなり、システムのデータ量が膨大になることが問題であった。辞書データベースについても不特定なアナウンス内容に対応可能とするためにデータ量が膨大となることが避けられなかった。このように、携帯電話装置に従来の音声認識を組み込むことで聴覚障害者をサポートする考え方は、システム構築のコストおよびシステムの容量の観点で課題があった。
そこで、本発明では低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる通信端末を提供することを目的とする。
本発明の通信端末は、モード選択部と、音響モデル記憶部と、マイクロホンと、解析部と、報知情報記憶部と、報知情報出力部とを含む。
モード選択部は、予め定めた生活場面を区分する複数種類のモードのうち、何れか1つのモードを選択する。音響モデル記憶部は、モードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶する。マイクロホンは、音声信号を取得する。解析部は、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する。報知情報記憶部は、モードごとに予め定めた報知情報をキーワードに対応させて記憶する。報知情報出力部は、解析結果に前記キーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する。
本発明の通信端末によれば、低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。
本発明の実施例1の通信端末の構成を示すブロック図。 本発明の実施例1の通信端末の音声認識動作を示すフローチャート。 本発明の実施例1の通信端末の音響モデル更新動作を示すフローチャート。 第1モードにおけるキーワードと報知情報の対応関係を例示する図。 第2モードにおけるキーワードと報知情報の対応関係を例示する図。 第3モードにおけるキーワードと報知情報の対応関係を例示する図。 第4モードにおけるキーワードと報知情報の対応関係を例示する図。 車内アナウンスおよび当該アナウンスに含まれるキーワードの例を示す図。 図8のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第1の表示例を示す図。 図8のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第2の表示例を示す図。 店内放送および当該放送に含まれるキーワードの例を示す図。 図11の放送の解析結果に含まれるキーワードと対応する報知情報の第1の表示例を示す図。 図11の放送の解析結果に含まれるキーワードと対応する報知情報の第2の表示例を示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<通信端末>
通信端末とは、電話機、特に携帯電話機やPHS電話機、又は通信機能を備えたPDAなどの総称である。
以下、図1、図2を参照して実施例1の通信端末について説明する。図1は本実施例の通信端末1の構成を示すブロック図である。図2は本実施例の通信端末1の音声認識動作を示すフローチャートである。図1に示すように、本実施例の通信端末1は、モード選択部11と、音響モデル記憶部12と、マイクロホン13と、解析部14と、報知情報記憶部15と、報知情報出力部16と、情報報知部17と、モデル受信部18と、モデル更新部19とを含む。
音響モデル記憶部12は、第1モード音響モデル記憶部12−1、第2モード音響モデル記憶部12−2、…、第Nモード音響モデル記憶部12−Nを含む。Nは2以上の整数とする。情報報知部17は、例えば図1に示すように表示画面17−1と、バイブレータ17−2と、LED素子17−3を含む。モデル受信部18は音響モデルを管理する音響モデルサーバ8とNW9を介して通信可能に接続されている。音響モデル記憶部12には、モードごとに予め定めた音声パターンを解析可能な音響モデルがモードごとに記憶されている。より詳細には、第1モード音響モデル記憶部12−1には、第1のモードに対して予め定めた音声パターンを解析可能な音響モデルである第1モード音響モデルが記憶されている。同様に、1≦n≦Nを充たす任意の整数nについて、第nモード音響モデル記憶部12−nには、第nのモードに対して予め定めた音声パターンを解析可能な音響モデルである第nモード音響モデルが記憶されている。報知情報記憶部15には、モードごとに予め定めた報知情報がキーワードに対応させて記憶されている。
モード選択部11は、予め定めた生活場面を区分する複数種類のモードのうち、何れか1つのモードを選択する(S11)。ここでモードとは、生活場面として数種類〜数十種類程度に区分できる各場面のことである。特に音声アナウンスが発生しやすい生活場面をモードとして定義しておくのが好適である。音声アナウンスが発生しやすい生活場面として、例えば電車内、自動車運転中、病院や薬局などの待合室、ショッピングモールや公園などの施設内が挙げられる。本実施例では第1モードを電車、第2モードを自動車運転中、第3モードを待合室、第4モードを施設内として具体的に説明する。モード選択部11は、複数種類のモードのうち、好ましくはユーザ操作により指定された1つのモードを選択する。例えば、本発明の通信端末1が音声認識に用いるユーザインターフェースを含むものとし、ユーザは、当該ユーザインターフェースに表示されるモード選択画面において、ユーザ操作を介して1つのモードを指定するものとし、モード選択部11はユーザ操作により指定された1つのモードを選択するようにすれば好適である。この場合、ユーザは電車乗降時、施設への入出時など、予め定義したモードへの入出時に限りユーザインタフェースを介してモードを設定し直せばよい。
前述したように第nモード音響モデル記憶部12−nには、第nのモードに対して予め定めた音声パターンを解析可能な音響モデルである第nモード音響モデルが記憶されている。第nモード音響モデルを第nのモードに対して予め定めた音声パターンのみを解析可能に学習しておけば、音響モデルの学習コストが削減され、音響モデルのデータ量も削減されるため好適である。
例えば、第1モード/電車の場合、第1モード音響モデル記憶部12−1には、第1のモードである電車内や駅構内におけるアナウンス中に含まれる数種類、または十数種類程度の音声パターンのみを解析可能な音響モデルである第1モード音響モデルが記憶される。電車内や駅構内におけるアナウンス中には、例えば「白線の内側に下がってお待ちください」など定型的で重要性の低いアナウンスも存在するし、一方「上下線とも運転見合わせ」、「信号機故障」、「人身事故」、「運転再開の目途」など、電車が平常に運行されていない場合の現状説明、事故原因、運転再開の見通しなどについて重要な情報を提供するアナウンスも存在する。従って、第1モード/電車に対して予め定めておく音声パターンとしては、例えば「キンキュウテイシ」「タチイリ」「シンゴウ」「ボタン」「ヒジョウテイシ」「コショウ」が発話されたときの音声パターンなど重要な情報を提供している可能性が高い音声パターンとするのが好適である。
マイクロホン13は、音声信号を取得する(S13)。マイクロホン13は、本発明の音声認識のための専用のものを追加実装することとしてもよいし、通信端末1にもともと組み込まれているマイクロホンを流用してもよい。
解析部14は、選択されたモードに対応する音響モデルを用いて、音声信号を解析して解析結果を出力する(S14)。前述したように各モードの音響モデルは、対応するモードに対して予め定めた音声パターンのみを解析可能に学習しておくことが望ましい。予め定めた音声パターンの数が少なければ、マイクロホン13から取得した音声信号の大部分には、予め定めた音声パターンが含まれていないことになる。従って、解析部14は、音響モデルを用いても、音声信号の全体を解析することはできない。解析部14は、音声信号のうち、予め定めた音声パターンが含まれる一部分のみを解析することができる。
前述したように報知情報記憶部15には、モードごとに予め定めた報知情報がキーワードに対応して記憶されている。例えば、第1モード/電車の場合、キーワードは「キンキュウテイシ」「タチイリ」「シンゴウ」「ボタン」「ヒジョウテイシ」「コショウ」などとしておく。報知情報出力部16は、解析結果にキーワードが含まれる場合に、当該キーワードおよびモードと対応する報知情報を出力する(S16)。報知情報の例については、詳細は後述するが、例えばキーワード「キンキュウテイシ」に対応する報知情報としてテキスト情報「電車が緊急停止します」、あるいは「設定キーワードである「緊急停止」を検出しました」などを対応付けてもよい。報知情報はテキスト情報に限らず、例えば通信端末1の振動パターンなどでもよい。例えばキーワード「キンキュウテイシ」に対して短い時間間隔で5回連続して振動を与える振動パターンを割り当ててもよい。あるいは、報知情報をLED素子の発光パターンとして、キーワード「キンキュウテイシ」に対して赤色光の発光パターンを割り当ててもよい。より好ましくは報知情報はテキスト情報に振動パターンや発光パターンを組み合わせて構成する。テキスト情報に振動パターン、発光パターンを組み合わせることにより、ユーザが通信端末を見ていなくても、振動や光によって、まず何らかのキーワードを含むアナウンスがなされたことを的確に通知することができ、テキスト情報によってキーワードの詳細を報知することができるため好適である。
情報報知部17は、出力された報知情報を表示する(S17)。前述したように情報報知部17は、例えば表示画面17−1と、バイブレータ17−2と、LED素子17−3を含む構成とすることができる。例えば表示画面17−1はキーワード「キンキュウテイシ」に対して割り当てられた報知情報であるテキスト情報「電車が緊急停止します」を表示し、バイブレータ17−2はキーワード「キンキュウテイシ」に対して割り当てられた報知情報である5回連続振動の振動パターンを実行し、LED素子17−3は、キーワード「キンキュウテイシ」に対して割り当てられた報知情報である赤色光の発光パターンを実行する。
以下、引き続き図1を、新たに図3を参照して本実施例の通信端末1の音響モデル更新動作について説明する。詳細は後述するが、生活場面によってユーザは自分の名前を呼びだされるアナウンスを受けることがある。典型的な例は病院の待合室である。このような場合、前述の電車の例とは異なり、通信端末1の解析部14は、ユーザの名前が発話されたときの音声パターンを解析できることが望ましい。
これを実現するために、ユーザは音響モデルを管理する音響モデルサーバ8に自分の名前などの個人情報のテキストデータを送信する。音響モデルサーバ8はテキストデータを受信し、当該テキストデータを解析可能に学習された追加の音響モデルである追加音響モデルと、当該追加音響モデルが何れのモードに追加されるかを示すモード識別番号とを通信端末1に送信する。モデル受信部18は、音響モデルサーバ8から、ユーザ要求に応じて送信された追加音響モデルと、モード識別番号とを受信する(S18)。モデル更新部19は、追加音響モデルを用いて対応するモードの音響モデルを更新する(S19)。
以下、図4、図5、図6、図7を参照して、第1モード/電車、第2モード/自動車運転中、第3モード/待合室、第4モード/施設内とした場合の、各モードにおけるキーワードと報知情報の対応関係の具体例を説明する。図4、図5、図6、図7はそれぞれ、第1、第2、第3、第4モードにおけるキーワードと報知情報の対応関係を例示する図である。図4に示すように、第1モード/電車の場合、電車の運転見合わせに関するキーワードや、次の停車駅に関するキーワードを設定することができる。キーワードと報知情報は必ずしも1対1に対応付けられていなくてもよい。例えば緊急停止時の車内アナウンスが「緊急停車します」という日本語のアナウンスの後に「The emergency brake has been applied」という英語のアナウンスが必ずあるような場合には、検出するキーワードを「キンキュウテイシ」「The emergency brake」の二つに設定し、何れのキーワードを検出した場合であっても同一の報知情報(テキスト情報)である「電車が緊急停車します」を対応付けてもよい。ここで報知情報(テキスト情報)は、なるべく断定を避け、推定表現を用いれば好適である。例えば図4では、キーワード「タチイリ」「タチイッタ」「センロニヒト」に対し、「線路に人が立ち入ったようです」のように、推定表現を用いた報知情報を対応させている。この報知情報を「線路に人が立ち入っています」のように推定表現を含まない表現とすると、情報の誤認や錯誤が発生する可能性がないとはいえないからである。あるいは、情報誤認を防ぐため、検出したキーワードのみを単純に表示することとしてもよい。この場合、キーワード「センロニヒト」に対し、例えば、報知情報「設定キーワードである「線路に人」を検知しました」を対応付ければよい。
なお、図4に示すようにキーワード「ツギハ○○○」「マモナク○○○」に対して報知情報「次の停車駅は○○○です」が対応付けられている。○○○は駅名である。また、キーワード「×××ニハトマリマセン」「×××ヲツウカ」「×××ハツウカ」に対して報知情報「×××駅には停まらないようです」が対応付けられている。×××は駅名である。このように、次の停車駅や通過駅に関するアナウンスを取得する場合、駅名が発話されたときの音声パターンを解析することができる追加音響モデルを前述の音響モデルサーバ8からダウンロードすればよい。例えば追加音響モデルは中央線、埼京線、湘南新宿ラインなど路線ごとに学習されて音響モデルサーバ8において管理されているものとし、ユーザが使用する路線ごとに追加音響モデルを選択することとしてもよい。
なお、本発明において対象となる音声パターンは人の発話音声に限定されるものではない。例えば第2モードは自動車運転中という生活場面に対応するモードであるが、自動車運転中には、発話音声以外の様々な音情報が重要になる場合がある。例えば、パトカー、救急車、消防車のサイレン音等が挙げられる。従って、第2モード/自転車運転中の場合、第2モード音響モデルは、各種の緊急車両のサイレン音の解析を実行可能であることが望ましい。さらに好ましくは、第2モード音響モデルは、音のドップラー効果による周波数の時系列変化を検出して、緊急車両が前方、後方のいずれの方角から接近しているかまでを特定する。例えば図5の例では、パトカーのサイレン音を、その周波数の時系列変化から三種類に分類し、パトカーのサイレン音1については報知情報「パトカーが後方から接近しているようです」を対応させ、パトカーのサイレン音2については報知情報「パトカーが前方から接近しているようです」を対応させ、パトカーのサイレン音3については方角の特定が困難であった場合として、報知情報「パトカーが接近しているようです」を対応させている。
なお、サイレン音のように音声パターンが発話以外の音声パターンである場合には、解析部14は、当該発話以外の音声パターンに対して予め定めた音の名称をキーワードとする解析結果を出力する。図5の例では、音の名称である「パトカーのサイレン音1」「白バイのサイレン音1」などがキーワードとして出力される。
なお、第2モード/自転車運転中では、サイレン音のみならず、自動車からのアナウンス情報なども検出できるようにしてもよい。例えば、昨今はETCカードが未挿入であれば、「ETCカードが挿入されていません」などのアナウンスを行う自動車が多い。そこで、第2モード音響モデルを、このアナウンスの少なくとも「イーティーシー」の部分だけ音声認識することができるように学習しておき、解析部14の解析結果にキーワード「イーティーシー」が含まれる場合に、報知情報出力部16は、対応する報知情報(テキスト情報)である「ETCカードに問題があるようです」あるいは「設定キーワードである「ETC」を検知しました」を出力すればよい。
また、前述したように生活場面によってユーザは自分の名前などユーザの個人情報を呼びだされるアナウンスを受けることがあり、これに対応するためには音響モデルをユーザ向けにカスタマイズする必要がある。例えば、第3モード/待合室の場合、図6に示すようにユーザ本人の名字「ドコモダ」、フルネーム「ドコモダタロウ」、子どものフルネームである「ドコモダイチロウ」、配偶者のフルネームである「ドコモダハナコ」を解析可能とする追加音響モデルを音響モデルサーバ8からダウンロードして、当該追加音響モデルを用いて、予め第3音響モデル記憶部12−3を更新しておく。このように個人情報に対する音声認識が実行されるように音響モデル更新動作を事前に行っておくことで、例えば病院などにおいても本発明を活用することが可能となる。個人情報は、ユーザの名前に限らず、例えばユーザ所有の車のナンバーであってもよい。例えば、第4モード/施設内の場合、ユーザ所有の車のナンバーである「ヨコハマ○○○−××−▲▲」が解析できるように、第4音響モデル記憶部12−4が更新されており、図7に示すように、キーワード「ヨコハマ○○○−××−▲▲」に対して報知情報「お車について館内放送があったようです」を対応付けておけば、本実施例の通信端末1は、ユーザの車についての館内放送の報知などにも応用することができる。
以下、図8、図9、図10を参照して具体的なアナウンスがされた場合の本実施例の通信端末1の動作例(その1)について説明する。図8は車内アナウンスおよび当該アナウンスに含まれるキーワードの例を示す図である。図9は図8のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第1の表示例を示す図である。図10は図8のアナウンスの解析結果に含まれるキーワードと対応する報知情報の第2の表示例を示す図である。図8は、中央線で人身事故が発生した場合の車内アナウンスの例を示したものである。
モード選択部11は、ユーザ指示に従って、複数種類のモードのうち第1モード/電車を選択する(S11)。マイクロホン13は、音声信号を取得する(S13)。解析部14は、選択されたモードである第1モード/電車に対応する第1モード音響モデルを用いて、音声信号を解析して解析結果を出力する(S14)。図8に示すように解析結果は少なくともキーワード「ジンシン」「ノボリセンクダリセントモ」「ミアワセ」を含んでいる。報知情報出力部16は、解析結果に含まれるキーワード「ジンシン」「ノボリセンクダリセントモ」「ミアワセ」と対応する報知情報を出力する(S16)。情報報知部17は、出力された報知情報を表示する(S17)。表示結果は例えば図9のようになる。図9に示すように各テキスト情報15−1、15−2、15−3に対して「Alarm!」の表記を付加することもできる。また音声信号の取得をユーザ契機としたい場合には、SCAN開始アイコン21、SCAN停止アイコン22などを表示してもよい。また、現在のモードをユーザに通知し、押下によって現在のモードを変更することができるようにモードアイコン31を表示してもよい。また、前述したキーワードを設定し、当該キーワードを解析可能な追加音響モデルを音響モデルサーバ8からダウンロードする画面に遷移するためのキーワード設定アイコン41を表示してもよい。なお、図10の各テキスト情報15−4、15−5、15−6のように、キーワードの検知のみを報知することとしてもよい。
以下、図11、図12、図13を参照して具体的なアナウンスがされた場合の本実施例の通信端末1の動作例(その2)について説明する。図11は店内放送および当該放送に含まれるキーワードの例を示す図である。図12は図11の放送の解析結果に含まれるキーワードと対応する報知情報の第1の表示例を示す図である。図13は図11の放送の解析結果に含まれるキーワードと対応する報知情報の第2の表示例を示す図である。
モード選択部11は、ユーザ指示に従って、複数種類のモードのうち第4モード/施設内を選択する(S11)。マイクロホン13は、音声信号を取得する(S13)。解析部14は、選択されたモードである第4モード/施設内に対応する第4モード音響モデルを用いて、音声信号を解析して解析結果を出力する(S14)。図11に示すように解析結果は少なくともキーワード「ヨコハマ○○○−××−▲▲」を含んでいる。報知情報出力部16は、解析結果に含まれるキーワード「ヨコハマ○○○−××−▲▲」と対応する報知情報を出力する(S16)。情報報知部17は、出力された報知情報を表示する(S17)。表示結果は例えば図12、図13のようになる。
本実施例の通信端末1によれば、生活場面を区分するモードごとに予め定めた音声パターンを解析可能な音響モデルをモードごとに記憶しておくことにより、低コスト、低容量で聴覚障害者に音声アナウンスを伝達することができる。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (7)

  1. 予め定めた生活場面を区分する複数種類のモードのうち、何れか1つのモードを選択するモード選択部と、
    前記モードごとに予め定めた音声パターンを解析可能な音響モデルを前記モードごとに記憶する音響モデル記憶部と、
    音声信号を取得するマイクロホンと、
    前記選択されたモードに対応する前記音響モデルを用いて、前記音声信号を解析して解析結果を出力する解析部と、
    前記モードごとに予め定めた報知情報をキーワードに対応させて記憶する報知情報記憶部と、
    前記解析結果に前記キーワードが含まれる場合に、当該キーワードおよび前記モードと対応する報知情報を出力する報知情報出力部と、
    を含む通信端末。
  2. 請求項1に記載の通信端末であって、
    前記音響モデルを管理する音響モデルサーバから、ユーザ要求に応じて送信された追加の音響モデルである追加音響モデルと、当該追加音響モデルが何れのモードに追加されるかを示すモード識別番号とを受信するモデル受信部と、
    前記追加音響モデルを用いて対応するモードの音響モデルを更新するモデル更新部と、
    をさらに含む通信端末。
  3. 請求項1に記載の通信端末であって、
    前記報知情報の種別がテキスト情報、振動パターン情報、発光素子の発光パターン情報の何れか、またはこれらの組み合わせである
    通信端末。
  4. 請求項1から3の何れかに記載の通信端末であって、
    前記モードごとに予め定めた音声パターンに発話以外の音声パターンを含む
    通信端末。
  5. 請求項4に記載の通信端末であって、
    前記解析部は、
    前記解析結果が発話以外の音声パターンである場合に、当該発話以外の音声パターンに対して予め定めた音の名称をキーワードとする解析結果を出力する
    通信端末。
  6. 請求項2に記載の通信端末であって、
    前記追加音響モデルは、
    ユーザが予め登録した個人情報の発話音声の音声パターンを解析可能である
    通信端末。
  7. コンピュータを、請求項1から6の何れかに記載の通信端末として機能させるためのプログラム。
JP2013154504A 2013-07-25 2013-07-25 通信端末、プログラム Active JP6216560B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013154504A JP6216560B2 (ja) 2013-07-25 2013-07-25 通信端末、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013154504A JP6216560B2 (ja) 2013-07-25 2013-07-25 通信端末、プログラム

Publications (2)

Publication Number Publication Date
JP2015025902A true JP2015025902A (ja) 2015-02-05
JP6216560B2 JP6216560B2 (ja) 2017-10-18

Family

ID=52490618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013154504A Active JP6216560B2 (ja) 2013-07-25 2013-07-25 通信端末、プログラム

Country Status (1)

Country Link
JP (1) JP6216560B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018531460A (ja) * 2015-09-29 2018-10-25 フジオ ダーツ テクノロジー エス エルFusio D’Arts Technology, S.L. 通知装置及び通知方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6910987B2 (ja) 2018-06-07 2021-07-28 株式会社東芝 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330624A (ja) * 2005-05-30 2006-12-07 Fujifilm Holdings Corp 音声可視化装置、音声可視化方法及び音声可視化プログラム
JP2009175630A (ja) * 2008-01-28 2009-08-06 Sharp Corp 音声認識装置、携帯端末、音声認識システム、音声認識装置制御方法、携帯端末制御方法、制御プログラム、および該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014066537A (ja) * 2012-09-25 2014-04-17 Zenrin Datacom Co Ltd 端末装置、経路案内方法およびコンピュータプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330624A (ja) * 2005-05-30 2006-12-07 Fujifilm Holdings Corp 音声可視化装置、音声可視化方法及び音声可視化プログラム
JP2009175630A (ja) * 2008-01-28 2009-08-06 Sharp Corp 音声認識装置、携帯端末、音声認識システム、音声認識装置制御方法、携帯端末制御方法、制御プログラム、および該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014066537A (ja) * 2012-09-25 2014-04-17 Zenrin Datacom Co Ltd 端末装置、経路案内方法およびコンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018531460A (ja) * 2015-09-29 2018-10-25 フジオ ダーツ テクノロジー エス エルFusio D’Arts Technology, S.L. 通知装置及び通知方法

Also Published As

Publication number Publication date
JP6216560B2 (ja) 2017-10-18

Similar Documents

Publication Publication Date Title
CN103038818B (zh) 在车载语音识别系统与车外语音识别系统之间的通信系统和方法
CN103918247B (zh) 基于背景环境的智能手机传感器逻辑
CN104604250B (zh) 用于耳机的智能通知工具
US20140007010A1 (en) Method and apparatus for determining sensory data associated with a user
KR20140088836A (ko) 음향 문맥을 활용하여 탐색하는 방법들 및 시스템들
US7881662B2 (en) System for information contextual distribution simultaneously in a public and individual mode
KR20140033654A (ko) 디바이스에 연결된 외부 기기를 제어하는 시스템 및 방법
US11068529B2 (en) Information output system, information output method, and program
US10430572B2 (en) Information processing system that recognizes a user, storage medium, and information processing method
CN112216140A (zh) 交通工具到站确认方法、电子设备及计算机可读存储介质
JP6216560B2 (ja) 通信端末、プログラム
US9406294B2 (en) Information-sharing system
JP2016183968A (ja) 音声ガイド支援システム及びそのプログラム
JP2015138534A (ja) 電子機器
US11302317B2 (en) Information processing apparatus and information processing method to attract interest of targets using voice utterance
JP6267298B1 (ja) 提供装置、提供方法、提供プログラム、端末装置、出力方法、及び出力プログラム
US20220279065A1 (en) Information processing terminal and automatic response method
CN117121406A (zh) 通过修改音频和视频接口广播情境信息
JP2016095705A (ja) 不明事項解消処理システム
JP2020034996A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
CN112889298B (zh) 信息提供方法、信息提供系统、以及记录介质
JP2019105966A (ja) 情報処理方法及び情報処理装置
JP6971205B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2017228167A (ja) 情報出力システム及び情報出力方法
EP2919442A1 (en) Using audio intervention for creating context awareness

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170925

R150 Certificate of patent or registration of utility model

Ref document number: 6216560

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250