JP2013174644A - 通信端末、制御方法及びプログラム - Google Patents

通信端末、制御方法及びプログラム Download PDF

Info

Publication number
JP2013174644A
JP2013174644A JP2012037572A JP2012037572A JP2013174644A JP 2013174644 A JP2013174644 A JP 2013174644A JP 2012037572 A JP2012037572 A JP 2012037572A JP 2012037572 A JP2012037572 A JP 2012037572A JP 2013174644 A JP2013174644 A JP 2013174644A
Authority
JP
Japan
Prior art keywords
character string
input
function
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012037572A
Other languages
English (en)
Other versions
JP5887162B2 (ja
Inventor
Hayato Kinoshita
逸人 木下
Hirotaka Furukawa
博崇 古川
Toshiharu Kurisu
俊治 栗栖
Kyoko Masuda
恭子 増田
Satoshi Suda
悟史 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2012037572A priority Critical patent/JP5887162B2/ja
Publication of JP2013174644A publication Critical patent/JP2013174644A/ja
Application granted granted Critical
Publication of JP5887162B2 publication Critical patent/JP5887162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】音声入力によりユーザに指示された機能の呼び出しに必要な場合に、音声認識サーバへの問合せを行う。
【解決手段】通信端末は、複数機能の各機能(例えばアプリケーションプログラム)に対応した登録文字列(例えばアプリケーションプログラムの名称)の一覧を記憶している。通信端末は、入力音声を認識して入力文字列に変換する(S1〜S4)。通信端末は、入力文字列と登録文字列の一覧とを照合し、入力文字列に合致した登録文字列に対応した機能の候補を特定する(S5,S6)。通信端末は、機能の候補を特定した場合は、候補をユーザに提示し、自端末で利用可能であればその機能を利用し、自端末で利用可能でなければ必要なアプリケーションプログラムを通信により検索する(S7〜S11)。通信端末は、機能の候補を特定できなかった場合には(S6;NO)、音声認識サーバに入力音声を認識させて音声認識結果を取得する(S12〜S15)。
【選択図】図7

Description

本発明は、ユーザからの音声入力により機能を呼び出す技術に関する。
スマートフォンや携帯電話端末等のユーザ端末には、ユーザからの音声入力を受け付けて、入力音声により指示された動作を実行する機能を備えたものがある。例えば特許文献1は、ユーザの携帯端末が、音声認識機能を備えた認証・認識サーバに入力音声を認識させ、認識したアプリケーションに関する要求内容が認証・認識サーバからアプリケーションサーバへ送信され、アプリケーションサーバによって提供されたアプリケーションサービスを携帯端末が利用することを開示している。
この種のユーザ端末において、ユーザ端末が音声認識辞書を内蔵しその音声認識辞書を用いて入力音声を認識すれば、ネットワーク上の音声認識サーバを利用する場合に比べて、全体の処理時間を短縮することができるし、ネットワーク負荷を増大させることもない。しかしながら、処理能力やメモリ容量等の装置が持つ能力の差を原因として、ユーザ端末の音声認識の精度は、一般に、音声認識サーバの音声認識の精度に比べて劣る。これに対し、特許文献2は、音声入力があると、小語彙の辞書を有する組込型音声認識機能で音声認識を行い、認識結果が良好であればその認識結果を採用し、その認識結果が良好でない場合には、大語彙の辞書を有するネットワーク型音声認識機能による音声認識を行わせる携帯端末を開示している。特許文献2に記載された技術では、必要な場合にだけ音声認識サーバに認識処理を行わせるから、認識精度が良いときには処理時間を短縮でき、認識精度が悪いときには外部から精度の良い認識結果を得ることができる。
特開2006-203900号公報 特開2009-237439号公報
ところで、特許文献2に記載された技術では、音声認識結果の精度に基づいてネットワーク型音声認識機能の使用の有無が判断される。しかしながら、特許文献1に記載された技術のようにアプリケーションプログラムを呼び出す場合、ユーザが呼び出しを指示したアプリケーションプログラムの候補を或る程度まで絞り込める程度の精度が確保できれば足り、極めて高い精度の音声認識結果を必ずしも要するわけではない。すなわち、音声認識結果の精度の高低に基づいて外部の音声認識サーバに音声認識を行わせるか否かを判断する手法では、ユーザ端末で或る程度まで機能を絞り込むことができていた場合には、結果的に、ユーザ端末が音声認識サーバに不要な問合せを行ったことになる。
そこで、本発明の目的は、音声入力によりユーザに指示された機能の呼び出しに必要な場合に、音声認識サーバへの問合せを行うことである。
上述した課題を解決するため、本発明の通信端末は、外部装置と通信する通信部と、複数機能の各機能に対応した登録文字列を記憶する記憶部と、入力音声を認識し、当該入力音声を入力文字列に変換する音声認識部と、前記音声認識部により変換された入力文字列と前記記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合部と、前記照合部により前記機能が特定されなかった場合には、前記通信部により音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得部と、前記照合部により特定された前記機能、又は前記認識結果取得部により取得された音声認識結果に基づいて所定の処理を実行する処理実行部とを備えることを特徴とする。
本発明において、前記記憶部は、前記機能を利用するために実行すべきアプリケーションプログラムを記憶し、前記照合部は、前記入力音声から変換された入力文字列を含む前記音声認識結果を取得した場合には、当該入力文字列に合致した登録文字列に対応した前記機能を前記記憶部から特定し、前記処理実行部は、前記照合部により特定された前記機能が自通信端末で利用可能である場合には、当該機能を利用するための前記記憶部に記憶されたアプリケーションプログラムを用いて処理を実行し、前記照合部により特定された前記機能が自通信端末で利用可能でない場合には、前記通信部により通信して、当該機能を利用するためのアプリケーションプログラムを検索するようにしてもよい。
本発明において、予め決められた条件を満たす場合には、前記照合部は、入力文字列と登録文字列との照合を行わず、前記認識結果取得部は、前記音声認識サーバに前記入力音声を認識させて前記音声認識結果を取得するようにしてもよい。
また、本発明において、前記条件を満たす場合には、前記音声認識部は、前記入力音声を認識せず、前記認識結果取得部は、前記音声認識サーバに前記入力音声を認識させて前記音声認識結果を取得するようにしてもよい。
本発明において、前記認識結果取得部は、前記入力音声から変換された入力文字列を含む前記音声認識結果を取得し、前記処理実行部は、前記音声認識結果から前記機能が特定された場合には、当該機能に対応して前記記憶部に記憶された登録文字列を、前記認識結果取得部が取得した入力文字列を用いて更新するようにしてもよい。
また、本発明の制御方法は、外部装置と通信する通信端末の制御方法であって、入力音声を認識し、当該入力音声を入力文字列に変換する音声認識ステップと、前記音声認識ステップで変換された入力文字列と、複数機能の各機能に対応した登録文字列を記憶する記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合ステップと、前記照合ステップで前記機能が特定されなかった場合には、音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得ステップと、前記照合ステップで特定された前記機能、又は前記認識結果取得ステップで取得された音声認識結果に基づいて所定の処理を実行する処理実行ステップとを有することを特徴とする。
また、本発明のプログラムは、外部装置と通信する通信端末のコンピュータに、入力音声を認識し、当該入力音声を入力文字列に変換する音声認識ステップと、前記音声認識ステップで変換された入力文字列と、複数機能の各機能に対応した登録文字列を記憶する記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合ステップと、前記照合ステップで前記機能が特定されなかった場合には、音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得ステップと、前記照合ステップで特定された前記機能、又は前記認識結果取得ステップで取得された音声認識結果に基づいて所定の処理を実行する処理実行ステップとを実行させるためのプログラムである。
本発明によれば、音声入力によりユーザに指示された機能の呼び出しに必要な場合に、音声認識サーバへの問合せを行うことができる。
通信システムの全体構成を示す図。 通信端末のハードウェア構成を示すブロック図。 アプリケーション管理リストの構成を示す図。 通信端末の制御部の機能的構成を示す機能ブロック図。 機能を呼び出す場合に実行する処理の流れを示すフローチャート。 機能を提示するときの画面例。 機能を呼び出す場合に実行する処理の流れを示すフローチャート(変形例1)。 機能を呼び出す場合に実行する処理の流れを示すフローチャート(変形例1)。 機能を呼び出す場合に実行する処理の流れを示すフローチャート(変形例2)。
以下、図面を参照しつつ本発明の実施形態を説明する。
図1は、通信システム1の全体構成を示す図である。
通信システム1は、通信端末10と、音声認識サーバ20と、アプリケーション配信サーバ30とを備えている。通信端末10と、音声認識サーバ20と、アプリケーション配信サーバ30とは、ネットワークNW経由で互いに通信可能に接続されている。ネットワークNWは、ここでは、移動体通信網、ゲートウェイ及びインターネットを含む通信網である。
通信端末10は、入力音声(主に、通信端末10のユーザが発する声。)を認識して、音声入力によってユーザに指示されたアプリケーションプログラムを呼び出すことのできるユーザ端末である。音声認識サーバ20は、通信端末10への入力音声を認識し、音声認識結果を通信端末10に提供するサーバ装置である。アプリケーション配信サーバ30は、アプリケーションプログラムをデータベースに蓄積し、蓄積しておいたアプリケーションプログラムを配信するサーバ装置である。通信端末10はアプリケーション配信サーバ30にアクセスして、アプリケーションプログラムを紹介するwebサイトを表示したり、有料又は無料でアプリケーションプログラムをダウンロードしたりすることができる。
なお、通信端末10は、例えばスマートフォンであるが、携帯電話端末やタブレット端末、パーソナルコンピュータ、PDA(Personal Digital Assistant)等の、入力音声を認識する機能とネットワークNWに接続する通信機能とを有する他の通信端末であってもよい。また、図1には、通信端末10、音声認識サーバ20及びアプリケーション配信サーバ30をそれぞれ1つだけ図示しているが、それぞれより多数存在していてもよい。
図2は、通信端末10のハードウェア構成を示すブロック図である。図1に示すように、通信端末10は、制御部11と、音声入出力部12と、通信部13と、操作部14と、表示部15と、記憶部16とを備える。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)を有するマイクロプロセッサを備える。CPUは、ROMや記憶部16に記憶されたデータをRAMに読み出して実行することにより、通信端末10の各部を制御する。音声入出力部12は、マイクロホン及びスピーカを有し、音声の入出力に関わる機能を実現する。通信部13は、無線通信回路やアンテナを備え、移動体通信網、ゲートウェイ及びインターネットを含むネットワークに接続して外部装置と通信するインタフェースである。
操作部14は、表示部15の表示面に重ねて設けられたタッチスクリーンと物理キーとを有し、通信端末10のユーザにより行われた操作を示す操作信号を制御部11に出力する。表示部15は、表示面に画像を表示する。記憶部16は、例えばEEPROM(Electronically Erasable and Programmable ROM)やフラッシュメモリなどの記憶装置を備え、制御部11により実行されるアプリケーションプログラムを含む各種プログラムのほか、通信端末10での音声認識に用いられる音声認識辞書161及びアプリケーション管理リスト162を記憶する。
なお、記憶部16は、リムーバブルメディア等の着脱可能な記憶手段を含んでもよいし、UIM(User Identity Module)カードやSIM(Subscriber Identity Module)カードのような、ユーザ(又は通信端末10)を識別するためのデータが記録された記憶手段を含んでもよい。
次に、アプリケーション管理リスト162の構成を説明する。
図3は、アプリケーション管理リスト162の構成を示す図である。図3に示すように、アプリケーション管理リスト162は、「機能ID」と、「登録文字列」とで表される情報を対応付けたデータテーブルである。
「機能ID」のフィールドは、複数機能の各機能を識別する識別子として機能IDが格納されるフィールドである。アプリケーション管理リスト162に機能IDが登録されている機能は、通信端末10で利用可能な機能のみならず、利用可能でない機能が含まれていることもある。例えば、通信端末10は所定のサーバにアクセスして、アプリケーション管理リスト162を更新する。通信端末10で利用可能な機能は、例えば、制御部11が記憶部16に記憶されたアプリケーションプログラムを実行することによって実現される。よって、機能IDは、通信端末10にインストールされて記憶部16に記憶されたアプリケーションプログラムを識別する識別子ということもできる。「登録文字列」のフィールドは、通信端末10で利用可能な機能に対応した文字列がテキストコード(例えば、ASCII、Unicode、Shift_JIS等)により格納されるフィールドである。登録文字列は、例えば単語であるが、複合語等の任意の文字列でよい。登録文字列は、機能IDが示す機能の名称や、機能を実現するために実行されるアプリケーションプログラムの名称であるが、ユーザは任意の文字列を登録文字列として設定可能である。
例えば、機能ID「ID001」は、記憶部16に記憶されたメーラを実行することにより実現される機能であって、電子メールの作成や送受信を行うための機能(以下、「メール機能A」と称することがある。)に対応し、登録文字列は「めーる」である。機能ID「ID002」は、或るwebページからダウンロードしたメーラを実行することにより実現される機能(以下、「メール機能B」と称することがある。)に対応し、登録文字列は「ふりーめーる」である。機能ID「ID003」は、電話を掛ける(つまり音声通信を行う)ための機能(電話機能)に対応し、登録文字列は「でんわ」である。機能ID「ID004」は、記憶部16に記憶されたアプリケーションプログラムに対応する。そのアプリケーションプログラムが「ABC」という名称あるとし、機能ID「ID004」には登録文字列「えーびーしー」が対応付けられている。
なお、アプリケーション管理リスト162には、各機能IDに対応付けて登録文字列が対応付けられ、登録文字列同士は互いに異なっている。図3に示すように、ここでは「めーる」と「ふりーめーる」とのように部分一致することが許容されているが、両方の登録文字列を「めーる」とする等、複数機能で登録文字列が重複していても構わない。
次に、通信端末10の機能的構成を説明する。
図4は、通信端末10の制御部11のユーザインタフェースに関する機能的構成を示す機能ブロック図である。制御部11は、音声情報取得部111と、音声認識部112と、照合部113と、認識結果取得部114と、処理実行部115とに相当する機能を実現する。
音声情報取得部111は、ユーザにより入力された音声を示す音声情報(例えば、音声波形を示す波形データ)を、音声入出力部12から取得する。
音声認識部112は、音声情報取得部111から取得した音声情報に基づいて音声認識処理を行って入力音声を認識し、入力音声を入力文字列に変換する。音声認識部112は、ここでは記憶部16に記憶された音声認識辞書161を参照して音声認識処理を行い、入力音声をテキストコードたる入力文字列に変換する。
照合部113は、音声認識部112により変換された入力文字列と記憶部16に記憶されたアプリケーション管理リスト162の登録文字列とを照合し、入力文字列に合致した登録文字列によって識別される機能を特定する。ここにおいて、照合部113は、入力文字列が少なくとも一部に含まれている登録文字列に対応した機能IDを、アプリケーション管理リスト162から抽出する。
認識結果取得部114は、照合部113により機能が特定されなかった場合には、音声認識サーバ20に入力音声を認識させ、音声認識サーバ20の音声認識結果を取得する。認識結果取得部114は、音声認識サーバ20に音声認識を行わせる場合には、例えば、音声情報取得部111が取得した音声情報から抽出した特徴情報を、通信部13により音声認識サーバ20に送信して、音声認識処理の実行を要求する。認識結果取得部114は、音声認識サーバ20により実行要求に応じて音声認識処理が行われると、音声認識サーバ20により送信された音声認識結果を通信部13により取得する。認識結果取得部114は、音声認識結果として、例えば入力音声から変換した入力文字列を取得する。
処理実行部115は、照合部113により特定された機能、又は認識結果取得部114により取得された音声認識結果に基づいて所定の処理を実行する。処理実行部115は、例えば、入力文字列から特定された機能を通信端末10で利用可能であれば、その機能を利用するために実行すべきアプリケーションプログラムをユーザに提示したり、そのアプリケーションプログラムを記憶部16から読み出して実行したりする。また、処理実行部115は、例えば、入力文字列から特定された機能を通信端末10で利用可能でなければ、通信部13によりアプリケーション配信サーバ30にアクセスして、アプリケーションプログラムをダウンロードする。
次に、通信端末10の動作を説明する。
図5は、通信端末10がユーザからの音声入力により機能を呼び出す場合に実行する処理の流れを示すフローチャートである。
まず、通信端末10の制御部11は、ユーザにより行われた操作部14の操作に応じて、所定の音声入力受付画面を表示部15に表示させる。制御部11は、表示部15に音声入力受付画面を表示させると、音声入出力部12から入力される音声の検出を開始する。そして、制御部11は、音声入出力部12からの音声入力を受け付けたか否かを判断する(ステップS1)。制御部11は、音声入力受付画面を表示部15に表示させている期間においては、音声入力を受け付けるまで待機する(ステップS1;NO)。
制御部11は、音声入力を受け付けたと判断すると(ステップS1;YES)、音声入出力部12から入力音声を示す音声情報を取得する(ステップS2)。そして、制御部11は、記憶部16に記憶された音声認識辞書161を参照して、音声入出力部12から取得した音声情報に基づいて音声認識処理を行い、入力音声を入力文字列に変換する(ステップS3)。ここにおいて、制御部11は、例えば隠れマルコフモデルに基づく手法等の周知の音声認識技術を用いて、音声認識処理を行えばよい。
次に、制御部11は、音声認識処理の結果により入力文字列を取得したか否かを判断する(ステップS4)。ここにおいて、制御部11は、ステップS3の処理の音声認識処理で入力音声を何らかの文字列(テキストコード)に変換することができれば、入力文字列を取得したと判断する。制御部11は、入力文字列を取得できなかったと判断した場合には(ステップS4;NO)、ステップS1に処理に戻って、入力音声の受け付けを行う。
一方、制御部11は、音声認識処理により入力文字列を取得したと判断すると(ステップS4;YES)、ステップS5の処理に進む。ここでは、制御部11は、「めーる」という入力文字列を取得したものとする。
次に、制御部11は、記憶部16に記憶されたアプリケーション管理リスト162を参照し、入力文字列を用いて登録文字列との照合を行う(ステップS5)。ここにおいて、制御部11は、入力文字列が少なくとも一部に含まれている(つまり、部分一致する)登録文字列に対応した機能IDを、アプリケーション管理リスト162から抽出する。ここでは入力文字列が「めーる」であるから、制御部11は登録文字列「めーる」である機能ID「ID001」と、登録文字列「ふりーめーる」である機能ID「ID002」とをアプリケーション管理リスト162から抽出する。
なお、ここでは、制御部11は、いわゆる表記ゆれを考慮して、入力文字列と登録文字列とが合致するか否かを判断するものとする。例えば、制御部11は「えーびーしー」と「えいびーしー」とが合致すると判断する。また、制御部11は、略語の利用を考慮して、入力文字列と登録文字列とが合致するか否かを判断してもよい。例えば、制御部11は「パソコン」と「パーソナルコンピュータ」とが合致すると判断してもよい。
次に、制御部11は、入力文字列と登録文字列とが合致する機能を特定したか否かを判断する(ステップS6)。ここでは制御部11は、ステップS5の処理で機能ID「ID001」及び「ID002」を抽出し、2種類の機能を特定したから、ステップS6の処理で「YES」と判断する(ステップS6;YES)。次に、制御部11は、特定した機能の候補をユーザに提示し、適切な機能があったか否かをユーザに問い合わせる(ステップS7)。制御部11は、例えば、図6に示す機能提示画面を表示部15に表示させる。具体的には、図6に示すように、制御部11は「あなたがお探しの機能は以下のどれかですか?」というメッセージと、特定した各機能の名称を付したソフトボタンSB1,SB2と、「どの機能でもない」というメッセージを付したソフトボタンSB3とを配置した機能提示画面を表示部15に表示させる。ここにおいて、制御部11は、提示した機能のいずれかに対応するソフトボタンがユーザの操作部14の操作により選択された場合に、適切な機能があると判断する。よって、制御部11は、図6に示すソフトボタンSB1又はSB2が選択された場合には、ステップS7の処理で「YES」と判断する。
次に、制御部11は、ステップS7の処理でユーザに選択された機能が利用可能であるか否かを判断する(ステップS8)。制御部11は、ユーザに選択された機能が利用可能であると判断すると(ステップS8;YES)、その機能を利用する(ステップS9)。例えば、制御部11は、ソフトボタンSB1が選択された場合には、記憶部16からメーラを読み出して実行して、メール機能を利用するための画面を表示部15に表示させる。
一方、制御部11は、ステップS8の処理で機能を利用可能でないと判断した場合(ステップS8;NO)、アプリケーション配信サーバ30から機能を検索するか否かを判断する(ステップS10)。ここでは、制御部11は、入力文字列を検索語として、アプリケーション配信サーバ30により提供されるアプリケーションプログラムから、ユーザが所望する機能の利用に必要なアプリケーションプログラムを検索するか否かをユーザに問い合わせる。制御部11は、ユーザによりアプリケーション配信サーバ30からアプリケーションプログラムを検索することが操作部14の操作により指示されると、ステップS10の処理で「YES」と判断して、ステップS11の処理に進む。そして、制御部11は、入力文字列を検索語とした検索クエリをアプリケーション配信サーバ30に送信して、アプリケーション配信サーバ30からアプリケーションプログラムを検索する(ステップS11)。アプリケーション配信サーバ30は、検索クエリを受信すると、入力文字列を検索語として、データベースからアプリケーションプログラムを検索し、検索結果を通信端末10に提示する。ここにおいて、アプリケーション配信サーバ30は、例えば、アプリケーションプログラムの名称に「めーる」という呼称を含むアプリケーションプログラムの一覧を提示する。通信端末10の制御部11は、アプリケーション配信サーバ30により提示されたアプリケーションプログラムの一覧から、ユーザの指示に応じてアプリケーションプログラムを選択し、その紹介をするwebサイトをwebブラウザに表示したり、アプリケーションプログラムをダウンロードしたりする。
一方、ステップS10の処理で「NO」と判断した場合、制御部11は、ステップS11の処理を実行しない。
ところで、ステップS6の処理で、制御部11が入力文字列に登録文字列が合致する機能を特定しなかった場合(ステップS6;NO)、又は、ステップS7の処理で適切な機能がないと判定した場合(具体的には、図6に示すソフトボタンSB3が選択された場合)には(ステップS7;NO)、音声認識サーバ20に音声認識を行わせる。制御部11がステップS6の処理で「NO」と判断する場合とは、入力文字列を取得したものの、通信端末10で利用可能な機能の登録文字列のいずれにも合致しなかった場合である。この原因として、例えば、音声認識の結果の精度が不良であることや、ユーザが利用したい機能の登録文字列がアプリケーション管理リスト162未登録であることが考えられる。また、制御部11がステップS7の処理で「NO」と判断する場合には、機能を提示したものの、ユーザが所望する機能が含まれていない場合がある。このような場合、制御部11は、音声認識サーバ20により精度の高い音声認識を行わせて、適切な機能を提示できるように試みる。
制御部11は、ステップS6又はS7の処理で「NO」と判断すると、ステップS2で取得した音声情報から抽出した特徴情報を、通信部13により音声認識サーバ20宛てに送信し、音声認識サーバ20に音声認識処理を要求する(ステップS12)。音声認識サーバ20は、通信端末10からの要求に応じて音声認識処理を行い、この音声認識処理で入力音声を入力文字列に変換すると、この入力文字列を含む音声認識結果を通信端末10宛てに送信する。そして、制御部11は、音声認識サーバ20から音声認識結果を取得する(ステップS13)。そして、制御部11は、取得した音声認識結果に含まれる入力文字列を用いて、ステップS5の処理と同様の照合処理を行って、特定した機能の一覧を表示部15への表示にユーザに提示する(ステップS14)。ステップS14の処理では、通信端末10の制御部11は、ステップS7の処理と同じようにして機能提示画面を表示部15に表示させればよい。
次に、制御部11は、音声の再入力指示を受け付けたか、又はステップS14の処理で提示機能がなかったかのいずれかに該当するか否かを判断する(ステップS15)。制御部11は、ユーザの操作部14の操作に応じて音声の再入力指示を受け付けたか、又は提示機能がなかったと判断した場合には(ステップS15;YES)、ステップS1の処理に戻って音声入力画面を表示部15に表示させ、音声入力を受け付けることとなる。
一方、制御部11は、音声の再入力指示を受け付けず、かつ、ステップS13の処理で少なくとも1つ機能を提示した場合には(ステップS15;NO)、ステップS8の処理に進み、機能の一覧からユーザに選択された機能が利用可能であるか否かを判断することとなる。この場合のステップS8の処理以降の処理は既に説明したとおりである。
以上が通信端末10が機能を呼び出すときの動作の説明である。
以上説明した実施形態によれば、通信端末10は内蔵する音声認識辞書161を用いて入力音声を認識し入力文字列に変換する。そして、通信端末10は、入力文字列とアプリケーション管理リスト162に格納された登録文字列とを照合し、入力文字列に合致する登録文字列の機能を特定しユーザに提示する。その際に、通信端末10は、入力文字列に合致する登録文字列の機能を特定できなかった場合に、音声認識サーバ20に音声認識を行わせて、音声認識サーバ20により入力文字列から特定された機能を提示する。仮に通信端末10が音声認識結果の精度の良し悪しで音声認識サーバ20への処理の要求を判断していれば、どちらでも同じ入力文字列が得られて同じ機能が特定されてしまい、音声認識サーバ20にアクセスしたことによるメリットを享受できないことがある。これに対し、通信端末10は、機能を適切に呼び出せなかった場合に、音声認識精度が自端末よりも高い音声認識サーバ20に音声認識処理を要求するので、音声認識サーバ20によって入力文字列が得られた場合に、自端末では特定できなかった機能を特定できることがある。
また、通信端末10は、ユーザに利用が指示された機能が自端末で利用できない場合には、アプリケーション配信サーバ30に問合せを行う。これにより、通信端末10は、一度の音声認識処理で得た入力文字列を用いて、アプリケーション配信サーバ30から速やかにアプリケーションプログラムをダウンロードし、ユーザが所望する機能を利用可能にすることができる。
[変形例]
本発明は、上述した実施形態と異なる形態で実施することが可能である。本発明は、例えば、以下のような形態で実施することも可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
(変形例1)
上述した実施形態において、通信端末10は音声入力を受け付けると、入力音声を示す音声情報に基づいて音声認識処理を行って、ステップS5の処理の照合処理を行っていたが、特定の条件を満たす場合には、この照合処理を行わず、音声認識サーバ20にそれを要求してもよい。照合処理を必要に応じて省略するためには、(1)音声認識を省略する構成と、(2)音声認識を行ってから照合処理を省略する構成との2通りが考えられる。以下、それぞれ分けて説明する。
(1)音声認識を省略する。
制御部11は、予め決められた音声認識の不実施条件(第1条件)を満たす場合には、音声認識処理を行うことなく、音声認識サーバ20に音声認識処理を行わせてもよい。例えば、通信端末10の音声認識精度が音声認識サーバ20よりも劣るのであれば、入力音声が長期間に及ぶ場合には、全期間に渡って精度良く認識するのが難しい場合がある。よって、入力音声が長期間に及ぶと、通信端末10が入力文字列に変換できたとしても、認識ミスによって、適切な機能を特定できない可能性が高まる。そこで、制御部11は、入力音声を示す音声情報を監視し、入力音声が所定時間長以上継続する場合に、入力音声を認識しない。
図7は、この変形例の通信端末10がユーザからの音声入力により機能を呼び出す場合に実行する処理の流れを示すフローチャートである。図5と同じ符号を付した処理ステップでは、上述した実施形態と同じ処理が行われるので、ここではその説明を省略する。
通信端末10の制御部11は、音声入力を受け付けて(ステップS1;YES)、音声情報を取得すると(ステップS2)、音声認識処理の不実施条件を満たすか否かを判断する(ステップS16)。例えば、制御部11は、入力音声の音量レベルが閾値以上である期間が所定の時間長以上継続した場合に、不実施条件を満たすと判断するとよい。これ以外にも、制御部11は、入力音声の周波数成分を解析し、人間の声を検知した時間が所定の時間長以上継続した場合に、不実施条件を満たすと判断してもよい。
制御部11は、入力音声が所定時間長以上継続し、不実施条件を満たすと判断した場合には(ステップS16;YES)、ステップS12の処理に進み、音声認識サーバ20に音声認識を行わせる。制御部11が実行するステップS12以降の処理は上述した実施形態と同じである。
一方、制御部11は、入力音声が所定時間長以上継続せず、不実施条件を満たさないと判断した場合には(ステップS16;NO)、ステップS3の処理進み、音声認識辞書161を参照して音声認識を行う。制御部11が実行するステップS3以降の処理は上述した実施形態と同じである。
このように、通信端末10は入力音声が所定時間長以上継続して、認識結果の精度が低くなる可能性のある場合には、自端末で音声認識を行わずに音声認識サーバ20に音声認識処理を要求する。これにより、通信端末10が自端末で音声認識を行って精度が悪い結果を得てから、音声認識サーバ20に音声認識処理を要求する場合に比べて、処理時間を短縮することができる。このような不実施条件を満たす場合、音声認識サーバ20に音声認識処理を要求したことによるメリットを享受できる可能性が高いわけであるが、音声認識を自端末で行わない不実施条件はこれ以外の条件であってもよい。例えば、不実施条件は、入力音声に含まれるノイズ成分が閾値レベル以上であるという条件であってもよいし、認識結果の精度が低下する要素に基づいて予め決められていればよい。
(2)音声認識を行ってから照合処理を省略する。
制御部11は、音声認識を行った後、予め決められた照合処理の不実施条件(第2条件)を満たす場合には、この照合処理を行うことなく、音声認識サーバ20に音声認識処理を行わせてもよい。例えば、通信端末10の音声認識精度が音声認識サーバ20よりも劣るのであれば、入力文字列に含まれる単語数が多い場合には、全期間に渡って精度良く認識するのが難しい場合がある。よって、単語数が多いと、通信端末10が入力文字列に変換できたとしても、認識ミスによって合致する登録文字列を発見できない可能性が高まる。そこで、制御部11は、入力音声を示す音声情報を監視し、単語数が閾値以上である場合に、照合処理をしない。
図8は、この変形例の通信端末10がユーザからの音声入力により機能を呼び出す場合に実行する処理の流れを示すフローチャートである。図5と同じ符号を付した処理ステップでは、上述した実施形態と同じ処理が行われるので、ここではその説明を省略する。
通信端末10の制御部11は、音声入力を受け付けて(ステップS1;YES)、音声情報を取得し(ステップS2)、音声認識処理を行う(ステップS3)。そして、制御部11は、入力音声から入力文字列を得ると、その入力文字列に基づいて照合処理の不実施条件を満たすか否かを判断する(ステップS17)。例えば、制御部11は、入力音声から閾値以上の数の単語を含む入力文字列を得た場合に、不実施条件を満たすと判断する。
制御部11は、単語数が閾値以上であり、不実施条件を満たすと判断した場合には(ステップS17;YES)、ステップS12の処理に進み、音声認識サーバ20に音声認識処理を行わせる。制御部11が実行するステップS12以降の処理は上述した実施形態と同じである。
一方、制御部11は、単語数が閾値未満であり、不実施条件を満たさないと判断した場合には(ステップS17;NO)、ステップS3の処理進み、音声認識辞書161を参照して音声認識処理を行う。制御部11が実行するステップS3以降の処理は上述した実施形態と同じである。
このように、通信端末10は入力文字列の単語数が多く、認識結果の精度が低くなる可能性のある場合には、照合処理を行わず音声認識サーバ20に音声認識処理を要求する。これにより通信端末10は、自端末で照合処理を行ってその結果を得てから音声認識サーバ20に音声認識処理を要求する場合に比べて、処理時間を短縮することができる。このような不実施条件を満たす場合、音声認識サーバ20に音声認識処理を要求したことによるメリットを享受できる可能性が高いわけであるが、照合処理を自端末で行わない不実施条件はこれ以外の条件であってもよい。例えば、不実施条件は、特定の外来語であることを条件としてもよいし、呼称が類似する言葉が複数ある語句であることを条件としてもよく、照合処理の結果の精度が低下する要素に基づいて予め決められていればよい。
(変形例2)
上述した実施形態において、通信端末10は音声認識サーバ20の音声認識結果を用いて、アプリケーション管理リスト162の登録文字列を更新してもよい。例えば、機能ID「ID004」の機能の登録文字列は「えーびーしー」であるが、ユーザの「ABC」の発話の仕方(例えば癖や滑舌)によっては、必ずしも「えーびーしー」という入力文字列に変換されるとは限らず、「えいびーしー」と認識されたり、「えいびーすぃー」と認識されたりすることが考えられる。このように、ユーザが指定する登録文字列と、そのユーザが発話して認識される入力文字列とが乖離する場合がある。
そこで、本変形例の通信端末10は以下に説明する手順で機能の呼び出しを行う。
図9は、この変形例の通信端末10がユーザからの音声入力により機能を呼び出す場合に実行する処理の流れを示すフローチャートである。図5と同じ符号を付した処理ステップでは、上述した実施形態と同じ処理が行われるので、ここではその説明を省略する。
制御部11は、ステップS1からステップS6(ステップS6;NO)の処理を実行し、ステップS12の処理に進むと、音声認識サーバ20に音声認識処理を行わせる。そして、制御部11は、音声認識サーバ20により入力音声が「えいびーしー」という入力文字列に変換されたとする。そして、制御部11は、ステップS15;NOに進むと、次に、登録文字列を更新するか否かを判断する(ステップS18)。
ここで、制御部11が、音声認識サーバ20により「えいびーしー」という認識結果を取得し、ユーザにより機能ID「ID004」の機能が選択されたとする。この場合、制御部11は、アプリケーション管理リスト162に機能ID「ID004」が登録されていたにも関わらず、ステップS3の音声認識処理の精度が悪く、ステップS5の処理でこの機能を特定できなかったことになる。そこで、制御部11は、この機能IDについて、音声認識サーバ20により変換された入力文字列を用いて登録文字列を更新するかをユーザに問い合わせる。
制御部11は、ユーザの指示に応じて、音声認識サーバ20により変換された入力文字列を用いて登録文字列を更新すると判断すると(ステップS18;YES)、アプリケーション管理リスト162の登録文字列を更新する(ステップS19)。ここでは、制御部11は、アプリケーション管理リスト162において機能ID「ID004」に対応する登録文字列を「えーびーしー」から「えいびーしー」に変更するよう更新する。ここにおいて、制御部11は、更新する登録文字列を追加する更新処理を行ってもよく、この場合、更新後のアプリケーション管理リスト162においては、機能ID「ID004」に登録文字列「えーびーしー」及び「えいびーしー」が対応付けられることになる。
これにより、ユーザが以降において同じ発話をした場合には、音声認識サーバ20で「えーびーしー」と認識される発話であっても、「えいびーしー」と認識される発話であっても、通信端末10は機能ID「ID004」の機能を特定できるから、ステップS3の処理の音声認識処理で機能ID「ID004」の機能を特定できる可能性が高くなる。
なお、制御部11は、登録文字列を更新しないと判断した場合は(ステップS18;NO)、ステップS19の処理を実行することなく、ステップS8の処理に進む。
以上説明した変形例2によれば、通信端末10は、音声認識サーバ20の音声認識結果を用いて登録文字列を更新するから、ユーザの癖や滑舌等のユーザ固有の発話をした場合であっても、そのユーザに適した登録文字列となるように、アプリケーション管理リスト162を更新することが可能となる。
(変形例3)
上述した実施形態においては、通信端末10はステップS8の処理で「NO」と判断した場合、アプリケーション配信サーバ30に対して検索を要求したが、この検索を行わないようにしてもよい。
また、音声認識サーバ20は入力文字列を通信端末10に通知し、通信端末10はこの入力文字列を用いて照合処理を行っていたが、音声認識サーバ20は入力音声を入力文字列に変換し、その入力文字列を用いて機能を特定して機能を通知してもよい。
(変形例4)
上述した実施形態において、アプリケーション管理リスト162において機能ID毎にその機能IDの機能が通信端末10で利用可能か否かを識別する識別子が記憶されていてもよい。この場合、制御部11は、ステップS8の処理においてアプリケーション管理リスト162を参照するだけで、機能が利用可能か否かを判断することができる。
(変形例5)
また、通信端末10の制御部11が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の協働によって実現されうる。
また、本発明は、通信端末10のほか、通信端末の制御方法やプログラムといった形態でも実施が可能である。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることも可能である。
1…通信システム、10…通信端末、11…制御部、111…音声情報取得部、112…音声認識部、113…照合部、114…認識結果取得部、115…処理実行部、12…音声入出力部、13…通信部、14…操作部、15…表示部、16…記憶部、161…音声認識辞書、162…アプリケーション管理リスト、20…音声認識サーバ、30…アプリケーション配信サーバ

Claims (7)

  1. 外部装置と通信する通信部と、
    複数機能の各機能に対応した登録文字列を記憶する記憶部と、
    入力音声を認識し、当該入力音声を入力文字列に変換する音声認識部と、
    前記音声認識部により変換された入力文字列と前記記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合部と、
    前記照合部により前記機能が特定されなかった場合には、前記通信部により音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得部と、
    前記照合部により特定された前記機能、又は前記認識結果取得部により取得された音声認識結果に基づいて所定の処理を実行する処理実行部と
    を備えることを特徴とする通信端末。
  2. 前記記憶部は、
    前記機能を利用するために実行すべきアプリケーションプログラムを記憶し、
    前記照合部は、
    前記入力音声から変換された入力文字列を含む前記音声認識結果を取得した場合には、当該入力文字列に合致した登録文字列に対応した前記機能を前記記憶部から特定し、
    前記処理実行部は、
    前記照合部により特定された前記機能が自通信端末で利用可能である場合には、当該機能を利用するための前記記憶部に記憶されたアプリケーションプログラムを用いて処理を実行し、
    前記照合部により特定された前記機能が自通信端末で利用可能でない場合には、前記通信部により通信して、当該機能を利用するためのアプリケーションプログラムを検索する
    ことを特徴とする請求項1に記載の通信端末。
  3. 予め決められた条件を満たす場合には、
    前記照合部は、入力文字列と登録文字列との照合を行わず、
    前記認識結果取得部は、
    前記音声認識サーバに前記入力音声を認識させて前記音声認識結果を取得する
    ことを特徴とする請求項1又は2に記載の通信端末。
  4. 前記条件を満たす場合には、
    前記音声認識部は、
    前記入力音声を認識せず、
    前記認識結果取得部は、
    前記音声認識サーバに前記入力音声を認識させて前記音声認識結果を取得する
    ことを特徴とする請求項3に記載の通信端末。
  5. 前記認識結果取得部は、
    前記入力音声から変換された入力文字列を含む前記音声認識結果を取得し、
    前記処理実行部は、
    前記音声認識結果から前記機能が特定された場合には、当該機能に対応して前記記憶部に記憶された登録文字列を、前記認識結果取得部が取得した入力文字列を用いて更新する
    ことを特徴とする請求項1から4のいずれか1項に記載の通信端末。
  6. 外部装置と通信する通信端末の制御方法であって、
    入力音声を認識し、当該入力音声を入力文字列に変換する音声認識ステップと、
    前記音声認識ステップで変換された入力文字列と、複数機能の各機能に対応した登録文字列を記憶する記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合ステップと、
    前記照合ステップで前記機能が特定されなかった場合には、音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得ステップと、
    前記照合ステップで特定された前記機能、又は前記認識結果取得ステップで取得された音声認識結果に基づいて所定の処理を実行する処理実行ステップと
    を有することを特徴とする制御方法。
  7. 外部装置と通信する通信端末のコンピュータに、
    入力音声を認識し、当該入力音声を入力文字列に変換する音声認識ステップと、
    前記音声認識ステップで変換された入力文字列と、複数機能の各機能に対応した登録文字列を記憶する記憶部に記憶された登録文字列とを照合し、当該入力文字列に合致した登録文字列に対応した前記機能を特定する照合ステップと、
    前記照合ステップで前記機能が特定されなかった場合には、音声認識サーバと通信して、当該音声認識サーバに前記入力音声を認識させて音声認識結果を取得する認識結果取得ステップと、
    前記照合ステップで特定された前記機能、又は前記認識結果取得ステップで取得された音声認識結果に基づいて所定の処理を実行する処理実行ステップと
    を実行させるためのプログラム。
JP2012037572A 2012-02-23 2012-02-23 通信端末、制御方法及びプログラム Active JP5887162B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012037572A JP5887162B2 (ja) 2012-02-23 2012-02-23 通信端末、制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012037572A JP5887162B2 (ja) 2012-02-23 2012-02-23 通信端末、制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013174644A true JP2013174644A (ja) 2013-09-05
JP5887162B2 JP5887162B2 (ja) 2016-03-16

Family

ID=49267622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012037572A Active JP5887162B2 (ja) 2012-02-23 2012-02-23 通信端末、制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5887162B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016126330A (ja) * 2014-12-26 2016-07-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識装置及び音声認識方法
JP2020510852A (ja) * 2017-03-31 2020-04-09 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 音声機能制御方法および装置
JP2021515256A (ja) * 2018-03-21 2021-06-17 グーグル エルエルシーGoogle LLC セキュアな処理環境内のデータ転送
JP2022513785A (ja) * 2018-12-11 2022-02-09 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022550609A (ja) * 2020-06-29 2022-12-02 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド ミニプログラムの音声制御方法、機器及び記憶媒体

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2003036221A (ja) * 2001-07-23 2003-02-07 Cai Kk 情報提供方法及び情報システム及び記録媒体及び伝送媒体
JP2003115929A (ja) * 2001-10-02 2003-04-18 Hitachi Ltd 音声入力システムおよび音声ポータルサーバおよび音声入力端末
JP2005043461A (ja) * 2003-07-23 2005-02-17 Canon Inc 音声認識方法及び音声認識装置
JP2006003696A (ja) * 2004-06-18 2006-01-05 Toyota Motor Corp 音声認識装置、音声認識方法、及び音声認識プログラム
JP2008046260A (ja) * 2006-08-11 2008-02-28 Nissan Motor Co Ltd 音声認識装置
WO2009019783A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation 音声認識装置及び音声認識方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2003036221A (ja) * 2001-07-23 2003-02-07 Cai Kk 情報提供方法及び情報システム及び記録媒体及び伝送媒体
JP2003115929A (ja) * 2001-10-02 2003-04-18 Hitachi Ltd 音声入力システムおよび音声ポータルサーバおよび音声入力端末
JP2005043461A (ja) * 2003-07-23 2005-02-17 Canon Inc 音声認識方法及び音声認識装置
JP2006003696A (ja) * 2004-06-18 2006-01-05 Toyota Motor Corp 音声認識装置、音声認識方法、及び音声認識プログラム
JP2008046260A (ja) * 2006-08-11 2008-02-28 Nissan Motor Co Ltd 音声認識装置
WO2009019783A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation 音声認識装置及び音声認識方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016126330A (ja) * 2014-12-26 2016-07-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識装置及び音声認識方法
JP2020510852A (ja) * 2017-03-31 2020-04-09 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 音声機能制御方法および装置
US10991371B2 (en) 2017-03-31 2021-04-27 Advanced New Technologies Co., Ltd. Voice function control method and apparatus
JP2021515256A (ja) * 2018-03-21 2021-06-17 グーグル エルエルシーGoogle LLC セキュアな処理環境内のデータ転送
US11392688B2 (en) 2018-03-21 2022-07-19 Google Llc Data transfer in secure processing environments
JP7111818B2 (ja) 2018-03-21 2022-08-02 グーグル エルエルシー セキュアな処理環境内のデータ転送
US11907363B2 (en) 2018-03-21 2024-02-20 Google Llc Data transfer in secure processing environments
JP2022513785A (ja) * 2018-12-11 2022-02-09 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP7159476B2 (ja) 2018-12-11 2022-10-24 チンタオ ハイアール ウォッシング マシン カンパニー,リミテッド 音声制御方法、クラウドサーバおよび端末装置
JP2022550609A (ja) * 2020-06-29 2022-12-02 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド ミニプログラムの音声制御方法、機器及び記憶媒体
JP7373063B2 (ja) 2020-06-29 2023-11-01 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド ミニプログラムの音声制御方法、機器及び記憶媒体

Also Published As

Publication number Publication date
JP5887162B2 (ja) 2016-03-16

Similar Documents

Publication Publication Date Title
KR102173100B1 (ko) 개발자 보이스 액티비티 시스템
CN107895578B (zh) 语音交互方法和装置
JP6744314B2 (ja) クラウドソーシングに基づいてデジタルパーソナルアシスタントのための言語理解分類子モデルを更新すること
US7980465B2 (en) Hands free contact database information entry at a communication device
CN107111516B (zh) 数字个人助理内的无头任务完成
CN106663430B (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
KR101777392B1 (ko) 중앙 서버 및 이에 의한 사용자 음성 처리 방법
US8725514B2 (en) Verifying a user using speaker verification and a multimodal web-based interface
US8938388B2 (en) Maintaining and supplying speech models
US10824300B2 (en) Predictive determination of actions
JP5887162B2 (ja) 通信端末、制御方法及びプログラム
US20170249934A1 (en) Electronic device and method for operating the same
JP2016095383A (ja) 音声認識クライアント装置及びサーバ型音声認識装置
CN103562847A (zh) 功能提示系统、终端装置、服务装置、程序和功能提示方法
CN104751847A (zh) 一种基于声纹识别的数据获取方法及系统
US11151995B2 (en) Electronic device for mapping an invoke word to a sequence of inputs for generating a personalized command
JP4144443B2 (ja) 対話装置
CN110675869A (zh) 一种语音控制智慧城市app内应用的方法和装置
CN112837668B (zh) 一种语音处理方法、装置和用于处理语音的装置
KR101885129B1 (ko) 통합형 다이얼러 어플리케이션 실행 가능한 장치 및 이를 수행하는 서버
JP2003202890A (ja) 音声認識装置及びその方法、プログラム
JP2018166302A (ja) 端末装置、商品提案方法、およびプログラム
JP2004145796A (ja) サーバ装置、利用者端末、文字列変換システム及びプログラム
KR100574007B1 (ko) 음성 인식 기반의 개인별 전화국 서비스 제공 시스템 및 그 방법, 상기 방법을 실행하기 위한 프로그램이 기록된 기록매체
KR200209075Y1 (ko) 음성으로 인터넷상의 정보를 유/무선/이동 전화망을 통해제공하는 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140731

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160215

R150 Certificate of patent or registration of utility model

Ref document number: 5887162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250