JP2016058816A - 情報端末および情報端末システム - Google Patents
情報端末および情報端末システム Download PDFInfo
- Publication number
- JP2016058816A JP2016058816A JP2014182231A JP2014182231A JP2016058816A JP 2016058816 A JP2016058816 A JP 2016058816A JP 2014182231 A JP2014182231 A JP 2014182231A JP 2014182231 A JP2014182231 A JP 2014182231A JP 2016058816 A JP2016058816 A JP 2016058816A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information terminal
- data
- processing unit
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】音声によって不正使用者の使用の防止と操作とを容易に行えることができる情報端末および情報端末システムを提供する。
【解決手段】音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、音声データを記憶する記憶部と、記憶部に記憶された音声データに基づいて処理を行う音声処理部と、を備え、音声処理部は、音声データが使用者が発した音声であるか否かを判定し、該音声データが使用者が発した音声であると判定した場合に、動作の実行が制限されているロック状態を解除して、該音声データに含まれるコマンドに応じた動作を実行する。
【選択図】図1
【解決手段】音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、音声データを記憶する記憶部と、記憶部に記憶された音声データに基づいて処理を行う音声処理部と、を備え、音声処理部は、音声データが使用者が発した音声であるか否かを判定し、該音声データが使用者が発した音声であると判定した場合に、動作の実行が制限されているロック状態を解除して、該音声データに含まれるコマンドに応じた動作を実行する。
【選択図】図1
Description
本発明は、情報端末および情報端末システムに関する。
従来から、既存の移動体通信網を利用した携帯電話の機能と、携帯情報端末(PDA:Personal Digital Assistant)の機能とを融合させた、いわゆる、スマートフォンやタブレット端末などの情報端末が普及している。このような情報端末には、持ち運びしているときなど情報端末の使用者が意図しないのに動作してしまう誤動作の防止や、正当な使用者以外の者が操作してしまう不正使用の防止の機能として、ロック機能が備わっている。そして、ロック機能が動作している状態、すなわち、情報端末にロックがかかっている状態(以下、「ロック状態」という)では、情報端末の主要な機能に対する操作の受け付けや画面表示などの出力が、一部を除いて制限される。
また、近年では、情報端末を操作する方法として、情報端末に備えた操作ボタン(操作キー)やタッチパネルを操作する他に、音声によってコマンドを入力して情報端末を操作する機能を備えた情報端末の普及も進んでいる。しかし、情報端末のロック状態を解除するのに暗証番号を入力する場合には、予め定めた順番で複数回のタッチパネルのタッチ操作を行う必要があり、操作が煩雑であった。
そこで、情報端末のロック状態を解除する方法として、使用者が発する音声を認証することによって、正当な使用者を判定してロックを解除し、その後の入力操作を許容する技術が知られている(例えば、特許文献1)。
しかしながら、従来の情報端末では、音声によって特定のコマンドを入力して操作する機能を備えている場合でも、ロック状態のときには、音声によるコマンドを入力することができない。このため、情報端末の使用者は、ロック状態を解除する操作を行った後に、音声によってコマンドを入力する必要があった。つまり、ロック状態から音声でコマンドを入力する場合には、ロック状態を解除する操作と、音声でコマンドを入力する操作との2つの操作が必要になる。このような2つの操作を情報端末に対して行うことは、時間と労力がかかり、正当な使用者にとって煩雑な操作である。
本発明は、上記の課題に基づいてなされたものであり、音声によって不正使用者の使用の防止と操作とを容易に行えることができる情報端末および情報端末システムを提供することを目的としている。
上記の課題を解決するため、本発明の情報端末は、音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、前記音声データを記憶する記憶部と、前記記憶部に記憶された前記音声データに基づいて処理を行う音声処理部と、を備え、前記音声処理部は、前記音声データが使用者が発した音声であるか否かを判定し、該音声データが使用者が発した音声であると判定した場合に、動作の実行が制限されているロック状態を解除して、該音声データに含まれる前記コマンドに応じた動作を実行する。
また、本発明の情報端末システムは、情報端末とサーバー装置とが通信回線によって接続された情報端末システムであって、前記情報端末は、音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、前記音声データを記憶する第1の記憶部と、前記第1の記憶部に記憶された前記音声データに基づいて処理を行う第1の音声処理部と、前記通信回線を介して前記サーバー装置の間で通信を行う第1の通信部と、前記音声データに含まれる前記コマンドに応じた動作の実行結果を提示する結果提示部と、を具備し、前記サーバー装置は、前記通信回線を介して前記情報端末1との間で通信を行う第2の通信部と、前記音声データを記憶する第2の記憶部と、前記第2の記憶部に記憶された前記音声データに基づいて処理を行う第2の音声処理部と、を具備し、前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、前記音声データが前記情報端末の使用者が発した音声であるか否かを判定し、前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、前記音声データが使用者が発した音声であると判定した場合に、前記情報端末の動作の実行が制限されているロック状態を解除し、前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、前記音声データに含まれる前記コマンドに応じた前記サーバー装置の動作を実行する。
本発明によれば、情報端末および情報端末システムにおいて、音声によって不正使用者の使用の防止と操作とを容易にすることができるとの効果を奏する。
<第1の実施形態>
以下、本発明の実施形態について、図面を参照して説明する。図1は、第1の実施形態における情報端末の概略構成を示したブロック図である。情報端末1は、音声入力部11と、表示部12と、操作ボタン部13と、操作入力部14と、音声出力部15と、通信部16と、処理部17と、記憶部18とを備えている。
以下、本発明の実施形態について、図面を参照して説明する。図1は、第1の実施形態における情報端末の概略構成を示したブロック図である。情報端末1は、音声入力部11と、表示部12と、操作ボタン部13と、操作入力部14と、音声出力部15と、通信部16と、処理部17と、記憶部18とを備えている。
音声入力部11は、例えば、マイクなどの音声入力装置を備え、情報端末1の使用者が発した言葉を音声データ(音声波形を数値で表したデータ(波形データ))に変換して出力する。音声入力部11が変換した音声データは、処理部17が、接続された記憶部18に記憶させる。
表示部12は、例えば、液晶ディスプレイ、有機ELディスプレイなどの表示装置を備え、情報端末1が使用者に情報を提示するため画像を表示する。
操作ボタン部13は、情報端末1の使用者によって操作される少なくとも1つの操作ボタン(例えば、電源オンオフボタン)を備え、使用者の操作に応じた情報端末1への入力を受け付ける。操作ボタン部13は、受け付けた操作を表す情報を出力する。
操作入力部14は、例えば、押圧センサを備え、情報端末1の使用者による各種のタッチ(タップやフリックなど)操作を検出することによって情報端末1への入力を受け付ける。操作入力部14は、受け付けた操作を表す情報を出力する。なお、情報端末1では、操作入力部14と表示部12とは、両者のパネルが組み合わされたタッチパネルとして備えられてもよい。
音声出力部15は、例えば、スピーカーなどの音声出力装置を備え、情報端末1が使用者に提供する情報を音声で出力する。
通信部16は、通信回線を介して、情報端末1が扱う種々の情報の送受信を行う。例えば、情報端末1の電話機能では、移動体通信網を介して音声通話を行い、インターネット機能では、ネットワーク通信網を介してデータ通信を行う。なお、通信回線には、例えば、IEEE(Institute of Electrical and Electronics Engineers)802.11などの無線通信規格、いわゆる、WiFi(登録商標)などの無線通信回線も含む。
表示部12は、例えば、液晶ディスプレイ、有機ELディスプレイなどの表示装置を備え、情報端末1が使用者に情報を提示するため画像を表示する。
操作ボタン部13は、情報端末1の使用者によって操作される少なくとも1つの操作ボタン(例えば、電源オンオフボタン)を備え、使用者の操作に応じた情報端末1への入力を受け付ける。操作ボタン部13は、受け付けた操作を表す情報を出力する。
操作入力部14は、例えば、押圧センサを備え、情報端末1の使用者による各種のタッチ(タップやフリックなど)操作を検出することによって情報端末1への入力を受け付ける。操作入力部14は、受け付けた操作を表す情報を出力する。なお、情報端末1では、操作入力部14と表示部12とは、両者のパネルが組み合わされたタッチパネルとして備えられてもよい。
音声出力部15は、例えば、スピーカーなどの音声出力装置を備え、情報端末1が使用者に提供する情報を音声で出力する。
通信部16は、通信回線を介して、情報端末1が扱う種々の情報の送受信を行う。例えば、情報端末1の電話機能では、移動体通信網を介して音声通話を行い、インターネット機能では、ネットワーク通信網を介してデータ通信を行う。なお、通信回線には、例えば、IEEE(Institute of Electrical and Electronics Engineers)802.11などの無線通信規格、いわゆる、WiFi(登録商標)などの無線通信回線も含む。
処理部17は、情報端末1内のそれぞれの部材を制御することによって、情報端末1の全体を制御する。また、処理部17は、音声入力部11から出力された音声データに含まれるコマンド(以下、「音声コマンド」という。ここでは、例えば、カナで表記した文字列を想定する。)、操作ボタン部13から出力された情報、または操作入力部14から出力された情報に基づいて、情報端末1の使用者によって要求(指示)された動作を実行する。
記憶部18は、処理部17が処理を実行するプログラムや、処理に使用するデータを記憶する。記憶部18は、ROM(Read Only Memory)やRAM(Random Access Memory)などのメモリで構成される。
図1に示した情報端末1の構成では、記憶部18に、音声解析プログラム181、音声特徴データ182、入力音声データ183、および端末動作対応情報184が記憶されている状態を示している。
記憶部18は、処理部17が処理を実行するプログラムや、処理に使用するデータを記憶する。記憶部18は、ROM(Read Only Memory)やRAM(Random Access Memory)などのメモリで構成される。
図1に示した情報端末1の構成では、記憶部18に、音声解析プログラム181、音声特徴データ182、入力音声データ183、および端末動作対応情報184が記憶されている状態を示している。
音声解析プログラム181は、処理部17によって実行されるプログラム本体である。音声解析プログラム181は、音声認証機能(情報端末1の正当な使用者の音声特徴データ182と比較して、正当な使用者であるか否かを判別する機能)と、音声データ(波形データ)を文字列(音声コマンド)に変換する機能とを備えている。処理部17は、音声解析プログラム181を実行することによって、入力された音声データに対して上述した処理などを行う音声処理部としての機能を実現する。
音声特徴データ182は、情報端末1の正当な使用者の音声の特徴を表すデータである。音声特徴データ182は、音声解析プログラム181を実行している処理部17が、例えば、情報端末1を初期設定する際などに正当な使用者が発した言葉を音声入力部11が変換した音声データ(電気信号)から抽出したものである。
入力音声データ183は、情報端末1の使用者が発した言葉を音声入力部11が変換した音声データである。音声解析プログラム181を実行している処理部17は、入力音声データ183から、情報端末1の使用者によって入力された動作、つまり、使用者が要求している動作を指示する音声コマンドを抽出して、情報端末1が音声コマンドに応じた動作を実行するようにする。
端末動作対応情報184は、情報端末1が実行する動作と、この動作を実行するための音声コマンドとが対応付けられた情報である。例えば、「地図を表示」という音声コマンドと、「地図を表示するアプリケーションソフトウェアを起動する」という情報端末1の動作が1対1に対応付けられている。端末動作対応情報184には、このような音声コマンドと情報端末1の動作とを1対1に対応付けた複数の情報が含まれている。処理部17は、情報端末1の使用者が音声によって入力した音声コマンドが、情報端末1のいずれの動作を要求(指示)するコマンドであるかを、端末動作対応情報184を参照して判断する。なお、端末動作対応情報184に含まれる音声コマンドと情報端末1の動作とを対応付けた情報は、情報端末1に予め定められている情報のみではなく、例えば、情報端末1を初期設定する際などに正当な使用者が設定することもできる。
このような構成によって情報端末1は、使用者から入力された音声コマンドに応じた動作を実行する。このとき、情報端末1は、主要な機能の実行を制限するためにロックがかかっている状態(ロック状態)のときにも使用者が音声を入力することができる。そして、情報端末1は、ロック状態のときに使用者から音声コマンドが入力された場合には、まず、入力された音声が正当な使用者が発した音声であるか否かを上述の音声認識処理により判定する。そして、情報端末1は、音声が正当な使用者からの入力である場合に、情報端末1のロック状態を解除し、次に、入力された音声コマンドによって指示された動作を実行する。
次に、第1の実施形態の情報端末1がロック状態のときに入力された音声コマンドに応じた動作を実行する際の処理手順について説明する。図2は、第1の実施形態の情報端末1における処理手順を示したフローチャートである。なお、以下の説明においては、正当な使用者の音声特徴データ182および端末動作対応情報184が、事前に記憶部18に記憶されているものとして説明を行う。
音声入力部11は、情報端末1がロック状態であっても使用者からの音声の入力を受け付ける状態となっている。このとき、使用者が言葉を発して、情報端末1に所望の動作を実行させるための音声コマンドを入力すると、音声入力部11は、使用者が発した言葉を音声データに変換する(ステップS101)。そして、処理部17は、音声入力部11が変換した音声データを、入力音声データ183として記憶部18に記憶させる(ステップS102)。
続いて、処理部17は、記憶部18から音声解析プログラム181を読み出して起動する。そして、音声解析プログラム181を実行している処理部17は、今回入力された入力音声データ183に含まれる音声の特徴と、記憶部18に記憶されている音声特徴データ182に含まれる正当な使用者の音声の特徴とを比較する(ステップS103)。
そして、処理部17は、ステップS103における音声の特徴の比較結果に基づいて、今回入力された入力音声データ183が正当な使用者が発した音声であるか否かを判定する(ステップS104)。このステップS104における判定は、例えば、今回入力された入力音声データ183に含まれる音声の特徴と、音声特徴データ182に含まれる正当な使用者の音声の特徴との類似度に基づいて行う。この場合、処理部17は、音声の特徴の類似度が予め定めた値(閾値)以上である場合に、入力音声データ183が正当な使用者が発した音声であると判定し、音声の特徴の類似度が予め定めた値よりも低い場合に、入力音声データ183が正当な使用者が発した音声ではないと判定する。なお、処理部17による音声の特徴の判定方法、つまり、音声解析プログラム181における音声認識の方法は、上述した方法に限定されるものではなく、既存のいかなる技術を用いてもよい。
ステップS104の判定によって、今回入力された入力音声データ183が正当な使用者が発した音声ではないと判定した場合(ステップS104の“NO”)には、処理部17は、今回入力された入力音声データ183に対する処理を終了する。この際の入力音声データ183は破棄される。一方、ステップS104の判定によって、今回入力された入力音声データ183が正当な使用者が発した音声であると判定した場合には、処理部17は、情報端末1のロック状態を解除する(ステップS105)。
続いて、処理部17は、今回入力された入力音声データ183から音声コマンドを抽出する。そして、処理部17は、記憶部18に記憶されている端末動作対応情報184を参照して、抽出した音声コマンドが情報端末1のいずれかの動作を指示するコマンドであるかを判断する。そして、処理部17は、情報端末1の動作を指示するコマンドであると判断した場合に、抽出した音声コマンドに対応する動作を実行する(ステップS106)。そして、処理部17は、今回入力された入力音声データ183に対する処理を終了する。
このような処理手順によって情報端末1は、第一に、ロック状態のときに入力された入力音声データ183に基づいて、今回入力された音声が正当な使用者が発した音声であるか否かを判定する。そして、情報端末1は、第二に、入力音声データ183が正当な使用者から入力された音声である場合にのみ、ロック状態の解除と、第三に、入力された音声コマンドに対応する動作、すなわち、正当な使用者が目的としている情報端末1の動作とを実行する。第1の実施形態によれば、入力された入力音声データ183をきっかけ(トリガー)として、上述の第一、第二、第三の動作が順次に可能となり、音声によって不正使用者の使用の防止と操作とを容易にすることができるとの効果を奏する。
<第2の実施形態>
次に、本発明における第2の実施形態について説明する。第1の実施形態の情報端末1では、入力音声データ183を、上述した第一、第二、第三の動作のために利用した。しかし、入力音声データ183は、第一と第二の動作のためにのみ用いることもできる。あるいは、第一と第三の動作のためにのみ用いることもできる。
次に、本発明における第2の実施形態について説明する。第1の実施形態の情報端末1では、入力音声データ183を、上述した第一、第二、第三の動作のために利用した。しかし、入力音声データ183は、第一と第二の動作のためにのみ用いることもできる。あるいは、第一と第三の動作のためにのみ用いることもできる。
第2の実施形態の情報端末の構成は、図1に示した第1の実施形態の情報端末1の構成と同様である。また、処理のフローも図2に示したフローチャートと同様である。しかし、入力音声データ183を第一と第二の動作のためにのみ用いる場合は、ステップS106の実行はされない点のみが異なる。また、入力音声データ183を第一と第三の動作のためにのみ用いる場合は、ステップS105の実行はされない点のみが異なる。
<第3の実施形態>
次に、本発明における第3の実施形態について説明する。第1の実施形態および第2の実施形態では、音声コマンドに対応する動作を情報端末1で実行する場合を説明した。しかし、音声コマンドは、情報端末1を動作させるためだけではなく、例えば、情報端末1と通信するサーバー装置を動作させる、つまり、情報端末1を備えたシステムを動作させることもできる。
次に、本発明における第3の実施形態について説明する。第1の実施形態および第2の実施形態では、音声コマンドに対応する動作を情報端末1で実行する場合を説明した。しかし、音声コマンドは、情報端末1を動作させるためだけではなく、例えば、情報端末1と通信するサーバー装置を動作させる、つまり、情報端末1を備えたシステムを動作させることもできる。
図3は、第3の実施形態における情報端末システムの概略構成を示したブロック図である。情報端末システム10は、情報端末1とサーバー装置2とが、通信回線3を介して接続された構成である。図3に示した情報端末システム10は、第1の実施形態の情報端末1がシステム内に構成された場合の一例である。なお、第2の実施形態の情報端末1が通信回線3を介してサーバー装置2と接続された構成であっても、同様の動作をする。
情報端末1の構成は、図1に示した第1の実施形態の情報端末1と同様である。従って、情報端末1の構成に関する詳細な説明は省略する。
通信回線3は、情報端末1とサーバー装置2とがデータ通信を行うためのネットワーク通信網であり、例えばインターネットである。なお、通信回線3は、音声通話を行う移動体通信網を利用してデータ通信を行う構成であってもよい。
サーバー装置2は、通信部21と、処理部22と、記憶装置23とを備えている。
通信回線3は、情報端末1とサーバー装置2とがデータ通信を行うためのネットワーク通信網であり、例えばインターネットである。なお、通信回線3は、音声通話を行う移動体通信網を利用してデータ通信を行う構成であってもよい。
サーバー装置2は、通信部21と、処理部22と、記憶装置23とを備えている。
通信部21は、通信回線3を介して、情報端末1に備えた通信部16との間で通信を行い、情報端末システム10における種々の情報やデータの送受信を行う。
処理部22は、サーバー装置2内のそれぞれの構成要素を制御することによって、サーバー装置2の全体を制御する。また、処理部22は、情報端末1の使用者が音声入力部11、操作ボタン部13、または操作入力部14によって入力した要求(指示)に応じた動作を実行し、その結果を通信部21および通信回線3を介して情報端末1に送信する。
記憶装置23は、処理部22が処理を実行するプログラムや、処理に使用するデータを記憶する。記憶装置23は、ハードディスクドライブなどの補助記憶装置や、ROM、RAMなどのメモリで構成される。記憶装置23には、情報端末1に備えた記憶部18が記憶している音声解析プログラム181、入力音声データ183、および端末動作対応情報184に相当するプログラム(不図示)やデータ(不図示)が記憶されている。以下の説明においては、音声解析プログラム181に相当するプログラムを音声解析プログラム231といい、入力音声データ183に相当するデータを入力音声データ233といい、端末動作対応情報184に相当する情報をサーバー動作対応情報234という。
処理部22は、サーバー装置2内のそれぞれの構成要素を制御することによって、サーバー装置2の全体を制御する。また、処理部22は、情報端末1の使用者が音声入力部11、操作ボタン部13、または操作入力部14によって入力した要求(指示)に応じた動作を実行し、その結果を通信部21および通信回線3を介して情報端末1に送信する。
記憶装置23は、処理部22が処理を実行するプログラムや、処理に使用するデータを記憶する。記憶装置23は、ハードディスクドライブなどの補助記憶装置や、ROM、RAMなどのメモリで構成される。記憶装置23には、情報端末1に備えた記憶部18が記憶している音声解析プログラム181、入力音声データ183、および端末動作対応情報184に相当するプログラム(不図示)やデータ(不図示)が記憶されている。以下の説明においては、音声解析プログラム181に相当するプログラムを音声解析プログラム231といい、入力音声データ183に相当するデータを入力音声データ233といい、端末動作対応情報184に相当する情報をサーバー動作対応情報234という。
音声解析プログラム231は、処理部22によって実行されるプログラム本体である。音声解析プログラム231は、音声認証機能(情報端末1の正当な使用者の音声特徴データ182と比較して、正当な使用者であるか否かを判別する機能)と、音声データ(波形データ)を文字列(音声コマンド)に変換する機能とを備えている。処理部22は、音声解析プログラム231を実行することによって、通信回線3を介して情報端末1から送信されてきた音声データに対して上述した処理などを行う音声処理部としての機能を実現する。
入力音声データ233は、情報端末1に入力された入力音声データ183が、通信回線3を介して送信されてきた音声データである。音声解析プログラム231を実行している処理部22は、入力音声データ233から、情報端末1の使用者によって入力されたサーバー装置2の動作、つまり、使用者が要求しているサーバー装置2の動作を指示する音声コマンドを抽出し、抽出した音声コマンドに応じた動作を実行する。
サーバー動作対応情報234は、サーバー装置2が実行する動作と、この動作を実行するための音声コマンドとが1対1に対応付けられた複数の情報である。処理部22は、通信回線3を介して情報端末1から送信されてきた音声コマンドが、サーバー装置2のいずれの動作を要求(指示)するコマンドであるかを、サーバー動作対応情報234を参照して判断する。なお、サーバー動作対応情報234に含まれる音声コマンドとサーバー装置2の動作とを対応付けた情報は、サーバー装置2や情報端末1に予め定められている情報のみではなく、例えば、情報端末1を含んだ情報端末システム10を構成する際に、情報端末1の正当な使用者が設定することもできる。
このような構成によって情報端末システム10は、情報端末1の使用者から入力された音声コマンドをサーバー装置2に送信し、サーバー装置2が音声コマンドに応じた動作を実行する。このとき、情報端末1は、ロック状態のときにも使用者が音声を入力することができる。そして、情報端末1は、ロック状態のときに使用者から音声コマンドが入力された場合には、まず、第1の実施形態と同様に、入力された音声が正当な使用者が発した音声であるか否かを判定する。そして、情報端末1は、音声が正当な使用者からの入力である場合にロック状態を解除し、入力音声データ183を、通信回線3を介してサーバー装置2に送信する。そして、サーバー装置2は、送信されてきた入力音声データ183から音声コマンドを抽出して動作を実行し、その結果を、通信回線3を介して情報端末1に送信する。これにより情報端末1は、送信されてきた結果を、正当な使用者に提示する。
次に、情報端末1がロック状態であるときに入力された音声コマンドに応じた動作を実行する際の処理手順について説明する。図4は、第3の実施形態の情報端末システム10における処理手順を示したフローチャートである。なお、以下の説明においては、正当な使用者の音声特徴データ182および端末動作対応情報184が事前に情報端末1に備えた記憶部18に記憶され、サーバー動作対応情報234が事前にサーバー装置2に備えた記憶装置23に記憶されているものとして説明を行う。
図4に示した情報端末システム10の処理手順には、図2に示した第1の実施形態の情報端末1における処理と同じ処理手順が含まれている。このため、図4に示したフローチャートにおける同じ処理手順には、図2のフローチャートに付与したステップ番号と同一のステップ番号を付与している。より具体的には、図4に示した情報端末システム10の処理におけるステップS101〜ステップS105までの処理は、第1の実施形態の情報端末1がロック状態を解除するまでの処理と同じであるため、同一のステップ番号を付与している。従って、図4に示した情報端末システム10のフローチャートの説明においては、情報端末1がロック状態を解除するまでの処理に関する詳細な説明は省略する。
ステップS105においてロック状態を解除した後、音声解析プログラム181を実行している処理部17は、通信部16によって、記憶部18に記憶されている入力音声データ183をそのまま通信回線3を介してサーバー装置2に送信する(ステップS206)。つまり、処理部17は、入力音声データ183から音声コマンドを抽出せずにサーバー装置2に送信する。これにより、サーバー装置2に備えた通信部21は、通信回線3を介して送信されてきた入力音声データ183を受信し、処理部22は、通信部21が受信した入力音声データ183を入力音声データ233として記憶装置23に記憶させる。
続いて、処理部22は、記憶装置23から音声解析プログラム231を読み出して起動する。そして、音声解析プログラム231を実行している処理部22は、今回送信された入力音声データ233から音声コマンドを抽出する。その後、処理部22は、記憶装置23に記憶されているサーバー動作対応情報234を参照して、抽出した音声コマンドがサーバー装置2のいずれかの動作を指示するコマンドであるかを判断する。そして、処理部22は、サーバー装置2の動作を指示するコマンドであると判断した場合に、抽出した音声コマンドに対応する動作を実行する(ステップS207)。
続いて、処理部22は、抽出した音声コマンドを実行した結果のデータ(以下、「応答データ」という)生成する。そして、処理部22は、生成した応答データを、通信部21によって通信回線3を介して情報端末1に送信する(ステップS208)。例えば、今回送信されてきた入力音声データ233から抽出した音声コマンドが「東京の明日の天気はいかが」という音声コマンドである場合、ステップS207において、処理部22は、サーバー装置2内に格納されている天気に関するデータや、サーバー装置2に接続されている他のサーバー装置に格納されているデータを参照するなどして、「東京の明日の天気」を調査する。そして、ステップS208において、処理部22は、調査した「東京の明日の天気」を表す音声のデータ(例えば、「晴れのち曇りです」と発声する音声のデータ)や画像のデータ(例えば、「晴れのち曇り」を表す天気記号の画像のデータ)を応答データとして生成して、情報端末1に送信する。これにより、情報端末1に備えた通信部16は、通信回線3を介して送信されてきた応答データを受信し、処理部17は、通信部16が受信した応答データを記憶部18に記憶させる。また、処理部22は、今回送信されてきた入力音声データ233に対する処理を終了する。
続いて、処理部17は、記憶部18に記憶した応答データを出力して、音声コマンドに対する応答を情報端末1の使用者に提示する(ステップS209)。例えば、応答データが音声のデータである場合には、応答データを音声出力部15に出力し、入力された音声コマンドに対する応答を音声出力部15から発せられる音声によって提示する。また、例えば、応答データが画像のデータである場合には、応答データを表示部12に出力し、入力された音声コマンドに対する応答を表示部12に表示される画像によって提示する。そして、処理部17は、今回入力された入力音声データ183に対する処理を終了する。
このような処理手順によって情報端末システム10では、情報端末1が、ロック状態のときに入力された入力音声データ183に基づいて、今回入力された音声が正当な使用者が発した音声であるか否かを判定する。そして、情報端末1は、入力音声データ183が正当な使用者から入力された音声である場合にのみ、ロック状態を解除して入力音声データ183サーバー装置2に送信する。そして、情報端末システム10では、サーバー装置2が、受信した入力音声データ183(入力音声データ233)に含まれる音声コマンドに対応する動作、すなわち、正当な使用者が目的としているサーバー装置2の動作を実行して、その実行結果である応答データを情報端末1に送信(返信)する。これにより、情報端末1は、入力された音声コマンドに応じた結果を、それが外部の情報を参照する必要がある高度な内容のものであっても、正当な使用者に提示することができる。
<第4の実施形態>
次に、本発明における第4の実施形態について説明する。第3の実施形態の情報端末システム10では、情報端末1が、使用者から入力された入力音声データ183が正当な使用者が発した音声であるか否かを判定する構成について説明した。しかし、入力音声データ183が正当な使用者が発した音声であるか否かの判定も、サーバー装置2が行う構成にすることもできる。
次に、本発明における第4の実施形態について説明する。第3の実施形態の情報端末システム10では、情報端末1が、使用者から入力された入力音声データ183が正当な使用者が発した音声であるか否かを判定する構成について説明した。しかし、入力音声データ183が正当な使用者が発した音声であるか否かの判定も、サーバー装置2が行う構成にすることもできる。
第4の実施形態の情報端末システムの構成は、図3に示した第3の実施形態の情報端末システム10の構成と同様である。従って、第4の実施形態の情報端末システムも情報端末システム10とし、図3に示した構成を用いて、第3の実施形態の情報端末システム10と異なる動作について説明する。
第4の実施形態の情報端末システム10においては、情報端末1に備えた記憶部18が記憶している音声特徴データ182に相当するデータ(不図示)も、サーバー装置2に備えた記憶装置23に記憶している。以下の説明においては、音声特徴データ182に相当するデータを音声特徴データ232という。
音声特徴データ232は、情報端末1の正当な使用者の音声の特徴を表す音声特徴データ182と同じデータである。音声特徴データ232は、例えば、情報端末1を含んだ情報端末システム10が構成される際に、通信回線3を介して情報端末1から送信される。なお、音声特徴データ232は、音声解析プログラム231を実行している処理部22が、通信回線3を介して情報端末1から送信されてきた正当な使用者の音声データから抽出して記憶装置23に記憶させることもできる。
情報端末システム10における処理手順は、正当な使用者を判定する処理と、情報端末1のロック状態を解除する処理をサーバー装置2が行うこと以外は、図4に示した情報端末システム10の処理におけるステップS101〜ステップS105までの処理と同様である。より具体的には、情報端末システム10では、正当な使用者の判定を音声特徴データ232に含まれる音声の特徴と比較することによって行い、今回送信された入力音声データ233が正当な使用者が発した音声であると判定した場合に、情報端末1のロック状態を解除することを表す指示を情報端末1に送信することによって、情報端末1のロック状態を解除する。
このように、サーバー装置2が正当な使用者が発した音声であるか否かの判定を行う構成であっても、第3の実施形態と同様に、入力音声データ233(入力音声データ183)が正当な使用者から入力された音声である場合にのみ、情報端末1のロック状態を解除することができる。そして、第3の実施形態と同様に、情報端末1が、サーバー装置2が動作を実行した結果を正当な使用者に提示することができる。
<変形例>
第4の実施形態の情報端末システム10においては、記憶部18が記憶している音声特徴データ182に相当するデータもサーバー装置2に備えた記憶装置23に記憶している。このため、第4の実施形態の情報端末システム10は、情報端末1の記憶部18に、音声解析プログラム181および音声特徴データ182を記憶させない構成であってもよい。
第4の実施形態の情報端末システム10においては、記憶部18が記憶している音声特徴データ182に相当するデータもサーバー装置2に備えた記憶装置23に記憶している。このため、第4の実施形態の情報端末システム10は、情報端末1の記憶部18に、音声解析プログラム181および音声特徴データ182を記憶させない構成であってもよい。
<変形例>
第3および第4の実施形態の情報端末システム10においては、情報端末1に音声で入力されたコマンドに対応する動作をサーバー装置2が実行する場合について説明したが、入力されたコマンドに対応する動作は、情報端末1とサーバー装置2とが分担して実行してもよい。また、第3および第4の実施形態の情報端末システム10においては、情報端末1とサーバー装置2とのそれぞれが同様の機能を実行することができる構成であった、つまり、情報端末1とサーバー装置2とで重複する機能を備えていた。しかし、情報端末1とサーバー装置2とのいずれか一方、または情報端末1とサーバー装置2とが分担して入力されたコマンドに対応する動作を実行するように、情報端末1とサーバー装置2とに備える機能を重複させない、つまり、重複する機能は情報端末1とサーバー装置2とのそれぞれに備えない構成であってもよい。
第3および第4の実施形態の情報端末システム10においては、情報端末1に音声で入力されたコマンドに対応する動作をサーバー装置2が実行する場合について説明したが、入力されたコマンドに対応する動作は、情報端末1とサーバー装置2とが分担して実行してもよい。また、第3および第4の実施形態の情報端末システム10においては、情報端末1とサーバー装置2とのそれぞれが同様の機能を実行することができる構成であった、つまり、情報端末1とサーバー装置2とで重複する機能を備えていた。しかし、情報端末1とサーバー装置2とのいずれか一方、または情報端末1とサーバー装置2とが分担して入力されたコマンドに対応する動作を実行するように、情報端末1とサーバー装置2とに備える機能を重複させない、つまり、重複する機能は情報端末1とサーバー装置2とのそれぞれに備えない構成であってもよい。
上記に述べたとおり、本発明を実施するための形態によれば、情報端末がロック状態のときに使用者が発した言葉を音声データに変換して一旦記憶する。そして、本発明を実施するための形態では、変換した音声データに基づいて、言葉を発した使用者が正当な使用者であるか否かを判定し、入力された音声データが正当な使用者が発した音声を変換した音声データである場合にのみ、情報端末のロック状態を解除する。そして、本発明を実施するための形態では、ロック状態の解除に用いた音声データに含まれるコマンドに対応する動作を実行し、その結果を正当な使用者に提示する。このように、本発明を実施するための形態では、音声データを、正当な使用者を判定する材料、情報端末のロック状態を解除する契機、および指示された動作の実行との3種類の用途に使用する。これにより、本発明を実施するための形態では、情報端末にロックがかかっている状態であっても音声によってコマンドを入力することによって、情報端末の使用者は、容易に情報端末を操作することができる。このことにより、情報端末の使用者は、情報端末を操作する際に要する時間を短縮し、情報端末を操作するための労力を軽減することができる。
以上、本発明の実施形態について、図面を参照して説明してきたが、具体的な構成はこの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲においての種々の変更も含まれる。
本発明は、携帯電話、スマートフォン、タブレット端末、ウェアラブル端末などの情報端末装置において実施することができる。
1・・・情報端末、11・・・音声入力部、12・・・表示部(結果提示部)、13・・・操作ボタン部、14・・・操作入力部、15・・・音声出力部(結果提示部)、16・・・通信部(第1の通信部)、17・・・処理部(音声処理部,第1の音声処理部)、18・・・記憶部(記憶部,第1の記憶部)、181・・・音声解析プログラム、182・・・音声特徴データ、183・・・入力音声データ(音声データ)、184・・・端末動作対応情報(動作対応情報)、10・・・情報端末システム、2・・・サーバー装置、21・・・通信部(第2の通信部)、22・・・処理部(第2の音声処理部)、23・・・記憶装置(第2の記憶部)、3・・・通信回線
Claims (5)
- 音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、
前記音声データを記憶する記憶部と、
前記記憶部に記憶された前記音声データに基づいて処理を行う音声処理部と、
を備え、
前記音声処理部は、
前記音声データが使用者が発した音声であるか否かを判定し、該音声データが使用者が発した音声であると判定した場合に、動作の実行が制限されているロック状態を解除して、該音声データに含まれる前記コマンドに応じた動作を実行する、
情報端末。 - 前記記憶部は、
使用者の音声の特徴を表す音声特徴データと、
前記コマンドと該コマンドに応じて動作する当該情報端末の動作とを対応付けた動作対応情報と、
を記憶し、
前記音声処理部は、
前記音声データに含まれる音声の特徴と、前記音声特徴データとを比較することによって該音声データが使用者が発した音声であるか否かを判定し、
前記音声データから抽出したコマンドが前記動作対応情報に含まれる場合に、該抽出したコマンドに応じた動作を実行する、
請求項1に記載の情報端末。 - 情報端末とサーバー装置とが通信回線によって接続された情報端末システムであって、
前記情報端末は、
音声によって入力されたコマンドを音声データに変換して出力する音声入力部と、
前記音声データを記憶する第1の記憶部と、
前記第1の記憶部に記憶された前記音声データに基づいて処理を行う第1の音声処理部と、
前記通信回線を介して前記サーバー装置の間で通信を行う第1の通信部と、
前記音声データに含まれる前記コマンドに応じた動作の実行結果を提示する結果提示部と、
を具備し、
前記サーバー装置は、
前記通信回線を介して前記情報端末1との間で通信を行う第2の通信部と、
前記音声データを記憶する第2の記憶部と、
前記第2の記憶部に記憶された前記音声データに基づいて処理を行う第2の音声処理部と、
を具備し、
前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、
前記音声データが前記情報端末の使用者が発した音声であるか否かを判定し、
前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、
前記音声データが使用者が発した音声であると判定した場合に、前記情報端末の動作の実行が制限されているロック状態を解除し、
前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、
前記音声データに含まれる前記コマンドに応じた前記サーバー装置の動作を実行する、
情報端末システム。 - 前記第1の音声処理部は、
前記音声データが前記情報端末の使用者が発した音声であるか否かを判定し、該音声データが使用者が発した音声であると判定した場合に、当該情報端末の動作の実行が制限されているロック状態を解除して、該音声データを前記第1の通信部によって前記サーバー装置に送信し、
前記第2の音声処理部は、
前記第2の通信部が受信した前記音声データに含まれる前記コマンドに応じた前記サーバー装置の動作を実行し、該実行した結果を表す応答データを前記第2の通信部によって前記情報端末に送信し、
前記結果提示部は、
前記第1の通信部が受信した前記応答データを、前記情報端末の使用者に提示する、
請求項3に記載の情報端末システム。 - 少なくとも前記第1の記憶部または前記第2の記憶部のいずれか一方に、
使用者の音声の特徴を表す音声特徴データと、
前記コマンドと該コマンドに応じて動作する当該情報端末を含む情報端末システムの動作とを対応付けた動作対応情報と、
を記憶し、
前記音声特徴データを記憶した前記第1の記憶部または前記第2の記憶部に対応する 前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、
前記音声データに含まれる音声の特徴と、前記音声特徴データとを比較することによって該音声データが前記情報端末の使用者が発した音声であるか否かを判定し、
前記動作対応情報を記憶した前記第1の記憶部または前記第2の記憶部に対応する 前記第1の音声処理部または前記第2の音声処理部のいずれか一方が、
前記音声データから抽出したコマンドが前記動作対応情報に含まれる場合に、該抽出したコマンドに応じた動作を実行する、
請求項4に記載の情報端末システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182231A JP2016058816A (ja) | 2014-09-08 | 2014-09-08 | 情報端末および情報端末システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014182231A JP2016058816A (ja) | 2014-09-08 | 2014-09-08 | 情報端末および情報端末システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016058816A true JP2016058816A (ja) | 2016-04-21 |
Family
ID=55758971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014182231A Pending JP2016058816A (ja) | 2014-09-08 | 2014-09-08 | 情報端末および情報端末システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016058816A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018074366A (ja) * | 2016-10-28 | 2018-05-10 | 京セラ株式会社 | 電子機器、制御方法およびプログラム |
CN108509119A (zh) * | 2017-02-28 | 2018-09-07 | 三星电子株式会社 | 用于功能执行的电子设备的操作方法和支持其的电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086356A (ja) * | 2002-08-23 | 2004-03-18 | Fujitsu Ten Ltd | 認証方法および認証装置 |
JP2014517366A (ja) * | 2011-03-21 | 2014-07-17 | アップル インコーポレイテッド | 音声認証を用いたデバイスアクセス |
-
2014
- 2014-09-08 JP JP2014182231A patent/JP2016058816A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086356A (ja) * | 2002-08-23 | 2004-03-18 | Fujitsu Ten Ltd | 認証方法および認証装置 |
JP2014517366A (ja) * | 2011-03-21 | 2014-07-17 | アップル インコーポレイテッド | 音声認証を用いたデバイスアクセス |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018074366A (ja) * | 2016-10-28 | 2018-05-10 | 京セラ株式会社 | 電子機器、制御方法およびプログラム |
CN108509119A (zh) * | 2017-02-28 | 2018-09-07 | 三星电子株式会社 | 用于功能执行的电子设备的操作方法和支持其的电子设备 |
CN108509119B (zh) * | 2017-02-28 | 2023-06-02 | 三星电子株式会社 | 用于功能执行的电子设备的操作方法和支持其的电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102246900B1 (ko) | 전자 장치 및 이의 음성 인식 방법 | |
KR102245747B1 (ko) | 사용자 명령어 등록을 위한 디스플레이 장치 및 방법 | |
KR101412764B1 (ko) | 대안적 잠금 해제 패턴 | |
US8543397B1 (en) | Mobile device voice activation | |
US10134392B2 (en) | Terminal, unlocking method, and program | |
JP2018074366A (ja) | 電子機器、制御方法およびプログラム | |
CN107832036B (zh) | 语音控制方法、装置及计算机可读存储介质 | |
KR101295711B1 (ko) | 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법 | |
US20130297318A1 (en) | Speech recognition systems and methods | |
CN106406867B (zh) | 一种基于android系统的读屏方法及装置 | |
KR20160014297A (ko) | 전자 장치 및 이의 제어 방법 | |
CN105577375B (zh) | 身份验证方法及装置 | |
WO2016188456A1 (zh) | 一种截屏的方法、装置及移动终端 | |
WO2016104766A1 (ja) | タッチスクリーン付情報処理端末および情報処理方法 | |
WO2016192258A1 (zh) | 语音使用的提示方法以及终端设备 | |
JP6383409B2 (ja) | 案内装置、案内方法、プログラム及び情報記憶媒体 | |
WO2022135323A1 (zh) | 图像生成方法、装置和电子设备 | |
KR20140003035A (ko) | 상황 인지를 이용한 단말의 제어 방법 및 그 단말 | |
JP2016058816A (ja) | 情報端末および情報端末システム | |
JP2007041089A (ja) | 情報端末および音声認識プログラム | |
KR20190072898A (ko) | 전자 장치, 전자 시스템 및 그 제어 방법 | |
US20140062653A1 (en) | Lock releasing method of electronic device, and apparatus thereof | |
WO2017032027A1 (zh) | 一种视频画面缩放方法及终端设备 | |
CN109697345B (zh) | 一种数据销毁方法及移动终端 | |
WO2017000343A1 (zh) | 一种指纹解锁的方法及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180911 |