JP6792654B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP6792654B2 JP6792654B2 JP2019025626A JP2019025626A JP6792654B2 JP 6792654 B2 JP6792654 B2 JP 6792654B2 JP 2019025626 A JP2019025626 A JP 2019025626A JP 2019025626 A JP2019025626 A JP 2019025626A JP 6792654 B2 JP6792654 B2 JP 6792654B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- application
- execution
- voice
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 63
- 238000003672 processing method Methods 0.000 title claims description 5
- 230000006870 function Effects 0.000 claims description 141
- 238000000034 method Methods 0.000 claims description 75
- 230000004913 activation Effects 0.000 claims description 42
- 230000004044 response Effects 0.000 claims description 3
- 101100055496 Arabidopsis thaliana APP2 gene Proteins 0.000 description 30
- 101100016250 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GYL1 gene Proteins 0.000 description 30
- 101150053844 APP1 gene Proteins 0.000 description 28
- 101100189105 Homo sapiens PABPC4 gene Proteins 0.000 description 28
- 102100039424 Polyadenylate-binding protein 4 Human genes 0.000 description 28
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 102100038359 Xaa-Pro aminopeptidase 3 Human genes 0.000 description 1
- 101710081949 Xaa-Pro aminopeptidase 3 Proteins 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
Images
Landscapes
- Stored Programmes (AREA)
Description
(第1の実施形態)
まず、本発明の第1の実施形態に係る情報処理装置1の概要について説明する。
情報処理装置1は、ユーザが発話した音声を受音し、受音した音声の発話内容に応じた機能を実現する。情報処理装置1には、予め設定された複数の音声コマンド(VC:Voice Command)のうち、入力された音声で指示される音声コマンドを特定し、特定した音声コマンドで指示される処理を実行する。音声コマンドグループは、システムコマンドグループと2個以上のアプリコマンドグループを含む。システムコマンドグループは、1個以上のシステムコマンドを含む。システムコマンドは、情報処理装置1に実装されるシステムの機能を制御するための音声コマンドである。個々のアプリコマンドグループは、アプリごとに設定され、それぞれ1個以上のアプリコマンドを含む。アプリコマンドは、個々のアプリの機能を制御するための音声コマンドである。
システムコマンドには、個々のアプリの実行開始を示すアプリ開始コマンドが含まれる。情報処理装置1は、アプリ開始コマンドで指示されたアプリの実行中において、当該アプリに対するアプリコマンドを有効にし、他のアプリに対するアプリコマンドを無効にする。情報処理装置1は、各時点において1つの実行中のアプリに対する音声コマンドを有効にし、その他の音声コマンドを無効にする。よって、音声により操作可能とするアプリは、アプリ開始コマンドで指示された1つのアプリに限定され、他のアプリの動作には及ばない(図4参照)。
情報処理装置1は、システムデバイスと、周辺デバイスと、を含んで構成される。情報処理装置1は、システムデバイスには、CPU(Central Processing Unit)11、システムメモリ13、GPU(Graphics Processing Unit)15、およびI/O(Input Output)コントローラ21、が含まれる。
GPU15には、ディスプレイ17とI/Oコントローラ21が接続されている。
I/Oコントローラ21には、CPU11、GPU15、オーディオデバイス23、通信モジュール25、HDD(Hard Disk Drive)27、およびEC(Embedded Controller;エンベデッドコントローラ)31が接続されている。オーディオデバイス23には、マイクロホンが含まれる。
EC31は、プロセッサ、記憶媒体、およびプログラマブルロジック回路を含んで構成されるマイクロコンピュータである。プロセッサとして、例えば、CPU11とは別個のCPUが含まれる。記憶媒体として、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)が含まれる。EC31は、CPU11とは独立に動作する。
EC31には、入力デバイス33が接続されている。入力デバイス33は、ユーザの操作を受け付け、受け付けた操作に応じた操作信号をEC31に出力する。入力デバイス33には、例えば、キーボード、マウス、タッチセンサなどのいずれか、またはそれらの任意の組み合わせが含まれる。
制御部100は、音声入力部102、発話情報要求部104、コマンド特定部112、およびコマンド実行部114を含んで構成される。
記憶部120は、コマンド記憶部122を含んで構成される。
CPU11は、所定のプログラムを実行し、情報処理装置1が有するハードウェア資源と協働して上記各部の機能を提供する。CPU11は、例えば、オーディオデバイスドライバを実行し、マイクロホンMICと協働して音声入力部102の機能を提供する。CPU11は、通信モジュールドライバを実行し、通信モジュールと協働して発話情報要求部104の機能を提供する。CPU11は、例えば、OS上で所定のアプリを実行して、コマンド特定部112、コマンド実行部114およびコマンド記憶部122の機能を提供する。CPU11は、OSを実行し、各アプリで共通して利用される基本的な機能を提供する。つまり、「OS上でアプリを実行する」とは、そのOSの実行により、アプリに対してインタフェースとリソースを提供し、提供されたインタフェースとリソースを用いてそのアプリを実行することを意味する。
発話情報要求部104は、音声入力部102から入力される音声データで表される発話内容を示す発話情報を音声認識部ASR(後述)に要求する。発話情報要求部104は、通信モジュール25を用い、ネットワークを経由して音声認識部ASRに送信する。
音声認識処理として、既存の手法が利用可能である。音声認識処理は、例えば、発話がなされている発話区間の特定、発話区間から発話された発音を示す音韻列の特定、音韻列から発話内容を示す語句の特定、などの処理を含む。
コマンド特定部112は、コマンド実行部114が実行を終了させたアプリを特定する。コマンド特定部112は、コマンド記憶部122に記憶された音声コマンドグループのうち、実行を終了させたアプリのアプリコマンドを無効と判定し、システムコマンドを有効と判定する。なお、コマンド特定部112には、電源投入直後いずれのアプリも実行を開始していない状況において、初期設定としてシステムコマンドを有効と設定しておく。
コマンド実行部114が実行を開始させたアプリが存在しない場合、またはコマンド実行部114が実行を開始させたアプリであって、実行中のアプリが存在しない場合には、コマンド特定部112は、いずれのアプリのアプリコマンドを無効と判定し、システムコマンドを有効と判定する。
入力される音声コマンド情報がアプリの実行開始を示すアプリ開始コマンドを示す場合、コマンド実行部114は、そのアプリのOS上での実行開始をCPU11に指示する。より具体的には、コマンド実行部114は、実行を開始(起動)させるアプリについて、実行中のOSのCreateProcess関数を呼び出す。CreateProcess関数は、アプリを実行するプロセスの生成を指示するため関数である。図3に例示されるように、アプリ開始コマンドがアプリAPP1の実行を示すとき、コマンド実行部114はOSにアプリAPP1の実行を指示する。コマンド実行部114は、アプリの起動完了を示す起動完了情報がOSから返り値として入力されるとき、実行を開始させたアプリを示す音声起動アプリ情報を生成し、生成した音声起動アプリ情報を記憶部120に記憶する。
よって、コマンド特定部112は、記憶部120に記憶された音声起動アプリ情報を参照して、コマンド実行部114が実行を開始させた実行中のアプリを特定することができる。
なお、音声認識部ASRは、発話情報に基づいて音声コマンドを特定できない場合であっても、そのまま新たな発話情報を待ち受ければよい。
次に、本実施形態に係る情報処理装置1の動作例について説明する。図4は、本実施形態に係る情報処理装置1の動作例を示す説明図である。図4は、上段に音声コマンドの種別ごとの有効期間と、下段にユーザの発話により指示される音声コマンドを示す。左右方向は、時刻を示す。また、×印は、無効な音声コマンドを示す。
まず、ユーザの発話によりアプリAPP1の実行開始(起動指示)を示すアプリ開始コマンドが指示されるとき、コマンド特定部112は、音声認識部ASRからの発話情報から、システムコマンドのうちアプリAPP1のアプリ開始コマンドを特定する。このとき、コマンド実行部114は、アプリAPP1の実行を開始させる。コマンド特定部112は、アプリAPP1のアプリコマンドを有効とし、システムコマンドを無効とする。よって、アプリAPP1のアプリコマンド(つまり、APP1のVC)の有効期間T1が開始される。有効期間T1内では、コマンド特定部112は、音声認識部ASRからの発話情報から、アプリAPP1のアプリコマンドのいずれかを特定することができ、その他のアプリのアプリコマンドまたはシステムコマンドを特定することはできない。例えば、コマンド特定部112は、アプリAPP1のアプリコマンドのうち、ユーザの発話により指示されるアプリコマンドVC11、VC12、VC13をそれぞれ認識することができる。コマンド実行部114は、コマンド特定部112が認識したアプリAPP1のアプリコマンドVC11、VC12、VC13で指示される処理を実行する。他方、コマンド特定部112は、アプリAPP2のアプリコマンド、例えば、アプリコマンドVC22を認識することはできない。そのため、アプリAPP2のアプリコマンドVC22で指示される処理は実行されない。
次に、音声コマンドの例について説明する。
図5は、本実施形態に係るシステムコマンドの例を示す図である。図5の各行は、システムコマンドごとに指示される機能を示す。第1行の「Open…」は、アプリ…の実行開始を示すアプリ開始コマンドである。第3行の「Shutdown」は、システムのシャットダウンを示す。
図7は、本実施形態に係るアプリコマンドの第2例を示す図である。図7は、プレゼンテーション用アプリAPP2に対する操作に係るアプリコマンド2を各行に例示する。第1行の「Start Presentation」は、プレゼンテーション機能の開始を示すアプリコマンドである。第8行の「Finish APP2」は、アプリAPP2の実行終了を示すアプリ終了コマンドである。
このように、アプリごとのアプリコマンドグループには、それぞれのアプリのアプリ終了コマンドが含まれる。アプリの実行中においては、そのアプリのアプリコマンドだけが有効となるが、アプリコマンドにそのアプリのアプリ終了コマンドを含めることで実行終了を音声で指示する契機が確保される。
従って、コマンドリストを視認したユーザは、その時点で有効な音声コマンドを把握することができる。そのため、無効な音声コマンドの発話を回避することができる。
次に、本実施形態に係る音声操作処理の例について説明する。
図8は、本実施形態に係る音声操作処理の一例を示すフローチャートである。
(ステップS102)コマンド特定部112は、音声認識部ASR(音声認識エンジン)から発話情報を取得する。その後、ステップS104の処理に進む。
(ステップS104)コマンド特定部112は、その時点でアプリコマンドが有効であるとき(ステップS104 YES)、ステップS116の処理に進む。アプリコマンドが無効であるとき(ステップS104 NO)、ステップS106の処理に進む。なお、コマンド特定部112には、初期設定として、有効なシステムコマンドであり、いずれのアプリのアプリコマンドが無効であることを設定させておく。
(ステップS110)コマンド実行部114は、コマンド特定部112が特定した他のシステムコマンドを実行する。その後、ステップS102の処理に戻る。
(ステップS114)コマンド特定部112は、特定したアプリ開始コマンドで指示されるアプリのアプリコマンドを有効にし、システムコマンドを無効にする。その後、ステップS102の処理に戻る。
(ステップS120)コマンド実行部114は、コマンド特定部112が特定したアプリ終了コマンドで指示されるアプリの実行を終了する。その後、ステップS122の処理に進む。
(ステップS122)コマンド特定部112は、特定したアプリ終了コマンドで指示されるアプリのアプリコマンドを無効にし、システムコマンドを有効にする。その後、ステップS102の処理に戻る。
(ステップS124)コマンド実行部114は、コマンド特定部112が特定した他のアプリコマンドを実行する。その後、ステップS102の処理に戻る。
上記の説明では、コマンド実行部114が、音声コマンドにより同時に2件以上のアプリを実行せず、1件のアプリのみの実行を可能とする場合を例にしたが、これには限られない。制御部100は、マルチウィンドウ機能のもとで、入力デバイス33から入力される操作信号でさらに別のアプリを実行可能とし、実行中のアプリの機能を操作可能としてもよい。一般にマルチウィンドウ機能を有するOSのもとでは、制御部100は、実行中のアプリのそれぞれについてウィンドウをディスプレイ17に表示させる。制御部100は、複数のウィンドウを表示させるとき、いずれか1つのウィンドウをアクティブウィンドウとして定める。制御部100は、アクティブウィンドウの領域内を指示する操作信号に基づいてアクティブウィンドウに係るアプリ(以下、フォアグランドアプリ)の動作を制御し、その他のウィンドウ(以下、非アクティブウィンドウ)に係るアプリ(以下、バックグランドアプリ)の動作を制御しない。アクティブウィンドウを表示させ、受け付けた操作信号に基づいて動作を制御可能としている状態は、一般にフォアグランドと呼ばれる。
その後、コマンド特定部112は、実行アプリ情報を参照して、フォアグランドアプリの実行が終了し、かつ、音声起動アプリがまだ実行中と判定するとき、実行を終了させたフォアグランドアプリに係るアプリコマンドを無効にし、実行中の音声起動アプリに係るアプリコマンドを有効にしてもよい。このとき、制御部100は、実行中の音声起動アプリをフォアグランドアプリとして定めてもよい。これにより、実行が継続している音声起動アプリに対する音声による動作の制御を再開するとともに、フォアグランドアプリとして操作信号に応じた操作も可能となる。
従って、コマンド実行部114は、実行中の音声起動アプリをユーザの発話に応じて認識されたアプリコマンドで制御することができる。同時に実行中のアプリの件数に関わらず、音声起動アプリの実行が終了するまで他のアプリの音声コマンドが有効にならないので、ユーザは、フォアグランドアプリとして音声起動アプリとしての操作に専念することができる。
アプリコマンドグループの少なくとも1つは、複数の階層に階層化されてもよい。
つまり、アプリコマンドグループは、例えば、N(Nは、2以上の整数)階層の階層別コマンドグループを有してもよい。第n(nは、1以上N以下の整数)階層の階層別コマンドグループは、1以上の第n階層の機能のそれぞれに対する階層別コマンドを含む。但し、第n(nは、1以上N−1以下の整数)階層の階層別コマンドグループは、1以上の第n+1階層の機能の実行開始を示す第n+1階層機能開始コマンドを有する。また、第n(nは、2以上N以下の整数)階層の階層別コマンドグループは、第n階層の機能の実行終了を示す第n階層機能終了コマンドを有する。
コマンド特定部112は、発話情報に基づいて第n+1階層機能終了コマンドを特定するとき、特定した第n+1階層の階層別コマンドを無効にし、第n階層機能の階層別コマンドを再度有効にする。
図11−14は、階層化されたアプリコマンドグループの例を示す図である。図11−14は、プレゼンテーション用アプリAPP2に係るアプリコマンドの例を示す。図11は、本実施形態に係る第1階層の機能の階層別コマンドの例を示す。図11の第1行の「Start Presentation」、第2行の「Start Document Preparation」は、それぞれ第2階層の機能の実行開始を示す第2階層機能開始コマンドである。第3行の「Finish APP2」は、アプリAPP2の実行終了を指示するためのアプリ終了コマンドである。
この構成によれば、同時に1つの実行中のアプリに対するアプリコマンドを有効とし、その他のアプリコマンドを無効にすることができる。音声により操作可能とするアプリは、アプリ開始コマンドで指示された1つのアプリに限定され、他のアプリの動作には及ばない。そのため、所望のアプリ以外の他のアプリに対する操作を回避することができる。その機能の実現のために個々のアプリに対してアプリコマンドを定義しておけば、個々のアプリやOSの改修、その他のソフトウェアの開発を要しないため、既存のアプリに対して容易に適用することができる。
この構成によれば、音声によりアプリを操作可能とする期間が、発話により指示されたアプリ開始コマンドが特定されてから、アプリ終了コマンドが特定されるまでの期間に限定される。そして、その期間の終了後、発話により指示されたシステムコマンドに応じてシステムに対する操作、例えば、再度のアプリの実行開始が可能となる。
この構成によれば、非音声起動アプリの実行開始に伴い、発話により指示されたアプリコマンドに応じて、そのアプリの操作が可能になる。
この構成によれば、非音声起動アプリの実行終了に伴い、既に起動していた音声起動アプリに対して、発話により指示されたアプリコマンドに応じた操作を再度可能にすることができる。
この構成によれば、音声起動アプリの実行中に非音声起動アプリの実行が指示されても、音声起動アプリに対して、発話により指示されたアプリコマンドに応じた操作可能な状態を維持することができる。そのため、実行開始を指示したアプリごとに、操作手段の使い分けがなされる。
この構成によれば、予めアプリごとに定義したアプリコマンドに応じた操作の開始ならびに終了を既存のOS上で実現することができる。
この構成によれば、同時に1つの実行中の階層の機能に対する階層別コマンドを有効とし、その他の階層の機能を無効にすることができる。音声により操作可能とする機能は、アプリ開始コマンドにより指示された1つのアプリに限定され、他のアプリの動作には及ばない。そのため、ユーザの発話により所望の階層の機能以外の機能に対する操作を回避することができる。
この構成によれば、ユーザはその時点で有効なコマンドを視認することができるため、ユーザに対して無効なコマンドに対する発話を回避させることができる。
CPU11は、OS上で所定の1個のアプリを実行して、コマンド特定部112、コマンド実行部114およびコマンド記憶部122の機能を提供してもよいし、所定の複数のアプリを実行して、コマンド特定部112、コマンド実行部114およびコマンド記憶部122の機能を提供してもよい。また、ディスプレイ17、入力デバイス33の双方または一方は、情報処理装置1の他の部材と各種のデータを送受信することができれば、他の部材と物理的に接続されていてもよいし、別体であってもよい。
また、音声認識部ASRは、情報処理装置1が別体である場合を例にしたが、情報処理装置1と一体化されていてもよい。その場合、音声認識部ASRと発話情報要求部104もしくはコマンド特定部112との間の送受信に代えて、情報処理装置1内部での入出力がなされていればよい。
Claims (11)
- 予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定部と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行部と、を備え、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記コマンド特定部は、
前記アプリケーション開始コマンドで実行開始が指示された音声起動アプリケーションプログラムの実行中に、他のアプリケーションプログラムの実行が指示されるとき、
前記音声起動アプリケーションプログラムのアプリケーションコマンドを有効にし、前記他のアプリケーションプログラムのアプリケーションコマンドを無効にする
情報処理装置。 - 予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定部と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行部と、を備え、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記アプリケーションコマンドグループは、N(Nは、2以上の整数)階層の階層別コマンドグループを含み、
第n(nは、1以上N以下の整数)階層の階層別コマンドグループは、第n階層の機能に対する階層別コマンドを含み、
第n(nは、1以上N−1以下の整数)階層の階層別コマンドの少なくともいずれかは、第n+1階層の機能の実行開始を示す第n+1階層機能開始コマンドであり、
第n+1(nは、1以上N−1以下の整数)階層の階層別コマンドの1つは、第n+1階層の機能の実行終了を示す第n+1階層機能終了コマンドであり、
前記コマンド特定部は、
前記アプリケーション開始コマンドで指示されたアプリケーションプログラムの実行中に、当該アプリケーションプログラムのアプリケーションコマンドを有効にし、前記システムコマンドと他のアプリケーションプログラムのアプリケーションコマンドを無効にし、
前記第n+1階層開始コマンドのいずれかを特定するとき、特定した第n+1階層機能の階層別コマンドを有効にし、前記第n階層機能の階層別コマンドと他の第n+1階層機能の階層別コマンドを無効とし、
前記第n+1階層機能終了コマンドを特定するとき、特定した第n+1階層の階層別コマンドを無効にし、前記第n階層機能の階層別コマンドを有効にする
情報処理装置。 - 前記アプリケーションコマンドの1つは、前記アプリケーションプログラムの実行終了を示すアプリケーション終了コマンドであり、
前記コマンド特定部は、
前記アプリケーション終了コマンドで指示されたアプリケーションプログラムの実行終了に応じて、前記アプリケーションプログラムのアプリケーションコマンドを無効にし、前記システムコマンドを有効にする
請求項1または請求項2に記載の情報処理装置。 - 前記コマンド特定部は、
他のアプリケーションプログラムの実行が開始されるとき、
前記他のアプリケーションプログラムのアプリケーションコマンドを有効にし、前記アプリケーション開始コマンドで実行開始が指示されたアプリケーションである音声起動アプリケーションプログラムのアプリケーションコマンドを無効にする
請求項2に記載の情報処理装置。 - 前記コマンド特定部は、
前記他のアプリケーションプログラムの実行が終了するとき、
前記他のアプリケーションプログラムのアプリケーションコマンドを無効にし、前記音声起動アプリケーションプログラムのアプリケーションコマンドを有効にする
請求項4に記載の情報処理装置。 - 前記コマンド特定部が、
前記アプリケーション開始コマンドを特定するとき、
前記コマンド実行部は、
前記アプリケーション開始コマンドで指示されたアプリケーションプログラムを実行するためのプロセスをオペレーティングシステムに生成させ、
前記コマンド特定部が、
前記アプリケーションプログラムの実行終了を示すアプリケーション終了コマンドを特定するとき、
前記コマンド実行部は、
前記プロセスを前記オペレーティングシステムに終了させる
請求項1から請求項5のいずれか一項に記載の情報処理装置。 - 前記コマンド特定部は、
前記アプリケーション開始コマンドで指示されたアプリケーションプログラムの実行中に、当該アプリケーションプログラムの機能に対して有効なコマンドを示すコマンドリストを表示部に表示させる
請求項1から請求項6のいずれか一項に記載の情報処理装置。 - 情報処理装置における方法であって、
予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定過程と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行過程と、を有し、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記コマンド特定過程は、
前記アプリケーション開始コマンドで実行開始が指示された音声起動アプリケーションプログラムの実行中に、他のアプリケーションプログラムの実行が指示されるとき、
前記音声起動アプリケーションプログラムのアプリケーションコマンドを有効にし、前記他のアプリケーションプログラムのアプリケーションコマンドを無効にする
情報処理方法。 - 情報処理装置における方法であって、
予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定過程と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行過程と、を有し、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記アプリケーションコマンドグループは、N(Nは、2以上の整数)階層の階層別コマンドグループを含み、
第n(nは、1以上N以下の整数)階層の階層別コマンドグループは、第n階層の機能に対する階層別コマンドを含み、
第n(nは、1以上N−1以下の整数)階層の階層別コマンドの少なくともいずれかは、第n+1階層の機能の実行開始を示す第n+1階層機能開始コマンドであり、
第n+1(nは、1以上N−1以下の整数)階層の階層別コマンドの1つは、第n+1階層の機能の実行終了を示す第n+1階層機能終了コマンドであり、
前記コマンド特定過程は、
前記アプリケーション開始コマンドで指示されたアプリケーションプログラムの実行中に、当該アプリケーションプログラムのアプリケーションコマンドを有効にし、前記システムコマンドと他のアプリケーションプログラムのアプリケーションコマンドを無効にし、
前記第n+1階層開始コマンドのいずれかを特定するとき、特定した第n+1階層機能の階層別コマンドを有効にし、前記第n階層機能の階層別コマンドと他の第n+1階層機能の階層別コマンドを無効とし、
前記第n+1階層機能終了コマンドを特定するとき、特定した第n+1階層の階層別コマンドを無効にし、前記第n階層機能の階層別コマンドを有効にする
情報処理方法。 - 情報処理装置のコンピュータに、
予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定手順と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行手順と、を実行させ、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記コマンド特定手順は、
前記アプリケーション開始コマンドで実行開始が指示された音声起動アプリケーションプログラムの実行中に、他のアプリケーションプログラムの実行が指示されるとき、
前記音声起動アプリケーションプログラムのアプリケーションコマンドを有効とし、前記他のアプリケーションプログラムのアプリケーションコマンドを無効とする
プログラム。 - 情報処理装置のコンピュータに、
予め設定されたコマンドグループに含まれる複数の音声コマンドから、入力された音声の発話情報で指示される音声コマンドを特定するコマンド特定手順と、
特定された前記音声コマンドで指示される処理を実行するコマンド実行手順と、を実行させ、
前記コマンドグループは、システムの動作に対するシステムコマンドを1以上含むシステムコマンドグループと、アプリケーションプログラムの機能に対するアプリケーションコマンドを1以上含むアプリケーションコマンドグループと、を含み
前記システムコマンドの1つは、アプリケーションプログラムの実行開始を示すアプリケーション開始コマンドであり、
前記アプリケーションコマンドグループは、N(Nは、2以上の整数)階層の階層別コマンドグループを含み、
第n(nは、1以上N以下の整数)階層の階層別コマンドグループは、第n階層の機能に対する階層別コマンドを含み、
第n(nは、1以上N−1以下の整数)階層の階層別コマンドの少なくともいずれかは、第n+1階層の機能の実行開始を示す第n+1階層機能開始コマンドであり、
第n+1(nは、1以上N−1以下の整数)階層の階層別コマンドの1つは、第n+1階層の機能の実行終了を示す第n+1階層機能終了コマンドであり、
前記コマンド特定手順は、
前記アプリケーション開始コマンドで指示されたアプリケーションプログラムの実行中に、当該アプリケーションプログラムのアプリケーションコマンドを有効にし、前記システムコマンドと他のアプリケーションプログラムのアプリケーションコマンドを無効にし、
前記第n+1階層開始コマンドのいずれかを特定するとき、特定した第n+1階層機能の階層別コマンドを有効にし、前記第n階層機能の階層別コマンドと他の第n+1階層機能の階層別コマンドを無効とし、
前記第n+1階層機能終了コマンドを特定するとき、特定した第n+1階層の階層別コマンドを無効にし、前記第n階層機能の階層別コマンドを有効にする
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019025626A JP6792654B2 (ja) | 2019-02-15 | 2019-02-15 | 情報処理装置、情報処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019025626A JP6792654B2 (ja) | 2019-02-15 | 2019-02-15 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020134627A JP2020134627A (ja) | 2020-08-31 |
JP6792654B2 true JP6792654B2 (ja) | 2020-11-25 |
Family
ID=72278469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019025626A Active JP6792654B2 (ja) | 2019-02-15 | 2019-02-15 | 情報処理装置、情報処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6792654B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581946B (zh) * | 2019-09-29 | 2024-08-16 | 百度在线网络技术(北京)有限公司 | 语音控制方法、装置、电子设备和可读存储介质 |
WO2024080009A1 (ja) * | 2022-10-11 | 2024-04-18 | ソニーグループ株式会社 | 音響装置、音響制御方法及び音響制御プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001216131A (ja) * | 2000-02-04 | 2001-08-10 | Sony Corp | 情報処理装置および方法、並びにプログラム格納媒体 |
JP4107093B2 (ja) * | 2003-01-30 | 2008-06-25 | 株式会社日立製作所 | 対話型端末装置及び対話アプリケーション提供方法 |
US8996386B2 (en) * | 2011-01-19 | 2015-03-31 | Denso International America, Inc. | Method and system for creating a voice recognition database for a mobile device using image processing and optical character recognition |
KR102022318B1 (ko) * | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US10186262B2 (en) * | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
JP2016033811A (ja) * | 2014-07-30 | 2016-03-10 | 富士通株式会社 | セッション管理方法、セッション管理装置、セッション管理プログラム、および通話処理方法 |
-
2019
- 2019-02-15 JP JP2019025626A patent/JP6792654B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020134627A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113424255B (zh) | 引导车辆客户端设备使用设备上的功能 | |
US11955124B2 (en) | Electronic device for processing user speech and operating method therefor | |
CN107564510A (zh) | 一种语音虚拟角色管理方法、装置、服务器和存储介质 | |
KR20180121097A (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
JP2024506778A (ja) | アシスタントコマンドの受動的な曖昧さ解消 | |
JP6792654B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US11372965B2 (en) | Application with self-configuring accessibility settings | |
JP7170739B2 (ja) | リモートに生成された自動化アシスタントコンテンツのレンダリングにおけるクライアントデバイスレイテンシの軽減 | |
US20150169551A1 (en) | Apparatus and method for automatic translation | |
KR102685523B1 (ko) | 사용자 음성 입력을 처리하는 장치 | |
KR20190001865A (ko) | 화면 제어 방법 및 이를 지원하는 전자 장치 | |
CN112313606B (zh) | 为自动助理扩展物理运动手势词典 | |
CN114174972B (zh) | 用于复杂应用gui的自动化助理控制的压缩口头话语 | |
CN113393367B (zh) | 图像处理方法、装置、设备和介质 | |
KR20180121254A (ko) | 그래픽 표시를 출력하는 전자 장치 | |
KR102713167B1 (ko) | 그래픽 사용자 인터페이스에 음성-제어 컨텐츠 입력 | |
WO2010029920A1 (ja) | 情報処理装置及びプログラム | |
KR20180116725A (ko) | 음성 인식 서비스의 운용 화면 표시 방법 및 이를 지원하는 전자 장치 | |
US20180364809A1 (en) | Perform function during interactive session | |
JP2009015393A (ja) | 端末装置、プログラム及び制御方法 | |
CN117157615A (zh) | 选择性地实施便于助理交互的辅助设备的角色改变请求 | |
KR20240124414A (ko) | 차량 컴퓨팅 디바이스를 통해 컨텍스트 자동화된 어시스턴트 액션 제안(들)을 제공 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200602 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6792654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |