JP2014075058A - ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム - Google Patents
ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム Download PDFInfo
- Publication number
- JP2014075058A JP2014075058A JP2012222560A JP2012222560A JP2014075058A JP 2014075058 A JP2014075058 A JP 2014075058A JP 2012222560 A JP2012222560 A JP 2012222560A JP 2012222560 A JP2012222560 A JP 2012222560A JP 2014075058 A JP2014075058 A JP 2014075058A
- Authority
- JP
- Japan
- Prior art keywords
- instruction
- instruction information
- information
- user
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/015—Input arrangements based on nervous system activity detection, e.g. brain waves [EEG] detection, electromyograms [EMG] detection, electrodermal response detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/038—Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/038—Indexing scheme relating to G06F3/038
- G06F2203/0381—Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
【課題】デバイスの故障や周囲環境の悪化などで指示情報検出の信頼性が低下した場合であっても、操作者の指示の検出を持続すること。
【解決手段】ユーザから検出される少なくとも2つの異なる指示情報の履歴を、ユーザの指示に対応付けて蓄積する指示履歴蓄積部と、指示情報を受信する指示情報受信部と、指示情報の履歴を参照して、受信した指示情報からユーザの指示を認識する指示認識部と、指示情報の履歴を参照して、受信した指示情報の信頼性を判定する信頼性判定部と、信頼性判定部が受信した指示情報の信頼性が低下したと判定した場合に、指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更部と、を備える。
【選択図】 図1
【解決手段】ユーザから検出される少なくとも2つの異なる指示情報の履歴を、ユーザの指示に対応付けて蓄積する指示履歴蓄積部と、指示情報を受信する指示情報受信部と、指示情報の履歴を参照して、受信した指示情報からユーザの指示を認識する指示認識部と、指示情報の履歴を参照して、受信した指示情報の信頼性を判定する信頼性判定部と、信頼性判定部が受信した指示情報の信頼性が低下したと判定した場合に、指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更部と、を備える。
【選択図】 図1
Description
本発明は、ユーザの指示を認識するための技術に関する。
上記技術分野において、特許文献1には、発話と頷きや瞬きとから操作者の指示を判断する技術が開示されている。また、特許文献2には、音響信号と筋電信号とから操作者の発話を判断する技術が開示されている。
しかしながら、上記文献に記載の技術では、デバイスの故障や周囲環境の悪化などで指示情報検出の信頼性が低下した場合、操作者の指示の検出を持続することができなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係る情報処理装置は、
ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を受信する指示情報受信手段と、
前記指示情報の履歴を参照して、前記受信した指示情報からユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更手段と、
を備える。
ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を受信する指示情報受信手段と、
前記指示情報の履歴を参照して、前記受信した指示情報からユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更手段と、
を備える。
上記目的を達成するため、本発明に係る情報処理装置の制御方法は、
指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
を含む。
指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
を含む。
上記目的を達成するため、本発明に係る情報処理装置の制御プログラムは、
指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
をコンピュータに実行させる。
指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
をコンピュータに実行させる。
上記目的を達成するため、本発明に係る携帯端末は、
ユーザの指示を検出するための検出デバイスを接続する接続コネクタと、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信手段と、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信手段と、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知手段と、
を備える。
ユーザの指示を検出するための検出デバイスを接続する接続コネクタと、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信手段と、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信手段と、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知手段と、
を備える。
上記目的を達成するため、本発明に係る携帯端末の制御方法は、
ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御方法であって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
を含む。
ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御方法であって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
を含む。
上記目的を達成するため、本発明に係る携帯端末の制御プログラムは、
ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御プログラムであって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
をコンピュータに実行させる。
ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御プログラムであって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
をコンピュータに実行させる。
上記目的を達成するため、本発明に係るユーザ指示認識システムは、
ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を検出する少なくとも2つの検出手段と、
前記指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更手段と、
を備える。
ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を検出する少なくとも2つの検出手段と、
前記指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更手段と、
を備える。
上記目的を達成するため、本発明に係るユーザ指示認識方法は、
少なくとも2つの検出手段によってユーザから少なくとも2つの異なる指示情報を検出する検出ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更ステップと、
を含む。
少なくとも2つの検出手段によってユーザから少なくとも2つの異なる指示情報を検出する検出ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更ステップと、
を含む。
本発明によれば、デバイスの故障や周囲環境の悪化などで指示情報検出の信頼性が低下した場合であっても、操作者の指示の検出を持続することができる。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素は単なる例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。なお、本明細書における「デバイス」との文言は、通信端末に有線あるいは無線で接続されて所定の入出力機能を果たし、基本的には通信端末を介して外部とのデータ送受信を行なう機器を総称している。
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、ユーザ指示を表わす複数の指示情報からユーザ指示を認識する装置である。
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、ユーザ指示を表わす複数の指示情報からユーザ指示を認識する装置である。
図1に示すように、情報処理装置100は、指示履歴蓄積部101と、指示情報受信部102と、指示認識部103と、信頼性判定部104と、指示情報変更部105と、を含む。指示履歴蓄積部101は、ユーザから検出される少なくとも2つの異なる指示情報の履歴を、ユーザの指示に対応付けて蓄積する。指示情報受信部102は、指示情報を受信する。指示認識部103は、指示情報の履歴を参照して、受信した指示情報からユーザの指示を認識する。信頼性判定部104は、指示情報の履歴を参照して、受信した指示情報の信頼性を判定する。指示情報変更部105は、信頼性判定部104が受信した指示情報の信頼性が低下したと判定した場合に、指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する。
本実施形態によれば、指示情報の履歴を参照して信頼性の低下した指示情報を他の指示情報に変更するので、デバイスの故障や周囲環境の悪化などで指示情報検出の信頼性が低下した場合であっても、操作者の指示の検出を持続することができる。
[第2実施形態]
次に、本発明の第2実施形態に係る情報処理装置を含むユーザ指示認識システムについて説明する。なお、本実施形態においては、情報処理装置であるサーバの一例としてクラウドサーバを用いて説明する。本実施形態においては、指示履歴を参照してデバイスからの指示情報の信頼性を判定し、信頼性の低下があった場合に、指示履歴を参照して信頼性の高いデバイスを選定してユーザに対してデバイスの交換を指示する。
次に、本発明の第2実施形態に係る情報処理装置を含むユーザ指示認識システムについて説明する。なお、本実施形態においては、情報処理装置であるサーバの一例としてクラウドサーバを用いて説明する。本実施形態においては、指示履歴を参照してデバイスからの指示情報の信頼性を判定し、信頼性の低下があった場合に、指示履歴を参照して信頼性の高いデバイスを選定してユーザに対してデバイスの交換を指示する。
本実施形態によれば、デバイスからの指示情報の信頼性低下に応じて信頼性の高いデバイスに変更されるので、指示情報検出の信頼性が低下した場合であっても、操作者の指示の検出を持続することができる。
なお、本実施形態においては、基本的にデバイスは、その設置や変更が現場で容易にできるように、スマートフォンなどの携帯端末のUSB(Universal Serial Bus)コネクタに接続した例を説明する。しかし、デバイスの一部は、デスクトップ型あるいはノート型のパーソナルコンピュータ(以下、PC:Personal Computer)に接続されても、あるいは独自にクラウドサーバへの通信機能を有するデバイスであってもよい。
《ユーザ指示認識システム》
図2〜図4Dを参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ210を含むユーザ指示認識システム200について説明する。
図2〜図4Dを参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ210を含むユーザ指示認識システム200について説明する。
(システムの概要)
図2は、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の概要を示す図である。図2においては、クラウドサーバ210が、野外の作業現場におけるユーザである作業者の指示を、スマートフォンである携帯端末220に接続したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ210は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、携帯端末220にデバイスの交換を指示する。
図2は、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の概要を示す図である。図2においては、クラウドサーバ210が、野外の作業現場におけるユーザである作業者の指示を、スマートフォンである携帯端末220に接続したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ210は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、携帯端末220にデバイスの交換を指示する。
図2において、携帯端末220にイヤホンマイク230が接続されて作業者の音声指示を検出している。また、通信機能を有するビデオカメラ240が作業者の動作指示を検出している。携帯端末220の表示画面220aには、作業者の現在の指示入力として、マイクからの入力音声とカメラからの入力動作とが使用されていることが表示され、また、音声や動作と指示コマンドとの関連も表示されている。なお、イヤホンマイク230のイヤホンから表示と同時に音声による説明がされるのが望ましい。
クラウドサーバ210は、マイクからの入力音声とカメラからの入力動作とを指示情報として受信し、蓄積された指示情報の履歴を参照して、作業者の指示を認識する。このようにすることで、作業者がキー入力などで指示をする必要がなく、両手を作業に使うことができる。
ここで、工事現場の作業などで周囲の雑音が高くなると、クラウドサーバ210は、マイク入力から作業者の音声を識別し難いと判定し、携帯端末220の表示画面220bに、“周囲の雑音でマイク入力の信頼性が低下しています。唇撮影用カメラに変更して下さい。”との指示メッセージを表示する。なお、作業者の音声を識別し難いとの判定は、マイク入力のレベルが高止まりになって音声抽出ができないこと、あるいは、指示認識の認識率が低下したことなどから行なうことができる。図2には図示しないが、唇撮影用カメラに変更するため、唇の動きを大きくするなどの注意事項を表示してもよい。作業者自身あるいは他の作業者が、イヤホンマイク230を唇撮影用カメラ250に交換する。クラウドサーバ210は、唇撮影用カメラ250への交換を判断して、唇撮影用カメラ250からの唇変化とカメラからの入力動作とを指示情報として、作業者の指示を認識する。携帯端末220の表示画面220cには、作業者の現在の指示入力として、唇撮影用カメラからの唇変化とカメラからの入力動作とが使用されていることが表示され、また、唇変化や動作と指示コマンドとの関連も表示される。
一方、夕方になって作業現場の周囲が暗くなってくると、クラウドサーバ210は、カメラ入力から作業者の動作を識別し難いと判定し、携帯端末220の表示画面220dに、“暗くなりカメラ入力の信頼性が低下しています。通電センサによる首の動作に変更して下さい。”との指示メッセージを表示する。なお、作業者の動作を識別し難いとの判定は、カメラ入力が低レベルになって画像抽出ができないこと、あるいは、指示認識の認識率が低下したことなどから行なうことができる。図2には図示しないが、首の動作に変更するため、首の動作についての注意事項を表示してもよい。作業者自身あるいは他の作業者が、イヤホンマイク230と通電センサ260とをルータを介して携帯端末220に接続する。クラウドサーバ210は、通電センサ260への交換を判断して、通電センサ260からの首の動きを示す電気信号とカメラからの入力動作とを指示情報として、作業者の指示を認識する。携帯端末220の表示画面220eには、作業者の現在の指示入力として、通電センサからの首の動きとカメラからの入力動作とが使用されていることが表示され、また、首の動きや動作と指示コマンドとの関連も表示される。
なお、図2においては、周囲の雑音によるマイク入力の信頼性低下と、暗くなったためのカメラ入力の信頼性低下とを説明したが、デバイスの故障や通信不良などもクラウドサーバ210によって信頼性低下と判定可能である。例えば、受信信号のレベルや指示認識率なども信頼性の判定条件である。
(システムの構成)
図3は、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の構成を示す図である。
図3は、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の構成を示す図である。
ユーザ指示認識システム200は、ネットワーク340を介して接続されるクラウドサーバ210と、種々の作業現場における作業者の指示情報を取得する指示情報取得デバイス群を有する種々の作業現場310〜330とを備える。なお、指示情報取得デバイス群は、それぞれの作業現場に適したデバイスが選択され、これらデバイスはスマートフォンのような携帯端末に接続されていてもPCに接続されていても、独自の通信機能を有するデバイスでもよい。ただし、本実施形態のように、デバイスの交換や予備のデバイス接続を考えると、持ち運びが便利で接続するデバイスの制限が少なく簡単にクラウドサーバ210に接続可能な携帯端末が望ましい。
本実施形態のクラウドサーバ210の基本構成は、指示情報受信部301と、指示履歴データベース(以下、DB)302と、指示認識部303と、信頼性判定部304と、指示情報変更指示部305と、指示処理部306とである。指示情報受信部301は、指示情報取得デバイス群からネットワーク340を介して指示情報を受信する。指示履歴DB302は、指示情報受信部301が受信した指示情報の履歴をそのまま、あるいは、例えば使用する作業アプリに対応付けた整理をして、蓄積する。指示認識部303は、指示履歴DB302に蓄積された指示情報の履歴を参照して、指示情報から作業者の指示を認識する。信頼性判定部304は、指示履歴DB302に蓄積された指示情報の履歴を参照して、受信した指示情報の信頼性を判定する。指示情報変更指示部305は、信頼性判定部304が受信した指示情報の信頼性が低下したと判定すると、受信する指示情報を変更するように携帯端末から作業者に指示する。指示処理部306は、指示認識部303が認識した作業者の指示を処理する。例えば、作業者の指示がクラウドサーバ210に対する指示の場合は、自身で応答動作を実行する。また、作業現場の他のデバイスへの指示であれば、そのデバイスへの操作を行なう。また、作業施行企業や作業者の所属する企業などの外部への指示であれば、外部へ指示メッセージを送信する。作業者の指示は、これらに限定されない。
(システムの動作手順)
図4Aおよび図4Bは、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の動作手順400−1、400−2を示すシーケンス図である。なお、作業アプリケーションについては、以下、図面では作業アプリと省略形とする場合もある。
図4Aおよび図4Bは、本実施形態に係るクラウドサーバ210を含むユーザ指示認識システム200の動作手順400−1、400−2を示すシーケンス図である。なお、作業アプリケーションについては、以下、図面では作業アプリと省略形とする場合もある。
図4Aの動作手順400−1は、作業者が作業情報を入力して以降、クラウドサーバ210が作業アプリを起動して作業者からの指示を認識しながら作業処理までの動作手順を示す。
作業者の携帯端末220は、ステップS401において、作業内容や作業場所、作業環境などを含む作業情報をクラウドサーバ210に送信する。また、ステップS403においては、指示情報を検出する各デバイスがデバイスを識別するデバイス情報をクラウドサーバ210に送信する。図4Aにおいては、図2の構成に従って、イヤホンマイク230は、携帯端末220を介してデバイス情報をクラウドサーバ210に送信し、ビデオカメラ240は、通信機能で直接、デバイス情報をクラウドサーバ210に送信する。
クラウドサーバ210においては、ステップS405において、携帯端末220から受信した作業情報と、接続されたデバイスのデバイス情報とを受信して、対応する作業アプリケーションを作業アプリケーションDB407から選定する。そして、ステップS407において、本作業に関連付く携帯端末やデバイスを使用して作業アプリケーションが連動して起動し、現場作業が開始する。かかる作業アプリケーションには、本実施形態における、作業者の指示を認識して処理する指示情報処理が含まれる。
以下、ステップS409〜S423は、作業者の指示を認識して処理する指示情報処理の動作手順を示す。
ステップS409において、携帯端末220は、イヤホンマイク230から作業者の音声指示を含む音声情報を取得して、クラウドサーバ210に送信する。クラウドサーバ210は、ステップS411において、指示履歴DB302を参照して、受信した音声情報から音声指示を認識する。そして、クラウドサーバ210は、ステップS413において、音声情報と認識した音声指示情報とを指示履歴DB302に蓄積する。
次に、ステップS409において、ビデオカメラ240は作業者の動作指示を含む映像情報を取得して、クラウドサーバ210に送信する。クラウドサーバ210は、ステップS417において、指示履歴DB302を参照して、受信した映像情報から動作指示を認識する。そして、クラウドサーバ210は、ステップS419において、映像情報と認識した動作指示情報とを指示履歴DB302に蓄積する。
次に、クラウドサーバ210は、ステップS421において、認識した音声指示と動作指示との組合せから、指示履歴DB302の指示履歴を参照して、ユーザ指示を認識する。そして、認識結果は、音声情報や映像情報などと関連付けて、以降の認識に利用すべく指示履歴DB302に蓄積する。そして、クラウドサーバ210は、ステップS423において、認識した作業者の指示に応じて、指示応答処理を行なう。
図4Bの動作手順400−2は、何らかの障害が発生して、イヤホンマイク230からの音声指示の信頼性が低下した場合のデバイス変更による指示情報変更の動作手順を示す。
クラウドサーバ210はステップS433において、指示履歴DB302に蓄積された指示履歴を参照して、指示情報の信頼性低下を判定する。なお、故障などのデバイス自身で判断可能な障害であれば、ステップS431のように、イヤホンマイク230から障害情報をクラウドサーバ210に送信して、障害を通知してもよい。
クラウドサーバ210はステップS435において、指示履歴DB302に蓄積された指示履歴を参照して、指示情報を変更する場合の適切な他の指示情報を選定する。適切な他の指示情報の条件には、例えば、ビデオカメラ240の映像からの指示情報との組合せが指示認識の信頼性を高めるもの、作業現場に準備されているものや準備が容易なもの、あるいは、作業現場の環境変化に影響されないもの、などがあるが、これらに限定されない。なお、クラウドサーバ210は、指示情報として有効なものの一覧を提示して、作業者が選択してもよい。
クラウドサーバ210はステップS437において、選定された指示情報を取得して送信するように、携帯端末220から作業者に指示する。もし指示された変更が不可能であれば、携帯端末220からクラウドサーバ210に通知して、さらに他の指示情報の選定を行なってよい(不図示)。
図4Bにおいては、唇撮影用カメラ250が携帯端末220に接続される。携帯端末220はステップS441において、唇撮影用カメラ250からデバイス情報(例えば、ディスクリプタ)を取得して、接続通知としてクラウドサーバ210に送信する(詳細は、図4Cおよび図4D参照)。クラウドサーバ210はステップS443において、デバイス情報を受信して、唇撮影用カメラ250からの指示情報への変更が行なわれたことを認識し、作業者の指示を認識するための指示情報の組合せを変えた指示情報処理とする。そして、ステップS445において、本作業に関連付く携帯端末や変更したデバイスを使用した作業アプリケーションが復帰する。
(接続デバイスの制御手順)
図4Cおよび図4Dは、本実施形態に係るUSB接続されたデバイス230〜260の制御手順410、420を示すシーケンス図である。
図4Cおよび図4Dは、本実施形態に係るUSB接続されたデバイス230〜260の制御手順410、420を示すシーケンス図である。
図4Cは、デバイス230〜260の携帯端末220のUSBコネクタへの接続時の制御手順410を示すシーケンス図である。
ステップS451において、携帯端末220はデバイスのUSB接続を検出する。携帯端末220は、ステップS453において、USB汎用ドライバでデバイスからディスクリプタを読み出す。携帯端末220は、ステップS455において、そのディスクリプタをクラウドサーバ210に送信する。クラウドサーバ210は、ステップS457において、ディスクリプタ受信後、デバイスDB413を参照してディスクリプタから接続したデバイスを特定する。次に、クラウドサーバ210は、ステップS459において、デバイスドライバDB414を参照して、特定したデバイスに基づいてデバイスドライバ選定をして起動する。
また、ステップS461において、携帯端末220は他のデバイスのUSB接続を検出する。携帯端末220は、ステップS463において、USB汎用ドライバで他のデバイスからディスクリプタを読み出す。携帯端末220は、ステップS465において、そのディスクリプタをクラウドサーバ210に送信する。クラウドサーバ210は、ステップS467において、デバイスDB413を参照してディスクリプタから接続したデバイスを特定する。次に、クラウドサーバ210は、ステップS469において、デバイスドライバDB414を参照して、特定したデバイスに基づいてデバイスドライバを選定して起動する。
その後、図4Aと同様に、ステップS407において、作業アプリケーションの起動がなされる。なお、図4Aには詳細に示していないが、例えば、作業アプリケーションの起動によって、クラウドサーバ210はステップS471において、各ディスプレイに共有画面を提供する。また、ステップS473において、各端末あるいはデバイスからの入力があれば入力応答処理を実行する。
図4Dは、USB接続されたデバイスのディスクリプタ取得の制御手順420を示すシーケンス図である。
デバイス230〜260に設定されているディスクリプタは、GET_DESCRIPTORなどのUSBリクエストにより取得される。USBリクエストは、それぞれコントロール転送によりデバイス230〜260とやり取りされる。各コントロール転送は、セット・ステージと、データ・ステージと、ステータス・ステージとからなる。各ステージは、トークン・パケットと、データ・パケットと、ハンドシェイク・パケットとからなる。ディスクリプタは、各データ・ステージのデータ・パケットで取得される。
デバイス230〜260から取得したディスクリプタはIPヘッダやTCPヘッダでIPカプセリングして、携帯端末220からクラウドサーバ210に送信される。
なお、クラウドサーバ210からデバイス230〜260へのデータ出力手順、および、デバイス230〜260からクラウドサーバ210へのデータ入力手順を含むUSBデバイスのデータ入出力手順は、USBプロトコルの標準規格があり、説明は省略する。
《クラウドサーバの機能構成》
図5は、本実施形態に係るクラウドサーバ210の機能構成を示すブロック図である。
図5は、本実施形態に係るクラウドサーバ210の機能構成を示すブロック図である。
クラウドサーバ210は、ネットワーク340を介した通信の制御をする通信制御部501を有する。ユーザ登録情報受信部502は、受信したユーザ登録情報を受信する。例えば、ユーザ登録情報には、ユーザの国籍、使用言語、所属する会社、住所、年齢、性別などの情報を含む。ユーザ登録部503は、ユーザ登録情報受信部502が受信したユーザ登録情報をユーザ登録DB504に登録する(図7参照)。作業情報受信部505は、携帯端末220から作業情報を受信する。なお、作業情報は作業現場の環境情報を含み、作業情報受信部505は環境情報受信も行なう。デバイス情報受信部506は、デバイスを識別するディスクリプタなどをデバイスから直接、あるいは携帯端末220を経由して受信する。作業アプリケーション選定部507は、作業情報とデバイス情報とに基づいて、作業アプリケーションDB407(図8参照)から作業情報とデバイス情報とに対応する作業アプリケーションを選定する。
作業アプリケーション実行部508は、作業アプリケーション選定部507が選定した作業アプリケーションを実行する。作業アプリケーション実行部508は、指示履歴DB302を参照して受信した指示情報から作業者の指示を認識する指示認識部303と、認識した作業者の指示に従って処理をする指示処理部306とを有する。指示認識部303の認識結果は指示情報と関連付けられて、指示履歴DB302に蓄積される。なお、指示認識部303においては、受信した指示情報からユーザの意図した指示情報を抽出する指示情報抽出と、抽出した指示情報の指示内容を判別する指示内容判別とからなる。
指示情報受信部301は、デバイスが検出した指示情報を直接、あるいは携帯端末220を経由して受信する。受信した指示情報は、作業アプリケーション実行部508の指示認識部303において、作業者の指示認識に使用される。また、信頼性判定部304の指示情報の信頼性判定に使用される。指示送信部509は、指示情報が作業現場における処理の指示である場合に、作業アプリケーション実行部508の指示処理部306からの指示を作業現場のデバイスや携帯端末に送信する。
信頼性判定部304は、受信した指示情報と、指示履歴DB302に蓄積された指示履歴とから、指示情報の信頼性を判定する。また、信頼性判定部304は、信頼性の判定結果と受信した指示情報の履歴とを関連付けて指示履歴DB302に蓄積する。そして、信頼性判定部304は、受信した指示情報の履歴が蓄積された指示情報の履歴に相当すると、信頼性の低下と判定する。信頼性判定部304は、指示情報の信頼性が低下していると判定した場合、その判定結果を指示情報変更指示部305に伝える。指示情報変更指示部305は、信頼性判定部304から信頼性の低下の通知を受けて、指示履歴DB302の指示履歴を参照して他の指示情報を選定し、指示情報の変更を指示する。変更情報提示部510は、指示情報変更指示部305からの変更指示を受けて、変更情報を携帯端末220から作業者に提示する。
《携帯端末の機能構成》
図6は、本実施形態に係る携帯端末220の機能構成を示すブロック図である。
図6は、本実施形態に係る携帯端末220の機能構成を示すブロック図である。
本実施形態の携帯端末220は、クラウドサーバ210とのネットワークを介した通信を制御する通信制御部603を有する。また、携帯端末220は、タッチパネルやキーボードなどからなる操作部601と、操作部601からの入力情報をクラウドサーバ210に送信する入力情報送信部602と、入出力部605とを有する。入出力部605は、画面受信部604が受信したクラウドサーバ210からの共有画面あるいは作業指示画面や指示情報変更の表示画面を表示する表示部606と、音声を入出力する音声入出力部607とを有する。また、入出力部605は、カメラやGPS(Global Positioning System)による位置生成部を含んでもよい。
また、携帯端末220は、USBデバイスを接続するためのデバイス接続コネクタであるUSBコネクタ610を有する。そして、USBコネクタ610に接続したデバイス230〜260のディスクリプタを取得するための汎用USBドライバ実行部611を有する。さらに、携帯端末220は、汎用USBドライバ実行部611が取得したUSBパケットからデバイス230〜260のディスクリプタを取得するディスクリプタ取得部612を有する。また、ディスクリプタ取得部612が取得したデバイス230〜260のディスクリプタをクラウドサーバ210に送信するディスクリプタ送信部613を有する。
また、汎用USBドライバ実行部611を介して、USBコネクタ610に接続したデバイス230〜260とクラウドサーバ210がUSBパケットをやり取りするための、アンカプセリング部614とカプセリング部615とを有する。アンカプセリング部614は、クラウドサーバ210からのIPメッセージをアンカプセリングする。カプセリング部615は、クラウドサーバ210へのIPカプセリングを行なう。かかる汎用USBドライバ実行部611、アンカプセリング部614、カプセリング部615が、クラウドサーバ210によるデバイス制御を中継する。なお、指示情報送信もこのルートで行なわれる。
ここで、本実施形態においては、入力情報送信部602は、作業情報送信などを行なう。また、画面受信部604は、現在取得している指示情報を表示する画面や変更すべきデバイス変更通知受信などを行なう。あるいは、操作部や表示部などがデバイスとしてUSBコネクタ610に接続されている場合は、携帯端末220の中継により、各デバイスにおいて作業情報送信やデバイス情報受信が行なわれる。
なお、図6には、クラウドサーバ210とデバイス230〜260とのデータ送受信を中継する場合を示した。しかし、クラウドサーバ210から対応するデバイスドライバをダウンロードしてデバイスを制御する構成であってもよい。
(ユーザ登録DB)
図7は、本実施形態に係るユーザ登録DB504の構成を示す図である。ユーザ指示認識システムに登録要請したユーザは、ユーザ登録部503によりこのユーザ登録DB504に登録される。なお、ユーザ登録DB504の構成は図7に限定されない。
図7は、本実施形態に係るユーザ登録DB504の構成を示す図である。ユーザ指示認識システムに登録要請したユーザは、ユーザ登録部503によりこのユーザ登録DB504に登録される。なお、ユーザ登録DB504の構成は図7に限定されない。
ユーザ登録DB504は、個人を登録する個人ユーザ登録部710と、企業などのグループ(法人)を登録するグループユーザ登録部720とを有する。
ユーザ登録DB504の個人ユーザ登録部710は、ユーザの識別情報であるユーザID711に対応付けて、パスワードなどのユーザ認証712、国籍713、使用言語714、所属するグループID715、住所716、および年齢や性別などのその他のデータ717、を格納する。
また、ユーザ登録DB504のグループユーザ登録部720は、グループID721に対応付けて、グループ名722、作業内容723などを格納する。
(作業アプリケーションDB)
図8は、本発明の第2実施形態に係る作業アプリケーションDB407の構成を示す図である。作業情報とデバイス情報とに基づいて、この作業アプリケーションDB407から実施する作業に適切な作業アプリケーションが選定されて、実行される。なお、作業アプリケーションDB407の構成は図8に限定されない。
図8は、本発明の第2実施形態に係る作業アプリケーションDB407の構成を示す図である。作業情報とデバイス情報とに基づいて、この作業アプリケーションDB407から実施する作業に適切な作業アプリケーションが選定されて、実行される。なお、作業アプリケーションDB407の構成は図8に限定されない。
作業アプリケーションDB407は、作業アプリケーションを識別する作業アプリケーションID801を選定する条件として、グループID802、作業内容803、指示用第1接続デバイス804〜指示用第n接続デバイス805などを格納する。
(指示履歴DB)
図9A〜図9Eを参照して、本実施形態に係る指示履歴DB302の特徴ある構成を説明する。なお、指示履歴DB302の構成は図9A乃至図9Eに限定されない。以下、指示履歴DB302の構成として、本実施形態における指示履歴DB302を使用する場合に見えるデータ構造を明瞭にするため、目的に従って整理された5つの構成を示す。しかしながら、これら5つの構成がそれぞれ個別に整理されて蓄積されている訳ではない。図9A〜図9Eは、指示履歴DB302の構成を分かり易く示したものであり、全ての項目のデータが1つにまとめられて、互いに検索可能にリンクされている構成であってもよい。
図9A〜図9Eを参照して、本実施形態に係る指示履歴DB302の特徴ある構成を説明する。なお、指示履歴DB302の構成は図9A乃至図9Eに限定されない。以下、指示履歴DB302の構成として、本実施形態における指示履歴DB302を使用する場合に見えるデータ構造を明瞭にするため、目的に従って整理された5つの構成を示す。しかしながら、これら5つの構成がそれぞれ個別に整理されて蓄積されている訳ではない。図9A〜図9Eは、指示履歴DB302の構成を分かり易く示したものであり、全ての項目のデータが1つにまとめられて、互いに検索可能にリンクされている構成であってもよい。
図9Aは、本実施形態に係る指示履歴DB302を、作業アプリケーション単位で蓄積した構成910を示す図である。すなわち、指示情報を現在実行されている作業アプリケーションごとにそのまま整理無しに蓄積したものである。図9Aにおいては、作業アプリケーションID911に対応付けて、グループID912、ユーザID913、を格納する。そして、指示情報の取得日時914に対応付けて、デバイスIDと指示情報とからなる第1接続デバイスの情報915、デバイスIDと指示情報とからなる第n接続デバイスの情報916、を格納する。また、指示情報の組合せから認識したユーザ指示917とその認識が成功であったか失敗であったかの情報918を格納する。この情報918の累積が整理されて、組合せによる指示認識の精度、信頼性の判定や変更する指示情報の選定に使用される。
図9Bは、本実施形態に係る指示履歴DB302を、接続されたデバイス単位で整理した構成920を示す図である。図9Bにおいては、接続デバイスID921に対応付けて、入力情報種別922、を格納する。そして、受信した指示情報列923に対応付けて、その指示情報列から認識した指示コマンド924、そして、指示コマンドの認識が成功であったか失敗であったかの情報925を格納する。この情報925の累積が、接続デバイスの傾向や、信頼性の判定や変更する指示情報の選定に使用される。
図9Cは、本実施形態に係る指示履歴DB302を、指示情報の組合せ単位で整理した構成930を示す図である。図9Cにおいては、第1接続デバイスの指示情報931、第2接続デバイスの指示情報932、…、に対応付けて、認識したユーザ指示933、認識の成功回数934、認識の失敗回数935、を格納する。この成功回数934および失敗回数935の累積数や、その比率などが、組合せによる指示認識の精度、信頼性の判定や、作業者の指示方法の選定に使用される。
図9Dは、本実施形態に係る指示履歴DB302を、作業アプリケーション単位に整理した構成940を示す図である。図9Dにおいては、作業アプリケーションID941に対応付けて、この作業においてユーザ指示が現われるシーケンス942、この作業において出現するユーザ指示の組合せ943、を格納する。また、この作業において出現しないユーザ指示944、この作業において出現率が多いユーザ指示945、この作業において出現率が少ないユーザ指示946、などを格納する。この情報は、例えば、作業者の指示の認識時に、シーケンス、組合せや出現率を参照してあり得る指示か、あり得ない指示か、の判断に使用される。一方、この情報は作業アプリケーションの傾向を表わしており、この情報から大きく離れる場合に信頼性の低下を疑うことになる。
図9Eは、本実施形態に係る指示履歴DB302を、指示情報を検出するデバイスの組合せから整理した構成950を示す図である。図9Eにおいては、作業アプリケーションID951に対応付けて、使用されたデバイスの組合せを格納する。使用されたデバイスの組合せは、第1接続デバイス952、第2接続デバイス953、…、第n接続デバイス954の欄に○で示されている。そして、そのデバイスの組合せに対して、作業者の指示の認識の信頼度955が格納される。この情報は、例えば、作業あるいは作業アプリケーションと指示認識により適切なデバイスの組合せを教えており、最初の組合せの提案や指示情報を変更する場合のデバイスの選定に役に立つ。
(デバイスドライバDB)
図10は、本実施形態に係るデバイスドライバDB414の構成を示す図である。作業情報により選定された作業アプリケーションにおいて指示情報を取得するデバイスを駆動するための、デバイスドライバを格納する。なお、デバイスドライバDB414の構成は図11に限定されない。
図10は、本実施形態に係るデバイスドライバDB414の構成を示す図である。作業情報により選定された作業アプリケーションにおいて指示情報を取得するデバイスを駆動するための、デバイスドライバを格納する。なお、デバイスドライバDB414の構成は図11に限定されない。
デバイスドライバDB414は、デバイスを特定するデバイスID1001に対応付けて、デバイスの性能やバージョンなどのデバイス情報1002と、使用可能な複数のデバイスドライバ1003を格納する。
なお、図4Cに示したデバイスDB413については、当業者には自明であるのでここでは図示および説明を省略する。
《クラウドサーバのハードウェア構成》
図11は、本実施形態に係るクラウドサーバ210のハードウェア構成を示すブロック図である。
図11は、本実施形態に係るクラウドサーバ210のハードウェア構成を示すブロック図である。
図11で、CPU(Central Processing Unit)1110は演算制御用のプロセッサであり、プログラムを実行することで図5のクラウドサーバ210の各機能構成部を実現する。ROM(Read Only Memory)1120は、初期データおよびプログラムなどの固定データおよびプログラムを格納する。また、通信制御部501は、ネットワーク340を介して携帯端末220と通信する。なお、CPU1110は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPU(Graphics Processing Unit)を含んでもよい。また、通信制御部501は、CPU1110とは独立したCPUを有して、RAM1140の領域に送受信データを書き込みあるいは読み出しするのが望ましい。また、RAM1140とストレージ1150との間でデータを転送するDMAC(Direct Memory Access Controller)を設けるのが望ましい(図示なし)。したがって、CPU1110は、RAM1140にデータが受信あるいは転送されたことを認識してデータを処理する。また、CPU1110は、処理結果をRAM1140に準備し、後の送信あるいは転送は通信制御部501やDMACに任せる。
RAM(Random Access Memory)1140は、CPU1110が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1140には、本実施形態の実現に必要なデータを記憶する領域が確保されている。ユーザ登録データ1141は、携帯端末220から受信したユーザ登録のためのデータである。指示情報テーブル1142は、デバイス230〜260などから受信した作業者の指示を表わす指示情報を記憶するためのテーブルである(図12参照)。指示認識テーブル1143は、受信した指示情報から作業者の指示を認識するためのテーブルである(図13参照)。信頼性判定テーブル1144は、指示履歴DB302の指示履歴を参照して、指示情報の信頼性を判定するためのテーブルである(図14参照)。指示情報変更テーブル1145は、指示情報の信頼性低下があると、指示履歴DB302の指示履歴を参照して、他の指示情報を選定するためのテーブルである(図15参照)。送受信データ1146は、通信制御部501がネットワーク340経由で送受信するデータである。なお、送受信データ1146は、各データ種別に対応して格納場所が特定されているものとする。
ストレージ1150には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。ユーザ登録DB504は、図7に示したユーザを登録するデータベースである。作業アプリケーションDB407は、図8に示した作業情報とデバイス情報とに対応して作業アプリケーションを格納するデータベースである。指示履歴DB302は、図9A〜図9Eに示した各デバイスから取得した指示情報の履歴を蓄積するデータベースである。デバイスDB413は、図4Cのように、ディスクリプタからデバイスを特定するためのデータベースである。デバイスドライバDB414は、図10に示したデバイスに対応してデバイスドライバを格納するデータベースである。
ストレージ1150には、以下のプログラムが格納される。クラウドサーバ制御プログラム1151は、本クラウドサーバ210の全体を制御するプログラムである。ユーザ登録モジュール1152は、クラウドサーバ制御プログラム1151において、通信端末から要請されたユーザ登録を行なうモジュールである。指示情報蓄積モジュール1153は、クラウドサーバ制御プログラム1151において、作業中に各デバイスで検出した作業者の指示情報を受信して、指示履歴DB302に蓄積するモジュールである。指示認識モジュール1154は、クラウドサーバ制御プログラム1151において、指示履歴DB302を参照して、受信した指示情報の組合せから作業者の指示を認識するモジュールである。指示情報変更モジュール1155は、クラウドサーバ制御プログラム1151において、受信した指示情報に信頼性低下があった場合に、受信する指示情報を変更するモジュールである。作業アプリケーション1156は、作業アプリケーションDB407から読み出されて実行されるプログラムである。
なお、図11のRAM1140やストレージ1150には、クラウドサーバ210が有する汎用の機能や他の実現可能な機能に関連するプログラムやデータは図示されていない。
(指示情報テーブル)
図12は、本実施形態に係る指示情報テーブル1142の構成を示す図である。指示情報テーブル1142は、各デバイスで検出された指示情報を受信して記憶するテーブルであり、指示情報受信部301や指示認識部303で使用される。
図12は、本実施形態に係る指示情報テーブル1142の構成を示す図である。指示情報テーブル1142は、各デバイスで検出された指示情報を受信して記憶するテーブルであり、指示情報受信部301や指示認識部303で使用される。
指示情報テーブル1142は、受信した指示情報と、これと合致した指示情報と、合致結果により指示情報から抽出した支持コマンドIDとを有する、第1接続デバイス1201と第2接続デバイス1202とを記憶する。なお、接続デバイスは2つに限定されない。
(指示認識テーブル)
図13は、本実施形態に係る指示認識テーブル1143の構成を示す図である。指示認識テーブル1143は、受信した指示情報を組み合わせて作業者の指示を認識するためのテーブルであり、指示認識部303で使用される。
図13は、本実施形態に係る指示認識テーブル1143の構成を示す図である。指示認識テーブル1143は、受信した指示情報を組み合わせて作業者の指示を認識するためのテーブルであり、指示認識部303で使用される。
指示認識テーブル1143は、n回前に認識した指示コマンドID1301、(n−1)回前に認識した指示コマンドID1302、…、前回に認識した指示コマンドID1303、第1接続デバイスの指示コマンドID1304、第2接続デバイスの指示コマンドID1304、を記憶する。そして、それら情報の組合せから認識した指示コマンドID1306とその指示内容1307とを記憶する。なお、認識に当たっての組合せは、第1接続デバイスの指示コマンドと、第2接続デバイスの指示コマンドとの組合せを考慮する。その外に、例えば、前回の指示コマンドとから考えられる今回の指示コマンドの絞り込みや、n回前からの指示コマンドのシーケンスから作業の進行を把握して今回の指示コマンドの絞り込みなどを行なう。
(信頼性判定テーブル)
図14は、本実施形態に係る信頼性判定テーブル1144の構成を示す図である。信頼性判定テーブル1144は、指示履歴DB302を参照して受信した指示情報の信頼性を判定するためのテーブルであり、信頼性判定部304で使用される。
図14は、本実施形態に係る信頼性判定テーブル1144の構成を示す図である。信頼性判定テーブル1144は、指示履歴DB302を参照して受信した指示情報の信頼性を判定するためのテーブルであり、信頼性判定部304で使用される。
信頼性判定テーブル1144は、指示情報検出のため接続しているデバイスのデバイスID1401とデバイス種別1402に対応付けて、現在のデバイス状況を記憶する。現在のデバイス状況には、例えば、デバイスからの信号なし1403、指示情報判別不能1404、自デバイスや他デバイスが検出した環境情報1405などを含む。ここで、指示情報判別不能1404は、作業者の指示を表わす指示情報が抽出できない状態であり、騒音や雑音でマイクからの指示情報が判別できない場合や、強い色や光あるいは暗くなって背景から作業者を判別できない場合などが含まれる。そして、現在のデバイス状況を勘案して、信頼性の高低1406を判定して記憶する。
(指示情報変更テーブル)
図15は、本実施形態に係る指示情報変更テーブル1145の構成を示す図である。指示情報変更テーブル1145は、指示情報の信頼性低下があると、指示履歴DB302を参照して、他の指示情報を選定するためのテーブルである。
図15は、本実施形態に係る指示情報変更テーブル1145の構成を示す図である。指示情報変更テーブル1145は、指示情報の信頼性低下があると、指示履歴DB302を参照して、他の指示情報を選定するためのテーブルである。
指示情報変更テーブル1145は、作業アプリケーションID1501とユーザID1502に対応付けて、現在の第1接続デバイス1503と第2接続デバイス1504、そして、第1接続デバイスから変更するデバイス候補1505と第2接続デバイスから変更するデバイス候補1506を記憶する。
《クラウドサーバの処理手順》
図16は、本実施形態に係るクラウドサーバ210の処理手順を示すフローチャートである。このフローチャートは、図11のCPU1110がRAM1140を使用して実行し、図5の機能構成部を実現する。なお、CPU1110は、RAM1140にデータが受信あるいは転送されたことを認識してデータを処理すると共に、処理結果をRAM1140に準備し、後の送信あるいは転送は通信制御部501やDMAに任せる構成を例として説明する。
図16は、本実施形態に係るクラウドサーバ210の処理手順を示すフローチャートである。このフローチャートは、図11のCPU1110がRAM1140を使用して実行し、図5の機能構成部を実現する。なお、CPU1110は、RAM1140にデータが受信あるいは転送されたことを認識してデータを処理すると共に、処理結果をRAM1140に準備し、後の送信あるいは転送は通信制御部501やDMAに任せる構成を例として説明する。
CPU1110はステップS1601において、作業アプリケーションやデバイスドライバの選定などの初期設定をするか否かを判定する。初期設定をする場合、CPU1110はステップS1603に進んで、初期設定処理を実行する(図17A参照)。次に、CPU1110はステップS1605において、デバイスあるいは携帯端末からの指示情報の受信か否かを判定する。指示情報の受信であれば、CPU1110はステップS1607に進んで、指示情報蓄積処理を実行する(図17B参照)。
次に、CPU1110はステップS1609において、受信した指示情報の信頼性が低下したか否かを判定する。信頼性の低下がなければ、CPU1110はステップS1611に進んで、受信した指示情報を使って指示情報認識処理を実行する(図17C参照)。そして、CPU1110はステップS1613において、認識した作業者の指示に対応する指示対応処理を実施する。一方、信頼性の低下があれば、CPU1110はステップS1615に進んで、信頼性が低下した指示情報を他の指示情報に変更する指示情報変更処理を実行する(図17D参照)。
(初期設定処理)
図17Aは、本実施形態に係る初期設定処理(S1603−1)の手順を示すフローチャートである。
図17Aは、本実施形態に係る初期設定処理(S1603−1)の手順を示すフローチャートである。
CPU1110はステップS1711において、RAM1140の送受信データ1146から作業情報を取得する。次に、CPU1110はステップS1713において、作業情報検出用に接続された接続デバイス情報を取得する。次に、CPU1110はステップS1715において、作業情報と接続デバイス情報とに基づき、作業アプリケーションDB407から作業アプリケーションを選定する。そして、CPU1110はステップS1717において、選定した作業アプリケーションを開始する。なお、作業アプリケーションの選定に対応して、デバイスドライバも選定されてよい。また、デバイスドライバは、携帯端末220のドライバ受信部にダウンロードされてもよい。
(指示情報蓄積処理)
図17Bは、本実施形態に係る指示情報蓄積処理(S1607)の手順を示すフローチャートである。
図17Bは、本実施形態に係る指示情報蓄積処理(S1607)の手順を示すフローチャートである。
CPU1110はステップS1721において、RAM1140の送受信データ1146から受信した複数の指示情報を取得する。そして、CPU1110はステップS1723において、作業種別、作業アプリケーション、ユーザ、検出用接続デバイスなどにより検索可能に、受信した指示情報を指示履歴DB302に蓄積する。
(信頼性判定処理)
図17Cは、本実施形態に係る信頼性判定処理(S1609−1)の手順を示すフローチャートである。
図17Cは、本実施形態に係る信頼性判定処理(S1609−1)の手順を示すフローチャートである。
CPU1110はステップS1731において、検出用接続デバイスから障害情報を受信したか否かを判定する。障害情報を受信すると、CPU1110はステップS1747に進んで、対応する指示情報の信頼性低下フラグをONにする。
障害情報の受信がなければ、CPU1110はステップS1747に進んで、1つの指示情報を選定して、その長期および短期の変化を分析する。そして、CPU1110はステップS1735において、信号の検出レベルの低下があるか否かを判定する。信号レベルの低下がなければ、CPU1110はステップS1737に進んで、指示情報の抽出精度が低下したか否かを判定する。抽出精度の低下がなければ、CPU1110はステップS1741に進んで、現在、作業で検出している全指示情報を検査したか否かを判定する。検査が完了してなければ、CPU1110はステップS1733に戻って、他の指示情報の変化を分析検査する。CPU1110は、ステップS173の判定で検出レベルの低下と判定し、また、ステップS1737の判定で抽出精度の低下と判定した場合、ステップS1739に進んで、対応する指示情報の信頼性低下フラグをONにする。
現在、作業で検出している全指示情報の検査が完了した場合、CPU1110はステップS1743に進んで、環境情報を取得する。環境情報としては、周囲の騒音や雑音、雨や雪などの天気、明暗などがあるが、検出デバイスの指示情報検出に影響するあらゆる条件が含まれる。次に、CPU1110はステップS1745において、取得した環境情報から、今後の検出レベルの低下や抽出精度の低下を予測する。そして、検出レベルの低下や抽出精度の低下が予測されると、CPU1110はステップS1747に進んで、対応する指示情報の信頼性低下フラグをONにする。
なお、予測は環境情報に基づいて行なったが、簡単に現在時刻からこの季節ではこの後何分で暗くなるかなどの予測でもよい。あるいは、クラウドサーバ210が天気予報や作業現場近辺の状態を取得して、環境変化を予測してもよい。
(指示情報認識処理)
図17Dは、本実施形態に係る指示情報認識処理(S1611)の手順を示すフローチャートである。
図17Dは、本実施形態に係る指示情報認識処理(S1611)の手順を示すフローチャートである。
CPU1110はステップS1751において、1つのデバイスからの指示情報を取得する。そして、CPU1110はステップS1753において、指示コマンドの指示情報と比較して、取得した指示情報の指示コマンドを認識する。次に、CPU1110はステップS1755において、指示コマンドの認識結果と過去の指示コマンドとの矛盾の有無を判定する。矛盾がなければ、CPU1110はステップS1757に進んで、1つのデバイスからの指示情報による指示コマンドを確定する。矛盾があれば、CPU1110はステップS1757の処理はしない。そして、CPU1110はステップS1759において、他のデバイスが接続されているかを判定する。他のデバイスが接続されていれば、CPU1110はステップS1751に戻って、他のデバイスからの指示情報について認識を繰り返す。
他のデバイスがなければ、CPU1110はステップS1761に進んで、上記繰り返しで確定した複数のデバイスの指示コマンドの組合せから、ユーザである作業者の指示を認識する。
(指示情報変更処理)
図17Eは、本実施形態に係る指示情報変更処理(S1615−1)の手順を示すフローチャートである。
図17Eは、本実施形態に係る指示情報変更処理(S1615−1)の手順を示すフローチャートである。
CPU1110はステップS1771において、信頼性低下フラグがONである指示情報、そしてデバイスを検索する。次に、CPU1110はステップS1773において、作業種別、作業アプリケーション、ユーザなどに対応して、変更する指示情報とそのデバイスとを選定する。なお、選定条件にユーザが入っている理由は、ユーザである作業者の癖によって、指示情報の信頼性が変化するからである。このように、本実施形態の指示履歴DB302を参照すれは、作業者の癖なども学習して考慮することができる。
《携帯端末のハードウェア構成》
図18は、本実施形態に係る携帯端末220のハードウェア構成を示すブロック図である。
図18は、本実施形態に係る携帯端末220のハードウェア構成を示すブロック図である。
図18で、CPU1810は演算制御用のプロセッサであり、プログラムを実行することで図6の携帯端末220の機能構成部を実現する。ROM1820は、初期データおよびプログラムなどの固定データおよびプログラムを記憶する。また、通信制御部603は、ネットワーク340を介してクラウドサーバ210と通信する。なお、CPU1810は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPUを含んでもよい。また、通信制御部603は、CPU1810とは独立したCPUを有して、RAM1840の領域に送受信データを書き込みあるいは読み出しするのが望ましい。また、RAM1840とストレージ1850との間でデータを転送するDMACを設けるのが望ましい(図示なし)。さらに、入出力インタフェース1860は、CPU1810とは独立したCPUを有して、RAM1840の領域に入出力データを書き込みあるいは読み出しするのが望ましい。したがって、CPU1810は、RAM1840にデータが受信あるいは転送されたことを認識してデータを処理する。また、CPU1810は、処理結果をRAM1840に準備し、後の送信あるいは転送は通信制御部603やDMAC、あるいは入出力インタフェース1860に任せる。
RAM1840は、CPU1810が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM1840には、本実施形態の実現に必要なデータを記憶する領域が確保されている。ユーザ登録データ1841は、クラウドサーバ210にユーザ登録するためユーザが入力したデータである。作業情報1842は、携帯端末220において作業者が入力した作業を特定する情報である。ディスクリプタ1843は、USBコネクタ610に接続したデバイスから読み出したデバイス情報である。指示情報1844は、ユーザである作業者からデバイスから取得して、クラウドサーバ210に送信する作業者の指示を表わす情報である。指示応答データ1845は、クラウドサーバ210から受信した、指示情報から認識された作業者の指示に応答するデータである。デバイスサーバ送受信パケット1846は、USBデバイスに入出力するパケット、および通信制御部603を介してクラウドサーバ210と送受信するIPカプセリングしたパケットである。入出力データ1847は、入出力インタフェース1860を介して入出力されるデータである。
ストレージ1850には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。端末情報1851は、本通信端末の識別子を含む情報である。ストレージ1850には、以下のプログラムが格納される。携帯端末制御プログラム1852は、本携帯端末220の全体を制御する制御プログラムである。ディスクリプタ転送モジュール1853は、接続デバイスから取得したディスクリプタをクラウドサーバ210に転送するモジュールである。指示情報転送モジュール1854は、接続デバイスが検出した指示情報をクラウドサーバ210に転送するためのモジュールである。デバイス入出力データ中継モジュール1855は、クラウドサーバ210と接続デバイス間のデータの入出力を中継するモジュールである。汎用USBドライバ1856は、デバイスのディスクリプタ読み出しなどの基本的なUSBプロトコルを実行するプログラムである。USB接続デバイスドライバ1857は、本携帯端末がデバイスドライバを実行する機能を有する場合に、クラウドサーバ210からダウンロードされたプログラムである。なお、本携帯端末が作業アプリケーションの一部を分担可能であれば、そのプログラムがストレージ1850に格納されてよい。
入出力インタフェース1860は、入出力機器との入出力データをインタフェースする。入出力インタフェース1860には、表示部606、タッチパネルなどからなる操作部601が接続される。また、スピーカやマイクなどの音声入出力部607が接続される。さらに、GPS位置生成部1861やカメラ1862などが接続される。そして、USBコネクタ610が接続される。
なお、図18のRAM1840やストレージ1850には、携帯端末220が有する汎用の機能や他の実現可能な機能に関連するプログラムやデータは図示されていない。
《携帯端末の処理手順》
図19は、本実施形態に係る携帯端末220の処理手順を示すフローチャートである。このフローチャートは、図18のCPU1810がRAM1840を使用して実行し、図6の機能構成部を実現する。
図19は、本実施形態に係る携帯端末220の処理手順を示すフローチャートである。このフローチャートは、図18のCPU1810がRAM1840を使用して実行し、図6の機能構成部を実現する。
CPU1810は、イベント発生を受けてその内容を判定する。CPU1810はステップS1911において、USBコネクタにデバイスが接続されたか否かを判定する。また、USBコネクタへのデバイス接続でない場合、CPU1810はステップS1921において、クラウドサーバ210からの操作画面の受信か否かを判定する。また、USBコネクタへのデバイス接続でなく、かつ、操作画面の受信でない場合、CPU1810はステップS1931において、デバイス宛のデータをクラウドサーバ210から受信したか否か、あるいは、デバイスからのデータを受信したか否かを判定する。また、USBコネクタへのデバイス接続でなく、操作画面の受信でなく、かつ、データ転送でない場合、CPU1810はステップS1941において、通信端末や接続デバイスが検出した指示情報の送信要求か否かを判定する。
USBコネクタにデバイスが接続された場合、CPU1810はステップS1911からS1913に進んで、汎用USBドライブを起動する。そして、CPU1810はステップS1915において、デバイスのディスクリプタを取得する。次に、CPU1810はステップS1917において、取得したディスクリプタをクラウドサーバ210に送信する。
また、操作画面の受信であれば、CPU1810はステップS1921からS1923に進んで、RAM1840から操作画面を取得して表示部606に表示する。そして、CPU1810はステップS1925において、ユーザの操作入力を待つ。ユーザからの操作入力があると、CPU1810はステップS1927に進んで、RAM1840の入出力データ1847から操作指示を取得し、クラウドサーバ210への送信を通信制御部603に指示する。
また、デバイス宛のデータのクラウドサーバ210からの転送要求、あるいはクラウドサーバ210宛のデータのデバイスからの受信要求であれば、CPU1810はステップS1931からS1933に進む。そして、CPU1810はステップS1933において、RAM1840のデバイスサーバ送受信パケット1846を、デバイス宛あるいはクラウドサーバ宛へのデータ転送を指示する。
また、授業情報の送信要求と判定すると、CPU1810はステップS1941からS1943に進んで、RAM1840の入出力データ1847から指示情報を取得して指示情報1844に記憶する。そして、CPU1810はステップS1945において、指示情報1844をクラウドサーバ210に送信するよう通信制御部603に指示する。
本実施形態によれば、デバイスからの指示情報の信頼性低下に応じて信頼性の高いデバイスに変更されるので、指示情報検出の信頼性が低下した場合であっても、操作者の指示の検出を持続することができる。
[第3実施形態]
次に、本発明の第3実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2実施形態と比べると、信頼性が低下した指示情報を他の指示情報に変更するよう作業者に指示するのではなく、クラウドサーバ自身で信頼性が低下した指示情報を他の指示情報に変更する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に、本発明の第3実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2実施形態と比べると、信頼性が低下した指示情報を他の指示情報に変更するよう作業者に指示するのではなく、クラウドサーバ自身で信頼性が低下した指示情報を他の指示情報に変更する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、デバイスからの指示情報の信頼性低下に応じて信頼性の高いデバイスに自動的に変更されるので、指示情報検出の信頼性が低下した場合であっても、操作者の操作なしに指示の検出を持続することができる。
《ユーザ指示認識システム》
図20〜図22を参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ2010を含むユーザ指示認識システム2000について説明する。
図20〜図22を参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ2010を含むユーザ指示認識システム2000について説明する。
(システムの概要)
図20は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム2000の概要を示す図である。図20においては、クラウドサーバ2010が、野外の作業現場におけるユーザである作業者の指示を、スマートフォンである携帯端末220に接続したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ2010は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、指示情報を受信するデバイスを信頼性が高く、組み合わせる指示情報との相性がよいデバイスに切り替える。
図20は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム2000の概要を示す図である。図20においては、クラウドサーバ2010が、野外の作業現場におけるユーザである作業者の指示を、スマートフォンである携帯端末220に接続したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ2010は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、指示情報を受信するデバイスを信頼性が高く、組み合わせる指示情報との相性がよいデバイスに切り替える。
図20において、携帯端末220には、ルータを介してイヤホンマイク230と唇撮影用カメラ250と通電センサ260とが接続されている。イヤホンマイク230は、作業者の音声指示の検出をする。唇撮影用カメラ250は、作業者の言葉に対応する唇の動きを撮影する。通電センサ260は作業者の首に設定されて、首の筋肉の動きを検出する。また、通信機能を有するビデオカメラ240が作業者の動作指示を検出している。携帯端末220の表示画面220aには、図2と同様に、作業者の現在の指示入力として、マイクからの入力音声とカメラからの入力動作とが使用されていることが表示され、また、音声や動作と指示コマンドとの関連も表示されている。なお、イヤホンマイク230のイヤホンから表示と同時に音声による説明がされるのが望ましい。
クラウドサーバ2010は、マイクからの入力音声とカメラからの入力動作とを指示情報として受信し、蓄積された指示情報の履歴を参照して、作業者の指示を認識する。このようにすることで、作業者がキー入力などで指示をする必要がなく、両手を作業に使うことができる。
ここで、工事現場の作業などで周囲の雑音が高くなると、クラウドサーバ2010は、マイク入力から作業者の音声を識別し難いと判定する。クラウドサーバ2010は、指示情報の検出元を唇撮影用カメラ250に切り替えて、唇撮影用カメラ250からの唇変化とビデオカメラ240からの入力動作とを指示情報として受信し、蓄積された指示情報の履歴を参照して、作業者の指示を認識する。そして、クラウドサーバ2010は、携帯端末220の表示画面220fに、“周囲の雑音でマイク入力の信頼性が低下しています。唇撮影用カメラに変更しました。”との指示メッセージを表示する。なお、図20には図示しないが、唇撮影用カメラに変更したため、唇の動きを大きくするなどの注意事項を表示してもよい。図2と同様に、携帯端末220の表示画面220cには、作業者の現在の指示入力として、唇撮影用カメラからの唇変化とカメラからの入力動作とが使用されていることが表示され、また、唇変化や動作と指示コマンドとの関連も表示される。
一方、夕方になって作業現場の周囲が暗くなってくると、クラウドサーバ2010は、カメラ入力から作業者の動作を識別し難いと判定する。クラウドサーバ2010は、指示情報の検出元を通電センサ260に切り替えて、通電センサ260からの首の動きを示す電気信号とカメラからの入力動作とを指示情報として、作業者の指示を認識する。そして、携帯端末220の表示画面220gに、“暗くなりカメラ入力の信頼性が低下しています。入力を通電センサによる首の動作に変更しました。指示時には首を後に反らしてください。”との指示メッセージを表示する。携帯端末220の表示画面220eには、作業者の現在の指示入力として、通電センサからの首の動きとカメラからの入力動作とが使用されていることが表示され、また、首の動きや動作と指示コマンドとの関連も表示される。
なお、図20においては、図2との比較のため、周囲の雑音によるマイク入力の信頼性低下と、暗くなったためのカメラ入力の信頼性低下とを説明したが、デバイスの故障や通信不良などもクラウドサーバ2010によって信頼性低下と判定可能である。例えば、受信信号のレベルや指示認識率なども信頼性の判定条件である。
(システムの構成)
図21は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム200の構成を示す図である。なお、図21において、図3と同様の構成要素には同じ参照番号を付して、説明を省略する。
図21は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム200の構成を示す図である。なお、図21において、図3と同様の構成要素には同じ参照番号を付して、説明を省略する。
ユーザ指示認識システム2000は、ネットワーク340を介して接続されるクラウドサーバ2010と、種々の作業現場における作業者の指示情報を取得する指示情報取得デバイス群を有する種々の作業現場2110〜2130とを備える。なお、本実施形態では、作業現場2110〜2130の作業者は、準備可能で接続可能な指示情報を検出するデバイスをできるだけ全て接続している。これは、デバイスが接続されてないために、クラウドサーバ2010の指示情報の切り替えが遅延するのを防ぐためである。
本実施形態のクラウドサーバ2010の基本構成には、図2のクラウドサーバ210の機能構成部の外に、信頼性の低下した指示情報をクラウドサーバ2010で切り替えるための指示情報変更処理部2105を備える。また、クラウドサーバ2010による指示情報の変更を携帯端末220から作業者に通知するための指示情報変更通知部2111を備える。
(システムの動作手順)
図22は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム2000の動作手順2200を示すシーケンス図である。なお、図22において、図4Bと同様のステップには同じステップ番号を付して、説明は省略する。また、図22は図4Bに対応する図であるが、他のシーケンス図である図4A、図4Cおよび図4Dは本実施形態にも援用される。
図22は、本実施形態に係るクラウドサーバ2010を含むユーザ指示認識システム2000の動作手順2200を示すシーケンス図である。なお、図22において、図4Bと同様のステップには同じステップ番号を付して、説明は省略する。また、図22は図4Bに対応する図であるが、他のシーケンス図である図4A、図4Cおよび図4Dは本実施形態にも援用される。
クラウドサーバ2010は、ステップS2243において、指示情報を切り替えて指示情報処理の変更を自動で行なう。次に、クラウドサーバ2010は、ステップS2244において、指示情報を変更したことを携帯端末220に通知する。
《クラウドサーバの機能構成》
図23は、本実施形態に係るクラウドサーバ2010の機能構成を示すブロック図である。なお、図23において、図5と同様な機能構成部には同じ参照番号を付して、説明は省略する。
図23は、本実施形態に係るクラウドサーバ2010の機能構成を示すブロック図である。なお、図23において、図5と同様な機能構成部には同じ参照番号を付して、説明は省略する。
図23においては、指示情報変更処理部2105は、信頼性判定部304が受信した指示情報に信頼性低下を判定した場合、指示履歴DB302の指示履歴を参照して、適切な指示情報を選定して指示情報の変更処理を行なう。指示情報変更処理部2105による指示情報の変更は、指示情報受信部301や作業アプリケーション実行部508における受信制御で行なわれる。そして、指示情報変更処理部2105は、指示情報変更を作業アプリケーション選定部507に伝えて、作業アプリケーション選定部507は、必要であれば作業アプリケーションの選定をやり直す。なお、本実施形態においてはデバイスが変更されるので、使用するデバイスドライバも切り替える。指示情報変更通知部2111は、指示情報変更処理部2105の指示情報変更を携帯端末220に通知する。
(指示情報変更処理)
図24は、本実施形態に係る指示情報変更処理(S1615−2)の手順を示すフローチャートである。このフローチャートは、図16のS1615に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図23の機能構成部を実現する。なお、図24において、図17Eと同様のステップには同じステップ番号を付して、説明は省略する。
図24は、本実施形態に係る指示情報変更処理(S1615−2)の手順を示すフローチャートである。このフローチャートは、図16のS1615に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図23の機能構成部を実現する。なお、図24において、図17Eと同様のステップには同じステップ番号を付して、説明は省略する。
CPU1110はステップS2465において、指示情報を切り替えて、指示情報処理を変更する。そして、CPU1110はステップS2475において、ユーザ端末に指示情報が変更されたことを通知する。
本実施形態によれば、デバイスからの指示情報の信頼性低下に応じて信頼性の高いデバイスに自動的に変更されるので、指示情報検出の信頼性が低下した場合であっても、操作者の操作なしに指示の検出を持続することができる。
[第4実施形態]
次に、本発明の第4実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2実施形態および第3実施形態と比べると、現場作業の開始前にあらかじめ作業時に作業者の指示を認識するために必要な接続デバイスを問い合わせる点で異なる。なお、ここで必要な接続デバイスとは、クラウドサーバが指示履歴DBを参照して、第2実施形態の接続変更や第3実施形態の自動切り替えに必要と予測される接続デバイスである。その他の構成および動作は、第2および第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に、本発明の第4実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2実施形態および第3実施形態と比べると、現場作業の開始前にあらかじめ作業時に作業者の指示を認識するために必要な接続デバイスを問い合わせる点で異なる。なお、ここで必要な接続デバイスとは、クラウドサーバが指示履歴DBを参照して、第2実施形態の接続変更や第3実施形態の自動切り替えに必要と予測される接続デバイスである。その他の構成および動作は、第2および第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、デバイスの変更時や自動切り替え時に、適切なデバイスがない、あるいは接続されてない状況をあらかじめ回避するので、迅速で好適な指示情報の変更ができる。
《ユーザ指示認識システム》
図25および図26を参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ2510を含むユーザ指示認識システム2500について説明する。
図25および図26を参照しながら、本実施形態に係る情報処理装置であるクラウドサーバ2510を含むユーザ指示認識システム2500について説明する。
(システムの概要)
図25は、本実施形態に係るクラウドサーバ2510を含むユーザ指示認識システム2500の概要を示す図である。図25においては、野外の作業現場における作業開始前に、ユーザである作業者が作業情報をクラウドサーバ2510に通知すると、クラウドサーバ2510は、作業に当たって作業者の指示を認識するために必要なデバイスの一覧をスマートフォンである携帯端末220に提示する。作業時には、クラウドサーバ2510が、作業者の指示を、携帯端末220に接続して準備したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ2510は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、指示情報を受信するデバイスを信頼性が高く、組み合わせる指示情報との相性がよいデバイスに切り替える。
図25は、本実施形態に係るクラウドサーバ2510を含むユーザ指示認識システム2500の概要を示す図である。図25においては、野外の作業現場における作業開始前に、ユーザである作業者が作業情報をクラウドサーバ2510に通知すると、クラウドサーバ2510は、作業に当たって作業者の指示を認識するために必要なデバイスの一覧をスマートフォンである携帯端末220に提示する。作業時には、クラウドサーバ2510が、作業者の指示を、携帯端末220に接続して準備したデバイスから取得した指示情報に基づいて認識する。そして、クラウドサーバ2510は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、指示情報を受信するデバイスを信頼性が高く、組み合わせる指示情報との相性がよいデバイスに切り替える。
図25において、携帯端末220から表示画面220hの上半分に示すように、作業情報がクラウドサーバ2510通知される。これに応答して、クラウドサーバ2510は、指示履歴DBを参照して、準備すべきデバイスの一覧を携帯端末220の表示画面220hの下半分のように提示する。図25においては、接続デバイスとして、マイク、カメラ、唇撮影用カメラ、通電センサが提示されている。なお、この接続デバイスは第3実施形態の図20と同様であるが、同じである必要はない。本実施形態においては、指示履歴DBの指示履歴から相性のよい組合せで、変更や切り替えが容易であり、かつ、余分なデバイスを準備するのでコスト的にも考慮して選定される。ただし、作業が中断することは避けるような選定がなされる。
図25において、携帯端末220には、クラウドサーバ2510の提示に従って、ルータを介してイヤホンマイク230と唇撮影用カメラ250と通電センサ260とが接続され、通信機能を有するビデオカメラ240が作業者の動作指示を検出している。携帯端末220の表示画面220iには、接続されているデバイス一覧と、網掛けにより作業者の現在の指示入力として、マイクからの入力音声とカメラからの入力動作とが使用されていることが表示されている。
ここで、工事現場の作業などで周囲の雑音が高くなると、クラウドサーバ2510は、マイク入力から作業者の音声を識別し難いと判定する。クラウドサーバ2510は、指示情報の検出元を唇撮影用カメラ250に切り替えて、唇撮影用カメラ250からの唇変化とビデオカメラ240からの入力動作とを指示情報として受信し、蓄積された指示情報の履歴を参照して、作業者の指示を認識する。なお、携帯端末220の表示画面220fは図20と同様である。そして、携帯端末220の表示画面220jには、接続されているデバイス一覧と、網掛けにより作業者の現在の指示入力として、唇撮影用カメラからの唇変化とカメラからの入力動作とが使用されていることが表示される。
一方、夕方になって作業現場の周囲が暗くなってくると、クラウドサーバ2510は、カメラ入力から作業者の動作を識別し難いと判定する。クラウドサーバ2510は、指示情報の検出元を通電センサ260に切り替えて、通電センサ260からの首の動きを示す電気信号とカメラからの入力動作とを指示情報として、作業者の指示を認識する。なお、携帯端末220の表示画面220gは図20と同様である。そして、携帯端末220の表示画面220kには、接続されているデバイス一覧と、網掛けにより作業者の現在の指示入力として、通電センサからの首の動きとカメラからの入力動作とが使用されていることが表示される。
(システムの動作手順)
図26は、本実施形態に係るクラウドサーバ2510を含むユーザ指示認識システム2500の動作手順2600を示すシーケンス図である。なお、図26において、図4Aと同様なステップには同じステップ番号を付して、説明は省略する。また、図26は図4Aに対応する図であるが、他のシーケンス図である図22、図4Cおよび図4Dは本実施形態にも援用される。
図26は、本実施形態に係るクラウドサーバ2510を含むユーザ指示認識システム2500の動作手順2600を示すシーケンス図である。なお、図26において、図4Aと同様なステップには同じステップ番号を付して、説明は省略する。また、図26は図4Aに対応する図であるが、他のシーケンス図である図22、図4Cおよび図4Dは本実施形態にも援用される。
作業者の携帯端末220は、ステップS2601において、作業内容や作業場所、作業環境などを含む作業情報をクラウドサーバ2510に送信する。クラウドサーバ2510は、ステップS2603において、携帯端末220から受信した作業情報に対応する作業アプリケーションを作業アプリケーションDB407から選定する。
次に、クラウドサーバ2510は、ステップS2605において、指示履歴DB2602の指示履歴を参照して、作業現場で準備すべき接続デバイスを選定する。そして、クラウドサーバ2510は、ステップS2607において、選定された接続デバイス情報を携帯端末220に通知する。携帯端末220は、ステップS2609において、受信した接続デバイス情報を一覧表示する。
一覧表示された全デバイスを接続して、ステップS2611において、各デバイスからのデバイス情報がクラウドサーバ2510に通知される。クラウドサーバ2510は、ステップS2613において、指示履歴DB2602を参照して、初期に使用する作業現場で最も適切に作業者の指示情報を検出するデバイスを選定する。そして、携帯端末220からクラウドサーバ2510に作業アプリケーションの開始指示があると、ステップS407で作業アプリケーションが起動する。
《クラウドサーバの機能構成》
図27は、本実施形態に係るクラウドサーバ2510の機能構成を示すブロック図である。なお、図27において、特に図23と同様な機能構成部には同じ参照番号を付して、説明は省略する。また、図27では、本実施形態の図23からの変更部分を示し、他の機能構成部は省略している。
図27は、本実施形態に係るクラウドサーバ2510の機能構成を示すブロック図である。なお、図27において、特に図23と同様な機能構成部には同じ参照番号を付して、説明は省略する。また、図27では、本実施形態の図23からの変更部分を示し、他の機能構成部は省略している。
作業アプリケーション選定部2707は、受信した作業情報から作業アプリケーションを選定する。接続デバイス選定部2708は、選定された作業アプリケーションに基づいて、指示履歴DB2602を参照して、準備すべき接続デバイスを選定する。接続デバイス通知部2709は、選定された接続デバイスを携帯端末220に通知する。初期使用デバイス選定部2710は、デバイス情報受信部506が接続されたデバイスから受信したデバイス情報を参照して、初期使用デバイスを選定して作業アプリケーション実行部508に伝える。
(指示履歴DB)
図28は、本実施形態に係る指示履歴DB2602の特徴ある構成を示す図である。ここで、指示履歴DB2602は、図9A〜図9Eに示した指示履歴DB302に対して追加されるデータベースの構成を示すものである。なお、指示履歴DB2602の構成は図28に限定されない。
図28は、本実施形態に係る指示履歴DB2602の特徴ある構成を示す図である。ここで、指示履歴DB2602は、図9A〜図9Eに示した指示履歴DB302に対して追加されるデータベースの構成を示すものである。なお、指示履歴DB2602の構成は図28に限定されない。
指示履歴DB2602は、作業アプリケーションID2801に対して、異なる接続デバイス組2802と各組の成功率2803とを格納する。履歴を蓄積するにつれて成功率により適切な組合せが学習される。なお、作業環境などの他の条件を追加して、履歴を蓄積してもよい。
(準備デバイス判定テーブル)
図29は、本実施形態に係る準備デバイス判定テーブル2900の構成を示す図である。準備デバイス判定テーブル2900は、作業情報と選定された作業アプリケーションとに対応して接続デバイスを選定するためのテーブルであり、接続デバイス選定部2708や初期使用デバイス選定部2710で使用される。
図29は、本実施形態に係る準備デバイス判定テーブル2900の構成を示す図である。準備デバイス判定テーブル2900は、作業情報と選定された作業アプリケーションとに対応して接続デバイスを選定するためのテーブルであり、接続デバイス選定部2708や初期使用デバイス選定部2710で使用される。
準備デバイス判定テーブル2900は、作業情報2901と選定された作業アプリケーションID2902とを対応付けて、選定した接続デバイス組2903を記憶する。
(初期設定処理)
図30は、本実施形態に係る初期設定処理(S1603−2)の手順を示すフローチャートである。このフローチャートは、図16のS1603に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図27の機能構成部を実現する。なお、図30において、図17Aと同様のステップには同じステップ番号を付して、説明は省略する。
図30は、本実施形態に係る初期設定処理(S1603−2)の手順を示すフローチャートである。このフローチャートは、図16のS1603に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図27の機能構成部を実現する。なお、図30において、図17Aと同様のステップには同じステップ番号を付して、説明は省略する。
CPU1110はステップS3011において、作業情報に基づいて作業アプリケーションを選定する。次に、CPU1110はステップS3013において、選定した作業アプリケーションに基づき指示履歴DB2602を参照して、接続デバイスを選定して、携帯端末220に通知する。
CPU1110はステップS3015において、デバイスの接続によりデバイスから送信されるデバイス情報の受信を待つ。デバイス情報を受信すると、CPU1110はステップS3017に進んで、接続されたデバイスから、指示履歴DB2602を参照して初期使用デバイスを選定する。
本実施形態によれば、デバイスの変更時や自動切り替え時に、適切なデバイスがない、あるいは接続されてない状況をあらかじめ回避するので、迅速で好適な指示情報の変更ができる。
[第5実施形態]
次に、本発明の第5実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2乃至第4実施形態と比べると、作業や作業者、作業環境などを考慮して、選定されたデバイスからより確実に差別化できる指示情報を選定して作業者に指示する点で異なる。その他の構成および動作は、第2乃至第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に、本発明の第5実施形態に係る情報処理装置であるクラウドサーバを含むユーザ指示認識システムについて説明する。本実施形態に係るクラウドサーバは、上記第2乃至第4実施形態と比べると、作業や作業者、作業環境などを考慮して、選定されたデバイスからより確実に差別化できる指示情報を選定して作業者に指示する点で異なる。その他の構成および動作は、第2乃至第4実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
すなわち、屋外での作業や構内作業にあわせて、適切なデバイスの選定に加え、選定されたデバイスにおける間違いの少ない指示パターンを、さらに選定するようにする。例えば、屋外での亀裂検査の記録指示において、指示情報の履歴を参照して、音声指示をしつつ首を前に振る動作を対応づけるとミスが多い場合は、それを避けるために、その次の運用にむけて課題を指摘したり、首を反らす動作などのユーザの意志が確認できるうまい組合せパターンを初期選定して提示したりする。さらに、作業中に初期選定した指示パターンの認識精度が低下すると、デバイスは変更せずに認識精度のより高い指示パターンを変更して、ユーザに変更を指示する。
本実施形態によれば、指示情報の選定がデバイスの選定に限定されず、選定されたデバイスでより確実に差別化された指示情報を検出するので、指示情報の抽出および認識の信頼性が高くなり、作業者の指示の認識も確実となる。
《ユーザ指示認識システム》
図31は、本実施形態に係るクラウドサーバ3110を含むユーザ指示認識システム3100の概要を示す図である。例えば、通電センサを使用して首の動きを指示情報とする場合に、頷く動作を通電センサで検出すると、人間は頷く動作を、指示を意図しない場合にも行なう可能性が高い。そのため、指示を意図しない頷きの動作は指示の誤認識となる。一方、首を後に反らす動作を指示とすれば、首を後に反らす動作は意図的にされる場合が多いため、指示動作として差別化が可能である。
図31は、本実施形態に係るクラウドサーバ3110を含むユーザ指示認識システム3100の概要を示す図である。例えば、通電センサを使用して首の動きを指示情報とする場合に、頷く動作を通電センサで検出すると、人間は頷く動作を、指示を意図しない場合にも行なう可能性が高い。そのため、指示を意図しない頷きの動作は指示の誤認識となる。一方、首を後に反らす動作を指示とすれば、首を後に反らす動作は意図的にされる場合が多いため、指示動作として差別化が可能である。
図31においては、クラウドサーバ3110が、野外の作業現場におけるユーザである作業者の指示を認識するための、スマートフォンである携帯端末220に接続したデバイスと取得する指示情報を、指示履歴DBを参照して選定する。そして、クラウドサーバ3110は、携帯端末220に接続したデバイスからの指示情報の信頼性を判定し、信頼性低下があれば、デバイスから取得する指示情報を変更する。
図31において、携帯端末220の表示画面220mからユーザが作業情報を入力して、クラウドサーバ3110に通知する。クラウドサーバ3110は、指示履歴DBを参照して、作業者の指示を認識するための接続すべきデバイスを選定し、携帯端末220の表示画面220nに提示する。さらに、クラウドサーバ3110は、指示履歴DBを参照して、接続すべきデバイスから取得すべき指示情報を選定し、携帯端末220の表示画面220pに提示する。すなわち、地盤調査などで情報記録装置に必要な記録をする場合の情報記録指示において、認識の成功率がより高い検出情報の組合せとして、記録開始指示を作業者の音声「はい(hai)」と「首を反らす」動作の組合せで行ない、記録終了指示を作業者の音声「よし(yoshi)」と「首を反らす」動作の組合せで行なうことが、クラウドサーバ3110により初期選定される。携帯端末220の表示画面220qには、作業者の現在の指示入力として、マイクからの入力音声と通電センサからの動作情報による首の動作とが使用されていることが表示されている。
ここで、音声入力の「はい」と「よし」との組合せの信頼性が低下したとすると、クラウドサーバ3110は、指示履歴DBの指示履歴を参照して、携帯端末220の表示画面220rのように、イヤホンマイク230から取得する指示情報として音声入力を「はじめ(hajime)」と「よし」に変更する。なお、記録開始の音声入力「はい」から「はじめ」への変更は、指示入力の言葉の信頼性の向上(他の目的では使用しない言葉の使用)や、記録開始と終了との間の音声入力の差別化などを、指示履歴DBを参照して判定して選定する。
一方、動作入力の「首を反らす」指示の信頼性が低下すると、クラウドサーバ3110は、携帯端末220の表示画面220sのように、「首を続けて2回反らす」動作入力を選定して、作業者の指示情報として指示する。「首を反らす」指示の信頼性低下は、例えば、作業者の癖で首が反るような動作が頻繁に発生する場合などがある。また、「首を続けて2回反らす」動作入力への変更は、2回続ければ作業者の指示の意図がより明確に把握されるためである。
上記指示情報の信頼性低下の判定と指示情報の変更とは一例であって、本実施形態のように指示履歴を蓄積することにより、同様の信頼性回復が種々の接続デバイスに対しても可能である。
《クラウドサーバの機能構成》
図32は、本実施形態に係るクラウドサーバ3110の機能構成を示すブロック図である。なお、図32において、特に図27と同様な機能構成部には同じ参照番号を付して、説明は省略する。また、図32では、本実施形態の図27からの変更部分を示し、他の機能構成部は省略している。
図32は、本実施形態に係るクラウドサーバ3110の機能構成を示すブロック図である。なお、図32において、特に図27と同様な機能構成部には同じ参照番号を付して、説明は省略する。また、図32では、本実施形態の図27からの変更部分を示し、他の機能構成部は省略している。
指示情報選定部3208は、選定された接続デバイスとの組合せとして、指示履歴DB3202を参照して、より確実に指示情報を取得できる差別化可能な指示情報を選定する。指示情報提示部3209は、選定された指示情報を初期指示情報として携帯端末220に通知する。しかしながら、信頼性判定部304が指示情報の信頼性低下を判定すると、指示情報変更部3210が接続デバイスを変更せずに取得する指示情報を変更する。指示情報提示部3209は、指示情報の変更も携帯端末220に通知する。このようにして、接続デバイスと取得する指示情報との適切な組が学習される。
(指示履歴DB)
図33は、本実施形態に係る指示履歴DB3202の特徴ある構成を示す図である。ここで、指示履歴DB3202は、図9A〜図9Eに示した指示履歴DB302および図28に示した指示履歴DB2602に対して追加されるデータベースの構成を示すものである。なお、指示履歴DB3202の構成は図33に限定されない。
図33は、本実施形態に係る指示履歴DB3202の特徴ある構成を示す図である。ここで、指示履歴DB3202は、図9A〜図9Eに示した指示履歴DB302および図28に示した指示履歴DB2602に対して追加されるデータベースの構成を示すものである。なお、指示履歴DB3202の構成は図33に限定されない。
指示履歴DB3202は、初期の作業内容に基づいて選定された接続デバイスにおいて、作業内容における指示情報をより確実に認識できる検出情報を選定するための検出情報選定領域3310を有する。また、指示履歴DB3202は、作業中の指示情報の認識率の経過を格納して、信頼性低下時に検出情報を変更するための指示認識経過領域3320を有する。
指示履歴DB3202の検出情報選定領域3310は、作業アプリケーションID3311で使用する接続デバイス3312に対して、指示情報とその指示情報を認識する検出情報との組3313を格納する。そして、検出情報選定領域3310は、各指示情報と検出情報との組3313の使用による認識の成功率3314、失敗率3315、そして、その結果の使用優先順位3316を格納する。
指示履歴DB3202の指示認識経過領域3320は、作業アプリケーションID3321の複数の指示コマンドID3322に対して、異なる接続デバイスと取得する指示情報との組3323を格納する。そして、指示認識経過領域3320は、各接続デバイスと取得する指示情報との組3323の使用による認識の成功率3324、失敗率3325、そして、その結果の使用優先順位3326を格納する。本例においては、記録開始指示を表わす「はい」と「首を反らす」との組合せの信頼性が低下したので、「はじめ」と「首を反らす」との組合せに変更する。なお、「はい」と「首を反らす」との組合せの信頼性低下の原因としては、例えば、ユーザの発声の癖や、マイクの感度や特性、あるいは周囲環境などによる、「はい」の認識率の低下や、「はい」と「よし」との識別精度の低下などが考えられる。
(指示情報選別テーブル)
図34は、本実施形態に係る指示情報選別テーブル3400の構成を示す図である。指示情報選別テーブル3400は、指示情報の選定のため、あるいは指示情報の信頼性低下時に指示情報の変更のためのテーブルであり、指示情報選定部3208や指示情報変更部3210において使用される。
図34は、本実施形態に係る指示情報選別テーブル3400の構成を示す図である。指示情報選別テーブル3400は、指示情報の選定のため、あるいは指示情報の信頼性低下時に指示情報の変更のためのテーブルであり、指示情報選定部3208や指示情報変更部3210において使用される。
指示情報選別テーブル3400は、作業アプリケーションID3401に対して複数の指示コマンドID3402を記憶する。そして、各指示コマンドID3402に対応付けて、認識の成功回数と失敗回数を有する接続デバイスと指示情報の初期組3403と、代替した第1組3404、…、代替した第n組3405を記憶する。
(初期設定処理)
図35Aは、本実施形態に係る初期設定処理(S1603−3)の手順を示すフローチャートである。このフローチャートは、図16のS1603に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図32の機能構成部を実現する。なお、図35Aにおいて、図17Aおよび図30と同様のステップには同じ参照番号を付して、説明は省略する。
図35Aは、本実施形態に係る初期設定処理(S1603−3)の手順を示すフローチャートである。このフローチャートは、図16のS1603に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図32の機能構成部を実現する。なお、図35Aにおいて、図17Aおよび図30と同様のステップには同じ参照番号を付して、説明は省略する。
CPU1110はステップS3511において、指示情報の初期選定を行ない携帯端末220に通知する。本例において、CPU1110は、記録開始指示を表わすためには「はい」と「首を反らす」との組合せを選定して、携帯端末220に通知する。また、CPU1110は、記録終了指示を表わすためには「よし」と「首を反らす」との組合せを選択して、携帯端末220に通知する。ここで、マイクにおける認識精度は、特に音声認識の成功率による。一方、通電センサにおいける認識精度において、「頷く」動作は記録指示に限らずユーザが他の状況でも行なう可能性が高いので、紛らわしくて選別の役割が低下する。これに対して、「首を反らす」動作はユーザが記録指示であることを意識的に伝える意志がなければ、余り発生しない動作である。したがって、「首を反らす」動作の方が、「頷く」動作よりもユーザ指示であることを選別する役割が向上することになる。
(信頼性判定処理)
図35Bは、本実施形態に係る信頼性判定処理(S1609−2)の手順を示すフローチャートである。このフローチャートは、図16のS1609に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図32の機能構成部を実現する。なお、図35Bにおいて、図17Cと同様のステップには同じ参照番号を付して、説明は省略する。
図35Bは、本実施形態に係る信頼性判定処理(S1609−2)の手順を示すフローチャートである。このフローチャートは、図16のS1609に置き換えられて、図11のCPU1110がRAM1140を使用して実行し、図32の機能構成部を実現する。なお、図35Bにおいて、図17Cと同様のステップには同じ参照番号を付して、説明は省略する。
CPU1110はステップS3538において、指示情報の識別精度の低下を判定する。そして、識別精度の低下を判定すると、CPU1110はステップS1739に進んで、対応する指示情報の信頼性低下フラグをONにする。
本実施形態によれば、指示情報の選定がデバイスの選定に限定されず、選定されたデバイスでより確実に差別化された指示情報を検出するので、指示情報の抽出および認識の信頼性が高くなり、作業者の指示の認識も確実となる。
[他の実施形態]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
Claims (21)
- ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を受信する指示情報受信手段と、
前記指示情報の履歴を参照して、前記受信した指示情報からユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更手段と、
を備える情報処理装置。 - 前記指示履歴蓄積手段は、前記指示情報の履歴と前記指示情報の信頼性の低下とを関連付けて蓄積し、
前記信頼性判定手段は、前記受信した指示情報の履歴が前記信頼性の低下と関連付けて蓄積された指示情報の履歴に相当する場合に、前記指示情報の信頼性が低下したと判定する請求項1に記載の情報処理装置。 - 前記指示履歴蓄積手段は、指示情報を他の指示情報に変更した履歴を蓄積し、
前記指示情報変更手段は、前記変更した履歴に基づいて、前記変更する他の指示情報を選定する請求項1または2に記載の情報処理装置。 - 前記指示情報変更手段は、選定した他の指示情報を受信すべく、前記ユーザに対して前記他の指示情報の検出への変更を指示する変更指示手段を有する請求項1乃至3のいずれか1項に記載の情報処理装置。
- 前記指示情報変更手段は、選定した他の指示情報を受信すべく、前記指示情報受信手段を制御する受信制御手段を有し、
前記指示認識手段は、受信した前記他の指示情報に基づいて、前記ユーザの指示を認識する請求項1乃至3のいずれか1項に記載の情報処理装置。 - 前記指示情報変更手段は、指示情報を他の検出デバイスから受信することにより、前記他の指示情報に変更する請求項1乃至5のいずれか1項に記載の情報処理装置。
- 前記指示認識手段は、
前記受信した指示情報から前記ユーザから検出した指示情報を抽出する指示情報抽出手段と、
前記指示情報の履歴に基づいて、前記抽出した指示情報の指示内容を判別する指示内容判別手段と、
を有し、
前記指示情報変更手段は、前記指示情報抽出手段により抽出する指示情報を変更することにより、前記他の指示情報に変更する請求項1乃至5のいずれか1項に記載の情報処理装置。 - 前記指示履歴蓄積手段は、ユーザが指示情報を検出する時の環境情報と、前記ユーザの指示を認識するために受信すべき指示情報とを関連付けて蓄積し、
前記ユーザから前記環境情報を受信する環境情報受信手段と、
前記受信した環境情報に対応して前記指示履歴蓄積手段に蓄積された受信すべき指示情報を前記ユーザに提示する指示情報提示手段と、
をさらに備える請求項1乃至7のいずれか1項に記載の情報処理装置。 - 前記指示情報受信手段は、携帯端末に接続した検出デバイスが検出した指示情報を、前記携帯端末を介して受信する請求項1乃至8のいずれか1項に記載の情報処理装置。
- 前記指示履歴蓄積手段は、前記検出デバイスに対応付けて前記検出デバイスのためのデバイスドライバを蓄積し、
前記携帯端末に接続した検出デバイスに対応して、使用するデバイスドライバを選定するドライバ選定手段をさらに有する請求項9に記載の情報処理装置。 - ユーザから検出される複数の指示情報は、前記ユーザの音声情報と、前記ユーザの映像情報と、前記ユーザの動作情報とを含み、
前記ユーザの動作情報は、前記ユーザの筋肉の動作を検出する通電センサにより検出された情報を含む請求項1乃至10のいずれか1項に記載の情報処理装置。 - 前記ユーザの指示は、情報記録装置による情報記録の開始指示と終了指示とを含み、
前記情報記録装置に対して、前記指示認識手段が認識した前記開始指示から前記終了指示の間の情報記録を指示する情報記録指示手段をさらに備える請求項1乃至11のいずれか1項に記載の情報処理装置。 - 指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
を含む情報処理装置の制御方法。 - 指示情報を受信する指示情報受信ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記受信した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記受信した指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記受信した指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、受信する指示情報を他の指示情報に変更する指示情報変更ステップと、
をコンピュータに実行させる情報処理装置の制御プログラム。 - ユーザの指示を検出するための検出デバイスを接続する接続コネクタと、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信手段と、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信手段と、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知手段と、
を備える携帯端末。 - 前記接続通知手段は、前記接続した検出デバイスの識別情報を前記情報処理装置に通知し、
前記接続した検出デバイスに対応し、前記情報処理装置が選定して送信したデバイスドライバを受信して実行するドライバ受信手段をさらに有する請求項15に記載の携帯端末。 - 前記検出デバイスは、前記ユーザの音声情報を検出するマイクと、前記ユーザの映像情報を検出するカメラと、前記ユーザの動作情報を検出する前記ユーザの筋肉の動作を検出する通電センサとを含む請求項15または16に記載の携帯端末。
- ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御方法であって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
を含む携帯端末の制御方法。 - ユーザの指示を検出するための検出デバイスを接続する接続コネクタを有する携帯端末の制御プログラムであって、
前記接続コネクタに接続された検出デバイスが検出した指示情報を、前記ユーザの指示を認識する情報処理装置に送信する指示情報送信ステップと、
前記情報処理装置から、送信した指示情報の信頼性の低下に対応して、前記指示情報を他の指示情報の送信に変更する通知を受信する変更通知受信ステップと、
前記接続コネクタに変更された前記他の指示情報を検出する検出デバイスが接続したことを、前記情報処理装置に通知する接続通知ステップと、
をコンピュータに実行させる携帯端末の制御プログラム。 - ユーザから検出される少なくとも2つの異なる指示情報の履歴を、該ユーザの指示に対応付けて蓄積する指示履歴蓄積手段と、
指示情報を検出する少なくとも2つの検出手段と、
前記指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識手段と、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定手段と、
前記信頼性判定手段が前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更手段と、
を備えるユーザ指示認識システム。 - 少なくとも2つの検出手段によってユーザから少なくとも2つの異なる指示情報を検出する検出ステップと、
ユーザの指示に対応付けて蓄積される、前記ユーザから検出された少なくとも2つの異なる指示情報の履歴を参照して、前記少なくとも2つの検出手段が検出した指示情報から前記ユーザの指示を認識する指示認識ステップと、
前記指示情報の履歴を参照して、前記指示情報の信頼性を判定する信頼性判定ステップと、
前記信頼性判定ステップにおいて前記指示情報の信頼性が低下したと判定した場合に、前記指示情報の履歴を参照して、前記指示情報を他の指示情報に変更する指示情報変更ステップと、
を含むユーザ指示認識方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222560A JP5949413B2 (ja) | 2012-10-04 | 2012-10-04 | ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
PCT/JP2013/074189 WO2014054384A1 (ja) | 2012-10-04 | 2013-09-09 | ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
US14/433,138 US9766695B2 (en) | 2012-10-04 | 2013-09-09 | User instruction recognition system and methods |
EP13843903.9A EP2905677A4 (en) | 2012-10-04 | 2013-09-09 | USER INSTRUCTION RECOGNITION SYSTEM AND METHOD, INFORMATION PROCESSING DEVICE, MOBILE TERMINAL, CORRESPONDING CONTROL METHOD AND PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012222560A JP5949413B2 (ja) | 2012-10-04 | 2012-10-04 | ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014075058A true JP2014075058A (ja) | 2014-04-24 |
JP5949413B2 JP5949413B2 (ja) | 2016-07-06 |
Family
ID=50434715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012222560A Active JP5949413B2 (ja) | 2012-10-04 | 2012-10-04 | ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9766695B2 (ja) |
EP (1) | EP2905677A4 (ja) |
JP (1) | JP5949413B2 (ja) |
WO (1) | WO2014054384A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6155555B2 (ja) * | 2012-05-30 | 2017-07-05 | 日本電気株式会社 | 情報処理システム、情報処理方法、情報処理装置、携帯端末およびその制御方法と制御プログラム |
JP6482911B2 (ja) | 2014-07-01 | 2019-03-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器制御方法および電気機器 |
US11115353B1 (en) * | 2021-03-09 | 2021-09-07 | Drift.com, Inc. | Conversational bot interaction with utterance ranking |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09244781A (ja) * | 1996-03-12 | 1997-09-19 | Hitachi Ltd | 環境適合情報アクセス方法 |
JP2000029661A (ja) * | 1998-07-16 | 2000-01-28 | Sharp Corp | 文字及び音声入出力機能付き情報端末装置 |
JP2012063921A (ja) * | 2010-09-15 | 2012-03-29 | Ntt Docomo Inc | 文字入力装置、文字入力方法および文字入力プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5201034A (en) * | 1988-09-30 | 1993-04-06 | Hitachi Ltd. | Interactive intelligent interface |
JPH04372012A (ja) | 1991-06-20 | 1992-12-25 | Fuji Xerox Co Ltd | 入力装置 |
JPH06131437A (ja) * | 1992-10-20 | 1994-05-13 | Hitachi Ltd | 複合形態による操作指示方法 |
US6092043A (en) * | 1992-11-13 | 2000-07-18 | Dragon Systems, Inc. | Apparatuses and method for training and operating speech recognition systems |
JP3729918B2 (ja) | 1995-07-19 | 2005-12-21 | 株式会社東芝 | マルチモーダル対話装置及び対話方法 |
US6088669A (en) * | 1997-01-28 | 2000-07-11 | International Business Machines, Corporation | Speech recognition with attempted speaker recognition for speaker model prefetching or alternative speech modeling |
US6505155B1 (en) | 1999-05-06 | 2003-01-07 | International Business Machines Corporation | Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy |
JP2003316387A (ja) | 2002-02-19 | 2003-11-07 | Ntt Docomo Inc | 学習装置、移動通信端末、情報認識システム、及び、学習方法 |
-
2012
- 2012-10-04 JP JP2012222560A patent/JP5949413B2/ja active Active
-
2013
- 2013-09-09 US US14/433,138 patent/US9766695B2/en active Active
- 2013-09-09 EP EP13843903.9A patent/EP2905677A4/en not_active Withdrawn
- 2013-09-09 WO PCT/JP2013/074189 patent/WO2014054384A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09244781A (ja) * | 1996-03-12 | 1997-09-19 | Hitachi Ltd | 環境適合情報アクセス方法 |
JP2000029661A (ja) * | 1998-07-16 | 2000-01-28 | Sharp Corp | 文字及び音声入出力機能付き情報端末装置 |
JP2012063921A (ja) * | 2010-09-15 | 2012-03-29 | Ntt Docomo Inc | 文字入力装置、文字入力方法および文字入力プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2905677A4 (en) | 2016-06-01 |
US20150277547A1 (en) | 2015-10-01 |
WO2014054384A1 (ja) | 2014-04-10 |
US9766695B2 (en) | 2017-09-19 |
JP5949413B2 (ja) | 2016-07-06 |
EP2905677A1 (en) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492698B (zh) | 一种模型训练的方法、对象检测的方法以及相关装置 | |
EP3411780B1 (en) | Intelligent electronic device and method of operating the same | |
EP3239975A1 (en) | Information processing device, information processing method, and program | |
JP6852729B2 (ja) | プラント管理システム、プラント管理方法、プラント管理装置、および、プラント管理プログラム | |
KR101803305B1 (ko) | 애플리케이션 실행을 위한 디스플레이 장치 및 방법 | |
US20220276701A1 (en) | Remote work support system | |
CN108710458B (zh) | 一种分屏控制方法和终端设备 | |
JP5949413B2 (ja) | ユーザ指示認識システム、ユーザ指示認識方法、情報処理装置、携帯端末およびその制御方法と制御プログラム | |
JPWO2019087870A1 (ja) | 作業支援装置、作業支援方法及びプログラム | |
WO2013146082A1 (ja) | 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム | |
CN111049687B (zh) | 设备检修视频操作指导文件处理方法、装置、ar终端 | |
US11404048B2 (en) | Method for operating voice recognition service and electronic device supporting same | |
US10133900B2 (en) | Controlling the output of contextual information using a computing device | |
JP2021013159A (ja) | 情報処理装置、テレプレゼンスロボット、拠点制御システム、遠隔制御システム、情報処理方法およびプログラム | |
CN109040457B (zh) | 一种屏幕亮度调节方法及移动终端 | |
JP6152020B2 (ja) | デバイス及び表示システム | |
KR20160060374A (ko) | 이동 단말기 및 그 제어 방법 | |
JP2015103158A (ja) | 情報処理装置、情報処理プログラムおよび情報表示システム | |
KR20190021774A (ko) | 터치 이벤트를 처리하는 전자 장치 및 그 제어 방법 | |
JP7484391B2 (ja) | プログラム、プログラムセット、および情報処理装置 | |
KR101470519B1 (ko) | 패턴 인식 기반의 기능 표시 방법 및 그 장치 | |
US20160054877A1 (en) | Communication adapter, and program | |
JP2017167746A (ja) | 情報提供装置、情報提供方法および情報提供プログラム | |
JP2021082295A (ja) | 遠隔作業支援システム | |
JP5569189B2 (ja) | 携帯端末と通信可能なコンピュータを動作させるプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160523 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5949413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |