JP6860431B2 - 計算機システム、対話制御方法、及び計算機 - Google Patents

計算機システム、対話制御方法、及び計算機 Download PDF

Info

Publication number
JP6860431B2
JP6860431B2 JP2017113189A JP2017113189A JP6860431B2 JP 6860431 B2 JP6860431 B2 JP 6860431B2 JP 2017113189 A JP2017113189 A JP 2017113189A JP 2017113189 A JP2017113189 A JP 2017113189A JP 6860431 B2 JP6860431 B2 JP 6860431B2
Authority
JP
Japan
Prior art keywords
user
authentication process
image
template
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017113189A
Other languages
English (en)
Other versions
JP2018206228A (ja
JP2018206228A5 (ja
Inventor
佑人 小松
佑人 小松
義崇 平松
義崇 平松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017113189A priority Critical patent/JP6860431B2/ja
Priority to US16/002,039 priority patent/US10621421B2/en
Publication of JP2018206228A publication Critical patent/JP2018206228A/ja
Publication of JP2018206228A5 publication Critical patent/JP2018206228A5/ja
Application granted granted Critical
Publication of JP6860431B2 publication Critical patent/JP6860431B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/14Vascular patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Collating Specific Patterns (AREA)
  • User Interface Of Digital Computer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

本発明は、ユーザとの対話を通してサービスを提供する計算機システムに関する。
ユーザの認証を行い、認証結果に基づいてユーザにサービスを提供する技術が知られている。提供するサービスとしては、例えば、商品の購入を促すサービス、行き先を検索するサービス、及び決済サービス等がある。
ユーザの認証方法としては、例えば特許文献1に記載の技術が知られている。特許文献1には、「登録顔データベース150には、同一人について、粗照合用顔特徴データと本照合用顔特徴データとが紐付けて登録されている。検出部120は、遠距離カメラ11から遠距離顔画像、近距離カメラ21から近距離顔画像をリアルタイムで入力する。抽出部130は、遠距離顔画像から粗照合用顔特徴データを抽出し、近距離顔画像から本照合用顔特徴データを抽出する。照合部140は、登録顔データベース150から、抽出された粗照合用顔特徴データに一致する粗照合用顔特徴データを検索し、1以上の粗照合用顔特徴データがヒットするとその粗照合用顔特徴データに紐づけられた本照合用顔特徴データを特定し、特定した本照合用顔特徴データのなかに抽出された本照合用対象データと一致するものがあるか判定する。」ことが記載されている。特許文献1に記載の認証方法は、高速かつ高精度な認証処理を実現できる。
ユーザとの対話を実現するシステムの一例としては、特許文献2に記載の技術が知られている。特許文献2には、「発話解析部2がユーザの発話内容に基づいてユーザの感情を特定し、応答種別決定部4が、当該感情に基づいてユーザの発話内容の応答種別を決定する。また、発話生成部7は、パーソナルDB10からユーザの嗜好情報(例えば、トピック情報、エンティティ情報)を取得し、応答種別に即したテンプレートを発話DB8から取得し、当該テンプレートにユーザの嗜好情報を当てはめた内容を発話内容として出力する。」ことが記載されている。
特開2010−108200号公報 特開2016−76117号公報
ユーザと対話を行い、サービスを提供する計算機システムにおいて、サービスの利用を促すような自然かつ充実した対話を実現するためには、ユーザに出力する発話内容の正確性及び応答速度の高速化が求められる。特許文献1及び特許文献2の技術を組み合わせることによって、ユーザの発話内容を把握し、また、ユーザを高速に特定できる。これによって、計算機システムは、ユーザのニーズ及び特性等を正確かつ迅速に把握して、適切な発話内容を出力できる。
しかし、特許文献1の技術では、精度が異なる二つの認証処理を行う必要があるため、認証処理の完了するまでユーザとの対話が行われない。したがって、応答速度の高速化が十分ではない。また、認証用のデータベースに登録されていないユーザに対して発話を行うことができない。
これによって、ユーザの興味の消失及びサービスの満足度の低下等の発生によって、サービスの利用機会を逃す可能性があり、また、サービスの正常な提供ができない可能性がある。
計算機リソース量を増加することによって認証処理の高速化は可能であるが、システムに含まれる装置の小型化が難しく、また、システム全体のコストが高くなるという問題がある。
本発明は、サービスの利用を促すような自然かつ充実した対話を実現するシステム、方法、及び計算機を提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、ユーザとの対話を行い、所定のサービスを提供する計算機システムであって、画像を取得する撮像装置、ユーザに出力する発話内容を定義するテンプレートを選択する計算機、及び前記テンプレートに基づいて発話内容を生成する生成装置を備え、前記計算機は、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるインタフェースを有し、前記テンプレートを格納する対話データベースを保持し、前記インタフェースを介して、前記撮像装置が取得した画像を用いた認証処理に使用する認証用画像を格納する画像データベースと接続し、前記対話データベースは、ユーザを特徴付ける属性に基づいて区分されたユーザ層に属するユーザに出力する発話内容を定義する複数の第1テンプレートと、特定の個人に出力する発話内容を定義する複数の第2テンプレートとを格納し、前記演算装置は、前記ユーザと前記撮像装置との間の距離を算出し、前記距離が第1閾値より大きい場合、前記撮像装置が取得した画像を用いて前記ユーザの前記属性を推定する属性推定処理を実行し、前記属性推定処理の結果に基づいて、前記対話データベースから前記ユーザが属する前記ユーザ層に対応する前記第1テンプレートを選択し、前記距離が前記第1閾値以下である場合、前記撮像装置が取得した画像及び前記画像データベースに基づいて前記ユーザを特定する認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、前記生成装置に、前記第1テンプレート及び前記第2テンプレートのいずれかを通知することを特徴とする。
本発明によれば、属性推定処理の結果に基づいてアルゴリズムを選択することによって、迅速かつ適切な対話内容の出力が可能となるため、サービスの利用を促すような自然かつ充実した対話を実現できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1の計算機システムの構成の一例を示す図である。 実施例1の対話装置のハードウェア構成及びソフトウェア構成を示す図である。 実施例1のリモートブレイン計算機のハードウェア構成及びソフトウェア構成を示す図である。 実施例1のマザーブレイン計算機のハードウェア構成及びソフトウェア構成を示す図である。 実施例1の対話DBに含まれる言語辞書のデータ構造の一例を示す図である。 実施例1の対話DBに含まれる推定ユーザ用テンプレートのデータ構造の一例を示す図である。 実施例1の対話DBに含まれる登録ユーザ用テンプレートのデータ構造の一例を示す図である。 実施例1の顔画像DBのデータ構造の一例を示す図である。 実施例1の静脈画像DBのデータ構造の一例を示す図である。 実施例1のリモートブレイン計算機が実行する処理の概要を示す図である。 実施例1の推定モジュールが実行する属性推定処理の一例を説明するフローチャートである。 実施例1の推定モジュールが実行する属性推定処理の一例を説明するフローチャートである。 実施例1の認証モジュールが実行する顔認証処理の一例を説明するフローチャートである。 実施例1の制御モジュールが実行する顔画像DBの検索処理の一例を説明するフローチャートである。 実施例1の認証モジュールが実行する静脈認証処理の一例を説明するフローチャートである。 実施例1の制御モジュールが実行する静脈画像DBの検索処理の一例を説明するフローチャートである。 実施例1の制御モジュールが実行するデータベースの更新処理の一例を説明するフローチャートである。 実施例1の計算機システムが提供する決済サービスの一例を説明するフローチャートである。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。
図1は、実施例1の計算機システムの構成の一例を示す図である。
計算機システムは、対話装置100、リモートブレイン計算機101、及びマザーブレイン計算機102から構成される。リモートブレイン計算機101は、無線ネットワーク等の図示しないネットワークを介して対話装置100に接続する。また、リモートブレイン計算機101は、ネットワーク103を介してマザーブレイン計算機102に接続する。
対話装置100は、ユーザ110と対話を行う装置である。対話装置100は、例えば、ロボット等が考えられる。なお、ディスプレイ、集音マイク、及びスピーカから構成される対話装置100でもよい。
対話装置100は、対話装置100とユーザ110との間の距離を計測し、ユーザ110との間で対話を行う。図1に示す計算機システムでは、対話装置100は一つであるが、複数あってもよい。
リモートブレイン計算機101は、対話装置100を制御する。より具体的には、リモートブレイン計算機101は、対話装置100によって計測された距離に基づいてユーザに出力する発話内容を生成するためのアルゴリズムを選択する。図1に示す計算機システムでは、リモートブレイン計算機101は一つであるが、複数あってもよい。
マザーブレイン計算機102は、情報を管理する。
図2は、実施例1の対話装置100のハードウェア構成及びソフトウェア構成を示す図である。
対話装置100は、演算装置201、記憶装置202、通信装置203、撮像装置204、音声再生装置205、集音装置206、駆動制御装置207、及び駆動装置208を有する。各ハードウェアは、内部バス等を介して互いに接続される。
演算装置201は、CPU(Central Processing Unit)等の装置である。演算装置201は、記憶装置202に格納されるプログラムを実行する。演算装置201がプログラムにしたがって処理を実行することによって、特定の機能を実現するモジュールとして動作する。以下の説明では、モジュールを主語に処理を説明する場合、演算装置201が当該モジュールを実現するプログラムを実行していることを表す。
記憶装置202は、メモリ等の装置であり、演算装置201が実行するプログラム及びプログラムの実行に必要な情報を格納する。また、記憶装置202は、プログラムが使用するワークエリアを含む。なお、対話装置100は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等の記憶装置を有してもよい。
本実施例では、記憶装置202は、制御モジュール211を実現するプログラムを格納し、また、対話DB212を格納する。
制御モジュール211は、対話装置100を制御して、発話内容を生成し、ユーザ110に対して発話内容を出力する対話処理を実行する。
対話処理では、制御モジュール211は、ユーザ110の発話内容の意味を把握するために、後述する言語辞書500を用いてユーザ110の発話内容を解析する。また、制御モジュール211は、ユーザ110の発話内容の解析結果と、後述する推定ユーザ用テンプレート600又は登録ユーザ用テンプレート610とに基づいて、出力する発話内容を生成し、ユーザ110に対して発話内容を出力する。
対話DB212は、ユーザ110との対話に使用する各種情報を格納する。なお、対話DB212は、リモートブレイン計算機101が保持する対話DB314(図3参照)と同一のデータを格納してもよいし、また、対話DB314の一部のデータのみを格納してもよい。
通信装置203は、ネットワークインタフェース等の装置であり、ネットワークを介して他の装置と接続する。撮像装置204は、カメラ等の装置であり、所定の範囲の画像を取得する。音声再生装置205は、スピーカ等の装置であり、発話内容を音声として再生する。集音装置206は、集音マイク等の装置であり、ユーザ110の音声を取得する。
駆動制御装置207は、マイコンチップ等の装置であり、駆動装置208を制御する。駆動装置208は、モータ等の装置であり、対話装置100の動きを実現する装置である。
本実施例では、撮像装置204が取得した画像を用いて対話装置100とユーザ110との間の距離が計測される。なお、本発明は、前述の距離の計測方法に限定されない。例えば、音波又はレーザ光を用いた距離の計測方法でもよい。音波又はレーザ光を用いた距離の計測方法を適用する場合、対話装置100は、音波又はレーザ光を発生する装置を有する。また、ユーザ110が発する声の強度を用いた距離の計測方法でもよい。
図3は、実施例1のリモートブレイン計算機101のハードウェア構成及びソフトウェア構成を示す図である。
リモートブレイン計算機101は、演算装置301、記憶装置302、及び通信装置303を有する。各ハードウェアは、内部バス等を介して互いに接続される。
演算装置301、記憶装置302、及び通信装置303は、演算装置201、記憶装置202、及び通信装置203と同一のものである。
記憶装置302は、制御モジュール311、認証モジュール312、及び推定モジュール313を実現するプログラムを格納し、また、対話DB314を格納する。
制御モジュール311は、リモートブレイン計算機101を制御する。認証モジュール312は、画像を用いた認証処理を実行する。推定モジュール313は、画像を用いた推定処理を実行する。ここで、推定処理は、ユーザの特徴を表す属性を推定するための処理である。属性としては、年齢及び性別等が考えられる。対話DB314は、ユーザ110との対話に使用する各種情報を格納する。対話DB314は、予め設定されているものとする。対話DB314の詳細は、図5、図6A、及び図6Bを用いて説明する。
図4は、実施例1のマザーブレイン計算機102のハードウェア構成及びソフトウェア構成を示す図である。
マザーブレイン計算機102は、演算装置401、記憶装置402、及び通信装置403を有する。各ハードウェアは、内部バス等を介して互いに接続される。
演算装置401、記憶装置402、及び通信装置403は、演算装置201、記憶装置202、及び通信装置203と同一のものである。
記憶装置402は、制御モジュール411を実現するプログラムを格納し、また、顔画像DB412及び静脈画像DB413を格納する。
制御モジュール411は、マザーブレイン計算機102を制御する。顔画像DB412は、ユーザ110の顔画像を管理するデータベースである。静脈画像DB413は、ユーザ110の静脈画像を管理するデータベースである。
次に、図5、図6A、及び図6Bを用いて対話DB314に格納される情報について説明する。対話DB314には、言語辞書500、推定ユーザ用テンプレート600、登録ユーザ用テンプレート610が含まれる。
図5は、実施例1の対話DB314に含まれる言語辞書500のデータ構造の一例を示す図である。
言語辞書500は、ユーザ110の発話内容を解釈するために使用する情報である。言語辞書500は、言語クラス501、言語種別502、及び言語503から構成されるエントリを含む。一つのエントリが一つの言語のグループ(部分グループ)に対応する。
言語クラス501は、言語のグループの識別情報を格納するフィールドである。言語種別502は、言語のグループの一部である部分グループの識別情報を格納するフィールドである。言語503は、部分グループを構成する言語を格納するフィールドである。
言語クラス501が「家電」、「生活雑貨」であるエントリの言語503には、社名及び製品番号の組が部分グループを構成する一つの要素として格納される。
図6Aは、実施例1の対話DB314に含まれる推定ユーザ用テンプレート600のデータ構造の一例を示す図である。
推定ユーザ用テンプレート600は、認証が行われていないユーザ110又はデータベースに登録されていないユーザ110に出力する発話内容を定義するテンプレートである。推定ユーザ用テンプレート600は、属性の組み合わせ毎に複数存在する。本実施例では、年齢及び性別の組合せの数だけ推定ユーザ用テンプレート600が存在する。
推定ユーザ用テンプレート600は、クラス601、トピック602、及び発話内容603から構成されるエントリを含む。一つのエントリが一つの発話内容に対応する。
クラス601は、出力する発話内容の種別を表すグループの識別情報を格納するフィールドである。トピック602は、クラス601に対応する発話内容に含めるトピックの種別を格納するフィールドである。なお、トピックを含める必要がない発話内容の場合、トピック602は空欄でもよい。発話内容603は、ユーザ110に対して出力する発話内容を格納するフィールドである。
なお、「天気」、「商品名」、「場所名」、及び「道順」等の括弧で囲われた単語は、画像の解析結果、ユーザの発話内容の解析結果、及び発話内容の履歴に基づいて置き換えられる単語である。例えば、二番目のエントリの「天気」は、発話内容の出力時の天気に置き換えられる。
図6Bは、実施例1の対話DB314に含まれる登録ユーザ用テンプレート610のデータ構造の一例を示す図である。
登録ユーザ用テンプレート610は、データベースに登録されたユーザ110に出力する発話内容を定義するテンプレートである。登録ユーザ用テンプレート610は、クラス611、トピック612、及び発話内容613から構成されるエントリを含む。一つのエントリが一つの発話内容に対応する。
クラス611、トピック612、及び発話内容613は、クラス601、トピック602、及び発話内容603と同一のものである。
推定ユーザ用テンプレート600及び登録ユーザ用テンプレート610は、ユーザ110に出力する発話内容を生成するためのアルゴリズムに対応する。したがって、テンプレートの選択は、発話内容を生成するためのアルゴリズムの選択と同義である。なお、本発明はアルゴリズムに限定されない。
次に、図7及び図8を用いてマザーブレイン計算機102が管理するデータベースについて説明する。
図7は、実施例1の顔画像DB412のデータ構造の一例を示す図である。
顔画像DB412は、ID701、顔画像702、特徴量703、及び属性704から構成されるエントリを含む。一つのエントリが一人のユーザ110に対応する。
ID701は、顔画像DB412に格納されるエントリを識別するための識別情報を格納するフィールドである。顔画像702は、認証に使用する顔画像を格納するフィールドである。なお、顔画像が別の記憶領域に格納されている場合、顔画像702には、記憶領域の場所を示すポインタが格納されてもよい。特徴量703は、顔画像から算出された特徴量を格納するフィールドである。特徴量703には、例えば、特徴ベクトルが格納される。属性704は、ユーザ110の属性を格納するフィールドである。
本実施例の属性704には、No711、氏名712、性別713、及び年齢714が含まれる。なお、前述した属性は一例であってこれに限定されない。
No711は、ユーザ110に付与された識別情報を格納するフィールドである。氏名712は、ユーザ110の氏名を格納するフィールドである。性別713は、ユーザ110の性別を格納するフィールドである。年齢714は、ユーザ110の年齢を格納するフィールドである。
顔画像DB412にエントリを登録する方法としては、リモートブレイン計算機101が画像の解析結果に基づいて自動的に設定する方法でもよいし、専用のUIを用いて手動で設定する方法でもよい。本実施例では、後述するように、顔画像DB412には、未登録のユーザのエントリが一時的に登録される。
図8は、実施例1の静脈画像DB413のデータ構造の一例を示す図である。
静脈画像DB413は、ID801、静脈画像802、特徴量803、及び属性804から構成されるエントリを含む。一つのエントリが一人のユーザ110に対応する。
ID801及び属性804は、ID701及び属性704と同一のものである。なお、属性804に含まれる属性は、属性704に含まれる属性と同一でなくてもよい。
静脈画像802は、認証に使用する静脈画像を格納するフィールドである。なお、静脈画像が別の記憶領域に格納されている場合、静脈画像802には、記憶領域の場所を示すポインタが格納されてもよい。特徴量803は、静脈画像から算出された特徴量を格納するフィールドである。特徴量803には、例えば、特徴ベクトルが格納される。
静脈画像DB413にエントリを登録する方法としては、リモートブレイン計算機101が画像の解析結果に基づいて自動的に設定する方法でもよいし、専用のUIを用いて手動で設定する方法でもよい。
図9は、実施例1のリモートブレイン計算機101が実行する処理の概要を示す図である。
対話装置100は、周期的又はイベントの発生を検知した場合、撮像装置204を用いて画像を取得し、リモートブレイン計算機101に画像を送信する。リモートブレイン計算機101は、取得された画像に人が含まれるか否かを判定する。画像から人を特定する方法は、公知の技術を用いればよいため詳細な説明は省略する。
リモートブレイン計算機101は、取得された画像に人が含まれる場合、以下で説明する処理を開始する。
まず、リモートブレイン計算機101の制御モジュール311は、受信した画像を用いて、対話装置100とユーザ110との間の距離を算出する(ステップS901)。このとき、制御モジュール311は、受信した画像から顔画像を抽出する。なお、対話装置100が、画像中の人物の有無を判定し、また、顔画像の抽出を行ってもよい。
制御モジュール311は、算出された距離が第1閾値より大きいか否かを判定する(ステップS902)。
距離が第1閾値より大きいと判定された場合、制御モジュール311は、推定モジュール313を呼び出し、属性推定処理の実行を指示する(ステップS903)。制御モジュール311は、属性推定処理の結果を対話装置100に送信する(ステップS907)。
距離が第1閾値以下であると判定された場合、制御モジュール311は、距離が第2閾値より大きいか否かを判定する(ステップS904)。
距離が第2閾値より大きいと判定された場合、制御モジュール311は、認証モジュール312を呼び出し、顔認証処理の実行を指示する(ステップS905)。制御モジュール311は、顔認証処理の結果を対話装置100に送信する(ステップS907)。
距離が第2閾値以下であると判定された場合、制御モジュール311は、認証モジュール312を呼び出し、静脈認証処理の実行を指示する(ステップS906)。制御モジュール311は、静脈認証処理の結果を対話装置100に送信する(ステップS907)。
顔画像とは別に静脈画像を取得する必要がある場合、リモートブレイン計算機101の制御モジュール311は、対話装置100に対して静脈画像の取得を指示する。この場合、対話装置100の制御モジュール211は、ユーザ110を所定の位置に誘導し、撮像装置204を用いてユーザ110から静脈画像を取得し、リモートブレイン計算機101に静脈画像を送信する。
対話装置100は、リモートブレイン計算機101から受信した属性推定処理の結果、顔認証処理の結果、又は静脈認証処理の結果に基づいて対話処理を実行する。
対話処理の実行中にもステップS901からステップS906の処理が実行される。この場合、対話装置100は処理結果に応じて対話処理を変更する。なお、すでにユーザ110が特定されている場合には、ステップS901からステップS906の処理は実行されなくてもよい。ただし、認証処理の認証精度が低い場合、リモートブレイン計算機101は、認証処理の結果によらずに、ステップS901からステップS906の処理を実行してもよい。
なお、画像の中に複数のユーザ110が含まれている場合、リモートブレイン計算機101は、対話装置100との間の距離が最も近いユーザ110に対して処理を実行する方法が考えられる。
図10A及び図10Bは、実施例1の推定モジュール313が実行する属性推定処理の一例を説明するフローチャートである。
推定モジュール313は、顔画像を用いて年齢推定処理及び性別推定処理を実行する(ステップS1001、ステップS1002)。顔画像を用いた年齢推定処理及び性別推定処理は公知の技術を用いればよいため詳細な説明は省略する。
次に、推定モジュール313は、ユーザ110の年齢が第3閾値より大きいか否かを判定する(ステップS1003)。
年齢が第3閾値より大きいと判定された場合、推定モジュール313は、ユーザ110の性別が男性であるか否かを判定する(ステップS1004)。
ユーザ110の性別が男性であると判定された場合、推定モジュール313は、男性かつ高齢者向けの推定ユーザ用テンプレート600を選択する(ステップS1005)。その後、推定モジュール313は、ステップS1014に進む。
ユーザ110の性別が女性であると判定された場合、推定モジュール313は、女性かつ高齢者向けの推定ユーザ用テンプレート600を選択する(ステップS1006)。その後、推定モジュール313は、ステップS1014に進む。
ステップS1003において、年齢が第3閾値以下であると判定された場合、推定モジュール313は、ユーザ110の年齢が第4閾値より大きいか否かを判定する(ステップS1007)。
ユーザ110の年齢が第4閾値より大きいと判定された場合、推定モジュール313は、ユーザ110の性別が男性であるか否かを判定する(ステップS1008)。
ユーザ110の性別が男性であると判定された場合、推定モジュール313は、男性かつ大人向けの推定ユーザ用テンプレート600を選択する(ステップS1009)。その後、推定モジュール313は、ステップS1014に進む。
ユーザ110の性別が女性であると判定された場合、推定モジュール313は、女性かつ大人向けの推定ユーザ用テンプレート600を選択する(ステップS1010)。その後、推定モジュール313は、ステップS1014に進む。
ステップS1007において、ユーザ110の年齢が第4閾値以下であると判定された場合、推定モジュール313は、ユーザ110の性別が男性であるか否かを判定する(ステップS1011)。
ユーザ110の性別が男性であると判定された場合、推定モジュール313は、男性かつ子供向けの推定ユーザ用テンプレート600を選択する(ステップS1012)。その後、推定モジュール313は、ステップS1014に進む。
ユーザ110の性別が女性であると判定された場合、推定モジュール313は、女性かつ子供向けの推定ユーザ用テンプレート600を選択する(ステップS1013)。その後、推定モジュール313は、ステップS1014に進む。
ステップS1014では、推定モジュール313は、推定ユーザ用テンプレート600の選択結果を対話装置100に送信する(ステップS1014)。このとき、推定モジュール313は、必要に応じて、選択された推定ユーザ用テンプレート600を対話装置100に送信してもよい。
次に、推定モジュール313は、制御モジュール311を介して、マザーブレイン計算機102に顔画像DB412の更新要求を送信する(ステップS1015)。その後、推定モジュール313は、処理の完了を制御モジュール311に通知する。当該更新要求には、顔画像及び特徴量と、推定結果である性別及び年齢とが含まれる。
マザーブレイン計算機102の制御モジュール411は、更新要求を受信した場合、顔画像DB412にエントリを追加し、追加されたエントリのID701に識別情報を設定する。制御モジュール411は、追加されたエントリの顔画像702に更新要求に含まれる顔画像を設定し、また、特徴量703に顔画像の特徴量を設定する。また、制御モジュール411は、追加されたエントリの属性704に含まれる性別713及び年齢714に推定結果を設定する。この時点では、No711及び氏名712は空欄である。
なお、画像の中に複数のユーザ110が含まれている場合、リモートブレイン計算機101は、各ユーザ110に対して属性推定処理を実行し、処理結果を用いた統計処理を実行する。年齢については例えば、平均値が算出される。性別の場合、性別については、人数が多い性別が処理に使用する性別として算出される。リモートブレイン計算機101は、算出された年齢及び性別に基づいて、複数のユーザ110に対して共通で使用する推定ユーザ用テンプレート600を選択する。
図11は、実施例1の認証モジュール312が実行する顔認証処理の一例を説明するフローチャートである。
認証モジュール312は、顔画像の特徴量を算出する(ステップS1101)。なお、対話装置100から顔画像の特徴量を受信している場合には、ステップS1101の処理を省略できる。
認証モジュール312は、マザーブレイン計算機102に、顔画像の特徴量を含む顔画像DB412の問合せを行う(ステップS1102)。
認証モジュール312は、問合せの結果に基づいて、顔画像DB412に対話装置100が取得した顔画像に一致する画像が存在するか否かを判定する(ステップS1103)。
顔画像DB412に対話装置100が取得した顔画像に一致する画像が存在すると判定された場合、認証モジュール312は、制御モジュール311を介して、特定されたエントリの情報を含む認証成功通知を対話装置100に送信する(ステップS1104)。その後、認証モジュール312は、顔認証処理を終了する。このとき、認証モジュール312は、制御モジュール311を介して、登録ユーザ用テンプレート610を対話装置100に送信してもよい。
顔画像DB412に対話装置100が取得した顔画像に一致する画像が存在しないと判定された場合、認証モジュール312は、制御モジュール311を介して、推定モジュール313を呼び出し、属性推定処理の実行を指示する(ステップS1105)。その後、認証モジュール312は、顔認証処理を終了する。
なお、すでに属性推定処理が実行されている場合には、リモートブレイン計算機101は、再度、属性推定処理を実行しなくてもよい。
図12は、実施例1の制御モジュール411が実行する顔画像DB412の検索処理の一例を説明するフローチャートである。
制御モジュール411は、リモートブレイン計算機101から顔画像DB412の問合せを受け付ける(ステップS1201)。
次に、制御モジュール411は、問合せに含まれる顔画像の特徴量を用いて検索処理を実行する(ステップS1202)。
具体的には、制御モジュール411は、顔画像の特徴量と、顔画像DB412の各エントリの特徴量703とを用いて、画像の類似度を算出する。制御モジュール411は、画像の類似度が第5閾値より大きいエントリを特定する。画像の類似度が第5閾値より大きいエントリが複数存在する場合、制御モジュール411は、類似度が最も大きいエントリを選択する。
次に、制御モジュール411は、検索結果を含む応答をリモートブレイン計算機101に送信する(ステップS1203)。
ステップS1202の処理において、画像の類似度が第5閾値より大きいエントリが存在する場合、制御モジュール411は、検索されたエントリの値を含む応答を送信する。画像の類似度が第5閾値より大きいエントリが存在しない場合、制御モジュール411は、エラーを示す値を含む応答を送信する。
図13は、実施例1の認証モジュール312が実行する静脈認証処理の一例を説明するフローチャートである。
認証モジュール312は、静脈画像の特徴量を算出する(ステップS1301)。なお、対話装置100から静脈画像の特徴量を受信している場合には、ステップS1301の処理を省略できる。
認証モジュール312は、マザーブレイン計算機102に、静脈画像の特徴量を含む静脈画像DB413の問合せを行う(ステップS1302)。
認証モジュール312は、問合せの結果に基づいて、静脈画像DB413に対話装置100が取得した静脈画像に一致する画像が存在するか否かを判定する(ステップS1303)。
静脈画像DB413に対話装置100が取得した静脈画像に一致する画像が存在すると判定された場合、認証モジュール312は、制御モジュール311を介して、特定されたエントリの情報を含む認証成功通知を対話装置100に送信する(ステップS1304)。その後、認証モジュール312は、静脈画像の認証処理を終了する。このとき、認証モジュール312は、制御モジュール311を介して、登録ユーザ用テンプレート610を対話装置100に送信してもよい。
静脈画像DB413に対話装置100が取得した静脈画像に一致する画像が存在しないと判定された場合、認証モジュール312は、制御モジュール311を介して、推定モジュール313を呼び出し、属性推定処理の実行を指示する(ステップS1305)。その後、認証モジュール312は、静脈認証処理を終了する。
なお、すでに属性推定処理が実行されている場合には、属性推定処理は実行されなくてもよい。
図14は、実施例1の制御モジュール411が実行する静脈画像DB413の検索処理の一例を説明するフローチャートである。
制御モジュール411は、リモートブレイン計算機101から静脈画像DB413の問合せを受け付ける(ステップS1401)。
次に、制御モジュール411は、問合せに含まれる静脈画像の特徴量を用いて検索処理を実行する(ステップS1402)。
具体的には、制御モジュール411は、静脈画像の特徴量と、静脈画像DB413の各エントリの特徴量803を用いて、画像の類似度を算出する。制御モジュール411は、画像の類似度が第6閾値より大きいエントリを特定する。画像の類似度が第6閾値より大きいエントリが複数存在する場合、制御モジュール411は、類似度が最も大きいエントリを特定する。
次に、制御モジュール411は、検索結果を含む応答をリモートブレイン計算機101に送信する(ステップS1403)。
ステップS1402の処理において、画像の類似度が第6閾値より大きいエントリが存在する場合、制御モジュール411は、検索されたエントリの値を含む応答を送信する。画像の類似度が第6閾値より大きいエントリが存在しない場合、制御モジュール411は、エラーを示す値を含む応答を送信する。
図15は、実施例1の制御モジュール411が実行するデータベースの更新処理の一例を説明するフローチャートである。
制御モジュール411は、周期的に又はイベントの発生時に、以下で説明する処理を実行する。イベントとしては、記憶装置402の空き領域が閾値より小さくなった場合が考えられる。
制御モジュール411は、顔画像DB412を参照し、属性704の全てのフィールドに値が設定されていないエントリを検索する(ステップS1501)。
制御モジュール411は、顔画像DB412から、検索されたエントリを削除する(ステップS1502)。なお、エントリに登録日時を格納するフィールドが含まれる場合、制御モジュール411は、登録日時と現在の日時との比較し、所定の時間を経過している場合にエントリを削除するようにしてもよい。
図15では顔画像DB412についてのみ処理が実行されているが、静脈画像DB413についても同様の処理が実行されてもよい。
本実施例では、制御モジュール411は、属性704及び属性804に基づいて、削除するエントリを特定していたがこれに限定されない。例えば、削除対象のエントリを示すフラグをエントリに含めてもよい。この場合、制御モジュール411は、エントリの追加時にフラグを設定し、一定期間経過後にフラグを削除する。フラグが削除される前に、前述の処理が開始された場合、フラグが設定されたエントリが削除される。
前述のようなデータベースの制御によって、認証用のデータベースに正式に登録されていないユーザ110の情報に基づいて、スムーズな対話が可能となる。例えば、お店に設置された対話装置100は、認証用のデータベースに正式に登録されていないユーザであって、以前来店したユーザに対して自然かつ充実した対話が可能となる。
また、顔画像DB412は、推定結果に基づく対話の内容を用いて更新されてもよい。例えば、以下のような処理が考えられる。
対話装置100は、推定処理の結果に基づく対話において、当該結果の修正が必要な対話の内容を検出した場合、リモートブレイン計算機101に属性の更新要求を送信する。更新要求には、変更する属性の種別及び値が含まれる。リモートブレイン計算機101の制御モジュール311は、属性の更新要求をマザーブレイン計算機102に転送する。マザーブレイン計算機102の制御モジュール411は、顔画像DB412を参照して正式に登録されていないユーザ110のエントリを特定し、属性の更新要求に含まれる情報に基づいて当該エントリの属性704を更新する。
次に、ユーザ110にサービスを提供する場合の計算機システムの処理の一例について説明する。
図16は、実施例1の計算機システムが提供する決済サービスの一例を説明するフローチャートである。ここでは、静脈画像を用いた決済サービスを例に説明する。なお、顔画像を用いた決済サービスでもよい。
リモートブレイン計算機101は、対話装置100から静脈画像を受信した場合、以下で説明する処理を開始する。
リモートブレイン計算機101の認証モジュール312は、対話装置100から静脈画像を受信する(ステップS1601)。
認証モジュール312は、静脈画像の特徴量を算出する(ステップS1602)。なお、対話装置100から静脈画像の特徴量を受信している場合には、ステップS1402の処理を省略できる。
認証モジュール312は、マザーブレイン計算機102に、静脈画像の特徴量を含む静脈画像DB413の問合せを行う(ステップS1603)。当該問合せを受け付けたマザーブレイン計算機102は図14に示す処理を実行する。
認証モジュール312は、問合せの結果に基づいて、静脈画像DB413に対話装置100が取得した静脈画像に一致する画像が存在するか否かを判定する(ステップS1604)。
静脈画像DB413に対話装置100が取得した静脈画像に一致する画像が存在すると判定された場合、認証モジュール312は、決済処理を実行する(ステップS1605)。その後、認証モジュール312は処理を終了する。
静脈画像DB413に対話装置100が取得した画像と一致する画像が存在しないと判定された場合、認証モジュール312は、対話装置100を介して、ユーザ110にエラーを通知する(ステップS1606)。その後、認証モジュール312は処理を終了する。
実施例1では、リモートブレイン計算機101が、認証モジュール312及び推定モジュール313を実現するプログラムを保持していたが、対話装置100又はマザーブレイン計算機102が保持してもよい。また、対話装置100又はマザーブレイン計算機102が、リモートブレイン計算機101の機能を有する構成であってもよい。また、対話装置100、リモートブレイン計算機101、及びマザーブレイン計算機102を一つの計算機を用いて実現してもよい。
なお、リモートブレイン計算機101及びマザーブレイン計算機102は、物理的な計算機として実現してもよいし、仮想的な計算機として実現してもよい。
ここで、実施例1の計算機システムのユースケースの一例について説明する。実施例1の計算機システムは、例えば、食料品、衣料品、及び電化製品等を販売する会社、又は交通会社が運用する基幹業務システムに適用できる。この場合、対話装置100としては支店に設置されたロボットが対話装置100に対応し、支店に設置された管理計算機がリモートブレイン計算機101に対応し、また、本社に設置された計算機がマザーブレイン計算機102に対応する。また、基幹業務システムが提供するサービスとしては、決済サービス、商品の案内サービス、及び経路の案内サービス等が考えられる。
リモートブレイン計算機101は、店に来店したユーザ110の属性を推定し、また、対話装置100は、推定結果に基づいて選択された推定ユーザ用テンプレート600を用いて発話を開始する。これによって、対話装置100とユーザ110との間で自然かつ充実した対話が可能となるため、計算機システムが提供するサービスに対するユーザ110の興味を引くことができる。対話装置100は、推定ユーザ用テンプレート600に基づいて、商品をレコメンドする発話、及びユーザのニーズを聞き出す発話を行う。
リモートブレイン計算機101は、ユーザ110と対話装置100との間の距離が第1閾値より小さい場合、顔認証処理を実行し、ユーザ110が会員登録されたユーザであるか否かを判定する。
リモートブレイン計算機101は、ユーザ110が会員登録されたユーザである場合、対話装置100に推定ユーザ用テンプレート600から登録ユーザ用テンプレート610への切替を指示する。対話装置100は、登録ユーザ用テンプレート610を用いて会員登録されたユーザ向けの発話を行う。これによって、より自然かつ充実したユーザ110との対話が可能となる。
リモートブレイン計算機101は、ユーザ110と対話装置100との間の距離が第2閾値より小さい場合、静脈認証処理を実行し、ユーザ110が会員登録されたユーザであるか否かを判定する。
リモートブレイン計算機101は、ユーザ110が会員登録されたユーザである場合、対話装置100に推定ユーザ用テンプレート600から登録ユーザ用テンプレート610への切替を指示する。対話装置100は、登録ユーザ用テンプレート610を用いて会員登録されたユーザ向けの発話を行う。これによって、より自然かつ充実したユーザ110との対話が可能となる。
基幹業務システムに実施例1の計算機システムを適用した場合、推定処理の結果に基づく発話によって、認証を行っていないユーザ110のサービス利用機会を迅速に得ることができる。また、対話装置100は、認証処理の結果に基づく発話によって、ユーザ110のニーズ及び好みに合った発話ができる。これによって、ユーザ110に適切なサービスを提供することができる。
実施例1の計算機システムは、基幹業務システムだけではなく、警備システム等の様々なシステムに適用できる。警備サービスを提供する警備システムに実施例1の計算機システムを適用した場合、リモートブレイン計算機101は、ステップS1305の処理の代わりに以下のような処理を実行すればよい。すなわち、顔認証処理及び静脈認証処理のいずれでも認証が成功しなかった場合、リモートブレイン計算機101は、対話装置100にユーザ110に対する警告を指示してもよいし、また、警備会社に連絡してもよい。
実施例1では、リモートブレイン計算機101が画像を用いてユーザ110の属性を推定し、対話装置100が推定結果に基づいて発話を行う。属性推定処理では、画像を格納した顔画像DB412及び静脈画像DB413を参照する必要がないため、認証処理より高速に実行できる。したがって、発話に使用する推定ユーザ用テンプレート600(アルゴリズム)を高速に選択でき、ユーザ110に対する発話の開始が迅速に行える。また、顔画像DB412及び静脈画像DB413のいずれにも登録されていないユーザに対しても、推定結果に基づく発話が可能となる。
実施例2では、顔認証処理において属性推定処理の結果を用いてデータの参照範囲を絞り込み、また、静脈画像処理において属性推定処理の結果又は顔認証処理の結果を用いてデータの参照範囲を絞り込む点が実施例1と異なる。以下、実施例1との差異を中心に実施例2について説明する。
実施例2の計算機システムの構成は、実施例1の計算機システムの構成と同一である。実施例2の対話装置100、リモートブレイン計算機101、及びマザーブレイン計算機102の構成は、実施例1の各装置の構成と同一である。また、各装置が保持するデータベースのデータ構造は、実施例1のデータベースのデータ構造と同一である。
実施例2では、属性推定処理、顔認証処理、及び静脈認証処理が一部異なる。
まず、実施例2の属性推定処理について説明する。推定モジュール313は、ステップS1014において、属性推定処理の結果を記憶装置302に格納する。他の処理は実施例1と同一である。
次に、実施例2の顔認証処理及び顔画像DB412の検索処理について説明する。
認証モジュール312は、ステップS1102において、記憶装置302に格納された属性推定処理の結果を含む問合せを行う。
問合せを受け付けたマザーブレイン計算機102の制御モジュール411は、ステップS1202において以下のような処理を実行する。
制御モジュール411は、顔画像DB412を参照し、属性推定処理の結果に合致するエントリを特定する。制御モジュール411は、顔画像の特徴量と、特定されたエントリの特徴量703を用いて、画像の類似度を算出する。制御モジュール411は、画像の類似度が第5閾値より大きいエントリを特定する。
画像の類似度が第5閾値より大きいエントリが存在しない場合、制御モジュール411は、画像の類似度が第7閾値より大きいエントリを特定する。以上が実施例2のステップS1202の処理である。
ステップS1203では、制御モジュール411は、検索処理の成功を示す値及び画像の類似度が第5閾値より大きいエントリの値、又は、検索処理の失敗を示す値及び画像の類似度が第7閾値より大きいエントリの値を含む応答を送信する。
認証モジュール312は、ステップS1103において、検索処理の結果を示す値に基づいて判定を行う。また、認証モジュール312は、ステップS1105において、画像の類似度が第7閾値より大きいエントリの値を記憶装置302に格納する。
次に、実施例2の静脈認証処理及び静脈画像DB413の検索処理について説明する。
認証モジュール312は、ステップS1302において、属性推定処理の結果及び顔画像の認証処理の結果の少なくともいずれかを含む問合せを行う。具体的には、記憶装置302に属性推定処理の結果のみが格納される場合、認証モジュール312は、属性推定処理の結果を含む問合せを行い、記憶装置302に顔画像の認証処理の結果が格納される場合、認証モジュール312は、顔画像の認証処理の結果を含む問合せを行う。
問合せを受け付けたマザーブレイン計算機102の制御モジュール411は、ステップS1402において以下のような処理を実行する。
制御モジュール411は、属性推定処理の結果を含む問合せを受け付けた場合、静脈画像DB413を参照し、属性推定処理の結果に合致するエントリを特定する。制御モジュール411は、顔認証処理の結果を含む問合せを受け付けた場合、静脈画像DB413を参照し、顔認証処理の結果に合致するエントリを特定する。
制御モジュール411は、顔画像の特徴量と、特定されたエントリの特徴量803を用いて、画像の類似度を算出する。制御モジュール411は、画像の類似度が第6閾値より大きいエントリを特定する。以上がステップS1402の処理の説明である。
ステップS1401及びステップS1403の処理は実施例1の処理と同一である。
実施例2によれば、属性推定処理の結果を用いることによって顔認証処理を高速化でき、また、属性推定処理の結果及び顔認証処理の結果の少なくともいずれかを用いることによって静脈認証処理を高速化できる。
実施例3では、属性推定処理の結果及び顔認証処理の結果に基づいて、顔画像DB412及び静脈画像DB413の一部をリモートブレイン計算機101にコピーする点が実施例1と異なる。以下、実施例1との差異を中心に実施例3について説明する。
実施例3の計算機システムの構成は、実施例1の計算機システムの構成と同一である。実施例3の対話装置100、リモートブレイン計算機101、及びマザーブレイン計算機102の構成は、実施例1の各装置の構成と同一である。また、各装置が保持するデータベースのデータ構造は、実施例1のデータベースのデータ構造と同一である。
実施例3では、属性推定処理、顔認証処理、及び静脈認証処理が一部異なる。
まず、実施例3の属性推定処理について説明する。
ステップS1014において、推定モジュール313は、制御モジュール311を介して、マザーブレイン計算機102に属性推定処理の結果を含むデータの取得要求を送信する。
マザーブレイン計算機102の制御モジュール411は、当該要求を受信した場合、顔画像DB412から属性704がデータの取得要求に含まれる値に一致するエントリを検索する。制御モジュール411は、検索されたエントリを含む応答を推定モジュール313に送信する。
推定モジュール313は、受信した応答に含まれるエントリを記憶装置302に格納する。
次に、実施例3の顔認証処理について説明する。
ステップS1102において、認証モジュール312は、マザーブレイン計算機102への問合せの代わりに、記憶装置302に格納された顔画像DB412のエントリを用いて以下の処理を実行する。したがって、実施例3では、図12に示す顔画像DB412の検索処理が実行されない。
認証モジュール312は、推定モジュール313によって記憶装置302に格納されたエントリを用いて顔画像の類似度を算出し、顔画像の類似度が第5閾値より大きいエントリを検索する。顔画像の類似度が第5閾値より大きいエントリが存在しない場合、認証モジュール312は、記憶装置302に格納されるエントリの中から顔画像の類似度が第8閾値より大きいエントリを検索し、検索されたエントリのみを記憶装置302に保存する。その他の処理は実施例1と同一である。
次に、実施例3の静脈認証処理について説明する。
ステップS1302において、認証モジュール312は、マザーブレイン計算機102への問合せの代わりに、記憶装置302に格納された顔画像DB412のエントリを用いて以下の処理を実行する。したがって、実施例3では、図14に示す静脈画像DB413の検索処理が実行されない。
認証モジュール312は、類似度が第8閾値より大きいエントリの中から、静脈画像の類似度が第6閾値より大きいエントリを検索する。その他の処理は実施例1と同一である。
実施例3によれば、属性推定処理の結果及び顔認証処理の結果に基づいて絞り込まれたデータベースの一部をリモートブレイン計算機101に保存することによって、マザーブレイン計算機102へのアクセス回数を削減している。これによって、認証処理を高速化でき、また、マザーブレイン計算機102にアクセスできない場合でも、認証処理を実行できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 対話装置
101 リモートブレイン計算機
102 マザーブレイン計算機
103 ネットワーク
110 ユーザ
201、301、401 演算装置
202、302、402 記憶装置
203、303、403 通信装置
204 撮像装置
205 音声再生装置
206 集音装置
207 駆動制御装置
208 駆動装置
211、311、411 制御モジュール
212、314 対話DB
312 認証モジュール
313 推定モジュール
412 顔画像DB
413 静脈画像DB
500 言語辞書
600 推定ユーザ用テンプレート
610 登録ユーザ用テンプレート

Claims (12)

  1. ユーザとの対話を行い、所定のサービスを提供する計算機システムであって、
    画像を取得する撮像装置、ユーザに出力する発話内容を定義するテンプレートを選択する計算機、及び前記テンプレートに基づいて発話内容を生成する生成装置を備え、
    前記計算機は、
    演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるインタフェースを有し、
    前記テンプレートを格納する対話データベースを保持し、
    前記インタフェースを介して、前記撮像装置が取得した画像を用いた認証処理に使用する認証用画像を格納する画像データベースと接続し、
    前記対話データベースは、ユーザを特徴付ける属性に基づいて区分されたユーザ層に属するユーザに出力する発話内容を定義する複数の第1テンプレートと、特定の個人に出力する発話内容を定義する複数の第2テンプレートとを格納し、
    前記演算装置は、
    前記ユーザと前記撮像装置との間の距離を算出し、
    前記距離が第1閾値より大きい場合、前記撮像装置が取得した画像を用いて前記ユーザの前記属性を推定する属性推定処理を実行し、前記属性推定処理の結果に基づいて、前記対話データベースから前記ユーザが属する前記ユーザ層に対応する前記第1テンプレートを選択し、
    前記距離が前記第1閾値以下である場合、前記撮像装置が取得した画像及び前記画像データベースに基づいて前記ユーザを特定する認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、
    前記生成装置に、前記第1テンプレート及び前記第2テンプレートのいずれかを通知することを特徴とする計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記演算装置は、
    前記第1テンプレートが選択された後に、前記距離が前記第1閾値以下となった場合、前記認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、
    前記生成装置に前記第2テンプレートを通知することを特徴とする計算機システム。
  3. 請求項2に記載の計算機システムであって、
    前記認証処理は、第1の認証処理と、前記第1の認証処理より認証精度が高い第2の認証処理とを含み、
    前記演算装置は、
    前記距離が前記第1閾値以下かつ第2閾値より大きい場合、前記第1の認証処理を実行し、前記第1の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、
    前記距離が前記第2閾値以下である場合、前記第2の認証処理を実行し、前記第2の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択することを特徴とする計算機システム。
  4. 請求項3に記載の計算機システムであって、
    前記演算装置は、
    前記属性推定処理の結果に基づいて、前記第1の認証処理で参照する前記画像データベースの参照範囲を特定し、
    前記第1の認証処理の結果に基づいて、前記第2の認証処理で参照する前記画像データベースの参照範囲を特定することを特徴とする計算機システム。
  5. ユーザとの対話を行い、所定のサービスを提供する計算機システムにおける対話制御方法であって、
    前記計算機システムは、画像を取得する撮像装置、ユーザに出力する発話内容を定義するテンプレートを選択する計算機、及び前記テンプレートに基づいて発話内容を生成する生成装置を備え、
    前記計算機は、
    演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるインタフェースを有し、
    前記テンプレートを格納する対話データベースを保持し、
    前記インタフェースを介して、前記撮像装置が取得した画像を用いた認証処理に使用する認証用画像を格納する画像データベースと接続し、
    前記対話データベースは、ユーザを特徴付ける属性に基づいて区分されたユーザ層に属するユーザに出力する発話内容を定義する複数の第1テンプレートと、特定の個人に出力する発話内容を定義する複数の第2テンプレートとを格納し、
    前記対話制御方法は、
    前記演算装置が、前記ユーザと前記撮像装置との間の距離を算出する第1のステップと、
    前記演算装置が、前記距離が第1閾値より大きい場合、前記撮像装置が取得した画像を用いて前記ユーザの前記属性を推定する属性推定処理を実行し、前記属性推定処理の結果に基づいて、前記対話データベースから前記ユーザが属する前記ユーザ層に対応する前記第1テンプレートを選択する第2のステップと、
    前記演算装置が、前記距離が前記第1閾値以下である場合、前記撮像装置が取得した画像及び前記画像データベースに基づいて前記ユーザを特定する認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択する第3のステップと、
    前記演算装置が、前記生成装置に、前記第1テンプレート及び前記第2テンプレートのいずれかを通知する第のステップと、を含むことを特徴とする対話制御方法。
  6. 請求項5に記載の対話制御方法であって、
    前記第1テンプレートが選択された後に、前記距離が前記第1閾値以下となった場合、前記演算装置が、前記認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択するステップと、
    前記演算装置が、前記生成装置に前記第2テンプレートを通知するステップと、を含むことを特徴とする対話制御方法。
  7. 請求項6に記載の対話制御方法であって、
    前記認証処理は、第1の認証処理と、前記第1の認証処理より認証精度が高い第2の認証処理とを含み、
    前記第のステップは、
    前記演算装置が、前記距離が前記第1閾値以下かつ第2閾値より大きい場合、前記第1の認証処理を実行し、前記第1の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択する第5のステップと、
    前記演算装置が、前記距離が前記第2閾値以下である場合、前記第2の認証処理を実行し、前記第2の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択する第6のステップと、を含むことを特徴とする対話制御方法。
  8. 請求項7に記載の対話制御方法であって、
    前記第のステップは、前記演算装置が、前記属性推定処理の結果に基づいて、前記第1の認証処理で参照する前記画像データベースの参照範囲を特定するステップを含み、
    前記第のステップは、前記演算装置が、前記第1の認証処理の結果に基づいて、前記第2の認証処理で参照する前記画像データベースの参照範囲を特定するステップを含むことを特徴とする対話制御方法。
  9. ユーザとの対話を行い、所定のサービスを提供する計算機システムに含まれる計算機であって、
    前記計算機は、
    演算装置、前記演算装置に接続される記憶装置、前記演算装置に接続されるインタフェース、及び前記演算装置に接続され、画像を取得する撮像装置を有し、
    ユーザに出力する発話内容を定義するテンプレートを格納する対話データベースを保持し、
    前記インタフェースを介して、ユーザと対話を行う対話装置、及び前記撮像装置が取得した画像を用いた認証処理に使用する認証用画像を格納する画像データベースと接続し、
    前記対話データベースは、ユーザを特徴付ける属性に基づいて区分されたユーザ層に属するユーザに出力する発話内容を定義する複数の第1テンプレートと、特定の個人に出力する発話内容を定義する複数の第2テンプレートとを格納し、
    前記演算装置は、
    前記ユーザと前記撮像装置との間の距離を算出し、
    前記距離が第1閾値より大きい場合、前記撮像装置が取得した画像を用いて前記ユーザの前記属性を推定する属性推定処理を実行し、前記属性推定処理の結果に基づいて、前記対話データベースから前記ユーザが属する前記ユーザ層に対応する前記第1テンプレートを選択し、
    前記距離が前記第1閾値以下である場合、前記撮像装置が取得した画像及び前記画像データベースに基づいて前記ユーザを特定する認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、
    前記第1テンプレート及び前記第2テンプレートのいずれかに基づいて発話内容を生成することを特徴とする計算機。
  10. 請求項9に記載の計算機であって、
    前記演算装置は、前記第1テンプレートが選択された後に、前記距離が前記第1閾値以下となった場合、前記認証処理を実行し、前記認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択することを特徴とする計算機。
  11. 請求項10に記載の計算機であって、
    前記認証処理は、第1の認証処理と、前記第1の認証処理より認証精度が高い第2の認証処理とを含み、
    前記演算装置は、
    前記距離が前記第1閾値以下かつ第2閾値より大きい場合、前記第1の認証処理を実行し、前記第1の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択し、
    前記距離が前記第2閾値以下である場合、前記第2の認証処理を実行し、前記第2の認証処理の結果に基づいて、前記対話データベースから前記ユーザに対応する前記第2テンプレートを選択することを特徴とする計算機。
  12. 請求項11に記載の計算機であって、
    前記演算装置は、
    前記属性推定処理の結果に基づいて、前記第1の認証処理で参照する前記画像データベースの参照範囲を特定し、
    前記第1の認証処理の結果に基づいて、前記第2の認証処理で参照する前記画像データベースの参照範囲を特定することを特徴とする計算機。
JP2017113189A 2017-06-08 2017-06-08 計算機システム、対話制御方法、及び計算機 Active JP6860431B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017113189A JP6860431B2 (ja) 2017-06-08 2017-06-08 計算機システム、対話制御方法、及び計算機
US16/002,039 US10621421B2 (en) 2017-06-08 2018-06-07 Computer system, dialogue control method, and computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017113189A JP6860431B2 (ja) 2017-06-08 2017-06-08 計算機システム、対話制御方法、及び計算機

Publications (3)

Publication Number Publication Date
JP2018206228A JP2018206228A (ja) 2018-12-27
JP2018206228A5 JP2018206228A5 (ja) 2020-02-27
JP6860431B2 true JP6860431B2 (ja) 2021-04-14

Family

ID=64738269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017113189A Active JP6860431B2 (ja) 2017-06-08 2017-06-08 計算機システム、対話制御方法、及び計算機

Country Status (2)

Country Link
US (1) US10621421B2 (ja)
JP (1) JP6860431B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6684009B1 (ja) * 2019-10-03 2020-04-22 株式会社クリューシステムズ プログラム、映像処理装置及び認証方法
WO2021131031A1 (ja) * 2019-12-27 2021-07-01 慎太郎 稲垣 興行ビジネス方法、興行システム及び認証装置
JP7355243B2 (ja) * 2020-06-11 2023-10-03 日本電気株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US6606596B1 (en) * 1999-09-13 2003-08-12 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through digital sound files
US7505921B1 (en) * 2000-03-03 2009-03-17 Finali Corporation System and method for optimizing a product configuration
JP2001307098A (ja) * 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> 人物属性推定方法および人物属性推定装置
JP4072033B2 (ja) * 2002-09-24 2008-04-02 本田技研工業株式会社 受付案内ロボット装置
JP2010079609A (ja) * 2008-09-26 2010-04-08 Brother Ind Ltd 個人認証装置、個人認証プログラム、および個人認証装置を備えたインターホンシステム
JP2010108200A (ja) 2008-10-30 2010-05-13 Mitsubishi Electric Corp 個人認証装置及び個人認証方法
US10276170B2 (en) * 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10289896B2 (en) * 2014-06-23 2019-05-14 British Telecommunications Public Limited Company Biometric identification
BR112016027700A2 (pt) * 2014-06-27 2017-08-15 Microsoft Technology Licensing Llc Proteção de dados baseada em reconhecimento de usuário e gesto
JP6450138B2 (ja) 2014-10-07 2019-01-09 株式会社Nttドコモ 情報処理装置及び発話内容出力方法
US10250650B2 (en) * 2015-01-05 2019-04-02 Harman International Industries, Incorporated Discovery playlist creation
US20170250930A1 (en) * 2016-02-29 2017-08-31 Outbrain Inc. Interactive content recommendation personalization assistant
JP2017209769A (ja) * 2016-05-27 2017-11-30 グローリー株式会社 サービスシステム、及び、ロボット
JP6440327B2 (ja) * 2016-07-25 2018-12-19 ユニボット株式会社 防犯システム、防犯方法、及びロボット

Also Published As

Publication number Publication date
JP2018206228A (ja) 2018-12-27
US20190005311A1 (en) 2019-01-03
US10621421B2 (en) 2020-04-14

Similar Documents

Publication Publication Date Title
US11030412B2 (en) System and method for chatbot conversation construction and management
EP3491533B1 (en) Providing command bundle suggestions for an automated assistant
CN109147770B (zh) 声音识别特征的优化、动态注册方法、客户端和服务器
US11551219B2 (en) Payment method, client, electronic device, storage medium, and server
JP6657124B2 (ja) 会話理解システムのためのセッションコンテキストモデリング
CN107886949B (zh) 一种内容推荐方法及装置
CN110288985B (zh) 语音数据处理方法、装置、电子设备及存储介质
US11855988B2 (en) Synchronizing access controls between computing devices
US10838746B2 (en) Identifying parameter values and determining features for boosting rankings of relevant distributable digital assistant operations
CN107481720A (zh) 一种显式声纹识别方法及装置
JP6860431B2 (ja) 計算機システム、対話制御方法、及び計算機
US20080298562A1 (en) Voice aware demographic personalization
CN111095892A (zh) 电子装置及其控制方法
JP2020004381A (ja) 情報プッシュ方法及び装置
CN116018791A (zh) 在助手系统中使用单个请求进行多人呼叫
US11561761B2 (en) Information processing system, method, and storage medium
JP7347217B2 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
CN110570843B (zh) 一种用户语音识别方法和装置
JP6481643B2 (ja) 音声処理システムおよび音声処理方法
JPWO2017199486A1 (ja) 情報処理装置
CN109712606A (zh) 一种信息获取方法、装置、设备及存储介质
CN109460504A (zh) 知识社区中预约答题的解答主体推荐方法及其装置、电子设备、计算机可读介质
US11842737B2 (en) Automated assistant interaction prediction using fusion of visual and audio input
JP7207543B2 (ja) 情報推薦装置、情報推薦システム、情報推薦方法及び情報推薦プログラム
CN110459203A (zh) 一种智能语音导游方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210326

R150 Certificate of patent or registration of utility model

Ref document number: 6860431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150