JP6620230B2

JP6620230B2 - 迅速な識別方法及び家庭用の知能ロボット

Info

Publication number: JP6620230B2
Application number: JP2018517885A
Authority: JP
Inventors: シアン、ウェンジ; ズ、レイ
Original assignee: ユウトウ・テクノロジー（ハンジョウ）・カンパニー・リミテッド
Priority date: 2015-10-09
Filing date: 2016-10-09
Publication date: 2019-12-11
Anticipated expiration: 2036-10-09
Also published as: CN106570443A; US20180293236A1; EP3361410A1; JP2018533064A; EP3361410A4; TWI621470B; WO2017059815A1; TW201713402A; US10664511B2

Description

本発明はロボットに関し、特に、家庭用の知能ロボットに応用する迅速な識別方法及び家庭用の知能ロボットに関するものである。

スマート・エレクトロニクスの普及に従って、ますます多くの家庭が家庭用の知能ロボットとも呼ばれる知能電子製品を使い始めることになった。
現在、ますます多くのインテリジェント電子機器が使用されており、スマートな家庭用のロボットも徐々に普通の人々に家に入っている。しかしながら、既存の家庭用の知能ロボットは通常に従来の移動端末の１対１の動作モードを継続し、家族の全てのメンバーを区別せずに一人のユーザーとして扱うため、よって、家族の各メンバーが家庭用の知能ロボットを起動させる時に、排他的なパーソナライズドサービスを得ることができない、家庭用の知能ロボットの地位が弱くなり、家庭用の知能ロボットの普及に影響を与えた。

上記の問題に対して、本発明は異なるユーザーに対して家庭メンバーを迅速に識別することができ、パーソナライズドサービスを提供する迅速な識別方法及び家庭用の知能ロボットを提供した。
具体的な技術案は以下通りであり、すなわち：
家庭用の知能ロボットに適用する迅速な識別方法は、
異なるユーザーに対応する複数のパーソナルファイルを予め設定する工程Ｓ１００と；
前記ユーザーの特徴に関係する識別情報を収集し、前記識別情報と前記対応するユーザーのパーソナルファイルとの間に関連を作る工程Ｓ２００と；
前記家庭用の知能ロボットはユーザーの特徴を収集し、記憶されている前記識別情報とマッチングを行い、前記ユーザーを識別して、識別が成功である場合、工程Ｓ４００に進み、成功ではない場合、終了とする工程Ｓ３００と；
前記識別されたユーザーによって、対応する前記パーソナルファイルを取得し、前記パーソナルファイルにより作業を行う工程Ｓ４００と；
を含む。

好ましくは、前記迅速な識別方法において、前記ユーザーは音声で前記家庭用の知能ロボットを活性化して、起動してから、前記家庭用の知能ロボットに指令を送信する。
好ましくは、前記迅速な識別方法において、前記識別情報は声紋モデルを含むこと。

好ましくは、前記迅速な識別方法において、前記識別情報は顔画像モデルを含む。
好ましくは、前記迅速な識別方法において、前記声紋モデルを収集する方式が第１主動収集と第１自動収集とを含み；
前記第１主動収集は前記家庭用の知能ロボットにより予め収集された前記ユーザーからの起動音声によって、前記ユーザーの声紋モデルを取得する方式であって；
前記第１自動収集は前記家庭用の知能ロボットにより前記ユーザーの初めて利用する時の収集された起動音声によって、自動的に前記ユーザーの声紋モデルを取得する方式である。

好ましくは、前記迅速な識別方法において、前記顔画像モデルの収集方式は第２主動収集と第２自動収集とを含み；
前記第２主動収集は前記家庭用の知能ロボットにより予め収集された前記ユーザーの顔画像によって、前記ユーザーの前記顔画像モデルを取得する方式であって；
前記第２自動収集は前記家庭用の知能ロボットが前記ユーザーの声紋モデルを取得した後、自動的に前記ユーザーの顔画像を読み取ることにより、前記顔画像モデルを取得する方式である。

好ましくは、前記迅速な識別方法において、前記パーソナルファイルは歴史記録と格納リストを含み、前記家庭用の知能ロボットは識別済のユーザー指令を接収して、前記識別済のユーザーのパーソナルファイルにある前記歴史記録あるいは前記格納リストにより、前記指令を執行する。

好ましくは、前記迅速な識別方法において、時間に関連する複数の録音済の音声を記憶する一つの記憶ユニットが提供され、前記パーソナルファイルは前記ユーザーの名前を含み、前記家庭用の知能ロボットは前記ユーザーに対して顔画像の識別を行い、識別結果に応じて前記パーソナルファイルにある前記ユーザーの名前を取出して、それに前記記憶ユニットから対応する前記予め録音済の音声を現在の時間に合わせて選択して、前記名前を予め録音された音声と接合した後に、マシン発声を通して放送する。

好ましくは、前記迅速な識別方法において、前記ユーザーの顔画像を読み取るカメラが提供される。
好ましくは、上記の請求項１−９のいずれかの迅速な識別方法を採用する家庭用の知能ロボットをさらに含む。
本発明の技術案により、異なるユーザーに対して迅速な識別ができ、認識度と認識率が高くなり、家庭用の知能ロボットはもっとインテリジェントになり、それに、異なるユーザーに対して、パーソナルサービスを提供することができ、広い適用の見通しがある。

図１は本発明の迅速な識別方法及び家庭用の知能ロボット、の一つ好ましい実施例の実施方法のフローチャートである。

以下本発明の実施形態の図面を参照しながら、本発明の実施形態の技術案をはっきり、完全的に説明する。明らかに、記載されている実施形態はただ本発明の実施形態の一部だけであり、全ての実施形態ではない。当業者が本発明の実施形態に基づいて、創造的な労働をしないで、取得した実施形態は全部本発明の保護範囲内に属するものである。

説明する必要があるのは、衝突しない場合、本発明の実施形態及び実施形態における特徴を組み合わせることができる。
以下は図面と具体的な実施形態とにより本発明を詳しく説明するが、本発明に対しての限定ではない。
図１の示したように、家庭用の知能ロボットに適用する迅速な識別方法は、
異なるユーザーに対応する複数のパーソナルファイルを予め設定する工程Ｓ１００と；
本発明の好ましい実施例では、好きな音楽あるいは個人の趣味などの様々なユーザーに関する情報を格納するために、ユーザーごとのパーソナルファイルを作成し、家庭用の知能ロボットは家族ごとに異なるパーソナライズドサービスを提供することができるようになった。

ユーザーの特徴に関係する識別情報を収集し、識別情報と上記の対応するユーザーのパーソナルファイルとの間に関連を作る工程Ｓ２００と；
ユーザーのパーソナルファイルと識別情報との間に相互の関連を作り、識別情報により対応するユーザーのパーソナルファイルを取得し、よって、家庭用の知能ロボットはパーソナルファイルごとに記載されている異なる情報により作動することができるようになって、家族ごとにパーソナライズドサービスを提供できることを実現した。

本発明の好ましい実施例では、識別情報は声紋モデルを含む。
本発明に基づいて、さらに、声紋モデルの収集方式が第１主動収集と第１自動収集とを含み；
第１主動収集は家庭用の知能ロボットにより予め収集されたユーザーの起動音声により、ユーザーの声紋モデルを取得する；
主動収集は主にはじめて家庭用の知能ロボットを使用する時に、ロボットに対して、ある情報の入力及び将来の使用のための設定をすることが必要であり、例えば起動音声の内容を設定すること、及び家族メンバーごとの識別情報を収集すること。第１自動収集は家庭用の知能ロボットにユーザーがはじめて使用する時の収集された起動音声により、自動的にユーザーの声紋モデルを取得するものである。

新しいユーザーの識別情報の収集に対して、家庭用の知能ロボットの自動収集方式によることができ、例えば、新しいユーザーは初めて家庭用の知能ロボットに指令（例えば家庭用の知能ロボットに設定された名前を呼ぶ）を発送する時、家庭用の知能ロボットは起動音声により起動され、且つ、当該ユーザーの音声を収集し、声紋モデルを生成し、当該ユーザーの指令に応答すると同時に、識別情報の収集が完成され、且つ新しいユーザーのパーソナルファイルが作成され、収集した声紋モデルを識別情報として格納する。

本発明の好ましい実施例では、識別情報は顔画像モデルを含む。
本技術案に基づいて、さらに、顔画像モデルの収集方式は第２主動収集と第２自動収集とを含み；
第２主動収集は家庭用の知能ロボットにより予め収集されたユーザーの顔画像によって、ユーザーの顔画像モデルを取得するものであって；
主動収集は主にはじめて家庭用の知能ロボットを使用する時に、ロボットに対して、ある情報の入力及び将来の使用のための設定をすることが必要であり、例えば起動音声の内容を設定すること、及び家族メンバーごとの識別情報を収集すること。

第２自動収集は上記の家庭用の知能ロボットが上記のユーザーの声紋モデルを取得した後、自動的に上記のユーザーの顔画像を読み取ることにより、上記の顔画像モデルを取得するものである。
新しいユーザーの識別情報に対して自動収集を行う時に、ユーザーは次回に家庭用の知能ロボットを使用する時の身分識別に便利になるように、新しいユーザーの顔画像モデルを収集することも含む。

家庭用の知能ロボットはユーザーの特徴を収集し、記憶されている識別情報とマッチングを行い、ユーザーを識別して、識別が成功である場合、工程Ｓ４００に進み、成功ではない場合、終了とする工程Ｓ３００と；
本発明の好ましい実施例では、家庭用の知能ロボットはユーザーを識別する時に、収集した顔画像がぼやけて顔を識別することができなかったら、自動にユーザーの声紋を識別し、声紋によりユーザーの身分を識別することができれば、顔画像の識別が成功でなくても、音声により、ユーザーは家庭用の知能ロボットに識別されることができる。

さらに、好ましい実施形態として、画像識別または音声識別のいずれかが成功である限り、家庭用の知能ロボットはユーザーに対する身分識別が成功とし、顔識別と声紋識別と共に成功でないだけでは、家庭用の知能ロボットはユーザーに対する識別が失敗とし、ユーザーは再び音声あるいは顔画像により身分の識別をすることができる。

識別されたユーザーによって、対応するパーソナルファイルを取り出し、パーソナルファイルに応じて作業を行う工程Ｓ４００と；
本発明の好ましい実施例では、ユーザーは起動音声により家庭用の知能ロボットを起動し、家庭用の知能ロボットに指令を発送する。

ユーザーは家庭用の知能ロボットに指令を出す時に、ユーザーの他の音声と区分をするため、普通に、家庭用の知能ロボットに対する起動は固定音声により起動させ、例えば、家庭用の知能ロボットに素晴らしい名前を付け、家族のように家庭用の知能ロボットの名前を呼ぶなど、前記の設定により、家庭用の知能ロボットは自分の名前が聞こえると活性化され、ロボットを起動させる音声は固定であるため、よって、起動音声に基づく声紋識別をすることができ、ユーザーはロボットを使用する時、起動音声を出すことによりロボットを起動させ、ロボットは自分の名前を含む音声を検測すると、声紋検測をし、だから、固定音声に基づく声紋検測はより高い正確率を持つ。

本発明の好ましい実施例では、パーソナルファイルに歴史記録と格納リストとを含み、家庭用の知能ロボットは識別済のユーザーからの指令を接収して、識別済のユーザーのパーソナルファイルにおける歴史記録あるいは格納リストにより指令を実行する。
例えば、あるユーザーはロボットを起動させて、“音楽を放送してくれ”という指令を出す時に、ロボットは起動音声によりユーザーを識別することができ、当該ユーザーの放送リストを記録し、且つ分析し、ユーザーはしばらくの日々が経って、使用してから、ロボットはユーザーの履歴とお気に入りのリストによって精確な勧めを行うことができ、他の家族メンバーが“音楽を放送してくれ”という同じ指令を出す時に、ロボットは声紋により家族メンバーを区分することができ、異なる家族メンバーに違う音楽を勧める。

本発明の好ましい実施例では、時間に関連する複数の予め録音済み音声を格納する一つの記憶ユニットがさらに提供され、パーソナルファイルにさらにユーザーの名前が含まれ、家庭用の知能ロボットはユーザーに対して自動に顔画像を識別して、識別結果によりユーザーのパーソナルファイルにおける名前を取り出し、且つ、現在の時間により、記憶ユニットにおける対応する予め録音された音声を選択して、名前をマシン発声により、予め録音した音声とを接合した後に放送する。

必要がある時に、音声放送をするため、時間に関連する予め録音された音声を記憶ユニットに格納して、例えば、ユーザーは夜、家に帰ると、ロボットは赤外線のカメラ装置を介して検出し、主動に自己起動することができ、それに、顔画像により、現在ユーザーの身分を識別してユーザーのパーソナルファイルを取得して、現在の時間により記憶ユニットにおける対応する予め録音された音声を取得して、この場合、家庭用の知能ロボットは内部に配置されたＴＴＳ（ＴｅｘｔＴｏＳｐｅｅｃｈ）エンジンを介してマシン発声によりパーソナルファイルにある名前を放送して、且つ、取得された予め録音した音声と接合して、“こんばんは、ｘｘｘ”のような挨拶が形成されるようになり、あるいはパーソナルファイルにおける歴史記録により、当該ユーザーが好きな音楽を放送する。好ましい実施形態として、記憶ユニットに必要な記憶空間を減少するため、挨拶の内容を文字列の形で記憶ユニットに格納して、マシンは直接的にＴＴＳエンジンを介して発声する。

本発明の好ましい実施例では、ユーザーの顔画像を読み取るカメラを提供する。
声紋を検測すると同時に、カメラは同期にユーザーの顔を検測して、ユーザーの顔画像を検測しなかった場合、単独に声紋データを格納する；ユーザーの顔画像を検測した場合、ユーザーの顔と声紋データを同時に格納して、且つ、パーソナルファイルに関連付け、それから、インタラクションにより、ユーザーの確認後、声紋と顔画像とパーソナルファイルとの間の関係が確立した。

本発明の好ましい実施例では、上記の迅速な識別方法を採用する家庭用の知能ロボットをさらに含む。
ユーザーの身分を識別することが必要である場合、同時に声紋モデルにより識別することあるいは顔モデルにより識別することができ、様々な識別する方式は識別の正確率と効率を高めることができる。ユーザーは起動音声によりロボットを起動させインタラクションを行う場合、声紋識別により正確にユーザーを識別することができる；ユーザーは起動音声を使用しなかった場合、顔によりユーザーを識別することもできる。

上記述べたのはただ本発明の好ましい実施例であり、本発明の実施方式と保護範囲を制限する意図がなくて、当業者には、本発明の明細書及び付図内容により作り出された等しい置換や顕著な変更などから得られ方案は全て本発明の保護範囲内に属することに意識すべきである。

Claims

異なるユーザーに対応する複数のパーソナルファイルを予め設定する工程Ｓ１００と、
前記ユーザーの特徴に関係する識別情報を収集し、前記識別情報と前記対応するユーザーのパーソナルファイルとの間に関連を作る工程Ｓ２００と、
家庭用の知能ロボットはユーザーの特徴を収集し、記憶されている前記識別情報とマッチングを行い、前記ユーザーを識別して、識別が成功である場合、工程Ｓ４００に進み、成功ではない場合、終了とする工程Ｓ３００と、
前記識別されたユーザーによって、対応する前記パーソナルファイルを取得し、前記パーソナルファイルにより作業を行う工程Ｓ４００とを含み、
前記ユーザーは音声で前記家庭用の知能ロボットに指令し、前記家庭用の知能ロボットが前記音声に基づいて前記ユーザーを識別した状態に起動してから、前記家庭用の知能ロボットに指令を送信し、
前記識別情報は声紋モデルを含み、
前記声紋モデルを収集する方式が第１主動収集と第１自動収集とを含み、
前記第１主動収集は前記家庭用の知能ロボットにより予め収集された前記ユーザーからの起動音声によって、前記ユーザーの声紋モデルを取得する方式であり、
前記第１自動収集は前記家庭用の知能ロボットにより前記ユーザーの初めて利用する時の収集された起動音声によって、自動的に前記ユーザーの声紋モデルを取得する方式であること、
を含むことを特徴とする家庭用の知能ロボットに適用する迅速な識別方法。
前記識別情報は顔画像モデルを含むことを特徴とする請求項１記載の迅速な識別方法。
前記顔画像モデルの収集方式は第２主動収集と第２自動収集とを含み、
前記第２主動収集は前記家庭用の知能ロボットにより予め収集された前記ユーザーの顔画像によって、前記ユーザーの前記顔画像モデルを取得する方式であって、
前記第２自動収集は前記家庭用の知能ロボットが前記ユーザーの声紋モデルを取得した後、自動的に前記ユーザーの顔画像を読み取ることにより、前記顔画像モデルを取得する方式である、
ことを特徴とする請求項２記載の迅速な識別方法。
前記パーソナルファイルは歴史記録と格納リストを含み、前記家庭用の知能ロボットは識別済のユーザー指令を接収して、前記識別済のユーザーのパーソナルファイルにある前記歴史記録あるいは前記格納リストにより、前記ユーザー指令を執行することを特徴とする請求項１記載の迅速な識別方法。
時間に関連する複数の録音済の音声を記憶する一つの記憶ユニットが提供され、前記パーソナルファイルは前記ユーザーの名前を含み、前記家庭用の知能ロボットは前記ユーザーに対して顔画像の識別を行い、識別結果に応じて前記パーソナルファイルにある前記ユーザーの名前を取出して、それに前記記憶ユニットから対応する前記予め録音済の音声を現在の時間に合わせて選択して、前記名前を予め録音された音声と接合した後に、マシン発声を通して放送することを特徴とする請求項１記載の迅速な識別方法。
前記ユーザーの顔画像を読み取るカメラが提供されることを特徴とする請求項１記載の迅速な識別方法。
請求項１−６のいずれかの迅速な識別方法を採用することを特徴とする家庭用の知能ロボット。