JP6751806B2 - エンティティに関連する欠落情報を補足するために複数のデータストリームを使用するエンティティ認識 - Google Patents

エンティティに関連する欠落情報を補足するために複数のデータストリームを使用するエンティティ認識 Download PDF

Info

Publication number
JP6751806B2
JP6751806B2 JP2019157122A JP2019157122A JP6751806B2 JP 6751806 B2 JP6751806 B2 JP 6751806B2 JP 2019157122 A JP2019157122 A JP 2019157122A JP 2019157122 A JP2019157122 A JP 2019157122A JP 6751806 B2 JP6751806 B2 JP 6751806B2
Authority
JP
Japan
Prior art keywords
data stream
entity
knowledge graph
recognizable
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019157122A
Other languages
English (en)
Other versions
JP2020064613A (ja
Inventor
リキュウ,フレディ
ファイザル ザマン,エムディー
ファイザル ザマン,エムディー
Original Assignee
アクセンチュア グローバル ソリューションズ リミテッド
アクセンチュア グローバル ソリューションズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アクセンチュア グローバル ソリューションズ リミテッド, アクセンチュア グローバル ソリューションズ リミテッド filed Critical アクセンチュア グローバル ソリューションズ リミテッド
Publication of JP2020064613A publication Critical patent/JP2020064613A/ja
Application granted granted Critical
Publication of JP6751806B2 publication Critical patent/JP6751806B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Analysis (AREA)

Description

本開示は、全般的に、複数のデータストリームを使用するエンティティ認識のためのデバイスおよび方法に関する。
知識グラフは、特定のカテゴリ、プロパティを、または或るドメインのクラス、トピック、データおよび/もしくはエンティティの間の関係を、表現、指定および/または定義するために使用され得る。知識グラフは、或るドメインのクラス、トピック、データおよび/またはエンティティを表現するノードと、そのドメインのクラス、トピック、データおよび/またはエンティティ間の関係を表現しノードをリンクするエッジとを含み得る。知識グラフは、分類システム、機械学習、コンピュータ処理および/または同様のものにおいて使用され得る。
一部の実装によれば、方法は、第1のデータストリームおよび第2のデータストリームを受信するステップ、第1のデータストリームの画像データ内に複数のエンティティが存在すると判断するステップ、第1のデータストリームの画像データ内で複数のエンティティのうちの或るエンティティが認識不能であると判断するために、第1のデータストリームを分析するステップ、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフをデバイスによって取得するステップであって、共通知識グラフは、複数のエンティティについての情報を含む、取得するステップ、第1のアノテーション付き知識グラフを生成するために、第1のデータストリーム内の複数のエンティティの第1の対応する認識可能な特性を用いて、共通知識グラフにアノテーションを付けるステップ、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内の複数のエンティティの第2の対応する認識可能な特性を用いて、共通知識グラフにアノテーションを付けるステップ、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づきエンティティが認識可能であるかどうかを判断するステップ、ならびに/またはエンティティが認識可能であるかどうかに基づき、第1のデータストリームに関連するアクションを実行するステップを含んでもよい。
上記の方法の一部の可能な実装によれば、複数のエンティティについての情報は、複数のエンティティのうちの1つ以上の、対応するアイデンティティを示してもよい。
上記の方法の一部の可能な実装によれば、本方法は、画像データがエンティティの認識不能な特性を含むことに基づき、エンティティが認識不能であると判断するステップをさらに含んでもよい。
上記の方法の一部の可能な実装によれば、本方法は、第1のアノテーション付き知識グラフと第2のアノテーション付き知識グラフとを比較することに基づきエンティティが認識可能である確率を判断するステップをさらに含んでもよく、アクションを実行するステップは、エンティティが認識可能である確率を第1のデータストリームに関連するメタデータの中で示すステップを含んでもよい。
上記の方法の一部の可能な実装によれば、アクションを実行するステップは、第1のアノテーション付き知識グラフと第2のアノテーション付き知識グラフとを比較することに基づきエンティティが認識可能である確率を判断するステップと、確率が閾値を満たすと判断するステップと、確率が閾値を満たすことに基づき、エンティティの認識不能な特性に対応する、第2のデータストリームからの認識可能な特性を含むように第1のデータストリームを補足するステップと、を含んでもよい。
上記の方法の一部の可能な実装によれば、第1のデータストリームおよび第2のデータストリームは、同じ事象、同じ場所、同じ人または同じ期間のうちの少なくとも1つに関連してもよい。
上記の方法の一部の可能な実装によれば、画像データは、第1の画像データを含んでもよく、第2のデータストリームは、第2の画像データを含み、第2の画像データは、複数のエンティティの第2の対応する認識可能な特性を含んでもよい。
上記の方法の一部の可能な実装によれば、第2のデータストリームは、画像データ、オーディオデータ、テキストデータまたはセンサデータのうちの少なくとも1つを含んでもよい。
一部の実装によれば、デバイスは、1つ以上のメモリと、1つ以上のメモリに通信結合された1つ以上のプロセッサと、を含んでもよく、1つ以上のプロセッサは、第1のデータストリームおよび第2のデータストリームを受信すること、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフを取得することであって、共通知識グラフは、第1のデータストリームおよび第2のデータストリームに関連する情報を含む、取得すること、エンティティが第1のデータストリーム内の認識不能な特性を有することに基づき、エンティティが第1のデータストリーム内の認識不能なエンティティであると検出すること、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けること、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けること、第2のアノテーション付き知識グラフ内の第2の対応する認識可能な特性のうちの1つが第1のアノテーション付き知識グラフ内の認識不能な特性に対応するかどうかを、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づき判断すること、第2の対応する認識可能な特性のうちの1つが認識不能な特性に対応するかどうかに基づき、エンティティが識別可能なエンティティである確率を判断すること、および/または確率に基づきアクションを実行すること、をする。
上記のデバイスの一部の可能な実装によれば、共通知識グラフは、第1のデータストリームを提供する1つ以上のデータストリームデバイスにより監視される事象、場所、人または期間のうちの少なくともに関連してもよい。
上記のデバイスの一部の可能な実装によれば、共通知識グラフは、エンティティが第1のデータストリームおよび第2のデータストリームに含まれていることを示してもよい。
上記のデバイスの一部の可能な実装によれば、1つ以上のプロセッサは、第1のアノテーション付き知識グラフを生成するために共通知識グラフにアノテーションを付けるとき、第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を識別するために、第1のオブジェクト認識手法を使用して第1のデータストリームを分析することであって、第1のオブジェクト認識手法は、第1のデータストリームの第1のタイプに関連する、第1のデータストリームを分析することと、第1のアノテーション付き知識グラフを生成するために、第1の対応する認識可能な特性と、共通知識グラフの対応するノードとを関連付けることと、認識不能な特性が、認識不能な特性に対応する共通知識グラフの特定のノードに関連することを示すことと、をしてもよく、1つ以上のプロセッサは、第2のアノテーション付き知識グラフを生成するために共通知識グラフにアノテーションを付けるとき、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を識別するために、第2のオブジェクト認識手法を使用して第2のデータストリームを分析することであって、第2のオブジェクト認識手法は、第2のデータストリームの第2のタイプに関連する、第2のデータストリームを分析することと、第2のアノテーション付き知識グラフを生成するために、第2の対応する認識可能な特性と、共通知識グラフの対応するノードとを関連付けることと、をしてもよい。
上記のデバイスの一部の可能な実装によれば、第1のデータストリームは、当初受信された第1のデータストリームであってもよく、1つ以上のプロセッサは、アクションを実行するとき、再構築された第1のデータストリームをもたらすために、認識不能な特性に関連するデータを第2の対応する認識可能な特性のうちの認識可能な特性に関連するデータにより置き換えることにより、当初受信された第1のデータストリームを再構築することと、再構築された第1のデータストリームを、当初受信された第1のデータストリームに関連して格納することと、をしてもよい。
上記のデバイスの一部の可能な実装によれば、1つ以上のプロセッサは、アクションを実行するとき、第2の対応する認識可能な特性のうちの1つが認識不能な特性に対応することに基づき、第2の対応する認識可能な特性のうちの1つに関連するメタデータを用いて第1のデータストリームを補足してもよい。
一部の実装によれば、非一時的コンピュータ可読媒体は、命令を格納してもよく、命令は、1つ以上の命令を含み、1つ以上の命令は、1つ以上のプロセッサにより実行されると1つ以上のプロセッサに、第1のデータストリームおよび第2のデータストリームを受信することと、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフを取得することと、エンティティが共通知識グラフ内に表現されていると判断することと、第1のデータストリーム内のエンティティの認識不能な特性を判断することと、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることと、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることと、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づき、エンティティの認識可能な特性が第2のデータストリーム内にあると判断することであって、第2のデータストリーム内のエンティティの認識可能な特性は、第1のデータストリーム内の前記エンティティの認識不能な特性に対応する、第2のデータストリーム内にあると判断することと、エンティティの認識可能な特性が第2のデータストリーム内にあると判断することに基づき、アクションを実行することとをさせる。
上記の非一時的コンピュータ可読媒体の一部の可能な実装によれば、第1のデータストリームは、第2のデータストリームと異なる期間に関連してもよい。
上記の非一時的コンピュータ可読媒体の一部の可能な実装によれば、第1のデータストリームと第2のデータストリームとは、異なるタイプのデータストリームであってもよい。
上記の非一時的コンピュータ可読媒体の一部の可能な実装によれば、1つ以上のプロセッサにアクションを実行させる1つ以上の命令は、1つ以上のプロセッサに、第1のアノテーション付き知識グラフと第2のアノテーション付き知識グラフとを比較することに基づき、認識不能な特性がエンティティに関連する確率を判断することと、確率が閾値を満たすと判断することと、確率が閾値を満たすことに基づき、認識可能な特性を含むように第1のデータストリームを補足することと、をさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の可能な実装によれば、第1のデータストリームは、当初受信された第1のデータストリームであってもよく、1つ以上のプロセッサにアクションを実行させる1つ以上の命令は、1つ以上のプロセッサに、再構築された第1のデータストリームをもたらすために、認識不能な特性に関連するデータを認識可能な特性に関連するデータにより置き換えることにより、当初受信された第1のデータストリームを再構築することと、再構築された第1のデータストリーム内でエンティティが識別されるとの通知を提供することと、をさせてもよい。
上記の非一時的コンピュータ可読媒体の一部の可能な実装によれば、1つ以上のプロセッサにアクションを実行させる1つ以上の命令は、1つ以上のプロセッサに、認識不能な特性に対応する認識可能な特性に基づき、認識可能な特性に関連するメタデータを用いて第1のデータストリームを補足させてもよい。
本願明細書に記載される例示の実装の図である。 本願明細書に記載される例示の実装の図である。 本願明細書に記載される例示の実装の図である。 本願明細書に記載されるシステムおよび/または方法が実装され得る例示の環境の図である。 図3の1つ以上のデバイスの例示のコンポーネントの図である。 エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセスのフローチャートである。 エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセスのフローチャートである。 エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセスのフローチャートである。
以下の例示の実装の詳細な説明は、添付の図面を参照する。異なる図面にある同じ参照番号は、同じまたは類似の要素を特定することがある。
データストリーム(例えばビデオストリーム、オーディオストリーム、テキストストリームおよび/または同様のもの)の中のエンティティを認識することは、データマイニング、eディスカバリ、ユーザプロファイリングおよび/または同様のものなど、様々な用途において有用であろう。データストリームは、情報を含む一連のデータまたはデータのシーケンスを含み得る。データストリームは、カメラ、マイクロフォン、ユーザデバイス、サーバおよび/または同様のものなどの1つ以上のデバイスにより提供され得る。様々な手法(例えばオブジェクト認識、文字認識、音声認識、発話テキスト化手法および/または同様のもの)を、データストリームの中のエンティティを認識するために使用できる。しかしながら、場合によっては、エンティティの特定の特性が、エンティティを認識不能にさせることもある。例として、ビデオストリーム(画像データまたは画像のストリームを含み得る)において、(例えば、人の背中がビデオストリームの画像を捕捉するカメラに向かっていることが理由で)ビデオストリームのいずれの画像または部分の中にも人の識別可能な特徴(例えば人の顔)が含まれていない場合、その人は認識可能でないかもしれない。さらに、または代わりに、テキストデータ(例えば、(例えばエンティティの)プロファイル、会話を文字起こししたもの、書籍、新聞記事および/または同様のものなどのテキストファイル)またはテキストストリーム(例えば一連のテキストメッセージ、電子メールおよび/もしくは同様のもの、ならびに/または同様のもの)において、人についてテキストストリーム内で議論されているがその人の名前がテキストストリームの中に含まれない(例えばその人が代名詞で言及されている)場合、その議論されている人は識別可能でないかもしれない。
本願明細書に記載される一部の実装は、データストリームアナライザが、データストリームの中の欠落情報を検出して、データストリームに関連する別のデータストリームからの情報を使用して当該欠落情報を補足できるようにする。例として、本願明細書に記載されるように、データストリームアナライザは、データストリーム内の認識不能なエンティティまたは認識不能な特性を有するエンティティを検出し、別のデータストリーム(またはデータのセット)からのデータおよび/または情報を使用して、エンティティを認識しまたは認識不能なエンティティに対応するエンティティの認識可能な特性を識別してもよい。したがって、そのような事例において、データストリーム内の認識不能なエンティティを、別のデータストリームからの情報を使用して認識できる(またはエンティティが特定のエンティティである確率を少なくとも認識できる)。例として、(例えばエンティティの認識可能な特性(例えばエンティティの名前、エンティティの顔、エンティティに関連する音および/または同様のもの)がビデオストリームにないことが理由で)或る事象に関連するビデオストリームの中のエンティティが認識できない場合、データストリームアナライザは、別のデータストリーム(例えば事象の別のビデオストリーム、事象のオーディオストリーム、事象に関連するテキストストリーム(または会話)、事象の文字起こしをしたものおよび/または同様のもの)を使用し、別のデータストリーム内のデータおよび/または情報を使用してエンティティを認識してもよい。一部の実装において、1つ以上の知識グラフが使用および/または生成されて、1つのデータストリーム内のエンティティの認識不能な特性が識別され、別のデータストリーム内のエンティティの対応する認識可能な特性が識別されてもよい。例として、データストリームアナライザは、各データストリーム内の識別可能な情報を用いて共通知識グラフ(例えば両方のデータストリームまたはデータストリームのセットに関連する知識グラフ)にアノテーションを付けて、データストリームのアノテーション付き知識グラフを生成してもよい。データストリームアナライザは、アノテーション付き知識グラフを比較して、1つのデータストリーム内の欠落情報が別のデータストリームに含まれているかどうか、および/または1つのデータストリーム内の欠落情報が別のデータストリーム内にある情報に対応する確率を判断してもよい。
このようにして、データストリームを分析してデータストリーム内の1つ以上のエンティティ(またはデータストリームの中で表現された1つ以上のエンティティ)を認識するプロセスの異なるいくつかの段階が自動化され、これにより、プロセスから人間の主観性および無駄を除去でき、プロセスの速度および効率性を改善してコンピューティングリソース(例えばプロセッサリソース、メモリリソースおよび/または同様のもの)を節約できる。さらに、本願明細書に記載された実装は、以前は実行されなかった、または以前は人間の主観的な直感もしくは入力を使用して実行されていたタスクまたは役割を実行するために、コンピュータによる的確なプロセスを使用する。例として、現在、(例えばエンティティが認識不能な特性を有することに基づき)第1のデータストリーム内のエンティティが認識不能であると判断し、第2のデータストリームからのデータを使用して当該エンティティを認識する手法は存在しない。したがって、先行する手法を使用してエンティティがデータストリームの中に含まれていないと間違って判断することに関連するコンピューティングリソースを節約できる。最後に、データストリーム内の認識不能なエンティティを別のデータストリームからの情報を使用して識別するプロセスを自動化することで、他の場合であればエンティティを識別するためにデータストリームおよび/または他のデータストリームをスキャンしてユーザにより浪費されるであろうコンピューティングリソース(例えばプロセッサリソース、メモリリソースおよび/または同様のもの)が節約される。
図1は、本願明細書に記載される例示の実装100の図である。例示の実装100は、1つのデータストリーム内の欠落情報を識別して当該欠落情報を別のデータストリームからの情報を用いて補足するように構成されたデータストリームアナライザに関連してもよく、且つ/またはそれを介して実装されてもよい。本願明細書にさらに記載されるように、データストリームアナライザは、複数のデータストリームを受信し、共通知識グラフに関連して複数のデータストリームの中の情報を識別し、共通知識グラフおよび/または1つのデータストリームの特性に基づき1つのデータストリーム内の欠落情報を識別し、他の1つ以上のデータストリームの中の対応する情報を発見して、欠落情報の内容を、または欠落情報の内容が何であり得るかの確率を少なくとも、判断してもよい。したがって、例示の実装100において、1つのデータストリーム内で欠落している情報を、別のデータストリーム(例えば1つのデータストリームの同じ事象、場所、エンティティ、期間および/または同様のものに関連する別のデータストリーム)からの情報を用いて補足できる。よって、データストリームアナライザは、他のデータストリームからの情報を使用して、1つのデータストリームの中のエンティティを適切に識別し、且つ/またはそれに応じて、1つのデータストリームのデータに基づき当該1つのデータストリームの中のエンティティが認識不能であるにもかかわらず当該エンティティを含むものとして1つのデータストリームを分類することができる。
図1に、参照番号110により示されているように、データストリームアナライザは、複数のデータストリームおよび共通知識グラフを受信して、認識不能なエンティティについてデータストリームを分析する。本願明細書で使用されるとき、エンティティとは、データストリームの中で表現され得る任意のオブジェクト、特徴、人、物、風景、場所および/または同様のものを指すことができる。さらに、本願明細書に記載されるとき、エンティティがデータストリームの中にあるとの記載は、エンティティを表す情報および/またはデータがデータストリームの中にあることを指す。図1の例に示されているように、データストリームアナライザは、1つ以上のビデオおよび/または画像ストリーム(本願明細書においてビデオストリームと呼ばれる)、オーディオストリーム、テキストストリームおよび/またはセンサストリームを受信し得るが、他のタイプのデータストリームおよび/または複数データストリームの組み合わせが受信されてもよい。
データストリームは、別のデバイス(例えばコンピュータ、携帯電話、タブレットコンピュータ、サーバおよび/または同様のものなどのユーザデバイス)から、データ構造(例えばデータベース、テーブル、タスクグラフ、インデックスおよび/または同様のもの)から、さらに/またはデータストリームを生成する1つ以上のデバイスから受信されてもよい。データストリームを生成するかかるデバイスは、カメラ、マイクロフォン、発話テキスト化デバイス、センサデバイス(例えばウェアラブルデバイスのセンサ、ヘルスモニタ、位置感知もしくは検出デバイス、モーションセンサ、モノのインターネット(IoT:internet of things)デバイスおよび/または同様のもの)および/または同様のもののうちの1つ以上を含み得る。一部の実装において、データストリームアナライザは、1つ以上の事象、場所、人、物および/または同様のものを監視するように構成されてもよい。例として、複数のデバイス(例えばカメラ、マイクロフォンおよび/または同様のもの)が、シーンを監視するように構成されてもよい。そのような事例において、複数のデバイスは、複数のデータストリームをデータストリームアナライザに提供して、データストリームアナライザが本願明細書に記載されるようにシーンの中のエンティティ(例えば人、オブジェクト、テキストおよび/または同様のもの)を識別できるようにしてもよい。一部の実装において、データストリームは同じ期間に関連してもよい。例として、同じ事象または同じ所の複数のビデオストリームが同時に捕捉されてもよい。さらに、または代わりに、データストリームは別々の期間に関連してもよい。例として、同じカメラからの複数のビデオストリームが、別々の瞬間(例えば、互いに数時間、数日、数週間、数ヶ月および/または同様に離れた時)に捕捉されてもよい。
共通知識グラフは、データストリームに関連する情報を含む知識グラフであってもよい。共通知識グラフは、データストリームの中で識別可能かもしれないエンティティまたはエンティティの特性についての非特異的情報を含む、一般および/または参照知識グラフであってもよい。例として、共通知識グラフは、特定のエンティティ(例えば人、オブジェクト、動物、場所、組織および/または同様のもの)がデータストリームの中で言及されているかもしれないこと、およびエンティティが物理的特徴(例えば人は顔、手、脚および/または同様のものを有するかもしれない)、名前、音(例えば人は認識可能な声を有するかもしれない)、年齢、アクションを実行する能力および/または同様のものなどの一般的特性を有するかもしれないことを示してもよい。さらに、または代わりに、共通知識グラフは、複数のデータストリームに共通して既知である情報を含んでもよい。例として、共通知識グラフは、データストリームの中で識別され得るエンティティの対応する特性(例えばエッジを介してエンティティにリンクされたノードとして)を伴う、既知の、またはデータストリームの中にある可能性が高い、識別可能なエンティティ(例えばノードとして)の知識グラフを含んでもよい。したがって、共通知識グラフは、複数のデータストリームに共通する情報を含む任意のタイプの知識グラフであってもよい。
このように、データストリームアナライザは、本願明細書に記載されるように、データストリームを受信し、且つ/またはデータストリームに関連する共通知識グラフを取得して、データストリームを分析し、且つ/またはデータストリームの中のエンティティを認識してもよい。
図1に、参照番号120によりさらに示されているように、データストリームアナライザは、(例えば共通知識グラフを使用して)データストリーム内の認識不能なエンティティを識別するためにメタデータを構造化してもよい。一部の実装によれば、データストリームアナライザは、メタデータを構造化して、データストリーム内のエンティティに関連するいずれかの情報が欠落しているかどうか、または認識不能であるかどうかを判断してもよい。例として、データストリームアナライザは、1つ以上のエンティティが認識不能な1つ以上の特性を有することに基づき、データストリームのうちの1つにおける1つ以上のエンティティが認識可能でないと判断してもよい。図1に示されているように、(例えばオブジェクト(または人)認識手法を使用して)3つのエンティティを備えたビデオストリームのフレームが検出されてもよい。3つのエンティティのうちの2つは、(例えば顔認識手法を使用して)ボブおよびジョンとして認識可能であってもよい。一部の実装において、ボブおよびジョンの年齢が、ビデオストリームに関連する追加情報(例えばメタデータ、会話の文脈(例えば、ボブおよびジョンが対応する年齢について議論した))および/または別のストリームに関連する追加情報を使用して取得されてもよい。第3のエンティティは、(例えば、エンティティの背中がカメラに面していて、顔認識手法がエンティティの顔を検出できなかったことが理由で)認識不能なエンティティであってもよい。よって、例示のビデオストリームからの認識可能な特性が、ビデオストリームのメタデータの中に構造化され、ビデオストリーム内に年齢40のボブおよび年齢25のジョンがいると示してもよい。一部の実装において、メタデータは、ビデオストリームに付加されること、ビデオストリームに関連して格納されること、および/またはビデオストリームに関連するデータ構造(例えばテーブル、インデックスおよび/または同様のもの)に格納されることが可能である。
一部の実装において、データストリームアナライザは、機械学習を使用してデータストリームに関連する情報および/またはメタデータを識別するモデルを訓練してもよい。例として、データストリームアナライザは、1つ以上のパラメータ(例えばエンティティもしくは特性の画像、エンティティもしくは特性の識別子(例えば名前、数および/もしくは同様のもの)、エンティティもしくは特性に関連する音および/もしくは同様のもの)ならびに/または1つ以上のオブジェクト認識手法、顔認識手法、発話認識手法、文字認識手法および/もしくは同様のものなどのエンティティおよび/もしくはエンティティの特性を検出する手法に基づき、エンティティおよび/またはエンティティの特性を検出するためにモデルを訓練してもよい。データストリームアナライザは、エンティティおよび/またはエンティティの特性の検出に関連する過去のデータを使用して(例えば、複数のデータストリームまたは他のデータストリームの以前の分析を使用して)モデルを訓練してもよい。エンティティまたは特性を検出するために過去のデータならびに1つ以上のパラメータおよび/または手法を使用して(例えば1つ以上のパラメータまたは手法をエンティティまたは特性を検出するモデルに対する入力として使用して)、データストリームアナライザは、エンティティ(または特定のエンティティ)および/またはエンティティの特性がデータストリームの中で表現されていると検出してもよい。
このように、データストリームアナライザは、データストリームの中の認識可能なエンティティおよび/または認識不能なエンティティ、ならびにデータストリームの中のエンティティの対応する認識可能な特性および/または認識不能な特性を識別するために、メタデータを構造化してもよい。
図1に、参照番号130によりさらに示されているように、データストリームアナライザは、認識可能なエンティティおよび/またはエンティティの認識可能な特性に関連する情報を用いてデータストリームの共通知識グラフにアノテーションを付ける。一部の実装によれば、データストリームアナライザは、共通知識グラフのノードおよび/またはエッジに対応する情報を付加および/または書き込みすることにより、共通知識グラフにアノテーションを付けてもよい。例として、人に対応する共通知識グラフのエンティティノードについて、データストリームアナライザは、データストリーム内で識別された人の特性を用いて人ノードの周りのノードにアノテーションを付けてもよい。例として、人ノードは、共通知識グラフ内の内部ノードであってもよく、人の一般的特性は、人ノードにリンクされたノードであってもよい。よって、データストリームアナライザは、データストリームからの情報を用いて共通知識グラフにアノテーションを付けることにより、対応するデータストリームのアノテーション付き知識グラフを生成してもよい。
共通知識グラフにアノテーションを付けるために、データストリームアナライザは、任意の適切なデータ分析手法(例えばオブジェクト認識手法、顔認識手法、発話認識手法、文字認識手法および/または同様のもの)を使用して、データストリーム内のエンティティの認識可能な特性を識別してもよい。データストリームアナライザは、認識可能な特性を、共通知識グラフの対応するノードに関連付けてもよい。例として、エンティティの名前が識別されれば、データストリームアナライザは、名前を識別する情報またはデータを用いて名前ノードにアノテーションを付けてもよく、エンティティの顔が識別されれば、データストリームアナライザは、エンティティの顔を表す情報またはデータを用いて顔ノードにアノテーションを付けてもよい。一部の実装において、データストリームアナライザは、認識不能な特性が、認識不能な特性に対応する共通知識グラフの特定のノードに対応することを示してもよい。例として、エンティティの背中が画像内で識別されれば(これはエンティティがあるがその特定のエンティティが認識不能であるとの判断を可能にする)、データストリームアナライザは、エンティティの背中を表すデータを用いて背中ノードにアノテーションを付けてもよい。
一部の実装において、データストリームアナライザは、機械学習を使用して、データストリーム内の情報を識別しその情報を用いて共通知識グラフにアノテーションを付けるモデルを訓練してもよい。例として、データストリームアナライザは、1つ以上のパラメータ(例えばエンティティのタイプもしくは特性のタイプの画像、エンティティのタイプもしくは特性のタイプの識別子、エンティティのタイプもしくは特性のタイプに関連する音および/もしくは同様のもの)ならびに/または1つ以上のオブジェクト認識手法、顔認識手法、発話認識手法、文字認識手法および/もしくは同様のものなどのエンティティのタイプおよび/もしくはエンティティのタイプ特性を検出する手法に基づき、エンティティのタイプおよび/またはエンティティの特性のタイプを検出するためにモデルを訓練してもよい。データストリームアナライザは、(例えば複数のデータストリームまたは他のデータストリームの以前の分析を使用して)エンティティのタイプおよび/またはエンティティの特性のタイプを検出すること、ならびにエンティティおよび/またはエンティティの特性に関連する対応する識別された情報を用いて共通知識グラフ(または他の共通知識グラフ)にアノテーションを付けることに関連する過去のデータを使用して、モデルを訓練してもよい。エンティティのタイプまたは特性のタイプを検出するために過去のデータおよび1つ以上のパラメータおよび/または手法を使用して(例えば1つ以上のパラメータまたは手法を共通知識グラフにアノテーションを付けるモデルに対する入力として使用して)、データストリームアナライザは、エンティティのタイプ(または特定のエンティティ)および/またはエンティティの特性のタイプ(または特定の特性)がデータストリームの中で表現されていると検出してもよい。
したがって、データストリームアナライザは、共通知識グラフおよびデータストリーム内で識別された情報を使用して、データストリームのアノテーション付き知識グラフを生成してもよい。共通知識グラフにアノテーションを付ける例が、少なくとも、図2Aの例示の実装200に関連して本願明細書に記載される。
図1に、参照番号140によりさらに示されているように、データストリームアナライザは、アノテーション付き知識グラフを比較して、1つのデータストリーム内で認識不能な特性を有し得るが別のデータストリーム内で認識可能な特性を有し得る候補エンティティを識別する。かかる事例において、データストリームアナライザは、アノテーション付き知識グラフに基づきエンティティが認識可能かどうかを判断してもよい。例として、エンティティの、例えば名前などの特性が1つのデータストリームの中でアノテーションを付けられていない(例えば、データストリームの認識可能な特性から名前が認識不能である)が、別のデータストリームの中でエンティティの対応する特性(名前)がアノテーションを付けられていれば、データストリームアナライザは、認識可能な特性がエンティティに対応すると判断してもよい。その結果、1つのデータストリーム内の当該エンティティに名前を割り当てることにより、認識可能な特性を使用してエンティティが認識されてもよい。
かかる事例において、複数のデータストリーム内で識別されたエンティティのアノテーション付き知識グラフが比較されてもよく、その結果、データストリーム内のエンティティの認識可能な特性および/または認識不能な特性が比較されて、どのエンティティが複数のデータストリームのうちの少なくとも2つ以上に共通するかを判断することができる。したがって、より多くの共通特性を示すエンティティの当該アノテーション付き知識グラフは、より少ない共通特性を有するアノテーション付き知識グラフ内の当該エンティティよりも、エンティティが同じエンティティであるより高い確率を示し得る。
一部の実装によれば、データストリームアナライザは、エンティティが特定のエンティティである確率を、複数のデータストリームのアノテーション付き知識グラフの比較に基づき判断してもよい。例として、データストリームアナライザは、複数のデータストリーム内で識別されたエンティティをスコアリングできるスコアリングシステムを使用してもよい。スコアリングシステムは、データストリームの共通知識グラフおよび/またはアノテーション付き知識グラフのエンティティの特定の特性に、特定の加重を適用してもよい。例として、人の顔の特性は、人の音声プロファイルよりも大きく加重されてもよく(例えば、おそらく、使用される顔認識手法が使用される音声認識手法よりも正確であることが理由で)、または人の名前が、人が特定の場所に関連するという事実よりも大きく加重されてもよく(例えば、そのことは必ずしもその人がデータストリームの捕捉時にその場所にいたことを示すとは限らないことが理由で)、且つ/または同様のことがされてもよい。一部の実装によれば、加重および/またはスコアリングシステムは、ユーザ入力を使用して調節可能であってもよく、且つ/または再設定されてもよい。
一部の実装において、データストリームアナライザは、機械学習を使用して、認識不能なエンティティが別のデータストリームの特定のエンティティである確率を判断する(または確率の判断に関連するスコアリングシステムを調節する)モデルを訓練してもよい。例として、データストリームアナライザは、エンティティがデータストリームの認識不能なエンティティである確率を、エンティティを含む別のデータストリームおよびデータストリームの、1つ以上のパラメータに基づき判断するためにモデルを訓練してもよい。1つ以上のパラメータは、別のデータストリーム内のエンティティの画像、別のデータストリーム内のエンティティの名前、データストリームおよび別のデータストリーム内のエンティティの存在に関連するタイミング、エンティティとデータストリームの事象および別のデータストリームの事象との関連付け、データストリームまたは別のデータストリームで言及されるエンティティの識別子、別のデータストリーム内で検出されるエンティティの音声、データストリームまたは別のデータストリームに関連する場所および/または同様のものを含んでもよい。データストリームアナライザは、認識不能なエンティティが認識可能なエンティティである確率の特定に関連する過去のデータを使用して(例えば、複数のデータストリームまたは他のデータストリームの以前の分析を使用して)モデルを訓練してもよい。過去のデータおよび1つ以上のパラメータを使用して(例えば特定のエンティティが認識不能なエンティティである確率を特定するモデルへの入力として1つ以上のパラメータを使用して)、データストリームアナライザは、データストリームのエンティティが別のデータストリームの中で認識された特定のエンティティである確率を判断してもよい。
このように、データストリームアナライザは、1つ以上のデータストリーム内の認識されたエンティティが別のデータストリーム内の認識不能なエンティティであるかどうかを判断してもよい。アノテーション付き知識グラフを比較して、1つのアノテーション付き知識グラフ内の認識されたエンティティが別のアノテーション付き知識グラフ内の認識不能なエンティティであるかどうかを判断する例は、図2Bの例示の実装200に少なくとも関連して本願明細書に記載されている。
図1に、参照番号150によりさらに示されているように、データストリームアナライザは、データストリーム内の認識不能なエンティティのメタデータを決定する。例として、データストリームアナライザは、別のデータストリームに関連するアノテーション付き知識グラフ内の認識可能なエンティティからの特性(例えば名前、声、顔および/または同様のもの)を含むメタデータを決定してもよい。さらに、または代わりに、メタデータは、別のデータストリーム内の認識可能なエンティティがデータストリームの認識不能なエンティティである確率を含んでもよい。確率は、上述のように、アノテーション付き知識グラフ内のエンティティの特性の比較に基づきエンティティが認識可能であるかどうかに対応してもよい。
一部の実装において、データストリームアナライザは、データストリームアナライザの設定および/または構成に基づいてメタデータを決定してもよい。データストリームアナライザの設定および/または構成は、ユーザ入力および/またはデフォルト設定に従って設定されてもよい。一部の実装において、データストリームアナライザは、機械学習を使用して、データストリームの認識不能なエンティティおよび/または別のストリームの認識可能なエンティティに関連するメタデータを決定するモデルを訓練してもよい。例として、データストリームアナライザは、1つ以上のパラメータ(例えば特性のタイプ、類似した特性の数、特性が認識可能な特性であるかもしくは認識不能な特性であるか、および/または同様のもの)に基づき別のデータストリームのエンティティの特性を判断するためにモデルを訓練してもよい。データストリームアナライザは、データストリームの認識不能なエンティティのメタデータの決定に関連する過去のデータを使用して(例えば、複数のデータストリームまたは他のデータストリームの以前の分析を使用して)モデルを訓練してもよい。メタデータを決定しながら過去のデータおよび1つ以上のパラメータを使用して(例えばメタデータを決定するモデルへの入力として1つ以上のパラメータを使用して)、データストリームアナライザは、メタデータを決定し、且つ/またはデータストリームに関連してどのようにメタデータが提供されるかを選択してもよい。
このように、データストリームアナライザは、データストリームの中で、および/またはそれに関連して、どのメタデータが提供、付加および/または補足されるかを決定してもよい。よって、メタデータは、データストリームの中の認識不能なエンティティに関連する欠落情報を示し、且つ/またはデータストリームの中のエンティティを認識してもよい。例として、メタデータは、エンティティを識別するために情報(例えば識別情報)を画像に重ねさせてもよく、認識不能な特性をエンティティの認識可能な特性により置き換えてもよく、さらに/または同様のことをしてもよい。
図1に、参照番号160によりさらに示されているように、データストリームアナライザは、認識不能なエンティティに関連するメタデータを示す出力を提供する。図1に示されているように、データストリームアナライザは、データストリームからの認識不能なエンティティが年齢50のポールである確率(例えば91%)を提供してもよい。さらに、または代わりに、データストリームアナライザは、メタデータの中で、エンティティが(例えば複数のデータストリームに関連する任意のエンティティとして)認識可能である確率を示してもよい。メタデータは、データストリームに付加されてもよく、データストリームに関連して格納されてもよく、且つ/またはデータストリームに関連するデータ構造に格納されてもよい。一部の実装によれば、メタデータは(例えばユーザインターフェースを介して)ユーザに提供されてもよく、データストリームに付加されてもよく、(例えば図1のビデオストリームの中にエンティティの名前を含めることにより)データストリームの中に埋め込まれてもよく、且つ/または同様のことをされてもよい。
一部の実装において、データストリームアナライザは、複数のプロファイルを提供して、他のエンティティが認識不能なエンティティであり得る確率を示してもよい(例えばデータストリームアナライザにより受信された複数のデータストリームの中の、関連するかまたは含まれる他のエンティティ)。例として、2つ以上のエンティティがデータストリームの認識不能なエンティティに対応し得る確率が閾値を満たせば、メタデータは、両方のエンティティ(およびそのエンティティの対応する確率)に対応する情報を含んでもよい。したがって、ユーザは、複数のプロファイルそれぞれの情報からエンティティを識別してもよく、且つ/または複数のプロファイルにおいて提供される情報に基づきさらなる分析を実行してもよい。
一部の実装において、例として、或るエンティティがデータストリーム内の認識不能なエンティティに対応する確率が閾値(例えば98%の可能性、90%の可能性、80%の可能性および/または同様のもの)を満たす場合、データストリームアナライザは、別のデータストリームからの認識可能な特性を用いて、認識不能なエンティティの認識不能な特性のデータおよび/または特性を補足してもよい。さらに、または代わりに、データストリームアナライザは、データストリームを再構築して、エンティティの認識不能な特性をエンティティの認識可能な特性により置き換えてもよい。具体的な例として、データストリームがテキストストリームであれば、データストリームアナライザは、テキストストリーム内のエンティティを指す代名詞を、別のデータストリームから判断されたエンティティの名前により置き換えてもよい。一部の実装において、再構築されたデータストリームを、当初のデータストリームの代わりに、且つ/または当初のデータストリームに関連して格納できる。
したがって、データストリームアナライザは、データストリーム内の認識不能なエンティティが別のデータストリーム内の認識されたエンティティである、またはエンティティであり得ると判断することに関連したアクションを実行してもよい。データストリームアナライザは、別のデータストリーム内で認識された単数または複数のエンティティに関連するメタデータを提供してもよい。
したがって、図1の例示の実装100に関連して本願明細書に記載されたように、データストリームアナライザは、複数のデータストリームを使用して、1つ以上のエンティティおよび/または1つ以上のエンティティの対応する1つ以上の特性を認識してもよい。よって、複数のデータストリームのうちの1つが、情報が欠落している且つ/または認識不能なエンティティを含む場合、複数のデータストリームのうちの残りのデータストリームの少なくとも1つが、欠落情報および/または認識不能なエンティティに関連する情報を補足および/または提供するために使用されてもよい。その結果、エンティティおよび/またはデータストリームを、特定のエンティティに関連する情報を含むものとして、または或る確率でデータストリームの中で特定のエンティティが表現されているものとして、正確に分類および/または類別できる。
上記で指摘されたように、図1は単に例として示されている。他の例が可能であり、図1に関して記載されたものとは異なってもよい。
図2Aおよび図2Bは、本願明細書に記載される例示の実装200の図である。例示の実装200に示されているように、1つのデータストリームについて共通知識グラフにアノテーションを付けて、1つのデータストリームのアノテーション付き知識グラフを生成することができる。アノテーション付き知識グラフが別のデータストリームの別のアノテーション付き知識グラフと比較されて、1つのデータストリーム内のエンティティの認識不能な特性に対応する別のデータストリーム内のエンティティおよび/またはエンティティの認識可能な特性を認識することができる。
図2Aに、参照番号210により示されているように、人の共通知識グラフが特定される。例として、1つのデータストリームを分析するために使用されるデータ分析手法(例えばオブジェクト認識手法、人物認識手法および/または同様のもの)が、1つのデータストリームに関して人が存在すると判断してもよい。したがって、データストリームアナライザは、人についての共通知識グラフを取得してもよい。例示の実装に示されているように、共通知識グラフは、内部ノードとしての「人」、および内部ノードに接続されたノード内の人の特性を含んでもよい。図2Aでは、そのような例示の特性は、人が「顔」を有すること、「音」(例えば声)に関連すること、「背中」を有することおよび「アクション」(例えば「話す」)を実行できることを含んでもよい。
図2Aに、参照番号220によりさらに示されているように、人が1つのデータストリーム内で検出されると(ただしその人は認識不能であってもよい)、データストリームアナライザは、1つのデータストリームからの認識可能な情報を用いて共通知識グラフにアノテーションを付けてもよい。例として、点線により示されているように、1つのデータストリーム内の人は、既知の年齢、背中(その人の背中に関連するデータを用いてアノテーションを付け、且つ/またはその人の背中がデータストリーム内に存在することを示すようにアノテーションを付けることができる)を有してもよく、その人が特定の声を有すること、ならびにその人がボブおよびジョンと話していること。図のように、人のアイデンティティなどの認識不能な特性が知識グラフ内に示される。
図2Bに、参照番号230により示されているように、1つのデータストリームのアノテーション付き知識グラフが、別のデータストリームのアノテーション付き知識グラフと比較される。例として、そのような比較は、アノテーション付き知識グラフ双方が、その人が同じ年齢であること、その人がボブおよびジョンに話しかけていること、ならびにその人が同じ声を有することを示すことを表す。したがって、(例えば顔が検出可能でないこと、または名前が検出可能でないことが理由で)1つのデータストリームからその人が認識不能であるにもかかわらず、データストリームアナライザは、別のデータストリームのアノテーション付き知識グラフからの情報を使用して、1つのデータストリーム内の人のアイデンティティ(例えばポール)を判断し得る。よって、参照番号240により示されているように、1つのデータストリーム内の人のアイデンティティが、ポールであると判断できる。さらに、または代わりに、本願明細書に記載されているように、1つのデータストリーム内の人のアイデンティティがポールである確率を(例えば、アノテーション付き知識グラフのどの特性が互いに一致するか、どの特性が互いに一致しないか、および/またはアノテーション付き知識グラフ内のどの特性が認識不能かに基づき)計算できる。
したがって、本願明細書に記載されているように、データストリームアナライザは、共通知識グラフを使用してもよく、1つ以上のアノテーション付き知識グラフ(共通知識グラフおよび対応するデータストリームからの情報から生成される)が、別のデータストリームからの情報を使用してデータストリームの中の認識不能なエンティティを識別するために使用されてもよい。
上記で指摘されたように、図2Aおよび図2Bは単に例として示されている。他の例が可能であり、図2Aおよび図2Bに関して記載されたものとは異なってもよい。
図3は、本願明細書に記載されるシステムおよび/または方法が実装され得る例示の環境300の図である。図3に示されているように、環境300は、ストリーミングデバイス305(個々に「ストリーミングデバイス305」または集合的に「ストリーミングデバイス群305」と呼ばれ得る)、データストリームアナライザ310、コンピューティングリソース315、クラウドコンピューティング環境320、ネットワーク330およびユーザデバイス340を含んでもよい。環境300のデバイスは、有線接続、無線接続または有線接続と無線接続との組み合わせを介して相互に接続してもよい。
ストリーミングデバイス305は、データストリームに関連する情報を取得、生成、格納、処理および/または提供できる1つ以上のデバイスを含む。例として、ストリーミングデバイス305は、ユーザデバイス(例えば携帯電話(例えばスマートフォン、無線電話など)などの通信および/またはコンピューティングデバイス、ラップトップコンピュータ、タブレットコンピュータ、ハンドヘルドコンピュータ、ゲーム用デバイス、ウェアラブル通信デバイス(例えばスマート腕時計、スマート眼鏡など)および/または同様のもの)、カメラ、マイクロフォン、文字起こしデバイス(例えば発話テキスト化機能を備えたデバイス)、センサデバイス、IoTデバイスおよび/または同様のものを含んでもよい。ストリーミングデバイス305は、特定の事象に関連する、特定の場所での、特定の人もしくはエンティティに関連する、特定の期間に関連する、および/または同様の1つ以上のエンティティを識別するために使用されてもよい。
データストリームアナライザ310は、エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識することに関連する情報を受信、生成、格納、処理および/または提供できる1つ以上のコンピューティングリソースまたはデバイスを含む。例として、データストリームアナライザ310は、図1、図2Aおよび/または図2Bに関連して記載されたデータストリームアナライザに対応してもよい。一部の実装において、データストリームアナライザ310は、1つのデータストリーム内でエンティティが認識不能であると判断し、別のデータストリームからの情報を使用してエンティティを認識し、且つ/または1つのデータストリーム内の欠落情報を別のデータストリーム内で識別された対応する情報を用いて補足することができる、クラウドコンピューティング環境320により実装されたプラットフォームであってもよい。一部の実装において、データストリームアナライザ310は、クラウドコンピューティング環境320のコンピューティングリソース315により実装される。
データストリームアナライザ310は、サーバデバイスまたはサーバデバイスのグループを含んでもよい。一部の実装において、データストリームアナライザ310は、クラウドコンピューティング環境320においてホストされてもよい。特に、本願明細書に記載される実装は、データストリームアナライザ310がクラウドコンピューティング環境320においてホストされるものとして記載するが、一部の実装では、データストリームアナライザ310はクラウドベースでなくてもよく、または部分的にクラウドベースであってもよい。
クラウドコンピューティング環境320は、サービスとしてコンピュータ処理を提供する環境を含み、それによって共有リソース、サービスなどがユーザデバイスに提供されてもよい。クラウドコンピューティング環境320は、サービスを提供するシステムおよび/またはデバイスの物理的な場所および構成についてエンドユーザの知識を要求しない演算、ソフトウェア、データアクセス、ストレージおよび/または他のサービスを提供してもよい。図のように、クラウドコンピューティング環境320は、データストリームアナライザ310およびコンピューティングリソース315を含んでもよい。
コンピューティングリソース315は、1つ以上のパーソナルコンピュータ、ワークステーションコンピュータ、サーバデバイス、または別のタイプの演算および/もしくは通信デバイスを含む。一部の実装において、コンピューティングリソース315はデータストリームアナライザ310をホストしてもよい。クラウドリソースは、コンピューティングリソース315において実行される演算インスタンス、コンピューティングリソース315内に設けられるストレージデバイス、コンピューティングリソース315により提供されるデータ転送デバイスなどを含んでもよい。一部の実装において、コンピューティングリソース315は、有線接続、無線接続または有線接続と無線接続との組み合わせを介して他のコンピューティングリソース315と通信してもよい。
図3にさらに示されるように、コンピューティングリソース315は、1つ以上のアプリケーション(「APP(application)」)315−1、1つ以上の仮想マシン(「VM(virtual machine)」)315−2、仮想化ストレージ(「VS(virtualized storage)」)315−3、1つ以上のハイパーバイザ(「HYP(hypervisor)」)315−4または同様のものなどのクラウドリソースのグループを含んでもよい。
アプリケーション315−1は、ストリーミングデバイス305に提供されても、またはストリーミングデバイス305によりアクセスされてもよい1つ以上のソフトウェアアプリケーションを含む。アプリケーション315−1は、ストリーミングデバイス305上でソフトウェアアプリケーションをインストールして実行する必要性をなくしてもよい。例として、アプリケーション315−1は、データストリームアナライザ310に関連したソフトウェア、および/またはクラウドコンピューティング環境320を介して提供できる他の任意のソフトウェアを含んでもよい。一部の実装において、1つのアプリケーション315−1は、仮想マシン315−2を介して他の1つ以上のアプリケーション315−1との間で情報を送受信してもよい。
仮想マシン315−2は、物理マシンのようにプログラムを実行するマシン(例えばコンピュータ)のソフトウェア実装を含む。仮想マシン315−2は、用途、および仮想マシン315−2の任意の実マシンとの類似の程度に応じて、システム仮想マシンまたはプロセス仮想マシンのいずれかとされ得る。システム仮想マシンは、完全なオペレーティングシステム(「OS(operating system)」)の実行をサポートする完全なシステムプラットフォームを提供してもよい。プロセス仮想マシンは、単一のプログラムを実行してもよく、単一のプロセスをサポートしてもよい。一部の実装において、仮想マシン315−2は、ユーザ(例えばストリーミングデバイス305)の代わりに実行してもよく、さらにデータ管理、同期化または長期データ転送など、クラウドコンピューティング環境320のインフラストラクチャの管理をしてもよい。
仮想化ストレージ315−3は、コンピューティングリソース315のストレージシステムまたはデバイスの中で仮想化手法を使用する1つ以上のストレージシステムおよび/または1つ以上のデバイスを含む。一部の実装において、ストレージシステムの文脈の中で、仮想化のタイプはブロック仮想化およびファイル仮想化を含んでもよい。ブロック仮想化は、物理ストレージからの論理ストレージの抽象化(または分離)を指してもよく、その結果、物理ストレージまたはヘテロジニアス構造と無関係にストレージシステムがアクセスされ得る。この分離は、ストレージシステムの管理者がエンドユーザに対しどのようにストレージを管理するかの点で、柔軟性を管理者に認めてもよい。ファイル仮想化は、ファイルレベルでアクセスされるデータと、ファイルが物理的に格納される場所との間の依存関係をなくしてもよい。これは、ストレージ使用の最適化、サーバコンソリデーションおよび/または無停止ファイルマイグレーションの実行を可能にしてもよい。
ハイパーバイザ315−4は、複数のオペレーティングシステム(例えば「ゲストオペレーティングシステム」)がコンピューティングリソース315などのホストコンピュータ上で同時に実行できるようにするハードウェア仮想化手法を提供する。ハイパーバイザ315−4は、ゲストオペレーティングシステムに仮想オペレーティングプラットフォームを提示してもよく、ゲストオペレーティングシステムの実行を管理してもよい。様々なオペレーティングシステムの複数のインスタンスが、仮想化ハードウェアリソースを共有してもよい。
ネットワーク330は、1つ以上の有線ネットワークおよび/または無線ネットワークを含む。例として、ネットワーク330は、セルラネットワーク(例えばロングタームエボリューション(LTE:long−term evolution)ネットワーク、符号分割多元接続(CDMA:code division multiple access)ネットワーク、3Gネットワーク、4Gネットワーク、5Gネットワーク、別のタイプの次世代ネットワークなど)、公衆陸上モバイルネットワーク(PLMN:public land mobile network)、ローカルエリアネットワーク(LAN:local area network)、ワイドエリアネットワーク(WAN:wide area network)、メトロポリタンエリアネットワーク(MAN:metropolitan area network)、電話網(例えば公衆交換電話網(PSTN:Public Switched Telephone Network))、プライベートネットワーク、アドホックネットワーク、イントラネット、インターネット、光ファイバベースのネットワーク、クラウドコンピューティングネットワークもしくは同様のものおよび/またはこれらもしくはその他タイプのネットワークの組み合わせを含んでもよい。
ユーザデバイス340は、(例えばデータストリームの中のエンティティを検出するために)1つ以上のデータストリームを分析することに関連する情報を、受信、生成、格納、処理および/または提供できる1つ以上のデバイスを含む。例としてユーザデバイス340は、携帯電話(例えばスマートフォン、無線電話など)、ラップトップコンピュータ、タブレットコンピュータ、ハンドヘルドコンピュータ、ゲーム用デバイス、ウェアラブル通信デバイス(例えばスマート腕時計、スマート眼鏡など)または類似のタイプのデバイスなどの通信および/またはコンピューティングデバイスを含んでもよい。
図3に示されたデバイスおよびネットワークの数および配置は、例として示されている。実際には、図3に示されたものと比べて、追加のデバイスおよび/もしくはネットワーク、より少数のデバイスおよび/もしくはネットワーク、異なるデバイスおよび/もしくはネットワークまたは別様に配置されたデバイスおよび/もしくはネットワークがあってもよい。さらに、図3に示されている2つ以上のデバイスが単一のデバイスの中に実装されてもよく、または、図3に示されている単一のデバイスが複数の分散型デバイスとして実装されてもよい。さらに、または代わりに、環境300のデバイスのセット(例えば1つ以上のデバイス)が、環境300のデバイスの別のセットにより実行されるものとして記載されている1つ以上の機能を実行してもよい。
図4は、デバイス400の例示のコンポーネントの図である。デバイス400は、ストリーミングデバイス305、データストリームアナライザ310、コンピューティングリソース315および/またはユーザデバイス340に対応し得る。一部の実装において、ストリーミングデバイス305、データストリームアナライザ310、コンピューティングリソース315および/またはユーザデバイス340は、1つ以上のデバイス400および/またはデバイス400の1つ以上のコンポーネントを含んでもよい。図4に示されているように、デバイス400は、バス410、プロセッサ420、メモリ430、ストレージコンポーネント440、入力コンポーネント450、出力コンポーネント460および通信インターフェース470を含んでもよい。
バス410は、デバイス400のコンポーネント間の通信を可能にするコンポーネントを含む。プロセッサ420は、ハードウェア、ファームウェアまたはハードウェアとソフトウェアとの組み合わせにおいて実装される。プロセッサ420は、中央処理ユニット(CPU:central processing unit)、グラフィックス処理ユニット(GPU:graphics processing unit)、アクセラレーテッド処理ユニット(APU:accelerated processing unit)、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP:digital signal processor)、フィールドプログラマブルゲートアレイ(FPGA:field−programmable gate array)、特定用途向け集積回路(ASIC:application−specific integrated circuit)または別のタイプの処理コンポーネントである。一部の実装において、プロセッサ420は、機能を実行するようにプログラムされることが可能な1つ以上のプロセッサを含む。メモリ430は、プロセッサ420により使用される情報および/または命令を格納するランダムアクセスメモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read only memory)および/または別のタイプの動的もしくは静的ストレージデバイス(例えばフラッシュメモリ、磁気メモリおよび/または光学メモリ)を含む。
ストレージコンポーネント440は、デバイス400の動作および使用に関係する情報および/またはソフトウェアを格納する。例としてストレージコンポーネント440は、ハードディスク(例えば磁気ディスク、光学ディスク、光磁気ディスクおよび/またはソリッドステートディスク)、コンパクトディスク(CD:compact disc)、デジタル多用途ディスク(DVD:digital versatile disc)、フロッピーディスク、カートリッジ、磁気テープおよび/または別のタイプの非一時的コンピュータ可読媒体を、対応するドライブとともに含んでもよい。
入力コンポーネント450は、デバイス400が、ユーザ入力(例えばタッチスクリーンディスプレイ、キーボード、キーパッド、マウス、ボタン、スイッチおよび/またはマイクロフォン)などを介して情報を受信することを可能にするコンポーネントを含む。さらに、または代わりに、入力コンポーネント450は、情報を感知するセンサ(例えばグローバルポジショニングシステム(GPS:global positioning system)コンポーネント、加速度計、ジャイロスコープおよび/またはアクチュエータ)を含んでもよい。出力コンポーネント460は、デバイス400からの出力情報を提供するコンポーネントを含む(例えばディスプレイ、スピーカおよび/または1つ以上の発光ダイオード(LED:light−emitting diode))。
通信インターフェース470は、デバイス400が有線接続、無線接続または有線接続と無線接続との組み合わせなどを介して他のデバイスと通信することを可能にする、トランシーバのようなコンポーネント(例えばトランシーバならびに/または別々の受信機および送信機)を含む。通信インターフェース470は、デバイス400が、別のデバイスから情報を受信し、且つ/または別のデバイスに情報を提供することを可能にしてもよい。例として通信インターフェース470は、イーサネットインターフェース、光インターフェース、同軸インターフェース、赤外線インターフェース、無線周波数(RF:radio frequency)インターフェース、ユニバーサルシリアルバス(USB:universal serial bus)インターフェース、Wi−Fiインターフェース、セルラネットワークインターフェースまたは同様のものを含んでもよい。
デバイス400は、本願明細書に記載された1つ以上のプロセスを実行してもよい。デバイス400は、メモリ430および/またはストレージコンポーネント440などの非一時的コンピュータ可読媒体により格納されたソフトウェア命令をプロセッサ420が実行するのに基づいてこれらのプロセスを実行してもよい。本願明細書において、コンピュータ可読媒体は非一時的メモリデバイスと定義される。メモリデバイスは、単一の物理ストレージデバイス内のメモリ空間、または複数の物理ストレージデバイスにまたがったメモリ空間を含む。
ソフトウェア命令は、メモリ430および/またはストレージコンポーネント440に別のコンピュータ可読媒体から、または通信インターフェース470を介して別のデバイスから読み込まれてもよい。メモリ430および/またはストレージコンポーネント440に格納されたソフトウェア命令は、実行されると本願明細書に記載された1つ以上のプロセスをプロセッサ420に実行させてもよい。さらに、または代わりに、本願明細書に記載の1つ以上のプロセスを実行するために、配線による回路構成がソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて使用されてもよい。したがって、本願明細書に記載された実装は、ハードウェア回路構成とソフトウェアとのいかなる特定の組み合わせにも限定されない。
図4に示されたコンポーネントの数および配置は、例として示されている。実際には、デバイス400は、図4に示されたものと比べて、追加のコンポーネント、より少少数のコンポーネント、異なるコンポーネントまたは別様に配置されたコンポーネントを含んでもよい。さらに、または代わりに、デバイス400のコンポーネントのセット(例えば1つ以上のコンポーネント)が、デバイス400のコンポーネントの別のセットにより実行されるものとして記載されている1つ以上の機能を実行してもよい。
図5は、エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセス500のフローチャートである。一部の実装において、図5の1つ以上のプロセスブロックは、データストリームアナライザ(例えばデータストリームアナライザ310)により実行されてもよい。一部の実装において、図5の1つ以上のプロセスブロックは、ストリーミングデバイス(例えばストリーミングデバイス305)および/またはユーザデバイス(例えばユーザデバイス340)など、データストリームアナライザ(例えばデータストリームアナライザ310)とは別個であるかまたはそれを含む、別のデバイスまたはデバイスのグループにより実行されてもよい。
図5に示されているように、プロセス500は、第1のデータストリームおよび第2のデータストリームを受信することを含んでもよい(ブロック510)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第1のデータストリームおよび第2のデータストリームを受信してもよい。
図5にさらに示されているように、プロセス500は、第1のデータストリームの画像データ内に複数のエンティティが存在すると判断することを含んでもよい(ブロック520)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450および/または同様のものを使用する)は、第1のストリームの画像データ内に複数のエンティティが存在すると判断してもよい。
図5にさらに示されているように、プロセス500は、第1のデータストリームの画像データ内で複数のエンティティのうちの或るエンティティが認識不能であると判断するために第1のデータストリームを分析することを含んでもよい(ブロック530)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のデータストリームの画像データ内で複数のエンティティのうちの或るエンティティが認識不能であると判断するために第1のデータストリームを分析してもよい。
図5にさらに示されているように、プロセス500は、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフを取得することを含んでもよく、共通知識グラフは、複数のエンティティについての情報を含む(ブロック540)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第2のデータストリーム内の第1のデータストリームに関連する共通知識グラフを取得してもよい。一部の実装において、共通知識グラフは、複数のエンティティについての情報を含む。
図5にさらに示されているように、プロセス500は、第1のアノテーション付き知識グラフを生成するために、第1のデータストリーム内の複数のエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック550)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のアノテーション付き知識グラフを生成するために、第1のデータストリーム内の複数のエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けてもよい。
図5にさらに示されているように、プロセス500は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内の複数のエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック560)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内の複数のエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けてもよい。
図5にさらに示されているように、プロセス500は、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づきエンティティが認識可能であるかどうかを判断することを含んでもよい(ブロック570)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2のアノテーション付き知識グラフ内の第1のアノテーション付き知識グラフに基づきエンティティが認識可能であるかどうかを判断してもよい。
図5にさらに示されているように、プロセス500は、エンティティが認識可能であるかどうかに基づき、第1のデータストリームに関連するアクションを実行することを含んでもよい(ブロック580)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、出力コンポーネント460、通信インターフェース470および/または同様のものを使用する)は、エンティティが認識可能であるかどうかに基づき第1のデータストリームに関連するアクションを実行してもよい。
プロセス500は、後述される、および/または本願明細書の他の箇所に記載された他の1つ以上のプロセスに関連して記載される、任意の単一の実装または任意の実装の組み合わせなど、追加の実装を含んでもよい。
一部の実装において、複数のエンティティについての情報は、複数の事象のうちの1つ以上の、対応するアイデンティティを示す。一部の実装において、データストリームアナライザは、画像データの略奪およびエンティティの認識不能な特性に基づき、エンティティが認識不能であると判断してもよい。
一部の実装において、データストリームアナライザは、第2のアノテーション付き知識グラフ内の第1のアノテーション付き知識グラフを比較することに基づきエンティティが認識可能である確率を判断してもよい。一部の実装において、アクションを実行するとき、データストリームアナライザは、エンティティが認識可能である確率を、第1のデータストリームに関連するメタデータの中で示してもよい。
一部の実装において、データストリームアナライザは、アクションを実行するとき、第2のアノテーション付き知識グラフ内の第1のアノテーション付き知識グラフをペアリングすることに基づき、エンティティが認識可能である確率を判断してもよく、確率が閾値を満たすと判断した、さらに確率が閾値を満たすことに基づき、エンティティの認識不能な特性に対応する、第2のデータストリームからの認識可能な特性を含むように第1のデータストリームを補足してもよい。一部の実装において、第2のデータストリーム内の第1のデータストリームは、同じ事象、同じ場所、同じ人または同じ期間のうちの少なくとも1つに関連する。
一部の実装において、画像データは、第1の画像データを含んでもよく、第2のデータストリームは、第2の画像データを含んでもよい。一部の実装において、第2の画像データは、複数のエンティティの第2の対応する認識可能な特性を含む。一部の実装において、第2のデータストリームは、画像データ、オーディオデータ、テキストデータまたはセンサデータのうちの少なくとも1つを含む。
図5はプロセス500の例示のブロックを示すが、一部の実装ではプロセス500は、図5に示されたものと比べて追加のブロック、より少数のブロック、異なるブロックまたは別様に配置されたブロックを含んでもよい。さらに、または代わりに、プロセス500のブロックの2つ以上が並列実行されてもよい。
図6は、エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセス600のフローチャートである。一部の実装において、図6の1つ以上のプロセスブロックは、データストリームアナライザ(例えばデータストリームアナライザ310)により実行されてもよい。一部の実装において、図6の1つ以上のプロセスブロックは、ストリーミングデバイス(例えばストリーミングデバイス305)および/またはユーザデバイス(例えばユーザデバイス340)など、データストリームアナライザ(例えばデータストリームアナライザ310)とは別個であるかまたはそれを含む、別のデバイスまたはデバイスのグループにより実行されてもよい。
図6に示されているように、プロセス600は、第1のデータストリームおよび第2のデータストリームを受信することを含んでもよい(ブロック610)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第1のデータストリームおよび第2のデータストリームを受信してもよい。
図6にさらに示されているように、プロセス600は、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフを取得することを含んでもよく、共通知識グラフは、第1のデータストリームおよび第2のデータストリームに関連する情報を含む(ブロック620)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第2のデータストリーム内の第1のデータストリームに関連する共通知識グラフを取得してもよい。一部の実装において、共通知識グラフは、第2のデータストリーム内の第1のデータストリームに関連する情報を含む。
図6にさらに示されているように、プロセス600は、第1のデータストリーム内の認識不能な特性をエンティティが有することに基づき、エンティティが第1のデータストリーム内の認識不能なエンティティであると検出することを含んでもよい(ブロック630)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450および/または同様のものを使用するコンピューティングリソース315)は、第1のデータストリーム内の認識不能な特性をエンティティが有することに基づき、エンティティが第1のデータストリーム内の認識不能なエンティティであると検出してもよい。
図6にさらに示されているように、プロセス600は、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック640)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けてもよい。
図6にさらに示されているように、プロセス600は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック650)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けてもよい。
図6にさらに示されているように、プロセス600は、第2のアノテーション付き知識グラフ内の第2の対応する認識可能な特性のうちの1つが第1のアノテーション付き知識グラフ内の認識不能な特性に対応するかどうかを、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づき判断することを含んでもよい(ブロック660)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2のアノテーション付き知識グラフ内の第2の対応する認識可能な特性のうちの1つが第1のアノテーション付き知識グラフ内の認識不能な特性に対応するかどうかを、第2のアノテーション付き知識グラフ内の第1のアノテーション付き知識グラフに基づき判断してもよい。
図6にさらに示されているように、プロセス600は、第2の対応する認識可能な特性のうちの1つが認識不能な特性に対応するかどうかに基づき、エンティティが識別可能なエンティティである確率を判断することを含んでもよい(ブロック670)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2の対応する認識可能な特性のうちの1つが認識不能な特性に対応するかどうかに基づき、エンティティが識別可能なエンティティである確率を判断してもよい。
図6にさらに示されているように、プロセス600は、確率に基づきアクションを実行することを含んでもよい(ブロック680)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、出力コンポーネント460、通信インターフェース470および/または同様のものを使用する)は、確率に基づきアクションを実行してもよい。
プロセス600は、後述される、および/または本願明細書の他の箇所に記載された他の1つ以上のプロセスに関連して記載される、任意の単一の実装または任意の実装の組み合わせなど、追加の実装を含んでもよい。
一部の実装において、共通知識グラフは、場所の事象、人または時間のうちの少なくとも1つに関連する。それは、第1のデータストリームを提供する1つ以上のデータストリームデバイスにより監視される。一部の実装において、共通知識グラフは、エンティティが第1のデータストリームおよび第2のデータストリームに含まれていることを示す。
一部の実装において、データストリームアナライザは、第1のアノテーション付き知識グラフを生成するために共通知識グラフにアノテーションを付けるとき、第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を識別するために、第1のオブジェクト認識手法を使用して第1のデータストリームを分析し、第1のアノテーション付き知識グラフを生成するために、第1の対応する認識可能な特性と、共通知識グラフの対応するノードとを関連付け、認識不能な特性が、認識不能な特性に対応する共通知識グラフの特定のノードに関連することを示してもよい。一部の実装において、第1のオブジェクト認識手法は、第1のデータストリームの第1のタイプに関連する。一部の実装において、データストリームアナライザは、第2のアノテーション付き知識グラフを生成するために共通知識グラフにアノテーションを付けるとき、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を識別するために第2のオブジェクト認識手法を使用して第2のデータストリームを分析し、第2のアノテーション付き知識グラフを生成するために、第2の対応する認識可能な特性と、共通知識グラフの対応するノードとを関連付けてもよい。一部の実装において、第2のオブジェクト認識手法は、第2のデータストリームの第2のタイプに関連する。
一部の実装において、第1のデータストリームは、当初受信された第1のデータストリームであり、データストリームアナライザは、アクションを実行するとき、再構築された第1のデータストリームをもたらすために、認識不能な特性に関連するデータを認識可能な特性に関連するデータにより置き換えることにより、当初受信された第1のデータストリームを再構築し、再構築された第1のデータストリームを、当初受信された第1のデータストリームに関連して格納してもよい。一部の実装において、データストリームアナライザは、アクションを実行するとき、第2の対応する認識可能な特性のうちの1つが認識不能な特性に対応することに基づき、第2の対応する認識可能な特性のうちの1つに関連するメタデータを用いて第1のデータストリームを補足してもよい。
図6はプロセス600の例示のブロックを示すが、一部の実装ではプロセス600は、図6に示されたものと比べて追加のブロック、より少数のブロック、異なるブロックまたは別様に配置されたブロックを含んでもよい。さらに、または代わりに、プロセス600のブロックの2つ以上が並列実行されてもよい。
図7は、エンティティに関連する欠落情報を補足するために複数のデータストリームを使用してエンティティを認識する例示のプロセス700のフローチャートである。一部の実装において、図7の1つ以上のプロセスブロックは、データストリームアナライザ(例えばデータストリームアナライザ310)により実行されてもよい。一部の実装において、図7の1つ以上のプロセスブロックは、ストリーミングデバイス(例えばストリーミングデバイス305)および/またはユーザデバイス(例えばユーザデバイス340)など、データストリームアナライザ(例えばデータストリームアナライザ310)とは別個であるかまたはそれを含む、別のデバイスまたはデバイスのグループにより実行されてもよい。
図7に示されているように、プロセス700は、第1のデータストリームおよび第2のデータストリームを受信することを含んでもよい(ブロック710)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第1のデータストリームおよび第2のデータストリームを受信してもよい。
図7にさらに示されているように、プロセス700は、第1のデータストリームおよび第2のデータストリームに関連する共通知識グラフを取得することを含んでもよい(ブロック720)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、入力コンポーネント450、通信インターフェース470および/または同様のものを使用する)は、第2のデートストリーム内の第1のデータストリームに関連する共通知識グラフを取得してもよい。
図7にさらに示されているように、プロセス700は、エンティティが共通知識グラフ内に表現されていると判断することを含んでもよい(ブロック730)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、エンティティが共通知識グラフ内に表現されていると判断してもよい。
図7にさらに示されているように、プロセス700は、第1のデータストリーム内のエンティティの認識不能な特性を判断することを含んでもよい(ブロック740)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のデータストリーム内のエンティティの認識不能な特性を判断してもよい。
図7にさらに示されているように、プロセス700は、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック750)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のアノテーション付き知識グラフを生成するために、認識不能な特性および第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けてもよい。
図7にさらに示されているように、プロセス700は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて共通知識グラフにアノテーションを付けることを含んでもよい(ブロック760)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第2のアノテーション付き知識グラフを生成するために、第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性の共通知識グラフにアノテーションを付けてもよい。
図7にさらに示されているように、プロセス700は、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づき、エンティティの認識可能な特性が第2のデータストリーム内にあると判断することを含んでもよく、第2のデータストリーム内のエンティティの認識可能な特性は、第1のデータストリーム内のエンティティの認識不能な特性に対応する(ブロック770)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420および/または同様のものを使用する)は、第1のアノテーション付き知識グラフおよび第2のアノテーション付き知識グラフに基づき、エンティティの認識可能な特性が第2のデータストリーム内にあると判断してもよい。一部の実装において、第2のデータストリーム内のエンティティの認識可能な特性は、第1のデータストリーム内のTの認識不能な特性に対応する。
図7にさらに示されているように、プロセス700は、エンティティの認識可能な特性が第2のデータストリーム内にあると判断することに基づき、アクションを実行することを含んでもよい(ブロック780)。例として、データストリームアナライザ(例えばコンピューティングリソース315、プロセッサ420、出力コンポーネント460、通信インターフェース470および/または同様のものを使用する)は、エンティティの認識可能な特性が第2のデータストリーム内にあると判断することに基づき、アクションを実行してもよい。
プロセス700は、後述される、および/または本願明細書の他の箇所に記載された他の1つ以上のプロセスに関連して記載される、任意の単一の実装または任意の実装の組み合わせなど、追加の実装を含んでもよい。
一部の実装において、第1のデータストリームは異なる時間に関連する。第2のデータストリーム内。一部の実装において、第2のデータストリーム内の第1のデータストリームは、異なるタイプのデータストリームである。一部の実装において、データストリームアナライザは、アクションを実行するとき、第1のアノテーション付き知識グラフと第2の名前アノテーション付き知識グラフとを比較することに基づき、認識不能な特性がエンティティに関連する確率を判断してもよく、確率が閾値を満たすと判断した、さらに確率が閾値を満たすことに基づき、認識可能な特性を含むように第1のデータストリームを補足してもよい。
一部の実装において、第1のデータストリームは、当初受信された第1のデータストリームである。一部の実装において、データストリームアナライザは、アクションを実行するとき、認識不能な特性に関連するデータを認識可能な特性に関連するデータにより置き換えることにより、当初受信された第1のデータストリームを再構築して、再構築された第1のデータストリームをもたらし、再構築された第1のデータストリーム内でエンティティが識別されるとの通知を提供してもよい。一部の実装において、データストリームアナライザは、アクションを実行するとき、認識不能な特性に対応する認識可能な特性に基づき、認識可能な特性に関連するメタデータを用いて第1のデータストリームを補足してもよい。
図7はプロセス700の例示のブロックを示すが、一部の実装ではプロセス700は、図7に示されたものと比べて追加のブロック、より少数のブロック、異なるブロックまたは別様に配置されたブロックを含んでもよい。さらに、または代わりに、プロセス700のブロックの2つ以上が並列実行されてもよい。
したがって、本願明細書に記載されるように、データストリームアナライザ310は、第1のデータストリーム内の認識不能な1つ以上のエンティティを、第1のデータストリームに関連する他のデータストリームの情報および/または分析を使用して自動的に認識してもよい。よって、データストリームアナライザ310は、データストリームに関連する情報を類別および/または提供して、以前の手法に従っては認識できなかったデータストリームの中の1つ以上のエンティティの存在を示すために使用されてもよい。よって、本願明細書に記載された一部の実装は、分類目的、データ分析および/または同様のものにおいて、データストリームの適切な分析および/またはデータストリームの使用を可能にする。したがって、本願明細書に記載されたように、エンティティを誤って認識すること、および/またはデータストリームを特定のエンティティを含まないものとして間違って類別することに関連して浪費されるプロセッサリソース、メモリリソースおよび/または同様のものを節約できる。
1人以上の個人を認識することに関連する、本願明細書において提供された例示の実装は、1人以上の個人との事前の合意により可能となり得る。例として、業務環境において、1人以上の個人(例えば従業員)が、会議室の中など業務の中で監視デバイスを介して認識されることに同意し得る。
前述の開示は、例示および説明を提供するが、網羅的であることも、実装を開示された厳密な形態に限定することも意図していない。変更および変形が、上記の開示を考慮して可能であり、または実装の実施から習得されるかもしれない。
本願明細書で使用されるとき、コンポーネントという用語は、ハードウェア、ファームウェアおよび/またはハードウェアとソフトウェアとの組み合わせとして広く解釈されるよう意図される。
一部の実装は、閾値に関連して本願明細書に記載された。本願明細書で使用されるとき、閾値を満たすとは、値が閾値より大きいこと、閾値を超えること、閾値より高いこと、閾値以上であること、閾値未満であること、閾値より少ないこと、閾値より低いこと、閾値以下であること、閾値と等しいことまたは同様のことを指すことができる。
特定のユーザインターフェースが本願明細書に記載され、且つ/または図面に示された。ユーザインターフェースは、グラフィカルユーザインターフェース、非グラフィカルユーザインターフェース、テキストベースのユーザインターフェースまたは同様のものを含んでもよい。ユーザインターフェースは、情報を表示のために提供してもよい。一部の実装において、ユーザは、ユーザインターフェースを表示のために提供するデバイスの入力コンポーネントを介して入力を提供することなどにより、情報と相互作用してもよい。一部の実装において、ユーザインターフェースは、デバイスおよび/またはユーザにより設定可能であってもよい(例えばユーザがユーザインターフェースのサイズ、ユーザインターフェースを介して提供される情報、ユーザインターフェースを介して提供される情報のポジションなどを変更してもよい)。さらに、または代わりに、ユーザインターフェースは、標準の設定、ユーザインターフェースが表示されるデバイスのタイプに基づく特定の設定ならびに/またはユーザインターフェースが表示されるデバイスに関連する能力および/もしくは仕様に基づく設定のセットに事前設定されてもよい。
当然のことながら、本願明細書に記載されたシステムおよび/または方法は、異なる形態のハードウェア、ファームウェアまたはハードウェアとソフトウェアとの組み合わせに実装されてもよい。これらのシステムおよび/または方法を実装するために使用される実際の専用制御ハードウェアまたはソフトウェアコードは、実装を限定しない。したがって、システムおよび/または方法の動作および挙動は、特定のソフトウェアコードを参照することなく本願明細書に記載されたが、当然のことながら、ソフトウェアおよびハードウェアを、本願明細書の記載に基づきシステムおよび/または方法を実装するよう設計できる。
特徴の特定の組み合わせが特許請求の範囲に記載され且つ/または明細書で開示されるが、これらの組み合わせは可能な実装の開示を限定することを意図されたものではない。実際には、これらの特徴の多くが、具体的に特許請求の範囲に記載および/または明細書に開示されなかった形で組み合わされてもよい。下記に列挙される各従属クレームは、1つのみのクレームに直接従属するかもしれないが、考えられる実装の開示は、クレームセットの中の他のすべてのクレームと組み合わせた各従属クレームを含む。
本願明細書で使用されるいずれの要素、動作または命令も、重要または必須とは、そのように明示的に記載されない限りは、解釈されてはならない。さらに、本願明細書で使用されるとき、冠詞「或る(aおよびan)」は、1つ以上の項目を含むよう意図され、「1つ以上の(one or more)」と交換可能なように使用され得る。さらに、本願明細書で使用されるとき、「セット(set)」という用語は、1つ以上の項目(例えば関係する項目、無関係の項目、関係する項目と無関係の項目との組み合わせなど)を含むよう意図され、「1つ以上の(one or more)」と交換可能なように使用され得る。1つのみの項目が意図される場合、「1つの(one)」という用語または同様の文言が使用される。さらに、本願明細書で使用されるとき、「有する(has、have、having)」という用語または同様のものは、非限定的な用語であるものと意図される。さらに、「基づく(based on)」という語句は、別段の記載が明示的にされない限り「少なくとも部分的に基づく(based,at least in part,on)」を意味するよう意図される。

Claims (20)

  1. 第1のデータストリームおよび第2のデータストリームをデバイスによって受信するステップと、
    画像データにオブジェクト認識手法を適用することに基づき、前記第1のデータストリームの前記画像データ内に複数のエンティティが存在すると、前記デバイスによって判断するステップと、
    顔認識手法が前記エンティティの顔を検出しないことに基づき、前記第1のデータストリームの前記画像データ内で前記複数のエンティティのうちの或るエンティティが認識不能であると判断するために、前記デバイスによって前記第1のデータストリームを分析するステップと、
    前記第1のデータストリームおよび前記第2のデータストリームに関連する共通知識グラフを前記デバイスによって取得するステップであって、
    前記共通知識グラフは、前記複数のエンティティについての情報を含む、
    前記取得するステップと、
    第1のアノテーション付き知識グラフを生成するために、前記第1のデータストリーム内の前記複数のエンティティの第1の対応する認識可能な特性を用いて、前記デバイスによって前記共通知識グラフにアノテーションを付けるステップと、
    第2のアノテーション付き知識グラフを生成するために、前記第2のデータストリーム内の前記複数のエンティティの第2の対応する認識可能な特性を用いて、前記デバイスによって前記共通知識グラフにアノテーションを付けるステップと、
    前記第1のアノテーション付き知識グラフおよび前記第2のアノテーション付き知識グラフに基づき前記エンティティが認識可能であるかどうかを、前記デバイスによって判断するステップと、
    前記第1のアノテーション付き知識グラフおよび前記第2のアノテーション付き知識グラフに基づき、前記デバイスによって前記エンティティのメタデータを生成するステップと、
    前記第1のデータストリームの前記画像データに前記エンティティの情報を重ねること、または
    前記エンティティの認識不能な特性を前記エンティティの認識可能な特性により置き換えること
    のうちの少なくとも1つのために、前記デバイスによって前記メタデータを前記第1のデータストリームに付加するステップと、
    を含む方法。
  2. 前記複数のエンティティについての前記情報は、前記複数のエンティティのうちの1つ以上の、対応するアイデンティティを示す、請求項1に記載の方法。
  3. 前記画像データが前記エンティティの前記認識不能な特性を含むことに基づき、前記エンティティが認識不能であると判断するステップ
    をさらに含む、請求項1に記載の方法。
  4. 前記方法は、
    前記第1のアノテーション付き知識グラフと前記第2のアノテーション付き知識グラフとを比較することに基づき前記エンティティが認識可能である確率を判断するステップと、
    前記エンティティが認識可能である前記確率を前記第1のデータストリームに関連する前記メタデータの中で示すステップと
    さらに含む、請求項1に記載の方法。
  5. 前記方法は、
    前記第1のアノテーション付き知識グラフと前記第2のアノテーション付き知識グラフとを比較することに基づき前記エンティティが認識可能である確率を判断するステップと、
    前記確率が閾値を満たすと判断するステップと、
    前記確率が前記閾値を満たすことに基づき、前記エンティティの前記認識不能な特性に対応する、前記第2のデータストリームからの認識可能な特性を含むように前記第1のデータストリームを補足するステップと、
    さらに含む、請求項1に記載の方法。
  6. 前記第1のデータストリームおよび前記第2のデータストリームは、同じ事象、同じ場所、同じ人または同じ期間のうちの少なくとも1つに関連する、請求項1に記載の方法。
  7. 前記画像データは、第1の画像データを含み、前記第2のデータストリームは、第2の画像データを含み、
    前記第2の画像データは、前記複数のエンティティの前記第2の対応する認識可能な特性を含む、請求項1に記載の方法。
  8. 前記第2のデータストリームは、画像データ、オーディオデータ、テキストデータまたはセンサデータのうちの少なくとも1つを含む、請求項1に記載の方法。
  9. 1つ以上のメモリと、
    前記1つ以上のメモリに通信結合された1つ以上のプロセッサと、
    を含むデバイスであって、前記1つ以上のプロセッサは、
    第1のデータストリームおよび第2のデータストリームを受信することと、
    前記第1のデータストリームおよび前記第2のデータストリームに関連する共通知識グラフを取得することであって、
    前記共通知識グラフは、前記第1のデータストリームおよび前記第2のデータストリームに関連する情報を含む、
    前記取得することと、
    エンティティが前記第1のデータストリーム内の認識不能な特性を有することに基づき、前記エンティティが前記第1のデータストリーム内の認識不能なエンティティであると検出することであって、
    顔認識手法が前記エンティティの顔を検出しないことに基づき、前記認識不能な特性が識別される、
    前記検出することと、
    第1のアノテーション付き知識グラフを生成するために、前記認識不能な特性および前記第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて前記共通知識グラフにアノテーションを付けることと、
    第2のアノテーション付き知識グラフを生成するために、前記第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて前記共通知識グラフにアノテーションを付けることと、
    前記第2のアノテーション付き知識グラフ内の前記第2の対応する認識可能な特性のうちの1つが前記第1のアノテーション付き知識グラフ内の前記認識不能な特性に対応するかどうかを、前記第1のアノテーション付き知識グラフおよび前記第2のアノテーション付き知識グラフに基づき判断することと、
    前記第2の対応する認識可能な特性のうちの前記1つが前記認識不能な特性に対応するかどうかに基づき、前記エンティティが識別可能なエンティティである確率を判断することと、
    前記確率に基づき、前記エンティティのメタデータを生成することと、
    前記第1のデータストリームの画像データに前記エンティティの情報を重ねること、または
    前記エンティティの認識不能な特性を前記エンティティの認識可能な特性により置き換えること、
    のうちの少なくとも1つのために、前記メタデータを前記第1のデータストリームに付加することと、
    をする、デバイス。
  10. 前記共通知識グラフは、前記第1のデータストリームを提供する1つ以上のデータストリームデバイスにより監視される事象、場所、人または期間のうちの少なくとも1つに関連する、請求項9に記載のデバイス。
  11. 前記共通知識グラフは、前記エンティティが前記第1のデータストリームおよび前記第2のデータストリームに含まれることを示す、請求項9に記載のデバイス。
  12. 前記1つ以上のプロセッサは、前記第1のアノテーション付き知識グラフを生成するために前記共通知識グラフにアノテーションを付けるとき、
    前記第1のデータストリーム内で識別された前記エンティティの前記第1の対応する認識可能な特性を識別するために、第1のオブジェクト認識手法を使用して前記第1のデータストリームを分析することであって、
    前記第1のオブジェクト認識手法は、前記第1のデータストリームの第1のタイプに関連する、
    前記第1のデータストリームを分析することと、
    前記第1のアノテーション付き知識グラフを生成するために、前記第1の対応する認識可能な特性と、前記共通知識グラフの対応するノードとを関連付けることと、
    前記認識不能な特性が、前記認識不能な特性に対応する前記共通知識グラフの特定のノードに関連することを示すことと、
    をし、前記1つ以上のプロセッサは、前記第2のアノテーション付き知識グラフを生成するために前記共通知識グラフにアノテーションを付けるとき、
    前記第2のデータストリーム内で識別された前記エンティティの前記第2の対応する認識可能な特性を識別するために、第2のオブジェクト認識手法を使用して前記第2のデータストリームを分析することであって、
    前記第2のオブジェクト認識手法は、前記第2のデータストリームの第2のタイプに関連する、
    前記第2のデータストリームを分析することと、
    前記第2のアノテーション付き知識グラフを生成するために、前記第2の対応する認識可能な特性と、前記共通知識グラフの対応するノードとを関連付けることと、
    をする、請求項9に記載のデバイス。
  13. 前記第1のデータストリームは、当初受信された第1のデータストリームであり、前記1つ以上のプロセッサはさらに
    再構築された第1のデータストリームをもたらすために、前記認識不能な特性に関連するデータを前記第2の対応する認識可能な特性のうちの在る認識可能な特性に関連するデータにより置き換えることにより、前記当初受信された第1のデータストリームを再構築することと、
    前記再構築された第1のデータストリームを、前記当初受信された第1のデータストリームに関連して格納することと、
    をする、請求項9に記載のデバイス。
  14. 前記1つ以上のプロセッサはさらに
    前記第2の対応する認識可能な特性のうちの前記1つが前記認識不能な特性に対応することに基づき、前記第2の対応する認識可能な特性のうちの前記1つに関連するメタデータを用いて前記第1のデータストリームを補足する、請求項9に記載のデバイス。
  15. 命令を格納する非一時的コンピュータ可読媒体であって、前記命令は、
    1つ以上の命令
    を含み、前記1つ以上の命令は、1つ以上のプロセッサにより実行されると前記1つ以上のプロセッサに、
    第1のデータストリームおよび第2のデータストリームを受信することと、
    前記第1のデータストリームおよび前記第2のデータストリームに関連する共通知識グラフを取得することと、
    エンティティが前記共通知識グラフ内に表現されていると判断することと、
    顔認識手法が前記エンティティの顔を検出しないことに基づき、前記第1のデータストリーム内の前記エンティティの認識不能な特性を判断することと、
    第1のアノテーション付き知識グラフを生成するために、前記認識不能な特性および前記第1のデータストリーム内で識別されたエンティティの第1の対応する認識可能な特性を用いて前記共通知識グラフにアノテーションを付けることと、
    第2のアノテーション付き知識グラフを生成するために、前記第2のデータストリーム内で識別されたエンティティの第2の対応する認識可能な特性を用いて前記共通知識グラフにアノテーションを付けることと、
    前記第1のアノテーション付き知識グラフおよび前記第2のアノテーション付き知識グラフに基づき、前記エンティティの認識可能な特性が前記第2のデータストリーム内にあると判断することであって、
    前記第2のデータストリーム内の前記エンティティの前記認識可能な特性は、前記第1のデータストリーム内の前記エンティティの前記認識不能な特性に対応する、
    前記第2のデータストリーム内にあると前記判断することと、
    前記第1のアノテーション付き知識グラフおよび前記第2のアノテーション付き知識グラフに基づき、前記エンティティのメタデータを生成することと、
    前記第1のデータストリームの画像データに前記エンティティの情報を重ねること、または
    前記エンティティの認識不能な特性を前記エンティティの前記認識可能な特性により置き換えること
    のうちの少なくとも1つのために、前記メタデータを前記第1のデータストリームに付加することと、
    をさせる、非一時的コンピュータ可読媒体。
  16. 前記第1のデータストリームは、前記第2のデータストリームと異なる期間に関連する、請求項15に記載の非一時的コンピュータ可読媒体。
  17. 前記第1のデータストリームと前記第2のデータストリームとは、異なるタイプのデータストリームである、請求項15に記載の非一時的コンピュータ可読媒体。
  18. 前記1つ以上の命令は、前記1つ以上のプロセッサによって実行されると前記1つ以上のプロセッサに、
    前記第1のアノテーション付き知識グラフと前記第2のアノテーション付き知識グラフとを比較することに基づき、前記認識不能な特性が前記エンティティに関連する確率を判断することと、
    前記確率が閾値を満たすと判断することと、
    前記確率が前記閾値を満たすことに基づき、前記認識可能な特性を含むように前記第1のデータストリームを補足することと、
    さらにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  19. 前記第1のデータストリームは、当初受信された第1のデータストリームであり、前記1つ以上の命令は、前記1つ以上のプロセッサによって実行されると前記1つ以上のプロセッサに、
    再構築された第1のデータストリームをもたらすために、前記認識不能な特性に関連するデータを前記認識可能な特性に関連するデータにより置き換えることにより、前記当初受信された第1のデータストリームを再構築することと、
    前記再構築された第1のデータストリーム内で前記エンティティが識別されるとの通知を提供することと、
    さらにさせる、請求項15に記載の非一時的コンピュータ可読媒体。
  20. 前記1つ以上の命令は、前記1つ以上のプロセッサによって実行されると前記1つ以上のプロセッサにさらに
    前記認識不能な特性に対応する前記認識可能な特性に基づき、前記認識可能な特性に関連するメタデータを用いて前記第1のデータストリームを補足させる、請求項15に記載の非一時的コンピュータ可読媒体。
JP2019157122A 2018-08-30 2019-08-29 エンティティに関連する欠落情報を補足するために複数のデータストリームを使用するエンティティ認識 Active JP6751806B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/117,475 US10339420B1 (en) 2018-08-30 2018-08-30 Entity recognition using multiple data streams to supplement missing information associated with an entity
US16/117,475 2018-08-30

Publications (2)

Publication Number Publication Date
JP2020064613A JP2020064613A (ja) 2020-04-23
JP6751806B2 true JP6751806B2 (ja) 2020-09-09

Family

ID=67069571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019157122A Active JP6751806B2 (ja) 2018-08-30 2019-08-29 エンティティに関連する欠落情報を補足するために複数のデータストリームを使用するエンティティ認識

Country Status (3)

Country Link
US (1) US10339420B1 (ja)
EP (1) EP3617942A1 (ja)
JP (1) JP6751806B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10916237B2 (en) * 2019-03-29 2021-02-09 Microsoft Technology Licensing, Llc Training utterance generation
US10867132B2 (en) 2019-03-29 2020-12-15 Microsoft Technology Licensing, Llc Ontology entity type detection from tokenized utterance
US10970278B2 (en) 2019-03-29 2021-04-06 Microsoft Technology Licensing, Llc Querying knowledge graph with natural language input
US11328076B2 (en) * 2019-04-30 2022-05-10 Imperva, Inc. Community-based data security
CN110570854B (zh) * 2019-08-23 2021-10-15 珠海格力电器股份有限公司 一种智能语音输出方法及装置
KR102524766B1 (ko) * 2019-12-17 2023-04-24 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 자연어 및 지식 그래프 기반 표현 학습 방법 및 장치
CN111091006B (zh) * 2019-12-20 2023-08-29 北京百度网讯科技有限公司 一种实体意图体系的建立方法、装置、设备和介质
WO2021161492A1 (ja) * 2020-02-14 2021-08-19 株式会社ロボマインド 汎用人工知能システムおよび汎用人工知能プログラム
CN112001265B (zh) * 2020-07-29 2024-01-23 北京百度网讯科技有限公司 视频事件识别方法、装置、电子设备及存储介质
CN112905853A (zh) * 2021-03-05 2021-06-04 北京中经惠众科技有限公司 知识图谱构建过程的故障检测方法、装置、设备和介质
US20220309588A1 (en) * 2021-03-26 2022-09-29 International Business Machines Corporation Identifying and leveraging close associates from unstructured data to improvise risk scoring
CN115225582B (zh) * 2022-06-10 2024-03-08 国家计算机网络与信息安全管理中心 一种基于动态知识图谱的动环平台协议适配方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668797B2 (en) * 2006-04-07 2010-02-23 Gary Kuvich Active semiotic system for image and video understanding by robots and unmanned vehicles, methods and apparatus
US9251421B2 (en) * 2012-09-13 2016-02-02 General Electric Company System and method for generating semantic annotations
US11397462B2 (en) * 2012-09-28 2022-07-26 Sri International Real-time human-machine collaboration using big data driven augmented reality technologies
KR20150132860A (ko) * 2013-03-15 2015-11-26 로버트 해드독 지식으로의 원-스텝 액세스를 제공하는 적응적 사용자 인터페이스를 갖춘 지능형 인터넷 시스템
WO2015195765A1 (en) * 2014-06-17 2015-12-23 Nant Vision, Inc. Activity recognition systems and methods
US20160203137A1 (en) * 2014-12-17 2016-07-14 InSnap, Inc. Imputing knowledge graph attributes to digital multimedia based on image and video metadata
US20160328443A1 (en) * 2015-05-06 2016-11-10 Vero Analytics, Inc. Knowledge Graph Based Query Generation
US10013450B2 (en) * 2015-12-03 2018-07-03 International Business Machines Corporation Using knowledge graphs to identify potential inconsistencies in works of authorship
JP2019507444A (ja) * 2015-12-07 2019-03-14 データフォーキュア、インク. 測定データおよびテキストからオントロジーベースの動的学習および知識統合を行う方法およびシステム
CN105740402B (zh) * 2016-01-28 2018-01-02 百度在线网络技术(北京)有限公司 数字图像的语义标签的获取方法及装置

Also Published As

Publication number Publication date
JP2020064613A (ja) 2020-04-23
EP3617942A1 (en) 2020-03-04
US10339420B1 (en) 2019-07-02

Similar Documents

Publication Publication Date Title
JP6751806B2 (ja) エンティティに関連する欠落情報を補足するために複数のデータストリームを使用するエンティティ認識
US10915820B2 (en) Generating data associated with underrepresented data based on a received data input
US11546183B2 (en) Managing meeting data
CN112955911B (zh) 数字图像分类和注释
US20200167556A1 (en) Real-time gesture detection and recognition
AU2019208146B2 (en) Information transition management platform
US10973458B2 (en) Daily cognitive monitoring of early signs of hearing loss
US11158210B2 (en) Cognitive real-time feedback speaking coach on a mobile device
US20200403816A1 (en) Utilizing volume-based speaker attribution to associate meeting attendees with digital meeting content
CA3071061C (en) Identifying a media item to present to a user device via a communication session
WO2021045990A1 (en) Multi-speaker diarization of audio input using a neural network
WO2023109103A1 (zh) 视频编辑方法、装置、电子设备、介质
US20240045904A1 (en) System and method of providing search and replace functionality for videos
US10643224B2 (en) Analyzing event-associated connections
US11386056B2 (en) Duplicate multimedia entity identification and processing
EP4032085B1 (en) Automated mining of real-world audio training data
US11889168B1 (en) Systems and methods for generating a video summary of a virtual event
US20200364195A1 (en) Identifying Duplication Multimedia Entities

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20191226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200228

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200228

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200228

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200817

R150 Certificate of patent or registration of utility model

Ref document number: 6751806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250