JP2015508209A - コンテキストを決定するシステムおよび方法 - Google Patents

コンテキストを決定するシステムおよび方法 Download PDF

Info

Publication number
JP2015508209A
JP2015508209A JP2014558171A JP2014558171A JP2015508209A JP 2015508209 A JP2015508209 A JP 2015508209A JP 2014558171 A JP2014558171 A JP 2014558171A JP 2014558171 A JP2014558171 A JP 2014558171A JP 2015508209 A JP2015508209 A JP 2015508209A
Authority
JP
Japan
Prior art keywords
context
tag
sparse vector
computer program
tags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014558171A
Other languages
English (en)
Other versions
JP5944535B2 (ja
Inventor
ユッカ サーリネン
ユッカ サーリネン
レオ カルッカイネン
レオ カルッカイネン
ミッコ テルホ
ミッコ テルホ
イレーニア フロンツァ
イレーニア フロンツァ
アンドレーア ヤネス
アンドレーア ヤネス
アルベールト シッリッティ
アルベールト シッリッティ
ジャンカルロ スッチ
ジャンカルロ スッチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2015508209A publication Critical patent/JP2015508209A/ja
Application granted granted Critical
Publication of JP5944535B2 publication Critical patent/JP5944535B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Environmental & Geological Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

システムを制御できるように、または、コンテキスト情報をシステムで利用できるように、システムのコンテキストを決定する。システムのコンテキストは、例えば、システムの状態、システムの環境、及び、ユーザの状態を特徴づけるタグまたはワードで記述される。これらのタグは、多数のタイムインスタンスで決定される。タグは、第1期間及び第2期間にわたって決定され、2セット(以上)のタグを用いてシステムのコンテキストを決定する。2セットを用いた決定の結果が異なる場合、すなわち、2つの導出されたコンテキスト間の距離が大きい場合、コンテキストが変更されたと決定される。コンテキストの変更を検出することにより、例えば、ユーザインターフェース上でユーザに提示されるアプリケーションを変更するか、または、アプリケーションの状態及び/または優先順位を変更することによって、システムを制御することができる。【選択図】 図3

Description

背景
スマートフォンやコンピュータのような最新のユーザ電子装置は、例えば、様々なニーズに対する様々なプログラムや、位置決め、通信及びエンターテイメントのための様々なモジュールなどの、複数の機能を担っている。これらの装置では数多くの種類のタスクが実行可能であり、個々のタスクは、複雑である。例えば、今日の世界で実行される仕事の多くは、コンピュータの助けによって行われており、同様に、電子装置は、仕事以外の時間においても日常生活の一部となっている。
コンピュータやスマートフォンのような最新の電子装置のユーザは、システムが提供する様々な機能に圧倒されてしまうかもしれない。このため、これらの装置は、装置の機能の見た目や配置をカスタマイズする方法を提供して、ユーザが、必要とする装置の機能を容易に利用できるようにしている。しかし、システムの使用状況だけでなくシステムのおかれている状態が、ユーザの好み及びニーズに影響することがある。
そこで、ユーザシステムの状況及び/または状態を決定する解決策が求められている。
摘要
本発明者は、上記の問題を緩和する方法を実施する改善された方法及び技術的装置を発明した。本発明の様々な態様は、独立請求項に特徴が記載された、方法、装置、サーバ、クライアント、データ構造、及び、コンピュータプログラムを保存したコンピュータ可読媒体を含む。本発明の様々な実施形態は、従属請求項に開示される。
本発明は、システムを制御できるように、あるいは、コンテキスト情報をシステムで使用できるようにシステムのコンテキストを決定する技術に関する。システムのコンテキストは、例えば、システムの状態、システムの環境、ユーザの状態などを特徴付けるタグまたはワードで記載されている。これらのタグは、複数のタイムインスタンスで決定される。タグは、第1期間及び第2期間にわたって収集され、タグの2つ以上のセットを用いてシステムのコンテキストが決定される。2つのセットを用いた決定の結果が異なる場合、すなわち、導出された2つのコンテキスト間の距離が大きい場合、コンテキストが変更されたと決定される。コンテキストの変更を検出することにより、例えば、ユーザインターフェース上でユーザに提示するアプリケーションを変更するか、または、アプリケーションの状態及び/または優先順位を変更することによって、システムを制御することができる。
第1の態様によれば、提供される方法は、コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと、前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと、前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと、前記差に基づいてコンテキストが変更されたかを判定することと、コンテキストが変更されたと判定されると、前記システムを制御することと、を含む。
実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む。実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む。実施形態によっては、前記方法は、前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成することと、前記コードブックを用いて前記第1セットから第1コンテキスト疎ベクトルを形成し、前記第2セットから第2コンテキスト疎ベクトルを形成することと、前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定することと、を含む。実施形態によっては、前記コードブックを形成することは、タグを含むドキュメントについてランダム疎ベクトルを形成することと、前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加することと、複数のタグに対して前記寄与の付加を繰り返すことと、を含む。実施形態によっては、前記方法は、前記第1コンテキスト疎ベクトルと第2コンテキスト疎ベクトルとの距離を算出して前記差を決定することを含む。実施形態によっては、前記方法は、前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定することを含む。実施形態によっては、前記方法は、前記コードブックを用いて、前記第2コンテキスト疎ベクトルから第2コンテキストを決定することと、前記決定された第1コンテキストと、前記決定された第2コンテキストとの距離を算出して前記差を決定することと、を含む。実施形態によっては、前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離の群から選択される少なくとも1つの距離測度を用いて算出される。実施形態によっては、前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態の群からのワードを含む。実施形態によっては、タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される。実施形態によっては、前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値の群のうち少なくとも1つに基づく。実施形態によっては、前記制御することは、前記コンテキストの変更に基づいてアプリケーション状態を設定することを含む。実施形態によっては、前記制御することは、ソーシャルメディア・アクティビティ・コンテキストを決定することと、前記ソーシャルメディア・アクティビティ・コンテキストに応じて前記ユーザに関連情報を提示することと、を含む。
第2の態様によれば、提供される装置は、少なくとも1つの処理装置と、1つ以上のプログラムユニットのためのコンピュータプログラムコードを含む少なくとも1つのメモリと、を含む装置であって、前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、前記処理装置により、前記装置に、コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々装置のコンテキストに対応すると共に、前記装置のコンテキストの異なる期間にそれぞれ対応する、前記形成することと;前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと;前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を判定することと;前記差に基づいて、コンテキストが変更されたかを判定することと;コンテキストが変更されたと判定されることに応じて前記装置を制御することと;を行わせるように構成される。
実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む。実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む。実施形態によっては、前記装置は、コンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成させ、前記コードブックを用いて、前記第1セットから第1コンテキスト疎ベクトルを形成させ、前記第2セットから第2コンテキスト疎ベクトルを形成させ、前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定させるように構成される。実施形態によっては、前記装置は、前記コードブックを形成するためのコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、タグを含むドキュメントに対してランダムな疎ベクトルを形成させ、前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加させ、複数のタグに対して前記寄与の付加を繰り返させるように構成される。実施形態によっては、前記装置は、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、前記第1コンテキスト疎ベクトルと前記第2コンテキスト疎ベクトルとの距離を算出させて前記差を決定させるように構成される。実施形態によっては、前記装置は、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定させ、前記コードブックを用いて前記第2コンテキスト疎ベクトルから第2コンテキストを決定させ、前記決定された第1コンテキスト及び前記決定された第2コンテキストとの距離を算出させて前記差を決定させるように構成される。実施形態によっては、前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離の群から選択される少なくとも1つの距離測度を用いて算出される。実施形態によっては、前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態の群からのワードを含む。実施形態によっては、タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される。実施形態によっては、前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値の群のうち少なくとも1つに基づく。実施形態によっては、前記装置は、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、前記コンテキストの変更に基づいて、アプリケーション状態を設定させるように構成される。実施形態によっては、前記装置は、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、ソーシャルメディア・アクティビティ・コンテキストを決定させ、前記ソーシャルメディア・アクティビティ・コンテキストに応じて、前記ユーザに関連情報を提示させるように構成される。
第3の態様によれば、提供されるシステムは、少なくとも1つの処理装置と、1つ以上のプログラムユニットのためのコンピュータプログラムを含む少なくとも1つのメモリと、を含むシステムであって、前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、前記処理装置により、前記システムに、 コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと;前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと;前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと;前記差に基づいて、コンテキストが変更されたかを判定することと;コンテキストが変更されたと判定されることに応じて前記システムを制御することと;を行わせるように構成される。
実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む。実施形態によっては、前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットは、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成させ、前記コードブックを用いて、前記第1セットから第1コンテキスト疎ベクトルを形成させ、前記第2セットら第2コンテキスト疎ベクトルを形成させ、前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定させるように構成される。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、タグを含むドキュメントに対してランダムな疎ベクトルを形成させ、前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加させ、複数のタグに対して前記寄与の付加を繰り返させるように構成される。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、前記第1コンテキスト疎ベクトルと前記第2コンテキスト疎ベクトルとの距離を算出させて前記差を決定させるように構成される。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定させ、前記コードブックを用いて前記第2コンテキスト疎ベクトルから第2コンテキストを決定させ、前記決定された第1コンテキスト及び前記決定された第2コンテキストとの距離を算出させて前記差を決定させる。実施形態によっては、前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離の群から選択される少なくとも1つの距離測度を用いて算出されるように構成される。実施形態によっては、前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態の群からのワードを含む。実施形態によっては、タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される。実施形態によっては、前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値の群のうち少なくとも1つに基づく。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、前記コンテキストの変更に基づいて、アプリケーション状態を設定させるように構成される。実施形態によっては、前記システムは、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、ソーシャルメディア・アクティビティ・コンテキストを決定させ、前記ソーシャルメディア・アクティビティ・コンテキストに応じて、前記ユーザに関連情報を提示させるように構成される。
第4の態様によれば、提供されるコンピュータプログラム製品は、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品であって、当該命令は、1つ以上の処理装置によって実行されると、システムに、第1の態様の実施形態のいずれかに記載の方法を行わせる。
第5の態様によれば、提供されるコンピュータプログラム製品は、1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品であって、当該命令は、1つ以上の処理装置によって実行されると、システムに、コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと;前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと;前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと;前記差に基づいて、コンテキストが変更されたかを判定することと;コンテキストが変更されたと判定されることに応じて前記システムを制御することと;を行わせるように構成される。
第6の態様によれば、提供される装置は、コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成する手段であって、前記第1セット及び前記第2セットは、各々装置のコンテキストに対応すると共に、前記装置のコンテキストの異なる期間にそれぞれ対応する、前記形成する手段と;前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出する手段と;前記第1導出コンテキストデータと前記第2コンテキストデータとの差を決定する手段と;前記差に基づいてコンテキストが変更されたかを判定する手段と;コンテキストが変更されたと判定されると、前記装置を制御する手段と;を有する。
実施形態によっては、前記装置は、前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成する手段と、前記コードブックを用いて前記第1セットから第1コンテキスト疎ベクトルを形成し、前記第2セットから第2コンテキスト疎ベクトルを形成する手段と、前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定する手段と、を有する。実施形態によっては、前記装置は、タグを含むドキュメントに対してランダム疎ベクトルを形成する手段と、前記タグが存在するドキュメントの前記疎ベクトルからタグのコードブックベクトルに寄与を付加する手段と、複数のタグに対して前記寄与の付加を繰り返す手段と、を有する。実施形態によっては、前記装置は、前記第1コンテキスト疎ベクトルと第2コンテキスト疎ベクトルとの距離を算出して前記差を決定する手段を含む。実施形態によっては、前記装置は、前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定する手段と、前記コードブックを用いて、前記第2コンテキスト疎ベクトルから第2コンテキストを決定する手段と、前記決定された第1コンテキストと、前記決定された第2コンテキストとの距離を算出して前記差を決定する手段と、を有する。実施形態によっては、前記装置は、前記コンテキストの変更に基づいて、アプリケーション状態を設定する手段を含む。実施形態によっては、前記装置は、ソーシャルメディア・アクティビティ・コンテキストを決定する手段と、前記ソーシャルメディア・アクティビティ・コンテキストに応じて前記ユーザに関連情報を提示する手段と、を有する。
第7の態様によれば、コンピュータシステムの動作を制御するデータ構造が提供され、前記データ構造は、用語に関連付けられた高次元疎ベクトルを含み、前記用語は、一般的なワード、インターネットアドレスのワード、ブランド名、ユーザ電話帳名およびセンサ値のワードの群から選択される少なくとも3種類のワードを含む。
第8の態様によれば、コンテキストの変更を判定するシステムにおいて、ハードウェアセンサ状態を示す人間の言葉のワードを使用することが提供される。
以下に、本発明の様々な実施形態を添付の図面を参照してより詳細に説明する。
実施形態に係る、コンテキストを決定する方法のフロー図。 実施形態に係る、コンテキストを決定するシステム及び装置を示す図。 実施形態に係る、コンテキストを決定するシステム及び装置を示す図。 実施形態に係る、より前のコンテキスト情報から将来のコンテキストを決定するシステムを示す図。 実施形態に係る、コンテキストを決定するためのランダム指標コードブックを形成するシステム及び方法を示す図。 実施形態に係る、コンテキストを決定するためのランダム指標コードブックを形成する別のシステム及び方法を示す図。 データ構造、システム、及び、ランダムな指標付けによって将来のコンテキストを決定するデータ構造を用いる方法を示す図。 実施形態に係る、ランダムな指標付けによって将来のコンテキストを決定する方法のフロー図。
実施形態の詳細説明
以下に、本発明のいくつかの実施形態を、ランダムな指標付けの構成だけでなく、システムのコンテキストを参照して説明する。なお、本発明は、これらの使用法または代替手段に限定されない。実際、実施形態は、意味処理が必要なあらゆる環境での用途を含む。
一例として、コンテキスト処理体系は、「ワード」及び「ドキュメント」の語彙体系にマッピングされてもよい。ドキュメントは、例えば、所与のタイムインスタンスにおける、コンテキストの単一の理解を定義する1組のワードを含んでいる。
分布意味論の方法は、大きく分けて、確率的方法あるいは幾何学的方法のいずれかに分類できる。
確率的モデルでは、ドキュメントを、主題が混在するものとして考えることで、特定の主題の議論において遭遇する確率によって用語を表すことを可能にする。例えば、潜在的意味解析(LSA)においては、ドキュメント全体をコンテキストとして用い、ドキュメントに用語が現れる回数に対応するセルを有する、用語−ドキュメントマトリクスを生成する。一方、超空間言語相似性(HAL)モデルでは、対象用語の周辺のワードをコンテキストとして用い、所与の用語が、1つおきの用語の近隣に現れる回数に注目した用語−用語マトリクスを生成する。これに対し、シュッツェのワード空間は、約1000回の頻度で現れる4グラムのスライドウィンドウをコンテキストとして定義することで、4グラム毎の用語マトリクスを生成する。通常、用語ベクトルの大きさは、用語がコーパスに現れる頻度に依存し、方向は、選択された基準ベクトルとの用語の関係に依存する。
幾何学的モデルの例としては、ランダムな指標付けが挙げられるが、用語を多次元空間のベクトルとして表す。多次元空間の次元は、定義されたコンテキストにわたる用語の分散から導出される。コンテキストは、ドキュメント全体、ドキュメント内の領域または文法的関係を含んでもよい。
ベクトル−空間モデルの性質は、非構造化データから監視されない状態で、意味情報が自動的に抽出されるということだろう。モデルは、データの前処理をする必要が、ほとんど、あるいは、全くなく、人が介在する必要がほとんど、あるいは、全くなくてもよい。「ベクトルに基づく意味解析」とは、データの統計的規則性、例えば、共起情報、を用いてベクトル及びベクトル空間を構築する処理、例えば、データの予備知識がないと仮定した場合において、モデルを簡単に主題及び構造的性質が異なるデータに適用する処理を指す。
従って、意味空間の力学に、訓練データの意味論が反映されるため、ベクトル−空間モデルを、新しいドメインに、本質的に適応することができる。つまり、ドメインによって、ワードとワードの意味的関係が異なるような、異なる意味空間が生成される。例えば、動物学データベースのモデルをみてみると、「mouse」というワードは、例えば、小さく、毛でおおわれた動物または齧歯動物を指す他のワードに間違いなく関連付けられるが、コンピュータ関連のドキュメントに目を向けると、「mouse」は、例えば、コンピュータハードウェアを指す他のワードに恐らく関連付けられるだろう。実験検証上では、この特徴によっても、モデルは、異なる言語に容易に適用可能になる。
ランダムな指標付け(RI)技術は、以下のように、2段階の動作として記載することができる。まず、データの各コンテキスト(例えば、各ドキュメントまたは各ワード)に、指標ベクトルと呼ばれる、ランダムに生成された固有の表現を割り当てる。これらの指標ベクトルは、高次元で三成分から成る疎ベクトルであり、すなわち、それらの次元(d)は、約100または1000以上であり、それらは、例えば、少数のランダムに分配された+1s及び−1sまたはそれ以外の小さい数から成り、ベクトルの残りの要素はゼロである。次に、テキストを走査することによりコンテキストベクトルを生成し、コンテキスト(例えば、ドキュメントあるいはスライドコンテキストウィンドウ内)にワードが現れる度に、そのコンテキストのd次元指標ベクトルを当該ワードのコンテキストベクトルに追加する。このように、ワードは、事実上、ワードのコンテキストの合計であるd次元コンテキストベクトルによって表現される。
例として、「A friend in need is a friend indeed」という文を検討する。指標ベクトルの次元を10とし、コンテキストを1つ前及び1つ後のワードとして定義する。「friend」にランダムな指標ベクトル[0 0 0 1 0 0 0 0 -1 0]を割り当て、「need」にランダムな指標ベクトル[0 1 0 0 -1 0 0 0 0 0]を割り当てる。次に、「in」のコンテキストベクトルを算出するため、RIにより、「in」のコンテキスト指標ベクトルを合計する。コンテキストは、1つ前及び1つ後のワードとして定義されるため、「in」のコンテキストベクトルは、「friend」及び「need」の指標ベクトルの合計となり、[0 1 0 1 -1 0 0 0 -1 0]となる。
図1は、実施形態に係る、コンテキストを決定するための方法のフロー図を示す。段階110において、コンテキストタグの第1セット及びコンテキストタグの第2セットを形成する。第1及び第2セットは、システムのコンテキストに対応し、第1セットは、第1期間のコンテキストを記述するタグを含み、第2セットは、第2期間のコンテキストを記述するタグを含む。第1期間は第2期間と異なり、及び/または、タグは、システムのコンテキストの異なる期間を記述するように選択されたものである。システムのコンテキストが異なるように、規則的または不規則なタイムインスタンスで決定されるようにすることができ、コンテキストは、各タイムインスタンスにおいて、ワードによって記述される。その後、これらのワードは、収集され、重複するものが除去される。第1セットのタグ(ワード)は、例えば、10タイムインスタンスといったより長い期間にわたってコンテキストを記述するワードを収集することによって形成される。第2セットのタグは、例えば、2タイムインスタンスといった短い期間にわたってコンテキストを記述するワードを収集することによって形成される。タイムインスタンスは、部分的にあるいは完全に重複してもよいし、重複しなくてもよい。なお、このように形成されるタグのセットがさらに(3、4、5あるいはそれ以上)あってもよいことを理解されたい。
段階120では、第1セットから第1導出コンテキストデータ及び第2セットから第2導出コンテキストデータを形成する。すなわち、タグの各セットを用いて、導出されたコンテキストまたは予測されたコンテキストあるいはそれらを示す情報を導出する。例えば、合計することによって、タグ(ワード)のランダムな指標ベクトルから、タグのセットについて、ランダムな指標ベクトルを算出してもよい。
段階130で、第1導出コンテキストデータと第2導出コンテキストデータとの差を決定する。この差は、例えば、タグのセットのランダムな指標インデックスを用いて距離を算出することによって決定される。距離の算出では、まず、タグの各セットのランダムな指標ベクトルを用いて代表コンテキストを決定し、次に、代表コンテキスト(または、それらのランダムな指標ベクトル)間の距離(例えば、ユークリッドやドット積)を算出する。
段階140で、当該差に基づいてコンテキストが変更されたかを決定する。この決定では、第1セットのタグは、例えば、現時点からさらに戻ったより長い期間にわたってコンテキストを表し、第2セットのタグは、現時点に近い、短い期間にわたってコンテキストを表す。このように、第2セットのタグからの導出コンテキストは、第1セットのタグからの導出コンテキストよりも速くコンテキストへの変更を反映する。
段階150で、コンテキストが変更されたと決定されると、システムを制御する。例えば、アプリケーション及びそれらの状態を変更し、決定されたコンテキストの変更によって情報処理を制御する。例として、屋内で仕事をしている状態からバスに乗るためにバス停に向かって屋外を歩いている状態にコンテキストが変更したと決定された場合、システムのアプリケーションを変更し、仕事中は、電子メールアプリケーションを表示し、コンテキストが変更されると、バスの時刻表を表示するようにブラウザを立ち上げ、及び/または、ナビゲーションアプリケーションがバス停までの距離及び案内とともに町の地図を示すようにしてもよい。
コンテキストが変更されたかを決定するためのランダムな指標付け方法を用いることには、例えば、以下の利点があると考えられる。
ランダムな指標付け方法は、漸進的に用いてもよい。すなわち、例は少ないが、コンテキストベクトルを、類似性の算出に用いてもよい。ベクトルの次元dは、当該方法におけるパラメータであり、すなわち、dは一旦設定されれば変更する必要がなく、新しいデータにより、コンテキストベクトルの要素の値は増加するが、コンテキストベクトルの次元は増加しない。次元を増加させないことによって、他のワード空間方法においてしばしば見られるスケーラビリティ問題を回避することができる。例えば、過度に大規模なマトリクスで仕事をすることが回避される。固定次元dは、システムにおいて考えられるコンテキストの数cよりもずっと低いため、ランダムな指標付け方法により、間接的に次元を削減することができる。これにより、処理時間を増やすことができ、計算コストが高い次元削減アルゴリズムを採用するワード空間方法よりもメモリ消費を削減することができる。ランダムな指標付け方法は、様々な種類のコンテキストとともに用いてもよい。他のワード空間方法では、一般的に、コンテキストとしてドキュメントかワードのいずれかを用いる。RIは、これらのもともとの選択肢に限定されることなく、あらゆる種類のコンテキストとともに用いることができる。
RI方法では、ユーザの個人の行動特徴及び参照を学習してもよい。個人の情報は、他のユーザに公開できない。すなわち、データは、「秘密の」形式である。RI方法では、多様な時間的データを処理することができ、データの意味記述をリアルタイムに行うことができる。予測RI方法は、時間的に一続きの種類のデータを処理してもよく、データの意味記述をリアルタイムにしてもよい。異なるコンテキスト記述を速く切り替えることができる。
図2a及び図2bは、実施形態に係る、コンテキストを決定するシステム及び装置を示す。コンテキストは、単一の装置、互いに接続された複数の装置、または、例えば、1つ以上のサーバ及び1つ以上のユーザ装置を有するネットワークサービスフレームワークにおいて決定されてもよい。
図2aにおいて、異なる装置が、インターネットやローカルエリアネットワークなどの固定網210、または、GSM(登録商標)ネットワーク、第3世代(3G)ネットワーク、第3.5世代(3.5G)ネットワーク、第4世代(4G)ネットワーク、無線ローカルエリアネットワーク(WLAN)、Bluetooth(登録商標)や、その他の現在及び将来のネットワークなどの移動通信ネットワーク220を介して接続されている。それぞれのネットワークは、互いに通信インターフェース280を介して接続されている。ネットワークは、データを処理するための(図示しない)ルータやスイッチなどのネットワーク要素、及び、それぞれの装置へのアクセスをネットワークに提供するための基地局230及び231などの通信インターフェースを含み、基地局230及び231自体も、固定接続276または無線接続277を介して移動通信ネットワーク220に接続されている。
ネットワークには多数のサーバが接続されている。図2aの例では、ソーシャルメディアサービスなどのネットワークサービスを提供する、固定網210に接続されたサーバ240、及び、ネットワークサービスを提供する、固定網210に接続されたサーバ241、及び、ネットワークサービスを提供する、移動通信ネットワーク220に接続されたサーバ242が示されている。上記の装置のうちいくつか、例えば、サーバ240、241及び242は、固定網210にある通信要素とインターネットを構成する。様々なサーバ及びユーザ装置は、例えば、ワードに対応する疎ベクトルを含むコードブックマトリクスを保存してもよい。
携帯電話及びスマートフォン251、インターネットアクセス装置(インターネットタブレット)250、様々な大きさ及び形式のパーソナルコンピュータ260、テレビやその他の視聴装置261、ビデオ復号器、及び、プレーヤー262、及び、ビデオカメラ263や音声を取り込むためのデジタルマイクなどのその他の符号器などのエンドユーザ装置が多数存在する。これらの装置250、251、260、261、262及び263もまた、複数の部品から成る。様々な装置が、インターネットへの固定接続270、271、272及び280、インターネット210への無線接続273、移動通信ネットワーク220への固定接続275、及び、移動通信ネットワーク220への無線接続278、279及び282などの通信接続を介して、ネットワーク210及び220に接続されてもよい。接続271から282は、通信接続のそれぞれの終端において通信インターフェースによって実装される。
図2bは、実施形態例に係る、コンテキストの決定が実行される装置を示す。図2bに示すように、サーバ240は、メモリ245、1つ以上の処理装置246及び247、及び、例えば、ソーシャルメディアサービスのようなソフトウェアアプリケーションの機能を実行するための、メモリ245にあるコンピュータプログラムコード248を含む。それぞれのサーバ240、241及び242は、少なくとも、各サーバに関連する機能を用いるための要素を含んでもよい。同様に、エンドユーザ装置251は、メモリ252、少なくとも1つの処理装置253及び256、及び、例えば、ブラウザやオペレーティングシステムのユーザインターフェースのようなソフトウェアアプリケーションの機能を実行するための、メモリ252にあるコンピュータプログラムコード254を含む。エンドユーザ装置はまた、例えば、ビデオなどの画像データを取り込むための1つ以上のカメラ255及び259を有する。エンドユーザ装置は、音声を取り込むための、1または2以上のマイク257及び258を含む。エンドユーザ装置はさらに、エンドユーザ装置に取り付けられた1つ以上の無線または有線マイクを有する。それぞれのエンドユーザ装置250及び260は、各装置に関連する機能を用いるための要素を含んでもよい。エンドユーザ装置はまた、グラフィカルユーザインターフェースを表示するための画面を含んでもよい。
なお、実施形態によって、異なる部品が異なる要素において実行できることを理解されたい。例えば、ソフトウェアアプリケーションは、250、251または260のような1つのユーザ装置において実行されてもよいし、1つのサーバ装置240、241または242において、あるいは、複数のユーザ装置250、251及び260にわたって、または、複数のネットワーク装置240、241または242にわたって、または、ユーザ装置250、251及び260及びネットワーク装置240、241または242の両方にわたって実行されてもよい。例えば、ある装置でユーザインターフェースを介したユーザ入力の取り込みが行われ、別の装置でデータ処理及び情報のユーザへの提供が行われ、さらに別の装置でコンテキスト処理の制御及び管理が行われてもよい。前述したように、異なるアプリケーション要素及びライブラリが1つの装置にある、または、数台の装置に分散されたソフトウェア要素として、例えば、装置がいわゆるクラウドを形成するように、実装される。ユーザ装置250、251または260は、様々なネットワーク装置240、241及び242のように、ウェブサービスサーバとしても動作する。このウェブサービスサーバの機能も、複数の装置に分散させてもよい。
様々な実施形態が、携帯装置上で、及び、随意的に、ネットワークを利用したサービスを提供する装置上で動作するソフトウェアとして実現される。携帯装置は、少なくとも、1つまたは複数のメモリ、1つ以上の処理装置、ディスプレイ、キーパッド、動作感知ハードウェア及び2G、3G、WLANまたはそれ以外の通信手段を備えてもよい。装置によっては、タッチ画面(シングルタッチまたはマルチタッチ)のようなハードウェア及びネットワーク位置特定または全地球測位システム(GPS)モジュールのような位置特定手段を有してもよい。装置は、カレンダーアプリケーション、連絡先アプリケーション、地図アプリケーション、メッセージングアプリケーション、ブラウザアプリケーション、ギャラリアプリケーション、ビデオプレーヤーアプリケーション及び仕事用及び/またはプライベート用の他の様々なアプリケーションなどを有する。
図3は、実施形態に係る、以前のコンテキスト情報から将来のコンテキストを決定するシステムを示す。一連のイベント310、312、314、・・・、316及び318が示され、各イベントは、コンテキストによって表される。コンテキストは、イベント310について、「午前中」、「仕事」、「タンペレ」、「会議」、「ミッコ」、「ノキア」、「暖かい」、「明るい」及び「まだ」などのワードによって記述されている。時間が経過すると、コンテキストは少し変更され、例えば、時間t1のイベント310と時間t2のイベント312では、「会議」が「自由」に変更されている。あるいは、例えば、時間t10のイベント318とイベント310のコンテキストを比較すると、コンテキストは、大きくまたは完全に変更されている。コンテキストを記述するワードは、システムの時間(時計)(午前中)、位置情報(タンペレ)、利用可能な通信ネットワーク(ノキア)、カレンダー内容(会議)、システムの周りの他の装置及びそれらの所有者(ミッコ)、温度計、周辺光センサ及び加速度センサなどのセンサ示度(「暖かい」、「明るい」、「まだ」)などの異なるソースからもたらされる。あるアクティビティから別のアクティビティに移行する場合、コンテキストは変更され、それに応じて、コンテキストを記述するワードが変更される。ある時間において利用可能である情報は、別の時間では利用可能ではないことがある。すなわち、利用可能なコンテキスト情報は、変化することがある。
本発明者は、システムのユーザインターフェースまたはシステム上のアプリケーションの状態を適応させるのに、次の(将来の)コンテキスト320の予測をすること、あるいは、(コンテキスト314と316との間で)コンテキストが変更されることが役立つということに気付いた。
実施形態によっては、コンテキストタグの、それぞれ異なる期間のイベントを表す2つ以上のセットの差を検知することによってコンテキストの変更を検出する。例えば、SET1(322)は、t1からt9の期間を表し、イベント310、312、314、・・・、及び316から収集されたコンテキストワードを含む。SET2(324)は、t9からt10の期間を表し、SET3(326)は、t1からt2の期間を表し、SET4(328)は、t3からt10の期間を表し、SET5(330)は、t10の期間、すなわち、1つのタイムインスタンスのみを表す。セットは、SET1とSET2のように、重複していてもよいし、SET2とSET3のように異なっていてもよい。セットは、SET2とSET4のように同じ終了時間、及び/または、SET1とSET3のように同じ開始時間を有してもよい。SET5がSET4のサブセットであるように、あるセットが別のセットのサブセットであってもよい。代替方法として、または追加して、第1セットに対する第1頻度f1を有するタイムインスタンスに対応するコンテキストのワード及び第2セットに対する第2頻度f2を有するタイムインスタンスに対応するコンテキストのワードを決定することによって、異なるセットを形成してもよい。このように、第1タイムインスタンス及び最後のタイムインスタンスが同じであったとしても、2つのセットの期間は異なる。
セット322、324、326、328及び330は、各セットが表すそれぞれのイベントからタグを収集するだけで形成される。この時、タグの重複が取り除かれる。代替方法として、または追加して、あるタグが他のタグよりもセットに頻繁に出現するように、あるいは、セットを使用する際、あるタグの重要性がより高くなるように、タグに重み付けを行ってもよい。重み付けは、例えば、より前のイベントが最近のタイムインスタンスにおけるイベントよりも、重要性が低くなるように行ってもよい。タグは、例えば、ユーザによって入力されたものであるか、あるいは、正しいと分かっている可能性が高いものであるため、確実により高い重要性を有するようにして、セットにおいて複数回出現するように、タグ自体に基づいて重み付けを行ってもよい。重み付けは、タグが表すコンテキストの種類に基づいても行われてもよい。例えば、温度計のようなセンサ情報の重要性は低くし、ユーザのカレンダーからの情報の重要性を高くしてもよい。重み付けは、ワードのセットを用いる際に行ってもよい。例えば、浮動小数点係数などの係数を対応する疎ベクトルの要素に掛けるように重み付けを行ってもよい。
セットを形成する時、2つ以上のセット間の差を決定してもよい。例えば、図3から分かるように、SET1とSET2とは、いくつかの共通タグ(「仕事」、「会議」)を有するが、ほとんどのタグは異なる。一方で、SET1とSET3とは、ほとんどのタグが共通している。2つのセットが異なるタグを有し、十分異なっている場合、セットは異なるコンテキストを表すと決定することができる。例えば、SET1のような長いセットは、オフィスでの仕事に関連するコンテキストを表し、より最近で短いSET2は、帰宅途中に関するコンテキストを表す。セット間でワードが異なり、差を有する場合、コンテキストが変更されたことを示す。コンテキストの変更を検出するため、例えば、最後の5または10個のコンテキストを表すセットを1セットとして、最後の2個のコンテキストを表すセットをもう一方のセットとして用いてもよい。距離測度を用いて、2つのセット間の距離を算出し、差を決定してもよい。例えば、図4a、図4b及び図5を参照して説明するように、ランダム指標付け方法を用いて差を決定してもよい。2セット以上、例えば、図に示すように3、4または5、あるいはそれ以上のセットを用いることができることは明らかである。
図4aは、実施形態に係る、コンテキストを決定するためのランダム指標付けコードブックを形成するシステム及び方法を示す。まず、多数の、例えば、何千または何万、あるいは、それ以上のコンテキスト410、412及び414を訓練セットとする。コンテキストは、図3に示すようなイベントである。あるいは、他のドキュメント、または、タグまたはワードを何らかの形で表すように他の方法で形成されたタグまたはワードを集めたものは、イベントまたはコンテキストにおいて一体となる傾向を有する。次に、各コンテキストに、コンテキスト疎ベクトルを割り当てる。コンテキスト疎ベクトルは、例えば、ベクトルのランダム要素に10個の1及び10個の−1を割り当てることによって、ランダムに割り当ててもよい。ベクトルは、例えば、100、500、1000、5000、10000、20000または100000要素の長さを有する。非ゼロである要素はごくわずかであり、例えば、(割合として)100または1000個の要素に1つであり、すなわち、疎ベクトルである。このベクトルは、ランダム指標ベクトルと呼ばれる。
コンテキストにコンテキストベクトル416、418及び420が割り当てられると、タグまたはワードごとの疎ベクトル(RIベクトル)が以下のように形成される。ワード/タグ、「日中」、「自由」及び「暖かい」を例にとる。ワードがコンテキストに存在する場合はいつでも、コンテキストのランダム指標ベクトルがタグ疎ベクトル(422、424または426)に付加される。例えば、ワード「日中」がコンテキスト1及びコンテキスト3に存在するため、RIベクトル416及び420を付加してタグ疎ベクトル422を形成する。このような組み合わせまたは付加は、単に要素の総和によって行われてもよいし、重み付けを行ってもよい。同様に、タグ「暖かい」は、コンテキスト2にのみ存在するため、そのRIベクトル424は、コンテキスト2のRIベクトル418と同じになる。同様に、ワード「暖かい」は、コンテキスト2及び3に存在し、そのRIベクトル426は、ベクトル424と426とを組み合わせた/合計したベクトルになる。これらのタグ疎ベクトルは、ワード/タグコードブックを形成し、各タグは、対応する高次元のタグ疎ベクトル(422、424及び426)を有する。なお、数個のコンテキストは、ある要素位置に値を有するため、これらのベクトルは、絶対値が1より大きい要素を含み、それらのベクトルが合計されると、合計の絶対値は、1より大きくなる。
図4bは、実施形態に係る、コンテキストを決定するためのランダム指標付けコードフックを形成する別のシステム及び方法を示す。前に説明したように、コンテキストRIベクトルは、高次元ベクトルに2、3個の非ゼロ要素を割り当てることによって、ランダムに形成される。コンテキスト疎ベクトルもまた、図4aのコードブックベクトルと同様に形成される。すなわち、まず、語彙のワードにランダムな指標(RI)ベクトル440、442及び448(2、3の1または−1要素を有する疎ベクトル)を割り当てる。次に、コンテキストに存在するワードのRIベクトルを組み合わせることによってコンテキスト疎ベクトル450、452、454を取得する。例えば、コンテキスト3のコンテキスト疎ベクトル454を「日中」440及び「会議」442のベクトルの組み合わせ(例えば、和)として形成する。取得されたコンテキスト疎ベクトル450、452及び454は、図4aで説明したようにコードブックを形成するのに用いられる。
図4a及び4bでは、例えば、1つ以上の元のワードに基づいて1つ以上の補助的なワードを生成する。元のワードの代わりに、あるいは、元のワードに付加して補助的なワードを用いることにより、コードマトリクスの疎ベクトルを更新する際、及び/または、予測を行う際により有用になる場合がある。元のワードは、例えば、文字列「2012年1月2日9時3分」である。原則として、別の文字列「2012年1月2日9時4分」は、全く異なるワードとして解釈される。このような解釈は、距離/差を更新及び決定する効率を下げてしまう恐れがある。
動作は、例えば、共起データを収集するために更新されるものであり、この更新により、ある曜日に実行される可能性が高い動作を予測することができる。この目的のため、元のワード「2012年1月2日9時3分」は、2012年1月2日に対応する曜日(月曜日)を示す補助的なワードT5に置き換えられるか、または、補足される。補助的なワードは、例えば、カレンダーを用いて、元のワードから決定される。
元のワード「2012年1月2日9時3分」に含まれる時間表現は、ある目的にとっては、時間分解能が高すぎる恐れがある。例えば、目的が、(電池及びデータ処理リソースを消費する)ウィルススキャンアプリケーションを開始するのに適した時間を予測することである場合、補助的なワードは、元のワード「2012年1月2日9時3分」よりも低い分解能(例えば、「午前中」)を有する時刻を表すように決定される。補助的なワードは、例えば、辞書を用いることによって、及び/または、量子化器(分類器)を用いることによって、提供される。
例えば、以下の(URI形式の)ワードが時間を表すのに用いられる。
時間://深夜 (0時16分から4時までの時間を表す)
時間://早朝 (4時1分から6時までの時間を表す)
時間://午前中 (6時1分から11時45分までの時間を表す)
時間://正午 (11時46分から12時15分までの時間を表す)
時間://午後 (12時16分から17時までの時間を表す)
時間://夕方 (17時1分から19時までの時間を表す)
時間://夜 (19時1分から23時45分までの時間を表す)
時間://真夜中 (23時46分から0時15分までの時間を表す)
元のワードは、例えば、場所を特定するかもしれない。場所は、例えば、GPS座標を用いて、及び/または、場所の名前を提供することによって特定される。例えば、電子地図を用いて、場所を特定する1つ以上の補助的なワードが元のワードから決定される。例えば、システム500の第1装置は、(フィンランドの)「バンター」と呼ばれる場所にあり、システム500の第2装置は、(フィンランドの)「エスポー」と呼ばれる場所にある。例えば、電子地図または地名辞書を用いて、ワード「バンター」から補助的なワード「フィンランド南部」または「フィンランドの主要地域」を決定する。また、例えば、電子地図または地名辞書を用いて、ワード「エスポー」から補助的なワード「フィンランド南部」または「フィンランドの主要地域」を決定する。電子地図は、例えば、インターネットからダウンロードされる。1つ以上の補助的なワードが遠隔(インターネット)サービスによって提供される。
補助的なワードが共通であるため、第1装置によって収集された共起データを、第2装置のユーザに関して予測する際に用いることができる。
システムのユーザは、場所を名前と関連付けてもよい。例えば、ユーザが有する携帯装置は、GPSナビゲーション装置によって位置を決定して、装置がユーザに検出した場所に名前を付けるように求めてもよい。ユーザが付けた名前は、GPSの場所と関連付けられたワードとして、後で用いられる。名前は、例えば、「家」、「学校」、「大学」または「仕事場」である。狭いURLに基づいて広いURLを決定してもよい。特に、インターネットの狭いURLに基づいて、インターネットの広いURLを決定してもよい。
トークン化及び/または構文解析によって、1つ以上の補助的なワードを元のワードから形成してもよい。1つ以上の補助的なワードは、元のワードの代わりに、あるいは、元のワードに加えて用いてもよい。
図5は、ランダムな指標付けを用いて将来のコンテキストを決定するデータ構造を用いるシステム及び方法を示す。図4aで説明したように、語彙510の各タグ/ワードは、コードブック520(ランダムな指標付けベクトル)に関連付けられたタグ疎ベクトルを有する。コードブックは、ワード/タグによってベクトルは異なるが、意味的に互いに近いワードは、意味的に離れたワードよりも(互いの距離が近い)似たベクトルを有するという性質を有する。この性質は、図4aに従って訓練することによって分かった。コードブック520は、コンピュータシステムの動作を制御するのに用いられるデータ構造として表される。すなわち、コードブックの値は、システムがどのように動作するかを決定する。
以上に説明したように、コードブックは、訓練によって形成されたタグ疎ベクトルを含む。ベクトルは、入力された疎ベクトルをコードブックベクトルと比較することによって訓練されたパターンをコードブックから特定することができるくらいまばらである。コードブックの多くの要素は、ゼロまたはゼロに近い値である。コードブックベクトルは、訓練疎ベクトルと異なるパターンを示す。この意味で、コードブックの多くの要素がゼロからそれているにも関わらず、コードブックにおいて、コードブックベクトルの要素値のばらつきが大きい。
図3で説明したように、タグの各セットは、各セットが表すコンテキストを記述するタグを含む。その結果として、タグのセットのタグを、タグセット疎ベクトルまたは当該セットのRIベクトルを形成するのに用いてもよい。例えば、図3のSET1、2及び3は、各セットに含まれるタグのタグ疎ベクトルの組み合わせとして形成された、関連付けられたタグセット疎ベクトル530、532及び534を有する。組み合わせるとは、合計することであり、前に説明したように、重み付けを用いてもよい。これらのタグセット疎ベクトルを用いて以下のように、タグセット間の差を決定する。
まず、タグセット疎ベクトル530、532及び534について、コードブックからの多数の最近疎ベクトルを求める。この最近疎ベクトルは、ユークリッド距離、ドット積、水平移動距離(L1ノルム)、ハウスドルフ距離、または、2つの疎ベクトル間の類似性を示すその他の距離測度などを用いて求められる。多数(仮にkとすると、例えば、k=4)の最近ベクトルがコードブックから求められると、これらの最近ベクトルは、組み合わせることによって、例えば、合計することによって、RIコンテキストベクトルRI1、RI2及びRI3を形成するのに再び用いられる。例えば、ワードw1、w3、w40及びw87は、タグセット疎ベクトル530に最も近いコードブックベクトルを有する。
これらのベクトルRI1、RI2及びRI3は、それらについて形成されたタグのセットに最も釣り合う単一のコンテキストを表すと理解される。次に、コンテキストベクトルRI1、RI2及びRI3を用いて2つのタグのセット間の距離を決定する。距離は、図5の下部に矢印(ベクトル)で示すように決定される。2つのセットの2つのコンテキストベクトルが、(上述の)距離測度によって距離的に互いに近いと決定される場合、それらのセットは、同じまたは近いコンテキストを表し、コンテキストが変更されていないと決定される(例えば、RI1とRI3)。2つのコンテキストベクトル間の距離が大きい場合(RI1とRI2に関して)、対応するセットは異なるコンテキストを表し、それらのセットで表される期間の間で、コンテキストが変更されたと決定される(セット1、2及び3の期間について図3参照)。
代替方法として、または追加して、2つのベクトル(例えば、530と532)間の距離または類似性を決定するのにタグセット疎ベクトル530、532及び534を直接用いて、2つのセット間の差を決定してもよい。
代替方法として、または追加して、ワードwを用いて2つのベクトル(例えば530と532)間の距離または類似性を決定して、2つのセットの差を決定してもよい。例えば、SET1に対応するワードw1、w3、w40及びw87のグループは、SET3に対応するワードw1、w6、w40及びw87のグループに近いと決定される。なぜなら、グループは、4個のワードのうち3個が共通するからである。グループにおけるワードの順番は、決定において、考慮してもよいし、しなくてもよい。
コンテキストの変更の決定にランダムな指標付け方法を用いることは、例えば、以下のような利点及び技術的効果を有する。セットの類似性の決定は、他の方法よりも少ない計算量で、簡単にできるため、高速なリアルタイムのコンテキスト算出が可能になる。図3のように、様々な種類のコンテキスト及びシステムをワード/タグによって表すことができるため、本方法は、様々なアプリケーションに対して多用途である。このため、携帯電話のように、本方法を組み込みシステムに実装することができ、組み込みシステムにおいて、ユーザの個人の行動特徴及び参照を学習することができる。本方法はまた、時間的に一続きの(長期的な)データの処理を簡易化することができる。コードブック520は、行及び列に分散された訓練された情報をしっかりと保持するので、失った、または、壊れたデータがあっても、学習されたパターンを確実に読み出すことができる。ドキュメントの追加、すなわち、新しいイベントなどの新しいデータの付加が、簡易であり、コードブックマトリクス(ベクトルの次元)における列数を増やす必要なく、何百万のドキュメントに至るまで追加可能である。本方法は、コードブックベクトルが、類似する意味を有するワードは類似のコードブックベクトルを有し、関連のないワードは、類似しないベクトルを有するというように意味を捉えるという効果を有する。
要約すると、高次元のランダムなベクトル、すなわち、大規模なランダムパターンが、データにおける規則性を捉える認識コードの基礎として役立つだろう。ランダムベクトル法の簡易性と柔軟性は、より正確な方法の簡易性及び柔軟性よりも優れており、その原理を広範囲のタスクに適用できる。本方法は、データが蓄積され続ける状況に特に適している。
図6は、実施形態に係る、ランダムな指標付けを用いて将来のコンテキストを決定する方法のフロー図を示す。段階610において、一般的なワード、インターネットアドレス(またはそれらのワード)、センサ状態(暑い、寒い、午前中、午後及び家)、及び、ブランド名やユーザの電話帳の名前のような他の特別なワードから語彙を形成する。図4bで説明したように、段階615で、ランダムな指標付けベクトルを訓練コンテキストに割り当て、段階620で、(図4aと同様に)これらを用いてタグ/ベクトルについてのRIベクトル(疎ベクトル)のコードブックを形成する。
段階625で、コンテキストタグの第1セット及びコンテキストタグの第2セットを形成する。図3に示すように、第1セットが第1期間のコンテキストを記述するタグを含み、第2セットが第2期間のコンテキストを記述するタグを含むように、第1セット及び第2セットは、システムのコンテキストに対応する。第1期間は第2期間と異なる、及び/または、タグがシステムのコンテキストの異なる期間を記述するように選択されている。システムのコンテキストが異なるように、規則的または不規則なタイムインスタンスで決定され、コンテキストは、各タイムインスタンスにおいて、ワードによって記述される。これらのワードは、その後収集され、重複するものが取り除かれ、及び/または、前に示したように、重み付けが行われてもよい。
段階630で、第1セットからの第1導出ランダム指標ベクトル及び第2セットからの第2導出ランダム指標ベクトルを、例えば、図5に示す方法で重み付けにより形成する。すなわち、タグの各セットを用いて導出コンテキストまたは予測コンテキスト、または、それらを示す情報を導出する。例えば、ランダム指標ベクトル(タグセット疎ベクトル)が、タグ(ワード)のランダム指標ベクトルから、タグのセットごとに、例えば、合計することによって算出される。段階635で、図5で説明したように、第1及び第2導出コンテキストを決定し、RIベクトル(図5のRI1、RI2及びRI3)を形成する。
段階640で、第1導出コンテキストと第2導出コンテキストとの差を決定する。この決定は、例えば、図5で説明したように、導出コンテキストのランダム指標ベクトルを用いて距離を算出することによって行われる。言い換えると、距離の算出において、まず、タグの各セットのランダム指標ベクトルを用いて各コンテキストを決定し、その後、コンテキスト(または、それらのランダム指標ベクトル)間の距離(例えば、ユークリッドまたはドット積)を算出する。
段階645で、差に基づいてコンテキストが変更されたかを判定する。タグの第1セットは、より長い期間にわたって、例えば、現時点よりもさらに遡って、コンテキストを表し、タグの第2セットは、現時点に近い短い期間にわたってコンテキストを表す。このように、タグの第2セットに基づく導出コンテキストは、タグの第1セットに基づく導出コンテキストよりも速くコンテキストの変更を反映する。別々のセットから形成されたコンテキストが異なっている、または、離れている場合、コンテキストが変更されたと決定される。
段階650で、コンテキストが変更されたと決定されると、システムを制御する。例えば、アプリケーション及びそれらの状態を変更する、または、決定されたコンテキストの変更によって情報処理を制御する。コンテキストの変更に基づいて、段階655で、異なる関連情報をユーザに表示する。例として、屋内で仕事をしている状態からバスに乗るためにバス停に向かって屋外を歩いている状態にコンテキストが変更したと決定された場合、システムのアプリケーションを変更し、仕事中は、電子メールアプリケーションを表示し、コンテキストが変更されると、バスの時刻表を表示するようにブラウザを立ち上げ、及び/または、ナビゲーションアプリケーションがバス停までの距離及び案内とともに町の地図を示すようにしてもよい。
本発明の様々な実施形態は、メモリにあるコンピュータプログラムコードの助けによって実施可能であり、コンピュータプログラムコードは、関連装置に本発明を実行させる。例えば、端末装置は、データを処理及び送受信する回路及び電子機器、メモリにあるコンピュータプログラムコード、及び、当該コンピュータプログラムコードを実行すると、当該端末装置に実施形態の特徴を実行させる処理装置を備える。さらに、ネットワーク装置は、データを処理及び送受信する回路及び電子機器、メモリにあるコンピュータプログラムコード、及び、当該コンピュータプログラムコードを実行すると、当該ネットワーク装置に実施形態の特徴を実行させる処理装置を備える。データ構造は、当該データ構造がコンピュータを制御するコンピュータプログラムとともにコンピュータで用いられる場合、当該コンピュータプログラム及びコンピュータに、データ構造及び内在するデータに従って動作させるように形成される。
本発明は、上述した実施形態に限定されることはなく、添付の請求の範囲の範囲内で変更可能であることは明らかである。

Claims (50)

  1. コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと、
    前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと、
    前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと、
    前記差に基づいて、コンテキストが変更されたかを判定することと、
    コンテキストが変更されたと判定されることに応じて前記システムを制御することと、
    を含む、方法。
  2. 請求項1に記載の方法であって、前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む、方法。
  3. 請求項1または2に記載の方法であって、前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む、方法。
  4. 請求項1、2または3に記載の方法であって、
    前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成することと、
    前記コードブックを用いて前記第1セットから第1コンテキスト疎ベクトルを形成し、前記第2セットから第2コンテキスト疎ベクトルを形成することと、
    前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定することと、
    を含む、方法。
  5. 請求項4に記載の方法であって、前記コードブックを形成することは、
    タグを含むドキュメントについてランダム疎ベクトルを形成することと、
    前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加することと、
    複数のタグに対して前記寄与の付加を繰り返すことと、
    を含む、方法。
  6. 請求項4または5に記載の方法であって、さらに、
    前記第1コンテキスト疎ベクトルと第2コンテキスト疎ベクトルとの距離を算出して前記差を決定すること、を含む、方法。
  7. 請求項4、5または6に記載の方法であって、さらに、
    前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定することと、
    前記コードブックを用いて、前記第2コンテキスト疎ベクトルから第2コンテキストを決定することと、
    前記決定された第1コンテキストと、前記決定された第2コンテキストとの距離を算出して前記差を決定することと、を含む、方法。
  8. 請求項6または7に記載の方法であって、
    前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離のグループから選択される少なくとも1つの距離測度を用いて算出される、方法。
  9. 請求項1から8のいずれかに記載の方法であって、
    前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態のグループからのワードを含む、方法。
  10. 請求項1から9のいずれかに記載の方法であって、
    タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される、方法。
  11. 請求項10に記載の方法であって、
    前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値のグループのうち少なくとも1つに基づく、方法。
  12. 請求項1から11のいずれかに記載の方法であって、
    前記制御することは、前記コンテキストの変更に基づいてアプリケーション状態を設定することを含む、方法。
  13. 請求項1から12のいずれかに記載の方法であって、前記制御することは、
    ソーシャルメディア・アクティビティ・コンテキストを決定することと、
    前記ソーシャルメディア・アクティビティ・コンテキストに応じて前記ユーザに関連情報を提示することと、
    を含む、方法。
  14. 少なくとも1つの処理装置と、1つ以上のプログラムユニットのためのコンピュータプログラムコードを含む少なくとも1つのメモリと、を含む装置であって、前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、前記処理装置により、前記装置に、少なくとも、
    コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々装置のコンテキストに対応すると共に、前記装置のコンテキストの異なる期間にそれぞれ対応する、前記形成することと、
    前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと、
    前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を判定することと、
    前記差に基づいて、コンテキストが変更されたかを判定することと、
    コンテキストが変更されたと判定されることに応じて前記装置を制御することと、
    を行わせるように構成される、装置。
  15. 請求項14に記載の装置であって、
    前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む、装置。
  16. 請求項14または15に記載の装置であって、
    前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む、装置。
  17. 請求項14から16のいずれかに記載の装置であって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成させ、
    前記コードブックを用いて、前記第1セットから第1コンテキスト疎ベクトルを形成させ、
    前記第2セットから第2コンテキスト疎ベクトルを形成させ、
    前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定させるように構成される、装置。
  18. 請求項17に記載の装置であって、さらに、前記コードブックを形成するためのコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    タグを含むドキュメントに対してランダムな疎ベクトルを形成させ、
    前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加させ、
    複数のタグに対して前記寄与の付加を繰り返させるように構成される、装置。
  19. 請求項17または18に記載の装置であって、さらにコンピュータプログラムコードを含み、前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    前記第1コンテキスト疎ベクトルと前記第2コンテキスト疎ベクトルとの距離を算出させて前記差を決定させるように構成される、装置。
  20. 請求項17から19のいずれかに記載の装置であって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定させ、
    前記コードブックを用いて前記第2コンテキスト疎ベクトルから第2コンテキストを決定させ、
    前記決定された第1コンテキスト及び前記決定された第2コンテキストとの距離を算出させて前記差を決定させるように構成される、装置。
  21. 請求項19または20に記載の装置であって、前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離のグループから選択される少なくとも1つの距離測度を用いて算出される、装置。
  22. 請求項14から21のいずれかに記載の装置であって、前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態のグループからのワードを含む、装置。
  23. 請求項14から22のいずれかに記載の装置であって、タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される、装置。
  24. 請求項23に記載の装置であって、前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値のグループのうち少なくとも1つに基づく、装置。
  25. 請求項14から24のいずれかに記載の装置であって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    前記コンテキストの変更に基づいて、アプリケーション状態を設定させるように構成される、装置。
  26. 請求項14から25のいずれかに記載の装置であって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記装置に、少なくとも、
    ソーシャルメディア・アクティビティ・コンテキストを決定させ、
    前記ソーシャルメディア・アクティビティ・コンテキストに応じて、前記ユーザに関連情報を提示させるように構成される、装置。
  27. 少なくとも1つの処理装置と、1つ以上のプログラムユニットのためのコンピュータプログラムを含む少なくとも1つのメモリと、を含むシステムであって、
    前記少なくとも1つのメモリ及び前記コンピュータプログラムコードは、前記処理装置により、前記システムに、少なくとも、
    コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと、
    前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと、
    前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと、
    前記差に基づいて、コンテキストが変更されたかを判定することと、
    コンテキストが変更されたと判定されることに応じて前記システムを制御することと、
    を行わせるように構成される、システム。
  28. 請求項27に記載のシステムであって、前記第1導出コンテキストデータが前記第2導出コンテキストデータよりも前のタイムインスタンスに少なくとも一部対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも前のタイムインスタンスに対応する少なくとも1つのコンテキストタグを含む、システム。
  29. 請求項27または28に記載のシステムであって、前記第1導出コンテキストデータが前記第2導出コンテキストタグよりも長い期間に対応するように、前記第1セットが、前記第2セットのコンテキストタグよりも長い期間に対応するコンテキストタグを含む、システム。
  30. 請求項27から29のいずれかに記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、少なくとも、
    前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成させ、
    前記コードブックを用いて、前記第1セットから第1コンテキスト疎ベクトルを形成させ、前記第2セットから第2コンテキスト疎ベクトルを形成させ、
    前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定させる、
    ように構成される、システム。
  31. 請求項30に記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、少なくとも、
    タグを含むドキュメントに対してランダムな疎ベクトルを形成させ、
    前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加させ、
    複数のタグに対して前記寄与の付加を繰り返させる、
    ように構成される、システム。
  32. 請求項30または31に記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、少なくとも、
    前記第1コンテキスト疎ベクトルと前記第2コンテキスト疎ベクトルとの距離を算出させて前記差を決定させるように構成される、システム。
  33. 請求項30から32のいずれかに記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、少なくとも、
    前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定させ、
    前記コードブックを用いて前記第2コンテキスト疎ベクトルから第2コンテキストを決定させ、
    前記決定された第1コンテキスト及び前記決定された第2コンテキストとの距離を算出させて前記差を決定させる、
    ように構成される、システム。
  34. 請求項32または33に記載のシステムであって、前記距離は、ユークリッド距離、水平移動距離、ドット積及びハウスドルフ距離のグループから選択される少なくとも1つの距離測度を用いて算出される、システム。
  35. 請求項27から34のいずれかに記載のシステムであって、前記タグは、一般的なワード、ブランド名、インターネットアドレスのワード、及び、センサまたはアプリケーションからの状態であってワードに形成される状態のグループからのワードを含む、システム。
  36. 請求項27から35のいずれかに記載のシステムであって、タグのセットの少なくとも1つは、対応するコンテキスト情報に重み付けを行うことによって形成または使用される、システム。
  37. 請求項36に記載のシステムであって、前記重み付けは、時間、タイムインスタンスで前記タグに関連付けられたコンテキストの種類、及び、タイムインスタンスで前記タグに関連付けられたコンテキストに関連する期待値のグループのうち少なくとも1つに基づく、システム。
  38. 請求項27から37のいずれかに記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、少なくとも、
    前記コンテキストの変更に基づいて、アプリケーション状態を設定させるように構成される、システム。
  39. 請求項27から38のいずれかに記載のシステムであって、さらにコンピュータプログラムコードを含み、
    前記コンピュータプログラムコードは、前記少なくとも1つの処理装置により、前記システムに、ソーシャルメディア・アクティビティ・コンテキストを決定させ、
    前記ソーシャルメディア・アクティビティ・コンテキストに応じて、前記ユーザに関連情報を提示させる、
    ように構成される、システム。
  40. 1つ以上の命令の1つ以上のシーケンスを含むコンピュータプログラム製品であって、当該命令は、1つ以上の処理装置によって実行されると、システムに、請求項1から13のいずれかに記載の方法を行わせる、コンピュータプログラム製品。
  41. 1つ以上の命令の1つ以上のシーケンスを含みコンピュータプログラム製品であって、当該命令は、1つ以上の処理装置によって実行されると、システムに、少なくとも、
    コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成することであって、前記第1セット及び前記第2セットは、各々システムのコンテキストに対応すると共に、前記システムのコンテキストの異なる期間にそれぞれ対応する、前記形成することと、
    前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出することと、
    前記第1導出コンテキストデータと前記第2導出コンテキストデータとの差を決定することと、
    前記差に基づいて、コンテキストが変更されたかを判定することと、
    コンテキストが変更されたと判定されることに応じて前記システムを制御することと、
    を行わせる、コンピュータプログラム製品。
  42. コンテキストタグの第1セット、及び、コンテキストタグの第2セットを形成する手段であって、前記第1セット及び前記第2セットは、各々装置のコンテキストに対応すると共に、前記装置のコンテキストの異なる期間にそれぞれ対応する、前記形成する手段と、
    前記第1セットから第1導出コンテキストデータを導出し、前記第2セットから第2導出コンテキストデータを導出する手段と、
    前記第1導出コンテキストデータと前記第2コンテキストデータとの差を決定する手段と、
    前記差に基づいてコンテキストが変更されたかを判定する手段と、
    コンテキストが変更されたと判定されると、前記装置を制御する手段と、
    を有する、装置。
  43. 請求項42に記載の装置であって、さらに、
    前記コンテキストタグに対応する疎ベクトルのコードブックであって、前記疎ベクトルの非ゼロ要素の数に対して高次元を有する疎ベクトルのコードブックを形成する手段と、
    前記コードブックを用いて前記第1セットから第1コンテキスト疎ベクトルを形成し、前記第2セットから第2コンテキスト疎ベクトルを形成する手段と、
    前記第1及び第2コンテキスト疎ベクトルを用いて前記差を決定する手段と、
    を有する、装置。
  44. 請求項43に記載の装置であって、さらに、
    タグを含むドキュメントに対してランダム疎ベクトルを形成する手段と、
    前記タグが存在するドキュメントについて前記疎ベクトルからタグのコードブックベクトルに寄与を付加する手段と、
    複数のタグに対して前記寄与の付加を繰り返す手段と、
    を有する、装置。
  45. 請求項43または44に記載の装置であって、さらに、
    前記第1コンテキスト疎ベクトルと第2コンテキスト疎ベクトルとの距離を算出して前記差を決定する手段を有する、装置。
  46. 請求項43から45のいずれかに記載の装置であって、さらに、
    前記コードブックを用いて前記第1コンテキスト疎ベクトルから第1コンテキストを決定する手段と、
    前記コードブックを用いて、前記第2コンテキスト疎ベクトルから第2コンテキストを決定する手段と、
    前記決定された第1コンテキストと、前記決定された第2コンテキストとの距離を算出して前記差を決定する手段と、
    を有する、装置。
  47. 請求項42から46のいずれかに記載の装置であって、さらに、
    前記コンテキストの変更に基づいて、アプリケーション状態を設定する手段を有する、装置。
  48. 請求項14から25のいずれかに記載の装置であって、さらに、
    ソーシャルメディア・アクティビティ・コンテキストを決定する手段と、
    前記ソーシャルメディア・アクティビティ・コンテキストに応じて前記ユーザに関連情報を提示する手段と、
    を有する、装置。
  49. コンピュータシステムの動作を制御するデータ構造であって、前記データ構造は、用語に関連付けられた高次元疎ベクトルを含み、前記用語は、一般的なワード、インターネットアドレスのワード、ブランド名、ユーザ電話帳名およびセンサ値のワードのグループから選択される少なくとも3種類のワードを含む、データ構造。
  50. コンテキストの変更を決定するシステムにおいて、ハードウェアセンサ状態を示す人間の言葉のワードの使用。
JP2014558171A 2012-02-22 2012-02-22 コンテキストを決定するシステムおよび方法 Expired - Fee Related JP5944535B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI2012/050180 WO2013124521A1 (en) 2012-02-22 2012-02-22 A system and a method for determining context

Publications (2)

Publication Number Publication Date
JP2015508209A true JP2015508209A (ja) 2015-03-16
JP5944535B2 JP5944535B2 (ja) 2016-07-05

Family

ID=49005056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014558171A Expired - Fee Related JP5944535B2 (ja) 2012-02-22 2012-02-22 コンテキストを決定するシステムおよび方法

Country Status (5)

Country Link
US (1) US10108701B2 (ja)
EP (1) EP2817735B1 (ja)
JP (1) JP5944535B2 (ja)
CN (1) CN104246748B (ja)
WO (1) WO2013124521A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2817737A4 (en) * 2012-02-22 2015-10-07 Nokia Technologies Oy ADAPTIVE SYSTEM
EP3106973A1 (en) * 2015-06-16 2016-12-21 Huawei Technologies Co., Ltd. Context-driven adaptive application launcher grid user interface based on random index predictor for mobile devices
US9622177B2 (en) * 2015-08-06 2017-04-11 Qualcomm Incorporated Context aware system with multiple power consumption modes
CN107193832A (zh) * 2016-03-15 2017-09-22 北京京东尚科信息技术有限公司 相似度挖掘方法及装置
US9805371B1 (en) 2016-07-08 2017-10-31 Asapp, Inc. Automatically suggesting responses to a received message
US10083451B2 (en) 2016-07-08 2018-09-25 Asapp, Inc. Using semantic processing for customer support
US10109275B2 (en) 2016-12-19 2018-10-23 Asapp, Inc. Word hash language model
GB201706047D0 (en) * 2017-04-14 2017-05-31 Digital Genius Ltd Automated tagging of text
US10572826B2 (en) * 2017-04-18 2020-02-25 International Business Machines Corporation Scalable ground truth disambiguation
US20190122140A1 (en) * 2017-10-20 2019-04-25 STATGRAF Research LLP. Data analysis and rendering
US10497004B2 (en) 2017-12-08 2019-12-03 Asapp, Inc. Automating communications using an intent classifier
US10489792B2 (en) 2018-01-05 2019-11-26 Asapp, Inc. Maintaining quality of customer support messages
US10169315B1 (en) * 2018-04-27 2019-01-01 Asapp, Inc. Removing personal information from text using a neural network
US11226990B2 (en) * 2018-07-20 2022-01-18 Ionir Systems Ltd. System and method for operating a digital storage system
US11216510B2 (en) 2018-08-03 2022-01-04 Asapp, Inc. Processing an incomplete message with a neural network to generate suggested messages
US10747957B2 (en) 2018-11-13 2020-08-18 Asapp, Inc. Processing communications using a prototype classifier
US11551004B2 (en) 2018-11-13 2023-01-10 Asapp, Inc. Intent discovery with a prototype classifier
US11425064B2 (en) 2019-10-25 2022-08-23 Asapp, Inc. Customized message suggestion with user embedding vectors
US11900110B2 (en) * 2021-03-19 2024-02-13 Prosper Funding LLC Increasing user interaction with deep learning agent

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001324335A (ja) * 2000-05-15 2001-11-22 Kenwood Corp 車載用ナビゲーション装置及び車載用オーディオ装置の再生方法
WO2006075512A1 (ja) * 2005-01-13 2006-07-20 Matsushita Electric Industrial Co., Ltd. 情報通知制御装置、情報通知方式、およびプログラム
JP2006302194A (ja) * 2005-04-25 2006-11-02 Brother Ind Ltd コンテンツ出力システム、及び、プログラム
US20070239813A1 (en) * 2006-04-11 2007-10-11 Motorola, Inc. Method and system of utilizing a context vector and method and system of utilizing a context vector and database for location applications
JP2010067175A (ja) * 2008-09-12 2010-03-25 Toshiba Corp ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
JP2011227758A (ja) * 2010-04-21 2011-11-10 Sony Corp 情報処理装置、情報処理方法及びプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6912386B1 (en) 2001-11-13 2005-06-28 Nokia Corporation Method for controlling operation of a mobile device by detecting usage situations
US7720675B2 (en) * 2003-10-27 2010-05-18 Educational Testing Service Method and system for determining text coherence
US7881708B2 (en) 2004-12-27 2011-02-01 Nokia Corporation Mobile terminal, and an associated method, with means for modifying a behavior pattern of a multi-medial user interface
US8275399B2 (en) 2005-09-21 2012-09-25 Buckyball Mobile Inc. Dynamic context-data tag cloud
US20100005087A1 (en) * 2008-07-01 2010-01-07 Stephen Basco Facilitating collaborative searching using semantic contexts associated with information
US20110044447A1 (en) * 2009-08-21 2011-02-24 Nexidia Inc. Trend discovery in audio signals
GB201003628D0 (en) * 2010-03-04 2010-04-21 Touchtype Ltd System and method for inputting text into electronic devices
EP2589257A4 (en) 2010-06-30 2014-01-15 Nokia Corp METHODS AND APPARATUSES FOR CONTROLLING SENSOR SOLICITATION
US8516205B2 (en) 2010-10-29 2013-08-20 Nokia Corporation Method and apparatus for providing efficient context classification
US8719257B2 (en) * 2011-02-16 2014-05-06 Symantec Corporation Methods and systems for automatically generating semantic/concept searches
WO2012123621A1 (en) * 2011-03-16 2012-09-20 Nokia Corporation Method, device and system for user interface adaptation
US8620764B2 (en) * 2011-05-09 2013-12-31 Telefonaktiebolaget L M Ericsson (Publ) Method for providing a recommendation such as a personalized recommendation, recommender system, and computer program product comprising a recommender computer program
US9582755B2 (en) * 2012-05-07 2017-02-28 Qualcomm Incorporated Aggregate context inferences using multiple context streams
US9646605B2 (en) * 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001324335A (ja) * 2000-05-15 2001-11-22 Kenwood Corp 車載用ナビゲーション装置及び車載用オーディオ装置の再生方法
WO2006075512A1 (ja) * 2005-01-13 2006-07-20 Matsushita Electric Industrial Co., Ltd. 情報通知制御装置、情報通知方式、およびプログラム
US20070197195A1 (en) * 2005-01-13 2007-08-23 Keiji Sugiyama Information notification controller, information notification system, and program
JP2006302194A (ja) * 2005-04-25 2006-11-02 Brother Ind Ltd コンテンツ出力システム、及び、プログラム
US20070239813A1 (en) * 2006-04-11 2007-10-11 Motorola, Inc. Method and system of utilizing a context vector and method and system of utilizing a context vector and database for location applications
JP2010067175A (ja) * 2008-09-12 2010-03-25 Toshiba Corp ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
JP2011227758A (ja) * 2010-04-21 2011-11-10 Sony Corp 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
US10108701B2 (en) 2018-10-23
CN104246748A (zh) 2014-12-24
JP5944535B2 (ja) 2016-07-05
WO2013124521A1 (en) 2013-08-29
EP2817735B1 (en) 2022-03-30
US20150154285A1 (en) 2015-06-04
CN104246748B (zh) 2018-02-09
EP2817735A1 (en) 2014-12-31
EP2817735A4 (en) 2016-03-02

Similar Documents

Publication Publication Date Title
JP5944535B2 (ja) コンテキストを決定するシステムおよび方法
CN106462608B (zh) 改进语言模型的知识源个性化
KR102189854B1 (ko) 개인적 엔티티들을 모델링
JP5870217B2 (ja) 適応システム
JP5890539B2 (ja) 予測に基づくサービスへのアクセス
JP2021108183A (ja) 意図推薦方法、装置、機器及び記憶媒体
CN106845644B (zh) 一种通过相互关系学习用户及移动应用的联系的异构网络
KR101656819B1 (ko) 특징-추출-기반 이미지 점수화
May Petry et al. MARC: a robust method for multiple-aspect trajectory classification via space, time, and semantic embeddings
Bao et al. A BiLSTM-CNN model for predicting users’ next locations based on geotagged social media
US20190079946A1 (en) Intelligent file recommendation
CN110956253A (zh) 针对头衔标准化的与语言无关的机器学习模型
CN111432347B (zh) 信息处理方法、装置、存储介质及电子设备
CN111512617A (zh) 推荐联系人信息的装置和方法
CN111814475A (zh) 用户画像构建方法、装置、存储介质和电子设备
KR20140027011A (ko) 친구 추천 방법 및 이를 위한 서버 및 단말
KR20190075277A (ko) 콘텐트 검색을 위한 방법 및 그 전자 장치
CN111796925A (zh) 算法模型的筛选方法、装置、存储介质和电子设备
TW202301080A (zh) 輔助系統的多裝置調解
US20160371598A1 (en) Unified attractiveness prediction framework based on content impact factor
Tran et al. Towards multi-resident activity monitoring with smarter safer home platform
US11314793B2 (en) Query processing
US11488039B2 (en) Unified intent understanding for deep personalization
Christopoulou et al. CLIO: context supporting collective city memory
Maggiore et al. Smarter smartphones: understanding and predicting user habits from GPS sensor data

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151002

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20151112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160525

R150 Certificate of patent or registration of utility model

Ref document number: 5944535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees