JP5150341B2 - データ作成装置及び方法 - Google Patents

データ作成装置及び方法

Info

Publication number
JP5150341B2
JP5150341B2 JP2008102444A JP2008102444A JP5150341B2 JP 5150341 B2 JP5150341 B2 JP 5150341B2 JP 2008102444 A JP2008102444 A JP 2008102444A JP 2008102444 A JP2008102444 A JP 2008102444A JP 5150341 B2 JP5150341 B2 JP 5150341B2
Authority
JP
Japan
Prior art keywords
behavior
action
class
data
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008102444A
Other languages
English (en)
Other versions
JP2009252145A (ja
Inventor
隆浩 川村
智弘 山崎
伸一 長野
祐美子 下郡
貴之 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008102444A priority Critical patent/JP5150341B2/ja
Priority to US12/419,777 priority patent/US8055658B2/en
Publication of JP2009252145A publication Critical patent/JP2009252145A/ja
Priority to US13/274,439 priority patent/US8589390B2/en
Application granted granted Critical
Publication of JP5150341B2 publication Critical patent/JP5150341B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ネットワークを介してアクセス可能な文書からユーザの行動の記録を抽出し、当該記録に基づいて、関連行動を提示するための行動マップデータを作成するデータ作成装置及び方法に関する。
従来より、例えば、「情報大航海プロジェクト」の1つとして、「マイ・ライフ・アシストサービス」などのライフログ系の研究がなされている(例えば、特許文献1参照)。この研究では、携帯電話やRFIDや各種センサーを活用して、ユーザの行動の記録から何らかの規則性を発見する試みが行われている。そして、発見された規則性に基づいて、ユーザの現在の行動(コンテキスト)やユーザが閲覧しているWebページや動画などのコンテンツに関連する行動(関連行動)を、推薦する行動として提示している。
特開2005−71026号公報
しかし、特許文献1の技術のように、ユーザ個人の行動の記録のみに基づいて関連行動を提示する場合、その行動はそのユーザにとって意外性がない恐れがある。また、関連行動を提示するために他人の行動の記録を用いる場合、セキュリティやプライバシーなどの観点から問題があり得る。
本発明は、ユーザの現在の行動に関連する関連行動を提示する場合、セキュリティを確保してプライバシーを保護しつつ、ユーザにとって意外性のある行動を提示可能なデータ作成装置及び方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、データ作成装置であって、ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出手段と、行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換手段と、変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成手段とを備えることを特徴とする。
また、本発明は、抽出手段と、変換手段と、データ作成手段とを備えるデータ作成装置で実現されるデータ作成方法であって、前記抽出手段が、ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出ステップと、前記変換手段が、行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換ステップと、前記データ作成手段が、変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成ステップとを含むことを特徴とする。
本発明によれば、ユーザの現在の行動に関連する関連行動を提示する場合、セキュリティを確保してプライバシーを保護しつつ、ユーザにとって意外性のある行動を提示可能である。
以下に添付図面を参照して、この発明にかかるデータ作成装置及び方法の最良な実施の形態を詳細に説明する。
(1)構成
本実施の形態のデータ作成装置100は、装置全体を制御するCPU(Central Processing Unit)等の制御装置と、各種データや各種プログラムを記憶するROM(Read Only Memory)やRAM(Random Access Memory)等の記憶装置と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶装置と、これらを接続するバスとを備えており、通常のコンピュータを利用したハードウェア構成となっている。また、データ作成装置100には、情報を表示する表示装置と、ユーザの指示入力を受け付けるキーボードやマウス等の入力装置と、外部装置の通信を制御する通信I/F(interface)とが有線又は無線により各々接続される。
次に、このようなハードウェア構成において、CPUが記憶装置や外部記憶装置に記憶された各種プログラムを実行することによりデータ作成装置100において実現される各種機能について説明する。尚、記憶装置や外部記憶装置に記憶される各種プログラムは、プログラムコードのみならず、プログラムコードの実行時に用いる各種データも含む。図1は、データ作成装置100の機能的構成を例示する図である。データ作成装置100は、行動メタデータ抽出部101と、行動マップ作成部102と、行動マップ記憶部103と、行動リンク重み付け部104と、関連行動選択部105とを有する。これらのうち、行動メタデータ抽出部101と、行動マップ作成部102と、行動リンク重み付け部104と、関連行動選択部105とは、CPUのプログラム実行時にRAMなどの記憶装置上に生成されるものである。行動マップ記憶部103は、例えば、外部記憶装置に記憶されるものである。また、図示しないが、外部記憶装置には、後述する行動オントロジー及び商品オントロジーが記憶されている。
行動メタデータ抽出部101には、あるトピックに関して、ネットワークを介してアクセス可能な文書として収集された複数のWebページが入力される。ここで対象となるWebページは、例えば、ブログやSNSといったCGM(Consumer Generated Media)などである。ネットワークは、例えば、LAN(Local Area Network)、イントラネット、イーサネット(登録商標)又はインターネットなどである。トピックとは、例えば、商品の名称や、人名や、話題などである。トピックに関するWebページの収集は、例えば、トピックをキーワードとして検索するキーワード型検索エンジンにより行われる。具体的には、例えば、「ハリー」というトピックに関し、これをキーワードとして含むWebページがキーワード型検索エンジンにより収集される。このようにして収集されたWebページが行動メタデータ抽出部101に入力されると、行動メタデータ抽出部101は、当該Webページから行動メタデータを抽出する。具体的には、行動メタデータ抽出部101は、各Webページに記載されている文章から、当該トピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現のリストを行動メタデータとして抽出する。言語表現とは、ターム(term)であり、主語、目的語、補語、及び述語のうち少なくとも1つになるものである。行動についてのタームとは、例えば、「見る」「借りる」「購入する」などであり、主に、述語に相当する。例えば、Webページに記載された「ハリーのDVDが発売日だったってこと今日なんか気が付いて、仕事終わってから、○×屋とか行って借りてきた」という文では、「ハリー」,「DVD」,「○×屋」,「借りてきた」という各タームについて、主語、目的語、補語及び述語という係り受け関係がある。このため、行動メタデータ抽出部101は、当該Webページから「ハリー,DVD,○×屋、借りてきた」という行動メタデータを抽出する。尚、基本的には、行動メタデータは文単位で抽出されるが、行動についてのタームとして述語を少なくとも含んでいれば良い。
行動マップ作成部102は、以下に説明する行動オントロジー及び商品オントロジーを参照して、行動メタデータ抽出部101が抽出した各行動メタデータに含まれる各タームをクラスに各々変換して、当該各クラスをノードとして各々表すと共に、クラス間の係り受け関係をノード間のリンクとして表す行動マップデータをトピック毎に作成する。
図2は、行動オントロジーのデータ構成を例示する図である。行動オントロジーとは、行動表現をインスタンスとし、このインスタンスの概念をクラスとしてグラフにより表現したものである。同図においては、「do」というクラスに対して、「outer act(外的行動)」及び「inner act(内的行動)」の2つのクラスがあり、各クラスに対して更に各クラスが存在している。例えば、「outer act(外的行動)」には、「vision」、「買う」及び「行く」などの各クラスが存在し、「vision」には、更に、「見る」及び「録画する」などの各クラスが存在する。また、「inner act(内的行動)」には、「考える」、「好き」及び「計画する」などの各クラスが存在する。クラス間の関係は、上下関係であったり、前後関係であったり、並列関係であったり、一対一の関係であったり、一対多の関係であったりするが、ここではその関係は特に限定されない。また、「見る」、「買う」、「行く」、「考える」、「好き」及び「計画する」の各クラスには、その概念に収束される各行動表現であるインスタンスが存在する。例えば、「見る」というクラスには、「観る」、「みる」、「鑑賞する」などのインスタンスが存在する。即ち、「見る」という概念に収束される具体的な行動表現のバリエーションが、インスタンスとして存在する。
図3は、商品オントロジーのデータ構成を例示する図である。商品オントロジーとは、商品名や商品名の細目や物の名称をインスタンスとし、このインスタンスの概念をクラスとしてグラフにより表現したものである。同図においては、例えば映画についての商品オントロジーを示しており、「映画」というクラスに対して、「洋画」及び「邦画」の2つのクラスが存在する。「洋画」というクラスに対して、例えば、映画名として「ハリー」、「ロード」及び「魔法使い」などの各クラスが存在する。そして、例えば、「ハリー」というクラスには、その映画の細目である「ハリー」、「謎」、「炎」及び「不死鳥」などのインスタンスが存在する。
その他、地名オントロジーが外部記憶装置に記憶されておりこれを用いても良い。地名オントロジーとは、地域名や場所名をインスタンスとし、これらの存在する地名をクラスとしてグラフにより表現したものである。図4は、地名オントロジーのデータ構成を例示する図である。同図においては、「世界」というクラスに対して、「外国」及び「日本」の2つのクラスが存在する。「日本」というクラスに対しては、例えば、「神奈川」、「東京」、「千葉」などの各クラスが存在する。また、「神奈川」というクラスには、「川崎」、「横浜」、「厨子」などの各クラスが存在する。そして、「川崎」というクラスには、「川崎」、「○○プラザ」、「××チーム」などのインスタンスが存在する。
尚、各オントロジーにおいて、各クラスの概念が近似するか否か、即ち、各クラスの概念が意味的に近いか否かが予め設定されており、意味的に近いほど位置が近くなるよう各クラスがグラフにおいて配置される。
行動マップ作成部102は、以上のような行動オントロジー及び商品オントロジーを少なくとも参照して、各行動メタデータに含まれる各タームついて、クラスに各々変換する。例えば、上述の「ハリー,DVD,○×屋、借りてきた」という行動メタデータに含まれる各タームについては、行動マップ作成部102は、左から順に、「ハリー」、「DVD」、「レンタル店」、「見る」という各クラスに変換する。そして、行動マップ作成部102は、これらの各クラスをノードとして各々表すと共に、「ハリー」に対して「DVD」と「レンタル店」が繋がり、「DVD」と「レンタル店」が繋がり、「DVD」と「レンタル店」とに対して「借りる」が繋がるというクラス間の係り受け関係をノード間のリンクとして表す行動マップデータを作成する。
図5は、行動マップデータのデータ構成を概念的に示す図である。同図に示される行動マップデータは、トピック「ハリー」に関するものである。同図においては、主語、目的語及び補語として、商品オントロジーに存在する各クラスがノードとして表され、述語として、行動オントロジーに存在する各クラスが、その言語表現によりノードとして表される。そして、クラス間の係り受け関係が、ノード間のリンクとして矢印により表されている。尚、ノード間のリンクは、上下関係であったり、前後関係であったり、並列関係であったり、一対一の関係であったり、一対多の関係であったりするが、ここではその関係は特に限定されない。
行動リンク重み付け部104は、行動マップ作成部102が作成した行動マップデータについて、クラス間の係り受け関係の出現回数に基づいて、リンクに対して重み係数を設定する。例えば、以下の4つの行動メタデータがあるとする。
行動メタデータ1「ハリー,DVD,借りてきた」
行動メタデータ2「ハリー君,DVD,観た」
行動メタデータ3「ロード,DVD,鑑賞した」
行動メタデータ4「ロード,DVD,録画した」
これらに含まれる各タームは、例えば以下のように各クラスに変換される。
行動メタデータ1「ハリー,DVD,借りる」
行動メタデータ2「ハリー,DVD,見る」
行動メタデータ3「ロード,DVD,見る」
行動メタデータ4「ロード,DVD,録画する」
この場合、行動リンク重み付け部104は、各タームから変換された各クラスについてクラス間の係り受け関係の出現回数から、「ハリー」と「DVD」との間のリンク及び「DVD」と「見る」との間のリンクについて、重み係数を各々2倍にする。この重み係数の値は、リンクと対応付けられて行動マップデータにおいて記憶される。
また、行動リンク重み付け部104は、行動メタデータの出現順序に基づいて、リンクに対して重み係数を設定する。行動メタデータの出現順序とは、同一のWebページ内に記載された文章から抽出された複数の行動メタデータについてその元になる文の記載順のことである。例えば、上述の行動メタデータ1と行動メタデータ2とが同一のWebページ内にその順に記載された文から抽出されたものである場合、行動リンク重み付け部104は、その順序から、行動メタデータ1を基にしたノード間のリンクの重み係数及び行動メタデータ2を基にしたノード間のリンクの重み係数を各々1.5倍にする。
更に、行動リンク重み付け部104は、各クラスの意味的な近さに基づいて、新たなリンクを作成する。例えば、行動メタデータ3に述語として含まれるタームが変換されたクラスである「見る」と、行動メタデータ4に述語として含まれるタームが変換されたクラスである「録画する」とは、行動オントロジーにおいて意味的に近いと予め設定されているものとする。この場合、行動リンク重み付け部104は、「見る」というクラスと、「録画する」というクラスとに繋がりがあるとしてリンクを新たに作成する。尚、リンクとしての前後関係は任意又は所定の方法により決定すれば良い。ここでは、行動リンク重み付け部104は、「録画する」というノードに対して「見る」というノードにリンクを新たに作成する。尚、行動リンク重み付け部104は、新たに作成したリンクに対して、更に重み係数を設定するようにしても良い。
行動リンク重み付け部104は、このようにリンクに重み係数を設定したりリンクを新たに作成したりすることにより更新した行動マップデータを行動マップ記憶部103に記憶する。図6は、更新された行動マップデータのデータ構成を概念的に示す図である。同図においては、例えば、「映画」というノードと「見る」というノードとを繋ぐ矢印が他の矢印より太く示されており、当該ノード間のリンクに重み係数が設定されていることが示されている。
関連行動選択部105には、ユーザ情報が入力される。尚、ユーザ情報とは、ユーザが現在閲覧しているWebページのトピックを示すトピック情報や、ユーザが現在行っている行動(現在行動という)を示す行動情報や、現在位置を示す位置情報や、それらの過去の履歴を示す履歴情報や、ユーザの年齢や性別などのプロフィール情報などである。位置情報は、例えば、GPS(Global Positioning System)により取得され得る。但し、位置情報を含め行動情報やプロフィール情報や履歴情報の取得方法は限定されず、これらが、任意の方法により取得され、例えば、通信I/Fを介して外部装置からデータ作成装置100に入力される。このようなユーザ情報が入力されると、関連行動選択部105は、当該ユーザ情報に基づいて、行動マップデータを検索し、検索の結果得られた行動マップデータにおいて、ユーザの現在行動に関連する行動(関連行動)を選択し、これを示す情報を関連行動情報として出力する。
具体的には、関連行動選択部105は、まず、ユーザ情報に含まれるトピック情報によって示されるトピックを検索キーとして行動マップデータを検索する。そして、関連行動選択部105は、検索の結果得られた行動マップデータにおいて、ユーザ情報に含まれる行動情報や位置情報や履歴情報やプロフィール情報に基づいて、現在行動に関連する行動(関連行動)を選択する。具体的には例えば、関連行動選択部105は、行動マップデータにおいて、リンクを辿り、当該現在行動の概念に相当するノードや現在位置に対応するノードを特定し、特定したノードに対するリンクのうち、所定値以上の重み係数が設定されたリンクに対する他方のノードを関連行動として選択する。尚、行動マップデータにおけるリンクの辿り方については特に限定されない。そして、関連行動選択部105は、関連行動を示す関連行動情報を出力する。
(2)動作
次に、本実施の形態にかかるデータ作成装置100の行う行動マップデータ作成処理の手順について図7を用いて説明する。データ作成装置100にあるトピックについて収集されたWebページが入力されると(ステップS1)、データ作成装置100は、各Webページから行動メタデータを抽出する(ステップS2)。次いで、データ作成装置100は、行動オントロジー及び商品オントロジーを参照して、ステップS1で抽出された各行動メタデータに含まれる各タームをクラスに各々変換して、当該各クラスをノードとして各々表すと共に、クラス間の係り受け関係をノード間のリンクとして表す行動マップデータをトピック毎に作成する(ステップS3)。ここで作成される行動マップデータのデータ構成の概念的なものは図5に示したとおりである。次いで、データ作成装置100は、ステップS3で作成した行動マップデータについて、係り受け関係のある2つ以上のクラスの出現回数や行動メタデータの出現順序に基づいて、リンクに対して重み係数を設定したり、各クラスの意味的な近さに基づいて、新たなリンクを作成したりする(ステップS4)。そして、データ作成装置100は、行動マップデータを、ステップS4でリンク重み係数を設定したり新たにリンクを作成したりすることにより更新した行動マップデータを行動マップ記憶部103に記憶する(ステップS5)。ここで更新された行動マップデータのデータ構成の概念的なものは図6に示したとおりである。
次いで、データ作成装置100が、行動マップ記憶部103に記憶された行動マップデータを用いて関連行動情報を出力する処理の手順について図8を用いて説明する。データ作成装置100にユーザ情報が入力されると(ステップS10)、データ作成装置100は、当該ユーザ情報に含まれるトピック情報によって示されるトピックを検索キーとして、行動マップ記憶部103に記憶された行動マップデータを検索する(ステップS11)。そして、データ作成装置100は、検索の結果得られた行動マップデータにおいて、ユーザ情報に含まれる、現在行動を示す行動情報に基づいて、当該現在行動に関連する行動(関連行動)を選択する(ステップS12)。そして、データ作成装置100は、当該関連行動を示す関連行動情報を出力する(ステップS13)。
例えば、トピック情報によって示されるトピックが「ハリー」であり、行動情報によって示される現在行動が「観る」ことであり、位置情報によって示される現在位置が「○×プラザ」であるとする。「○×プラザ」は、図4に例示した地名オントロジーにおいて「川崎」というクラスに相当するものとする。「観る」という概念に相当するクラスは「見る」である。この場合、「ハリー」というノードに対して「川崎」というノードが繋がり、「川崎」というノードに対して「見る」というノードが繋がることになる。この場合、例えば、図9に示されるような行動マップデータにおいて、各ノードと、ノード間のリンクとが特定できる。そして、同図に示されるように、ここで特定された「見る」というノードに対するリンクのうち、「寝る」というノードに対するリンクがあるとする。この場合、データ作成装置100は、「寝る」というノードを関連行動として選択する。即ち、「ハリーを○×プラザで見ている」と推測されるユーザに対して、それに関連する関連行動が選択されるのである。尚、データ作成装置100は、リンクに設定された重み係数が所定値以上である場合にのみ当該ノードを関連行動として選択するようにしても良い。そして、データ作成装置100は、「寝る」という関連行動を示す関連行動情報として、例えば、「そろそろ寝ますか?」などのメッセージを出力する。この関連行動情報をデータ作成装置100は、例えば、通信I/Fを介して携帯情報端末などの外部装置に出力するようにしても良いし、表示装置に出力するようにしても良い。
以上のようにして、データ作成装置100が、CGMなどユーザ自身のみならず不特定多数のユーザが記載したブログなどの複数のWebページから行動メタデータを抽出することにより、ノイズの少ないデータを抽出することができる。そして、この行動メタデータを用いてデータ作成装置100が行動マップデータを作成することにより、行動のルールなどを手動で登録する必要がなくなる。このため、システムの構築や保守にかかるコストを低減することができる。
また、商品オントロジーや行動オントロジーを参照して、行動メタデータを用いて、同一の概念に収束されるものをクラスとしてグループ化して行動マップデータを作成することにより、個人を特定する情報や秘匿されるべき情報を含むことなく行動マップデータを作成することができ、セキュリティを確保したりプライバシーを保護したりすることができる。また、以上のようにして行動マップデータを作成することにより、対象のトピックに相応する行動メタデータが存在していなくても、類似のトピックに基づいて関連行動を選択して、関連行動情報を出力することができる。これにより、例えば、対象のトピックがマイナーな話題などであり、Webページから十分な行動メタデータが得られない場合であっても、ユーザになんらかの関連行動を提示することができる。
また、行動マップデータにおいてリンクに重み係数を設定することで、リンクを辿ったりリンクの重み係数を参酌したりすることにより、規則性のある行動や関連行動を容易に検出することができる。従って、ユーザがしたいと思われる行動を効果的に選択して提示することができる。
また、Webページに記載されている文章における行動の連続性として、当該文章から抽出した行動メタデータの出現順序を考慮して、クラスとして表現される行動間の繋がりを表すリンクに重み係数を設定することで、役に立つがありがちな行動と、意外性のある行動とを識別可能にする。このため、前者の行動をユーザに提示することにより、実用性をユーザに提示することができると共に、後者の行動をユーザに提示することにより、面白さをユーザに提示することができる。
即ち、上述の実施の形態においては、リンクに設定された重み係数が所定値以上であるノードを関連行動として選択したが、逆に、リンクに設定された重み係数が所定値より小さいノード、即ち、関連性が弱い行動を選択することもできる。そして、この行動を示す情報を出力することにより、ユーザが少し意外に感じる行動を提示することができる。
尚、ユーザ個人に拠らない意外性のある行動の提示は、上述したようにユーザ自身のみならず不特定多数のユーザが記載したブログなどのWebページから行動メタデータを抽出することによっても実現される。
[変形例]
なお、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。また、以下に例示するような種々の変形が可能である。
上述した実施の形態において、データ作成装置100で実行される各種プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、当該各種プログラムを、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成しても良い。
上述した実施の形態においては、Webページを収集する方法や行動メタデータを抽出する方法は特に限定されない。
上述した実施の形態においては、トピックは、複数であっても良く、複数のトピック毎に行動メタデータを抽出したり、行動マップを作成したりしても良い。
上述した実施の形態においては、行動オントロジー及び商品オントロジーは上述したものに限らない。また、その他様々なものについての言語表現の概念をクラスとしクラス間の相互関係をグラフにより表現するオントロジーを用いて、行動マップデータを作成するようにしても良い。
上述した実施の形態においては、行動リンク重み付け部104は、新たに作成したリンクに対して、更に、重み係数を設定するようにしても良い。
上述した実施の形態において、データ作成装置100がステップS13で出力する関連行動情報は、関連行動自体を示すものに限らず、例えば、関連行動に関連する情報であっても良い。データ作成装置100は、例えば、上述の例において「寝る」という関連行動に関連する情報として、癒し系グッズや快眠グッズに関する情報を出力するようにしても良いし、当該情報を例えばWebページとして提供する情報提供サイトとなる外部装置へネットワークを介して接続するようにしても良い。
一実施の形態にかかるデータ作成装置100の機能的構成を例示する図である。 同実施の形態にかかる行動オントロジーのデータ構成を例示する図である。 同実施の形態にかかる商品オントロジーのデータ構成を例示する図である。 同実施の形態にかかる地名オントロジーのデータ構成を例示する図である。 同実施の形態にかかる行動マップデータのデータ構成を概念的に示す図である。 同実施の形態にかかる行動マップデータのデータ構成を概念的に示す図である。 同実施の形態にかかるデータ作成装置100の行う行動マップデータ作成処理の手順を示すフローチャートである。 同実施の形態にかかるデータ作成装置100が行動マップデータを用いて関連行動情報を出力する処理の手順を示すフローチャートである。 同実施の形態にかかる行動マップデータにおける関連行動について説明するための図である。
符号の説明
100 データ作成装置
101 行動メタデータ抽出部
102 行動マップ作成部
103 行動マップ記憶部
104 行動リンク重み付け部
105 関連行動選択部

Claims (10)

  1. ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出手段と、
    行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換手段と、
    変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成手段とを備える
    ことを特徴とするデータ作成装置。
  2. 前記クラス間の係り受け関係の出現頻度及び前記文書から抽出された複数の前記行動メタデータの出現順序のうち少なくとも一方に基づいて、前記リンクに対して重み係数を設定する設定手段を更に備える
    ことを特徴とする請求項1に記載のデータ作成装置。
  3. 前記行動マップデータにおいて表される前記クラスと、当該クラスに近似するクラスとの間に新たなリンクを作成するリンク作成手段を更に備える
    ことを特徴とする請求項1又は2に記載のデータ作成装置。
  4. 前記新たなリンクに対して重み係数を設定する新設定手段を更に備える
    ことを特徴とする請求項3に記載のデータ作成装置。
  5. 前記行動マップデータを記憶する記憶手段を更に備える
    ことを特徴とする請求項1乃至4のいずれか一項に記載のデータ作成装置。
  6. 対象のトピックを示すトピック情報と、ユーザの現在の行動を示す行動情報とを取得する取得手段と、
    前記トピック情報によって示されるトピックに対応する前記行動マップデータを前記記憶手段において検索して、該当の行動マップデータを得る検索手段と、
    前記検索の結果得られた前記行動マップデータにおいて、前記行動情報によって示される前記行動の概念に相当する第1クラスに対する前記リンクに基づいて、前記行動に関連する関連行動を選択する選択手段と、
    前記関連行動を示す関連行動情報を出力する出力手段とを更に備える
    ことを特徴とする請求項5に記載のデータ作成装置。
  7. 前記選択手段は、前記行動マップデータにおいて、前記第1クラスとの間に前記リンクがある他方のクラスを、前記関連行動として選択する
    ことを特徴とする請求項6に記載のデータ作成装置。
  8. 前記選択手段は、前記第1クラスに対する前記リンクのうち、第1所定値以上の重み係数が設定されたリンクに対する他方のクラスを、前記関連行動として選択する
    ことを特徴とする請求項6に記載のデータ作成装置。
  9. 前記選択手段は、前記第1クラスに対する前記リンクのうち、第2所定値以下の重み係数が設定されたリンクに対する他方のクラスを、前記関連行動として選択する
    ことを特徴とする請求項6に記載のデータ作成装置。
  10. 抽出手段と、変換手段と、データ作成手段とを備えるデータ作成装置で実現されるデータ作成方法であって、
    前記抽出手段が、ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出ステップと、
    前記変換手段が、行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換ステップと、
    前記データ作成手段が、変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成ステップと
    を含むことを特徴とするデータ作成方法。
JP2008102444A 2008-04-10 2008-04-10 データ作成装置及び方法 Expired - Fee Related JP5150341B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008102444A JP5150341B2 (ja) 2008-04-10 2008-04-10 データ作成装置及び方法
US12/419,777 US8055658B2 (en) 2008-04-10 2009-04-07 Data creating apparatus and data creating method
US13/274,439 US8589390B2 (en) 2008-04-10 2011-10-17 Data creating apparatus and data creating method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008102444A JP5150341B2 (ja) 2008-04-10 2008-04-10 データ作成装置及び方法

Publications (2)

Publication Number Publication Date
JP2009252145A JP2009252145A (ja) 2009-10-29
JP5150341B2 true JP5150341B2 (ja) 2013-02-20

Family

ID=41164825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008102444A Expired - Fee Related JP5150341B2 (ja) 2008-04-10 2008-04-10 データ作成装置及び方法

Country Status (2)

Country Link
US (2) US8055658B2 (ja)
JP (1) JP5150341B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5150341B2 (ja) * 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
CN102053978B (zh) * 2009-10-27 2014-04-30 深圳市世纪光速信息技术有限公司 单句的主题词提取方法和装置
JP5442401B2 (ja) * 2009-11-13 2014-03-12 株式会社インテック 行動情報抽出システム及び抽出方法
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8260664B2 (en) 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8983989B2 (en) 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
CN103297469B (zh) * 2012-02-25 2016-12-14 阿里巴巴集团控股有限公司 一种网站数据的采集方法及装置
JP5975949B2 (ja) * 2013-07-23 2016-08-23 日本電信電話株式会社 ライフログ情報分析装置、方法及びプログラム
US20150081648A1 (en) * 2013-09-17 2015-03-19 Sonja Zillner Method of Composing an Integrated Ontology
US9607081B2 (en) 2013-11-15 2017-03-28 Red Hat, Inc. Ontology based categorization of users
KR102244298B1 (ko) * 2014-04-30 2021-04-23 삼성전자주식회사 의미를 기반으로 웹 페이지 접근 기록을 구조화하는 장치 및 방법
JP5939588B2 (ja) * 2014-05-26 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム
JP6228909B2 (ja) * 2014-11-20 2017-11-08 日本電信電話株式会社 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594837A (en) * 1993-01-29 1997-01-14 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US20050005266A1 (en) * 1997-05-01 2005-01-06 Datig William E. Method of and apparatus for realizing synthetic knowledge processes in devices for useful applications
US7543325B2 (en) * 1999-03-30 2009-06-02 Tivo Inc. System for remotely controlling client recording and storage behavior
US6446035B1 (en) * 1999-05-05 2002-09-03 Xerox Corporation Finding groups of people based on linguistically analyzable content of resources accessed
US6567785B2 (en) * 1999-06-19 2003-05-20 John Richard Clendenon Electronic behavior modification reminder system and method
EP1247624A1 (en) * 2000-03-24 2002-10-09 Sony Corporation Method for determining action of robot and robot
US6721706B1 (en) * 2000-10-30 2004-04-13 Koninklijke Philips Electronics N.V. Environment-responsive user interface/entertainment device that simulates personal interaction
IL146597A0 (en) * 2001-11-20 2002-08-14 Gordon Goren Method and system for creating meaningful summaries from interrelated sets of information
JP3990201B2 (ja) * 2002-06-14 2007-10-10 日本車輌製造株式会社 杭打機
US6865538B2 (en) * 2002-08-20 2005-03-08 Autodesk, Inc. Meeting location determination using spatio-semantic modeling
JPWO2004019225A1 (ja) 2002-08-26 2005-12-15 富士通株式会社 状況付情報を処理する装置および方法
US7899862B2 (en) * 2002-11-18 2011-03-01 Aol Inc. Dynamic identification of other users to an online user
JP4127809B2 (ja) 2003-08-22 2008-07-30 日本電信電話株式会社 行動支援システムで使用されるサーバ装置及びそのプログラム
JP2005165454A (ja) * 2003-11-28 2005-06-23 Nippon Telegr & Teleph Corp <Ntt> コンテンツ推薦装置、コンテンツ推薦方法、およびコンテンツ推薦プログラム
JP4581446B2 (ja) * 2004-03-22 2010-11-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2005309907A (ja) * 2004-04-23 2005-11-04 Hewlett-Packard Development Co Lp ユーザコメントダイジェストの生成方法・装置・プログラム
US7689410B2 (en) * 2004-04-23 2010-03-30 Microsoft Corporation Lexical semantic structure
US7761858B2 (en) * 2004-04-23 2010-07-20 Microsoft Corporation Semantic programming language
JP2005332212A (ja) * 2004-05-20 2005-12-02 Ntt Docomo Inc 検索サーバ、検索端末、検索方法、及び、検索実行方法
JP2008511057A (ja) * 2004-08-19 2008-04-10 クラリア コーポレイション エンドユーザの情報要求に応答するための方法及び装置
US8255413B2 (en) * 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
US7496791B2 (en) * 2005-08-04 2009-02-24 Microsoft Corporation Mock object generation by symbolic execution
JP4672578B2 (ja) * 2006-03-09 2011-04-20 日本電信電話株式会社 興味情報提供装置、興味情報提供方法および興味情報提供プログラム
US8255489B2 (en) * 2006-08-18 2012-08-28 Akamai Technologies, Inc. Method of data collection among participating content providers in a distributed network
US8271310B2 (en) * 2006-12-20 2012-09-18 Microsoft Corporation Virtualizing consumer behavior as a financial instrument
US20090076887A1 (en) * 2007-09-16 2009-03-19 Nova Spivack System And Method Of Collecting Market-Related Data Via A Web-Based Networking Environment
US20090106307A1 (en) * 2007-10-18 2009-04-23 Nova Spivack System of a knowledge management and networking environment and method for providing advanced functions therefor
US8161106B2 (en) * 2007-10-30 2012-04-17 Microsoft Corporation Supporting serendipitous group interaction based on user activities
US8615479B2 (en) * 2007-12-13 2013-12-24 The Invention Science Fund I, Llc Methods and systems for indicating behavior in a population cohort
JP5150341B2 (ja) * 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
US8412656B1 (en) * 2009-08-13 2013-04-02 Videomining Corporation Method and system for building a consumer decision tree in a hierarchical decision tree structure based on in-store behavior analysis
US8368559B2 (en) * 2009-08-26 2013-02-05 Raytheon Company Network of traffic behavior-monitoring unattended ground sensors (NeTBUGS)

Also Published As

Publication number Publication date
US8055658B2 (en) 2011-11-08
JP2009252145A (ja) 2009-10-29
US20120036126A1 (en) 2012-02-09
US8589390B2 (en) 2013-11-19
US20090259655A1 (en) 2009-10-15

Similar Documents

Publication Publication Date Title
JP5150341B2 (ja) データ作成装置及び方法
Zheng et al. Carskit: A java-based context-aware recommendation engine
US9659278B2 (en) Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content
US8402034B2 (en) Using a dynamically-generated content-level newsworthiness rating to provide content recommendations
US20130117677A1 (en) Methods and systems for displaying web pages based on a user-specific browser history analysis
AU2014306879A1 (en) Browsing images via mined hyperlinked text snippets
JP6586177B2 (ja) 累積検索処理方法および装置、端末並びに記憶媒体
US11745093B2 (en) Developing implicit metadata for data stores
Whitmore Extracting knowledge from US department of defense freedom of information act requests with social media
KR101651963B1 (ko) 시공간 연관 정보 생성 방법, 이를 수행하는 시공간 연관 정보 생성 서버 및 이를 저장하는 기록매체
JP4754849B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5577228B2 (ja) 概念処理装置及びプログラム
JP4751430B2 (ja) 最新情報提供方法及びそのシステム
JP5513929B2 (ja) 経験情報の再利用性評価装置及び方法及びプログラム
KR100933269B1 (ko) 색상 키워드를 이용한 검색 방법 및 시스템
Fung et al. Discover information and knowledge from websites using an integrated summarization and visualization framework
JP3778270B2 (ja) 選択履歴管理情報、選択履歴情報、情報記憶媒体、及びユーザーインターフェース補助システム
JP5334214B2 (ja) 組織内ソーシャルマップ作成システム及び組織内ソーシャルマップ作成方法
KR101049814B1 (ko) 사용자에 의하여 편집된 검색 결과를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
Koh et al. Domain Knowledge Driven FRBR and Cataloguing for the Future Libraries
KR20220109188A (ko) 인공지능 기반의 문장 검색 방법 및 시스템
KR20220109952A (ko) 인공지능 기반의 문장 검색 방법 및 시스템
KR101544603B1 (ko) 개인화된 웹 정보 제공 장치 및 방법
Ahn et al. A system for contextual search
JP2006146458A (ja) ドキュメント検索装置及びドキュメント検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121203

R151 Written notification of patent or utility model registration

Ref document number: 5150341

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees