JP5150341B2 - データ作成装置及び方法 - Google Patents
データ作成装置及び方法Info
- Publication number
- JP5150341B2 JP5150341B2 JP2008102444A JP2008102444A JP5150341B2 JP 5150341 B2 JP5150341 B2 JP 5150341B2 JP 2008102444 A JP2008102444 A JP 2008102444A JP 2008102444 A JP2008102444 A JP 2008102444A JP 5150341 B2 JP5150341 B2 JP 5150341B2
- Authority
- JP
- Japan
- Prior art keywords
- behavior
- action
- class
- data
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本実施の形態のデータ作成装置100は、装置全体を制御するCPU(Central Processing Unit)等の制御装置と、各種データや各種プログラムを記憶するROM(Read Only Memory)やRAM(Random Access Memory)等の記憶装置と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶装置と、これらを接続するバスとを備えており、通常のコンピュータを利用したハードウェア構成となっている。また、データ作成装置100には、情報を表示する表示装置と、ユーザの指示入力を受け付けるキーボードやマウス等の入力装置と、外部装置の通信を制御する通信I/F(interface)とが有線又は無線により各々接続される。
行動メタデータ1「ハリー,DVD,借りてきた」
行動メタデータ2「ハリー君,DVD,観た」
行動メタデータ3「ロード,DVD,鑑賞した」
行動メタデータ4「ロード,DVD,録画した」
これらに含まれる各タームは、例えば以下のように各クラスに変換される。
行動メタデータ1「ハリー,DVD,借りる」
行動メタデータ2「ハリー,DVD,見る」
行動メタデータ3「ロード,DVD,見る」
行動メタデータ4「ロード,DVD,録画する」
この場合、行動リンク重み付け部104は、各タームから変換された各クラスについてクラス間の係り受け関係の出現回数から、「ハリー」と「DVD」との間のリンク及び「DVD」と「見る」との間のリンクについて、重み係数を各々2倍にする。この重み係数の値は、リンクと対応付けられて行動マップデータにおいて記憶される。
次に、本実施の形態にかかるデータ作成装置100の行う行動マップデータ作成処理の手順について図7を用いて説明する。データ作成装置100にあるトピックについて収集されたWebページが入力されると(ステップS1)、データ作成装置100は、各Webページから行動メタデータを抽出する(ステップS2)。次いで、データ作成装置100は、行動オントロジー及び商品オントロジーを参照して、ステップS1で抽出された各行動メタデータに含まれる各タームをクラスに各々変換して、当該各クラスをノードとして各々表すと共に、クラス間の係り受け関係をノード間のリンクとして表す行動マップデータをトピック毎に作成する(ステップS3)。ここで作成される行動マップデータのデータ構成の概念的なものは図5に示したとおりである。次いで、データ作成装置100は、ステップS3で作成した行動マップデータについて、係り受け関係のある2つ以上のクラスの出現回数や行動メタデータの出現順序に基づいて、リンクに対して重み係数を設定したり、各クラスの意味的な近さに基づいて、新たなリンクを作成したりする(ステップS4)。そして、データ作成装置100は、行動マップデータを、ステップS4でリンク重み係数を設定したり新たにリンクを作成したりすることにより更新した行動マップデータを行動マップ記憶部103に記憶する(ステップS5)。ここで更新された行動マップデータのデータ構成の概念的なものは図6に示したとおりである。
なお、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。また、以下に例示するような種々の変形が可能である。
101 行動メタデータ抽出部
102 行動マップ作成部
103 行動マップ記憶部
104 行動リンク重み付け部
105 関連行動選択部
Claims (10)
- ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出手段と、
行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換手段と、
変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成手段とを備える
ことを特徴とするデータ作成装置。 - 前記クラス間の係り受け関係の出現頻度及び前記文書から抽出された複数の前記行動メタデータの出現順序のうち少なくとも一方に基づいて、前記リンクに対して重み係数を設定する設定手段を更に備える
ことを特徴とする請求項1に記載のデータ作成装置。 - 前記行動マップデータにおいて表される前記クラスと、当該クラスに近似するクラスとの間に新たなリンクを作成するリンク作成手段を更に備える
ことを特徴とする請求項1又は2に記載のデータ作成装置。 - 前記新たなリンクに対して重み係数を設定する新設定手段を更に備える
ことを特徴とする請求項3に記載のデータ作成装置。 - 前記行動マップデータを記憶する記憶手段を更に備える
ことを特徴とする請求項1乃至4のいずれか一項に記載のデータ作成装置。 - 対象のトピックを示すトピック情報と、ユーザの現在の行動を示す行動情報とを取得する取得手段と、
前記トピック情報によって示されるトピックに対応する前記行動マップデータを前記記憶手段において検索して、該当の行動マップデータを得る検索手段と、
前記検索の結果得られた前記行動マップデータにおいて、前記行動情報によって示される前記行動の概念に相当する第1クラスに対する前記リンクに基づいて、前記行動に関連する関連行動を選択する選択手段と、
前記関連行動を示す関連行動情報を出力する出力手段とを更に備える
ことを特徴とする請求項5に記載のデータ作成装置。 - 前記選択手段は、前記行動マップデータにおいて、前記第1クラスとの間に前記リンクがある他方のクラスを、前記関連行動として選択する
ことを特徴とする請求項6に記載のデータ作成装置。 - 前記選択手段は、前記第1クラスに対する前記リンクのうち、第1所定値以上の重み係数が設定されたリンクに対する他方のクラスを、前記関連行動として選択する
ことを特徴とする請求項6に記載のデータ作成装置。 - 前記選択手段は、前記第1クラスに対する前記リンクのうち、第2所定値以下の重み係数が設定されたリンクに対する他方のクラスを、前記関連行動として選択する
ことを特徴とする請求項6に記載のデータ作成装置。 - 抽出手段と、変換手段と、データ作成手段とを備えるデータ作成装置で実現されるデータ作成方法であって、
前記抽出手段が、ネットワークを介してアクセス可能な文書から、少なくとも1つのトピックに関し、行動についての言語表現又は当該言語表現を含み係り受け関係のある2つ以上の言語表現を含む行動メタデータを抽出する抽出ステップと、
前記変換手段が、行動についての言語表現をインスタンスとし、該インスタンスの概念をクラスとしてグラフにより表現する行動オントロジーに基づいて、前記行動メタデータに含まれる前記言語表現をクラスに各々変換する変換ステップと、
前記データ作成手段が、変換された各前記クラスを各々表すと共に、前記クラス間の係り受け関係をリンクとして表す行動マップデータを作成するデータ作成ステップと
を含むことを特徴とするデータ作成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008102444A JP5150341B2 (ja) | 2008-04-10 | 2008-04-10 | データ作成装置及び方法 |
US12/419,777 US8055658B2 (en) | 2008-04-10 | 2009-04-07 | Data creating apparatus and data creating method |
US13/274,439 US8589390B2 (en) | 2008-04-10 | 2011-10-17 | Data creating apparatus and data creating method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008102444A JP5150341B2 (ja) | 2008-04-10 | 2008-04-10 | データ作成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009252145A JP2009252145A (ja) | 2009-10-29 |
JP5150341B2 true JP5150341B2 (ja) | 2013-02-20 |
Family
ID=41164825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008102444A Expired - Fee Related JP5150341B2 (ja) | 2008-04-10 | 2008-04-10 | データ作成装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US8055658B2 (ja) |
JP (1) | JP5150341B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5150341B2 (ja) * | 2008-04-10 | 2013-02-20 | 株式会社東芝 | データ作成装置及び方法 |
CN102053978B (zh) * | 2009-10-27 | 2014-04-30 | 深圳市世纪光速信息技术有限公司 | 单句的主题词提取方法和装置 |
JP5442401B2 (ja) * | 2009-11-13 | 2014-03-12 | 株式会社インテック | 行動情報抽出システム及び抽出方法 |
US8150859B2 (en) * | 2010-02-05 | 2012-04-03 | Microsoft Corporation | Semantic table of contents for search results |
US8903794B2 (en) | 2010-02-05 | 2014-12-02 | Microsoft Corporation | Generating and presenting lateral concepts |
US8260664B2 (en) | 2010-02-05 | 2012-09-04 | Microsoft Corporation | Semantic advertising selection from lateral concepts and topics |
US8983989B2 (en) | 2010-02-05 | 2015-03-17 | Microsoft Technology Licensing, Llc | Contextual queries |
CN103297469B (zh) * | 2012-02-25 | 2016-12-14 | 阿里巴巴集团控股有限公司 | 一种网站数据的采集方法及装置 |
JP5975949B2 (ja) * | 2013-07-23 | 2016-08-23 | 日本電信電話株式会社 | ライフログ情報分析装置、方法及びプログラム |
US20150081648A1 (en) * | 2013-09-17 | 2015-03-19 | Sonja Zillner | Method of Composing an Integrated Ontology |
US9607081B2 (en) | 2013-11-15 | 2017-03-28 | Red Hat, Inc. | Ontology based categorization of users |
KR102244298B1 (ko) * | 2014-04-30 | 2021-04-23 | 삼성전자주식회사 | 의미를 기반으로 웹 페이지 접근 기록을 구조화하는 장치 및 방법 |
JP5939588B2 (ja) * | 2014-05-26 | 2016-06-22 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム |
JP6228909B2 (ja) * | 2014-11-20 | 2017-11-08 | 日本電信電話株式会社 | 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594837A (en) * | 1993-01-29 | 1997-01-14 | Noyes; Dallas B. | Method for representation of knowledge in a computer as a network database system |
US20050005266A1 (en) * | 1997-05-01 | 2005-01-06 | Datig William E. | Method of and apparatus for realizing synthetic knowledge processes in devices for useful applications |
US7543325B2 (en) * | 1999-03-30 | 2009-06-02 | Tivo Inc. | System for remotely controlling client recording and storage behavior |
US6446035B1 (en) * | 1999-05-05 | 2002-09-03 | Xerox Corporation | Finding groups of people based on linguistically analyzable content of resources accessed |
US6567785B2 (en) * | 1999-06-19 | 2003-05-20 | John Richard Clendenon | Electronic behavior modification reminder system and method |
EP1247624A1 (en) * | 2000-03-24 | 2002-10-09 | Sony Corporation | Method for determining action of robot and robot |
US6721706B1 (en) * | 2000-10-30 | 2004-04-13 | Koninklijke Philips Electronics N.V. | Environment-responsive user interface/entertainment device that simulates personal interaction |
IL146597A0 (en) * | 2001-11-20 | 2002-08-14 | Gordon Goren | Method and system for creating meaningful summaries from interrelated sets of information |
JP3990201B2 (ja) * | 2002-06-14 | 2007-10-10 | 日本車輌製造株式会社 | 杭打機 |
US6865538B2 (en) * | 2002-08-20 | 2005-03-08 | Autodesk, Inc. | Meeting location determination using spatio-semantic modeling |
JPWO2004019225A1 (ja) | 2002-08-26 | 2005-12-15 | 富士通株式会社 | 状況付情報を処理する装置および方法 |
US7899862B2 (en) * | 2002-11-18 | 2011-03-01 | Aol Inc. | Dynamic identification of other users to an online user |
JP4127809B2 (ja) | 2003-08-22 | 2008-07-30 | 日本電信電話株式会社 | 行動支援システムで使用されるサーバ装置及びそのプログラム |
JP2005165454A (ja) * | 2003-11-28 | 2005-06-23 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ推薦装置、コンテンツ推薦方法、およびコンテンツ推薦プログラム |
JP4581446B2 (ja) * | 2004-03-22 | 2010-11-17 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2005309907A (ja) * | 2004-04-23 | 2005-11-04 | Hewlett-Packard Development Co Lp | ユーザコメントダイジェストの生成方法・装置・プログラム |
US7689410B2 (en) * | 2004-04-23 | 2010-03-30 | Microsoft Corporation | Lexical semantic structure |
US7761858B2 (en) * | 2004-04-23 | 2010-07-20 | Microsoft Corporation | Semantic programming language |
JP2005332212A (ja) * | 2004-05-20 | 2005-12-02 | Ntt Docomo Inc | 検索サーバ、検索端末、検索方法、及び、検索実行方法 |
JP2008511057A (ja) * | 2004-08-19 | 2008-04-10 | クラリア コーポレイション | エンドユーザの情報要求に応答するための方法及び装置 |
US8255413B2 (en) * | 2004-08-19 | 2012-08-28 | Carhamm Ltd., Llc | Method and apparatus for responding to request for information-personalization |
US7496791B2 (en) * | 2005-08-04 | 2009-02-24 | Microsoft Corporation | Mock object generation by symbolic execution |
JP4672578B2 (ja) * | 2006-03-09 | 2011-04-20 | 日本電信電話株式会社 | 興味情報提供装置、興味情報提供方法および興味情報提供プログラム |
US8255489B2 (en) * | 2006-08-18 | 2012-08-28 | Akamai Technologies, Inc. | Method of data collection among participating content providers in a distributed network |
US8271310B2 (en) * | 2006-12-20 | 2012-09-18 | Microsoft Corporation | Virtualizing consumer behavior as a financial instrument |
US20090076887A1 (en) * | 2007-09-16 | 2009-03-19 | Nova Spivack | System And Method Of Collecting Market-Related Data Via A Web-Based Networking Environment |
US20090106307A1 (en) * | 2007-10-18 | 2009-04-23 | Nova Spivack | System of a knowledge management and networking environment and method for providing advanced functions therefor |
US8161106B2 (en) * | 2007-10-30 | 2012-04-17 | Microsoft Corporation | Supporting serendipitous group interaction based on user activities |
US8615479B2 (en) * | 2007-12-13 | 2013-12-24 | The Invention Science Fund I, Llc | Methods and systems for indicating behavior in a population cohort |
JP5150341B2 (ja) * | 2008-04-10 | 2013-02-20 | 株式会社東芝 | データ作成装置及び方法 |
US8412656B1 (en) * | 2009-08-13 | 2013-04-02 | Videomining Corporation | Method and system for building a consumer decision tree in a hierarchical decision tree structure based on in-store behavior analysis |
US8368559B2 (en) * | 2009-08-26 | 2013-02-05 | Raytheon Company | Network of traffic behavior-monitoring unattended ground sensors (NeTBUGS) |
-
2008
- 2008-04-10 JP JP2008102444A patent/JP5150341B2/ja not_active Expired - Fee Related
-
2009
- 2009-04-07 US US12/419,777 patent/US8055658B2/en not_active Expired - Fee Related
-
2011
- 2011-10-17 US US13/274,439 patent/US8589390B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8055658B2 (en) | 2011-11-08 |
JP2009252145A (ja) | 2009-10-29 |
US20120036126A1 (en) | 2012-02-09 |
US8589390B2 (en) | 2013-11-19 |
US20090259655A1 (en) | 2009-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5150341B2 (ja) | データ作成装置及び方法 | |
Zheng et al. | Carskit: A java-based context-aware recommendation engine | |
US9659278B2 (en) | Methods, systems, and computer program products for displaying tag words for selection by users engaged in social tagging of content | |
US8402034B2 (en) | Using a dynamically-generated content-level newsworthiness rating to provide content recommendations | |
US20130117677A1 (en) | Methods and systems for displaying web pages based on a user-specific browser history analysis | |
AU2014306879A1 (en) | Browsing images via mined hyperlinked text snippets | |
JP6586177B2 (ja) | 累積検索処理方法および装置、端末並びに記憶媒体 | |
US11745093B2 (en) | Developing implicit metadata for data stores | |
Whitmore | Extracting knowledge from US department of defense freedom of information act requests with social media | |
KR101651963B1 (ko) | 시공간 연관 정보 생성 방법, 이를 수행하는 시공간 연관 정보 생성 서버 및 이를 저장하는 기록매체 | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5577228B2 (ja) | 概念処理装置及びプログラム | |
JP4751430B2 (ja) | 最新情報提供方法及びそのシステム | |
JP5513929B2 (ja) | 経験情報の再利用性評価装置及び方法及びプログラム | |
KR100933269B1 (ko) | 색상 키워드를 이용한 검색 방법 및 시스템 | |
Fung et al. | Discover information and knowledge from websites using an integrated summarization and visualization framework | |
JP3778270B2 (ja) | 選択履歴管理情報、選択履歴情報、情報記憶媒体、及びユーザーインターフェース補助システム | |
JP5334214B2 (ja) | 組織内ソーシャルマップ作成システム及び組織内ソーシャルマップ作成方法 | |
KR101049814B1 (ko) | 사용자에 의하여 편집된 검색 결과를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
Koh et al. | Domain Knowledge Driven FRBR and Cataloguing for the Future Libraries | |
KR20220109188A (ko) | 인공지능 기반의 문장 검색 방법 및 시스템 | |
KR20220109952A (ko) | 인공지능 기반의 문장 검색 방법 및 시스템 | |
KR101544603B1 (ko) | 개인화된 웹 정보 제공 장치 및 방법 | |
Ahn et al. | A system for contextual search | |
JP2006146458A (ja) | ドキュメント検索装置及びドキュメント検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110324 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121203 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5150341 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |