JP5020414B2 - 構造化情報の生成 - Google Patents
構造化情報の生成 Download PDFInfo
- Publication number
- JP5020414B2 JP5020414B2 JP2012004466A JP2012004466A JP5020414B2 JP 5020414 B2 JP5020414 B2 JP 5020414B2 JP 2012004466 A JP2012004466 A JP 2012004466A JP 2012004466 A JP2012004466 A JP 2012004466A JP 5020414 B2 JP5020414 B2 JP 5020414B2
- Authority
- JP
- Japan
- Prior art keywords
- company
- week
- string
- business hours
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
図1は、本発明の一実施形態における、多数の構造化されあるいは構造化されていない情報源から構造化された情報を生成するためのコンピュータ環境100のハイレベルブロック図である。図1は、構造化情報データベース112に接続される構造生成エンジン110を示す。構造生成エンジン110はネットワーク114に接続される。また、ネットワーク114は、商業データプロバイダ116と、企業ウェブサイト118と、ディレクトリウェブサイト120とにも接続される。ある実施形態では、これら後者の3つのエンティティの1以上が存在しない。
図2は、一実施形態における図1のコンピュータ環境100に示されるエンティティの一つとして用いられるコンピュータ200の機能図を示すハイレベルブロック図である。バス204に接続される少なくとも1つのプロセッサ202が示される。また、メモリ206、記憶装置208、キーボード210、グラフィックアダプタ212、ポインティングデバイス214およびネットワークアダプタ216もバス204に接続される。ディスプレイ218はグラフィックアダプタ212に接続される。
名称、住所あるいは電話番号、
営業時間(すなわち、開いている時間)、
予約規定、
アクセスしやすさ(すなわち、身体障害者のアクセス)、
可能な支払方法、
駐車場(すなわち、駐車場がどのような形式で利用可能か)、
提供されるサービス、および
提供されるブランド。
他の実施形態は、異なるあるいは追加のデータを抽出する。
1.円卓(Round Table)ピザ
650−961−0361
カリフォルニア州マウンテンビュー海岸線大通り北570
営業日 毎日午前11時〜午後10時
2.マウンテンビューの円卓ピザ
650−961−0361
94043 カリフォルニア州マウンテンビュー海岸線大通り北560
3.セーフウェーのフード&ドラッグ
650−961−4868
94043 カリフォルニア州マウンテンビュー海岸線大通り570
24時間オープン
4.円卓ピザ
650−961−0361
94022 カリフォルニア州ロスアルトス一番通り399
宅配可能
5.円卓
650−384−7463
94043 カリフォルニア州マウンテンビュー海岸線大通り570
図5は、一実施形態における構造生成エンジン110により実行されるステップを示すフローチャートである。他の実施形態は、異なる順序でステップを実行し、あるいは、図5に示すステップと異なるステップまたは追加のステップを実行する。構造生成エンジン110は、図5のステップの多数の事例を同時に実行し、あるいは並列にステップを実行することができる。
110 構造生成エンジン
112 構造化情報データベース
114 ネットワーク
116 商業データプロバイダ
118 企業ウェブサイト
120 ディレクトリウェブサイト
Claims (18)
- 構造化データを生成するシステムであって、
企業の営業時間についての事実を記述する非構造化データを含む電子文書を受け取るためのデータ取得モジュールと、
前記企業の営業時間についての事実を記述する前記非構造化データを前記電子文書から抽出するためのデータ抽出モジュールと、
前記抽出された非構造化データを受け取り、前記非構造化データにより記述される前記企業の営業時間についての事実の構造化表現を作り出すためのデータ解析モジュールであって、値標準化モジュールを含み、該値標準化モジュールは、
前記電子文書から抽出された前記企業の営業時間についての事実を記述する文字列を受信し、
前記文字列内に含まれる複数シンボルを分類するために前記文字列を解析し、ここで、該解析することは、前記文字列から、一週間の曜日を表すシンボルを分類し、かつ、前記企業の前記営業時間を表すシンボルを分類することからなり、
前記文字列内における前記一週間の曜日を表すシンボルを一つにまとめて、まとめられた文字列を形成し、ここで、該まとめられた文字列は、一連の曜日を表すシンボルと前記企業の営業時間を表すシンボルとを有し、
前記一連の曜日における前記企業の営業時間を判定するために前記まとめられた文字列を解釈する、
ことを行う、前記データ解析モジュールと
を備え、前記企業の営業時間についての事実の前記構造化表現が、該企業が営業している一週間内の曜日を表すビットを使用して前記一連の曜日を表す前記シンボルを記述するベクトルを含むことを特徴とするシステム。 - 前記文字列内における一週間の曜日を表すシンボルを一つにまとめることは、
前記文字列内における一週間の曜日を表す複数のシンボルのシーケンスを識別することと、
前記一週間の曜日を表す複数のシンボルのシーケンスを一連の曜日を表す1つのシンボルにまとめること
を含む請求項1に記載のシステム。 - 前記値標準化モジュールは、更に、
前記文字列内の前記企業の営業時間の記述が境界値を欠いていることを識別することと、
前記境界値として前記企業の営業時間の一つの時間を前記文字列内に挿入すること
を行うものである請求項1又は2に記載のシステム。 - 前記文字列を解析することは、該文字列内で他のシンボルを分離するセパレータを、該文字列内の複数シンボルから分類することを含む請求項1乃至3のいずれかに記載のシステム。
- 前記文字列を解析することは、該文字列内での他のシンボルによって表された曜日及び/又は時間の修飾語を、該文字列内のシンボルから分類することを含む請求項1乃至4のいずれかに記載のシステム。
- 前記ベクトルは、一週間内の各曜日において前記企業が営業している営業時間を記述する、請求項1乃至5のいずれかに記載のシステム。
- 構造化データを生成するためのコンピュータプログラムであって、コンピュータに、
企業の営業時間についての事実を記述する非構造化データを含む電子文書を受け取るためのデータ取得手順と、
前記企業の営業時間についての事実を記述する前記非構造化データを前記電子文書から抽出するためのデータ抽出手順と、
前記抽出された非構造化データを受け取り、前記非構造化データにより記述される前記企業の営業時間についての事実の構造化表現を作り出すためのデータ解析手順であって、
前記電子文書から抽出された前記企業の営業時間についての事実を記述する文字列を受信し、
前記文字列内に含まれる複数シンボルを分類するために前記文字列を解析し、ここで、該解析することは、前記文字列から、一週間の曜日を表すシンボルを分類し、かつ、前記企業の前記営業時間を表すシンボルを分類することからなり、
前記文字列内における一週間の曜日を表すシンボルを一つにまとめて、まとめられた文字列を形成し、ここで、該まとめられた文字列は、一連の曜日を表すシンボルと前記企業の営業時間を表すシンボルとを有し、前記一連の曜日を表す前記シンボルは、前記企業が営業している一週間内の曜日を表すビットを有するベクトルによって前記構造化表現内において記述され、
前記一連の曜日における前記企業の営業時間を判定するために前記まとめられた文字列を解釈する、
ことを行う値標準化手順を備え、ここで、前記企業の営業時間についての事実の前記構造化表現が、該企業が営業している一週間内の曜日を表すビットを使用して前記一連の曜日を表すシンボルを記述する前記ベクトルからなる、前記データ解析手順と
を実行させるためのコンピュータプログラム。 - 前記文字列内における一週間の曜日を表すシンボルを一つにまとめることは、
前記文字列内における一週間の曜日を表す複数のシンボルのシーケンスを識別する手順と、
前記一週間の曜日を表す複数のシンボルのシーケンスを一連の曜日を表す1つのシンボルにまとめる手順
を前記コンピュータに実行させることを含む請求項7に記載のコンピュータプログラム。 - 前記値標準化手順は、更に、
前記文字列内の前記企業の営業時間の記述が境界値を欠いていることを識別する手順と、
前記境界値として前記企業の営業時間の一つの時間を前記文字列内に挿入する手順
を前記コンピュータに実行させることを含む請求項7又は8に記載のコンピュータプログラム。 - 前記文字列を解析することは、該文字列内で他のシンボルを分離するセパレータを、該文字列内の複数シンボルから分類することを含む請求項7乃至9のいずれかに記載のコンピュータプログラム。
- 前記文字列を解析することは、該文字列内での他のシンボルによって表された曜日及び/又は時間の修飾語を、該文字列内のシンボルから分類することを含む請求項7乃至10のいずれかに記載のコンピュータプログラム。
- 前記ベクトルは、一週間内の各曜日において前記企業が営業している営業時間を記述する、請求項7乃至11のいずれかに記載のコンピュータプログラム。
- 構造化データを生成するためにコンピュータによって実行される方法であって、
前記コンピュータが、企業の営業時間についての事実を記述する非構造化データを含む電子文書を受け取ることと、
前記コンピュータが、前記企業の営業時間についての事実を記述する前記非構造化データを前記電子文書から抽出することと、
前記コンピュータが、前記抽出された非構造化データを受け取り、前記非構造化データにより記述される前記企業の営業時間についての事実の構造化表現を作り出すこと、
を備え、前記抽出された非構造化データを受け取って前記構造化表現を作り出すことは、
前記電子文書から抽出された前記企業の営業時間についての事実を記述する文字列を受信することと、
前記文字列に含まれる複数シンボルを分類するために前記文字列を解析することと、ここで、該解析することは、前記文字列から、一週間の曜日を表すシンボルを分類し、かつ、前記企業の前記営業時間を表すシンボルを分類することからなり、
前記文字列内における一週間の曜日を表すシンボルを一つにまとめて、まとめられた文字列を形成することと、ここで、該まとめられた文字列は、一連の曜日を表すシンボルと前記企業の営業時間を表すシンボルとを有し、前記一連の曜日を表す前記シンボルは、前記企業が営業している一週間内の曜日を表すビットを有するベクトルによって前記構造化表現内において記述され、
前記一連の曜日における前記企業の営業時間を判定するために前記まとめられた文字列を解釈すること、
を含み、前記企業の営業時間についての事実の前記構造化表現が、該企業が営業している一週間内の曜日を表すビットを使用して前記一連の曜日を表すシンボルを記述する前記ベクトルからなることを特徴とする方法。 - 前記文字列内における一週間の曜日を表すシンボルを一つにまとめることは、
前記コンピュータによって、前記文字列内における一週間の曜日を表す複数のシンボルのシーケンスを識別することと、
前記コンピュータによって、前記一週間の曜日を表す複数のシンボルのシーケンスを一連の曜日を表す1つのシンボルにまとめること
を含む請求項13に記載の方法。 - 前記抽出された非構造化データを受け取って前記構造化表現を作り出すことは、更に、
前記コンピュータによって、前記文字列内の前記企業の営業時間の記述が境界値を欠いていることを識別することと、
前記コンピュータによって、前記境界値として前記企業の営業時間の一つの時間を前記文字列内に挿入すること
を含む請求項13又は14に記載の方法。 - 前記文字列を解析することは、該文字列内で他のシンボルを分離するセパレータを、該文字列内の複数シンボルから分類することを含む請求項13乃至15のいずれかに記載の方法。
- 前記文字列を解析することは、該文字列内での他のシンボルによって表された曜日及び/又は時間の修飾語を、該文字列内のシンボルから分類することを含む請求項13乃至16のいずれかに記載の方法。
- 前記ベクトルは、一週間内の各曜日において前記企業が営業している営業時間を記述する、請求項13乃至17のいずれかに記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US65821405P | 2005-03-02 | 2005-03-02 | |
US60/658,214 | 2005-03-02 | ||
US11/366,162 US7788293B2 (en) | 2005-03-02 | 2006-03-01 | Generating structured information |
US11/366,162 | 2006-03-01 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007558276A Division JP2008535044A (ja) | 2005-03-02 | 2006-03-02 | 構造化情報の生成 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012099138A JP2012099138A (ja) | 2012-05-24 |
JP5020414B2 true JP5020414B2 (ja) | 2012-09-05 |
Family
ID=36941867
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007558276A Pending JP2008535044A (ja) | 2005-03-02 | 2006-03-02 | 構造化情報の生成 |
JP2012004466A Active JP5020414B2 (ja) | 2005-03-02 | 2012-01-12 | 構造化情報の生成 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007558276A Pending JP2008535044A (ja) | 2005-03-02 | 2006-03-02 | 構造化情報の生成 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7788293B2 (ja) |
EP (1) | EP1856602A4 (ja) |
JP (2) | JP2008535044A (ja) |
KR (1) | KR101021549B1 (ja) |
CN (1) | CN101164039B (ja) |
CA (1) | CA2600685C (ja) |
WO (1) | WO2006094206A2 (ja) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010165374A (ja) * | 2000-03-29 | 2010-07-29 | Sojitz Corp | 与信機能を備えた匿名電子商取引システム及び方法 |
US7584208B2 (en) | 2002-11-20 | 2009-09-01 | Radar Networks, Inc. | Methods and systems for managing offers and requests in a network |
US7640267B2 (en) | 2002-11-20 | 2009-12-29 | Radar Networks, Inc. | Methods and systems for managing entities in a computing device using semantic objects |
US8200775B2 (en) | 2005-02-01 | 2012-06-12 | Newsilike Media Group, Inc | Enhanced syndication |
US7433876B2 (en) | 2004-02-23 | 2008-10-07 | Radar Networks, Inc. | Semantic web portal and platform |
US8140482B2 (en) | 2007-09-19 | 2012-03-20 | Moore James F | Using RSS archives |
US8700738B2 (en) | 2005-02-01 | 2014-04-15 | Newsilike Media Group, Inc. | Dynamic feed generation |
US9202084B2 (en) | 2006-02-01 | 2015-12-01 | Newsilike Media Group, Inc. | Security facility for maintaining health care data pools |
US8347088B2 (en) | 2005-02-01 | 2013-01-01 | Newsilike Media Group, Inc | Security systems and methods for use with structured and unstructured data |
US20070050446A1 (en) * | 2005-02-01 | 2007-03-01 | Moore James F | Managing network-accessible resources |
US8200700B2 (en) | 2005-02-01 | 2012-06-12 | Newsilike Media Group, Inc | Systems and methods for use of structured and unstructured distributed data |
US20070033089A1 (en) * | 2005-08-04 | 2007-02-08 | Microsoft Corporation | User interface and geo-parsing data structure |
US8694530B2 (en) | 2006-01-03 | 2014-04-08 | Textdigger, Inc. | Search system with query refinement and search method |
US8862573B2 (en) * | 2006-04-04 | 2014-10-14 | Textdigger, Inc. | Search system and method with text function tagging |
US7921046B2 (en) | 2006-06-19 | 2011-04-05 | Exegy Incorporated | High speed processing of financial information using FPGA devices |
US7840482B2 (en) | 2006-06-19 | 2010-11-23 | Exegy Incorporated | Method and system for high speed options pricing |
US9043197B1 (en) * | 2006-07-14 | 2015-05-26 | Google Inc. | Extracting information from unstructured text using generalized extraction patterns |
WO2008021832A2 (en) * | 2006-08-09 | 2008-02-21 | Radar Networks, Inc. | Harvesting data from page |
US8326819B2 (en) | 2006-11-13 | 2012-12-04 | Exegy Incorporated | Method and system for high performance data metatagging and data indexing using coprocessors |
US7660793B2 (en) | 2006-11-13 | 2010-02-09 | Exegy Incorporated | Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors |
US20080319843A1 (en) * | 2007-06-22 | 2008-12-25 | Dennis Norman Moser | Supply of requested offer based on point-of-service to offeree distance |
US20090076925A1 (en) * | 2007-09-13 | 2009-03-19 | Dewitt Jay Allen | Offeree requested offer based on point-of-service to offeree distance |
US20090076887A1 (en) * | 2007-09-16 | 2009-03-19 | Nova Spivack | System And Method Of Collecting Market-Related Data Via A Web-Based Networking Environment |
US10229453B2 (en) | 2008-01-11 | 2019-03-12 | Ip Reservoir, Llc | Method and system for low latency basket calculation |
US7840597B2 (en) * | 2008-01-31 | 2010-11-23 | Intuit Inc. | Method and apparatus for managing metadata associated with entities in a computing system |
US7996390B2 (en) | 2008-02-15 | 2011-08-09 | The University Of Utah Research Foundation | Method and system for clustering identified forms |
US8965865B2 (en) * | 2008-02-15 | 2015-02-24 | The University Of Utah Research Foundation | Method and system for adaptive discovery of content on a network |
CN101231661B (zh) * | 2008-02-19 | 2010-06-23 | 上海估家网络科技有限公司 | 对象级知识挖掘的方法和系统 |
CN101458680B (zh) * | 2008-09-03 | 2010-12-01 | 北京大学 | 一种自动识别数字文档目录的方法及装置 |
JP5871619B2 (ja) | 2008-12-15 | 2016-03-01 | アイ・ピー・リザブワー・エル・エル・シー | 金融市場深度データの高速処理のための方法および装置 |
KR101111222B1 (ko) * | 2009-02-25 | 2012-02-16 | 김기미 | 인터넷 프로그램의 메타데이타와 웹 정보의 데이타베이스화를 통한 시만틱웹 구현 시스템 |
WO2010120929A2 (en) | 2009-04-15 | 2010-10-21 | Evri Inc. | Generating user-customized search results and building a semantics-enhanced search engine |
WO2010120934A2 (en) | 2009-04-15 | 2010-10-21 | Evri Inc. | Search enhanced semantic advertising |
US8200617B2 (en) | 2009-04-15 | 2012-06-12 | Evri, Inc. | Automatic mapping of a location identifier pattern of an object to a semantic type using object metadata |
US8862579B2 (en) | 2009-04-15 | 2014-10-14 | Vcvc Iii Llc | Search and search optimization using a pattern of a location identifier |
GB2470563A (en) * | 2009-05-26 | 2010-12-01 | John Robinson | Populating a database |
US8521680B2 (en) * | 2009-07-31 | 2013-08-27 | Microsoft Corporation | Inferring user-specific location semantics from user data |
WO2011095988A2 (en) * | 2010-02-03 | 2011-08-11 | Puranik Anita Kulkarni | A system and method for extraction of structured data from arbitrarily structured composite data |
CN102214179A (zh) * | 2010-04-12 | 2011-10-12 | 无锡科利德斯科技有限公司 | 网络信息抓取方法 |
WO2012079041A1 (en) | 2010-12-09 | 2012-06-14 | Exegy Incorporated | Method and apparatus for managing orders in financial markets |
US8779941B2 (en) | 2010-12-27 | 2014-07-15 | Ai Incube, Inc. | Providing guidance for locating street parking |
CN102073726B (zh) * | 2011-01-11 | 2014-08-06 | 百度在线网络技术(北京)有限公司 | 搜索引擎系统的结构化数据的引入方法和装置 |
CN102118279B (zh) * | 2011-02-23 | 2013-04-10 | 北京蓝汛通信技术有限责任公司 | 一种链路质量探测方法、装置及系统 |
US10467677B2 (en) | 2011-09-28 | 2019-11-05 | Nara Logics, Inc. | Systems and methods for providing recommendations based on collaborative and/or content-based nodal interrelationships |
US11727249B2 (en) | 2011-09-28 | 2023-08-15 | Nara Logics, Inc. | Methods for constructing and applying synaptic networks |
US10789526B2 (en) | 2012-03-09 | 2020-09-29 | Nara Logics, Inc. | Method, system, and non-transitory computer-readable medium for constructing and applying synaptic networks |
US9069863B2 (en) | 2011-10-10 | 2015-06-30 | International Business Machines Corporation | Identifying unknown parameter and name value pairs |
US20130117012A1 (en) * | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Knowledge based parsing |
US9002847B2 (en) * | 2012-02-29 | 2015-04-07 | Hewlett-Packard Development Company, L.P. | Identifying an auto-complete communication pattern |
US9990393B2 (en) | 2012-03-27 | 2018-06-05 | Ip Reservoir, Llc | Intelligent feed switch |
US10650452B2 (en) | 2012-03-27 | 2020-05-12 | Ip Reservoir, Llc | Offload processing of data packets |
US10121196B2 (en) | 2012-03-27 | 2018-11-06 | Ip Reservoir, Llc | Offload processing of data packets containing financial market data |
US11436672B2 (en) | 2012-03-27 | 2022-09-06 | Exegy Incorporated | Intelligent switch for processing financial market data |
CN103455471B (zh) * | 2012-06-01 | 2016-12-14 | 阿里巴巴集团控股有限公司 | 一种将文本解析成键值对的方法和装置 |
CN103810199B (zh) * | 2012-11-12 | 2017-07-14 | 北大方正集团有限公司 | 一种目录的制作方法及装置 |
US9439036B2 (en) | 2013-01-25 | 2016-09-06 | Visa International Service Association | Systems and methods to select locations of interest based on distance from route points or route paths |
CN104969221B (zh) * | 2013-02-07 | 2018-05-11 | 慧与发展有限责任合伙企业 | 格式化数据库中的半结构化数据 |
US9887911B2 (en) | 2013-02-28 | 2018-02-06 | Xaptum, Inc. | Systems, methods, and devices for adaptive communication in a data communication network |
US10055751B2 (en) | 2013-04-05 | 2018-08-21 | Visa International Service Association | Systems and methods to enhance search results using transaction data of merchants |
US9355136B2 (en) | 2013-05-06 | 2016-05-31 | International Business Machines Corporation | Automating generation of messages in accordance with a standard |
CN103425780B (zh) * | 2013-08-19 | 2016-08-17 | 曙光信息产业股份有限公司 | 一种数据的查询方法和装置 |
CN104424185B (zh) * | 2013-08-19 | 2018-10-16 | 北大方正集团有限公司 | 同步提取中英文目录的方法及系统 |
US20150058681A1 (en) * | 2013-08-26 | 2015-02-26 | Microsoft Corporation | Monitoring, detection and analysis of data from different services |
CN103744897A (zh) * | 2013-12-24 | 2014-04-23 | 华为技术有限公司 | 故障信息的关联搜索方法、系统和网络管理系统 |
CN105335338B (zh) * | 2014-06-25 | 2018-04-03 | 阿里巴巴集团控股有限公司 | 一种电子文档转换方法及装置 |
KR20160046038A (ko) * | 2014-10-17 | 2016-04-28 | 삼성전자주식회사 | 위치 기반 소셜 검색 서비스를 제공하는 방법 및 장치 |
EP3220284A1 (en) * | 2014-11-14 | 2017-09-20 | Fujitsu Limited | Data acquisition program, data acquisition method and data acquisition device |
US9507762B1 (en) * | 2015-11-19 | 2016-11-29 | International Business Machines Corporation | Converting portions of documents between structured and unstructured data formats to improve computing efficiency and schema flexibility |
CN107145493B (zh) * | 2016-03-01 | 2020-11-24 | 创新先进技术有限公司 | 信息处理方法及装置 |
CN106649867B (zh) * | 2016-12-30 | 2018-05-18 | 北京亚控科技发展有限公司 | 一种对象数据的组织方法 |
US11562008B2 (en) | 2016-10-25 | 2023-01-24 | Micro Focus Llc | Detection of entities in unstructured data |
TWI659369B (zh) * | 2017-07-12 | 2019-05-11 | 金腦數位股份有限公司 | 訊息處理裝置 |
US20190236121A1 (en) * | 2018-01-29 | 2019-08-01 | Salesforce.Com, Inc. | Virtualized detail panel |
US11057352B2 (en) | 2018-02-28 | 2021-07-06 | Xaptum, Inc. | Communication system and method for machine data routing |
US10965653B2 (en) | 2018-03-28 | 2021-03-30 | Xaptum, Inc. | Scalable and secure message brokering approach in a communication system |
US10805439B2 (en) * | 2018-04-30 | 2020-10-13 | Xaptum, Inc. | Communicating data messages utilizing a proprietary network |
US10924593B2 (en) | 2018-08-31 | 2021-02-16 | Xaptum, Inc. | Virtualization with distributed adaptive message brokering |
US10938877B2 (en) | 2018-11-30 | 2021-03-02 | Xaptum, Inc. | Optimizing data transmission parameters of a proprietary network |
US10912053B2 (en) | 2019-01-31 | 2021-02-02 | Xaptum, Inc. | Enforcing geographic restrictions for multitenant overlay networks |
CN110442671A (zh) * | 2019-08-02 | 2019-11-12 | 深圳百胜扬工业电子商务平台发展有限公司 | 一种非结构化数据处理的方法和系统 |
KR102244782B1 (ko) * | 2020-10-08 | 2021-04-27 | (주)시큐레이어 | 임의의 구조를 가지는 비정형 로그를 정확하게 자동 분석하기 위한 정규화율 기반 파서 매칭 방법 및 장치 |
JP7116940B2 (ja) * | 2021-01-26 | 2022-08-12 | 株式会社Xaion Data | オープンデータを効率的に構造化し補正する方法及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08339361A (ja) * | 1995-06-09 | 1996-12-24 | Omron Corp | 予測用知識の生成装置と需要量予測装置、及び、予測用知識の生成方法と需要量予測方法 |
JPH10133853A (ja) * | 1996-10-29 | 1998-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール書換え方法及び装置 |
US6834276B1 (en) * | 1999-02-25 | 2004-12-21 | Integrated Data Control, Inc. | Database system and method for data acquisition and perusal |
US6721713B1 (en) * | 1999-05-27 | 2004-04-13 | Andersen Consulting Llp | Business alliance identification in a web architecture framework |
US6711585B1 (en) * | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
WO2001067225A2 (en) * | 2000-03-06 | 2001-09-13 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
JP2002230035A (ja) * | 2001-01-05 | 2002-08-16 | Internatl Business Mach Corp <Ibm> | 情報整理方法、情報処理装置、情報処理システム、記憶媒体、およびプログラム伝送装置 |
US20040186817A1 (en) * | 2001-10-31 | 2004-09-23 | Thames Joseph M. | Computer-based structures and methods for generating, maintaining, and modifying a source document and related documentation |
EP1481346B1 (en) * | 2002-02-04 | 2012-10-10 | Cataphora, Inc. | A method and apparatus to visually present discussions for data mining purposes |
US20030154071A1 (en) * | 2002-02-11 | 2003-08-14 | Shreve Gregory M. | Process for the document management and computer-assisted translation of documents utilizing document corpora constructed by intelligent agents |
JP2003271610A (ja) * | 2002-03-19 | 2003-09-26 | Toshiba Corp | 情報収集装置及び情報収集プログラム |
JP2004234288A (ja) * | 2003-01-30 | 2004-08-19 | Nippon Telegr & Teleph Corp <Ntt> | Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体 |
US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US20040243560A1 (en) * | 2003-05-30 | 2004-12-02 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including an annotation inverted file system facilitating indexing and searching |
KR20100027775A (ko) * | 2008-09-03 | 2010-03-11 | 이화섭 | 상점가 단위로 상점들과 상품들에 대한 정보를 분류하여 저장하고 온라인 시스템을 통하여 검색할 수 있도록 하는 방법과 시스템. |
-
2006
- 2006-03-01 US US11/366,162 patent/US7788293B2/en active Active
- 2006-03-02 JP JP2007558276A patent/JP2008535044A/ja active Pending
- 2006-03-02 WO PCT/US2006/007639 patent/WO2006094206A2/en active Application Filing
- 2006-03-02 KR KR1020077021887A patent/KR101021549B1/ko active IP Right Grant
- 2006-03-02 CN CN2006800132451A patent/CN101164039B/zh active Active
- 2006-03-02 CA CA2600685A patent/CA2600685C/en active Active
- 2006-03-02 EP EP06736888A patent/EP1856602A4/en not_active Ceased
-
2012
- 2012-01-12 JP JP2012004466A patent/JP5020414B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN101164039A (zh) | 2008-04-16 |
JP2008535044A (ja) | 2008-08-28 |
KR101021549B1 (ko) | 2011-03-16 |
EP1856602A2 (en) | 2007-11-21 |
WO2006094206A3 (en) | 2006-11-23 |
WO2006094206A2 (en) | 2006-09-08 |
KR20070112219A (ko) | 2007-11-22 |
EP1856602A4 (en) | 2010-03-17 |
CN101164039B (zh) | 2011-03-02 |
US20060200478A1 (en) | 2006-09-07 |
US7788293B2 (en) | 2010-08-31 |
CA2600685A1 (en) | 2006-09-08 |
CA2600685C (en) | 2015-08-11 |
JP2012099138A (ja) | 2012-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5020414B2 (ja) | 構造化情報の生成 | |
US7240049B2 (en) | Systems and methods for search query processing using trend analysis | |
Aleman-Meza et al. | Context-aware semantic association ranking | |
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US7707201B2 (en) | Systems and methods for managing and using multiple concept networks for assisted search processing | |
JP4489994B2 (ja) | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 | |
US7340460B1 (en) | Vector analysis of histograms for units of a concept network in search query processing | |
US8768912B2 (en) | System and method for geographically organizing and classifying businesses on the world-wide web | |
US20080147642A1 (en) | System for discovering data artifacts in an on-line data object | |
CN107660283A (zh) | 用于在日志分析系统中实现日志解析器的方法和系统 | |
US20080147578A1 (en) | System for prioritizing search results retrieved in response to a computerized search query | |
JP2005535039A (ja) | 地理的なテキスト検索システムを備えたデスクトップクライアントとの対話 | |
JP2007122732A (ja) | ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法) | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
US20080147641A1 (en) | Method for prioritizing search results retrieved in response to a computerized search query | |
US20110270691A1 (en) | Method and system for providing url possible new advertising | |
JPWO2003042869A1 (ja) | 情報検索支援装置、コンピュータプログラム、プログラム格納媒体 | |
KR20000054312A (ko) | 맞춤 웹정보 구축 제공 방법 | |
Rehman et al. | Building socially-enabled event-enriched maps | |
Sahni et al. | Topic modeling on online news extraction | |
CN110781213B (zh) | 一种以人员为中心的多源海量数据关联搜索方法和系统 | |
Sanjana | Ad service detection-a comparative study using machine learning techniques | |
JP2003280945A (ja) | ログ解析システム,該ログ解析システムによる解析対象抽出方法および解析対象抽出プログラム | |
Chavda et al. | Recent trends and novel approaches in web usage mining | |
KR20240015280A (ko) | 트렌드 분석을 이용한 검색 쿼리 처리 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20120320 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20120427 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5020414 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |