JP2015528611A - 動的データ取得方法およびシステム - Google Patents
動的データ取得方法およびシステム Download PDFInfo
- Publication number
- JP2015528611A JP2015528611A JP2015532016A JP2015532016A JP2015528611A JP 2015528611 A JP2015528611 A JP 2015528611A JP 2015532016 A JP2015532016 A JP 2015532016A JP 2015532016 A JP2015532016 A JP 2015532016A JP 2015528611 A JP2015528611 A JP 2015528611A
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- search term
- score
- search
- characteristic factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004590 computer program Methods 0.000 claims abstract description 9
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 94
- 238000007405 data analysis Methods 0.000 claims description 58
- 238000012417 linear regression Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000000556 factor analysis Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 230000001737 promoting effect Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012806 monitoring device Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000003068 static effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000001824 photoionisation detection Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、すべての目的のために参照により本明細書に組み込まれる、発明の名称を「DYNAMIC ACQUISITION METHOD,DEVICE AND SYSTEM FOR DATA(データの動的取得方法、装置およびシステム)」とする、2012年9月13日に出願された中華人民共和国特許出願第201210339669.4号に基づく優先権を主張する。
本発明の種々の実施形態について、以下の詳細な説明および添付の図面において開示する。
適用例1:動的データ取得方法であって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信することと、を備える、方法。
適用例2:適用例1に記載の方法において、インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを含む、方法。
適用例3:適用例1に記載の方法において、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、方法。
適用例4:適用例1に記載の方法において、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、方法。
適用例5:適用例1に記載の方法において、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、方法。
適用例6:適用例1に記載の方法はさらに、前記閾値辞書を構築することを備え、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、方法。
適用例7:適用例6に記載の方法において、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore 0 を取得するために、線形回帰モデルScore 0 =F0(f 1 ,f 2 ,...,f i )を採用し、ここで、f i は前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore 1 を取得するために、線形回帰モデルScore 1 =F1(f’ 1 ,...,f’ k )を採用し、ここで、f’ k は前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p 1 は前記第1の閾値スコアの占有率であり、p 2 は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score 0 ,score 1 )×p 1 ×p 2 に基づいて、フィッティング計算を実行すること、を備える、方法。
適用例8:適用例1に記載の方法はさらに、前記インデックスデータテーブルを構築することを備え、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存し、
前記閾値データベース内のキーワードおよび対応する前記1つ以上の閾値スコアに基づいて、前記インデックスデータテーブルを作成すること、を備え、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを備える、方法。
適用例9:適用例1に記載の方法はさらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新すること、を備える、方法。
適用例10:動的データ取得システムであって、
少なくとも1つのプロセッサであって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信する、ように構成されている少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を供給するように構成されているメモリと、を備えるシステム。
適用例11:適用例10に記載のシステムにおいて、インデックスデータテーブルで、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを備える、システム。
適用例12:適用例10に記載のシステムにおいて、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、システム。
適用例13:適用例10に記載のシステムにおいて、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、システム。
適用例14:適用例10に記載のシステムにおいて、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、システム。
適用例15:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記閾値辞書を構築するように構成されており、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、システム。
適用例16:適用例15に記載のシステムにおいて、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore 0 を取得するために、線形回帰モデルScore 0 =F0(f 1 ,f 2 ,...,f i )を採用し、ここで、f i は前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore 1 を取得するために、線形回帰モデルScore 1 =F1(f’ 1 ,...,f’ k )を採用し、ここで、f’ k は前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p 1 は前記第1の閾値スコアの占有率であり、p 2 は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score 0 ,score 1 )×p 1 ×p 2 に基づいて、フィッティング計算を実行すること、を備える、システム。
適用例17:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記インデックスデータテーブルを構築するように構成されており、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存すること、を備える、システム。
適用例18:適用例17に記載のシステムにおいて、各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを含む、システム。
適用例19:適用例10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新する、ように構成されている、システム。
適用例20:データを動的に取得するためのコンピュータプログラム・プロダクトであって、前記コンピュータプログラム・プロダクトは、有形の非一時的コンピュータ可読記憶媒体内に具現化されており、
受信された検索要求文字列から検索語を抽出するためのコンピュータ命令と、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップするためのコンピュータ命令と、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用するためのコンピュータ命令と、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得するためのコンピュータ命令と、
ウェブサイトのページに表示させるために、前記データ情報を送信するためのコンピュータ命令と、を備える、コンピュータプログラム・プロダクト。
Claims (20)
- 動的データ取得方法であって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信することと、を備える、方法。 - 請求項1に記載の方法において、インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを含む、方法。 - 請求項1に記載の方法において、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、方法。
- 請求項1に記載の方法において、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、方法。
- 請求項1に記載の方法において、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、方法。
- 請求項1に記載の方法はさらに、前記閾値辞書を構築することを備え、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、方法。 - 請求項6に記載の方法において、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore0を取得するために、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用し、ここで、fiは前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore1を取得するために、線形回帰モデルScore1=F1(f’1,...,f’k)を採用し、ここで、f’kは前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p1は前記第1の閾値スコアの占有率であり、p2は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、フィッティング計算を実行すること、を備える、方法。 - 請求項1に記載の方法はさらに、前記インデックスデータテーブルを構築することを備え、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存し、
前記閾値データベース内のキーワードおよび対応する前記1つ以上の閾値スコアに基づいて、前記インデックスデータテーブルを作成すること、を備え、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを備える、方法。 - 請求項1に記載の方法はさらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新すること、を備える、方法。 - 動的データ取得システムであって、
少なくとも1つのプロセッサであって、
受信された検索要求文字列から検索語を抽出し、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップし、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用し、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得し、
ウェブサイトのページに表示させるために、前記データ情報を送信する、ように構成されている少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに接続され、前記少なくとも1つのプロセッサに命令を供給するように構成されているメモリと、を備えるシステム。 - 請求項10に記載のシステムにおいて、インデックスデータテーブルで、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアをフィルタ条件として使用することは、
前記検索語とマッチするキーワードが前記インデックスデータテーブル内に存在し、前記インデックスデータテーブルにおける前記キーワードの閾値スコアが、前記検索語の前記動的閾値スコア以上の大きさである場合に、1つ以上の対応するインデックス情報を取得することを備える、システム。 - 請求項10に記載のシステムにおいて、前記閾値辞書は、複数の検索語と、対応する複数の動的閾値スコアと、を含む、システム。
- 請求項10に記載のシステムにおいて、前記インデックスデータテーブルは、複数のキーワードと、対応する複数の、前記キーワードと前記データ情報との間の閾値スコアと、を含む、システム。
- 請求項10に記載のシステムにおいて、前記特性因子は、テキスト特性因子と、データ解析特性因子と、を含む、システム。
- 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記閾値辞書を構築するように構成されており、前記閾値辞書を構築することは、
各検索語のテキスト特性因子およびデータ解析特性因子をログ辞書から取得し、
各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行し、
前記検索語および各検索語の前記動的閾値スコアを、データ辞書形式で、前記閾値辞書に保存すること、を含み、
前記テキスト特性因子は、前記検索語と前記データ情報のマッチング特性重みであり、
前記データ解析特性因子は、前記検索語に対応する解析パラメータ特性重みである、システム。 - 請求項15に記載のシステムにおいて、各検索語の前記動的閾値スコアを取得するために、前記テキスト特性因子および前記データ解析特性因子に基づいて閾値計算を実行することは、
フィッティング計算を実行し、前記検索語の第1の閾値スコアScore0を取得するために、線形回帰モデルScore0=F0(f1,f2,...,fi)を採用し、ここで、fiは前記検索語に対応するテキスト特性因子であり、iはN以下の大きさの整数であり、Nは自然数であり、
フィッティング計算を実行し、前記検索語の第2の閾値スコアScore1を取得するために、線形回帰モデルScore1=F1(f’1,...,f’k)を採用し、ここで、f’kは前記検索語に対応するデータ解析特性因子であり、kはM以下の大きさの整数であり、Mは自然数であり、
前記検索語の前記動的閾値スコアを取得するために、p1は前記第1の閾値スコアの占有率であり、p2は前記第2の閾値スコアの占有率であるとして、線形回帰モデルScore=F(score0,score1)×p1×p2に基づいて、フィッティング計算を実行すること、を備える、システム。 - 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記インデックスデータテーブルを構築するように構成されており、前記インデックスデータテーブルを構築することは、
キーワードと、前記キーワードにバインドされた各データ情報のテキスト特性因子とを、入札管理サーバまたはログ辞書から取得し、
各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて閾値計算を実行し、
前記キーワードと、各キーワードに対応する前記1つ以上の閾値スコアとを、閾値データベースに保存すること、を備える、システム。 - 請求項17に記載のシステムにおいて、各キーワードに対応する1つ以上の閾値スコアを取得するために、前記テキスト特性因子に基づいて前記閾値計算を実行することは、前記キーワードの閾値スコアを取得するためのフィッティング計算を実行するために、fjは前記キーワードに対応する前記テキスト特性因子であり、jはJ以下の大きさの整数であり、Jは自然数であるとして、線形回帰モデルScore’=F’(f1,f2,...,fj)を採用することを含む、システム。
- 請求項10に記載のシステムにおいて、前記少なくとも1つのプロセッサは、さらに、
前記検索要求文字列を受信すること、および前記検索要求文字列から検索語を抽出することの前に、
ログ辞書の整合性を監視するためのリアルタイムメッセージを受信し、
前記特性因子が変化したことが検出された場合に、前記ログ辞書を更新する、ように構成されている、システム。 - データを動的に取得するためのコンピュータプログラム・プロダクトであって、前記コンピュータプログラム・プロダクトは、有形の非一時的コンピュータ可読記憶媒体内に具現化されており、
受信された検索要求文字列から検索語を抽出するためのコンピュータ命令と、
前記検索語に対応する動的閾値スコアを取得するために、閾値辞書で前記検索語をルックアップするためのコンピュータ命令と、
インデックスデータテーブルにおいて、1つ以上の対応するインデックス情報を取得するために、前記検索語をクエリ条件として使用し、前記検索語に対応する前記動的閾値スコアであって、特性因子に基づいて変化する前記動的閾値スコアをフィルタ条件として使用するためのコンピュータ命令と、
前記インデックスデータテーブル内の前記インデックス情報に基づいて、前記検索語に対応するデータ情報を取得するためのコンピュータ命令と、
ウェブサイトのページに表示させるために、前記データ情報を送信するためのコンピュータ命令と、を備える、コンピュータプログラム・プロダクト。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210339669.4A CN103678365B (zh) | 2012-09-13 | 2012-09-13 | 数据的动态获取方法、装置及系统 |
CN201210339669.4 | 2012-09-13 | ||
US14/022,634 | 2013-09-10 | ||
US14/022,634 US10025807B2 (en) | 2012-09-13 | 2013-09-10 | Dynamic data acquisition method and system |
PCT/US2013/059212 WO2014043200A2 (en) | 2012-09-13 | 2013-09-11 | Dynamic data acquisition method and system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015528611A true JP2015528611A (ja) | 2015-09-28 |
JP5916959B2 JP5916959B2 (ja) | 2016-05-11 |
Family
ID=50234435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015532016A Active JP5916959B2 (ja) | 2012-09-13 | 2013-09-11 | 動的データ取得方法およびシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US10025807B2 (ja) |
EP (1) | EP2895969A4 (ja) |
JP (1) | JP5916959B2 (ja) |
CN (1) | CN103678365B (ja) |
TW (1) | TWI567572B (ja) |
WO (1) | WO2014043200A2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10346769B1 (en) * | 2014-03-14 | 2019-07-09 | Walmart Apollo, Llc | System and method for dynamic attribute table |
US10733555B1 (en) | 2014-03-14 | 2020-08-04 | Walmart Apollo, Llc | Workflow coordinator |
US10565538B1 (en) | 2014-03-14 | 2020-02-18 | Walmart Apollo, Llc | Customer attribute exemption |
US9785712B1 (en) * | 2014-06-20 | 2017-10-10 | Amazon Technologies, Inc. | Multi-index search engines |
CN104504134B (zh) * | 2014-12-31 | 2017-10-27 | 北京国双科技有限公司 | 推广信息属性数据的获取方法和装置 |
CN105512230B (zh) * | 2015-11-30 | 2020-05-22 | 北京金山安全软件有限公司 | 数据存储方法及装置 |
CN105512232B (zh) * | 2015-11-30 | 2020-02-28 | 北京金山安全软件有限公司 | 数据存储方法及装置 |
CN106022163A (zh) * | 2016-05-17 | 2016-10-12 | 上海凭安网络科技有限公司 | 一种基于第三方自动混淆的查询方法及系统 |
US11200217B2 (en) * | 2016-05-26 | 2021-12-14 | Perfect Search Corporation | Structured document indexing and searching |
CN106021562B (zh) * | 2016-05-31 | 2019-05-24 | 北京京拍档科技有限公司 | 用于电商平台的基于主题相关的推荐方法 |
CN109934631B (zh) * | 2019-03-13 | 2022-03-25 | 联想(北京)有限公司 | 问答信息处理方法、装置及计算机设备 |
CN111897840A (zh) * | 2020-08-14 | 2020-11-06 | 北京字节跳动网络技术有限公司 | 一种数据搜索方法、装置、电子设备及存储介质 |
CN112000479B (zh) * | 2020-08-24 | 2022-11-25 | 辽宁省中科知产高新产业技术研究有限公司 | 一种基于大数据的处理方法、系统及服务器平台 |
CN112883225B (zh) * | 2021-02-02 | 2022-10-11 | 聚好看科技股份有限公司 | 一种媒体资源搜索、显示方法及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04262460A (ja) * | 1991-02-15 | 1992-09-17 | Ricoh Co Ltd | 情報検索装置 |
JPH09101991A (ja) * | 1995-07-31 | 1997-04-15 | Toshiba Corp | 情報フィルタリング装置 |
JP2005018530A (ja) * | 2003-06-27 | 2005-01-20 | Toshiba Corp | 情報処理装置、情報処理プログラム及び情報処理方法 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082426B2 (en) | 1993-06-18 | 2006-07-25 | Cnet Networks, Inc. | Content aggregation method and apparatus for an on-line product catalog |
US6714933B2 (en) | 2000-05-09 | 2004-03-30 | Cnet Networks, Inc. | Content aggregation method and apparatus for on-line purchasing system |
US5946678A (en) | 1995-01-11 | 1999-08-31 | Philips Electronics North America Corporation | User interface for document retrieval |
US6012053A (en) | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
JP3607462B2 (ja) | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
US6675159B1 (en) | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
US20020078045A1 (en) | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
US7398461B1 (en) * | 2002-01-24 | 2008-07-08 | Overture Services, Inc. | Method for ranking web page search results |
US7216121B2 (en) * | 2002-12-31 | 2007-05-08 | International Business Machines Corporation | Search engine facility with automated knowledge retrieval, generation and maintenance |
US7836010B2 (en) | 2003-07-30 | 2010-11-16 | Northwestern University | Method and system for assessing relevant properties of work contexts for use by information services |
US7505969B2 (en) | 2003-08-05 | 2009-03-17 | Cbs Interactive, Inc. | Product placement engine and method |
US7346615B2 (en) * | 2003-10-09 | 2008-03-18 | Google, Inc. | Using match confidence to adjust a performance threshold |
US20050131872A1 (en) | 2003-12-16 | 2005-06-16 | Microsoft Corporation | Query recognizer |
US7562068B2 (en) | 2004-06-30 | 2009-07-14 | Microsoft Corporation | System and method for ranking search results based on tracked user preferences |
US7603349B1 (en) | 2004-07-29 | 2009-10-13 | Yahoo! Inc. | User interfaces for search systems using in-line contextual queries |
WO2007064874A2 (en) | 2005-12-01 | 2007-06-07 | Adchemy, Inc. | Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy |
US7657506B2 (en) | 2006-01-03 | 2010-02-02 | Microsoft International Holdings B.V. | Methods and apparatus for automated matching and classification of data |
US7814112B2 (en) | 2006-06-09 | 2010-10-12 | Ebay Inc. | Determining relevancy and desirability of terms |
US20080059458A1 (en) | 2006-09-06 | 2008-03-06 | Byron Robert V | Folksonomy weighted search and advertisement placement system and method |
US20080097982A1 (en) | 2006-10-18 | 2008-04-24 | Yahoo! Inc. | System and method for classifying search queries |
US20080104101A1 (en) * | 2006-10-27 | 2008-05-01 | Kirshenbaum Evan R | Producing a feature in response to a received expression |
US7966309B2 (en) | 2007-01-17 | 2011-06-21 | Google Inc. | Providing relevance-ordered categories of information |
US20080263009A1 (en) | 2007-04-19 | 2008-10-23 | Buettner Raymond R | System and method for sharing of search query information across organizational boundaries |
US20080313142A1 (en) | 2007-06-14 | 2008-12-18 | Microsoft Corporation | Categorization of queries |
CN101378187B (zh) | 2007-08-29 | 2012-07-18 | 鸿富锦精密工业(深圳)有限公司 | 电源保护电路 |
CN100557612C (zh) | 2007-11-15 | 2009-11-04 | 深圳市迅雷网络技术有限公司 | 一种基于搜索引擎的搜索结果排序方法及装置 |
US7895206B2 (en) | 2008-03-05 | 2011-02-22 | Yahoo! Inc. | Search query categrization into verticals |
US7877404B2 (en) | 2008-03-05 | 2011-01-25 | Microsoft Corporation | Query classification based on query click logs |
US20100138402A1 (en) | 2008-12-02 | 2010-06-03 | Chacha Search, Inc. | Method and system for improving utilization of human searchers |
US8396742B1 (en) * | 2008-12-05 | 2013-03-12 | Covario, Inc. | System and method for optimizing paid search advertising campaigns based on natural search traffic |
US20100153366A1 (en) | 2008-12-15 | 2010-06-17 | Motorola, Inc. | Assigning an indexing weight to a search term |
CN102460470B (zh) * | 2009-06-11 | 2014-12-03 | 杜比实验室特许公司 | 基于指纹的内容识别趋势分析 |
CN102612691B (zh) * | 2009-09-18 | 2015-02-04 | 莱克西私人有限公司 | 给文本评分的方法和系统 |
CN102053983B (zh) * | 2009-11-02 | 2013-09-25 | 阿里巴巴集团控股有限公司 | 一种垂直搜索的查询方法、系统和装置 |
CN102054008A (zh) * | 2009-11-05 | 2011-05-11 | 北京四维图新科技股份有限公司 | 网络信息获取方法和装置 |
CN102289436B (zh) * | 2010-06-18 | 2013-12-25 | 阿里巴巴集团控股有限公司 | 确定搜索词权重值方法及装置、搜索结果生成方法及装置 |
CN102339296A (zh) | 2010-07-26 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 一种查询结果的排序方法和装置 |
CN102385585A (zh) * | 2010-08-27 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 网页数据库的建立方法、网页搜索方法以及相关装置 |
CN102411583B (zh) * | 2010-09-20 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
US10275782B2 (en) * | 2010-12-28 | 2019-04-30 | Excalibur Ip, Llc | Variation of minimum advertisement relevance quality threshold based on search query attributes |
US8977640B2 (en) * | 2011-02-28 | 2015-03-10 | Yahoo! Inc. | System for processing complex queries |
-
2012
- 2012-09-13 CN CN201210339669.4A patent/CN103678365B/zh active Active
- 2012-11-13 TW TW101142221A patent/TWI567572B/zh active
-
2013
- 2013-09-10 US US14/022,634 patent/US10025807B2/en active Active
- 2013-09-11 JP JP2015532016A patent/JP5916959B2/ja active Active
- 2013-09-11 WO PCT/US2013/059212 patent/WO2014043200A2/en active Application Filing
- 2013-09-11 EP EP13770565.3A patent/EP2895969A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04262460A (ja) * | 1991-02-15 | 1992-09-17 | Ricoh Co Ltd | 情報検索装置 |
JPH09101991A (ja) * | 1995-07-31 | 1997-04-15 | Toshiba Corp | 情報フィルタリング装置 |
JP2005018530A (ja) * | 2003-06-27 | 2005-01-20 | Toshiba Corp | 情報処理装置、情報処理プログラム及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103678365A (zh) | 2014-03-26 |
JP5916959B2 (ja) | 2016-05-11 |
TWI567572B (zh) | 2017-01-21 |
WO2014043200A2 (en) | 2014-03-20 |
TW201411380A (zh) | 2014-03-16 |
US20140074851A1 (en) | 2014-03-13 |
EP2895969A4 (en) | 2016-06-08 |
EP2895969A2 (en) | 2015-07-22 |
US10025807B2 (en) | 2018-07-17 |
CN103678365B (zh) | 2017-07-18 |
WO2014043200A3 (en) | 2014-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5916959B2 (ja) | 動的データ取得方法およびシステム | |
US10534781B2 (en) | Website traffic optimization | |
US10762539B2 (en) | Resource estimation for queries in large-scale distributed database system | |
JP6487201B2 (ja) | 推奨ページを生成するための方法及び装置 | |
US10332184B2 (en) | Personalized application recommendations | |
US10713311B2 (en) | Audience on networked devices | |
US10607271B1 (en) | Search platform with data driven search relevancy management | |
US20110258054A1 (en) | Automatic Generation of Bid Phrases for Online Advertising | |
KR20160020429A (ko) | 맥락적 모바일 애플리케이션 광고 기법 | |
CN106447419B (zh) | 基于特征选择的拜访者标识 | |
US20110295840A1 (en) | Generalized edit distance for queries | |
US10621616B2 (en) | Systems, methods, and devices for generating metrics associated with advertisement data objects | |
US20170024776A1 (en) | Externality-based advertisement bid and budget allocation adjustment | |
US20110131093A1 (en) | System and method for optimizing selection of online advertisements | |
US20180096067A1 (en) | Creation and optimization of resource contents | |
US20140214632A1 (en) | Smart Crowd Sourcing On Product Classification | |
US20180114156A1 (en) | Computer-based automatic tagging of user multimedia data to generate commercial sales lead | |
US20130179418A1 (en) | Search ranking features | |
CN109075987B (zh) | 优化数字组件分析系统 | |
US8799070B1 (en) | Generating synthetic advertisements for an electronic environment | |
US20160055203A1 (en) | Method for record selection to avoid negatively impacting latency | |
US10366414B1 (en) | Presentation of content items in view of commerciality | |
JP5846898B2 (ja) | 情報処理装置、情報処理方法、情報処理システム、及び、プログラム | |
JP5696113B2 (ja) | 情報推薦装置及び方法及びプログラム | |
US20140122257A1 (en) | Apparatus and method for interfacing with a plurality of publishers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150512 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5916959 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |