JP2016505178A - ユーザ参加による検索エンジンソーティング方法 - Google Patents
ユーザ参加による検索エンジンソーティング方法 Download PDFInfo
- Publication number
- JP2016505178A JP2016505178A JP2015552986A JP2015552986A JP2016505178A JP 2016505178 A JP2016505178 A JP 2016505178A JP 2015552986 A JP2015552986 A JP 2015552986A JP 2015552986 A JP2015552986 A JP 2015552986A JP 2016505178 A JP2016505178 A JP 2016505178A
- Authority
- JP
- Japan
- Prior art keywords
- user
- search engine
- data
- model
- engine sorting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本発明は、ソフトウェア技術分野におけるユーザ参加による検索エンジンソーティング方法に関するものであり、検検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法である。本発明に係るユーザ参加による検索エンジンソーティング方法によれば、ユーザの参加を強化することができ、検索情報に対してその他のユーザの参考として意見表示を行うことができるため、検索質量を効果的に向上することができ、ユーザは意見を参考して選択を行うことができるため、ユーザの検索時間を効果的に低減可能であり、作業効率及び情報獲得能力を向上することができる。
Description
本発明は、ソフト技術分野における、ユーザ参加による検索エンジンソーティング方法に関するものである。
中国インターネット情報センターの調査報告によると、82.5%のネットユーザは検索エンジンを利用しており、83.4%のネットユーザは検索エンジンを通じて新しいウェブサイトを知り得たという。このことから、検索エンジンは、一般のネット生活の中で重要な役割を果たしている。良好な検索エンジンは、膨大でゴミのような情報から有用な知識を見つけ出し、情報を選別、加工、抽出することにより情報価値を向上することができる。しかしながら、現在の検索エンジンのソーティングに関連する演算法が完備されていないため、ユーザは、大量のフィードバック情報から関連するウェブページを人工的に選別しなければならないのが一般的である。検索エンジンのナビゲーション機能は十分発揮していない。
検索エンジンの発展初期において、検索結果の配列は、単に検索エンジンがデータベースから見つけ出した対応ウェブページに基づいた前後順序だけであり、ユーザ検索との関連性については前に配列されたウェブページが大きいとは限らないため、ユーザが大量の情報から本当に関連する情報を素早く選別することには貢献できない。現在、検索エンジンがアクセスするウェブページ量は既に数十億の規模に達しており、検索結果には何千何万のウェブページが含まれているのが一般的である。たとえこれらのウェブページがユーザによって必要とされるものであるとしても、ユーザは、すべてのウェブページを見ることが不可能である。従って、ユーザが必要とする情報を素早く検索できるように、もっと関連するウェブページを前に配列させ、ユーザが見るウェブページの数を減らすことは、極めて有意義かつ挑戦性に富むことである。ユーザは通常、検索エンジンからフィードバックされた前に配列されたドキュメントにのみ関心を持っている。従って、検索エンジンの関連性ソーティング演算法に工夫し、ユーザの所望の結果を前に配列させることは、一層重要になってきている。
検索エンジンは、検索結果をフィードバックするのみならず、これらの結果に対して再加工を行い、どれがユーザの検索意図によりふさわしいか判断し、ユーザが最も興味を示すドキュメントを、ユーザが短い時間で必要とする情報を見つけ出すように前に配列させることで、検索エンジンのユーザ満足度を向上する必要がある。これは、検索エンジンの関連性ルールであり、既に検索エンジンの最も基本的ルールの一つとなっている。検索エンジンの関連性ソーティングモデルには、ブリンモデル、ベクトル空間モデル、確率モデル、ハイパーリングモデル、自己学習ソーティングモデルがある。ブリンモデルは、古典集合論及びブリン代数の基礎の上に確立されており、ドキュメントにおけるキーワード出現の有無に基づいてドキュメントが関連するか否かを判定するものであり、検索との関連性は、すべての関連ドキュメントが同じであるため、関連性ソーティングを支援しない。ベクトル空間モデルは、ドキュメント及びユーザの検索をそれぞれベクトル形態に変換し、2つのベクトルの夾角余弦を算出するとともに逓減の順序でドキュメントを配列する。確率モデルは、ドキュメントが検索に関連する確率を推定し、関連確率に基づいてすべてのドキュメントに対してソーティングを行う。ハイパーリンクモデルは、ウェブページ同士のハイパーリンクに基づいてウェブページのランキングを算出し、リンク数及びリンクページの質量からウェブページのレベルを判断する。自己学習ソーティングモデルは、マシーン学習の方法を検索エンジン関連性ソーティングの問題に応用することで、従来のモデルに存在した数多くの不具合を解決するものであり、トレーニングサンプルに基づいてソーティングモデルを学習して、ソーティングモデル予測が検索に関連するドキュメントに対してソーティングを行う。
現在、異なる検索エンジンには、異なる関連性ソーティング方法が使用されている。流行になっているのは二つの種類がある。一つにはハイパーリンク分析法であり、即ち、ウェブページがリンクされる回数が多くかつリンクされるサイトが影響力を持っているほど、このウェブページの質量は高くなる。もう一つには単語頻度統計法であり、すなわちウェブページドキュメントにおける検索単語の出現頻度が高いほど、そのランキングは上位になる。このほか、さらにクリック率法がある。即ちウェブページがクリックされる回数が多いほど、関連性は高くなる。いずれの検索エンジンも、ユーザによる検索に素早く応答し、ユーザの要求を満たす検索結果を検索ユーザにフィードバックすることを目的とする。ユーザ検索要求にもっとも関連する高質量ドキュメントをソーティング結果の上位に表示させることは、検索エンジン性能を評価するキー技術の一つとなっている。
本発明は、ユーザ参加による評価結果に基づいて評価結果に評点して参加ソーティングを評定することで、ユーザ参加による評価結果に基づいて対応する結果を容易に見つけ出すことができ、必要に応じて使用することができる、ユーザ参加による検索エンジンソーティング方法を提供することを目的とする。
上記の目的を実現するために、本発明の技術的特徴は以下の通りである。
本発明は、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法であって、
(1)ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザであり、
(2)検索エンジンソーティングシステムは、ユーザ参加による方法を採用し、完全な個性化検索エンジンソーティングに属し、ユーザに個性化サービスを提供しており、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理しており、オンライン即時検索エンジンソーティングと、モデル処理とを含み、オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザの個人情報を収集し、ユーザによる異なる表示リストに対する評価に基づいて興味を示すリスト内容を予測しており、ユーザが検索結果の一つの表示リストを選択した後、ユーザのシリーズ情報に基づいてユーザは同意、好き、同意せず、反対等の意見を示すことができ、
(3)モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上しており、
(4)入出力システム:個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する
ことを特徴とするユーザ参加による検索エンジンソーティング方法を提供する。
本発明は、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法であって、
(1)ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザであり、
(2)検索エンジンソーティングシステムは、ユーザ参加による方法を採用し、完全な個性化検索エンジンソーティングに属し、ユーザに個性化サービスを提供しており、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理しており、オンライン即時検索エンジンソーティングと、モデル処理とを含み、オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザの個人情報を収集し、ユーザによる異なる表示リストに対する評価に基づいて興味を示すリスト内容を予測しており、ユーザが検索結果の一つの表示リストを選択した後、ユーザのシリーズ情報に基づいてユーザは同意、好き、同意せず、反対等の意見を示すことができ、
(3)モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上しており、
(4)入出力システム:個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する
ことを特徴とするユーザ参加による検索エンジンソーティング方法を提供する。
上記システムが管理すべきデータは、所要の検索結果の表示リストに存在した大量のデータについて分析するものであり、主に入力データと、モデルデータと、出力データとを含んでおり、
(1)入力データ:システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものであり、前記ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含んでおり、検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測しており、該情報は主にリスト番号、リスト名称、期日、類型を含んでおり、検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集しており、ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価(同意、好き、同意せず、反対)または直接評点の形態を含んでおり、評価情報は、ユーザ標示、リスト番号、評点、時間標示を含んでおり、
(2)モデルデータは下記の2種類を有しており、
(I)モデル入力データ:検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要があり、前記ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態であり、リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型1と、類型2と、・・・類型Mとを含む形態に変換しており、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を1列の0−1ベクトルの形態に変換しており、ユーザ評点データは、ユーザ番号と、リスト評点1と、リスト評点2と、・・・評点Kとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
(II)モデル出力データ:検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、2つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト1評点と、リスト2評点と、・・・リストK評点とを含む分類の評点結果であり、
(3)出力データ:検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の3つの出力結果を生成しており、
(I)ユーザ予測評点データ:検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測しており、
(II)新規ユーザ評点データ:ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定する。
(1)入力データ:システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものであり、前記ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含んでおり、検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測しており、該情報は主にリスト番号、リスト名称、期日、類型を含んでおり、検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集しており、ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価(同意、好き、同意せず、反対)または直接評点の形態を含んでおり、評価情報は、ユーザ標示、リスト番号、評点、時間標示を含んでおり、
(2)モデルデータは下記の2種類を有しており、
(I)モデル入力データ:検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要があり、前記ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態であり、リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型1と、類型2と、・・・類型Mとを含む形態に変換しており、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を1列の0−1ベクトルの形態に変換しており、ユーザ評点データは、ユーザ番号と、リスト評点1と、リスト評点2と、・・・評点Kとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
(II)モデル出力データ:検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、2つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト1評点と、リスト2評点と、・・・リストK評点とを含む分類の評点結果であり、
(3)出力データ:検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の3つの出力結果を生成しており、
(I)ユーザ予測評点データ:検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測しており、
(II)新規ユーザ評点データ:ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定する。
上記モデル処理部分の処理プロセスにおいて、
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的であり、オフライン計算モデルを採用し、モデル出力結果を生成しており、オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックしており、モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
(1)データプリ処理:異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
(2)モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的であり、オフライン計算モデルを採用し、モデル出力結果を生成しており、オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックしており、モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
(1)データプリ処理:異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
(2)モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。
上記オンライン検索エンジンソーティングのプロセスにおいて、
個性化リスト検索エンジンソーティングシステムは主にユーザの個人嗜好に基づいて検索エンジンソーティングリストを行い、オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、
(1)モデル選択:検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に3つの検索エンジンソーティングを含む異なるモデルを選択しており、
(I)ユーザの検索エンジンソーティングを評点する:システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
(II)新規リスト検索エンジンソーティング:新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
(III)新規ユーザ検索エンジンソーティング:新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、2つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
(2)検索エンジンソーティング予測:
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて2つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。
個性化リスト検索エンジンソーティングシステムは主にユーザの個人嗜好に基づいて検索エンジンソーティングリストを行い、オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、
(1)モデル選択:検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に3つの検索エンジンソーティングを含む異なるモデルを選択しており、
(I)ユーザの検索エンジンソーティングを評点する:システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
(II)新規リスト検索エンジンソーティング:新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
(III)新規ユーザ検索エンジンソーティング:新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、2つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
(2)検索エンジンソーティング予測:
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて2つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。
本発明に係るユーザ参加による検索エンジンソーティング方法によれば、ユーザの参加を強化することができ、検索情報に対してその他のユーザの参考として意見表示を行うことができるため、検索質量を効果的に向上することができ、ユーザは意見を参考して選択を行うことができるため、ユーザの検索時間を効果的に低減可能であり、作業効率及び情報獲得能力を向上することができる。
以下、本発明の具体的な実施方法について、本発明の内容がより理解できるように図面及び実施例を参照しながら詳しく説明する。
(実施例)
本発明に係る検索エンジンソーティング方法は、検索エンジンソーティングシステムに基づいたものであり、そのシステムの構成は図1に示すようなものである。ある検索エンジンを例にすると、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させることができる。同時に、不正評点防止プログラムがインストールされている。図1に示すように、そのシステムは、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとを備えており、ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザである。検索エンジンソーティングシステム自身は複雑であるため、検索エンジンソーティング質量及び即時性を保証するため、合理的な検索エンジンソーティングシステムが要求されている。ユーザ参加による検索エンジンソーティングシステムは、完全個性化の検索エンジンソーティングに属し、合理的な演算法を採用しており、ユーザに個性化サービスを提供している。ここで、検索エンジンソーティングシステムは、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理する必要がある。検索エンジンソーティング方法の実行効率及び検索エンジンソーティングの即時性の要求を考量すると、システムは、オンライン即時検索エンジンソーティングと、モデル処理とを含む。オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、これにより検索エンジンソーティングシステムの実行効率の向上に有利になる。モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上する。図2は、本発明の実施例の検索エンジンにおけるオンライン評点フローである。
本発明に係る検索エンジンソーティング方法は、検索エンジンソーティングシステムに基づいたものであり、そのシステムの構成は図1に示すようなものである。ある検索エンジンを例にすると、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させることができる。同時に、不正評点防止プログラムがインストールされている。図1に示すように、そのシステムは、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとを備えており、ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザである。検索エンジンソーティングシステム自身は複雑であるため、検索エンジンソーティング質量及び即時性を保証するため、合理的な検索エンジンソーティングシステムが要求されている。ユーザ参加による検索エンジンソーティングシステムは、完全個性化の検索エンジンソーティングに属し、合理的な演算法を採用しており、ユーザに個性化サービスを提供している。ここで、検索エンジンソーティングシステムは、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理する必要がある。検索エンジンソーティング方法の実行効率及び検索エンジンソーティングの即時性の要求を考量すると、システムは、オンライン即時検索エンジンソーティングと、モデル処理とを含む。オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、これにより検索エンジンソーティングシステムの実行効率の向上に有利になる。モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上する。図2は、本発明の実施例の検索エンジンにおけるオンライン評点フローである。
検索エンジンソーティングシステムの適用性:
入出力システム:個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する。検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザ個人データを収集し、ユーザの異なる表示リストに対する評価に基づいて、興味を示す可能性のあるリスト内容を予測する。検索エンジンソーティングシステムの目的は、ユーザが評価を容易に選択するために、検索の選択を促進する。異なる検索エンジンソーティング技術は、特定の類型の検索エンジンソーティングシステムにおいて好ましい効果があるため、一定の適用性範囲を有する。検索結果の表示リストにとっては、一般に、規定の形式により全面的に説明するのではなく、ユーザの体験に基づいて説明する。ユーザは、検索結果の一つの表示リストを選択した後、ユーザの一連の情報に基づいて、賛成、好き、賛成せず、反対等の意見を示すことができる。図3は、本発明の実施例におけるリスト及びユーザ評点のフローである。
入出力システム:個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する。検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザ個人データを収集し、ユーザの異なる表示リストに対する評価に基づいて、興味を示す可能性のあるリスト内容を予測する。検索エンジンソーティングシステムの目的は、ユーザが評価を容易に選択するために、検索の選択を促進する。異なる検索エンジンソーティング技術は、特定の類型の検索エンジンソーティングシステムにおいて好ましい効果があるため、一定の適用性範囲を有する。検索結果の表示リストにとっては、一般に、規定の形式により全面的に説明するのではなく、ユーザの体験に基づいて説明する。ユーザは、検索結果の一つの表示リストを選択した後、ユーザの一連の情報に基づいて、賛成、好き、賛成せず、反対等の意見を示すことができる。図3は、本発明の実施例におけるリスト及びユーザ評点のフローである。
上記システムが管理すべきデータ及び実行プロセスは以下の通りである:システムは、検索すべき結果の表示リストに存在した大量のデータについて分析し、システムが管理するデータは、主に入力データと、モデルデータと、出力データとを含む。
(1)入力データ:システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものである。ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含む。表示リスト情報:検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測する必要がある。該システムは表示リストの検索エンジンについてソーティングするため、該情報は主にリスト番号、リスト名称、期日、類型を含む。上記ユーザ評価情報:検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集する。ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価(同意、好き、同意せず、反対)または直接評点の形態を含む。ユーザのリスト情報に対する評点方法:評価情報は、ユーザ標示、リスト番号、評点、時間標示を含む。
(2)モデルデータは下記の2種類を有しており、
(I)モデル入力データ:検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要がある。ここで、ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態である。リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型1と、類型2と、・・・類型Mとを含む形態に変換する。ここで、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を1列の0−1ベクトルの形態に変換する。ユーザ評点データは、ユーザ番号と、リスト評点1と、リスト評点2と、・・・評点Kとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
(I)モデル入力データ:検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要がある。ここで、ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態である。リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型1と、類型2と、・・・類型Mとを含む形態に変換する。ここで、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を1列の0−1ベクトルの形態に変換する。ユーザ評点データは、ユーザ番号と、リスト評点1と、リスト評点2と、・・・評点Kとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
(II)モデル出力データ:モデル構成データ:検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、2つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト1評点と、リスト2評点と、・・・リストK評点とを含む分類の評点結果である。
(3)出力データ:検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の3つの出力結果を生成しており、
(I)ユーザ予測評点データ:検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測する。
(I)ユーザ予測評点データ:検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測する。
(II)新規ユーザ評点データ:ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定する。
モデル処理部分:
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的である。リストウェブサイトのデータ量は膨大で、増加が速いため、演算法モデルにおける処理には時間がかかる。システムのエネルギー消費が極めて大きいため、検索エンジンソーティングの即時性に影響を大きく及ぼしている。従って、検索エンジンソーティングシステムは、オフライン計算モデルを採用し、モデル出力結果を生成する。オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックする。モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的である。リストウェブサイトのデータ量は膨大で、増加が速いため、演算法モデルにおける処理には時間がかかる。システムのエネルギー消費が極めて大きいため、検索エンジンソーティングの即時性に影響を大きく及ぼしている。従って、検索エンジンソーティングシステムは、オフライン計算モデルを採用し、モデル出力結果を生成する。オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックする。モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
(1)データプリ処理:異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
(2)モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。
(2)モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。
オンライン検索エンジンソーティング部分:
個性化リスト検索エンジンソーティングシステムの主な機能はユーザ個人嗜好に基づいて検索エンジンソーティングリストを行う。オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、図3、4に示すようなものである。
個性化リスト検索エンジンソーティングシステムの主な機能はユーザ個人嗜好に基づいて検索エンジンソーティングリストを行う。オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、図3、4に示すようなものである。
(1)モデル選択:検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に3つの検索エンジンソーティングを含む異なるモデルを選択しており、
(I)ユーザの検索エンジンソーティングを評点する:システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
(II)新規リスト検索エンジンソーティング:新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
(III)新規ユーザ検索エンジンソーティング:新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、2つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
(I)ユーザの検索エンジンソーティングを評点する:システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
(II)新規リスト検索エンジンソーティング:新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
(III)新規ユーザ検索エンジンソーティング:新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、2つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
(2)検索エンジンソーティング予測:
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて2つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて2つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。
上述したものは、本発明の好ましい実施例に過ぎず、本発明の実施の範囲を限定するためのものではなく、本発明の明細書及び図面内容に基づいてなされた均等な変更および付加は、いずれも本発明の特許請求の範囲内に含まれるものとする。
Claims (4)
- 検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法であって、
(1)ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザであり、
(2)検索エンジンソーティングシステムは、ユーザ参加による方法を採用し、完全な個性化検索エンジンソーティングに属し、ユーザに個性化サービスを提供しており、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理しており、オンライン即時検索エンジンソーティングと、モデル処理とを含み、オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザの個人情報を収集し、ユーザによる異なる表示リストに対する評価に基づいて興味を示すリスト内容を予測しており、ユーザが検索結果の一つの表示リストを選択した後、ユーザのシリーズ情報に基づいてユーザは同意、好き、同意せず、反対等の意見を示すことができ、
(3)モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上しており、
(4)入出力システム:個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する、
ことを特徴とするユーザ参加による検索エンジンソーティング方法。 - 前記システムが管理すべきデータは、主に入力データと、モデルデータと、出力データとを含んでおり、
(1)入力データ:システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものであり、前記ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含んでおり、検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測しており、該情報は主にリスト番号、リスト名称、期日、類型を含んでおり、検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集しており、ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価(同意、好き、同意せず、反対)または直接評点の形態を含んでおり、評価情報は、ユーザ標示、リスト番号、評点、時間標示を含んでおり、
(2)モデルデータは下記の2種類を有しており、
(I)モデル入力データ:検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要があり、前記ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態であり、リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型1と、類型2と、・・・類型Mとを含む形態に変換しており、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を1列の0−1ベクトルの形態に変換しており、ユーザ評点データは、ユーザ番号と、リスト評点1と、リスト評点2と、・・・評点Kとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
(II)モデル出力データ:検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、2つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト1評点と、リスト2評点と、・・・リストK評点とを含む分類の評点結果であり、
(3)出力データ:検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の3つの出力結果を生成しており、
(I)ユーザ予測評点データ:検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測しており、
(II)新規ユーザ評点データ:ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定することを特徴とする請求項1に記載のユーザ参加による検索エンジンソーティング方法。 - 前記モデル処理部分の処理プロセスにおいて、
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的であり、オフライン計算モデルを採用し、モデル出力結果を生成しており、オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックしており、モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
(1)データプリ処理:異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
(2)モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含むことを特徴とする請求項1に記載のユーザ参加による検索エンジンソーティング方法。 - 前記オンライン検索エンジンソーティングのプロセスにおいて、オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、
(1)モデル選択:検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に3つの検索エンジンソーティングを含む異なるモデルを選択しており、
(I)ユーザの検索エンジンソーティングを評点する:システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
(II)新規リスト検索エンジンソーティング:新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
(III)新規ユーザ検索エンジンソーティング:新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、2つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
(2)検索エンジンソーティング予測:
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて2つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成することを特徴とする請求項1に記載のユーザ参加による検索エンジンソーティング方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310693680.5A CN103646092B (zh) | 2013-12-18 | 2013-12-18 | 基于用户参与的搜索引擎排序方法 |
CN201310693680.5 | 2013-12-18 | ||
PCT/CN2013/090350 WO2015089860A1 (zh) | 2013-12-18 | 2013-12-24 | 基于用户参与的搜索引擎排序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016505178A true JP2016505178A (ja) | 2016-02-18 |
Family
ID=50251306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015552986A Pending JP2016505178A (ja) | 2013-12-18 | 2013-12-24 | ユーザ参加による検索エンジンソーティング方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20150379135A1 (ja) |
EP (1) | EP2902923A4 (ja) |
JP (1) | JP2016505178A (ja) |
CN (1) | CN103646092B (ja) |
RU (1) | RU2015110455A (ja) |
WO (1) | WO2015089860A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104348628A (zh) * | 2014-12-01 | 2015-02-11 | 北京奇虎科技有限公司 | 获取本机Root权限的方法和装置 |
CN104346576A (zh) * | 2014-12-01 | 2015-02-11 | 北京奇虎科技有限公司 | 提权配置信息反馈、匹配方法及相应的装置 |
US10015269B2 (en) | 2014-12-09 | 2018-07-03 | Xiaomi Inc. | Method and device for providing contact information |
CN105069653A (zh) * | 2015-08-07 | 2015-11-18 | 合肥工业大学 | 一种针对推荐系统解释的交互方法 |
CN106909412A (zh) * | 2015-12-23 | 2017-06-30 | 北京奇虎科技有限公司 | 一种终端设备的root方法、配置方法、终端设备和服务器 |
CN106060637A (zh) * | 2016-06-29 | 2016-10-26 | 乐视控股(北京)有限公司 | 视频推荐方法、装置及系统 |
CN106547816B (zh) * | 2016-09-27 | 2019-10-18 | 河海大学 | 一种基于负相关反馈的时间序列相似性搜索方法 |
CN107122467B (zh) * | 2017-04-26 | 2020-12-29 | 努比亚技术有限公司 | 一种搜索引擎的检索结果评价方法及装置、计算机可读介质 |
KR101804960B1 (ko) * | 2017-06-08 | 2017-12-06 | 윤성민 | 집단지성 수렴 시스템 및 그 방법 |
CN110020096B (zh) * | 2017-07-24 | 2021-09-07 | 北京国双科技有限公司 | 基于查询的分类器训练方法和装置 |
CN109948032A (zh) * | 2017-08-21 | 2019-06-28 | 李华林 | 基于用户偏好的网络搜索结果排名装置、搜索引擎及浏览器 |
CN109934648A (zh) * | 2017-12-15 | 2019-06-25 | 中国移动通信集团公司 | 一种基于信息协同过滤算法的集团产品推荐方法及装置 |
CN108446964B (zh) * | 2018-03-30 | 2022-03-22 | 中南大学 | 一种基于移动流量dpi数据的用户推荐方法 |
US20190325069A1 (en) * | 2018-04-18 | 2019-10-24 | Microsoft Technology Licensing, Llc | Impression-tailored computer search result page visual structures |
CN110765345B (zh) * | 2018-07-10 | 2023-04-25 | 阿里巴巴集团控股有限公司 | 搜索方法、装置以及设备 |
CN109104301A (zh) * | 2018-07-19 | 2018-12-28 | 国政通科技有限公司 | 一种基于深度学习模型针对综艺节目进行网络热度预测的方法和系统 |
CN109034895A (zh) * | 2018-07-23 | 2018-12-18 | 中国联合网络通信集团有限公司 | 一种搜索结果评分方法和系统 |
CN109189904A (zh) * | 2018-08-10 | 2019-01-11 | 上海中彦信息科技股份有限公司 | 个性化搜索方法及系统 |
CN109740140B (zh) * | 2018-12-28 | 2023-07-11 | 北京百度网讯科技有限公司 | 页面排版方法、装置和计算机设备 |
CN116501969B (zh) * | 2023-04-28 | 2024-01-30 | 北京泰茂科技股份有限公司 | 一种基于个性化推荐算法的医药数据搜索系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006218A (en) * | 1997-02-28 | 1999-12-21 | Microsoft | Methods and apparatus for retrieving and/or processing retrieved information as a function of a user's estimated knowledge |
EP1866738A4 (en) * | 2005-03-18 | 2010-09-15 | Search Engine Technologies Llc | USER FEEDBACK RESEARCH ENGINE FOR IMPROVING RESEARCH RESULTS |
CN101169797B (zh) * | 2007-11-30 | 2010-04-07 | 朱廷劭 | 一种用于搜索的方法 |
CN101661476A (zh) * | 2008-08-26 | 2010-03-03 | 华为技术有限公司 | 一种搜索方法和系统 |
CN101661487B (zh) * | 2008-08-27 | 2012-08-08 | 国际商业机器公司 | 对信息项进行搜索的方法和系统 |
CN102081604A (zh) * | 2009-11-27 | 2011-06-01 | 上海电机学院 | 一种用于元搜索引擎的搜索方法及其装置 |
US20110196733A1 (en) * | 2010-02-05 | 2011-08-11 | Wei Li | Optimizing Advertisement Selection in Contextual Advertising Systems |
CN101968799B (zh) * | 2010-09-21 | 2012-02-08 | 百度在线网络技术(北京)有限公司 | 一种基于搜索引擎的用户交互方法及系统 |
US9665643B2 (en) * | 2011-12-30 | 2017-05-30 | Microsoft Technology Licensing, Llc | Knowledge-based entity detection and disambiguation |
-
2013
- 2013-12-18 CN CN201310693680.5A patent/CN103646092B/zh active Active
- 2013-12-24 WO PCT/CN2013/090350 patent/WO2015089860A1/zh active Application Filing
- 2013-12-24 EP EP13890864.5A patent/EP2902923A4/en not_active Withdrawn
- 2013-12-24 US US14/410,252 patent/US20150379135A1/en not_active Abandoned
- 2013-12-24 RU RU2015110455A patent/RU2015110455A/ru not_active Application Discontinuation
- 2013-12-24 JP JP2015552986A patent/JP2016505178A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2015089860A1 (zh) | 2015-06-25 |
EP2902923A4 (en) | 2016-10-26 |
EP2902923A1 (en) | 2015-08-05 |
RU2015110455A (ru) | 2016-10-10 |
CN103646092B (zh) | 2017-07-04 |
CN103646092A (zh) | 2014-03-19 |
US20150379135A1 (en) | 2015-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016505178A (ja) | ユーザ参加による検索エンジンソーティング方法 | |
US11507551B2 (en) | Analytics based on scalable hierarchical categorization of web content | |
US8266162B2 (en) | Automatic identification of related search keywords | |
Wen et al. | A hybrid approach for personalized recommendation of news on the Web | |
US8676811B2 (en) | Method and apparatus of generating update parameters and displaying correlated keywords | |
JP5449466B2 (ja) | 情報処理システム、類似カテゴリ特定方法、およびプログラム | |
CN106599065B (zh) | 一种基于Storm分布式框架的食品安全网络舆情预警系统 | |
US20110082863A1 (en) | Semantic analysis of documents to rank terms | |
US20080243838A1 (en) | Combining domain-tuned search systems | |
Ponnuswami et al. | On composition of a federated web search result page: using online users to provide pairwise preference for heterogeneous verticals | |
Wu et al. | An approach of product usability evaluation based on Web mining in feature fatigue analysis | |
JP2006227965A (ja) | トレンド予測装置およびトレンド予測方法 | |
JP6723673B2 (ja) | 因果関係抽出システムおよび因果関係抽出プログラム | |
WO2015066591A1 (en) | Ranking information providers | |
US20180139296A1 (en) | Method of producing browsing attributes of users, and non-transitory computer-readable storage medium | |
CN108205572A (zh) | 一种搜索方法、装置及设备 | |
Lin et al. | A consumer review-driven recommender service for web e-commerce | |
Li et al. | CoWS: An Internet-enriched and quality-aware Web services search engine | |
Gleason et al. | Google the gatekeeper: how search components affect clicks and attention | |
US10013699B1 (en) | Reverse associate website discovery | |
Trappey et al. | Using Web Mining and Perceptual Mapping to Support Customer-Oriented Product Positions Designs | |
WO2020057237A1 (zh) | 适用于关注对象的影响力检测方法、电子终端及存储介质 | |
Kang et al. | Modeling web crawler wrappers to collect user reviews on shopping mall with various hierarchical tree structure | |
Ramzan et al. | An Intelligent Data Analytics based Model Driven Recommendation System. | |
Anugrah et al. | Sentiment Analysis Of Internet Service Providers Using Naïve Bayes Based On Particle Swarm Optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160715 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20161018 |