JP2016505178A

JP2016505178A - ユーザ参加による検索エンジンソーティング方法

Info

Publication number: JP2016505178A
Application number: JP2015552986A
Authority: JP
Inventors: ヤンチゥンスン，
Original assignee: Sun Yanqun
Current assignee: Sun Yanqun
Priority date: 2013-12-18
Filing date: 2013-12-24
Publication date: 2016-02-18
Also published as: WO2015089860A1; EP2902923A4; EP2902923A1; RU2015110455A; CN103646092B; CN103646092A; US20150379135A1

Abstract

本発明は、ソフトウェア技術分野におけるユーザ参加による検索エンジンソーティング方法に関するものであり、検検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法である。本発明に係るユーザ参加による検索エンジンソーティング方法によれば、ユーザの参加を強化することができ、検索情報に対してその他のユーザの参考として意見表示を行うことができるため、検索質量を効果的に向上することができ、ユーザは意見を参考して選択を行うことができるため、ユーザの検索時間を効果的に低減可能であり、作業効率及び情報獲得能力を向上することができる。

Description

本発明は、ソフト技術分野における、ユーザ参加による検索エンジンソーティング方法に関するものである。

中国インターネット情報センターの調査報告によると、８２．５％のネットユーザは検索エンジンを利用しており、８３．４％のネットユーザは検索エンジンを通じて新しいウェブサイトを知り得たという。このことから、検索エンジンは、一般のネット生活の中で重要な役割を果たしている。良好な検索エンジンは、膨大でゴミのような情報から有用な知識を見つけ出し、情報を選別、加工、抽出することにより情報価値を向上することができる。しかしながら、現在の検索エンジンのソーティングに関連する演算法が完備されていないため、ユーザは、大量のフィードバック情報から関連するウェブページを人工的に選別しなければならないのが一般的である。検索エンジンのナビゲーション機能は十分発揮していない。

検索エンジンの発展初期において、検索結果の配列は、単に検索エンジンがデータベースから見つけ出した対応ウェブページに基づいた前後順序だけであり、ユーザ検索との関連性については前に配列されたウェブページが大きいとは限らないため、ユーザが大量の情報から本当に関連する情報を素早く選別することには貢献できない。現在、検索エンジンがアクセスするウェブページ量は既に数十億の規模に達しており、検索結果には何千何万のウェブページが含まれているのが一般的である。たとえこれらのウェブページがユーザによって必要とされるものであるとしても、ユーザは、すべてのウェブページを見ることが不可能である。従って、ユーザが必要とする情報を素早く検索できるように、もっと関連するウェブページを前に配列させ、ユーザが見るウェブページの数を減らすことは、極めて有意義かつ挑戦性に富むことである。ユーザは通常、検索エンジンからフィードバックされた前に配列されたドキュメントにのみ関心を持っている。従って、検索エンジンの関連性ソーティング演算法に工夫し、ユーザの所望の結果を前に配列させることは、一層重要になってきている。

検索エンジンは、検索結果をフィードバックするのみならず、これらの結果に対して再加工を行い、どれがユーザの検索意図によりふさわしいか判断し、ユーザが最も興味を示すドキュメントを、ユーザが短い時間で必要とする情報を見つけ出すように前に配列させることで、検索エンジンのユーザ満足度を向上する必要がある。これは、検索エンジンの関連性ルールであり、既に検索エンジンの最も基本的ルールの一つとなっている。検索エンジンの関連性ソーティングモデルには、ブリンモデル、ベクトル空間モデル、確率モデル、ハイパーリングモデル、自己学習ソーティングモデルがある。ブリンモデルは、古典集合論及びブリン代数の基礎の上に確立されており、ドキュメントにおけるキーワード出現の有無に基づいてドキュメントが関連するか否かを判定するものであり、検索との関連性は、すべての関連ドキュメントが同じであるため、関連性ソーティングを支援しない。ベクトル空間モデルは、ドキュメント及びユーザの検索をそれぞれベクトル形態に変換し、２つのベクトルの夾角余弦を算出するとともに逓減の順序でドキュメントを配列する。確率モデルは、ドキュメントが検索に関連する確率を推定し、関連確率に基づいてすべてのドキュメントに対してソーティングを行う。ハイパーリンクモデルは、ウェブページ同士のハイパーリンクに基づいてウェブページのランキングを算出し、リンク数及びリンクページの質量からウェブページのレベルを判断する。自己学習ソーティングモデルは、マシーン学習の方法を検索エンジン関連性ソーティングの問題に応用することで、従来のモデルに存在した数多くの不具合を解決するものであり、トレーニングサンプルに基づいてソーティングモデルを学習して、ソーティングモデル予測が検索に関連するドキュメントに対してソーティングを行う。

現在、異なる検索エンジンには、異なる関連性ソーティング方法が使用されている。流行になっているのは二つの種類がある。一つにはハイパーリンク分析法であり、即ち、ウェブページがリンクされる回数が多くかつリンクされるサイトが影響力を持っているほど、このウェブページの質量は高くなる。もう一つには単語頻度統計法であり、すなわちウェブページドキュメントにおける検索単語の出現頻度が高いほど、そのランキングは上位になる。このほか、さらにクリック率法がある。即ちウェブページがクリックされる回数が多いほど、関連性は高くなる。いずれの検索エンジンも、ユーザによる検索に素早く応答し、ユーザの要求を満たす検索結果を検索ユーザにフィードバックすることを目的とする。ユーザ検索要求にもっとも関連する高質量ドキュメントをソーティング結果の上位に表示させることは、検索エンジン性能を評価するキー技術の一つとなっている。

本発明は、ユーザ参加による評価結果に基づいて評価結果に評点して参加ソーティングを評定することで、ユーザ参加による評価結果に基づいて対応する結果を容易に見つけ出すことができ、必要に応じて使用することができる、ユーザ参加による検索エンジンソーティング方法を提供することを目的とする。

上記の目的を実現するために、本発明の技術的特徴は以下の通りである。
本発明は、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法であって、
（１）ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザであり、
（２）検索エンジンソーティングシステムは、ユーザ参加による方法を採用し、完全な個性化検索エンジンソーティングに属し、ユーザに個性化サービスを提供しており、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理しており、オンライン即時検索エンジンソーティングと、モデル処理とを含み、オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザの個人情報を収集し、ユーザによる異なる表示リストに対する評価に基づいて興味を示すリスト内容を予測しており、ユーザが検索結果の一つの表示リストを選択した後、ユーザのシリーズ情報に基づいてユーザは同意、好き、同意せず、反対等の意見を示すことができ、
（３）モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上しており、
（４）入出力システム：個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する
ことを特徴とするユーザ参加による検索エンジンソーティング方法を提供する。

上記システムが管理すべきデータは、所要の検索結果の表示リストに存在した大量のデータについて分析するものであり、主に入力データと、モデルデータと、出力データとを含んでおり、
（１）入力データ：システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものであり、前記ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含んでおり、検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測しており、該情報は主にリスト番号、リスト名称、期日、類型を含んでおり、検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集しており、ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価（同意、好き、同意せず、反対）または直接評点の形態を含んでおり、評価情報は、ユーザ標示、リスト番号、評点、時間標示を含んでおり、
（２）モデルデータは下記の２種類を有しており、
（Ｉ）モデル入力データ：検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要があり、前記ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態であり、リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型１と、類型２と、・・・類型Ｍとを含む形態に変換しており、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を１列の０−１ベクトルの形態に変換しており、ユーザ評点データは、ユーザ番号と、リスト評点１と、リスト評点２と、・・・評点Ｋとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
（ＩＩ）モデル出力データ：検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、２つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト１評点と、リスト２評点と、・・・リストＫ評点とを含む分類の評点結果であり、
（３）出力データ：検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の３つの出力結果を生成しており、
（Ｉ）ユーザ予測評点データ：検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測しており、
（ＩＩ）新規ユーザ評点データ：ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定する。

上記モデル処理部分の処理プロセスにおいて、
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的であり、オフライン計算モデルを採用し、モデル出力結果を生成しており、オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックしており、モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
（１）データプリ処理：異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
（２）モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。

上記オンライン検索エンジンソーティングのプロセスにおいて、
個性化リスト検索エンジンソーティングシステムは主にユーザの個人嗜好に基づいて検索エンジンソーティングリストを行い、オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、
（１）モデル選択：検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に３つの検索エンジンソーティングを含む異なるモデルを選択しており、
（Ｉ）ユーザの検索エンジンソーティングを評点する：システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
（ＩＩ）新規リスト検索エンジンソーティング：新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
（ＩＩＩ）新規ユーザ検索エンジンソーティング：新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、２つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
（２）検索エンジンソーティング予測：
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて２つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。

本発明に係るユーザ参加による検索エンジンソーティング方法によれば、ユーザの参加を強化することができ、検索情報に対してその他のユーザの参考として意見表示を行うことができるため、検索質量を効果的に向上することができ、ユーザは意見を参考して選択を行うことができるため、ユーザの検索時間を効果的に低減可能であり、作業効率及び情報獲得能力を向上することができる。

本発明の実施例において使用される検索エンジンの模式図である。本発明の実施例において使用される検索エンジンにおけるオンライン評点フローである。本発明の実施例においてリスト及びユーザの評点フローである。本発明の実施例においてリスト及び新規ユーザの評点フローである。

以下、本発明の具体的な実施方法について、本発明の内容がより理解できるように図面及び実施例を参照しながら詳しく説明する。

（実施例）
本発明に係る検索エンジンソーティング方法は、検索エンジンソーティングシステムに基づいたものであり、そのシステムの構成は図１に示すようなものである。ある検索エンジンを例にすると、検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させることができる。同時に、不正評点防止プログラムがインストールされている。図１に示すように、そのシステムは、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとを備えており、ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザである。検索エンジンソーティングシステム自身は複雑であるため、検索エンジンソーティング質量及び即時性を保証するため、合理的な検索エンジンソーティングシステムが要求されている。ユーザ参加による検索エンジンソーティングシステムは、完全個性化の検索エンジンソーティングに属し、合理的な演算法を採用しており、ユーザに個性化サービスを提供している。ここで、検索エンジンソーティングシステムは、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理する必要がある。検索エンジンソーティング方法の実行効率及び検索エンジンソーティングの即時性の要求を考量すると、システムは、オンライン即時検索エンジンソーティングと、モデル処理とを含む。オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、これにより検索エンジンソーティングシステムの実行効率の向上に有利になる。モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上する。図２は、本発明の実施例の検索エンジンにおけるオンライン評点フローである。

検索エンジンソーティングシステムの適用性：
入出力システム：個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する。検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザ個人データを収集し、ユーザの異なる表示リストに対する評価に基づいて、興味を示す可能性のあるリスト内容を予測する。検索エンジンソーティングシステムの目的は、ユーザが評価を容易に選択するために、検索の選択を促進する。異なる検索エンジンソーティング技術は、特定の類型の検索エンジンソーティングシステムにおいて好ましい効果があるため、一定の適用性範囲を有する。検索結果の表示リストにとっては、一般に、規定の形式により全面的に説明するのではなく、ユーザの体験に基づいて説明する。ユーザは、検索結果の一つの表示リストを選択した後、ユーザの一連の情報に基づいて、賛成、好き、賛成せず、反対等の意見を示すことができる。図３は、本発明の実施例におけるリスト及びユーザ評点のフローである。

上記システムが管理すべきデータ及び実行プロセスは以下の通りである：システムは、検索すべき結果の表示リストに存在した大量のデータについて分析し、システムが管理するデータは、主に入力データと、モデルデータと、出力データとを含む。

（１）入力データ：システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものである。ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含む。表示リスト情報：検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測する必要がある。該システムは表示リストの検索エンジンについてソーティングするため、該情報は主にリスト番号、リスト名称、期日、類型を含む。上記ユーザ評価情報：検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集する。ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価（同意、好き、同意せず、反対）または直接評点の形態を含む。ユーザのリスト情報に対する評点方法：評価情報は、ユーザ標示、リスト番号、評点、時間標示を含む。

（２）モデルデータは下記の２種類を有しており、
（Ｉ）モデル入力データ：検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要がある。ここで、ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態である。リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型１と、類型２と、・・・類型Ｍとを含む形態に変換する。ここで、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を１列の０−１ベクトルの形態に変換する。ユーザ評点データは、ユーザ番号と、リスト評点１と、リスト評点２と、・・・評点Ｋとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、

（ＩＩ）モデル出力データ：モデル構成データ：検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、２つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト１評点と、リスト２評点と、・・・リストＫ評点とを含む分類の評点結果である。

（３）出力データ：検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の３つの出力結果を生成しており、
（Ｉ）ユーザ予測評点データ：検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測する。

（ＩＩ）新規ユーザ評点データ：ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定する。

モデル処理部分：
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的である。リストウェブサイトのデータ量は膨大で、増加が速いため、演算法モデルにおける処理には時間がかかる。システムのエネルギー消費が極めて大きいため、検索エンジンソーティングの即時性に影響を大きく及ぼしている。従って、検索エンジンソーティングシステムは、オフライン計算モデルを採用し、モデル出力結果を生成する。オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックする。モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、

（１）データプリ処理：異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
（２）モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含む。

オンライン検索エンジンソーティング部分：
個性化リスト検索エンジンソーティングシステムの主な機能はユーザ個人嗜好に基づいて検索エンジンソーティングリストを行う。オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、図３、４に示すようなものである。

（１）モデル選択：検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に３つの検索エンジンソーティングを含む異なるモデルを選択しており、
（Ｉ）ユーザの検索エンジンソーティングを評点する：システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
（ＩＩ）新規リスト検索エンジンソーティング：新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
（ＩＩＩ）新規ユーザ検索エンジンソーティング：新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、２つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、

（２）検索エンジンソーティング予測：
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて２つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成する。

上述したものは、本発明の好ましい実施例に過ぎず、本発明の実施の範囲を限定するためのものではなく、本発明の明細書及び図面内容に基づいてなされた均等な変更および付加は、いずれも本発明の特許請求の範囲内に含まれるものとする。

Claims

検索結果の表示リストにおいてユーザが同意、好き、同意せず、反対等の意見を示すことですべての情報及び検索結果に対して評点して、検索結果の評定値に基づいて、次の検索結果の場合、評定値の高低に応じて自動的にソーティングし、評点の高いものを上位に表示させ、不正評点防止プログラムがインストールされた検索エンジンソーティングシステムに基づいた、ユーザと、検索エンジンソーティングシステムと、モデル処理システムと、出力システムとが構築されているユーザ参加による検索エンジンソーティング方法であって、
（１）ユーザは、それぞれ主に個性化サービスである登録ユーザ、及び検索エンジンソーティング機能を有する非登録ユーザであり、
（２）検索エンジンソーティングシステムは、ユーザ参加による方法を採用し、完全な個性化検索エンジンソーティングに属し、ユーザに個性化サービスを提供しており、ウェブサイト情報、ユーザ登録情報、評点等のデータ及び検索エンジンソーティング方法、モデル、結果等の内容を管理しており、オンライン即時検索エンジンソーティングと、モデル処理とを含み、オンラインとはアクセスユーザに対するものであり、モデル処理は即時に行われておらず、検索エンジンソーティングシステムは、一般のウェブサイトに適用されており、ユーザ登録情報に基づいてユーザの個人情報を収集し、ユーザによる異なる表示リストに対する評価に基づいて興味を示すリスト内容を予測しており、ユーザが検索結果の一つの表示リストを選択した後、ユーザのシリーズ情報に基づいてユーザは同意、好き、同意せず、反対等の意見を示すことができ、
（３）モデル処理システムは、主に検索エンジンソーティング方法に基づいてデータを処理しモデルを得るものであり、ユーザがウェブページをブラウザした場合、オンライン検索エンジンソーティングにおいてモデル結果に基づいて検索エンジンソーティングリストをユーザに即時にフィードバックしており、オンライン検索エンジンソーティング側は異なる情況に基づいて異なる検索エンジンソーティング策略を実行しており、特に新規ユーザに対して異なる検索エンジンソーティング方法を採用し、コールドスターをある程度解決し、検索エンジンソーティング質量を向上しており、
（４）入出力システム：個性化検索エンジンソーティングシステムの主な機能はユーザ情報、ウェブサイト情報及びウェブサイトに対する評価情報を収集し、モデル処理によりユーザに対して検索エンジンソーティングリストを提供する、
ことを特徴とするユーザ参加による検索エンジンソーティング方法。
前記システムが管理すべきデータは、主に入力データと、モデルデータと、出力データとを含んでおり、
（１）入力データ：システムの入力はユーザ情報、表示リスト情報、ユーザ評価情報を含んでおり、ユーザ情報データは、ユーザがシステム登録後に記入した個人データから得られたものであり、前記ユーザデータは、ユーザ標示、登録パスワード、年齢、性別、職業、住所、電子メールを含んでおり、検索エンジンソーティングシステムは、ユーザによる検索エンジンの検索のために興味を示す表示リスト情報をソーティングするとともに興味を示す情報及び対応する検索エンジンソーティング演算法に基づいてユーザ興味度合いを予測しており、該情報は主にリスト番号、リスト名称、期日、類型を含んでおり、検索エンジンソーティングシステムは、検索エンジンソーティング演算法の重要な入力内容として、ユーザによるリスト情報に対する評価データ情報を収集しており、ユーザによるリスト情報に対する評価は多くの形態、例えば文字形式の記述、ファジー評価（同意、好き、同意せず、反対）または直接評点の形態を含んでおり、評価情報は、ユーザ標示、リスト番号、評点、時間標示を含んでおり、
（２）モデルデータは下記の２種類を有しており、
（Ｉ）モデル入力データ：検索エンジンソーティングシステムの核心は、検索エンジンソーティング演算法モデルであるが、異なる演算法毎には異なる入力データが要求されているため、計算時にシステムの入力データをプリ処理し、主にユーザ、リスト情報、評点データを含むモデル入力データとして整理する必要があり、前記ユーザデータはユーザ情報を演算法モデルに必要な形態、具体的にはユーザ標示、年齢層、性別標示、職業標示を含む形態に変換しており、そのうちの年齢、性別及び職業はそれぞれユーザ情報に対応してモデルデータによってプリ処理されたデータ形態であり、リストデータは、リスト情報をモデルによって要求される、リスト番号と、類型１と、類型２と、・・・類型Ｍとを含む形態に変換しており、類型は、リスト情報に基づいて変換されたものであり、異なる類型を異なるフィールドに表現し、各リスト類型を１列の０−１ベクトルの形態に変換しており、ユーザ評点データは、ユーザ番号と、リスト評点１と、リスト評点２と、・・・評点Ｋとを含む評点マトリックスの形態にする必要があり、そのうちの各ビットユーザの評点データは列ベクトルの形態として表示されており、
（ＩＩ）モデル出力データ：検索エンジンソーティングシステムは、検索エンジンソーティング演算法により入力データを算出し、モデル標示と、演算法に基づいたウェイトと、モデルパラメータとを含む演算法モデルの構成データを予測の根拠とするものであり、ユーザ分類データは、モデル入力データが演算法によって処理された分類結果であり、２つの部分の内容を含み、一つにはユーザ番号と、モデル標示と、分類番号とを含む本来のユーザの分類結果であり、もう一つにはモデル番号と、分類番号と、リスト１評点と、リスト２評点と、・・・リストＫ評点とを含む分類の評点結果であり、
（３）出力データ：検索エンジンソーティングシステムの応用に応じて異なるモデルを採用し、主に下記の３つの出力結果を生成しており、
（Ｉ）ユーザ予測評点データ：検索エンジンソーティングシステムの出力は、モデルによりユーザ予測を行った後、検索エンジンソーティング結果を出力しており、検索エンジンソーティングシステムの入力データ及びモデルデータに基づいて、ユーザ番号と、モデル標示と、分類番号と、リスト番号と、評点とを含む予測ユーザの検索エンジンソーティング結果を算出しており、新しいリストの特徴及びユーザ評点情報に基づいて興味を示す可能性のあるユーザ類別を予測しており、
（ＩＩ）新規ユーザ評点データ：ユーザ及び本来のユーザデータに基づいて、新規ユーザ番号と、モデル番号と、リスト番号と、評点とを含むユーザ評点結果を予測しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定することを特徴とする請求項１に記載のユーザ参加による検索エンジンソーティング方法。
前記モデル処理部分の処理プロセスにおいて、
検索エンジンソーティングシステムのモデル処理部分は、アクセスユーザにとって不可視的であり、オフライン計算モデルを採用し、モデル出力結果を生成しており、オンライン検索エンジンソーティングした場合に、モデル結果及びシステムによりデータを入力し、検索エンジンソーティング結果をユーザにフィードバックしており、モデルの算出は、入力データの増加に基づいて更新し、新規増加されたユーザ評点データが所定の閾値を超えた場合に、モデルを改めて処理する必要があり、その具体的なプロセスは、
（１）データプリ処理：異なる演算法の要求に応じてデータを処理し、システム入力データをモデル入力データとして処理するステップと、
（２）モデルは検索エンジンソーティングシステムによるデータ量の変化に基づいて算出し、定期的にモデルを実行し、更新データを算出し、モデル出力結果を補正し、検索エンジンソーティング質量を保証するステップと、
を含むことを特徴とする請求項１に記載のユーザ参加による検索エンジンソーティング方法。
前記オンライン検索エンジンソーティングのプロセスにおいて、オンライン推薦の主要な機能は検索エンジンの類型を分析し、対応する演算法モデルの出力結果を選択し入力データと組み合わせることで検索エンジンソーティング結果を予測し、ユーザにフィードバックしており、その具体的なプロセスは、
（１）モデル選択：検索エンジンソーティングシステムは、検索エンジンソーティングの類型に基づいて、主に３つの検索エンジンソーティングを含む異なるモデルを選択しており、
（Ｉ）ユーザの検索エンジンソーティングを評点する：システムに評点のユーザが存在した場合、その評点データ、リストデータ及びユーザデータに基づいて分類に用いられるモデルを選択しており、
（ＩＩ）新規リスト検索エンジンソーティング：新規リストとは本来の検索エンジンソーティングシステムには該リストのいずれのユーザ評点データ及びリスト特徴データも存在せず、新規リストの検索エンジンソーティングについて入力されたリスト特徴に基づいて内容に応じた分類モデルを用いて分析しており、ユーザがすべての検索結果に満足せず、若しくは所要の情報がない場合には、ユーザは出現すべきと考える検索情報を自発的に添加提供可能であり、この添加情報はあるページ面に出現しており、検索結果の右側または評点値の高い検索結果の後にプリントアウトされるとともに、この添加結果は同様にその他のユーザの評点に参加し、評点値はそのランキングを決定しており、
（ＩＩＩ）新規ユーザ検索エンジンソーティング：新規ユーザとは検索エンジンソーティングシステムには他のいずれの評点データも存在しないことであり、２つの類型のユーザを含み、一つには新規登録のユーザであり、もう一つには登録済みであるが、評点されていないユーザであり、新規ユーザに対する検索エンジンソーティングは、ユーザデータに基づいたモデルを採用しており、
（２）検索エンジンソーティング予測：
モデルの出力結果及び入力されたデータに基づいて算出し、検索エンジンソーティング結果を予測しており、オンライン検索エンジンソーティングは、即時検索エンジンソーティングモデルによる検索エンジンソーティングを採用しており、ユーザは、検索エンジンソーティングシステムウェブサイトに登録し、ウェブページをブラウザした場合、ユーザ評点データを直接読み取り、ユーザが興味を示すリストを予測し、もっとも興味を示す可能性のあるリストをユーザに直接フィードバックしており、ユーザデータに応じた混合検索エンジンソーティング演算法と組み合わせて２つの種類の検索エンジンソーティングを実現しており、一つには、近隣クラスタが内容及びユーザ情報に基づいた混合検索エンジンソーティングは、リスト情報及びユーザ評点データに基づいてユーザ嗜好を形成し、近隣クラスタを行い、類似ユーザをクラスタし、その後、テストユーザ情報と組み合わせて予測し、ユーザ検索エンジンソーティングリストを生成しており、もう一つには、ユーザデータに応じた検索エンジンソーティング演算法は、新規ユーザに対する検索エンジンソーティングを実現し、新規ユーザ情報及び本来のユーザ情報に基づいてウェイトをつけ、サポートベクターマシンを用いて新規ユーザ評点を予測し、新規ユーザリスト検索エンジンソーティングリストをユーザが使用するために生成することを特徴とする請求項１に記載のユーザ参加による検索エンジンソーティング方法。