JP2019511065A - 情報検索方法及び装置 - Google Patents

情報検索方法及び装置 Download PDF

Info

Publication number
JP2019511065A
JP2019511065A JP2018552167A JP2018552167A JP2019511065A JP 2019511065 A JP2019511065 A JP 2019511065A JP 2018552167 A JP2018552167 A JP 2018552167A JP 2018552167 A JP2018552167 A JP 2018552167A JP 2019511065 A JP2019511065 A JP 2019511065A
Authority
JP
Japan
Prior art keywords
request
search
knowledge entity
information
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018552167A
Other languages
English (en)
Other versions
JP6732938B2 (ja
JP2019511065A5 (ja
Inventor
首科 秦
首科 秦
▲飛▼ 黄
▲飛▼ 黄
志▲揚▼ ▲陳▼
志▲揚▼ ▲陳▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2019511065A publication Critical patent/JP2019511065A/ja
Publication of JP2019511065A5 publication Critical patent/JP2019511065A5/ja
Application granted granted Critical
Publication of JP6732938B2 publication Critical patent/JP6732938B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本願は情報検索方法及び装置を提供する。情報検索方法は、ユーザにより入力された検索語句を含む検索要求を受信するステップと、前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも一つの要求を含む、ステップと、予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するステップであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、ステップと、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するステップとを含む。この方法は、ユーザが要求する内容を表示し、検索結果の表示内容を豊かにすることができる。
【選択図】図2

Description

本出願は、2016年4月7日に提出した第201610214064.0号中国特許出願の優先権を主張するところ、当該特許出願のすべての内容は、参照として本出願に援用される。
本願は、コンピュータの技術分野に関するものであり、具体的に検索の技術分野に関するものであり、特には、情報検索方法及び装置に関するものである。
現在、従来の情報検索技術は、通常、ユーザにより入力された検索語句によって、検索語句に関連する内容が含まれているWebページを検索し、Webページにおける検索語句に関連する内容の要約を抽出し、続いてその要約を検索結果に表示する。
しかし、従来の技術を使用して表示する検索結果の内容は、比較的単一で、一般的にユーザが要求する内容を表示することができない。
本願は、改善された情報検索方法及び装置を提供して上記背景技術の部分に言及された技術課題を解決することを目的とする。
第一の局面として、本願実施形態は、情報検索方法を提供する。上記情報検索方法は、ユーザにより入力された検索語句を含む検索要求を受信するステップと、前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも一つの要求を含む、ステップと、予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するステップであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、ステップと、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するステップとを含む。
一部の実施形態において、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップは、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップと、前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップとを含む。
一部の実施形態において、上記方法は、検索要求を受信した以降、マルチモードマッチングアルゴリズムを使用し、所定のマッチング結果と、最初の知識エンティティ及び最初の要求と、の対応関係に基づいて、前記検索語句にマッチする最初の知識エンティティと最初の要求を取得するステップをさらに含み、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップを含む。
一部の実施形態において、前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップは、前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップを含む。
一部の実施形態において、上記方法は、検索要求を受信した以降、前記検索語句に基づいて固有表現抽出アルゴリズムを介して前記検索語句中のエンティティの単語および要求の単語を取得するステップをさらに含み、前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップを含む。
一部の実施形態において、前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップは、前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップを含む。
一部の実施形態において、前記取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含む。
第二の局面として、本実施形態は、情報検索装置を提供する。上記装置は、ユーザにより入力された検索語句を含む検索要求を受信するように構築された検索要求受信ユニットと、前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するように構築された検索要求取得ユニットであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも1つの要求を含む検索要求取得ユニットと、予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するように構築された属性情報取得ユニットであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、属性情報取得ユニットと、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するように構築されたページ生成ユニットを含む。
一部の実施形態において、前記検索要求取得ユニットは、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように構築された知識エンティティ取得サブユニットと、前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように構築された要求取得サブユニットとを含む。
一部の実施形態において、上記装置は、検索要求を受信した以降、マルチモードマッチングアルゴリズムを使用し、所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係に基づいて、前記検索語句にマッチする最初の知識エンティティと最初の要求を取得するように構築されたマルチモードマッチングユニットをさらに含み、前記知識エンティティ取得サブユニットは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように、さらに構築される。
一部の実施形態において、前記要求取得サブユニットは、前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように、さらに構築される。
一部の実施形態において、上記装置は、検索要求を受信した以降、前記検索語句に基づいて固有表現抽出アルゴリズムを介して前記検索語句中のエンティティの単語と要求の単語を取得するように構築された固有表現抽出ユニットをさらに含み、前記知識エンティティ取得サブユニットは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように、さらに構築される。
一部の実施形態において、前記要求取得サブユニットは、前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように、さらに構築される。
一部の実施形態において、前記属性情報取得ユニットで取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含む。
本出願で提供される情報検索方法及び装置は、検索語句とユーザ情報に基づいて、予めトレーニングされた分類モデルを使用して、ユーザの検索要求中の知識エンティティと少なくとも1つの要求を取得し、予め記憶された知識エンティティ情報セットで前記要求に一対一対応する前記知識エンティティの少なくとも一つの属性情報を取得し、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加する。これにより、ユーザが要求する内容を表示し、検索結果の表示内容を豊かにすることができる。
以下の図面による非限定的な実施例についての詳細な説明を読み、参照することにより、本願の他の特徴、目的及び利点がより明らかになる。
本出願が適用可能な例示的システムアーキテクチャの図である。 本出願に係る情報検索方法の一実施形態のフローチャートである。 本出願に係る情報検索方法の一応用情景の例示的概略図である。 本出願に係る情報検索方法の他の一実施形態のフローチャートである。 本出願に係る情報検索装置の一実施形態の構造の概略図である。 本出願の実施例を実現するのに適するサーバのコンピュータシステムの構造の概略図である。
以下、図面と実施例を参照しながら、本願を詳しく説明する。ここで記載される具体的な実施例は、関連の発明を解釈するのみに用いられ、当該発明に対する限定ではないことは理解される。なお、説明の便宜上、図面には、関連の発明に関わる部分のみを示す。
なお、矛盾が生じない限り、本願における実施例及び実施例における特徴は互いに組み合わせることができるものとする。以下、図面を参照しながら、実施例を併せて本願を詳しく説明する。
図1は、本出願の情報検索方法や情報検索装置の実施例が適用可能な例示的システムアーキテクチャ100を示す。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104とサーバ105を含むことができる。ネットワーク104は、端末装置101、102、103とサーバ105との間で通信リンクを提供する媒体として使用される。ネットワーク104は、例えば、有線通信リンク、無線通信リンク、または光ファイバケーブルなどの各種の接続タイプを含むことができる。
ユーザは、メッセージなどを送受信するために、端末装置101、102、103を利用して、ネットワーク104を介してサーバ105とインタラクションすることができる。端末装置101、102、103上に、例えばブラウザアプリケーション、検索の種類のアプリケーション、ショッピング種類のアプリケーションなど、様々なクライアント・アプリケーションがインストールされることができる。
端末装置101、102、103は、ブラウザアプリケーションや検索の種類のアプリケーションをサポートする各種の電子機器であることができ、スマートフォン、タブレットPC、ラップトップ型コンピュータやデスクトップ型コンピュータなどを含むが、これに限定されない。
サーバ105は、各種のサービスを提供するサーバであることができ、例えば、端末装置101、102、103上のブラウザアプリケーション、検索の種類のアプリケーションなどについてサポートを提供しているデータベースサーバやクラウドサーバであることができる。サーバは、受信したデータの分析、検索等の処理を行い、処理結果(例えば、検索結果)を端末装置にフィードバックすることができる。
本出願の実施例で提供される情報検索方法は、一般的にサーバ105によって実行される。これに対応して、情報検索装置は、一般的にサーバ105にインストールされる。
図1中の端末装置、ネットワーク、サーバの数量は、模式的なものにすぎないことを理解すべきである。必要に応じて、任意の数量の端末装置、ネットワーク、およびサーバを備えてもよい。
続いて、図2を参照すると、図2は、本出願に係る情報検索方法の一実施形態のフロー200を示す。
図2に示すように、本実施例の情報検索方法は、以下のようなステップを含む。
ステップ201において、検索要求を受信する。
ここで、上記検索要求は、ユーザにより入力された検索語句を含む。
本実施例において、情報検索方法が運行されている電子機器(例えば、図1に示されたサーバ)は、有線または無線の方式により、端末(例えば、図1に示した端末装置)から上記検索要求を受信することができる。ここで、上記検索語句は、ユーザがブラウザ検索ページや検索の種類のアプリケーションの中のテキスト検索ボックスに入力したテキストであることができる。
ステップ202において、上記ユーザのユーザ情報を取得し、上記検索語句と上記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して上記ユーザの検索要求を取得する。ここで、上記検索要求は、知識エンティティ(Intellectual Entities)、上記知識エンティティに関連する少なくとも1つの要求を含んでもよい。
本実施例において、電子機器は、まず端末のCookie情報からユーザのユーザ情報を取得することができ、予め構築されたユーザ画像データからユーザのユーザ情報を取得することもできる。ここで、ユーザ情報は、歴史的な検索履歴、性別、年齢、職業、趣味などの情報のうちの1つまたは複数を含むことができるが、これに限定されない。次に、上記検索語句取得したユーザ情報を予めトレーニングされた分類モデル(例えば、ロジスティック回帰モデル)に入力して、分類アルゴリズム(例えば、ロジスティック回帰アルゴリズム)を介して各知識エンティティに対応する確率を取得し、上記検索要求中の知識エンティティとして対応する確率が一番大きな知識エンティティを取り、各知識エンティティに関連する所定の要求に応じて上記検索要求中の知識エンティティに関連する少なくとも1つの要求を取得する。ここで、上記知識エンティティは知識のポイント/固有名詞(例えば、「九寨溝」、「関節炎」)に対応するオブジェクトであることができる。上記各知識エンティティに関連する所定の要求は、ドメイン知識に基づいて手動で予め設定してもよく、機械学習の方法を介して取得してもよく。例えば、知識エンティティ「関節炎」に関連する要求は、「治療」、「価格お問い合わせ」、「了解」を含むことができる。
上記分類モデルは、エンティティの注釈を備えた大量のトレーニングデータに対する学習とトレーニングを行って取得してもよい。ここで、上記トレーニングデータは、検索単語、ユーザ情報、知識エンティティ、コメントを含めることができ、ここで、コメントは検索語がそのトレーニングデータの知識エンティティに関連するかどうかを表示するためのものである。上記トレーニングデータは、ユーザが検索結果をクリックして進入したページの内容と今回の検索に使用された検索語を介して収集することができる。例えば、ユーザが任意の1つの検索結果をクリックして進入したページが「九寨溝」に関する内容であることを前提とする場合は、1つのトレーニングデータを生成することができ、そのトレーニングデータの検索ワードは、ユーザが使用した検索語であり、知識エンティティは「九寨溝」であり、コメントは1である。
ステップ203において、予め記憶された知識エンティティのセットにおいて、上記知識エンティティの少なくとも一つの属性情報を取得する。
ここで、上記少なくとも一つの属性情報と上記少なくとも1つの要求は、一対一対応する。
本実施例において、上記知識エンティティのセットには、各知識エンティティの複数の属性情報が含まれ、例えば、知識エンティティ「九寨溝」の攻略、紹介、歴史、旅行コースなどの属性情報を含むことができる。電子機器は、上記知識エンティティのセットからのステップ202で取得した検索要求中の知識エンティティにマッチングされる知識エンティティ情報を照会し、次いで、当該知識エンティティ情報から、上記検索要求のうちの少なくとも1つの要求に対応する少なくとも一つの属性情報を取得することができる。
ここで、上記知識エンティティのセットは、第3者のサイト(例えば、百科タイプのサイト、医療の種類のサイト)から、既に編集された構造情報をクローリングして取得することができる。例えば、知識エンティティ「顔面麻痺」において、所定の医療タイプのサイトの顔面麻痺に関連するページから情報をクローリングして、紹介、症状、病因などの属性情報を取得することができる。
本実施例の一部の選択可能な実施形態において、上記取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含むことができる。これにより、検索結果の表示内容をさらに豊かにすることができる。
ステップ204において、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加する。
本実施例において、電子機器は、端末が複数の属性情報を含む検索結果を表示できるように、少なくとも一つの属性情報を1つの検索結果に組み合わせて、当該検索結果を検索結果ページに追加することができる。
本実施例の一部の選択可能な実施形態において、ステップ202は、上記検索語句と上記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して上記知識エンティティを取得するステップと、上記検索語句、上記ユーザ情報及び上記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得するステップを含むことができる。
ここで、電子機器は、上記検索語句と取得したユーザの情報を予めトレーニングされた知識エンティティ分類モデルに入力して、分類アルゴリズムを使用して、各知識エンティティに対応する確率を取得し、上記検索要求中の知識エンティティとして対応する確率が一番大きな知識エンティティを取る。ここで、知識エンティティ分類モデルのトレーニング方法は、ステップ202中の分類モデルのトレーニング方法を参照することができ、ここでこれに対する重複された説明は省略する。続いて、電子機器は、上記検索語句、上記ユーザ情報及び上記検索要求中の知識エンティティを予めトレーニングされた要求分類モデルに入力して、各要求に対応する確率を取得し、対応する確率に応じて上記検索要求中の少なくとも1つの要求として降順に所定の量の要求を順次選択することができる。ここで、上記要求分類モデルは、要求のコメントを備える大量のトレーニングデータの学習とトレーニングを行い、取得してもよい。ここで、上記トレーニングデータは、検索単語、ユーザ情報、知識エンティティ、要求、コメントなどの情報を含めることができ、ここで、コメントは検索語がそのトレーニングデータの知識エンティティと要求に関連するかどうかを表示するためのものである。上記トレーニングデータは、ユーザが検索結果をクリックして進入したページの内容と今回の検索に使用された検索語を介して収集することができる。例えば、ユーザが任意の1つの検索結果をクリックして進入したページが「九寨溝」の旅行攻略に関する内容であることを前提とする場合は、1つのトレーニングデータを生成することができ、そのトレーニングデータの検索単語は、ユーザが使用した検索語であり、知識エンティティは「九寨溝」であり、要求は「旅行攻略」であり、コメントは1である。
この実施形態で、取得したユーザの検索要求中の知識エンティティに関連する少なくとも1つの要求がより正確にすることで、ユーザが要求する内容をより正確に表示することができる。
以下、図3を参照すると、図3は、本実施例の情報検索方法の一応用情景の例示的概略図を示す。図3の応用情景において、ユーザは、最初に検索入力ウィンドウに検索ワード「顔面麻痺」を入力して、検索ボタンをクリックした。続いて、サーバは、検索要求を受信し、検索要求中の検索語句「顔面麻痺」を取得して、本実施例で提供される情報検索方法を使用して、知識エンティティ「顔面麻痺」と知識エンティティ「顔面麻痺」に関連する「病因」、「紹介」、「症状」などのユーザの検索要求を取得する。続いて、知識エンティティのセットで「顔面麻痺」の「病因」、「紹介」、「症状」に一対一対応する属性情報を取得し、これらの属性情報を1つの検索結果に組み合わせて、検索結果ページに追加する。続いて、当該検索結果ページを端末に送信すれば、端末のインターフェースで、図3に示すように、「顔面麻痺」に関する病因、導入、症状の画像やテキスト情報を表示する。
本実施例で提供される情報検索方法は、検索語句とユーザ情報に基づいて、予めトレーニングされた分類モデルを使用して、ユーザの検索要求中の知識エンティティと少なくとも1つの要求を取得し、予め記憶された知識エンティティのセットにおいて、上記要求に一対一対応する上記知識エンティティの少なくとも一つの属性情報を取得し、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加することで、ユーザが要求する内容を表示し、検索結果の表示内容を豊かにすることができる。
続いて図4を参照すると、図4は、本出願に係る情報検索方法の他の一実施形態のフロー400を示す。
図4に示すように、本実施例の情報検索方法は、以下のようなステップを含む。
ステップ401において、検索要求を受信する。
ここで、上記検索要求は、ユーザにより入力された検索語句を含む。
本実施例において、ステップ401の具体的な処理は、図2の対応する実施例中のステップ201の関連説明を参照することができ、これに対する重複した説明は省略することにする。
ステップ402において、マルチモードマッチングアルゴリズムを使用して所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係に基づいて、上記検索語句にマッチする最初の知識エンティティと最初の要求を取得する。
本実施例において、上記マルチモードマッチングアルゴリズム(Multi−pattern matching algorithm)は、正規表現またはサフィックスツリーなどを通じてマッチングを行うアルゴリズムであることができる。電子機器は、マルチモードマッチングアルゴリズムを使用してマッチング結果として検索語句にマッチするモード文字列(式)を取得し、所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係に基づいて、上記検索語句にマッチする最初の知識エンティティと最初の要求を取得することができる。ここで、所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係は、ドメイン知識に基づいて手動で予め設定した可能性があり、機械学習の方法を介して取得した可能性がある。
例えば、正規表現を使用してマッチングを行うことを例にとると、検索語句が「北京の長城が楽しいか」であることを前提とする場合に、マッチングされた正規表現は、「北京・(どう|楽しいか)」である。その式に対応する所定の最初の知識エンティティが「北京旅行」であり、最初の要求が「はじめに(紹介)」と「攻略」であることを前提とする場合には、検索語句「北京の長城が楽しいか」にマッチングされている最初の知識エンティティが「北京旅行」であり、最初の要求が「はじめに」と「攻略」であることを取得することができる。
ステップ403において、上記ユーザのユーザ情報を取得し、上記検索語句、上記ユーザ情報、上記最初の知識エンティティおよび上記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを使用して、ユーザの検索要求中の知識エンティティを取得する。
本実施例において、上記ユーザのユーザ情報を取得する具体的な処理は、図2の対応する実施例中のステップ202の関連説明を参照することができ、これに対する重複した説明は省略することにする。電子機器は、上記ユーザ情報を取得する前に、上記検索語句、上記ユーザ情報、上記最初の知識エンティティおよび上記最初の要求を予めトレーニングされた知識エンティティ分類モデルに入力して、分類アルゴリズムを使用して、各知識エンティティに対応する確率を取得し、ユーザの検索要求中の知識エンティティとして対応する確率が一番大きな知識エンティティを取ることができる。
ここで、本実施例の知識エンティティ分類モデルは、エンティティの注釈を備えた大量のトレーニングデータの学習とトレーニングを行い、取得してもよい。ここで、上記トレーニングデータは、検索単語、ユーザ情報、最初の知識エンティティ、最初の要求、知識エンティティ、コメントなどの情報を含むことができ、ここで、コメントは検索語がそのトレーニングデータの知識エンティティに関連するかどうかを表示するためのものである。
ステップ404において、上記検索語句、上記ユーザ情報及び上記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得する。
本実施例において、ステップ404の具体的な処理は、図2の対応する実施例中の関連選択可能な実施形態の関連説明を参照することができ、これに対する重複した説明は省略することにする。
ステップ405において、予め記憶された知識エンティティのセットにおいて、上記知識エンティティの少なくとも一つの属性情報を取得する。
ここで、上記少なくとも一つの属性情報と上記少なくとも1つの要求は、一対一対応する。
本実施例において、ステップ405の具体的な処理は、図2の対応する実施例中のステップ203の関連説明を参照することができ、これに対する重複した説明は省略することにする。
ステップ406において、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加する。
本実施例において、ステップ406の具体的な処理は、図2の対応する実施例中のステップ204の関連説明を参照することができ、これに対する重複した説明は省略することにする。
本実施例の一部の選択可能な実施形態において、ステップ404は、上記検索語句、上記ユーザ情報、上記知識エンティティ、上記最初の知識エンティティおよび上記最初の要求に基づいて、予めトレーニングされた要求分類モデルを使用して上記少なくとも1つの要求を取得するステップを含むことができる。ここで、電子機器は、上記検索語句、上記ユーザ情報は、ステップ403で取得した検索要求の中の知識エンティティ、上記最初の知識エンティティおよび上記最初の要求を、予めトレーニングされた要求分類モデルに入力して、各要求に対応する確率を取得し、対応する確率に応じて上記検索要求中の少なくとも1つの要求として降順に所定の量の要求を順次選択することができる。ここで、上記要求分類モデルは、要求のコメントを備える大量のトレーニングデータの学習とトレーニングを行い、取得してもよい。ここで、上記トレーニングデータは、検索単語、ユーザ情報、知識エンティティ、最初の知識エンティティ、最初の要求、要求、コメントなどの情報を含むことができ、ここで、コメントは検索語がそのトレーニングデータの知識エンティティと要求に関連するかどうかを表示するためのものである。
この実施形態で、取得したユーザの検索要求中の知識エンティティに関連する少なくとも1つの要求がより正確で科学的であるようすることで、ユーザが要求する内容をより正確に表示することができる。
本実施例の一部の選択可能な実施形態において、本実施例の情報検索方法は、検索要求を受信して以降、上記検索語句に基づいて固有表現抽出(Named Entity Recognition)アルゴリズムを介して上記検索語句中のエンティティの単語および要求の単語を取得するステップをさらに含むことができる。ここで、上記固有表現抽出アルゴリズムは、CRF(Conditional Random Field、条件付きランダムフィールド)アルゴリズムであることができる。
また、ステップ403は、上記検索語句、上記ユーザ情報、上記最初の知識エンティティ、上記最初の要求、上記エンティティの単語及び上記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して上記知識エンティティを取得するステップを含むことができる。ここで、本実施の方法の知識エンティティ分類モデルは、エンティティの注釈を備えた大量のトレーニングデータの学習とトレーニングを行い、取得してもよい。ここで、本実施の方法の上記トレーニングデータは、検索単語、ユーザ情報、最初の知識エンティティ、最初の要求、エンティティの言葉、要求の単語、知識エンティティ、コメントなどの情報を含むことができ、コメントは検索語がそのトレーニングデータの知識エンティティに関連するかどうかを表示するためのものである。
この実現は、名前のエンティティの認識アルゴリズムを介して取得した上記検索語句中のエンティティの単語および要求の単語を知識エンティティの分類の基準因子に加えて、取得した知識エンティティがより科学的であるようすることで、ユーザが要求する内容をより正確に表示する。
また、上記実施形態に基づいて、本実施例の一部を選択可能な実施形態において、ステップ404は、上記検索語句、上記ユーザ情報、上記知識エンティティ、上記最初の知識エンティティ、上記最初の要求、上記エンティティの単語及び上記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得するステップを含むことができる。ここで、電子機器は、上記検索語句、上記ユーザ情報、ステップ403で取得した検索要求の中の知識エンティティ、上記最初の知識エンティティ、上記最初の要求、上記エンティティの単語及び上記要求単語を、予めトレーニングされた要求分類モデルに入力して、各要求に対応する確率を取得し、対応する確率に応じて上記検索要求中の少なくとも1つの要求として降順に所定の量の要求を順次選択することができる。ここで、上記要求分類モデルは、要求のコメントを備える大量のトレーニングデータの学習とトレーニングを行って取得してもよい。ここで、上記トレーニングデータは、検索単語、ユーザ情報、知識エンティティ、最初の知識エンティティ、最初の要求、エンティティの言葉、要求の単語、要求、コメントなどの情報を含めることができ、ここで、コメントは検索語がそのトレーニングデータの知識エンティティと要求に関連するかどうかを表示するためのものである。
この実現は、名前のエンティティの認識アルゴリズムを介して取得した上記検索語句中のエンティティの単語および要求の単語を求め分類の基準因子に加えて、取得したユーザの検索要求中の知識エンティティに関連する少なくとも1つの要求がより正確で科学的であるようすることで、ユーザが要求する内容をより正確に表示することができる。
図4からわかるように、図2の対応する実施例と比較すれば、本実施例中の情報検索方法のフロー400は、マルチモードマッチングアルゴリズムを使用して検索語句にマッチする最初の知識エンティティとの最初の要求を取得するステップを追加し、その最初の知識エンティティと最初の要求を知識エンティティの分類の基準因子に加える。これにより、本実施例で説明する方法は、取得した知識エンティティがより科学的であるようすることで、ユーザが要求する内容を正確に表示する。
更に図5を参照すると、上記各図面に示された方法の実現として、本出願は、情報検索装置の一実施例を提供し、そのデバイスの実施例は、図2に示された方法の実施例と対応され、この装置は、具体的には、サーバに適用することができる。
図5に示すように、本実施例の上記情報を検索装置500は、検索要求を受信ユニット501、検索要求取得ユニット502は、属性情報取得ユニット503とページ生成ユニット504を含む。ここで、検索要求の受信ユニット501は、ユーザにより入力された検索語句を含む検索要求を受信するように構築される。検索要求取得ユニット502は、上記ユーザのユーザ情報を取得し、上記検索語句と上記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して上記ユーザの検索要求を取得するように構築されるが、上記検索要求は、知識エンティティ、上記知識エンティティに関連する少なくとも1つの要求を含む。属性情報取得ユニット503は、予め記憶された知識エンティティのセットから、上記知識エンティティの少なくとも一つの属性情報を取得するように構築されるが、上記少なくとも一つの属性情報と上記少なくとも1つの要求は、一対一対応する。ページ生成ユニット504は、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するように構築される。
本実施例において、検索要求の受信ユニット501、検索要求取得ユニット502、属性情報取得ユニット503とページ生成ユニット504の具体的な処理は、図2の対応する実施例中のステップ201、ステップ202、ステップ203とステップ204の関連説明を参照することができ、これに対する重複した説明は省略する。
本実施例の一部の選択可能な実施形態において、検索要求取得ユニット502は、上記検索語句と上記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して上記知識エンティティを取得するように構築された知識エンティティ取得サブユニット5021と、上記検索語句、上記ユーザ情報及び上記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得するように構築された要求取得サブユニット5022とを含むことができる。ここで、知識エンティティ取得サブユニット5021と要求取得サブユニット5022の具体的な処理とこれら代行する技術効果は、図2の対応する実施例中の相応の実施形態の関連説明を参照することができ、これに重複した説明は省略する。
本実施例の一部の選択可能な実施形態において、本実施例の情報検索装置500は、検索要求を受信した後、マルチモードマッチングアルゴリズムを使用し、所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係に基づいて、上記検索語句にマッチする最初の知識エンティティと最初の要求を取得するように構築されたマルチモードマッチングユニット505をさらに含むことができる。また、知識エンティティ取得サブユニット5021は、上記検索語句、上記ユーザ情報、上記最初の知識エンティティおよび上記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して上記知識エンティティを取得するように、さらに構築されることができる。ここで、マルチモードマッチングユニット505の具体的な処理は、図4の対応する実施例中のステップ402の関連説明を参照することができ、これに対する重複した説明は省略する。本実施形態の知識エンティティ取得サブユニット5021の具体的な処理は、図4の対応する実施例中のステップ403の関連説明を参照することができ、これに対する重複した説明は省略する。
上記実施形態に基づいて、本実施例の一部を選択可能な実施形態において、要求取得サブユニット5022は、上記検索語句、上記ユーザ情報、上記知識エンティティ、上記最初の知識エンティティおよび上記最初の要求に基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得するように、さらに構築することができる。その実施形態の具体的な処理とこれら代行する技術効果は、図4の対応する実施例中の相応の実施形態の関連説明を参照することができ、これに対する重複した説明は省略する。
本実施例の一部の選択可能な実施形態において、本実施例の情報検索装置500は、検索要求を受信した後、上記検索語句に基づいて固有表現抽出アルゴリズムを介して、上記検索語句中のエンティティの単語と要求の単語を取得するように構築された固有表現抽出ユニット506をさらに含むことができる。また、知識エンティティ取得サブユニット5021は、上記検索語句、上記ユーザ情報、上記最初の知識エンティティ、上記最初の要求、上記エンティティの単語及び上記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して上記知識エンティティを取得するように、さらに構築することができる。その実施形態の具体的な処理とこれら代行する技術効果は、図4の対応する実施例中の相応の実施形態の関連説明を参照することができ、これに対する重複した説明は省略する。
上記実施形態に基づいて、本実施例の一部を選択可能な実施形態において、要求取得サブユニット5022は、上記検索語句、上記ユーザ情報、上記知識エンティティ、上記最初の知識エンティティ、上記最初の要求、上記エンティティの単語及び上記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して上記少なくとも1つの要求を取得するように、さらに構築することができる。その実施形態の具体的な処理とこれら代行する技術効果は、図4の対応する実施例中の相応の実施形態の関連説明を参照することができ、これに対する重複した説明は省略する。
本実施例の一部の選択可能な実施形態において、属性情報取得ユニット503で取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含む。その実施形態の具体的な処理とこれら代行する技術効果は、図2の対応する実施例中のステップ203の選択可能な実施形態の関連説明を参照することができ、これに対する重複した説明は省略する。
本実施例で提供される情報を検索装置は、検索要求取得ユニット502で検索語句とユーザ情報に基づいて、予めトレーニングされた分類モデルを使用して、ユーザの検索要求中の知識エンティティと少なくとも1つの要求を取得して、属性情報の取得ユニット503に予め記憶された知識エンティティのセットにおいて、上記要求に一対一対応する上記知識エンティティの少なくとも一つの属性情報を取得し、続いてページ生成ユニット504で取得した属性情報を一つの検索結果に統合して、検索結果ページに追加する。これにより、ユーザが要求する内容を表示し、検索結果の表示内容を豊かにすることができる。
下に図6を参照すると、図6は、本出願の実施例のサーバを実現するのに適したコンピュータシステム600の構造概略図を示す。
図6に示されたように、コンピュータシステム600は、中央処理ユニット(CPU)601を含み、CPU601は、読み取り専用メモリデバイス(ROM)602に記憶されたプログラムまたは記憶部606からランダムアクセスメモリデバイス(RAM)603にロードされたプログラムにより各種の適切な動作と処理を実行することができる。RAM603には、システム600を動作させるために必要な各種プログラムやデータが記憶されている。CPU601、ROM602とRAM603は、バス604を介して互いに接続される。入力/出力(I/O)インターフェース605もバス604に接続される。
I/Oインターフェース605に接続されている部材として、ハードドライブなどを含む記憶部606と、例えばLANカード、モデムなどのネットワークインターフェースカードを含む通信部607が含まれる。通信部607は、インターネットなどのネットワークを介して通信処理を実行する。駆動部608も需要に応じ、I/Oインターフェース605に接続される。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリデバイスなどのリムーバブルメディア609は、このような媒体から読み取ったコンピュータプログラムを需要に応じて記憶部606に設置するように要求に応じて、駆動部608に設置される。
特に、本開示の実施例によれば、フローチャートを参照して、説明した上記プロセスは、コンピュータソフトウェアプログラムとして実現されることができる。例えば、本開示の実施例は、コンピュータプログラム製品を含み、上記コンピュータプログラム製品は、機械可読媒体に有形的に含まれているコンピュータプログラムを含み、上記コンピュータプログラムは、フローチャートに示された方法を実行するためのコンピュータコードを含む。これらの実施例において、当該コンピュータプログラムは、通信部607を経由してネットワークからダウンロードされ、インストールされることができ、および/またはリムーバブルメディア609からインストールすることができる。そのコンピュータプログラムが、中央処理ユニット(CPU)601によって実行される場合には、本出願の方法に限定された上記機能を実行する。
添付された図面中のフローチャート及びブロック図は、本出願の各実施形態によるシステム、方法、およびコンピュータプログラム製品の実現可能なシステムの構造、機能、および操作を示した。これらの点で、フローチャートまたはブロック図中の各ブロックは、一つのモジュールは、プログラムのセグメントまたはコードの一部を代表することができ、上記モジュールは、プログラムのセグメントまたはコードの一部は、規定されたロジック機能を実現するための1つまたは複数の実行可能なコマンドを含む。いくつかの代替実現において、ブロックに記載さ機能は、添付された図面に記載さ順序とは異なる順序で発生する可能性があることに注意しなければならない。たとえば、順次表示された二つのブロックは、実際にほぼ同時に実行されることができ、場合によっては逆にされた順序に沿って実行されることもあり、これは関連する機能に応じて決定される。ブロック図および/またはフローチャート中の各ブロックとブロック図および/またはフローチャート中のブロックの組み合わせは、規定された機能や操作を実行するハードウェアベースの専用システムとして実現されるか、専用のハードウェアとコンピュータコマンドの組み合わせで実現されることがあるのに注意しなければならない。
本出願の実施例で説明した関連ユニットは、ソフトウェアの方法で実現されることができ、ハードウェアの方法で実現することもできる。説明されたユニットは、プロセッサにインストールされることもあり、例えば、プロセッサが検索要求受信ユニット、検索要求取得ユニット、属性情報取得ユニットと、ページ生成ユニットを含むと説明することができる。ここで、これらのユニットの名称は、いくつかのケースに該当するユニット自体の限定を構成しない、例えば、検索要求の受信ユニットは、「検索要求を受信するユニット」と説明することもできる。
他の一態様として、本出願は、不揮発性のコンピュータ記憶媒体をさらに提供し、その不揮発性コンピュータ記憶媒体は、上記実施例で説明されたデバイスに含まれる不揮発性コンピュータ記憶媒体であることができ、端末に搭載されていない独立しに存在している不揮発性コンピュータ記憶媒体であることもできる。上記不揮発性コンピュータ記憶媒体には、1つまたは複数のプログラムが記憶され、上記1つまたは複数のプログラムが一つの装置で実行される場合には、上記装置にとって、ユーザにより入力された検索語句を含む検索要求を受信し、上記ユーザのユーザ情報を取得し、上記検索語句と上記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して上記ユーザの検索要求を取得するが、上記検索要求は、知識エンティティ、上記知識エンティティに関連する少なくとも1つの要求を含めて、予め記憶された知識エンティティのセットにおいて、上記知識エンティティの少なくとも一つの属性情報を取得するが、上記少なくとも一つの属性情報と上記少なくとも1つの要求は、一対一対応し、取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するようする。
以上の記載は、本願の好ましい実施例、及び使われている技術的原理の説明に過ぎない。当業者は、本願に係る保護範囲が、上記の技術特徴による特定お組合せからなる技術方案に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、上記技術特徴又は均等の特徴の任意の組合せからなる他の技術方案も含まれることを理解している。例えば、上記特徴と、本願に開示された類似の機能を持っている技術特徴(これらに限定されていない)とを互いに置き換えてなる技術方案も含まれる。

Claims (16)

  1. ユーザにより入力された検索語句を含む検索要求を受信するステップと、
    前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップであって、前記検索要求は、知識エンティティ(Intellectual Entities)、前記知識エンティティに関連する少なくとも一つの要求を含む、ステップと、
    予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するステップであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、ステップと、
    取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するステップとを含むことを特徴とする情報検索方法。
  2. 前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップは、
    前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップと、
    前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップとを含むことを特徴とする請求項1に記載の情報検索方法。
  3. 検索要求を受信した以降、マルチモードマッチングアルゴリズムを使用し、所定のマッチング結果と、最初の知識エンティティ及び最初の要求と、の対応関係に基づいて、前記検索語句にマッチする最初の知識エンティティと最初の要求を取得するステップをさらに含み、
    前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップは、
    前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップを含むことを特徴とする請求項2に記載の情報検索方法。
  4. 前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップは、
    前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップを含むことを特徴とする請求項3に記載の情報検索方法。
  5. 検索要求を受信した以降、前記検索語句に基づいて固有表現抽出(Named Entity Recognition)アルゴリズムを介して前記検索語句中のエンティティの単語および要求の単語を取得するステップをさらに含み、
    前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップは、
    前記検索語句、前記ユーザ情報、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するステップを含むことを特徴とする請求項3に記載の情報検索方法。
  6. 前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップは、
    前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するステップを含むことを特徴とする請求項5に記載の情報検索方法。
  7. 前記取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含むことを特徴とする請求項1〜請求項6のいずれか一項に記載の情報検索方法。
  8. ユーザにより入力された検索語句を含む検索要求を受信するように構築された検索要求受信ユニットと、
    前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するように構築された検索要求取得ユニットであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも1つの要求を含む検索要求取得ユニットと、
    予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するように構築された属性情報取得ユニットであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、属性情報取得ユニットと、
    取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するように構築されたページ生成ユニットを含むことを特徴とする情報検索装置。
  9. 前記検索要求取得ユニットは、
    前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように構築された知識エンティティ取得サブユニットと、
    前記検索語句、前記ユーザ情報及び前記知識エンティティに基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように構築された要求取得サブユニットとを含むことを特徴とする請求項8に記載の情報検索装置。
  10. 検索要求を受信した以降、マルチモードマッチングアルゴリズムを使用し、所定のマッチング結果と、最初の知識エンティティと最初の要求の対応関係に基づいて、前記検索語句にマッチする最初の知識エンティティと最初の要求を取得するように構築されたマルチモードマッチングユニットをさらに含み、
    前記知識エンティティ取得サブユニットは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように、さらに構築されることを特徴とする請求項9に記載の情報検索装置。
  11. 前記要求取得サブユニットは、
    前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティおよび前記最初の要求に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように、さらに構築されることを特徴とする請求項10に記載の情報検索装置。
  12. 検索要求を受信した以降、前記検索語句に基づいて固有表現抽出アルゴリズムを介して前記検索語句中のエンティティの単語と要求の単語を取得するように構築された固有表現抽出ユニットをさらに含み、
    前記知識エンティティ取得サブユニットは、前記検索語句、前記ユーザ情報、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた知識エンティティ分類モデルを介して前記知識エンティティを取得するように、さらに構築されることを特徴とする請求項10に記載の情報検索装置。
  13. 前記要求取得サブユニットは、前記検索語句、前記ユーザ情報、前記知識エンティティ、前記最初の知識エンティティ、前記最初の要求、前記エンティティの単語及び前記要求の単語に基づいて、予めトレーニングされた要求分類モデルを介して前記少なくとも1つの要求を取得するように、さらに構築されることを特徴とする請求項12に記載の情報検索装置。
  14. 前記属性情報取得ユニットで取得した属性情報は、画像情報、文字情報のうち少なくとも一つを含むことを特徴とする請求項8〜請求項13のいずれか一項に記載の情報検索装置。
  15. プロセッサと、
    記憶装置を含み、
    前記記憶装置には、前記プロセッサで実行可能なコンピュータ読み取り可能なコマンドが記憶され、前記コンピュータ読み取り可能なコマンドが実行される場合に、前記プロセッサは、情報検索方法を実行し、前記情報検索方法は、
    ユーザにより入力された検索語句を含む検索要求を受信するステップと、
    前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも一つの要求を含む、ステップと、
    予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するステップであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、ステップと、
    取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するステップとを含むことを特徴とする機器。
  16. プロセッサで実行可能なコンピュータ読み取り可能なコマンドが記憶されている不揮発性のコンピュータ記憶媒体において、
    前記コンピュータ読み取り可能なコマンドが、プロセッサによって実行される場合には、前記プロセッサは、情報検索方法を実行し、前記情報検索方法は、
    ユーザにより入力された検索語句を含む検索要求を受信するステップと、
    前記ユーザのユーザ情報を取得し、前記検索語句と前記ユーザ情報に基づいて、予めトレーニングされた分類モデルを介して前記ユーザの検索要求を取得するステップであって、前記検索要求は、知識エンティティ、前記知識エンティティに関連する少なくとも一つの要求を含む、ステップと、
    予め記憶された知識エンティティのセットから、前記知識エンティティの少なくとも一つの属性情報を取得するステップであって、前記少なくとも一つの属性情報と前記少なくとも1つの要求は、一対一対応する、ステップと、
    取得した属性情報を1つの検索結果に統合して、検索結果ページに追加するステップとを含むことを特徴とする不揮発性コンピュータ記憶媒体。
JP2018552167A 2016-04-07 2016-08-30 情報検索方法及び装置 Active JP6732938B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610214064.0A CN105677931B (zh) 2016-04-07 2016-04-07 信息搜索方法和装置
CN201610214064.0 2016-04-07
PCT/CN2016/097291 WO2017173773A1 (zh) 2016-04-07 2016-08-30 信息搜索方法和装置

Publications (3)

Publication Number Publication Date
JP2019511065A true JP2019511065A (ja) 2019-04-18
JP2019511065A5 JP2019511065A5 (ja) 2020-02-13
JP6732938B2 JP6732938B2 (ja) 2020-07-29

Family

ID=56308607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018552167A Active JP6732938B2 (ja) 2016-04-07 2016-08-30 情報検索方法及び装置

Country Status (4)

Country Link
JP (1) JP6732938B2 (ja)
KR (1) KR102148691B1 (ja)
CN (1) CN105677931B (ja)
WO (1) WO2017173773A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677931B (zh) * 2016-04-07 2018-06-19 北京百度网讯科技有限公司 信息搜索方法和装置
CN108052613B (zh) * 2017-12-14 2021-12-31 北京百度网讯科技有限公司 用于生成页面的方法和装置
CN108256070B (zh) * 2018-01-17 2022-07-15 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110516226A (zh) * 2018-05-22 2019-11-29 广东神马搜索科技有限公司 搜索语句处理方法、装置及服务器
CN110134860B (zh) * 2019-04-12 2023-04-07 创新先进技术有限公司 用户画像生成方法、装置和设备
CN110633476B (zh) * 2019-09-27 2024-04-05 北京百度网讯科技有限公司 用于获取知识标注信息的方法及装置
CN111241400B (zh) * 2020-01-14 2023-04-25 北京字节跳动网络技术有限公司 一种信息搜索方法及装置
CN111708943B (zh) * 2020-06-12 2024-03-01 北京搜狗科技发展有限公司 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN111915366B (zh) * 2020-07-20 2024-01-12 上海燕汐软件信息科技有限公司 一种用户画像构建方法、装置、计算机设备及存储介质
CN111949793B (zh) * 2020-08-13 2024-02-27 深圳市欢太科技有限公司 用户意图识别方法、装置及终端设备
CN112925883B (zh) * 2021-02-19 2024-01-19 北京百度网讯科技有限公司 搜索请求处理方法、装置、电子设备及可读存储介质
CN113221572B (zh) * 2021-05-31 2024-05-07 抖音视界有限公司 一种信息处理方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003228580A (ja) * 2002-02-04 2003-08-15 Celestar Lexico-Sciences Inc 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
JP2003256466A (ja) * 2002-03-04 2003-09-12 Denso Corp 適応的情報検索システム
JP2007122290A (ja) * 2005-10-26 2007-05-17 Yafoo Japan Corp 検索装置及び検索方法
JP2009037603A (ja) * 2007-07-05 2009-02-19 Nec (China) Co Ltd クエリー要件展開器およびクエリー要件展開方法
JP2009282903A (ja) * 2008-05-26 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 知識抽出・検索装置およびその方法
JP2013190848A (ja) * 2012-03-12 2013-09-26 Rakuten Inc 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584177B2 (en) * 2005-06-29 2009-09-01 Google Inc. Determination of a desired repository
CN102073729B (zh) * 2011-01-14 2013-03-06 百度在线网络技术(北京)有限公司 一种关系化知识共享平台及其实现方法
US9665643B2 (en) * 2011-12-30 2017-05-30 Microsoft Technology Licensing, Llc Knowledge-based entity detection and disambiguation
CN103425714A (zh) * 2012-05-25 2013-12-04 北京搜狗信息服务有限公司 一种搜索方法和系统
CN103853722B (zh) * 2012-11-29 2017-09-22 腾讯科技(深圳)有限公司 一种基于检索串的关键词扩展方法、装置和系统
CN103425741A (zh) * 2013-07-16 2013-12-04 北京中科汇联信息技术有限公司 一种信息展示方法和装置
KR101553848B1 (ko) * 2014-02-17 2015-09-17 네이버 주식회사 검색 결과를 제공하는 방법 및 상기 방법을 수행하는 시스템
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
CN103914566A (zh) * 2014-04-22 2014-07-09 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN104199855B (zh) * 2014-08-13 2017-07-28 王和平 一种针对中医药学信息的检索系统和方法
CN104462505A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 搜索方法和装置
CN104598556A (zh) * 2015-01-04 2015-05-06 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105677931B (zh) * 2016-04-07 2018-06-19 北京百度网讯科技有限公司 信息搜索方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003228580A (ja) * 2002-02-04 2003-08-15 Celestar Lexico-Sciences Inc 文献知識管理装置、文献知識管理方法、プログラム、および、記録媒体
JP2003256466A (ja) * 2002-03-04 2003-09-12 Denso Corp 適応的情報検索システム
JP2007122290A (ja) * 2005-10-26 2007-05-17 Yafoo Japan Corp 検索装置及び検索方法
JP2009037603A (ja) * 2007-07-05 2009-02-19 Nec (China) Co Ltd クエリー要件展開器およびクエリー要件展開方法
JP2009282903A (ja) * 2008-05-26 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 知識抽出・検索装置およびその方法
JP2013190848A (ja) * 2012-03-12 2013-09-26 Rakuten Inc 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体

Also Published As

Publication number Publication date
CN105677931B (zh) 2018-06-19
JP6732938B2 (ja) 2020-07-29
KR102148691B1 (ko) 2020-08-27
CN105677931A (zh) 2016-06-15
KR20180126589A (ko) 2018-11-27
WO2017173773A1 (zh) 2017-10-12

Similar Documents

Publication Publication Date Title
JP2019511065A (ja) 情報検索方法及び装置
JP2019511065A5 (ja)
JP6745384B2 (ja) 情報をプッシュするための方法及び装置
US9535960B2 (en) Context-sensitive search using a deep learning model
EP3180742B1 (en) Generating and using a knowledge-enhanced model
CN112262421B (zh) 自动学习复习的可编程接口
CN109241403B (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
US20190095788A1 (en) Supervised explicit semantic analysis
CN108399150B (zh) 文本处理方法、装置、计算机设备和存储介质
JP2019514117A (ja) 個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法
US10437894B2 (en) Method and system for app search engine leveraging user reviews
US20160188726A1 (en) Scalable user intent mining using a multimodal restricted boltzmann machine
CN106471497B (zh) 使用上下文的辅助浏览
US11651015B2 (en) Method and apparatus for presenting information
CN105095444A (zh) 信息获取方法和装置
CN109766418B (zh) 用于输出信息的方法和装置
US20200104427A1 (en) Personalized neural query auto-completion pipeline
CN112035741B (zh) 基于用户体检数据的预约方法、装置、设备及存储介质
US20100211605A1 (en) Apparatus and method for unified web-search, selective broadcasting, natural language processing utilities, analysis, synthesis, and other applications for text, images, audios and videos, initiated by one or more interactions from users
US9652544B2 (en) Generating snippets for prominent users for information retrieval queries
US20200349208A1 (en) Data-driven online business name generator
CN111403011B (zh) 挂号科室推送方法、装置、系统、电子设备及存储介质
US20180336525A1 (en) Hybrid offline/online generation of job recommendations
US20180336527A1 (en) Offline computation of partial job recommendation scores
US20200351241A1 (en) Data-driven online domain name generator

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190821

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191121

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20191225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200708

R150 Certificate of patent or registration of utility model

Ref document number: 6732938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250