JP2018525717A - 探索処理方法およびデバイス - Google Patents

探索処理方法およびデバイス Download PDF

Info

Publication number
JP2018525717A
JP2018525717A JP2017567163A JP2017567163A JP2018525717A JP 2018525717 A JP2018525717 A JP 2018525717A JP 2017567163 A JP2017567163 A JP 2017567163A JP 2017567163 A JP2017567163 A JP 2017567163A JP 2018525717 A JP2018525717 A JP 2018525717A
Authority
JP
Japan
Prior art keywords
search
search character
sentence pattern
variable
character variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017567163A
Other languages
English (en)
Other versions
JP6457123B2 (ja
Inventor
▲鴻▼城 傅
▲鴻▼城 傅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2018525717A publication Critical patent/JP2018525717A/ja
Application granted granted Critical
Publication of JP6457123B2 publication Critical patent/JP6457123B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

探索処理方法およびデバイスであって、この方法は、少なくとも1つの過去の探索文字列における過去の探索文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスを生成し、生成された探索キャラクタ変数センテンスからの共通の探索センテンスセットに属さない探索キャラクタ変数センテンスに対応する生成回数の数を蓄積し、生成回数の数のための事前設定された第1のしきい値に達する生成回数の数を有する探索キャラクタ変数センテンスを、共通の探索センテンスセットへ追加するステップと、現在の探索文字列が獲得された場合、少なくとも1つの探索キャラクタ変数センテンスからの共通の探索センテンスセットに属し、現在の探索文字列に対応する、探索キャラクタ変数センテンスを、ターゲット探索キャラクタ変数センテンスとして判定し、ターゲット探索キャラクタ変数センテンスに対応する探索結果データをクライアントへ送信するステップとを備える。本出願は、探索文字列の識別精度を高めることができ、探索結果がユーザの期待を満たし得ることを保証する。

Description

この出願は、その全体が参照により組み込まれる2016年1月12日出願の「SEARCHING PROCESSING METHOD AND APPARATUS」と題された中国特許出願第201610019595.4号の優先権を主張する。
この出願は、インターネット技術の分野に関し、特に、探索処理方法および装置に関する。
インターネットと電子デバイスの発展により、より多くのユーザが、インターネットを経由して曲を選択し、曲を聴くことを選択する。たとえば、ユーザが、クライアントによって、探索フィールドに「アンディラウ(中国の有名な歌手)」を入力した場合、サーバは、クライアントへ「アンディラウ」の曲に関する情報をフィードバックし得る。理解され得るように、ユーザは、インターネットを経由して曲を探索することによって、様々な曲をより便利に聴くことができ得る。しかしながら、ユーザによって入力された探索キャラクタ文字列が口語である場合、探索キャラクタ文字列は、現在の曲探索方式において正確に認識されることはできず、その結果、発見された曲に関する情報は、ユーザの期待を十分に満たすことはできない。たとえば、ユーザによって入力された探索キャラクタ文字列が、「私はレスリーチャン(中国の有名な歌手)の赤を探索したい」であれば、現在の曲探索方式に従って、「私(「I」に対応する漢字は、「wo」の漢字と同じである)」と、「赤」との両方が、レスリーチャンの曲として認識され得、「私」という曲のクリック率は、「赤」という曲のクリック率よりも高く、すなわち、「私」という曲の優先度はより高くなる。したがって、現在の曲探索方式に従って、「私」という曲がユーザへ出力され得る。しかしながら、明らかに、ユーザは、「私」という曲を探索せず、「赤」という曲を探索する。理解され得るように、探索キャラクタ文字列は、現在の曲探索方式に従って正確に認識されることはできない。
この出願の実施形態は、探索キャラクタ文字列を認識する精度を高め、探索結果がユーザの期待を満たし得ることを保証するための探索処理方法および装置を提供する。
この出願の実施形態は、
事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するステップと、
事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するステップと、
クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するステップと
を含む探索処理方法を提供する。
相応して、この出願の実施形態は、
事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するように構成された第1の取得モジュールと、
事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するように構成されたセンテンスパターン処理モジュールと、
クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するように構成された判定および送信モジュールと
を含む探索処理装置を提供する。
相応して、この出願の実施形態はさらに、
デバイス制御アプリケーションを記憶するように構成されたメモリと、
デバイス制御アプリケーションを起動して、以下のステップ、すなわち、
事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するステップと、
事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するステップと、
クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するステップとを実行するように構成されたプロセッサと
を含む探索処理装置を提供する。
この出願の実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
この出願の実施形態における、または、従来の技術における技術的解決策をより明確に説明するために、以下は、これら実施形態または従来技術を説明するために必要とされる添付図面を手短に紹介する。明らかに、以下の説明における添付図面は、単に、この出願のいくつかの実施形態を図示しているに過ぎず、当業者であればまだ、創造的な努力なしで、これら添付図面から他の図面を導出し得る。
この出願の実施形態に従う探索処理方法の概要フローチャートである。 この出願の実施形態に従う別の探索処理方法の概要フローチャートである。 この出願の実施形態に従うセンテンスパターン処理方法の概要フローチャートである。 この出願の実施形態に従う探索処理装置の概要構成図である。 この出願の実施形態に従うセンテンスパターン処理モジュールの概要構成図である。 この出願の実施形態に従う判定および送信モジュールの概要構成図である。 この出願の実施形態に従う別の探索処理装置の概要構成図である。 この出願の実施形態に従うさらに別の探索処理装置の概要構成図である。
以下は、この出願の実施形態における添付図面を参照してこの出願の実施形態における技術的解決策を明確かつ完全に説明する。明らかに、説明された実施形態は、この出願の実施形態のすべてではなく、単なる一部である。創造的な努力なしでこの出願の実施形態に基づいて当業者によって取得されたその他のすべての実施形態は、この出願の保護範囲内にあるものとする。
図1を参照すると、図1は、この出願の実施形態に従う探索処理方法の概要フローチャートである。この方法は、以下のステップを含み得る。
S101。事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得する。
具体的には、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を、サーバが取得し得る。少なくとも1つの過去の探索キャラクタ文字列はすべて、第1の時間インターバル内にすべてのクライアントによって入力されアップロードされたすべてのユーザ探索コーパスであり得る。たとえば、第1の時間インターバルが1日に設定されているのであれば、サーバは、1日に1回、その日のうちに収集した少なくとも1つの過去の探索キャラクタ文字列を取得する。
S102。事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加する。
具体的には、探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を含み得、各キャラクタ変数は、キャラクタ変数に関連付けられた探索キャラクタを含む。たとえば、探索キャラクタ変数セットに含まれるキャラクタ変数は個別に「%歌手%」、「%曲%」、「%したい%」、「%の%」、「%接頭語%」、および「%接尾語%」である。「%歌手%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての歌手の名前であり得る。「%曲%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての曲の名前であり得る。「%したい%」というキャラクタ変数に含まれる探索キャラクタは個別に、「私は探索したい」、および「探索したい」のようなフレーズであり得、探索キャラクタの意味は、「%したい%」というキャラクタ変数の意味に類似している。「%の%」というキャラクタ変数に含まれる探索キャラクタは個別に、「の」、「および」等であり得、探索キャラクタの意味は、「%の%」というキャラクタ変数の意味に類似している。「%接頭語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「こんにちは」、「して頂けませんか」等であり得、探索キャラクタの意味は、「%接頭語%」というキャラクタ変数の意味に類似している。「%接尾語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「ありがとう」、「ありがとうございます」等であり得、探索キャラクタの意味は、「%接尾後%」というキャラクタ変数の意味に類似している。したがって、サーバは、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける各キャラクタ変数に含まれる探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識し、過去の各探索キャラクタ文字列における少なくとも1つのセグメンテーションキャラクタに対応するキャラクタ変数に従って、過去の各探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し得る。各探索キャラクタ変数センテンスパターンは、1つまたは複数のキャラクタ変数を含む。たとえば、過去の探索キャラクタ文字列が、「私はレスリーチャンの赤を探索したい」であれば、「私はレスリーチャンの赤を探索したい」が、探索キャラクタ変数セットに従って、多数のセグメンテーションキャラクタ、すなわち、「私は探索したい」、「赤」、「の」、および「レスリーチャン」へ分割され得る。「私は探索したい」は、「%したい%」というキャラクタ変数に対応しているので、「レスリーチャン」は、「%歌手%」というキャラクタ変数に対応し、「の」は、「%の%」というキャラクタ変数に対応し、「赤」は、「%曲%」というキャラクタ変数に対応し、「%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンが生成され得る。さらに、「私はレスリーチャンの赤を探索したい」が、多数のセグメンテーションキャラクタ、すなわち、「私」、「探索したい」、「赤」、「の」、および「レスリーチャン」へ分割され得る。「私」は、「曲」というキャラクタ変数に対応し、「探索したい」は、「%したい%」というキャラクタ変数に対応し、「レスリーチャン」は、「%歌手%」というキャラクタ変数に対応し、「の」は、「%の%」というキャラクタ変数に対応し、「赤」は、「%曲%」というキャラクタ変数に対応するので、「%曲%%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンが生成され得る。すなわち、「私はレスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、2つの探索キャラクタ変数センテンスパターンに対応する。
さらに、サーバは、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し得る。すなわち、探索キャラクタ変数センテンスパターンが、1つの過去の探索キャラクタ文字列のために生成される毎に、生成回数の量を蓄積するために、探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加される。たとえば、少なくとも1つの過去の探索キャラクタ文字列に従って、統計収集によって、探索キャラクタ変数センテンスパターンに対応する生成回数の量が60であることが取得されるのであれば、それは、探索キャラクタ変数センテンスパターンが、少なくとも1つの過去の探索キャラクタ文字列における60の過去の探索キャラクタ文字列のために生成され得ることを示す。別の例のために、少なくとも1つの過去の探索キャラクタ文字列が、「レスリーチャンの赤を探索したい」、「アンディラウのWang qing shuiを探索したい」、「Wen bieを探索したい」、および「アンディラウを探索したい」を含むのであれば、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウのWang qing shuiを探索したい」という過去の探索キャラクタ文字列は、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「Wen bieを探索したい」という過去の探索キャラクタ文字は、「%したい%%曲%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウを探索したい」という過去の探索キャラクタ文字列は、「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ2が追加され得、「%したい%%曲%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加され得、「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加され得る。
さらに、サーバはさらに、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加し得る。たとえば、事前設定された回数の量の第1のしきい値が1000であれば、探索キャラクタ変数センテンスパターンに対応する生成回数の蓄積された量が1000である場合、探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得、探索キャラクタ変数センテンスパターンに対応する生成回数の量が、その後蓄積される必要はない。さらに、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンをサーバによって、共通の探索センテンスパターンセットへ追加する具体的な処理は、探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第1のしきい値に達したことを検出した場合に、サーバによって、アドミニストレータクライアントへメッセージを送信するステップであり得、これによって、アドミニストレータは、探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するか否かを判定できるようになり、アドミニストレータはさらに、探索キャラクタ変数センテンスパターンに関連付けられた探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加するか否かを判定し得る。トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンは、もはや使用されないセンテンスパターンである。すなわち、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンと、トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンとに対応する回数の量は、蓄積される必要はない。たとえば、「私はレスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、2つの探索キャラクタ変数センテンスパターン、すなわち、「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」に対応し得る。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量が、事前設定された回数の量の第1のしきい値に達した場合、アドミニストレータは、アドミニストレータクライアントを使用することによって、サーバに対して、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを共通の探索センテンスパターンセットへ追加するように指示し得、サーバに対して、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加するように指示し得る。
S103。クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを、クライアントへ送信する。
具体的には、クライアントによって送信された現在の探索キャラクタ文字列をサーバが取得した場合、サーバは、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを、クライアントへ送信し得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。たとえば、クライアントによって送信された現在の探索キャラクタ文字列が、「私はレスリーチャンの赤を探索したい」であれば、サーバは、「私はレスリーチャンの赤を探索したい」に対応する探索キャラクタ変数センテンスパターンである「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」を生成する。「%したい%%曲%%の%%歌手%」は、共通の探索センテンスパターンセットに属するので、サーバは、「%したい%%曲%%の%%歌手%」に対応する探索結果データをクライアントへダイレクトに送信する。「%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「赤」という曲を含む。理解され得るように、「%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を満たす。「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「私」および「赤」という2つの曲を含む。理解され得るように、「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を十分に満たす訳ではない。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンよりもユーザの期待をより良好に満たすので、過去の大量の探索キャラクタ文字列から、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する確率は、「%曲%%したい%%曲%%の%%歌手%」という
探索キャラクタ変数センテンスパターンを生成する確率よりも高い。すなわち、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、共通の探索センテンスパターンセットへ追加されるより高い優先度を得る。
S101およびS102は、第1の時間インターバル毎に実行され得るので、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンは、コンスタントに更新され得、S103が実行された場合に取得される探索結果データは、より正確である。すなわち、探索結果データは、ユーザの期待をより良く満たす。
この出願のこの実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
図2を参照すると、図2は、この出願の実施形態に従う別の探索処理方法の概要フローチャートである。方法は、以下のステップを含み得る。
S201。事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得する。
S202。事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加する。
ステップS201およびS202の具体的な実施のために、図1に対応する実施形態におけるS101およびS102を参照し、詳細は本明細書では再度説明されない。
S203。クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、探索キャラクタ変数セットに従って、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成する。
具体的には、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、探索キャラクタ変数セットに従って、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが生成される。探索キャラクタ変数センテンスパターンを生成する具体的な処理は、図1に対応する実施形態におけるS102と同じである。たとえば、探索キャラクタ変数セットに含まれるキャラクタ変数は個別に「%歌手%」、「%曲%」、「%したい%」、「%の%」、「%接頭語%」、および「%接尾語%」である。「%歌手%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての歌手の名前であり得る。「%曲%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての曲の名前であり得る。「%したい%」というキャラクタ変数に含まれる探索キャラクタは、個別に「私は探索したい」および「探索したい」というようなフレーズであり得る。「%の%」というキャラクタ変数に含まれる探索キャラクタは、個別に「の」と「および」等であり得る。「%接頭語%」というキャラクタ変数に含まれる探索キャラクタは、個別に「こんにちは」、「頂けますか」等であり得る。「%接尾語%」というキャラクタ変数に含まれる探索キャラクタは、個別に「ありがとう」、「ありがとうございます」等であり得る。現在の探索キャラクタ文字列が「私はレスリーチャンの赤を探索したい」であれば、「%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンが生成され得る。現在の探索キャラクタ文字列における「私」はまた、レスリーチャンの曲の名前でもあるので、「%曲%%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンもまた生成され得る。
S204。現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出する。
具体的には、サーバはさらに、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出し得る。たとえば、「私はレスリーチャンの赤を探索したい」という現在の探索キャラクタ文字列が、2つの探索キャラクタ変数センテンスパターン、すなわち「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」に対応する。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンのみが、共通の探索センテンスパターンセットに属する。したがって、「私はレスリーチャンの赤を探索したい」という現在の探索キャラクタ文字列に対応する2つの探索キャラクタ変数センテンスパターンに存在する共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることが検出され得る。
S205。現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信する。
具体的には、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることを検出した場合、サーバは、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信し得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。たとえば、クライアントによって送信された現在の探索キャラクタ文字列が、「私はレスリーチャンの赤を探索したい」であれば、サーバは、「私はレスリーチャンの赤を探索したい」に対応する「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する。「%したい%%曲%%の%%歌手%」は、共通の探索センテンスパターンセットに属するので、サーバは、「%したい%%曲%%の%%歌手%」に対応する探索結果データをクライアントへダイレクトに送信する。「%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「赤」という曲を含む。理解され得るように、「%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を満たす。「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「私」および「赤」という2つの曲を含む。理解され得るように、「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を十分に満たす訳ではない。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンよりもユーザの期待をより良好に満たすので、過去の大量の探索キャラクタ文字列から、「%したい%
%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する確率は、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する確率よりも高い。すなわち、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、共通の探索センテンスパターンセットへ追加されるより高い優先度を得る。
オプションとして、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が0であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける生成回数の最大量を有する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信される。
オプションとして、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1よりも大きいことが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報が取得され、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信される。たとえば、現在の探索キャラクタ文字列は「私はABCを探索したい」であり、「ABC」は、歌手の名前と曲の名前との両方である。したがって、「私はABCを探索したい」という現在の探索キャラクタ文字列に対応する探索キャラクタ変数センテンスパターンは、個別に「%したい%%歌手%」および「%したい%%曲%」であり得る。「%したい%%歌手%」および「%したい%%曲%」という探索キャラクタ変数センテンスパターンの両方が、共通の探索センテンスパターンセットに属するのであれば、歌手としての「ABC」というユーザクリックボリューム(すなわち、人気ランク情報)が取得され得、曲としての「ABC」というユーザクリックボリュームが取得され得、さらに、これら2つのユーザクリックボリュームが比較される。曲としての「ABC」というユーザクリックボリュームが、より大きなユーザクリックボリュームを有しているのであれば、「%したい%%曲%」に対応する探索結果データ(すなわち、名前が「ABC」である曲が、探索結果データとして使用される)が、クライアントへ送信される。
S206。事前設定された第2の時間インターバルに達した場合、共通の探索センテンスパターンセットと、事前設定された、判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得する。
具体的には、事前設定された第2の時間インターバルに達した場合、サーバは、共通の探索センテンスパターンセットと、事前設定された、判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得し得る。判定されるべきセンテンスパターンセットは、共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される。すなわち、過去の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、S202において生成された場合、共通の探索センテンスパターンセットに属さず、判定されるべきセンテンスパターンセットにない探索キャラクタ変数センテンスパターンが、判定されるべきセンテンスパターンセットへ追加され得、探索キャラクタ変数センテンスパターンに対応する生成回数の量が1へ設定される。その後、探索キャラクタ変数センテンスパターンが生成される毎に、生成回数の量へ1が追加され、探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第1のしきい値に達した場合、探索キャラクタ変数センテンスパターンが、判定されるべきセンテンスパターンセットから、共通の探索センテンスパターンセットへ転送される。
S207。第2の時間インターバル内に収集された過去のすべての探索キャラクタ文字列に従って、すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除する。
具体的には、サーバが、第2の時間インターバル内に収集された過去のすべての探索キャラクタ文字列に対応する探索キャラクタ変数センテンスパターンに従って、すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し得、判定されるべきセンテンスパターンセットおよび共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンの量がコンスタントに増加しないことを保証するために、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除し得、エンジンにおける過多なリソースのケースを回避し得る。たとえば、第2の時間インターバルが1か月であれば、サーバは、月に1回、その月において共通して使用されない探索キャラクタ変数センテンスパターンを削除する。例として月を使用して、共通の探索センテンスパターンセットと、判定されるべきセンテンスパターンセットとにおいて、サーバによって取得されたすべての現在の探索キャラクタ変数センテンスパターンは、A、B、C、D、E、およびFを含み、その月における過去のすべての探索キャラクタ文字列が取得される。その月において、過去のすべての探索キャラクタ文字列において、Aが1回生成され、Cが10回生成され、Eが5回生成され、Fが8回生成されたのであれば、Aに対応する新たな生成回数の量は1であり、Bに対応する新たな生成回数の量は0であり、Cに対応する新たな生成回数の量は10であり、Dに対応する新たな生成回数の量は0であり、Eに対応する新たな生成回数の量は5であり、Fに対応する新たな生成回数の量は8である。事前設定された回数の量の第3のしきい値が2であれば、探索キャラクタ変数センテンスパターンA、BおよびDが削除される。
この出願におけるこの実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
図3を参照すると、図3は、この出願の実施形態に従うセンテンスパターン処理方法の概要フローチャートである。この出願のこの実施形態における方法は、図1に対応する実施形態におけるS102、または、図2に対応する実施形態におけるS202に対応し得る。この方法は具体的に、以下のステップを含む。
S301。過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識する。
具体的には、探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を含み得、各キャラクタ変数は、キャラクタ変数に関連付けられた探索キャラクタを含む。たとえば、探索キャラクタ変数セットに含まれるキャラクタ変数は個別に「%歌手%」、「%曲%」、「%したい%」、「%の%」、「%接頭語%」、および「%接尾語%」である。「%歌手%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての歌手の名前であり得る。「%曲%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての曲の名前であり得る。「%したい%」というキャラクタ変数に含まれる探索キャラクタは個別に、「私は探索したい」、および「探索したい」のようなフレーズであり得、探索キャラクタの意味は、「%したい%」というキャラクタ変数の意味に類似している。「%の%」というキャラクタ変数に含まれる探索キャラクタは個別に、「の」、「および」等であり得、探索キャラクタの意味は、「%の%」というキャラクタ変数の意味に類似している。「%接頭語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「こんにちは」、「して頂けませんか」等であり得、探索キャラクタの意味は、「%接頭語%」というキャラクタ変数の意味に類似している。「%接尾語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「ありがとう」、「ありがとうございます」等であり得、探索キャラクタの意味は、「%接尾後%」というキャラクタ変数の意味に類似している。したがって、サーバは、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける各キャラクタ変数に含まれる探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識し得る。たとえば、過去のキャラクタ文字列が、「レスリーチャンの赤を探索したい」であれば、「レスリーチャンの赤を探索したい」が、探索キャラクタ変数セットに従って、多数のセグメンテーションキャラクタ、すなわち、「探索したい」、「赤」、「の」、および「レスリーチャン」へ分割され得る。
S302。少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定する。
具体的には、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割した後、サーバは、過去の各探索キャラクタ文字列に対応する各セグメンテーションキャラクタが、対応するキャラクタ変数を有するか否を検出し得、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定し得る。たとえば、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列に対応する多数のセグメンテーションキャラクタは個別に、「探索したい」、「赤」、「の」、および「レスリーチャン」である。「探索したい」は、「%したい%」というキャラクタ変数に対応し、「レスリーチャン」は、「%歌手%」というキャラクタ変数に対応し、「の」は、「%の%」というキャラクタ変数に対応し、「赤」は、「%曲%」というキャラクタ変数に対応しているので、それは、各セグメンテーションキャラクタが、対応するキャラクタ変数を有することと、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列が、第1のカテゴリの過去の探索キャラクタ文字列として判定され得ることとを示す。
S303。第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、第1のカテゴリの過去の探索キャラクタ文字列に対応し、キャラクタ変数を含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成する。
具体的には、多数の第1のカテゴリの過去の探索キャラクタ文字列が存在するのであれば、各第1のカテゴリの過去の探索キャラクタ文字列に対応し、キャラクタ変数を独占的に含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンが、各第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って生成され得る。例として「レスリーチャンの赤を探索したい」という第1のカテゴリの過去の探索キャラクタ文字列を使用して、「レスリーチャンの赤を探索したい」に対応するキャラクタ変数は、個別に「%したい%」、「%曲%」、「%の%」、および「%歌手%」である。その後、対応するキャラクタ変数を含み、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンが生成され得る。すべての変数タイプからなる探索キャラクタ変数センテンスパターンは、キャラクタ変数を独占的に含む探索キャラクタ変数センテンスパターンである。
S304。事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる、探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加する。
具体的には、サーバは、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し得る。すなわち、1つの過去の探索キャラクタ文字列のために、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが生成される毎に、生成回数の量を蓄積するために、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加される。たとえば、統計収集によって、少なくとも1つの過去の探索キャラクタ文字列に従って、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が60であることが取得されると、それは、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが、少なくとも1つの過去の探索キャラクタ文字列における60の過去の探索キャラクタ文字列のために生成され得ることを示す。別の例のために、少なくとも1つの過去の探索キャラクタ文字列が、「レスリーチャンの赤を探索したい」、「アンディラウのWang qing shuiを探索したい」、「Wen bieを探索したい」、および「アンディラウを探索したい」を含むのであれば、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列が、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウのWang qing shuiを探索したい」という過去の探索キャラクタ文字列が、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「Wen bieを探索したい」という過去の探索キャラクタ文字列が、すべての変数タイプからなる「%したい%%曲%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウを探索したい」という過去の探索キャラクタ文字列が、すべての変数タイプからなる「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ2が追加され得、すべての変数タイ
プからなる「%したい%%曲%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加され得、すべての変数タイプからなる「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加され得る。
さらに、サーバはさらに、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを共通の探索センテンスパターンセットへ追加し得る。たとえば、事前設定された回数の量の第1のしきい値が1000であれば、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の蓄積された量が1000である場合、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量は、その後蓄積される必要はない。さらに、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンをサーバによって、共通の探索センテンスパターンセットへ追加する具体的な処理は、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第1のしきい値に達したことを検出した場合に、サーバによって、アドミニストレータクライアントへメッセージを送信するステップであり得、これによって、アドミニストレータは、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するか否かを判定し、アドミニストレータはさらに、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに関連付けられた探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加するか否かを判定できるようになり得る。トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンは、もはや使用されないセンテンスパターンである。すなわち、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンに対応する生成回数の量と、トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンとは、蓄積される必要はない。たとえば、「私はレスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、すべての変数タイプからなる2つの探索キャラクタ変数センテンスパターンである「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」に対応し得る。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量が、事前設定された回数の量の第1のしきい値に達した場合、アドミニストレータは、アドミニストレータクライアントを使用することによって、サーバに対して、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するように指示し得、サーバに対して、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加するように指示し得る。
S305。少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列として判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定する。
具体的には、統計情報が、すべての変数タイプからなる探索キャラクタ変数センテンスパターンにおいて収集された後、サーバはさらに、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列として判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定し得る。たとえば、過去の探索キャラクタ文字列は、「レスリーチャンの赤を探索したい」である。「探索したい」というセグメンテーションキャラクタは、探索キャラクタ変数セットにおけるいずれのキャラクタ変数にも属さないので、「レスリーチャン」は、%歌手%というキャラクタ変数に対応し、「の」は、%の%というキャラクタ変数に対応し、「赤」は、%曲%というキャラクタ変数に対応し、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、第2のカテゴリの過去の探索キャラクタ文字列として判定され得、「探索したい」というセグメンテーションキャラクタは、第1のセグメンテーションキャラクタとして判定され得、「赤」、「の」、および「レスリーチャン」というセグメンテーションキャラクタは、第2のセグメンテーションキャラクタとして判定され得る。
S306。第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成する。
具体的には多数の第2のカテゴリの過去の探索キャラクタ文字列が存在するのであれば、各第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンが生成され得る。例として「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列を使用して、第1のセグメンテーションキャラクタは、「探索したい」を含み、第2のセグメンテーションキャラクタは、「赤」、「の」、および「レスリーチャン」を含み、「レスリーチャン」は、%歌手%というキャラクタ変数に対応し、「の」は、%の%というキャラクタ変数に対応し、「赤」は、%曲%というキャラクタ変数に対応する。したがって、「レスリーチャンの赤を探索したい」に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、「%曲%%の%%歌手%を探索したい」という探索キャラクタ変数センテンスパターンが生成され得る。すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンは、キャラクタ変数を非独占的に含む探索キャラクタ変数センテンスパターンである。
S307。すべてではない変数タイプからなる少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、第1のセグメンテーションキャラクタに対応するキャラクタ変数を、探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、すべてではない変数タイプに対応する少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加する。
具体的には、すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンが、1つの第2のカテゴリの過去の探索キャラクタ文字列のために生成された場合、すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加される。すなわち、生成回数の量が蓄積される。すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第2のしきい値に達した場合、第1のセグメンテーションキャラクタに対応するキャラクタ変数が、探索キャラクタ変数セットへ、または、新たに生成された探索キャラクタ変数セットへ追加され得る。たとえば、「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列が、すべてではない変数タイプからなる「%曲%%の%%歌手%を探索したい」という探索キャラクタ変数センテンスパターンに対応し、回数の量の第2のしきい値が500であれば、「%曲%%の%%歌手%を探索したい」に対応する生成回数の量が500に達した場合、それは、「%曲%%の%%歌手%を探索したい」ことが、500の第2のカテゴリの過去の探索キャラクタ文字列のために生成され得ることを示す。このケースでは、「探索したい」という第1のセグメンテーションキャラクタが、「したい」という既存のキャラクタ変数へマニュアルで追加され得るか、または、%探索したい%という新たなキャラクタ変数がマニュアルで生成され、「探索したい」という第1のセグメンテーションキャラクタが、「探索したい」という新たなキャラクタ変数へ追加される。
S308。第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタに対応するキャラクタ変数と、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成する。
具体的には、第1のセグメンテーションキャラクタが、対応するキャラクタ変数を有した後、第1のセグメンテーションキャラクタを含む第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタに対応するキャラクタ変数と、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンが生成され得、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを共通の探索センテンスパターンセットへ追加するS304が再実行される。たとえば、「探索したい」という第1のセグメンテーションキャラクタが、%したい%というキャラクタ変数に対応するのであれば、すべての変数タイプからなり、「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列に対応する%したい%%曲%%の%%歌手%という探索キャラクタ変数センテンスパターンが生成され得、既存の「%したい%%曲%%の%%歌手%」に対応する生成回数の量へ1が追加され得る(S304における統計集計によって、「%したい%%曲%%の%%歌手%」に対応する生成回数の量が560であることが取得されると、このケースでは、生成回数の量が561へ蓄積され得る)か、または、すべての変数タイプからなり、「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列に対応する「%したい%%歌手%」という探索キャラクタ変数センテンスパターンが生成され得、既存の「%したい%%歌手%」に対応する生成回数の量にさらに1が追加される。
この出願のこの実施形態では、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され、生成された探索キャラクタ変数センテンスパターンにおいて、事前設定された共通の探索センテンスパターンセットに属しない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され、これによって共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加されるようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。それに加えて、探索キャラクタ変数センテンスパターンが生成された場合、探索キャラクタ変数センテンスパターンが、すべての変数タイプとすべてではない変数タイプへ分類され得、探索キャラクタ変数セットに従ってより多くの単語が認識され得、さらに、ユーザによって入力された探索キャラクタ文字列を認識する精度を高めることを保証するように、対応するキャラクタ変数を有さないセグメンテーションキャラクタへキャラクタ変数を割り当てるために、または、対応するキャラクタ変数を有さないセグメンテーションキャラクタのための新たなキャラクタ変数を生成するために、すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンについて個別の統計収集が実行される。
図4を参照すると、図4は、この出願の実施形態に従う探索処理装置の概要構成図である。探索処理装置1は、第1の取得モジュール10、センテンスパターン処理モジュール20、および判定および送信モジュール30を含み得る。
事前設定された第1の時間インターバルに達した場合、第1の取得モジュール10は、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するように構成される。
具体的には、事前設定された第1の時間インターバルに達した場合、第1の取得モジュール10は、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得し得る。少なくとも1つの過去の探索キャラクタ文字列はすべて、第1の時間インターバル内にすべてのクライアントによって入力されアップロードされたすべてのユーザ探索コーパスであり得る。たとえば、第1の時間インターバルが1日に設定されているのであれば、第1の取得モジュール10は、1日に1回、その日のうちに収集した少なくとも1つの過去の探索キャラクタ文字列を取得する。
センテンスパターン処理モジュール20は、事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するように構成される。
具体的には、図5を参照すると、図5は、センテンスパターン処理モジュール20の概要構成図である。センテンスパターン処理モジュール20は、認識および分割ユニット201、キャラクタ判定ユニット202、第1の生成ユニット203、蓄積および追加ユニット204、第2の生成ユニット205、および生成および通知ユニット206を含み得る。
認識および分割ユニット201は、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識するように構成される。
具体的には、探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を含み得、各キャラクタ変数は、キャラクタ変数に関連付けられた探索キャラクタを含む。たとえば、探索キャラクタ変数セットに含まれるキャラクタ変数は個別に「%歌手%」、「%曲%」、「%したい%」、「%の%」、「%接頭語%」、および「%接尾語%」である。「%歌手%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての歌手の名前であり得る。「%曲%」というキャラクタ変数に含まれる探索キャラクタは、バックグランドミュージックライブラリにおけるすべての曲の名前であり得る。「%したい%」というキャラクタ変数に含まれる探索キャラクタは個別に、「私は探索したい」、および「探索したい」のようなフレーズであり得、探索キャラクタの意味は、「%したい%」というキャラクタ変数の意味に類似している。「%の%」というキャラクタ変数に含まれる探索キャラクタは個別に、「の」、「および」等であり得、探索キャラクタの意味は、「%の%」というキャラクタ変数の意味に類似している。「%接頭語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「こんにちは」、「して頂けませんか」等であり得、探索キャラクタの意味は、「%接頭語%」というキャラクタ変数の意味に類似している。「%接尾語%」というキャラクタ変数に含まれる探索キャラクタは個別に、「ありがとう」、「ありがとうございます」等であり得、探索キャラクタの意味は、「%接尾後%」というキャラクタ変数の意味に類似している。したがって、認識および分割ユニット201は、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける各キャラクタ変数に含まれる探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識し得る。たとえば、過去のキャラクタ文字列が、「レスリーチャンの赤を探索したい」であれば、認識および分割ユニット201は、探索キャラクタ変数セットに従って、「レスリーチャンの赤を探索したい」を、多数のセグメンテーションキャラクタ、すなわち、「探索したい」、「赤」、「の」、および「レスリーチャン」へ分割し得る。
キャラクタ判定ユニット202は、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定するように構成される。
具体的には、認識および分割ユニット201が各々、過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割した後、キャラクタ判定ユニット202は、過去の各探索キャラクタ文字列に対応する少なくとも1つのセグメンテーションキャラクタの各々が、対応するキャラクタ変数を有するか否かを検出し得、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定し得る。たとえば、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列に対応する多数のセグメンテーションキャラクタは個別に「探索したい」、「赤」、「の」、および「レスリーチャン」である。「探索したい」は、「%したい%」というキャラクタ変数に対応し、「レスリーチャン」は、「%歌手%」というキャラクタ変数に対応し、「の」は、「%の%」というキャラクタ変数に対応し、「赤」は、「%曲%」というキャラクタ変数に対応するので、それは、各セグメンテーションキャラクタが、対応するキャラクタ変数を有することを示し、キャラクタ判定ユニット202は、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定し得る。
第1の生成ユニット203は、第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、第1のカテゴリの過去の探索キャラクタ文字列に対応し、キャラクタ変数を含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成される。
具体的には、多数の第1のカテゴリの過去の探索キャラクタ文字列が存在するのであれば、第1の生成ユニット203は、第1のカテゴリの過去の各探索キャラクタ文字列に対応する各キャラクタ変数に従って、第1のカテゴリの過去の探索キャラクタ文字列に対応し、キャラクタ変数を独占的に含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し得る。例として「レスリーチャンの赤を探索したい」という第1のカテゴリの過去の探索キャラクタ文字列を使用して、「レスリーチャンの赤を探索したい」に対応するキャラクタ変数は、個別に「%したい%」、「%曲%」、「%の%」、および「%歌手%」である。その後、第1の生成ユニット203は、対応するキャラクタ変数を独占的に含み、すべての変数タイプからなる、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成し得る。すべての変数タイプからなる探索キャラクタ変数センテンスパターンは、キャラクタ変数を独占的に含む探索キャラクタ変数センテンスパターンである。
蓄積および追加ユニット204は、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するように構成される。
具体的には、蓄積および追加ユニット204は、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し得る。すなわち、1つの過去の探索キャラクタ文字列のために、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが生成される毎に、生成回数の量を蓄積するために、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1が追加される。たとえば、統計収集によって、少なくとも1つの過去の探索キャラクタ文字列に従って、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が60であることが取得されると、それは、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが、少なくとも1つの過去の探索キャラクタ文字列における60の過去の探索キャラクタ文字列のために生成され得ることを示す。別の例のために、少なくとも1つの過去の探索キャラクタ文字列が、「レスリーチャンの赤を探索したい」、「アンディラウのWang qing shuiを探索したい」、「Wen bieを探索したい」、「アンディラウを探索したい」を含むのであれば、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウのWang qing shuiを探索したい」という過去の探索キャラクタ文字列は、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、「Wen bieを探索したい」という過去の探索キャラクタ文字列は、すべての変数タイプからなる「%したい%%曲%」という探索キャラクタ変数センテンスパターンに対応し、「アンディラウを探索したい」という過去の探索キャラクタ文字列が、すべての変数タイプからなる「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応し、蓄積および追加ユニット204は、すべての変数タイプからなる「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応す
る生成回数の量へ2を追加し得、すべての変数タイプからなる「%したい%%曲%%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1を追加し得、すべての変数タイプからなる「%したい%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1を追加し得る。
さらに、蓄積および追加ユニット204はさらに、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加し得る。たとえば、事前設定された回数の量の第1のしきい値が1000であれば、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の蓄積された量が1000である場合、蓄積および追加ユニット204は、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加し得、後続して、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積する必要はない。さらに、蓄積および追加ユニット204によって、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加する具体的な処理は、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第1のしきい値に達したことを検出した場合に、蓄積および追加ユニット204によって、アドミニストレータクライアントへメッセージを送信するステップであり得、これによって、アドミニストレータは、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するか否かを判定し、アドミニストレータはさらに、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに関連付けられた探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加するか否かを判定できるようになり得る。トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンは、もはや使用されないセンテンスパターンである。すなわち、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンに対応する生成回数の量と、トラッシュ探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンとは、蓄積される必要はない。たとえば、「私はレスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列は、すべての変数タイプからなる2つの探索キャラクタ変数センテンスパターンである「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」に対応し得る。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンに対応する生成回数の量が、事前設定された回数の量の第1のしきい値に達した場合、蓄積および追加ユニット204は、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加し得、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを、トラッシュ探索センテンスパターンセットへ追加し得る。
キャラクタ判定ユニット202はさらに、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定するように構成される。
具体的には、すべての変数タイプからなる探索キャラクタ変数センテンスパターンにおいて、統計収集が実行された後、キャラクタ判定ユニット202はさらに、少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定し得る。たとえば、過去の探索キャラクタ文字列は、「レスリーチャンの赤を探索したい」である。「探索したい」というセグメンテーションキャラクタは、探索キャラクタ変数セットにおけるいずれのキャラクタ変数にも属さないので、「レスリーチャン」は、%歌手%というキャラクタ変数に対応し、「の」は、%の%というキャラクタ変数に対応し、「赤」は、%曲%というキャラクタ変数に対応し、キャラクタ判定ユニット202は、「レスリーチャンの赤を探索したい」という過去の探索キャラクタ文字列を、第2のカテゴリの過去のキャラクタ文字列として判定し、「探索したい」というセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、「赤」、「の」、および「レスリーチャン」というセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定し得る。
第2の生成ユニット205は、第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成される。
具体的には、多数の第2のカテゴリの過去の探索キャラクタ文字列が存在するのであれば、第2の生成ユニット205は、各第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し得る。例として「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列を使用して、第1のセグメンテーションキャラクタは、「探索したい」を含み、第2のセグメンテーションキャラクタは、「レスリーチャン」、「の」、および「赤」を含み、「レスリーチャン」は、%歌手%というキャラクタ変数に対応し、「の」は、%の%というキャラクタ変数に対応し、「赤」は、%曲%というキャラクタ変数に対応する。したがって、第2の生成ユニット205は、「レスリーチャンの赤を探索したい」に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、「%曲%%の%%歌手%を探索したい」という探索キャラクタ変数センテンスパターンを生成し得る。すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンは、キャラクタ変数を非独占的に含む探索キャラクタ変数センテンスパターンである。
蓄積および追加ユニット204はさらに、すべてではない変数タイプからなる少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、第1のセグメンテーションキャラクタに対応するキャラクタ変数を、探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加するように構成される。
具体的には、すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンが、1つの第2のカテゴリの過去の探索キャラクタ文字列のために生成された場合、蓄積および追加ユニット204は、すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量へ1を追加する。すなわち、生成回数の量が蓄積される。すべてではない変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第2のしきい値に達した場合、蓄積および追加ユニット204は、第1のセグメンテーションキャラクタに対応するキャラクタ変数を、探索キャラクタ変数セット、または、新たに生成された探索キャラクタ変数セットへ追加し得る。たとえば、「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列が、すべてではない変数タイプからなる「%曲%%の%%歌手%を探索したい」という探索キャラクタ変数センテンスパターンに対応し、回数の量の第2のしきい値が500であれば、「%曲%%の%%歌手%を探索したい」に対応する生成回数の量が500に達する場合、それは、「%曲%%の%%歌手%を探索したい」が、500の第2のカテゴリの過去の探索キャラクタ文字列のために生成され得ることを示す。このケースでは、蓄積および追加ユニット204は、「探索したい」という第1のセグメンテーションキャラクタを、「したい」という既存のキャラクタ変数へ追加し得るか、または、%探索したい%という新たなキャラクタ変数がマニュアルで生成され、蓄積および追加ユニット204は、「探索したい」という第1のセグメンテーションキャラクタを、「探索したい」という新たなキャラクタ変数へ追加する。
生成および通知ユニット206は、第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタに対応するキャラクタ変数と、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を、再蓄積するように、蓄積および追加ユニット204へ指示し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するように構成される。
具体的には、第1のセグメンテーションキャラクタが、対応するキャラクタ変数を有した後、生成および通知ユニット206は、第1のセグメンテーションキャラクタを含む第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタに対応するキャラクタ変数と、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべての変数タイプからなる、探索キャラクタ変数センテンスパターンを生成し得、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を、再蓄積するように、蓄積および追加ユニット204へ指示し得、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加し得る。たとえば、「探索したい」という第1のセグメンテーションキャラクタは、%したい%というキャラクタ変数に対応するのであれば、生成および通知ユニット206は、「レスリーチャンの赤を探索したい」という第2のカテゴリの過去の探索キャラクタ文字列に対応し、すべての変数タイプからなる、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成し得、蓄積および追加ユニット204に対して、既存の「%したい%%曲%%の%%歌手%」に対応する生成回数の量へ1を追加するように指示し得るか、または、生成および通知ユニット206が、「レスリーチャンを探索したい」という第2のカテゴリの過去の探索キャラクタ文字列に対応し、すべての変数タイプからなる、「%したい%%歌手%」という探索キャラクタ変数センテンスパターンを生成し得、蓄積および追加ユニット204に対して、既存の「%したい%%歌手%」に対応する生成回数の量へ1を追加するようにさらに指示し得る。
判定および送信モジュール30は、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを、クライアントへ送信するように構成される。
具体的には、図6を参照すると、図6は、判定および送信モジュール30の概要構成図である。判定および送信モジュール30は、センテンスパターン生成ユニット301、量検出ユニット302、およびセンテンスパターン判定および送信ユニット303を含み得る。
センテンスパターン生成ユニット301は、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、探索キャラクタ変数セットに従って、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成される。
具体的には、センテンスパターン生成ユニット301、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、探索キャラクタ変数セットに従って、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成する。たとえば、現在の探索キャラクタ文字列が、「私はレスリーチャンの赤を探索したい」であれば、センテンスパターン生成ユニット301は、「%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンを生成し得る。現在の探索キャラクタ文字列における「私」は、レスリーチャンの曲の名前でもあるので、センテンスパターン生成ユニット301はさらに、「%曲%%したい%%曲%%の%%歌手%」という対応する探索キャラクタ変数センテンスパターンを生成し得る。現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスは、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターン、および/または、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンであり得る。
量検出ユニット302は、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出するように構成される。
具体的には、量検出ユニット302はさらに、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出し得る。たとえば、「私はレスリーチャンの赤を探索したい」という現在の探索キャラクタ文字列は、2つの探索キャラクタ変数センテンスパターン、つまり、「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」に対応し、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンのみが、共通の探索センテンスパターンセットに属する。したがって、量検出ユニット302は、共通の探索センテンスパターンセットに属する1つの探索キャラクタ変数センテンスパターンが、「私はレスリーチャンの赤を探索したい」という現在の探索キャラクタ文字列に対応する2つの探索キャラクタ変数センテンスパターンに存在することを検出し得る。
センテンスパターン判定および送信ユニット303は、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するように構成される。
具体的には、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることを検出した場合、センテンスパターン判定および送信ユニット303は、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信し得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。たとえば、クライアントによって送信された現在の探索キャラクタ文字列が、「私はレスリーチャンの赤を探索したい」のであれば、サーバは、「私はレスリーチャンの赤を探索したい」に対応する探索キャラクタ変数センテンスパターンである「%したい%%曲%%の%%歌手%」および「%曲%%したい%%曲%%の%%歌手%」を生成する。「%したい%%曲%%の%%歌手%」は、共通の探索センテンスパターンセットに属するので、センテンスパターン判定および送信ユニット303は、「%したい%%曲%%の%%歌手%」に対応する探索結果データを、クライアントへダイレクトに送信する。「%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「赤」という曲を含む。理解され得るように、「%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を満たす。「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、レスリーチャンの「私」および「赤」という2つの曲を含む。理解され得るように、「%曲%%したい%%曲%%の%%歌手%」に対応する探索結果データは、ユーザの期待を十分に満たさない。「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンよりもユーザの
期待をより良好に満たすので、過去の大量の探索キャラクタ文字列から、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する確率は、「%曲%%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンを生成する確率よりも高い。すなわち、「%したい%%曲%%の%%歌手%」という探索キャラクタ変数センテンスパターンは、共通の探索センテンスパターンセットへ追加されるより高い優先度を得る。
センテンスパターン判定および送信ユニット303はさらに、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が0であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、生成回数の最大量を有する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するように構成される。
センテンスパターン判定および送信ユニット303はさらに、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1よりも大きいことが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報を取得し、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを、クライアントへ送信するように構成される。たとえば、現在の探索キャラクタ文字列が、「私はABCを探索したい」である。「ABC」は、歌手の名前と曲の名前の両方であり得る。したがって、「私はABCを探索したい」という現在の探索キャラクタ文字列に対応する探索キャラクタ変数センテンスパターンは、個別に「%したい%%歌手%」および「%したい%%曲%」であり得る。「%したい%%歌手%」および「%したい%%曲%」という探索キャラクタ変数センテンスパターンの両方が、共通の探索センテンスパターンセットに属するのであれば、センテンスパターン判定および送信ユニット303は、「ABC」のユーザクリックボリューム(すなわち、人気ランキング情報)を歌手としてい取得し得、「ABC」のユーザクリックボリュームを曲として取得し得、さらに、これら2つのクリックボリュームを比較し得る。曲としての「ABC」というユーザクリックボリュームが、より大きなユーザクリックボリュームを有しているのであれば、センテンスパターン判定および送信ユニット303は、「%したい%%曲%」に対応する探索結果データ(すなわち、名前が「ABC」である曲の探索結果データ)をクライアントへ送信する。
この出願のこの実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
また図7を参照すると、図7は、この出願の実施形態に従う別の探索処理装置の概要構成図である。探索処理装置1は、図4に対応する実施形態において、第1の取得モジュール10、センテンスパターン処理モジュール20、および、判定および送信モジュール30を含み得る。さらに、探索処理装置1はさらに、第2の取得モジュール40および検出および削除モジュール50を含み得る。
第2の取得モジュール40は、事前設定された第2の時間インターバルに達した場合、共通の探索センテンスパターンセットと事前設定された判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得するように構成され、判定されるべきセンテンスパターンセットは、共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される。
具体的には、事前設定された第2の時間インターバルに達した場合、第2の取得モジュール40は、共通の探索センテンスパターンセットおよび事前設定された判定されるべきセンテンスパターンセットにおけるすべての探索キャラクタ変数センテンスパターンを取得し得る。判定されるべきセンテンスパターンセットは、共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される。すなわち、センテンスパターン処理モジュール20が、過去の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成する場合、センテンスパターン処理モジュール20は、共通の探索センテンスパターンセットに属さず、判定されるべきセンテンスパターンセットに存在せず、すべての変数タイプからなる、探索キャラクタ変数センテンスパターンを、判定されるべきセンテンスパターンセットへ追加し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量を1へ設定し得る。その後、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが生成される毎に、生成回数の量へ1が追加され、すべての変数タイプからなる探索キャラクタ変数センテンスパターンに対応する生成回数の量が、回数の量の第1のしきい値に達した場合、すべての変数タイプからなる探索キャラクタ変数センテンスパターンが、判定されるべきセンテンスパターンセットから、共通の探索センテンスパターンセットへ転送される。センテンスパターン処理モジュール20はさらに、共通の探索センテンスパターンセットに属さず、判定されるべきセンテンスパターンセットに存在せず、すべてではない変数タイプからなる、探索キャラクタ変数センテンスパターンを、判定されるべきセンテンスパターンセットへ追加し得る。
検出および削除モジュール50は、第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に従って、すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除するように構成される。
具体的には、検出および削除モジュール50は、第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に対応する探索キャラクタ変数センテンスパターンに従って、すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し得、判定されるべきセンテンスパターンセットおよび共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンの量がコンスタントに増加しないことを保証するために、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除し得、エンジンにおける過多なリソースのケースを回避し得る。たとえば、第2の時間インターバルが1か月であれば、検出および削除モジュール50は、月に1回、その月において共通して使用されない探索キャラクタ変数センテンスパターンを削除する。例として月を使用して、共通の探索センテンスパターンセットと、判定されるべきセンテンスパターンセットとにおいて、検出および削除モジュール50によって取得されるすべての現在の探索キャラクタ変数センテンスパターンは、A、B、C、D、E、およびFを含み、その月における過去のすべての探索キャラクタ文字列が取得される。その月において、過去のすべての探索キャラクタ文字列において、Aが1回生成され、Cが10回生成され、Eが5回生成され、Fが8回生成されたのであれば、Aに対応する新たな生成回数の量は1であり、Bに対応する新たな生成回数の量は0であり、Cに対応する新たな生成回数の量は10であり、Dに対応する新たな生成回数の量は0であり、Eに対応する新たな生成回数の量は5であり、Fに対応する新たな生成回数の量は8である。事前設定された回数の量の第3のしきい値が2であれば、検出および削除モジュール50は、探索キャラクタ変数センテンスパターンA、BおよびDを削除し得る。
この出願のこの実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
図8を参照すると、図8は、この出願の実施形態に従うさらに別の探索処理装置の概要構成図である。図8に図示されるように、探索処理装置1000は、たとえばCPUのような少なくとも1つのプロセッサ1001と、少なくとも1つのネットワークインターフェース1004と、ユーザインターフェース1003と、メモリ1005と、少なくとも1つの通信バス1002とを含み得る。通信バス1002は、構成要素間の接続および通信を実施するように構成される。ユーザインターフェース1003は、ディスプレイおよびキーボードを含み得る。オプションで、ユーザインターフェース1003はさらに、標準的なワイヤインターフェースとワイヤレスインターフェースとを含み得る。ネットワークインターフェース1004は、オプションで、標準的なワイヤインターフェースおよびワイヤレスインターフェース(たとえば、Wi-Fiインターフェース)を含み得る。メモリ1005は、高速ランダムアクセスメモリ(RAM)であり得るか、または、たとえば少なくとも1つの磁気ディスクメモリのような不揮発性メモリであり得る。オプションで、メモリ1005はまた、プロセッサ1001から離れて置かれた少なくとも1つの記憶デバイスであり得る。図8に図示されるように、コンピュータ記憶媒体として、メモリ1005は、オペレーティングシステム、ネットワーク通信モジュール、ユーザインターフェースモジュール、およびデバイス制御アプリケーションを含み得る。
図8に図示される探索処理装置1000では、ネットワークインターフェース1004は主に、クライアントへ接続し、クライアントとのデータ通信を実行するように構成される。ユーザインターフェース1003は主に、ユーザによる入力のためのインターフェースを提供し、ユーザによって出力されたデータを取得するように構成される。プロセッサ1001は、メモリ1005に記憶されたデバイス制御アプリケーションを起動し、具体的には、以下のステップ、すなわち、
事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するステップと、
事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するステップと、
クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するステップと
を実行するように構成される。
実施形態では、探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を含み、各キャラクタ変数は、キャラクタ変数に関連付けられた探索キャラクタを含む。
事前設定された探索キャラクタ変数セットに従って、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、生成された探索キャラクタ変数センテンスパターンにおいて、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加した場合、プロセッサ1001は、具体的に、以下のステップ、すなわち、
過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、探索キャラクタ変数セットにおける探索キャラクタに従って、少なくとも1つの過去の探索キャラクタ文字列を認識するステップと、
少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定するステップと、
第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、第1のカテゴリの過去の探索キャラクタ文字列に対応し、キャラクタ変数を含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおいてすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するステップと
を実行する。
実施形態では、プロセッサ1001はさらに以下のステップ、すなわち、
少なくとも1つのセグメンテーションキャラクタの各々が、少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定するステップと、
第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタと、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、第1のセグメンテーションキャラクタに対応するキャラクタ変数を、探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加するステップと、
第2のカテゴリの過去の探索キャラクタ文字列に対応し、第1のセグメンテーションキャラクタに対応するキャラクタ変数と、第2のセグメンテーションキャラクタに対応するキャラクタ変数とを含み、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、事前設定された共通の探索センテンスパターンセットに属さず、生成された探索キャラクタ変数センテンスパターンにおけるすべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を再蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達し、すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、共通の探索センテンスパターンセットへ追加するステップと
を実行する。
実施形態では、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信する場合、プロセッサ1001は、具体的には、以下のステップ、すなわち、
クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、探索キャラクタ変数セットに従って、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出するステップと、
現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するステップと
を実行する。
実施形態では、プロセッサ1001はさらに、以下のステップ、すなわち、
現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が0であることが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、生成回数の最大量を有する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データをクライアントへ送信するステップ、または、
現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量が1よりも大きいことが検出された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報を取得し、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを、クライアントへ送信するステップ
を実行する。
実施形態では、プロセッサ1001はさらに、以下のステップ、すなわち、
事前設定された第2の時間インターバルに達した場合、共通の探索センテンスパターンセットと事前設定された判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得するステップであって、判定されるべきセンテンスパターンセットは、共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される、ステップと、
第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に従って、すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除するステップと
を実行する。
この出願のこの実施形態では、事前設定された第1の時間インターバルに達した場合、第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列が取得され、これによって、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、共通して使用されるセンテンスパターンであることを保証するために、少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンが、事前設定された探索キャラクタ変数セットに従って生成され得、生成された探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量が蓄積され得、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンが、共通の探索センテンスパターンセットへ追加され得るようになる。すなわち、それは、共通の探索センテンスパターンセットにおける探索キャラクタ変数センテンスパターンが、ユーザの意図をより良好に満たすセンテンスパターンであることを示す。したがって、クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンが、ターゲット探索キャラクタ変数センテンスパターンとして判定され得、ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データが、クライアントへ送信され得る。ターゲット探索キャラクタ変数センテンスパターンは、ユーザの意図を最も良く満たすセンテンスパターンであるので、探索結果がユーザの期待を満たし得ることを保証するために、現在の探索キャラクタ文字列を認識する精度が高められ得る。
当業者であれば、この実施形態における方法の処理のうちのすべてまたはいくつかが、関連するハードウェアに命令するコンピュータプログラムによって実施され得ることを理解し得る。プログラムは、コンピュータ読取可能な記憶媒体に記憶され得る。プログラムが実行した場合、実施形態における方法の処理が実行される。前述した記憶媒体は、磁気ディスク、光ディスク、読取専用メモリ(ROM)、またはランダムアクセスメモリ(RAM)を含み得る。
上記開示されるものは単に、この出願の例示的な実施形態であり、この出願の保護範囲を限定することは確実に意図されていない。したがって、この出願の特許請求の範囲に従ってなされた等価的な変形は、この出願の範囲内にあるものとする。
1 探索処理装置
10 第1の取得モジュール
20 センテンスパターン処理モジュール
30 判定および送信モジュール
40 第2の取得モジュール
50 検出および削除モジュール
201 認識および分割ユニット
202 キャラクタ判定ユニット
203 第1の生成ユニット
204 蓄積および追加ユニット
205 第2の生成ユニット
206 生成および通知ユニット
301 センテンスパターン生成ユニット
302 量検出ユニット
303 センテンスパターン判定および送信ユニット
1000 探索処理装置
1001 プロセッサ
1002 通信バス
1003 ユーザインターフェース
1004 ネットワークインターフェース
1005 メモリ

Claims (21)

  1. 事前設定された第1の時間インターバルに達した場合、前記第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するステップと、
    クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信するステップと
    を備える探索処理方法。
  2. 事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップ
    をさらに備える、請求項1に記載の探索処理方法。
  3. 前記探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を備え、各キャラクタ変数は、前記キャラクタ変数に関連付けられた探索キャラクタを備え、
    事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加する前記ステップは、
    過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、前記探索キャラクタ変数セットにおける前記探索キャラクタに従って、前記少なくとも1つの過去の探索キャラクタ文字列を認識するステップと、
    前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定するステップと、
    前記第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、前記第1のカテゴリの過去の探索キャラクタ文字列に対応し、前記キャラクタ変数を備え、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップと
    を備える、請求項2に記載の探索処理方法。
  4. 事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加する前記ステップは、
    前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定するステップと、
    前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタと、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、前記第1のセグメンテーションキャラクタに対応するキャラクタ変数を、前記探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加するステップと、
    前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタに対応する前記キャラクタ変数と、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、前記すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を再蓄積し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップと
    をさらに備える、請求項3に記載の探索処理方法。
  5. クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信する前記ステップは、
    前記クライアントによって送信された前記現在の探索キャラクタ文字列が取得された場合、前記探索キャラクタ変数セットに従って、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出するステップと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する前記探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するステップと
    を備える、請求項1から4のいずれか一項に記載の探索処理方法。
  6. クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信する前記ステップはさらに、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が0であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、生成回数の最大量を有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを前記クライアントへ送信するステップ、または、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1よりも大きいことが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報を取得し、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するステップ
    を備える、請求項5に記載の探索処理方法。
  7. 事前設定された第2の時間インターバルに達した場合、前記共通の探索センテンスパターンセットと事前設定された判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得するステップであって、前記判定されるべきセンテンスパターンセットは、前記共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される、ステップと、
    前記第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に従って、前記すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除するステップと
    をさらに備える、請求項1から6のいずれか一項に記載の探索処理方法。
  8. 事前設定された第1の時間インターバルに達した場合、前記第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するように構成された第1の取得モジュールと、
    クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信するように構成された判定および送信モジュールと
    を備える探索処理装置。
  9. 事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するように構成されたセンテンスパターン処理モジュール
    をさらに備える、請求項8に記載の探索処理装置。
  10. 前記探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を備え、各キャラクタ変数は、前記キャラクタ変数に関連付けられた探索キャラクタを備え、
    前記センテンスパターン処理モジュールは、
    過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、前記探索キャラクタ変数セットにおける前記探索キャラクタに従って、前記少なくとも1つの過去の探索キャラクタ文字列を認識するように構成された認識および分割ユニットと、
    前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定するように構成されたキャラクタ判定ユニットと、
    前記第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、前記第1のカテゴリの過去の探索キャラクタ文字列に対応し、前記キャラクタ変数を備え、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成された第1の生成ユニットと、
    前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するように構成された蓄積および追加ユニットと
    を備える、請求項9に記載の探索処理装置。
  11. 前記センテンスパターン処理モジュールはさらに、第2の生成ユニットと、生成および通知ユニットとを備え、
    前記キャラクタ判定ユニットはさらに、前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定するように構成され、
    前記第2の生成ユニットは、前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタと、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成され、
    前記蓄積および追加ユニットはさらに、前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、前記第1のセグメンテーションキャラクタに対応するキャラクタ変数を、前記探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加するように構成され、
    前記生成および通知ユニットは、前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタに対応する前記キャラクタ変数と、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、前記すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を再蓄積するように、前記蓄積および追加ユニットに指示し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するように構成される、
    請求項10に記載の探索処理装置。
  12. 前記判定および送信モジュールは、
    前記クライアントによって送信された前記現在の探索キャラクタ文字列が取得された場合、前記探索キャラクタ変数セットに従って、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンを生成するように構成されたセンテンスパターン生成ユニットと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出するように構成された量検出ユニットと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する前記探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するように構成されたセンテンスパターン判定および送信ユニットと
    を備える、請求項8から11のいずれか一項に記載の探索処理装置。
  13. 前記センテンスパターン判定および送信ユニットはさらに、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が0であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、生成回数の最大量を有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを前記クライアントへ送信するように構成されるか、または、
    前記センテンスパターン判定および送信ユニットはさらに、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1よりも大きいことが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報を取得し、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するように構成される、
    請求項12に記載の探索処理装置。
  14. 事前設定された第2の時間インターバルに達した場合、前記共通の探索センテンスパターンセットと事前設定された判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得するように構成された第2の取得モジュールであって、前記判定されるべきセンテンスパターンセットは、前記共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される、第2の取得モジュールと、
    前記第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に従って、前記すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除するように構成された検出および削除モジュールと
    をさらに備える、請求項8から13のいずれか一項に記載の探索処理装置。
  15. デバイス制御アプリケーションを記憶するように構成されたメモリと、
    前記デバイス制御アプリケーションを起動して、以下のステップ、すなわち、
    事前設定された第1の時間インターバルに達した場合、前記第1の時間インターバル内に収集された少なくとも1つの過去の探索キャラクタ文字列を取得するステップと、
    クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、事前設定された共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信するステップとを実行するように構成されたプロセッサと
    を備える探索処理装置。
  16. 前記プロセッサは、前記デバイス制御アプリケーションを起動し、さらに、以下のステップ、すなわち、
    事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップを実行するように構成される、
    請求項15に記載の探索処理装置。
  17. 前記探索キャラクタ変数セットは、少なくとも1つのキャラクタ変数を備え、各キャラクタ変数は、前記キャラクタ変数に関連付けられた探索キャラクタを備え、
    事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加する前記ステップは、
    過去の各探索キャラクタ文字列を、少なくとも1つのセグメンテーションキャラクタへ分割するために、前記探索キャラクタ変数セットにおける前記探索キャラクタに従って、前記少なくとも1つの過去の探索キャラクタ文字列を認識するステップと、
    前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有する過去の探索キャラクタ文字列を、第1のカテゴリの過去の探索キャラクタ文字列として判定するステップと、
    前記第1のカテゴリの過去の探索キャラクタ文字列に対応する各キャラクタ変数に従って、前記第1のカテゴリの過去の探索キャラクタ文字列に対応し、前記キャラクタ変数を備え、すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップと
    を備える、請求項16に記載の探索処理装置。
  18. 事前設定された探索キャラクタ変数セットに従って、前記少なくとも1つの過去の探索キャラクタ文字列の各々に対応する少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記生成された探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属さない探索キャラクタ変数センテンスパターンに対応する生成回数の量を蓄積し、生成回数の量が、事前設定された回数の量の第1のしきい値に達する探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加する前記ステップはさらに、
    前記少なくとも1つのセグメンテーションキャラクタの各々が、前記少なくとも1つの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有してはいない過去の探索キャラクタ文字列を、第2のカテゴリの過去の探索キャラクタ文字列であると判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有さないセグメンテーションキャラクタを、第1のセグメンテーションキャラクタとして判定し、前記第2のカテゴリの過去の探索キャラクタ文字列において、対応するキャラクタ変数を有するセグメンテーションキャラクタを、第2のセグメンテーションキャラクタとして判定するステップと、
    前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタと、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、すべてではない変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンの各々に対応する生成回数の量を蓄積し、前記第1のセグメンテーションキャラクタに対応するキャラクタ変数を、前記探索キャラクタ変数セットへ、または、生成回数の量が、事前設定された回数の量の第2のしきい値に達する探索キャラクタ変数センテンスパターンが、前記すべてではない変数タイプからなる、前記少なくとも1つの探索キャラクタ変数センテンスパターンに存在する場合、新たに生成された探索キャラクタ変数セットへ追加するステップと、
    前記第2のカテゴリの過去の探索キャラクタ文字列に対応し、前記第1のセグメンテーションキャラクタに対応する前記キャラクタ変数と、前記第2のセグメンテーションキャラクタに対応する前記キャラクタ変数とを備え、前記すべての変数タイプからなる、少なくとも1つの探索キャラクタ変数センテンスパターンを生成し、前記事前設定された共通の探索センテンスパターンセットに属さず、前記生成された探索キャラクタ変数センテンスパターンにおける前記すべての変数タイプからなる、探索キャラクタ変数センテンスパターンに対応する生成回数の量を再蓄積し、生成回数の量が、前記事前設定された回数の量の第1のしきい値に達し、前記すべての変数タイプからなる探索キャラクタ変数センテンスパターンを、前記共通の探索センテンスパターンセットへ追加するステップと
    を備える、請求項17に記載の探索処理装置。
  19. クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信する前記ステップは、
    前記クライアントによって送信された前記現在の探索キャラクタ文字列が取得された場合、前記探索キャラクタ変数セットに従って、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンを生成するステップと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの量を検出するステップと、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する前記探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するステップと
    を備える、請求項15から18のいずれか一項に記載の探索処理装置。
  20. クライアントによって送信された現在の探索キャラクタ文字列が取得された場合、前記現在の探索キャラクタ文字列に対応する少なくとも1つの探索キャラクタ変数センテンスパターンにおける、共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンを、ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する探索結果データを前記クライアントへ送信する前記ステップはさらに、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が0であることが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、生成回数の最大量を有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを前記クライアントへ送信するステップ、または、
    前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する探索キャラクタ変数センテンスパターンの前記量が1よりも大きいことが検出された場合、前記現在の探索キャラクタ文字列に対応する前記少なくとも1つの探索キャラクタ変数センテンスパターンにおける、前記共通の探索センテンスパターンセットに属する多数の探索キャラクタ変数センテンスパターンの各々に対応する人気ランク情報を取得し、最も高い人気ランクを有する探索キャラクタ変数センテンスパターンを、前記ターゲット探索キャラクタ変数センテンスパターンとして判定し、前記ターゲット探索キャラクタ変数センテンスパターンに対応する前記探索結果データを、前記クライアントへ送信するステップ
    を備える、請求項19に記載の探索処理装置。
  21. 前記プロセッサは、前記デバイス制御アプリケーションを起動し、さらに、以下のステップ、すなわち、
    事前設定された第2の時間インターバルに達した場合、前記共通の探索センテンスパターンセットと事前設定された判定されるべきセンテンスパターンセットとにおけるすべての探索キャラクタ変数センテンスパターンを取得するステップであって、前記判定されるべきセンテンスパターンセットは、前記共通の探索センテンスパターンセットへ追加されない探索キャラクタ変数センテンスパターンを記憶するために使用される、ステップと、
    前記第2の時間インターバル内に収集されたすべての過去の探索キャラクタ文字列に従って、前記すべての探索キャラクタ変数センテンスパターンの各々に対応する新たな生成回数の量に関する統計情報を再収集し、新たな生成回数の量が、事前設定された回数の量の第3のしきい値未満である探索キャラクタ変数センテンスパターンを削除するステップと
    を実行するように構成される、請求項15から20のいずれか一項に記載の探索処理装置。
JP2017567163A 2016-01-12 2017-01-12 探索処理方法およびデバイス Active JP6457123B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610019595.4 2016-01-12
CN201610019595.4A CN106959976B (zh) 2016-01-12 2016-01-12 一种搜索处理方法以及装置
PCT/CN2017/070970 WO2017121355A1 (zh) 2016-01-12 2017-01-12 搜索处理方法以及装置

Publications (2)

Publication Number Publication Date
JP2018525717A true JP2018525717A (ja) 2018-09-06
JP6457123B2 JP6457123B2 (ja) 2019-01-23

Family

ID=59310838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017567163A Active JP6457123B2 (ja) 2016-01-12 2017-01-12 探索処理方法およびデバイス

Country Status (6)

Country Link
US (1) US10713302B2 (ja)
JP (1) JP6457123B2 (ja)
KR (1) KR102106936B1 (ja)
CN (1) CN106959976B (ja)
MY (1) MY174218A (ja)
WO (1) WO2017121355A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526670B2 (en) * 2018-09-28 2022-12-13 The Mitre Corporation Machine learning of colloquial place names
CN110046352A (zh) * 2019-04-19 2019-07-23 无锡伽玛信息科技有限公司 地址标准化方法及装置
US11048984B2 (en) * 2019-05-08 2021-06-29 Capital One Services, Llc Systems and techniques to monitor text data quality
US11429879B2 (en) * 2020-05-12 2022-08-30 Ubs Business Solutions Ag Methods and systems for identifying dynamic thematic relationships as a function of time
US11645283B2 (en) 2021-04-26 2023-05-09 International Business Machined Corporation Predictive query processing
CN113312523B (zh) * 2021-07-30 2021-12-14 北京达佳互联信息技术有限公司 字典生成、搜索关键字推荐方法、装置和服务器
US11947551B2 (en) 2022-05-27 2024-04-02 Maplebear Inc. Automated sampling of query results for training of a query engine

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287394A (ja) * 2007-05-16 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法及び装置並びにそのコンピュータプログラム
US20090265786A1 (en) * 2008-04-17 2009-10-22 Microsoft Corporation Automatic botnet spam signature generation
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
CN104199825A (zh) * 2014-07-23 2014-12-10 清华大学 一种信息查询方法和系统
WO2015114804A1 (ja) * 2014-01-31 2015-08-06 株式会社日立製作所 不正アクセスの検知方法および検知システム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294619A1 (en) * 2007-05-23 2008-11-27 Hamilton Ii Rick Allen System and method for automatic generation of search suggestions based on recent operator behavior
US7756860B2 (en) * 2007-05-23 2010-07-13 International Business Machines Corporation Advanced handling of multiple form fields based on recent behavior
CN102625936B (zh) * 2009-08-04 2016-11-23 谷歌公司 来自文档的查询建议
CN102855252B (zh) * 2011-06-30 2015-09-09 北京百度网讯科技有限公司 一种基于需求的数据检索方法和装置
CN102693310B (zh) * 2012-05-28 2016-08-03 无锡成电科大科技发展有限公司 一种基于关系数据库的资源描述框架查询方法和系统
CN103514189A (zh) * 2012-06-25 2014-01-15 上海博腾信息科技有限公司 一种基于搜索引擎的网络爬虫的实现方法
CN102833594B (zh) * 2012-08-14 2017-11-24 中兴通讯股份有限公司 一种网络协议电视iptv节目搜索方法、装置及系统
US9529856B2 (en) * 2013-06-03 2016-12-27 Google Inc. Query suggestion templates
JP6507541B2 (ja) * 2014-09-22 2019-05-08 カシオ計算機株式会社 情報表示機器、情報表示プログラムおよび情報表示方法
WO2019104338A1 (en) * 2017-11-27 2019-05-31 Snowflake Computing Inc Batch data ingestion in database systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287394A (ja) * 2007-05-16 2008-11-27 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法及び装置並びにそのコンピュータプログラム
US20090265786A1 (en) * 2008-04-17 2009-10-22 Microsoft Corporation Automatic botnet spam signature generation
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
WO2015114804A1 (ja) * 2014-01-31 2015-08-06 株式会社日立製作所 不正アクセスの検知方法および検知システム
CN104199825A (zh) * 2014-07-23 2014-12-10 清华大学 一种信息查询方法和系统

Also Published As

Publication number Publication date
KR102106936B1 (ko) 2020-05-28
US20180232461A1 (en) 2018-08-16
WO2017121355A1 (zh) 2017-07-20
JP6457123B2 (ja) 2019-01-23
KR20180011261A (ko) 2018-01-31
US10713302B2 (en) 2020-07-14
CN106959976A (zh) 2017-07-18
CN106959976B (zh) 2020-08-14
MY174218A (en) 2020-03-17

Similar Documents

Publication Publication Date Title
JP6457123B2 (ja) 探索処理方法およびデバイス
CN108304444B (zh) 信息查询方法及装置
JP6734946B2 (ja) 情報を生成するための方法及び装置
CN109918555B (zh) 用于提供搜索建议的方法、装置、设备和介质
US11604843B2 (en) Method and system for generating phrase blacklist to prevent certain content from appearing in a search result in response to search queries
JP2018518788A (ja) ウェブページトレーニング方法及び装置、検索意図識別方法及び装置
US10346496B2 (en) Information category obtaining method and apparatus
CN103294778A (zh) 一种推送资讯信息的方法及系统
JP6661754B2 (ja) コンテンツ配信方法および装置
JP6932360B2 (ja) オブジェクト検索方法、装置およびサーバ
CN108268438B (zh) 一种页面内容提取方法、装置以及客户端
AU2017216520A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
CN102955821A (zh) 一种对查询序列进行扩展处理的方法与设备
CN105893548A (zh) 命名方法以及终端
US8935252B2 (en) Massive rule-based classification engine
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
CN103164425B (zh) 应用程序平台系统中推送应用程序的方法和装置
CN110245357B (zh) 主实体识别方法和装置
JP2024516836A (ja) クリップテンプレート検索方法及び装置
CN110442696B (zh) 查询处理方法及装置
US10372754B2 (en) Creating an audio file sample based upon user preferences
CN111723201A (zh) 一种用于文本数据聚类的方法和装置
CN107220249B (zh) 基于分类的全文搜索
CN103902687A (zh) 一种搜索结果的生成方法及装置
CN110147488B (zh) 页面内容的处理方法、处理装置、计算设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181219

R150 Certificate of patent or registration of utility model

Ref document number: 6457123

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250