JP2022083997A - 機械学習を利用した応答時間予測によって検索システムを運営する方法および装置 - Google Patents

機械学習を利用した応答時間予測によって検索システムを運営する方法および装置 Download PDF

Info

Publication number
JP2022083997A
JP2022083997A JP2021187675A JP2021187675A JP2022083997A JP 2022083997 A JP2022083997 A JP 2022083997A JP 2021187675 A JP2021187675 A JP 2021187675A JP 2021187675 A JP2021187675 A JP 2021187675A JP 2022083997 A JP2022083997 A JP 2022083997A
Authority
JP
Japan
Prior art keywords
search
response time
machine learning
computer
search system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021187675A
Other languages
English (en)
Other versions
JP7329028B2 (ja
Inventor
歳珍 千
Se Jin Chun
起徳 朴
Kee-Teok Park
永善 ▲ちょう▼
Young Sun Cho
民修 金
Min Soo Kim
ジア ユ
Jia You
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2022083997A publication Critical patent/JP2022083997A/ja
Application granted granted Critical
Publication of JP7329028B2 publication Critical patent/JP7329028B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 機械学習を利用した応答時間予測を利用して検索システムを運営する方法および装置を提供する。【解決手段】 検索システム運営方法は、検索と関連する特徴を基盤とした機械学習予測モデルを利用して、与えられた検索要請に対する応答時間を予測する段階、および前記応答時間の予測結果に基づいて、前記検索要請を処理するための演算リソースを制御する段階を含む。【選択図】図4

Description

以下の説明は、検索システムの効率性と安全性を高めるための運営技術に関するのだ。
インターネットの常用化により、インターネットを利用して多様な主題の情報を簡単かつ迅速に検索することができるようになった。
インターネット利用者のほとんどは、ブラウザを通じてインターネットに接続した後、インターネットポータルサイトで情報を検索する。
利用者がインターネットポータルサイトの検索ウィンドウに検索語を入力すれば、インターネットポータルサイトは、検索語に対応する多様な情報をデータベースから抽出して検索結果として利用者に提供する。
検索技術の一例として、特許文献1(公開日2008年7月2日)には、利用者が入力した検索語を分析して利用者の意図に適した検索結果を提供する、検索システムおよび方法が開示されている。
韓国公開特許第10-2008-0060462号公報
機械学習予測モデルを利用して、より効率的かつ安定的な自動化された検索環境を提供することができる方法および装置を提供する。
機械学習予測モデルを利用して、検索要請に対する応答時間をより精密に予測することができる方法および装置を提供する。
コンピュータが実行する検索システム運営方法であって、前記コンピュータは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記検索システム運営方法は、前記少なくとも1つのプロセッサが、検索と関連する特徴を基盤とした機械学習予測モデルを利用して、与えられた検索要請に対する応答時間を予測する段階、および前記少なくとも1つのプロセッサが、前記応答時間の予測結果に基づいて、前記検索要請を処理するための演算リソースを制御する段階を含む、検索システム運営方法を提供する。
一側面によると、前記制御する段階は、前記応答時間が基準値を超過するスロークエリ(slow query)であると予測される場合、前記検索要請に対するランキング演算の負荷を調節してよい。
他の側面によると、前記制御する段階は、前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算を2つの段階に分けて処理する演算方式を適用する段階を含んでよい。
また他の側面によると、前記制御する段階は、前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算に参加する特徴のうちの一部を取り除くランキング特徴損失(ranking feature dropout)方式を適用する段階を含んでよい。
また他の側面によると、前記制御する段階は、前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算のためのキャッシュ満了時間(cache expire time)を延長する段階を含んでよい。
また他の側面によると、前記制御する段階は、前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請によるトラフィックを遮断する段階を含んでよい。
また他の側面によると、前記予測する段階は、前記機械学習予測モデルを利用して前記検索要請に対する検索結果の有無を予測する段階を含み、前記制御する段階は、前記検索結果有無の予測結果に基づいて、前記検索要請に対するランキング演算の負荷を調節する段階を含んでよい。
また他の側面によると、前記予測する段階は、前記検索要請に対応する検索類型に応じて前記機械学習予測モデルとして構築された複数のモデルのうちのいずれか1つのモデルを選択して前記応答時間を予測してよい。
また他の側面によると、前記予測する段階は、前記検索要請に含まれた検索語が単一索引語で構成される場合、索引語DF(document frequency)を基盤とした機械学習予測モデルを利用して前記応答時間を予測する段階、および前記検索語が多重索引語で構成される場合、索引語単語埋め込み(word embedding)を基盤とした機械学習予測モデルを利用して前記応答時間を予測する段階を含んでよい。
また他の側面によると、前記機械学習予測モデルは、検索ログから抽出されたデータによって応答時間に影響を及ぼす少なくとも1つの検索パラメータを学習データとして利用したモデルで構成されてよい。
また他の側面によると、前記機械学習予測モデルは、検索ログから抽出された索引語の単語埋め込みを学習データとして利用したディープラーニングモデルで構成されてよい。
また他の側面によると、前記機械学習予測モデルは、前記索引語の単語埋め込みとともに、前記検索ログから抽出可能な検索方式(search method)、クエリ分析類型(query analyze type)、ランキング特徴組み合わせ(ranking feature combination)、後処理類型(post processing type)のうちの少なくとも1つのパラメータを前記学習データとして利用してよい。
また他の側面によると、前記機械学習予測モデルは、検索ログから抽出された索引語のDF値を学習データとして利用した回帰モデルで構成されてよい。
また他の側面によると、前記機械学習予測モデルは、線形回帰(linear regression)モデル、重回帰(multiple regression)モデル、または多重ロジスティック回帰(multiple logistic regression)モデルで構成されてよい。
さらに他の側面によると、前記機械学習予測モデルは、前記索引語のDF値とともに、前記検索ログから抽出可能な検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つのパラメータを前記学習データとして利用してよい。
前記検索システム運営方法をコンピュータに実行させるためのコンピュータプログラムを提供する。
コンピュータであって、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、検索と関連する特徴を基盤とした機械学習予測モデルを利用して、与えられた検索要請に対する応答時間を予測する応答予測部、および前記応答時間の予測結果に基づいて、前記検索要請を処理するための演算リソースを制御するリソース制御部を含む、コンピュータを提供する。
本発明の実施形態によると、機械学習予測モデルを利用して検索要請に対する応答時間を精密に予測することにより、検索システムの効率性と安全性を高めることができる。
本発明の実施形態によると、機械学習予測モデルを利用して検索要請に対する応答時間を予測し、スロークエリ(slow query)であると予測される場合には、検索演算の負荷を調節したりシステムの可用性を防御したりすることができる。
本発明の一実施形態における、ネットワーク環境の例を示した図である。 本発明の一実施形態における、コンピュータの例を示したブロック図である。 本発明の一実施形態における、コンピュータのプロセッサが含むことのできる構成要素の例を示した図である。 本発明の一実施形態における、コンピュータが実行することができる方法の例を示したフローチャートである。 本発明の一実施形態における、機械学習予測モデルが含まれた検索システムの全体構造を示した図である。 本発明の一実施形態における、索引語DF基盤の線形回帰モデル構造を示した例示図である。 本発明の一実施形態における、索引語DF基盤の重回帰モデル構造を示した例示図である。 本発明の一実施形態における、索引語DF基盤の重回帰モデル構造を示した例示図である。 本発明の一実施形態における、索引語DF基盤の多重ロジスティック回帰モデル構造を示した例示図である。 本発明の一実施形態における、索引語DF基盤の多重ロジスティック回帰モデル構造を示した例示図である。 本発明の一実施形態における、索引語単語埋め込み基盤のCNNモデル構造を示した例示図である。 本発明の一実施形態における、索引語単語埋め込み基盤のCNNモデル構造を示した例示図である。
以下、本発明の実施形態について、添付の図面を参照しながら詳しく説明する。
本発明の実施形態に係る検索システム運営装置は、少なくとも1つのコンピュータによって実現されてよく、本発明の実施形態に係る検索システム運営方法は、検索システム運営装置に含まれる少なくとも1つのコンピュータによって実行されてよい。このとき、コンピュータにおいては、本発明の一実施形態に係るコンピュータプログラムがインストールされて実行されてよく、コンピュータは、実行されたコンピュータプログラムの制御にしたがって本発明の実施形態に係る検索システム運営方法を実行してよい。上述したコンピュータプログラムは、コンピュータと結合して検索システム運営方法をコンピュータに実行させるために、コンピュータ読み取り可能な記録媒体に記録されてよい。
図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されてはならない。また、図1のネットワーク環境は、本実施形態に適用可能な環境のうちの一例を説明するためのものに過ぎず、本実施形態に適用可能な環境が図1のネットワーク環境に限定されてはならない。
複数の電子機器110、120、130、140は、コンピュータで実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットなどがある。一例として、図1では、電子機器110の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータのうちの1つを意味してよい。
通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
サーバ150、160それぞれは、複数の電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する1つ以上のコンピュータによって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140にサービス(一例として、検索サービス、コンテンツ提供サービス、ソーシャルネットワークサービス、地図サービス、翻訳サービス、金融サービスなど)を提供するシステムであってよい。
図2は、本発明の一実施形態における、コンピュータの例を示したブロック図である。上述した複数の電子機器110、120、130、140それぞれやサーバ150、160それぞれは、図2に示したコンピュータ200によって実現されてよい。
このようなコンピュータ200は、図2に示すように、メモリ210、プロセッサ220、通信インタフェース230、および入力/出力インタフェース240を含んでよい。メモリ210は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ210とは区分される別の永続的記録装置としてコンピュータ200に含まれてもよい。また、メモリ210には、オペレーティングシステムと、少なくとも1つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ210とは別のコンピュータ読み取り可能な記録媒体からメモリ210にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース230を通じてメモリ210にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク170を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータ200のメモリ210にロードされてよい。
プロセッサ220は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ210または通信インタフェース230によって、プロセッサ220に提供されてよい。例えば、プロセッサ220は、メモリ210のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信インタフェース230は、ネットワーク170を介してコンピュータ200が他の電子機器(一例として、上述した記録装置)と互いに通信するための機能を提供してよい。一例として、コンピュータ200のプロセッサ220がメモリ210のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース230の制御にしたがってネットワーク170を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データ、ファイルなどが、ネットワーク170を介してコンピュータ200の通信インタフェース230を通じてコンピュータ200に受信されてよい。通信インタフェース230を通じて受信された信号や命令、データなどは、プロセッサ220やメモリ210に伝達されてよく、ファイルなどは、コンピュータ200がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
入力/出力インタフェース240は、入力/出力装置250とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、またはマウスなどの装置を、出力装置は、ディスプレイ、スピーカなどのような装置を含んでよい。他の例として、入力/出力インタフェース240は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置250は、コンピュータ200と1つの装置で構成されてもよい。
また、他の実施形態において、コンピュータ200は、図2の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、コンピュータ200は、上述した入力/出力装置250のうちの少なくとも一部を含むように実現されてもよいし、トランシーバやデータベースなどのような他の構成要素をさらに含んでもよい。
以下では、機械学習を利用した応答時間予測によって検索システムを運営する方法およびシステムの具体的な実施形態について説明する。
図3は、本発明の一実施形態における、コンピュータのプロセッサが含むことのできる構成要素の例を示したブロック図であり、図4は、本発明の一実施形態における、コンピュータが実行することのできる方法の例を示したフローチャートである。
本実施形態に係るコンピュータ200は、クライアントを対象に、クライアント上にインストールされた専用アプリケーションやコンピュータ200と関連するウェブ/モバイルサイトへの接続によって検索サービスを提供してよい。コンピュータ200には、コンピュータで実現された検索システム運営装置が構成されてよい。
コンピュータ200のプロセッサ220は、図4に係る検索システム運営方法を実行するための構成要素として、図3に示すように、応答予測部310とリソース制御部320を含んでよい。実施形態によって、プロセッサ220の構成要素は、選択的にプロセッサ220に含まれても除外されてもよい。また、実施形態によって、プロセッサ220の構成要素は、プロセッサ220の機能の表現のために分離されても併合されてもよい。
このようなプロセッサ220およびプロセッサ220の構成要素は、図3の検索システム運営方法が含む段階410~420を実行するようにコンピュータ200を制御してよい。例えば、プロセッサ220およびプロセッサ220の構成要素は、メモリ210が含むオペレーティングシステムのコードと、少なくとも1つのプログラムのコードとによる命令(instruction)を実行するように実現されてよい。
ここで、プロセッサ220の構成要素は、コンピュータ200に記録されたプログラムコードが提供する命令にしたがってプロセッサ220によって実行される、互いに異なる機能(different functions)の表現であってよい。例えば、コンピュータ200が検索要請に対する応答時間を予測するように上述した命令にしたがってコンピュータ200を制御するプロセッサ220の機能的表現として、応答予測部310が利用されてよい。
プロセッサ220は、コンピュータ200の制御と関連する命令がロードされたメモリ210から必要な命令を読み取ってよい。この場合、前記読み取られた命令は、プロセッサ220が以下で説明する段階410~420を実行するように制御するための命令を含んでよい。
以下で説明する段階410~420は、図4に示した順序とは異なる順序で実行されてもよいし、段階410~420のうちの一部が省略されたり追加の過程がさらに含まれたりしてもよい。
図4を参照すると、段階410で、応答予測部310は、与えられた検索要請に対して、機械学習予測モデルを利用して応答時間を予測してよい。応答予測部310は、検索システムの応用階層(search application server)から検索階層(search collection server)に検索を実行するとき、応用階層で検索階層の応答時間を予測してよい。
利用者がフロントエンド(front-end)で検索語を入力する場合、バックエンド(back-end)では数万台の検索サーバが複雑な演算過程を経ながら検索語に対応する検索結果を提供するようになる。しかし、検索要請に含まれる検索語によって、索引語(term)DF(document frequency)、検索方式(search method)、クエリ分析類型(query analyze type)、ランキング特徴組み合わせ(ranking feature combination)、後処理類型(post processing type)などが異なるため、検索要請を処理する時間、すなわち、応答時間も異なる。検索サーバで検索される文書の量が多いほど、検索スペック(ロジック)が複雑なほど、文書ランキング演算が多いほど、より多くのシステムリソースを消耗するため応答時間が長くなる。
このような応答時間が基準値を超過するスロークエリの場合、利用者が感じるサービス品質(QoS)は格段に低下し、スロークエリが瞬間的に大量に流入する場合には検索システムの停止状態(outage)を誘発することもあるため、スロークエリに対する防御措置が必要である。
このために、応答予測部310は、機械学習予測モデルを利用して検索要請の応答時間を予測してよい。コンピュータ200は、応答時間と関連性をもつ少なくとも1つの特徴を学習データとして利用して応答時間を予測する機械学習予測モデルを含んでよく、応答予測部310は、コンピュータ200上の機械学習予測モデルを利用して、与えられた検索要請の応答時間を予測してよい。一例として、応答予測部310は、索引語DFを学習データとして構築された線形回帰(linear regression)モデルを利用して応答時間を予測してよい。他の例として、応答予測部310は、索引語DFとともに、検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つの他の特徴を学習データとして構築された重回帰(multiple regression)モデルを利用して応答時間を予測してよい。また他の例として、応答予測部310は、索引語DFとともに、検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つの他の特徴を学習データとして構築された多重ロジスティック回帰(multiple logistic regression)モデルを利用して応答時間を予測してよい。また他の例として、応答予測部310は、索引語DFではない、索引語自体の単語埋め込み(word embedding)を学習データとするディープラーニングモデルとして、索引語単語埋め込みとともに、検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つの他の特徴を学習データとして構築されたCNN(convolutional neural network)モデルを利用して応答時間を予測してよい。
コンピュータ200は、応答時間予測モデルとして構築された複数の機械学習予測モデルを含んでよく、応答予測部310は、機械学習予測モデルのうち、検索要請に対応する検索類型に応じて適切なモデルを選択的に利用して応答時間を予測してよい。一例として、応答予測部310は、検索語が単一索引語で構成される場合には、索引語DF基盤の機械学習予測モデルを利用して応答時間を予測してよく、検索語が多重索引語で構成される場合には、索引語単語埋め込み基盤の機械学習予測モデルを利用して応答時間を予測してよい。
さらに、応答予測部310は、検索要請に対する応答時間の予測はもちろん、検索結果の有無を予測してよい。応答時間を予測する機械学習予測モデルと同様に、検索結果の有無と関連性をもつ少なくとも1つの特徴を学習データとして利用して検索結果の有無を予測する機械学習予測モデルを構築してよく、応答予測部310は、コンピュータ200上に構築された機械学習予測モデルを利用して、与えられた検索要請に対する検索結果の有無を予測してよい。
段階420で、リソース制御部320は、応答時間予測結果に基づいて、検索要請を処理するための演算リソースを制御してよい。
リソース制御部320は、検索システムの効率性を高めるために、スロークエリであると予測される場合、検索品質を害さない範囲内で検索階層のランキング演算の負荷を調節した、軽量化された検索を実行してよい。一例として、リソース制御部320は、応答時間予測結果によってスロークエリであると予測される場合、ランキング演算を一度に処理する方式ではなく、2つの段階に分けて処理する2段階ランキング(2-phase ranking)演算方式を適用してよい。2段階ランキング演算方式とは、検索ランキングの演算費用、すなわち、文書のスコア値を計算するコンピューティング費用が低いアルゴリズムを利用して1次整列を実行して検索結果に該当する文書の候補群を選別した後、選別された候補群に対して、正常なクエリに対する検索方式として合意されたアルゴリズムを利用して2次整列(最終検索結果)を実行する方法である。他の例として、リソース制御部320は、応答時間予測結果によってスロークエリであると予測される場合、検索ランキング演算に参加する特徴のうちの一部を取り除くランキング特徴損失(ranking feature dropout)方式を適用してよい。ランキング特徴損失方式とは、文書のスコア値を計算するランキング演算を実行する過程において、ランキング演算に参加する特徴のうちで重要度が低いか多くのコンピューティングリソースを占める一部の特徴を取り除く方法である。また他の例として、リソース制御部320は、応答時間予測結果によってスロークエリであると予測される場合、ランキング演算のためのキャッシュ満了時間(cache expire time)を延長してよい。検索サーバではキャッシュ満了時間を動的に設定してよく、リソース制御部320は、スロークエリであると予測されれば、検索サーバに設定されたキャッシュ満了時間を動的に調節してよい。
リソース制御部320は、検索システムの安全性を高めるための方法として、検索階層の可用性を防御してよい。一例として、リソース制御部320は、トラフィックの急増のような有事の状況において、検索システムに基準値以上の負荷を与えるスロークエリを選択的に遮断する(blocking)ことにより、検索システムの可用性を保障してよい。言い換えれば、リソース制御部320は、有事の際に、検索システムの応用階層から検索階層に伝達されるスロークエリトラフィックを遮断してよい。
リソース制御部320は、検索要請に対する予測結果として検索結果の有無を確認してよく、検索結果の有無に基づいて、正常なクエリの検索方式として合意されたアルゴリズムの代わりに、2段階ランキング演算方式またはランキング特徴損失方式を利用した、軽量化された検索を実行してよい。
したがって、本実施形態では、機械学習予測モデルを利用して検索要請の応答時間を予測し、スロークエリであると予測される場合には検索費用を調節してタイムアウトの可能性を最小化することができ、有事の際にはスロークエリトラフィックを選択的に遮断して検索システムを防御することができる。
以下では、応答時間と検索結果の有無を予測するモデルについて具体的に説明する。
図5は、本発明の一実施形態における、機械学習予測モデルが含まれた検索システムの全体構造を示した図である。
図5を参照すると、検索システム500の応用階層であるSAS(search application server)520では、標準化された入力/出力インタフェースが適用されてよい。呼び出しサーバ510は、検索要請を処理するためにSAS520を呼び出すようになるが、このとき、検索語、検索方式、後処理類型、整列などのようにSAS520を呼び出すときに必ず存在しなればならない必須パラメータと選択的に存在するパラメータまで数十種類のSAS要請パラメータが存在する。
検索システム500は、機械学習予測モデルを構築するためのディープラーニング分散プラットフォーム530を含んでよい。ディープラーニング分散プラットフォーム530は、SAS520のログを活用して、応答時間を予測する機械学習予測モデルを構築してよい。
ディープラーニング分散プラットフォーム530は、SAS520のログでSAS520を呼び出したURLと、該当のURLを処理するのにかかった応答時間を抽出してよく、応答時間と関連性のある検索特徴として少なくとも1つのSAS要請パラメータを取得してよい。
ディープラーニング分散プラットフォーム530は、SAS520のログデータを学習データフォーマットに変更してよい。モデル構築のための学習データは、各検索特徴の性質と設計するモデルに適した形態に加工する。データの性質は、数値型データと範疇型データとに大別されてよく、例えば、索引語DFは数値型データに該当し、検索方式と後処理類型パラメータは範疇型データに該当してよい。数値型データの場合は、スケーリング(scaling)変換による正規化によってデータを加工してよく、範疇型データの場合は、バイナリ(binary)フォーマットやワンホットエンコード(one-hot encoding)フォーマットに変換する作業によってデータを加工してよい。ディープラーニング分散プラットフォーム530は、加工されたデータの散布図、分布、統計などを分析してノイズデータを取り除くことにより、学習データとして活用するデータを選別してよい。
ディープラーニング分散プラットフォーム530は、SAS520のログから取得した学習データを利用して機械学習予測モデルを学習してよく、学習されたモデルは、サービングプラットフォーム540を利用して応答時間や検索結果の有無を予測するためのモデルとして検索システム500上に登録することにより、リアルタイムAPIに基づく動的インファレンスが可能な環境を生成することができる。
機械学習予測モデルが構築された後、SAS520が与えられた検索要請に対して検索エンジン550を呼び出せば、検索エンジン550は、検索要請に該当する入力文字列を機械学習予測モデルの入力データフォーマットに変換してサービングプラットフォーム540に伝達してよい。サービングプラットフォーム540は、検索エンジン550から伝達された入力データに対して機械学習予測モデルを利用して該当の検索要請の応答時間を予測した後、予測結果を検索エンジン550を経てSAS520に返還してよい。
SAS520は、応答時間予測結果によってスロークエリであると予測される場合、検索環境を最適化することのできるロジックの軽量化された検索を実行してよい。
スロークエリであると予測されて軽量化された検索を実行した検索要請のログをモデルに反映するようになれば、以後からは、同じ検索要請がスロークエリであると予測されないフィードバックループ問題が発生することがある。
SAS520で検索要請と関連するログを記録するにあたり、スロークエリであると予測された検索要請のログに対しては、正常な検索要請とは区分される個別のフラギング(flagging)を処理することにより、フィードバックループ問題を解決することができる。
図6は、索引語DFを基盤として応答時間を予測する線形回帰モデル600を示している。
索引語DFは、索引で該当の索引語が登場する文書の数、言い換えれば、ポスティングリストの長さを意味する。TF-IDF(Term Frequency-Inverse Document Frequency)基盤の情報検索モデルにおいて、索引語DFは、検索語に多数の索引語があるときに特定の索引語の重要度を選り分ける尺度となる。簡単に言うと、DFが高ければ、該当の索引語が複数の文書に分布するため主題を特定するのに好ましくない反面、DFが低ければ、具体的な意味を有するため、主題を特定するのに好ましい索引語に該当する。索引語DFは、検索要請を処理する過程で生成されるのではなく、文書コレクションで検索ボリュームを生成する時点に生成される値であるため、検索時点に相対的に低い費用で求めることのできる値である。
例えば、図6を参照すると、応答時間を予測する機械学習予測モデルの一例として、線形回帰モデル600は、索引語DF611を示す数値型データを入力特徴とし、応答時間620を出力特徴のラベルとする学習モデル構造を有する。
線形回帰モデル600は、1つの入力層(input layer)、1つの隠れ層(hidden layer)、および1つの出力層(output layer)からなるモデル構造で実現されてよい。
図7は、索引語DFを基盤として応答時間を予測する重回帰モデル700を示している。
応答時間予測の正確度を高めるためには、索引語DFとともに、検索ログから取得可能なハッシュ(hash)やインデックス(index)、例えば、検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つの特徴を追加してよい。
応答時間を予測する機械学習予測モデルの一例として、少なくとも1つの隠れ層で構成された重回帰モデル700を適用してよい。例えば、図7を参照すると、重回帰モデル700は、索引語DF711、検索方式712、クエリ分析類型713、ランキング特徴組み合わせ714、後処理類型715を入力特徴とし、応答時間720を出力特徴のラベルとする学習モデル構造を有する。
検索方式712、クエリ分析類型713、ランキング特徴組み合わせ714、後処理類型715は、各パラメータの類型がn個である場合、サイズがnであるスパーベクトル(sparse vector)で構成されてよい。検索方式712や後処理類型715のような範疇型データはバイナリまたはワンホットエンコードにベクトル化し、索引語DF711は正規化によって1つの数値ベクトルで表現してよい。
図8に示すように、重回帰モデル700は、複数の入力層、1つの隠れ層、および1つの出力層からなるモデル構造であって、応答時間に影響を及ぼす複数のパラメータを入力特徴とし、入力特徴の間の因果関係に対する確率を出力特徴で表現するモデルで実現されてよい。
図9は、索引語DFを基盤として応答時間を予測する多重ロジスティック回帰モデル900を示している。
多クラス分類の問題に使用されるロジスティック回帰を適用して、応答時間を予測するための機械学習予測モデル、すなわち、多重ロジスティック回帰モデル900を構築してよい。
図9を参照すると、多重ロジスティック回帰モデル900は、図7の重回帰モデル700と同じであるが、入力特徴として使用される索引語DF911と出力特徴として使用される応答時間920もワンホットエンコードによってベクトル化してよい。出力ラベルとなる応答時間920は、0.1秒区間に分けた合計101のサイズを有するベクトルで表現されてよい。
図10に示すように、多重ロジスティック回帰モデル900は、複数の入力層、複数の隠れ層、および複数の出力層からなるモデル構造であって、応答時間に影響を与える複数のパラメータを入力特徴とし、入力特徴の間の因果関係に対する101種類の確率を出力特徴で表現するモデルで実現されてよい。
索引語DF基盤の予測モデル600、700、900の場合、多重索引語からなる検索要請あるいは制限検索要請(フィルタリング)では、応答時間予測の正確度が低下することがある。
多重索引語からなる検索要請あるいは制限検索要請(フィルタリング)に対する応答時間予測の正確度を高めるためには、索引語DFではなく、索引語自体を単語埋め込みしてモデルに適用してよい。
図11は、索引語単語埋め込みを基盤として応答時間を予測するCNNモデル1100を示している。
回帰方式とは異なり、SAS520のログを文章情報形態で表現し、CNNモデル1100を利用して応答時間を分類する多クラス分類(multi classification)方式を適用してよい。
単語埋め込みを基盤とするCNNモデル1100は、各層の入力/出力データの形状を維持することができ、単語の空間情報を維持しながら隣接単語との特徴を効果的に認識することができる。また、CNNモデル1100は、複数のフィルタによって文章の特徴を抽出および学習することができ、抽出された文章の特徴を強化させることができ、データのサイズを減らすプーリング層(pooling layer)を適用することができる。
例えば、図11を参照すると、CNNモデル1100は、索引語単語埋め込み1111、検索方式1112、クエリ分析類型1113、ランキング特徴組み合わせ1114、後処理類型1115を入力特徴とし、応答時間1120を出力特徴のラベルとする学習モデル構造を有する。
検索方式1112、クエリ分析類型1113、ランキング特徴組み合わせ1114、後処理類型1115は、各パラメータの類型がn個である場合、サイズがnであるスパーベクトル(sparse vector)で構成されてよい。索引語単語埋め込み1111は、索引語自体をベクトルで表現してID化したものであり、出力ラベルとなる応答時間1120は、0.1秒区間に分けた合計101のサイズのベクトルで表現されてよい。
CNNモデル1100は、検索ログから取得可能なデータをベクトル化し、ベクトル化されたデータに対する応答時間を予測する指導学習モデルで実現されてよい。
図12に示すように、CNNモデル1100は、畳み込み、マックスプーリング(maxpooling)、平坦化(flatten)、FC(fully-connected)を含むモデル構造であって、応答時間に影響を与える複数のパラメータを入力特徴とし、入力特徴の間の因果関係に対する101種類の確率を出力特徴として表現するモデルで実現されてよい。
索引語単語埋め込み基盤のCNNモデル1100の場合、検索要請に対する応答時間を予測することができる。言い換えれば、畳み込みとマックスプーリングを繰り返し実行して文章の特性を抽出し、抽出された特性に対してFC層を経て応答時間確率を示す101種類のクラスを求めることができる。
検索結果の有無を予測する機械学習予測モデルを索引語単語埋め込み基盤のCNNモデル1100で構築してよく、プロセッサ220は、該当のCNNモデル(1100)を利用して、与えられた検索要請に対する検索結果の有無を予測することも可能である。検索結果の有無を予測するCNNモデル1100の場合、検索結果の有無を示す2種類のクラスを求めることができる。
このように、本発明の実施形態によると、機械学習予測モデルを利用して検索要請に対する応答時間を予測することによってより正確な予測を提供することができ、特に、応答時間予測結果によってスロークエリであると予測される場合、検索演算の負荷を調節したりシステムの可用性を防御したりすることにより、検索システムの効率性と安全性を高めることができる。さらに、本発明の実施形態によると、索引語DFとともに追加の検索パラメータを学習データとして利用したり、索引語DFではなく索引語自体の単語埋め込みを学習データとして利用したりする予測モデルを適用することにより、検索要請の応答時間をより精密に予測することができる。
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。ここで、媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD-ROMおよびDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられてよい。
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
220:プロセッサ
310:応答予測部
320:リソース制御部

Claims (20)

  1. コンピュータが実行する検索システム運営方法であって、
    前記コンピュータは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
    前記検索システム運営方法は
    前記少なくとも1つのプロセッサが、検索と関連する特徴を基盤とした機械学習予測モデルを利用して、与えられた検索要請に対する応答時間を予測する段階、および
    前記少なくとも1つのプロセッサが、前記応答時間の予測結果に基づいて、前記検索要請を処理するための演算リソースを制御する段階
    を含む、検索システム運営方法。
  2. 前記制御する段階は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算の負荷を調節すること
    を特徴とする、請求項1に記載の検索システム運営方法。
  3. 前記制御する段階は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算を2つの段階に分けて処理する演算方式を適用する段階
    を含む、請求項1に記載の検索システム運営方法。
  4. 前記制御する段階は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算に参加する特徴のうちの一部を取り除くランキング特徴損失方式を適用する段階
    を含む、請求項1に記載の検索システム運営方法。
  5. 前記制御する段階は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算のためのキャッシュ満了時間を延長する段階
    を含む、請求項1に記載の検索システム運営方法。
  6. 前記制御する段階は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請によるトラフィックを遮断する段階
    を含む、請求項1に記載の検索システム運営方法。
  7. 前記予測する段階は、
    前記機械学習予測モデルを利用して前記検索要請に対する検索結果の有無を予測する段階
    を含み、
    前記制御する段階は、
    前記検索結果の有無の予測結果に基づいて、前記検索要請に対するランキング演算の負荷を調節する段階
    を含む、請求項1~6のうちのいずれか一項に記載の検索システム運営方法。
  8. 前記予測する段階は、
    前記検索要請に対応する検索類型に応じて前記機械学習予測モデルとして構築された複数のモデルのうちのいずれか1つのモデルを選択して前記応答時間を予測すること
    を特徴とする、請求項1~6のうちのいずれか一項に記載の検索システム運営方法。
  9. 前記予測する段階は、
    前記検索要請に含まれた検索語が単一索引語で構成される場合、索引語DF基盤の機械学習予測モデルを利用して前記応答時間を予測する段階、および
    前記検索語が多重索引語で構成される場合、索引語単語埋め込み基盤の機械学習予測モデルを利用して前記応答時間を予測する段階
    を含む、請求項1~6のうちのいずれか一項に記載の検索システム運営方法。
  10. 前記機械学習予測モデルは、検索ログから抽出されたデータによって応答時間に影響を及ぼす少なくとも1つの検索パラメータを学習データとして利用したモデルで構成されること
    を特徴とする、請求項1~9のうちのいずれか一項に記載の検索システム運営方法。
  11. 前記機械学習予測モデルは、検索ログから抽出された索引語の単語埋め込みを学習データとして利用したディープラーニングモデルで構成されること
    を特徴とする、請求項1~9のうちのいずれか一項に記載の検索システム運営方法。
  12. 前記機械学習予測モデルは、前記索引語の単語埋め込みとともに、前記検索ログから抽出可能な検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つのパラメータを前記学習データとして利用すること
    を特徴とする、請求項11に記載の検索システム運営方法。
  13. 前記機械学習予測モデルは、検索ログから抽出された索引語のDF値を学習データとして利用した回帰モデルで構成されること
    を特徴とする、請求項11に記載の検索システム運営方法。
  14. 前記機械学習予測モデルは、線形回帰モデル、または重回帰モデル、または多重ロジスティック回帰モデルで構成されること
    を特徴とする、請求項13に記載の検索システム運営方法。
  15. 前記機械学習予測モデルは、前記索引語のDF値とともに、前記検索ログから抽出可能な検索方式、クエリ分析類型、ランキング特徴組み合わせ、後処理類型のうちの少なくとも1つのパラメータを前記学習データとして利用すること
    を特徴とする、請求項13に記載の検索システム運営方法。
  16. 請求項1~15のうちのいずれか一項に記載の検索システム運営方法をコンピュータに実行させるためのコンピュータプログラム。
  17. コンピュータであって、
    メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
    を含み、
    前記少なくとも1つのプロセッサは、
    検索と関連する特徴を基盤とした機械学習予測モデルを利用して、与えられた検索要請に対する応答時間を予測する応答予測部、および
    前記応答時間の予測結果に基づいて、前記検索要請を処理するための演算リソースを制御するリソース制御部
    を含む、コンピュータ。
  18. 前記リソース制御部は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算を2つの段階に分けて処理する演算方式を適用すること
    を特徴とする、請求項17に記載のコンピュータ。
  19. 前記リソース制御部は、
    前記応答時間が基準値を超過するスロークエリであると予測される場合、前記検索要請に対するランキング演算に参加する特徴のうちの一部を取り除く方式を適用すること
    を特徴とする、請求項17に記載のコンピュータ。
  20. 前記応答予測部は、
    前記検索要請に含まれた検索語が単一索引語で構成される場合、索引語DF基盤の機械学習予測モデルを利用して前記応答時間を予測し、
    前記検索語が多重索引語で構成される場合、索引語単語埋め込み基盤の機械学習予測モデルを利用して前記応答時間を予測すること
    を特徴とする、請求項17~19のうちのいずれか一項に記載のコンピュータ。
JP2021187675A 2020-11-25 2021-11-18 機械学習を利用した応答時間予測によって検索システムを運営する方法および装置 Active JP7329028B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0159511 2020-11-25
KR1020200159511A KR102525918B1 (ko) 2020-11-25 2020-11-25 기계 학습을 이용한 응답 시간 예측을 통해 검색 시스템을 운영하는 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2022083997A true JP2022083997A (ja) 2022-06-06
JP7329028B2 JP7329028B2 (ja) 2023-08-17

Family

ID=81855576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021187675A Active JP7329028B2 (ja) 2020-11-25 2021-11-18 機械学習を利用した応答時間予測によって検索システムを運営する方法および装置

Country Status (2)

Country Link
JP (1) JP7329028B2 (ja)
KR (1) KR102525918B1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150013440A (ko) * 2012-04-26 2015-02-05 아마데우스 에스.에이.에스. 배취-지향 연산을 사용하는 데이터베이스 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150013440A (ko) * 2012-04-26 2015-02-05 아마데우스 에스.에이.에스. 배취-지향 연산을 사용하는 데이터베이스 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MARIO MILICEVIC他2名, APPLICATION OF MACHINE LEARNING ALGORITHMS FOR THE QUERY PERFORMANCE PREDICTION[ONLINE], JPN6023000502, August 2015 (2015-08-01), ISSN: 0004965975 *

Also Published As

Publication number Publication date
JP7329028B2 (ja) 2023-08-17
KR102525918B1 (ko) 2023-04-26
KR20220072179A (ko) 2022-06-02

Similar Documents

Publication Publication Date Title
US11080340B2 (en) Systems and methods for classifying electronic information using advanced active learning techniques
US20200304550A1 (en) Generic Event Stream Processing for Machine Learning
JP2019169148A (ja) 自動的な意図のマイニング、分類、及び配置のための方法及びシステム
US10824694B1 (en) Distributable feature analysis in model training system
US20220114186A1 (en) System and method for automatic persona generation using small text components
US9852390B2 (en) Methods and systems for intelligent evolutionary optimization of workflows using big data infrastructure
US11538481B2 (en) Speech segmentation based on combination of pause detection and speaker diarization
US20200349226A1 (en) Dictionary Expansion Using Neural Language Models
CN116057518A (zh) 使用机器学习模型的自动查询谓词选择性预测
Cao et al. Deqa: On-device question answering
US20160217126A1 (en) Text classification using bi-directional similarity
US11567851B2 (en) Mathematical models of graphical user interfaces
US20150269241A1 (en) Time series clustering
Trucolo et al. Improving trend analysis using social network features
JP2022083997A (ja) 機械学習を利用した応答時間予測によって検索システムを運営する方法および装置
US11782918B2 (en) Selecting access flow path in complex queries
Ma et al. API prober–a tool for analyzing web API features and clustering web APIs
KR102215259B1 (ko) 주제별 단어 또는 문서의 관계성 분석 방법 및 이를 구현하는 장치
CN114510575A (zh) 关系发现和量化
Fernandes et al. Lightweight context-based web-service composition model for mobile devices
US11836176B2 (en) System and method for automatic profile segmentation using small text variations
US11244007B2 (en) Automatic adaption of a search configuration
US11810572B2 (en) Multi-threaded speaker identification
US11907775B2 (en) Intelligent API content governance framework
Akerkar et al. Analytics and big data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230804

R150 Certificate of patent or registration of utility model

Ref document number: 7329028

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150