JP7428250B2

JP7428250B2 - 文書検索の性能を評価する方法、システム、および装置

Info

Publication number: JP7428250B2
Application number: JP2022530027A
Authority: JP
Inventors: 健太郎森本
Original assignee: Shimadzu Corp
Current assignee: Shimadzu Corp
Priority date: 2020-06-11
Filing date: 2021-03-04
Publication date: 2024-02-06
Anticipated expiration: 2041-03-04
Also published as: CN115698980A; WO2021250950A1; US20230244705A1; US12099535B2; JPWO2021250950A1

Description

本発明は、文書検索の性能を評価する方法、システム、および装置に関する。

従来、データベースから所望の情報を検索する構成が知られている。たとえば、特開２００３－９９４３９号公報（特許文献１）には、各種分析処理方法をデータベースとして保持し、データベースから所望の分析処理方法を検索して表示する分析処理方法検索装置が開示されている。当該分析処理方法検索装置によれば、直感的に把握しやすいキーワードが分析処理方法を特徴づける属性データとして設定されているため、当該属性データを検索キーとすることにより、目的の処理にあった分析処理方法を容易に検索することができる。

特開２００３－９９４３９号公報

検索対象の情報を含むデータベースには新たな情報が追加されることがあるため、検索クエリが同じでも、検索のタイミングによって当該検索クエリを用いた検索結果は変化し得る。データベースに追加される情報によっては、データベースに含まれる情報の傾向が急激に変化し、検索クエリとの関連性が相対的に低い文書データが上位に順位付けされ得る。しかし、特許文献１に開示された分析処理方法検索装置においては、データベースに含まれる情報の傾向の変化に伴う文書検索の性能の低下について考慮されていない。

本発明は、このような課題を解決するためになされたものであって、その目的は、文書検索の性能の低下を自動的に検出することである。

本発明の一局面に係る方法は、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、当該言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該方法は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新するステップと、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出するステップと、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出するステップと、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合、文書検索の性能の低下を検出するステップとを含む。

本発明の他の局面に係るシステムは、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該システムは、端末装置と、サーバ装置とを備える。端末装置には、検索クエリが入力される。サーバ装置は、端末装置から検索クエリを受信して文書検索を行う。サーバ装置は、学習部と、性能評価部とを含む。学習部は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新する。性能評価部は、文書検索の性能を評価する。性能評価部は、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出する。性能評価部は、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出する。性能評価部は、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ更新による第２統計値の変動値が第２閾値よりも大きい場合、文書検索の性能の低下を検出する。

本発明の他の局面に係る装置は、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該装置は、入出力部と、検索部と、学習部と、性能評価部とを備える。入出力部には、検索クエリが入力される。検索部は、検索クエリを受けて文書検索を行う。学習部は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新する。性能評価部は、文書検索の性能を評価する。性能評価部は、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出する。性能評価部は、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出する。性能評価部は、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ更新による第２統計値の変動値が第２閾値よりも大きい場合、性能の低下を検出する。

本発明に係る方法、システム、および装置によれば、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合に文書検索の性能の低下が検出されることにより、文書検索の性能の低下を自動的に検出することができる。

実施の形態に係る文書検索システムの一例である分析事例検索システムの構成を示すブロック図である。図１の計算機および入出力部のハードウェア構成を示すブロック図である。図１のサーバ装置およびデータベースの機能構成を示すブロック図である。分析事例データベースに含まれる分析事例データの一例である分析事例データを示す図である。検索クエリが「プリン体」である場合に、図１のディスプレイに表示される検索結果ウィンドウの一例を示す図である。検索クエリが「核酸」である場合に、図１のディスプレイに表示される検索結果ウィンドウの一例を示す図である。図１の分析事例検索システムにおいて行われる検索処理の概略的な流れを示す図である。テストクエリデータベースにおいて形成されている、第１ラベル、第２ラベル、および特定分析事例データの識別子が関連付けられた構造を示す図である。複数の第１ラベルの各々を検索クエリとした場合の、複数の特定分析事例データの順位の頻度の分布曲線を示す図である。複数の第２ラベルの各々を検索クエリとした場合の、複数の特定分析事例データの順位の頻度の分布曲線を示す図である。図３のサーバ装置において行われる性能評価処理の概略的な流れを示す図である。図３のサーバ装置のハードウェア構成を示すブロック図である。実施の形態の変形例に係る情報処理装置の構成を示すブロック図である。図１３の情報処理装置のハードウェア構成を示すブロック図である。

以下に、実施の形態について図面を参照して詳細に説明する。なお、以下では図中の同一または相当部分には同一符号を付してその説明は原則的に繰返さない。

図１は、実施の形態に係る文書検索システムの一例である分析事例検索システム１０００の構成を示すブロック図である。図１に示されるように、分析事例検索システム１０００は、端末装置１００と、サーバ装置２００と、データベース３００とを備える。端末装置１００およびサーバ装置２００は、ネットワークＮＷを介して接続されている。データベース３００は、複数の分析事例データ（文書データ）を含む。ネットワークＮＷは、たとえばインターネット、ＷＡＮ（Wan Area Network）、またはＬＡＮ（Lan Area Network）を含む。

端末装置１００は、計算機１２０と、入出力部１３０とを含む。入出力部１３０は、ディスプレイ１３１と、キーボード１３２と、マウス１３３とを含む。ディスプレイ１３１と、キーボード１３２と、マウス１３３とは、計算機１２０に接続されている。

ディスプレイ１３１には、検索ウィンドウＷｎ１およびカーソルＣｒが表示されている。ユーザは、マウス１３３を操作することによりカーソルＣｒを操作する。ユーザは、キーボード１３２を操作することにより検索クエリＱＲＹを検索ウィンドウＷｎ１に入力する。図１には、プリン体の分析に適した分析装置、分析方法、および分析条件等が記載された分析事例データ（文書データ）を検索するため、検索クエリＱＲＹとして「プリン体」という文字列をユーザが検索ウィンドウＷｎ１に入力した場合が示されている。

分析事例検索システム１０００においては、ユーザによって入力された検索クエリが、端末装置１００から、ネットワークＮＷを介してサーバ装置２００へ送信される。サーバ装置２００は、データベース３００から検索クエリＱＲＹに関連する複数の関連分析事例データ（関連文書データ）を検索する。サーバ装置２００は、検索クエリＱＲＹとの関連度に応じて、複数の関連分析事例データの各々を順位付けて、検索結果を端末装置１００に送信する。端末装置１００は、サーバ装置２００からの検索結果に基づいて、複数の関連分析事例データを順位順に表示する。

図２は、図１の計算機１２０および入出力部１３０のハードウェア構成を示すブロック図である。図２に示されるように、計算機１２０は、プロセッサ１２１と、記憶部としてのメモリ１２２およびハードディスク１２３と、通信インターフェース１２４とを含む。これらは、バス１２５を介して相互に通信可能に接続されている。

ハードディスク１２３は、不揮発性の記憶装置である。ハードディスク１２３には、たとえばオペレーティングシステム（ＯＳ：Operating System）のプログラム４１、および分析事例検索アプリケーションのクライアントプログラム４２が保存されている。図２に示されるデータ以外にも、ハードディスク１２３には、たとえば各種アプリケーションの設定および出力が保存される。メモリ１２２は、揮発性の記憶装置であり、たとえばＤＲＡＭ（Dynamic Random Access Memory）を含む。

プロセッサ１２１は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ１２１は、ＧＰＵ（Graphics Processing Unit）をさらに含んでもよい。プロセッサ１２１は、ハードディスク１２３に保存されているプログラムをメモリ１２２に読み込んで実行する。プロセッサ１２１は、通信インターフェース１２４を介してネットワークＮＷに接続する。

入出力部１３０は、ディスプレイ１３１と、マウス１３３と、キーボード１３２とを含む。ディスプレイ１３１、マウス１３３、およびキーボード１３２の各々は、計算機１２０に接続されている。ディスプレイ１３１には、分析事例検索アプリケーションのＧＵＩ（Graphical User Interface）が表示される。ユーザは、ディスプレイ１３１の表示を参照しながら、キーボード１３２の操作、またはマウス１３３の操作によって、分析事例検索アプリケーションへ所望の入力を行う。

図３は、図１のサーバ装置２００およびデータベース３００の機能構成を示すブロック図である。図３に示されるように、サーバ装置２００は、通信部２１０と、ベクトル生成部２２０と、検索部２３０と、表示制御部２５０と、学習部２６０と、性能評価部２７０と、分析事例生成部２８０とを含む。データベース３００は、分析事例データベース３１０と、テストクエリデータベース３２０とを含む。

分析事例データベース３１０には、検索対象である複数の分析事例データ（分析レポート、技術論文、または特許文献など）が記憶されている。分析事例データベース３１０に記憶されている複数の分析事例データは、一般に公開可能な分析事例データと、特定のユーザのみに公開が許可される分析事例データとに分類されてもよい。分析事例生成部２８０は、新たな分析事例データを生成し、当該分析事例データを分析事例データベース３１０に追加する。分析事例生成部２８０は、複数の新たな分析事例データを一度に分析事例データベース３１０に追加してもよい。分析事例生成部２８０は、新たな分析事例データを分析事例データベース３１０に追加したことを学習部２６０に通知する。分析事例生成部２８０は、サーバ装置２００とは別個の装置として形成されてもよい。データベース２００内の情報の設定および更新は、所定の期間ごとに自動的に実行されてもよい。

図４は、分析事例データベース３１０に含まれる分析事例データの一例である分析事例データＤ１を示す図である。図４に示されるように、分析事例データＤ１は、高速液体クロマトグラフ（ＨＰＬＣ：High Performance Liquid Chromatograph）による食品中総プリン体量の測定という分析事例に関する情報を含む。当該分析事例において、分析の対象となる具体的な化合物は、アデニン、およびグアニン等のプリン体である。分析事例データＤ１は、「プリン体」を検索クエリＱＲＹとする分析事例の検索において、検索結果の上位に順位付けられることがユーザに望まれる分析事例データである。また、プリン体は核酸に分類される分子でもあるため、分析事例データＤ１は、「プリン体」の上位概念である「核酸」、または「核酸」に関連する化合物を検索クエリＱＲＹとする検索においても、検索結果の上位に順位付けられることがユーザに望まれる分析事例データである。

再び図３を参照して、学習部２６０は、分析事例データベース３１０を用いる機械学習により、当該分析事例データに対応する特定自然言語の分散表現（ベクトル）を言語モデル６１に学習させ、言語モデル６１を学習済みモデルとする。分析事例データベース３１０は、当該機械学習においてコーパスとしての役割を果たす。分析事例データベース３１０を用いる機械学習においては、分析事例データベース３１０に含まれる複数の分析事例データに対して、形態素解析を含む自然言語処理が行われる。形態素解析においては、意味を有する最小の言語単位（形態素あるいは単語）に解析対象の文字列が分割される。分析事例データに対応する特定自然言語とは、当該分析事例データに含まれる情報を表現するのに使用されている自然言語である。

言語モデル６１は、共起行列を用いるカウントベースの言語モデルであってもよいし、ニューラルネットワークを用いる推論ベースの言語モデルであってもよい。推論ベースの言語モデルとしては、たとえば、単語の分散表現を生成するｗｏｒｄ２ｖｅｃのＣＢＯＷ（Continuous Bag-of-Words）モデルおよびｓｋｉｐ－ｇｒａｍモデル、ならびに文書の分散表現を生成するｄｏｃ２ｖｅｃのＰＶ－ＤＭ（Paragraph Vector Distributed Memory）モデルおよびＰＶ－ＤＢＯＷ（Paragraph Vector Distributed Bag-of-Words)モデルを挙げることができる。

ベクトル生成部２２０は、学習済みの言語モデル６１を用いて、分析事例データベース３１０に含まれる複数の分析事例データの各々について、当該分析事例データに含まれる単語の特徴を表す単語ベクトル、当該分析事例データに含まれる文章の特徴を表す文章ベクトル、および文書の特徴を表す文書ベクトルを生成する。ベクトル生成部２２０は、分析事例データベース３１０に含まれる複数の分析事例データの各々をベクトル化して、当該分析事例データがベクトル化されたデータを当該分析事例データに関連付けて分析事例データベース３１０に保存する。

通信部２１０は、検索クエリＱＲＹの情報をネットワークＮＷを介して端末装置１００から受信して、検索クエリＱＲＹをベクトル生成部２２０に出力する。検索クエリＱＲＹは自然言語で表現された文字列である。

ベクトル生成部２２０は、検索クエリＱＲＹに対して、形態素解析によって、検索クエリＱＲＹを最小単位の言語単位に分割する。ベクトル生成部２２０は、言語モデル６１を用いて、当該言語単位を特徴付ける単語ベクトルＷＶＣを算出する。ベクトル生成部２２０は、単語ベクトルＷＶＣの情報を検索部２３０に出力する。

検索部２３０は、分析事例データベース３１０に記憶されている複数の分析事例データから、単語ベクトルＷＶＣに類似する特徴を含む複数の関連分析事例データを検索する。具体的には、検索部２３０は、複数の分析事例データの各々について、検索クエリＱＲＹのベクトルと当該分析事例データのベクトルとの間の距離の大きさに応じて、検索クエリと当該分析事例データとの関連度を算出する。当該距離としては、たとえば、コサイン距離（コサイン類似度）を挙げることができる。２つのベクトル間の距離が小さいほど、２つのベクトルによってそれぞれ表現される２つの言語単位の関連度は大きい。検索部２３０は、複数の分析事例データのうち、検索クエリＱＲＹとの関連度が所定の閾値よりも大きい複数の関連分析事例データを関連度に応じて順位付ける。検索部２３０は、当該複数の関連分析事例データの順位を示すランキング情報ＲＮＫを表示制御部２５０へ出力する。

なお、検索部２３０によって行われる検索は、検索クエリＱＲＹに含まれる文字列（キーワード）から、検索したい分析事例の内容を解釈するセマンティック検索である。セマンティック検索は、キーワードの意味表現、検索を求める意図、目的等に基づいて、検索文字列に合致する検索対象を特定する。すなわち、セマンティック検索は、キーワードを単なる文字列として捉えるのではなく、検索要求を含めた意味を持つ文字列として捉える。

また、検索部２３０によって行われる検索においては、セマンティック検索と、キーワードと一致する文字列を含む分析事例データを検索するキーワード検索とが統合的に用いられてもよい。すなわち、検索クエリと分析事例データとの関連度は、キーワードのベクトルと当該分析事例データのベクトルとの距離、および当該分析事例データに含まれるキーワードの数に基づいて算出されてもよい。たとえば、キーワードをより多く含む分析事例データが上位に順位付けられ、キーワードを含まない分析事例データはセマンティック検索によってキーワードを含む分析事例データよりも下位に順位付けられてもよい。セマンティック検索とキーワード検索とが統合的に用いられることにより、セマンティック検索の検索根拠の明確性を向上させることができる。

表示制御部２５０は、ランキング情報ＲＮＫに基づいて、端末装置１００のディスプレイ１３１に表示される検索結果の画面情報ＤＳＰを作成する。表示制御部２５０は、通信部２１０を介して、端末装置１００に画面情報ＤＳＰを送信する。端末装置１００においては、画面情報ＤＳＰに従って、複数の関連分析事例データの名称が順位順にディスプレイ１３１に表示される。

図５は、検索クエリＱＲＹが「プリン体」である場合に、図１のディスプレイ１３１に表示される検索結果ウィンドウＷｎ２の一例を示す図である。図５に示されるように、検索結果ウィンドウＷｎ２には、関連分析事例データＤ１～Ｄ１１の名称が、順位１～１１とともにこの順にそれぞれ表示されている。関連分析事例データＤ１～Ｄ１１の各々の名称には、当該関連分析事例データへのハイパーリンクが設定されている。分析事例データベース３１０に含まれる複数の分析事例データのうち、「プリン体」という検索クエリＱＲＹに最も関連のある分析事例データはＤ１である。

図６は、検索クエリＱＲＹが「核酸」である場合に、図１のディスプレイ１３１に表示される検索結果ウィンドウＷｎ２の一例を示す図である。図６に示されるように、検索結果ウィンドウＷｎ２には、関連分析事例データＤ５，Ｄ１，Ｄ９，Ｄ３，Ｄ２，Ｄ６～Ｄ８，Ｄ４，Ｄ１０，Ｄ１１の名称が、順位１～１１とともにこの順にそれぞれ表示されている。関連分析事例データＤ１～Ｄ１１の各々の名称には、当該関連分析事例データへのハイパーリンクが設定されている。分析事例データベース３１０に含まれる複数の分析事例データのうち、「核酸」という検索クエリＱＲＹに最も関連のある分析事例データはＤ５である。

図７は、図１の分析事例検索システム１０００において行われる検索処理の概略的な流れを示す図である。以下ではステップを単にＳと記載する。図７に示されるように、Ｓ１０においてユーザによって端末装置１００に検索クエリＱＲＹが入力され、処理がＳ２０に進めされる。Ｓ２０において、ベクトル生成部２２０は、検索クエリＱＲＹのベクトルを算出し、処理をＳ３０に進める。Ｓ３０において、検索部２３０は、分析事例データベース３１０から検索クエリＱＲＹに関連する複数の関連分析事例データを検索し、複数の関連分析事例データを順位付けて処理をＳ４０に進める。Ｓ４０において、端末装置１００のディスプレイ１３１に検索結果が表示されて検索処理が終了する。

再び図３を参照して、分析事例データベース３１０に新たな分析事例データが追加された場合、学習部２６０は、分析事例データベース３１０を用いる機械学習を行い、言語モデル６１を更新する。ベクトル生成部２２０は、更新された言語モデル６１を用いて、分析事例データベース３１０に含まれる複数の分析事例データの各々のベクトルを更新する。

分析事例データベース３１０に新たな分析事例データが追加されると、検索クエリＱＲＹのベクトルおよび分析事例データベース３１０に含まれる複数の分析事例データの各々のベクトルが変化し得る。そのため、同じ検索クエリＱＲＹが用いられても、分析事例データベース３１０に新たな分析事例データが追加される前の検索結果と、分析事例データベース３１０に新たな分析事例データが追加された後の検索結果とは異なり得る。分析事例データベース３１０に追加される情報によっては、分析事例データベース３１０に含まれる情報の傾向が急激に変化し、検索クエリＱＲＹとの関連性が相対的に低い分析事例データが上位に順位付けされ得る。

そこで、分析事例検索システム１０００においては、分析事例データベース３１０に新たな分析事例データが追加された場合、予め定められた複数のテストクエリを用いて、複数の分析事例データの順位の頻度の分布の変動を当該分布の特徴を表す統計値の変化として算出する。分析事例検索システム１０００によれば、検索性能の変化を定量的に算出することができるため、予め定められた基準に基づいて検索性能の低下を自動的に検知することができる。

第１ラベルは、当該特定分析事例データに関連する文字列を含む。第１ラベルは、たとえば、当該分析事例データにおいて主に説明される分析対象の化合物の名称の文字列または当該化合物の分析を行う装置の名称の文字列を含む。

第２ラベルは、第１ラベルの上位概念を表す文字列を含む。第１ラベルが化合物の名称の文字列を含む場合、第２ラベルは当該化合物の化学的または生物学的な上位概念を示す文字列を含む。たとえば、第１ラベルが「プリン体」または「プリン塩基」である場合、第２ラベルは、たとえば「核酸」、「アルカロイド」または「塩基」であってよい。特定分析事例データの第１ラベルおよび第２ラベルは、当該特定分析事例データに自動的に付されてもよいし、オペレータによって付されてもよい。

また、たとえば第１ラベルが装置の名称の文字列としてＬＣＭＳ（Liquid Chromatograph Mass Spectrometer）－ＸＹＺＷ（ＸＹＺＷは当該装置の型番）である場合、第２ラベルは四重極型ＬＣ／ＭＳ、飛行時間型ＬＣ／ＭＳ、または単にＬＣ／ＭＳであってもよい。

第１ラベルおよび第２ラベルが分析対象の化合物または当該化合物の分析を行う装置に関する概念によって互いに関連付けられているため、化学的または生物学的な分析に関する情報を含む文書データが蓄積されたデータベースに対する文書検索の性能の低下を高精度に検出することができる。

図８は、テストクエリデータベース３２０において形成されている、第１ラベル、第２ラベル、および特定分析事例データの識別子が関連付けられた構造を示す図である。図８に示されるように、特定分析事例データＤａ１１，Ｄａ１２，Ｄａ１３の各々には、第１ラベルＣａ１および第２ラベルＣＡが付されている。特定分析事例データＤａ２１，Ｄａ２２，Ｄａ２３の各々には、第１ラベルＣａ２および第２ラベルＣＡが付されている。第２ラベルＣＡは、第１ラベルＣａ１，Ｃａ２の上位概念であり、第１ラベルＣａ１，Ｃａ２を包含する。特定分析事例データＤ１，Ｄ３，Ｄ６の各々には、第１ラベルの「プリン体」および第２ラベルの「核酸」が付されている。特定分析事例データＤ５には、第１ラベルＣｂ１および第２ラベルの「核酸」が付されている。特定分析事例データＤ９には、第１ラベルＣｂ２および第２ラベルの「核酸」が付されている。「核酸」は、「プリン体」，第１ラベルＣｂ１，Ｃｂ２の上位概念であり、「プリン体」，第１ラベルＣｂ１，Ｃｂ２を包含する。なお、特定分析事例データＤ１，Ｄ３，Ｄ５，Ｄ６，Ｄ９は、図５および図６に示される分析事例データＤ１，Ｄ３，Ｄ５，Ｄ６，Ｄ９にそれぞれ対応する。

再び図３を参照して、ベクトル生成部２２０は、分析事例データベース３１０に新たな分析事例データが追加されたことに伴う分析事例データベース３１０に含まれる複数の分析事例データのベクトルの更新が完了したことの通知を、性能評価部２７０に出力する。性能評価部２７０は、当該通知に応じて、テストクエリデータベース３２０から複数のテストクエリを取得して、当該複数のテストクエリの各々を検索クエリＴＱＲＹとした分析事例データの検索を行う。

性能評価部２７０は、検索部２３０から検索クエリＴＱＲＹに関するランキング情報ＲＮＫを取得する。性能評価部２７０は、複数のテストクエリのうち、複数の第１ラベルに関するランキング情報ＲＮＫにおける、複数の特定分析事例データの各々の順位の頻度を集計し、第１ラベルに関する統計値（第１統計値）を算出する。性能評価部２７０は、複数のテストクエリのうち、複数の第２ラベルに関するランキング情報ＲＮＫにおける、複数の特定分析事例データの各々の順位の頻度を集計し、複数の第２ラベルに関する統計値（第２統計値）を算出する。第１ラベルに関する統計値および第２ラベルに関する統計値の各々は、当該統計値が算出されたタイミングと関連付けられて記憶部に保存される。

性能評価部２７０は、言語モデル６１の更新による第１ラベルに関する統計値の変動値が予め定められた閾値Ｔｈ１（第１閾値）より大きく、かつ言語モデル６１の更新による第２ラベルに関する統計値の変動値が予め定められた閾値Ｔｈ２（第２閾値）より大きい場合、検索性能の低下を検出する。閾値Ｔｈ１，Ｔｈ２は、実機実験あるいはシミュレーションによって適宜決定することができる。なお、統計値の変動値とは、分析事例データベース３１０に新たな分析事例データが追加された後の当該統計値と、分析事例データベース３１０に新たな分析事例データが追加される前の当該統計値との差の絶対値である。なお、性能評価部２７０によって行われる検索においては、図７のＳ２０，Ｓ３０と同様の処理が行われる。

検索クエリＴＱＲＹが第１ラベルの「プリン体」である場合の検索結果の順位が図５に示されている順位と同じであるとする。図８および図５を参照しながら、「プリン体」が付されている特定分析事例データＤ１，Ｄ３，Ｄ６の順位は、それぞれ１位，３位、６位である。そのため、１位，３位、６位の各々の第１ラベルに関する頻度が１だけ増加される。同様に、検索クエリＴＱＲＹが第１ラベルＣａ１である場合、検索結果における特定分析事例データＤａ１１，Ｄａ１２，Ｄａ１３の各々の順位の第１ラベルに関する頻度が１だけ増加される。検索クエリＴＱＲＹが第１ラベルＣａ２である場合、検索結果における特定分析事例データＤａ２１，Ｄａ２２，Ｄａ２３の各々の第１ラベルに関する順位の頻度が１だけ増加される。検索クエリＴＱＲＹが第１ラベルＣｂ１である場合、検索結果における特定分析事例データＤ５の順位の第１ラベルに関する頻度が１だけ増加される。検索クエリＴＱＲＹが第１ラベルＣｂ２である場合、検索結果における特定分析事例データＤ９の第１ラベルに関する順位の頻度が１だけ増加される。

検索クエリＴＱＲＹが第２ラベルの「核酸」である場合の検索結果の順位が図６に示されている順位と同じであるとする。図８および図６を参照しながら、「核酸」が付されている特定分析事例データＤ１，Ｄ３，Ｄ５，Ｄ６，Ｄ９の順位は、それぞれ２位，４位，１位，６位，３位である。そのため、２位，４位，１位，６位，３位の各々の第２ラベルに関する頻度が１だけ増加される。検索クエリＴＱＲＹが第２ラベルＣＡである場合、検索結果における特定分析事例データＤａ１１，Ｄａ１２，Ｄａ１３，Ｄａ２１，Ｄａ２２，Ｄａ２３の各々の順位の第２ラベルに関する頻度が１だけ増加される。

図９は、複数の第１ラベルの各々を検索クエリＴＱＲＹとした場合の、複数の特定分析事例データの順位の頻度の分布曲線を示す図である。図９において実線は分析事例データベース３１０に新たな分析事例データが追加される前の分布曲線を示し、点線は分析事例データベース３１０に新たな分析事例データが追加された後の分布曲線を示す。また、図９においては、分布の特徴を表す統計値として最頻値が用いられる。図１０においても同様である。なお、分布の特徴を表す統計値は、最頻値以外の統計値であってもよく、たとえば中央値、または平均値であってもよい。

図９に示されるように、分析事例データベース３１０に新たな分析事例データが追加される前の第１ラベルに関する最頻値は、Ｖｓ１１である。分析事例データベース３１０に新たな分析事例データが追加された後の第１ラベルに関する最頻値は、Ｖｓ１２である。第１ラベルに関する最頻値の変動値は、Ｖｃ１である。

図１０は、複数の第２ラベルの各々を検索クエリＴＱＲＹとした場合の、複数の特定分析事例データの順位の頻度の分布曲線を示す図である。図１０に示されるように、分析事例データベース３１０に新たな分析事例データが追加される前の第２ラベルに関する最頻値は、Ｖｓ２１である。分析事例データベース３１０に新たな分析事例データが追加された後の第２ラベルに関する最頻値は、Ｖｓ２２である。第２ラベルに関する最頻値の変動値は、Ｖｃ２（＜Ｖｃ１）である。

第２ラベルは、通常、互いに異なる複数の第１ラベルを包含する。第２ラベルが付された分析事例データの数は、第２ラベルの下位概念の１つである第１ラベルが付された分析事例データの数よりも大きい。そのため、言語モデル６１の更新による検索結果の順位の変動は、第２ラベルを検索クエリとする場合よりも、第１ラベルを検索クエリとする場合の方が大きくなり易い。言語モデル６１の更新による検索結果の順位の変動の生じ易さに合わせて、第１ラベルに関する統計値の閾値Ｔｈ１は、第２ラベルに関する統計値の閾値Ｔｈ２より大きいことが望ましい。閾値Ｔｈ１がＴｈ２より大きいことにより、第１ラベルに関する統計値の変動および第２ラベルに関する統計値の変動の各々に現れる異常の兆候を整合的に検出することができる。

図１１は、図３のサーバ装置２００において行われる性能評価処理の概略的な流れを示す図である。図１１に示されるように、Ｓ１１０において、分析事例生成部２８０は、新たな分析事例データを分析事例データベース３１０に追加して、処理をＳ１２０に進める。Ｓ１２０において、学習部２６０は、分析事例データベース３１０を用いる機械学習を行い、言語モデル６１および分析事例データベース３１０に含まれる複数の分析事例データの各々のベクトルを更新し、処理をＳ１３０に進める。Ｓ１３０において、検索部２３０は、テストクエリデータベース３２０に登録されている複数の第１ラベルおよび複数の第２ラベルの各々を検索クエリＴＱＲＹとする分析事例データの検索を行い、処理をＳ１４０に進める。

Ｓ１４０において、性能評価部２７０は、複数の第１ラベルの各々を検索クエリＴＱＲＹとする分析事例データの検索結果から第１ラベルに関する統計値Ｖｓ１を算出し、処理をＳ１５０に進める。Ｓ１５０において、性能評価部２７０は、複数の第２ラベルの各々を検索クエリＴＱＲＹとする分析事例データの検索結果から第２ラベルに関する統計値Ｖｓ２を算出し、処理をＳ１６０に進める。

Ｓ１６０において性能評価部２７０は、統計値Ｖｓ１の変動値Ｖｃ１が閾値Ｔｈ１より大きいか否かを判定する。変動値Ｖｃ１が閾値Ｔｈ１以下である場合（Ｓ１６０においてＮＯ）、性能評価部２７０は、Ｓ１９０において通常の検索処理の開始を許可して、処理を終了する。変動値Ｖｃ１が閾値Ｔｈ１より大きい場合（Ｓ１６０においてＹＥＳ）、性能評価部２７０は、処理をＳ１７０に進める。

Ｓ１７０において、性能評価部２７０は、統計値Ｖｓ２の変動値Ｖｃ２が閾値Ｔｈ２より大きいか否かを判定する。変動値Ｖｃ２が閾値Ｔｈ２以下である場合（Ｓ１７０においてＮＯ）、性能評価部２７０は、Ｓ１９０において通常の検索処理の開始を許可して、処理を終了する。変動値Ｖｃ２が閾値Ｔｈ２より大きい場合（Ｓ１７０においてＹＥＳ）、性能評価部２７０は、Ｓ１８０において、検索性能の低下を検出して、処理を終了する。分析事例検索システム１０００においては、分析事例データベース３１０への新たな分析事例データの追加が性能評価処理に含まれているため、分析事例データベース３１０への新たな分析事例データの追加と文書検索の性能評価を一体的かつ連続的に行うことができる。

検索性能の低下の原因としては、たとえば、分析事例データベース３１０に追加された分析事例データの傾向が分析事例データベース３１０に既に含まれている複数の分析事例データの傾向から乖離していること、あるいは、分析事例データベース３１０と機械学習のハイパーパラメータとの不適合を挙げることができる。検索性能の低下が検出された場合、検出性能の低下が予め定められた関係者（たとえば分析事例検索システム１０００の管理者）に通知される。検索性能の低下が検出された場合、分析事例データベース３１０から追加された分析事例データが削除されて、当該分析事例データが追加される前の言語モデル６１および複数の分析事例データの各々のベクトルが分析事例データの検索に使用されてもよい。

図１２は、図３のサーバ装置２００のハードウェア構成を示すブロック図である。図１２に示されるように、サーバ装置２００は、プロセッサ２０１と、記憶部としてのメモリ２０２およびハードディスク２０３と、通信部２１０としての通信インターフェース２０４と、入出力部２０５とを含む。これらは、バス２０６を介して相互に通信可能に接続されている。

ハードディスク２０３は、不揮発性の記憶装置である。ハードディスク２０３には、たとえばオペレーティングシステム（ＯＳ：Operating System）のプログラム５１、分析事例検索サーバプログラム５２、性能評価プログラム５３、機械学習プログラム５４、および言語モデル６１が保存されている。図１２に示されるデータ以外にも、ハードディスク２０３には、たとえば各種アプリケーションの設定および出力（たとえば第１ラベルに関する統計値および第２ラベルに関する統計値）が保存される。メモリ２０２は、揮発性の記憶装置であり、たとえばＤＲＡＭ（Dynamic Random Access Memory）を含む。

プロセッサ２０１は、ＣＰＵ（Central Processing Unit）を含む。プロセッサ２０１は、ＧＰＵ（Graphics Processing Unit）をさらに含んでもよい。プロセッサ２０１は、ハードディスク２０３に保存されているプログラムをメモリ２０２に読み込んで実行し、サーバ装置２００の各種機能を実現する。たとえば、分析事例検索サーバプログラム５２を実行するプロセッサ２０１は、ベクトル生成部２２０，検索部２３０，表示制御部２５０，分析事例生成部２８０として機能する。性能評価プログラム５３を実行するプロセッサ２０１は、ベクトル生成部２２０および性能評価部２７０として機能する。機械学習プログラム５４を実行するプロセッサ２０１は、ベクトル生成部２２０および学習部２６０として機能する。プロセッサ２０１は、通信インターフェース２０４を介してネットワークＮＷに接続する。

実施の形態においては、ユーザが検索クエリを入力する端末装置１００とは別個のサーバ装置２００にベクトル生成部２２０、検索部２３０、表示制御部２５０、学習部２６０、性能評価部２７０、および分析事例生成部２８０が形成されているシステムについて説明した。ベクトル生成部、検索部、表示制御部、学習部、性能評価部、および分析事例生成部は、ユーザが検索クエリを入力する装置に形成されていてもよい。

図１３は、実施の形態の変形例に係る情報処理装置１００Ａの構成を示すブロック図である。図１３に示されるように、情報処理装置１００Ａは、ベクトル生成部２２０Ａ、検索部２３０Ａ、表示制御部２５０Ａ、学習部２６０Ａ、性能評価部２７０Ａ、および分析事例生成部２８０Ａを含む。ベクトル生成部２２０Ａ、検索部２３０Ａ、表示制御部２５０Ａ、学習部２６０Ａ、性能評価部２７０Ａ、および分析事例生成部２８０Ａは、図３のベクトル生成部２２０、検索部２３０、表示制御部２５０、学習部２６０、性能評価部２７０、および分析事例生成部２８０のそれぞれと同様の機能を有するため、当該機能の説明を繰り返さない。データベース３００は、情報処理装置１００Ａに接続されている。

図１４は、図１３の情報処理装置１００Ａのハードウェア構成を示すブロック図である。情報処理装置１００Ａのハードウェア構成は、図２のハードディスク１２３に図１２の性能評価プログラム５３、機械学習プログラム５４、および言語モデル６１が加えられているとともに、分析事例検索クライアントプログラム４２が分析事例検索プログラム４２Ａに置き換えられた構成である。これら以外は同様であるため、説明を繰り返さない。

図１４に示されるように、分析事例検索プログラム４２Ａを実行するプロセッサ１２１は、ベクトル生成部２２０Ａ，検索部２３０Ａ，表示制御部２５０Ａ，分析事例生成部２８０Ａとして機能する。性能評価プログラム５３を実行するプロセッサ１２１は、ベクトル生成部２２０Ａおよび性能評価部２７０Ａとして機能する。機械学習プログラム５４を実行するプロセッサ１２１は、ベクトル生成部２２０Ａおよび学習部２６０Ａとして機能する。

以上、実施の形態に係るシステムおよび方法、ならびに変形例に係る装置によれば、文書検索の性能の低下を自動的に検出することができる。

［態様］
上述した例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。

（第１項）一態様に係る方法は、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、当該言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該方法は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新するステップと、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出するステップと、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出するステップと、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合、文書検索の性能の低下を検出するステップとを含む。

第１項に記載の方法によれば、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合に文書検索の性能の低下が検出されることにより、文書検索の性能の低下を自動的に検出することができる。

（第２項）第１項に記載の方法において、第１ラベルは、当該第１ラベルが付された特定文書データにおいて分析対象とされている化合物の名称を示す文字列を含む。第２ラベルは、当該化合物の化学的または生物学的な上位概念を示す文字列を含む。

第２項に記載の方法によれば、第１ラベルおよび第２ラベルが分析対象の化合物に関する概念によって互いに関連付けられているため、化学的または生物学的な分析に関する情報を含む文書データが蓄積されたデータベースに対する文書検索の性能の低下を高精度に検出することができる。

（第３項）第１項または第２項に記載の方法において、言語モデルは、複数の文書データに含まれる単語および文章の各々の分散表現および複数の文書データの各々の分散表現を生成可能である。複数の関連文書データの各々と検索クエリとの関連度は、当該関連文書データの分散表現と検索クエリの分散表現との間の距離を用いて算出される。

第３項に記載の方法によれば、複数の関連文書データの各々と検索クエリとの関連度が当該関連文書データの分散表現と検索クエリの分散表現との間の距離を用いて算出されることにより、当該関連度を検索クエリと複数の関連文書データの各々との意味的な近さを表す指標として算出することができる。

（第４項）第３項に記載の方法において、複数の関連文書データの各々と検索クエリとの関連度は、当該関連文書データの分散表現と検索クエリの分散表現との間の距離および当該関連文書データに含まれる検索クエリの数に基づいて算出される。

第４項に記載の方法によれば、当該関連度の算出に関連文書データに含まれる検索クエリの数も用いられることにより、検索根拠の明確性を向上させることができる。

（第５項）第１項～第４項のいずれか１項に記載の方法は、少なくとも１つの文書データをデータベースに追加するステップを含む。

第５項に記載の方法によれば、データベースへの新たな文書データの追加と文書検索の性能評価を一体的かつ連続的に行うことができる。

（第６項）第１項～第５項のいずれか１項に記載の方法において、第１閾値は、第２閾値よりも大きい。

第６項に記載の方法によれば、第１統計値の変動および第２統計値の変動の各々に現れる異常の兆候を整合的に検出することができる。

（第７項）一態様に係るシステムは、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該システムは、端末装置と、サーバ装置とを備える。端末装置には、検索クエリが入力される。サーバ装置は、端末装置から検索クエリを受信して文書検索を行う。サーバ装置は、学習部と、性能評価部とを含む。学習部は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新する。性能評価部は、文書検索の性能を評価する。性能評価部は、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出する。性能評価部は、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出する。性能評価部は、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ更新による第２統計値の変動値が第２閾値よりも大きい場合、文書検索の性能の低下を検出する。

第７項に記載のシステムによれば、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合に文書検索の性能の低下が検出されることにより、文書検索の性能の低下を自動的に検出することができる。

（第８項）一態様に係る装置は、複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、複数の関連文書データの各々と検索クエリとの関連度に応じて複数の関連文書データを順位付ける文書検索の性能を評価する。当該関連度は、データベースを用いる機械学習によって生成された言語モデルによって抽出される複数の文書データの各々の特徴と、言語モデルによって抽出される検索クエリの特徴とに基づいて算出される。複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび第１ラベルの上位概念である第２ラベルが予め付されている。当該装置は、入出力部と、検索部と、学習部と、性能評価部とを備える。入出力部には、検索クエリが入力される。検索部は、検索クエリを受けて文書検索を行う。学習部は、データベースに少なくとも１つの文書データが追加された場合、機械学習によって言語モデルを更新する。性能評価部は、文書検索の性能を評価する。性能評価部は、複数の特定文書データに付された複数の第１ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第１統計値を算出する。性能評価部は、複数の特定文書データに付された複数の第２ラベルの各々を検索クエリとする文書検索の結果から、複数の特定文書データの各々の順位に関する第２統計値を算出する。性能評価部は、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ更新による第２統計値の変動値が第２閾値よりも大きい場合、性能の低下を検出する。

第８項に記載の装置によれば、少なくとも１つの文書データの追加に伴う言語モデルの更新による第１統計値の変動値が第１閾値より大きく、かつ当該更新による第２統計値の変動値が第２閾値よりも大きい場合に文書検索の性能の低下が検出されることにより、文書検索の性能の低下を自動的に検出することができる。

なお、上述した実施の形態および変更例について、明細書内で言及されていない組み合わせを含めて、不都合または矛盾が生じない範囲内で、実施の形態で説明された構成を適宜組み合わせることは出願当初から予定されている。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

６１言語モデル、１００端末装置、１００Ａ情報処理装置、１２０計算機、１２１，２０１プロセッサ、１２２，２０２メモリ、１２３，２０３ハードディスク、１２４，２０４通信インターフェース、１２５，２０６バス、１３０，２０５入出力部、１３１ディスプレイ、１３２キーボード、１３３マウス、２００サーバ装置、２１０通信部、２２０，２２０Ａベクトル生成部、２３０，２３０Ａ検索部、２５０，２５０Ａ表示制御部、２６０，２６０Ａ学習部、２７０，２７０Ａ性能評価部、２８０，２８０Ａ分析事例生成部、３００データベース、３１０分析事例データベース、３２０テストクエリデータベース、１０００分析事例検索システム、ＣＡ第２ラベル、Ｃａ１，Ｃａ２，Ｃｂ１，Ｃｂ２第１ラベル、Ｄ１，Ｄ２，Ｄ３，Ｄ４，Ｄ５，Ｄ６，Ｄ８，Ｄ９，Ｄ１０，Ｄ１１分析事例データ、ＮＷネットワーク、ＱＲＹ，ＴＱＲＹ検索クエリ、Ｔｈ１，Ｔｈ２閾値、Ｖｃ１，Ｖｃ２変動値、Ｖｓ１，Ｖｓ２統計値、ＷＶＣ単語ベクトル。

Claims

複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、前記複数の関連文書データの各々と前記検索クエリとの関連度に応じて前記複数の関連文書データを順位付ける文書検索の性能を評価する、プロセッサによって実行される方法であって、
前記関連度は、前記データベースを用いる機械学習によって生成された言語モデルによって抽出される前記複数の文書データの各々の特徴と、前記言語モデルによって抽出される前記検索クエリの特徴とに基づいて算出され、
前記複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび前記第１ラベルの上位概念である第２ラベルが予め付されており、
前記方法は、
前記データベースに少なくとも１つの文書データが追加された場合、前記機械学習によって前記言語モデルを更新するステップと、
前記複数の特定文書データに付された複数の第１ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第１統計値を算出するステップと、
前記複数の特定文書データに付された複数の第２ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第２統計値を算出するステップと、
前記少なくとも１つの文書データの追加に伴う前記言語モデルの更新による前記第１統計値の変動値が第１閾値より大きく、かつ前記更新による前記第２統計値の変動値が第２閾値よりも大きい場合、前記性能の低下を検出するステップとを含む、方法。
前記第１ラベルは、前記第１ラベルが付された特定文書データにおいて分析対象とされている化合物の名称を示す文字列を含み、
前記第２ラベルは、前記化合物の化学的または生物学的な上位概念を示す文字列を含む、請求項１に記載の方法。
前記言語モデルは、前記複数の文書データに含まれる単語および文章の各々の分散表現および前記複数の文書データの各々の分散表現を生成可能であり、
前記関連度は、前記複数の関連文書データの各々の分散表現と前記検索クエリの分散表現との間の距離を用いて算出される、請求項１に記載の方法。
前記関連度は、前記距離および前記複数の関連文書データの各々に含まれる前記検索クエリの数に基づいて算出される、請求項３に記載の方法。
前記少なくとも１つの文書データを前記データベースに追加するステップをさらに含む、請求項１に記載の方法。
前記第１閾値は、前記第２閾値よりも大きい、請求項１に記載の方法。
複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、前記複数の関連文書データの各々と前記検索クエリとの関連度に応じて前記複数の関連文書データを順位付ける文書検索の性能を評価するシステムであって、
前記関連度は、前記データベースを用いる機械学習によって生成された言語モデルによって抽出される前記複数の文書データの各々の特徴と、前記言語モデルによって抽出される前記検索クエリの特徴とに基づいて算出され、
前記複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび前記第１ラベルの上位概念である第２ラベルが予め付されており、
前記システムは、
前記検索クエリが入力される端末装置と、
前記端末装置から前記検索クエリを受信して前記文書検索を行うサーバ装置とを備え、
前記サーバ装置は、
前記データベースに少なくとも１つの文書データが追加された場合、前記機械学習によって前記言語モデルを更新する学習部と、
前記性能を評価する性能評価部とを含み、
前記性能評価部は、
前記複数の特定文書データに付された複数の第１ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第１統計値を算出し、
前記複数の特定文書データに付された複数の第２ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第２統計値を算出し、
前記少なくとも１つの文書データの追加に伴う前記言語モデルの更新による前記第１統計値の変動値が第１閾値より大きく、かつ前記更新による前記第２統計値の変動値が第２閾値よりも大きい場合、前記性能の低下を検出する、システム。
複数の文書データを含むデータベースから、検索クエリに関連する複数の関連文書データを検索し、前記複数の関連文書データの各々と前記検索クエリとの関連度に応じて前記複数の関連文書データを順位付ける文書検索の性能を評価する装置であって、
前記関連度は、前記データベースを用いる機械学習によって生成された言語モデルによって抽出される前記複数の文書データの各々の特徴と、前記言語モデルによって抽出される前記検索クエリの特徴とに基づいて算出され、
前記複数の文書データに含まれる複数の特定文書データの各々には、当該特定文書データに関連する第１ラベルおよび前記第１ラベルの上位概念である第２ラベルが予め付されており、
前記装置は、
前記検索クエリが入力される入出力部と、
前記検索クエリを受けて前記文書検索を行う検索部と、
前記データベースに少なくとも１つの文書データが追加された場合、前記機械学習によって前記言語モデルを更新する学習部と、
前記性能を評価する性能評価部とを備え、
前記性能評価部は、
前記複数の特定文書データに付された複数の第１ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第１統計値を算出し、
前記複数の特定文書データに付された複数の第２ラベルの各々を前記検索クエリとする前記文書検索の結果から、前記複数の特定文書データの各々の順位に関する第２統計値を算出し、
前記少なくとも１つの文書データの追加に伴う前記言語モデルの更新による前記第１統計値の変動値が第１閾値より大きく、かつ前記更新による前記第２統計値の変動値が第２閾値よりも大きい場合、前記性能の低下を検出する、装置。