JP7282940B2

JP7282940B2 - 電子記録の文脈検索のためのシステム及び方法

Info

Publication number: JP7282940B2
Application number: JP2022022532A
Authority: JP
Inventors: モスクウィンスキー，マイケル; フィールディング，アレックス; ホール，ケビン，クリストファー; レンボ，キンバリー
Original assignee: リップコードインコーポレイテッド
Priority date: 2016-08-09
Filing date: 2022-02-17
Publication date: 2023-05-29
Anticipated expiration: 2037-08-09
Also published as: KR20190062391A; JP2022065108A; JP2019530057A; EP3497584A4; US11030199B2; US20190332601A1; EP3497584A1; US20180150522A1; CA3033108A1; CN109937417A; JP7028858B2; MX2019001576A; US20210319032A1; WO2018031656A1; US10198479B2

Description

関連出願の相互参照
[0001] 本出願は、２０１６年８月９日付けで出願された米国仮特許出願第６２／３７２，５６５号、２０１６年８月９日付けで出願された米国仮特許出願第６２／３７２，５７１号、及び２０１６年８月９日付けで出願された米国仮特許出願第６２／３７２，５７７号の利益を主張するものであり、これらの出願は、引用により、そのすべてが本明細書に包含される。

発明の背景
[0002] 情報は、多くの場合に、物理的な文書ファイル上において保存することができる。但し、このような物理的保存システムは、不定の持続時間にわたる極めて大容量の空間の利用可能性を必要としうる。例えば、物理的文書ファイルは、記録保管所、倉庫、図書館、及び／又は貯蔵所内において、離れた状態で、梱包される場合がある。また、物理的文書は、一旦保存されたら、文書の損傷、破壊、又は劣化（例えば、自然な劣化）を防止するなどのために、定期的な保守を必要としうる。更には、物理的文書ファイル上において保存されている情報のアクセスには、費用及び時間を所要しうる。物理的文書は、発見及び搬送が困難でありうるのみならず、物理的文書が識別された後の、物理的ファイルからの情報の抽出にも、時間を所要しうる。

[0003] 代替肢として、物理的文書からの情報は、電子媒体に転送することができると共に、メモリ内において保存することができる。いくつかの例においては、情報は、電子的に生成及び保存することができる。この結果、保存の際の保存空間及び保守に対するニーズを除去することができる。情報は、このような電子記録から電子的にサーチすることができる。例えば、ユーザーによって提供されるサーチクエリに応答してサーチ結果を検索することができる。

発明の概要
[0004] 電子記録として保存される場合にも、ソートするべき無数のその他の電子記録が存在している際には、特定の情報、及び／又は文書の発見及び隔離が困難になりうる。ユーザー提供のサーチクエリに応答して検索されたサーチ結果は、いくつかの側面において、ユーザー提供のサーチクエリと関連性を有しうるが、このような関連性は、しばしば、非常に希薄となる可能性があり、或いは、サーチ結果が、まったく誤った側面において関連性を有する可能性もある。ユーザーが探している正確な情報を見出するべく、ユーザーがサーチクエリを反復的に生成し直さなければならないことは、珍しいことではない。複数のサーチクエリを実行した後にも、ユーザーが、依然として、求めている情報を発見できない場合もある。これは、ユーザーの側における相当な時間及び努力に結び付く可能性がある。本明細書においては、少なくとも以上において識別されている問題点に対処する、電子記録の文脈検索用のシステム及び方法に対するニーズが認識されている。

[0005] 本明細書において提供されているシステム及び方法は、ユーザークエリの文脈的な処理、及び／又は自然言語に基づいた処理に少なくとも部分的に基づいて電子記録を文脈的に検索することができる。電子記録は、ユーザーの振る舞いに少なくとも部分的に基づいて検索することができる。検索されたサーチ結果は、文脈固有のものでありうる。検索されたサーチ結果は、ユーザー固有のものでありうる。

[0006] 本明細書において提供されているシステム及び方法は、（ｉ）自然言語処理（ＮＬＰ：Natural Language Processing）モデル、（ｉｉ）ユーザーの振る舞い、及び／又は（ｉｉｉ）ユーザー、記録、及び／又は専門分野の間などの、サーチに関与する様々なエンティティの間の関係に基づいたサーチクエリ、及び／又はサーチ結果の改善を許容している。本明細書において提供されているシステム及び方法は、サーチクエリのタイプに相対的に固有である、又はこれとの間において相対的に高度な互換性を有する、メカニズムを使用した改善されたサーチクエリの実行を許容している。有益には、サーチ結果は、相対的に高度な正確性を有することができる、及び／又はユーザー及び／又は文脈に対して相対的に個人化されたものとなりうる。

[0007] 一態様においては、サーチクエリに基づいて電子記録を文脈的に検索するコンピュータ実装された方法が提供されており、方法は、１つ又は複数のコンピュータプロセッサの支援により、クエリタイプの自然言語処理（ＮＬＰ）モデル定義に少なくとも部分的に基づいてサーチクエリのクエリタイプを判定することと、クエリタイプのレジストリにアクセスすることであって、レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアをレジストリ内において有する、ことと、クエリタイプにマッピングされた１つ又は複数の実行方法を解明することと、サーチ結果として複数の電子記録を検索するべく、クエリタイプにマッピングされた１つ又は複数の実行方法を使用してサーチクエリを実行することであって、複数の電子記録のうちの所与の電子記録は、所与の電子記録を検索するべく使用される実行方法と関連する優先順位重み値によって重み付けされている、ことと、複数の電子記録の優先順位重み付け値に少なくとも部分的に基づいて複数の電子記録を表示することと、を有する。

[0008] いくつかの実施形態においては、方法は、実行の前に、サーチクエリ内において元々存在していない１つ又は複数のキーワードを付加することにより、或いは、分類法フィルタを付加することにより、サーチクエリを改善することを更に有することができる。

[0009] いくつかの実施形態においては、１つ又は複数のキーワードは、サーチクエリを提供するユーザーのユーザー振る舞いデータに少なくとも部分的に基づいている。

[0010] いくつかの実施形態においては、方法は、実行の前に、サーチクエリに対応する第１のＮＬＰモデルを判定することであって、第１のＮＬＰモデルは、１つ又は複数のキーワードの第１の組に対応しており、サーチクエリのコンポーネントは、１つ又は複数のキーワードの第１の組のうちの少なくとも１つのキーワードとマッチングしている、ことと、第１のＮＬＰモデルに近接した第２のＮＬＰモデルを判定することであって、第２のＮＬＰモデルは、１つ又は複数のキーワードの第２の組に対応しており、第１のＮＬＰモデル及び第２のＮＬＰモデルは、既定の閾値以上の重み値を有する近接性関係を有している、ことと、サーチクエリ内において元々存在していない１つ又は複数のキーワードの第２の組のキーワードによってサーチクエリを改善することと、を更に有することができる。

[0011] いくつかの実施形態においては、方法は、実行の前に、分類法フィルタを判定するべく、ＮＬＰモデル定義を使用して分類法抽出をサーチクエリに対して実行することを更に有することができる。

[0012] いくつかの実施形態においては、ＮＬＰモデル定義は、発話の一部のパターン又は正規表現のパターンに少なくとも部分的に基づいている。

[0013] いくつかの実施形態においては、実行方法は、キーワードサーチ及びグラフサーチを有する。

[0014] いくつかの実施形態においては、グラフサーチは、複数の電子記録、サーチクエリを提供するユーザー、又はこれらの両方と文脈的に関連している更なる電子記録を検索するべく、１つ又は複数のエンティティ及び１つ又は複数のエンティティの間の文脈的関係を有するグラフデータベースを調査することを有する。

[0015] いくつかの実施形態においては、１つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも１つの構成要素である。

[0016] いくつかの実施形態においては、クエリタイプのＮＬＰモデル定義は、発話の一部のパターンに少なくとも基づいている。

[0017] 別の態様においては、サーチクエリに基づいて電子記録を文脈的に検索するコンピュータシステムが提供されており、システムは、１つ又は複数のプロセッサと、電子記録を分類する方法を実装するべく、個別に又は集合的に、１つ又は複数のプロセッサによって実行可能である命令を含む、１つ又は複数のプロセッサに通信自在に結合されたメモリと、を有し、方法は、ユーザーから、コンピュータネットワーク上において、サーチクエリを受け取ることと、グラフデータベースから、自然言語処理（ＮＬＰ）モデルライブラリにアクセスすることであって、ＮＬＰモデルライブラリは、複数のＮＬＰモデルを有しており、複数のＮＬＰモデルのうちの所与のＮＬＰモデルは、キーワードの１つ又は複数の組に対応している、ことと、サーチクエリに対応する第１のＮＬＰモデルを判定するべくサーチクエリをＮＬＰモデルライブラリに照らしてマッチングすることであって、サーチクエリのコンポーネントは、第１のＮＬＰモデルのキーワードの１つ又は複数の組の少なくとも１つのキーワードにマッチングしている、ことと、第１のＮＬＰモデルに近接した１つ又は複数のその他のＮＬＰモデルを判定することであって、第１のＮＬＰモデル及び１つ又は複数のその他のＮＬＰモデルのそれぞれは、既定の閾値以上の重み値を有する近接性関係を有している、ことと、サーチクエリ内において元々存在していない１つ又は複数のその他のＮＬＰモデルに対応する１つ又は複数のキーワードを付加することにより、サーチクエリを改善することと、サーチ結果として複数の電子記録を検索するべく、改善されたサーチクエリを実行することと、ユーザーに対して、１つ又は複数のプロセッサに通信自在に結合されたグラフィカルユーザーインターフェイス上において、複数の電子記録を表示することと、を有する。

[0018] いくつかの実施形態においては、方法は、１つ又は複数のコンピュータプロセッサの支援により、クエリタイプの自然言語処理（ＮＬＰ）モデル定義に少なくとも基づいてサーチクエリのクエリタイプを判定することと、クエリタイプのレジストリにアクセスすることであって、レジストリは、クエリタイプを実行方法にマッピングしており、且つ、それぞれのクエリタイプと関連する優先順位重み値と実行方法のペアをレジストリ内において有する、ことと、複数の電子記録を検索するべく、クエリタイプにマッピングされた１つ又は複数の実行方法を使用して改善されたサーチクエリを実行することであって、複数の電子記録のうちの所与の電子記録は、所与の電子記録を検索するべく使用される実行方法と関連する優先順位重み値によって重み付けされており、複数の電子記録は、複数の電子記録の優先順位重み値に少なくとも部分的に基づいた順序において表示される、ことと、を更に有することができる。

[0019] いくつかの実施形態においては、実行方法は、キーワードサーチ及びグラフサーチを有する。

[0020] いくつかの実施形態においては、グラフサーチは、複数の電子記録、サーチクエリを提供したユーザー、及びこれらの両方に文脈的に関連している更なる電子記録を検索するべく、１つ又は複数のエンティティ及び１つ又は複数のエンティティの間の文脈的関係を有するグラフデータベースを調査することを有する。

[0021] いくつかの実施形態においては、１つ又は複数のエンティティは、記録、ユーザー、及び専門分野からなる群からの少なくとも１つの構成要素である。

[0022] いくつかの実施形態においては、サーチクエリは、ユーザーのユーザー振る舞いデータに少なくとも部分的に基づいた１つ又は複数のキーワードを付加することにより、更に改善されている。

[0023] いくつかの実施形態においては、ユーザー振る舞いデータは、グラフデータベース内において保存されており、且つ、これからアクセスされる。

[0024] いくつかの実施形態においては、方法は、実行の前に、ユーザー振る舞いデータを判定するべく、ユーザーに対してユーザー振る舞いフィードバックループを実行することを更に有する。

[0025] いくつかの実施形態においては、方法は、表示の後に、ユーザーからユーザー振る舞いデータを受け取ることを更に有する。

[0026] いくつかの実施形態においては、ユーザー振る舞いデータは、複数の電子記録のうちの電子記録が選択されるか又は選択されないかに関するデータ、複数の電子記録のうちの選択された電子記録を閲覧するべく使用される時間、及びユーザーが記録において実行するスクロール及びページングの程度、のうちの少なくとも１つを有する。

[0027] 本開示の更なる態様及び利点については、本開示の例示用の実施形態のみが図示及び記述されている以下の詳細な説明から、当業者に容易に明らかとなろう。理解されるように、本開示は、その他の且つ異なる実施形態を有する能力を有しており、且つ、本開示を逸脱することなしに、様々な明白な観点において、そのいくつかの詳細事項を変更することができる。従って、図面及び説明は、その特性が、限定ではなく、例示を目的としているものと見なされたい。

引用による包含
[0028] 本明細書において言及されているすべての出版物、特許、及び特許出願は、それぞれの個々の出版物、特許、又は特許出願が引用によって包含されることが具体的に且つ個別に示されているのと同程度に、引用により、本明細書に包含される。引用によって包含された出版物及び特許又は特許出願が本明細書において含まれている開示と矛盾している場合には、本明細書が、すべてのそのような矛盾する記述に取って代わる及び／又はそれらよりも優先するものと解釈されたい。

図面の簡単な説明
[0029] 本発明の新規の特徴については、添付の請求項において詳細事項を伴って記述されている。本発明の特徴及び利点の更に十分な理解は、本発明の原理が利用されている例示用の実施形態について記述する以下の詳細な説明を参照することにより、得られることになるが、添付図面（本明細書においては、「図（Figure）」及び「図（FIG.）とも表現されている」）は、以下のとおりである。

[0030]記録管理システムにおける記録の文脈検索のための方法の概略フローチャートを示す。 [0031]ＮＬＰモデルライブラリのグラフデータベースの一部分を示す。 [0032]発話の一部のタグの例を示す。 [0033]サンプルクエリ及びその対応するクエリタイプを示す。 [0034]サンプルクエリタイプレジストリを示す。 [0035]ユーザー振る舞いフィードバックループの一例を示す。 [0036]サーチ結果を改善するべく調査されうる様々なエンティティの知識グラフデータベースを示す。 [0037]本開示のシステム及び方法によるサンプルクエリ及び処理方法を示す。 [0038]本開示の方法を実装するように、プログラミングされた又はその他の方法で構成されたコンピュータシステムを示す。

本発明の詳細な説明
[0039] 本明細書には、本発明の様々な実施形態が図示及び記述されているが、当業者には、このような実施形態は、例として提供されているに過ぎないことが明らかとなろう。本発明を逸脱することなしに、当業者は、多数の変形、変更、及び置換を想起することができる。本明細書において記述されている本発明の実施形態の様々な代替肢が利用されうることを理解されたい。

[0040] 政府機関とプライベート及びパブリックエンティティの両方により、膨大な量の情報を物理的文書上において保存することができる。このような文書は、巨大な記録保管所、倉庫、図書館、及び／又は貯蔵所内において保管することができる。但し、物理的文書は、手作業による発見、アクセス、サーチ、及び／又は操作が困難でありうる。更には、このような物理的文書からの情報の発見、アクセス、サーチ、及び／又は抽出も、困難でありうる。手作業による方法は、費用を所要し、非効率的であり、信頼性が低く、及び／又はプライバシーの懸念を有する可能性がある。例えば、大量の文書の人間による取扱いは、低速となる場合があり、エラーが発生しやすい場合があり、文書内の化学物質に対する曝露及び留め具に対する曝露に起因して人間の健康を損なう場合があり、文書を損なう場合があり、及び／又は機密情報を含む文書が関係している際にはセキュリティ漏洩を起こす場合がある。特定の文書の発見及び／又はそのような文書の搬送は、骨が折れると共に費用を所要する場合がある。また、物理的文書上における情報の保存は、物理的文書が失われた際などに、失われやすい場合があり、損なわれる場合があり、さもなければ、実質的に劣化する場合があり（例えば、インキの薄れ、シートの完全性の弱化など）、破壊される場合があり、及び／又は誤ったラベルが付与される場合がある。少なくとも本明細書において記述されている理由に起因し、物理的文書上において保存されている情報の抽出は、困難であり、これにより、保存されている膨大な量の情報に対するアクセスが妨げられる又は妨害される場合がある。

[0041] 物理的文書上において保存されている情報をデジタル情報に変換することにより、情報をデジタルサーチを通じて容易にアクセス可能なものにすることができる。例えば、物理的文書は、カメラ又はその他の撮像装置又は光学センサなどにより、デジタル的にスキャンすることが可能であり、或いは、その他の方法で撮像することができる。いくつかの例においては、自動化された又は半自動化されたシステム及び方法を介して、大量の（例えば、数百万個の）物理的文書を電子記録に変換することができる。このような自動化された又は半自動化されたシステム及び方法は、物理的文書の電子記録への変換において、さもなければ手作業で実行される、１つ又は複数のプロセス（例えば、組織化されていない文書スタックをソートする、文書スタックからシートを隔離する、１つ又は複数のシートに付着した留め具を取り外す、文書を装置に供給する、文書をスキャンする、文書を方向付けする、スキャンされた文書を処分するなど）を自動化するなどにより、大量の物理的文書を効率的に且つ高度な均一性を伴って処理するように、構成することができる。本明細書において記述されているシステム及び方法は、電子記録への物理的文書の変換、電子記録のタグ付け、及びタグ付けされた電子記録のサーチ、を伴う自動化されたエンドツーエンドプロセスの一部分でありうる。いくつかの例においては、タグ付けされていない電子記録をサーチすることができる。

[0042] いくつかの例においては、デジタル化された情報は、テキスト認識（例えば、光学文字認識（ＯＣＲ：Optical Character Recognition））を経験するなどのように、更に処理することができる。デジタル化された情報は、安全な場所におけるオンサイトの又は遠隔地のサーバー内において保存することが可能であり、及び／又は要求に応じて容易に且つ確実に複製することができる。情報のデジタル化により、信頼性を改善することが可能であり、費用を低減することが可能であり、及び／又は機密情報の曝露を回避することができる。但し、デジタル情報は、物理的文書上において保存されている情報よりも容易にサーチすることができると共に、デジタル化の後にターゲット宛先に容易に送信することができる一方で、電子記録である場合にも、ソートするべき無数のその他の電子記録が存在している際には、特定の情報及び／又は文書を発見及び隔離することが困難でありうる。

[0043] 電子記録の文脈検索を促進するシステム及び方法が提供されている。本明細書において提供されているシステム及び方法は、ユーザークエリの文脈的な処理及び／又は自然言語に基づいた処理に少なくとも部分的に基づいて電子記録を文脈的に検索することができる。システム及び方法は、１つ又は複数の自然言語処理（ＮＬＰ）モデルを使用することができる。電子記録は、ユーザーの振る舞いに少なくとも部分的に基づいて検索することができる。検索されたサーチ結果は、文脈固有のものでありうる。検索されたサーチ結果は、ユーザー固有のものでありうる。有益には、サーチ結果をユーザーに対して個人化することができる。サーチ結果は、自然言語に基づいたユーザークエリに応答するものであってもよい。有益には、ユーザーは、文脈的に関連する及び／又はユーザー固有であるサーチ結果を取得するべく、特別なサーチ構文（例えば、演算子など）を学習しなくてもよい。

[0044] 本明細書において記述されているシステム及び方法は、物理的ファイルから変換された（例えば、デジタル的にスキャンされた又はその他の方法で撮像された）電子記録と電子ファイルとして生成及び保存された電子記録の両方の検索に適用することができる。

[0045] 本明細書において記述されているシステム及び方法は、記録管理システム内における電子記録のサーチ及び検索に適用することができる。記録管理システムは、複数の電子記録を有することができる。本明細書において記述されている記録管理システムは、任意の数の電子記録を有することができる。例えば、記録管理は、少なくとも１つ、１０個、１００個、１０^３個、１０^４個、１０^５個、１０^６個、１０^７個、１０^８個、１０^９個、１０^１２個、１０^１５個、又はこれらを上回る数の電子記録を有することができる。電子記録は、例えば、テキスト及び／又は画像などの、情報を含む任意のデジタル記録でありうる。電子記録は、電子文書又は電子文書からの抜粋（例えば、単語、フレーズ、文章、段落、節、章、ページ、その他のセグメントなど）でありうる。電子記録は、物理的文書の、或いは、物理的文書からの抜粋の、デジタル画像でありうる。電子記録は、オフライン及び／又はオンラインで（例えば、インターネット上において）電子的に入手可能である、投稿、リスト、コメント、注記、パンフレット、ガイド、マニュアル、写真、絵、画像、グラフィック、グラフ、表、チャート、ブログ、ウェブサイト、ハイパーリンク（例えば、ＵＲＬ）、記事、任意のテキスト、及び／又は画像、任意のその他の情報、及び／又はこれらの組合せでありうる。

[0046] 或いは、この代わりに、又はこれに加えて、本明細書において記述されているシステム及び方法は、任意のストレージシステム、データベース、データ構造、サーチエンジン、グラフ、チャート、表、これらのうちの複数の任意のもの、及び／又はこれらの任意の組合せにおける電子記録のサーチ及び検索に適用することができる。

[0047] 本明細書において記述されているシステム及び方法は、タグ付けされた電子記録とタグ付けされていない電子記録の両方の検索に適用することができる。タグは、電子記録を記述するべく使用されるラベルでありうる。タグは、共通主題を有する異なる電子記録をグループ化するべく使用されるラベルでありうる。タグは、テキストストリングでありうる。タグは、数値でありうる。タグは、キーワード及び／又はフレーズでありうる。タグは、名称でありうる。タグは、レーティングでありうる。タグは、カテゴリ、グループ、トピック、及び／又はタイプでありうる。タグは、注記でありうる。タグは、構造化されていない分類法の１つ又は複数のコンポーネントでありうる。タグは、標準化された情報でありうる。タグは、電子記録又はファイル用の任意のメタデータフィールドでありうる。タグは、電子記録に割り当てられる際などに、電子記録用のメタデータフィールドとして保存することができる。いくつかの例においては、タグは、２値（例えば、はい／いいえ、○／×、０／１など）でありうる。タグは、電子記録に割り当て可能でありうる及び／又はこれから除去可能でありうる。タグは、電子記録をインデックス付けするべく使用されてもよい。タグは、電子記録を分類するべく使用されてもよい。タグは、電子記録をサーチ及びフィルタリングするべく使用されてもよい。タグは、変更されてもよく、修正されてもよく、及び／又はその他の方法で更新されてもよい。いくつかの例においては、タグは、１つ又は複数の電子記録に割り当てられている間に、変更されてもよく、修正されてもよく、及び／又はその他の方式で更新されてもよい。

[0048] 本明細書において提供されているシステム及び方法は、（ｉ）自然言語処理（ＮＬＰ）モデル、（ｉｉ）ユーザーの振る舞い、及び／又は（ｉｉｉ）ユーザー、記録、及び／又は専門分野の間のなどの、サーチに関与する様々なエンティティの間の関係に基づいたサーチクエリ及び／又はサーチ結果の改善を許容している。本明細書において提供されているシステム及び方法は、サーチクエリのタイプに相対的に固有である又はこれとの間において相対的に高度な互換性を有するメカニズムを使用した改善されたサーチクエリの実行を許容している。異なるタイプのクエリを実行するべく、異なるメカニズムを使用することができる。有益には、サーチ結果は、相対的に高度な正確さを有することができる。有益には、サーチ結果は、ユーザー及び／又は文脈に対して相対的に個人化することができる。

[0049] いくつかの例においては、第１のＮＬＰモデルは、発話の一部のパターン又は正規表現のパターンを使用するなどにより、クエリタイプを判定するべく、使用することができる。更には、サーチクエリ内において元々存在していないその他のＮＬＰモデルに対応するキーワードを付加するなどにより、サーチクエリを改善するべく、第１のＮＬＰモデルに近接していると判定されたその他のＮＬＰモデルを使用することができる。

[0050] いくつかの例においては、サーチクエリは、ユーザーの振る舞いによって改善することできる。記録管理システムは、例えば、ユーザー振る舞いフィードバックを介して、ユーザーの振る舞いを学習することができると共に、サーチクエリを改善するべく、このようなユーザー振る舞いデータを使用することができる。システムは、記録の共有、記録の閲覧、記録を通じたサーチ、及び／又はサーチ結果からの記録に対するクリックなどの、ユーザーの活動からユーザーの振る舞いを学習することができる。

[0051] いくつかの例においては、サーチクエリ及び／又はサーチ結果を改善して電子記録の文脈的サーチを促進するべく、ユーザー、記録、及び／又は専門分野の間などの、サーチに関与する様々なエンティティの間の関係を有する知識グラフを調査することができる。

[0052] 図１は、記録管理システムにおける記録の文脈検索のためのシステム及び方法の概略フローチャートを示している。

[0053] ユーザーは、システムによって実行される１つ又は複数の動作の後にサーチ結果１０４を取得するべく、サーチクエリ１０２を記録管理システムに提供することができる。ユーザーは、記録管理システムのユーザーであってもよく、或いは、そうでなくてもよい。例えば、ユーザーは、記録管理システムの操作者、管理者、又はアドミニストレータでありうる。ユーザーは、記録管理システムの顧客でありうる。ユーザーは、記録管理システムに対する文書及び／又は記録の提供者でありうる。ユーザーは、記録管理システムに対する文書及び／又は記録の生成者でありうる。ユーザーは、個人でありうる。ユーザーは、エンティティでありうる。ユーザーは、複数の個人でありうる。ユーザーは、複数のエンティティでありうる。いくつかの例においては、記録管理システムは、一意の識別子（例えば、ユーザー名、ユーザーアカウント、ユーザーＩＤなど）により、ユーザーを識別することができる。ユーザーの振る舞いなどの、ユーザーのユーザー固有の情報は、ユーザーの一意の識別子と関連付けることができると共に、１つ又は複数のデータベース内において保存することができる。

[0054] サーチクエリ１０２は、システムによって提供されるユーザーインターフェイスを介して、ユーザーが提供することができる。ユーザーインターフェイスは、グラフィカルユーザーインターフェイス（ＧＵＩ：Graphical User Interface）及び／又はウェブに基づいたインターフェイスであってもよい。ユーザーインターフェイスは、サーチクエリを受け取るための入力フィールド（例えば、グラフィカルな矩形のボックス）を有することができる。システムは、例えば、ユーザー装置のディスプレイ（例えば、電子ディスプレイ）上においてユーザーインターフェイスを表示することができる。ディスプレイは、別個のものでありうると共に、ユーザー装置に通信自在に結合することができる。ユーザー装置は、例えば、モバイル装置（例えば、スマートフォン、タブレット、ページャ、パーソナルデジタルアシスタント（ＰＤＡ：Personal Digital Assistant））、コンピュータ（例えば、ラップトップコンピュータ、デスクトップコンピュータ、サーバー）、及び／又はウェアラブル装置（例えば、スマートウォッチ）であってもよい。また、ユーザー装置は、例えば、セットトップボックス、テレビ受像機、ビデオゲームシステム、又はデータを提供又はレンダリングする能力を有する任意の電子装置などの、任意のその他のメディアコンテンツプレーヤーを含みうる。ユーザー装置は、任意選択により、携帯型であってもよい。ユーザー装置は、ハンドヘルド型であってもよい。ユーザー装置は、ローカルエリアネットワーク（ＬＡＮ：Local Area Network）、インターネットなどのワイドエリアネットワーク（ＷＡＮ：Wide Area Network）、電気通信ネットワーク、データネットワーク、或いは、ネットワークの任意のその他のタイプ（例えば、エクストラネット、イントラネットなど）などの、ネットワークに接続する能力を有するネットワーク装置であってもよい。

[0055] ユーザー装置は、本明細書において記述されている１つ又は複数の動作を実行するためのコード、ロジック、又は命令を有する一時的ではないコンピュータ可読媒体を有しうるメモリストレージユニットを有することができる。ユーザー装置は、例えば、一時的ではないコンピュータ可読媒体に従って１つ又は複数のステップを実行する能力を有する１つ又は複数のプロセッサを有することができる。ユーザー装置は、ユーザー対話型装置を介して、サーチクエリなどの、入力を受け付ける能力を有することができる。このようなユーザー対話型装置の例は、キーボード、ボタン、マウス、タッチスクリーン、タッチパッド、ジョイスティック、トラックボール、カメラ、マイクロフォン、モーションセンサ、熱センサ、慣性センサ、又は任意のその他のタイプのユーザー対話型装置を含みうる。ユーザー装置は、記録管理システムによって提供されるソフトウェア又はアプリケーションを実行する及び／又は記録管理システムによって提供されるユーザーインターフェイスにアクセスする能力を有することができる。ユーザー装置は、更に後述するコンピュータ制御システムでありうる。ユーザー装置は、サーバー、データネットワーク（例えば、クラウド演算ネットワークなど）、又はデータベースなどの、その他のコンピュータシステム、又はその１つ又は複数のコンポーネント、と通信する能力を有することができる。

[0056] サーチクエリ１０２は、テキストの形態（例えば、ストリング）でありうる。サーチクエリは、自然言語において提供することができる。いくつかのケースにおいては、テキストクエリは、音声－テキスト変換を介して提供することができる。クエリは、ストリングの形態において提供することができる。クエリは、ハイパーリンク（例えば、ＵＲＬ）を含みうる。いくつかの例においては、ストリングは、約１０００文字、５００文字、４００文字、３００文字、２００文字、１５０文字、１４０文字、１３０文字、１２０文字、１１０文字、１０００文字、５０文字、４０文字、３０文字、２０文字、１０文字、又はこれら未満の文字限度を有することができる。或いは、この代わりに、ストリングは、１０００個超の文字を有することもできる。ストリングは、文字制限を有していなくてもよい。いくつかの例においては、クエリは、約１０００ワード、５００ワード、４００ワード、３００ワード、２００ワード、１５０ワード、１００ワード、５０ワード、４０ワード、３０ワード、２０ワード、１０ワード、又はこれら未満のワード限度を有することができる。或いは、この代わりに、クエリは、１００超のワードを有することもできる。クエリは、ワード制限を有していなくてもよい。クエリは、英語及び非英語言語を含む、任意の言語におけるものであってもよい。

[0057] ユーザー提供のサーチクエリ１０２がシステムに提供された際に、システムは、サーチクエリを改善するべく、サーチクエリの初期処理１０６を開始することができる。初期処理において、システムは、関連するＮＬＰモデルに対応する１つ又は複数のキーワードを付加することにより、サーチクエリを改善するべく、サーチクエリ又はサーチクエリのコンポーネントを潜在的に関連する自然言語処理（ＮＬＰ）モデルにマッチングさせることができる。後述するように、サーチクエリは、ＮＬＰモデルのライブラリに照らしてマッチングさせることができる。

[0058] ＮＬＰモデルは、構文（例えば、文法）、意味論（例えば、意味）、語用論（例えば、目的、目標、意図）、及び／又は言語学のその他の単位（例えば、様々な語彙関係）などの、人間の自然言語を学習、解釈、及び理解する能力を有することができる。ＮＬＰモデルは、１つ又は複数のＮＬＰ及び／又は自然言語理解（ＮＬＵ：Natural Language Understanding）技法を利用することができる。ＮＬＰモデルは、限定を伴うことなしに、サーチの反復の数又はその他のユーザーのやり取りの数などの、反復の数の増大に伴って、相対的に正確なものになりうる。

[0059] いくつかの例においては、ＮＬＰモデルは、機械学習及び／又は深層学習の大規模な統計的方式などの、分散型の方式を採用することができる。例えば、分散型の方式により、コンテンツをワードベクトルに変換することが可能であり、且つ、例えば、ワードの間の関係を理解するべく、数学的分析を実行することができる。分散型のＮＬＰモデルは、エンドツーエンド注意メモリネットワーク及びジョイントマルチタスクモデルなどのニューラルネットワークモデルを含むことができる。いくつかの例においては、ＮＬＰモデルは、コンテンツを解析すると共にフレームパラメータを入力することにより、意味的に同一のもの（例えば、但し、構文又は語用的には異なっているもの）をフレーム（或いは、データ構造）にフレーム化するなどの、フレームに基づいた方式を採用することができる。いくつかの例においては、ＮＬＰモデルは、モデル－理論的方式（model-theoretical approach）を採用することができる。モデル－理論的方式は、組成へのコンテンツの意味論的解析、組成の再組合せ、及び実行を実行することができる。モデル－理論的方式は、人間による監督を受けることができると共に、フルワールド表現、豊富な意味、エンドツーエンド処理、及び難しく且つ微妙なサーチクエリの理解が可能となることから利益を享受することできる。いくつかの例においては、ＮＬＰモデルは、対話型の学習方式を採用することができる。対話型の学習ＮＬＰモデルは、人間とやり取りすることが可能であり、且つ、このようなやり取りに少なくとも部分的に基づいて、人間の自然言語を徐々に学習することができる。例えば、対話型の学習モデルは、同一の動作を実行するべく、或いは、同一の結果をもたらすべく、一貫性を有する方式で使用されている言語を同一の動作又は同一の結果のための正しい言語であるとして解釈することができる。或いは、この代わりに、又はこれに加えて、ＮＬＰモデルは、自然言語を学習、解釈、及び／又は理解するべく、異なる方式を採用することもできる。いくつかの例においては、ＮＬＰモデルは、異なる方式の組合せでありうる。

[0060] 初期処理１０６においては、サーチクエリ１０２及び／又はそのコンポーネント（例えば、トークン）をＮＬＰモデルのライブラリに照らして評価することができる。ＮＬＰモデルは、ＮＬＰモデルライブラリ内において保存することができる。ＮＬＰモデルライブラリは、１つ又は複数のデータベース内などのように、コンピュータシステム（例えば、サーバー）のメモリ内において保存することができる。ＮＬＰモデルライブラリは、更に後述するように、グラフデータベース１３０内において保存することができる。コンピュータシステムは、クラウド演算ネットワークなどの、データネットワークを有していてもよく、及び／又はこれとの通信状態にあってもよい。いくつかの例においては、１つ又は複数のデータベース（例えば、グラフデータベース）は、データネットワーク内において保存されていてもよく、及び／又はこれとの通信状態にあってもよく、且つ、コンピュータシステムは、このような１つ又は複数のデータベースにデータネットワークを介してアクセスすることができる。いくつかの例においては、ＮＬＰモデルライブラリは、少なくとも１つ、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０個、１５個、２０個、２５個、３０個、３５個、４０個、４５個、５０個、１００個、２００個、３００個、４００個、５００個、１０００個、又はこれらを上回る数のＮＬＰモデルを有することができる。いくつかの例においては、ＮＬＰモデルライブラリは、最大で約１０００個、５００個、４００個、３００個、２００個、１００個、５０個、４５個、４０個、３５個、３０個、２５個、２０個、１５個、１０個、９つ、８つ、７つ、６つ、５つ、４つ、３つ、２つ、又は１つのＮＬＰモデルを有することができる。

[0061] ＮＬＰモデルは、１つ又は複数のキーワード又はキーワードの１つ又は複数の組に対応することができる。ＮＬＰモデルは、１つ又は複数の用語又は用語の１つ又は複数の組に対応することができる。いくつかの例においては、ＮＬＰモデルは、少なくとも約１つ、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０個、１５個、２０個、２５個、３０個、３５個、４０個、４５個、５０個、１００個、２００個、３００個、４００個、５００個、１０００個、又はこれらを上回る数のキーワード（又は、用語）、或いは、キーワード（又は、用語）の組に対応することができる。いくつかの例においては、ＮＬＰモデルは、最大で約１０００個、５００個、４００個、３００個、２００個、１００個、５０個、４５個、４０個、３５個、３０個、２５個、２０個、１５個、１０個、９つ、８つ、７つ、６つ、５つ、４つ、３つ、２つ、又は１つのキーワード（用語）、或いは、キーワード（又は、用語）の組に対応することできる。

[0062] 例えば、キーワードに基づいたクエリは、１つ又は複数のトークンにトークン化することができる。トークンは、キーワードでありうる。トークンは、トピックでありうる。トークンは、語彙関係でありうる。トークンは、任意の語彙のサブ単位（例えば、段落、文章、単語、文字、発話の一部、意味、構文、語用、キーワードなど）でありうる。システムは、トークン化されたクエリをＮＬＰモデルのライブラリに照らして評価することができる。いくつかの例においては、例えば、システムは、トークン化されたクリエ内のトークンをＮＬＰモデル内のキーワード又はキーワードの組と比較することができる。

[0063] システムは、トークン化されたクエリに対応する１つ又はＮＬＰモデルを判定することができる。いくつかの例においては、サーチクエリは、少なくとも約１つ、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０個、１５個、２０個、２５個、３０個、３５個、４０個、４５個、５０個、１００個、又はこれらを上回る数のＮＬＰモデルに対応することができる。いくつかの例においては、サーチクエリは、最大で約１００個、５０個、４５個、４０個、３５個、３０個、２５個、２０個、１５個、１０個、９つ、８つ、７つ、６つ、５つ、４つ、３つ、２つ、又は１つのＮＬＰモデルに対応することできる。

[0064] 上述のように、ＮＬＰモデルライブラリは、グラフデータベース１３０内において保存することができる。グラフデータベースは、ＮＬＰモデル及びＮＬＰモデルの間の近接性関係を有することができる。図２は、ＮＬＰモデルライブラリのグラフデータベース２００の一部分を示している。グラフデータベース２００は、第１のＮＬＰモデル２０２、第２のＮＬＰモデル２０４、第３のＮＬＰモデル２０６、第１のＮＬＰモデル２０２と第２のＮＬＰモデル２０４の間の第１の近接性関係２０８、並びに、第１のＮＬＰモデル２０２と第３のＮＬＰモデル２０６の間の第２の近接性関係２１０を有することができる。グラフデータベースは、任意の数のＮＬＰモデルを有することができる。いくつかの例においては、グラフデータベースは、すべてのＮＬＰモデルをＮＬＰモデルライブラリ内において有することができる。いくつかの例においては、グラフデータベースは、いくつかのＮＬＰモデルのみをＮＬＰモデルライブラリ内において有することができる。いくつかの例においては、複数のグラフデータベースは、個々に又は集合的に、ＮＬＰモデルライブラリ内においてＮＬＰモデルを保存することができる。

[0065] ＮＬＰモデル（例えば、ＮＬＰモデル２０２、２０４、２０６など）の間の近接性関係（例えば、近接性関係２０８、２１０など）は、ＮＬＰモデルの間の関連性レベルを定義することができる。近接性関係は、任意の２つのＮＬＰモデルの間のものでありうる。近接性関係は、ＮＬＰモデルの任意の組合せの間におけるものでありうる。関連性レベルは、重み値によって表すことができる。重み値は、ＮＬＰモデルの間の近接性の程度を通知することができる。例えば、相対的に大きな重み値は、相対的に小さな重み値よりも高度な近接性に対応しうる。重み値は、２値（例えば、近接していない、或いは、近接しているに対応する０又は１）でありうる。重み値は、任意のスケール（例えば、０～１、０～５、０～１０、０～１００、５０～１００など）を有することができる。例として、重み値スケールが０～１である場合に、第１のＮＬＰモデル２０２と第２のＮＬＰモデル２０４の間の第１の近接性関係２０８は、０．７の重み値を有することができる。第１のモデル２０２と第３のモデル２０６の間の第２の近接性関係２１０は、０．８の重み値を有することができる。この例においては、第１のＮＬＰモデル２０２は、第３のＮＬＰモデル２０６よりも第２のＮＬＰモデル２０４に近接している可能性がある。また、有益には、２つのＮＬＰモデルの間の近接性関係は、２つのＮＬＰモデルに属するキーワードの間の近接性関係をも通知することができる。或いは、この代わりに、又はこれに加えて、重み値のために、その他のスコアリングシステム又はスケール（例えば、百分率、５、１０、１００などの異なる最大値から逸脱、０又は１などの２値など）を使用することもできる。

[0066] いくつかの例においては、近接性関係は、重み値が、例えば、０．８、８０％、８０／１００などの、閾値レベル、或いは、別の対応するスケールにおけるその他の対応する値、以上である場合にのみ、２つのＮＬＰモデルの間に存在しうる。或いは、この代わりに、近接性関係は、重み値が、（０．８又は対応するスケールにおける対応する値以外の）別の値以上である場合にのみ、２つのＮＬＰモデルの間に存在しうる。いくつかの例においては、近接性関係は、例えば、重み値が、２つのＮＬＰモデルの間に関連性がほとんど又はまったく存在していないことを表す０である場合にも、任意の２つのＮＬＰモデルの間に存在しうる。

[0067] 図１を再度参照すれば、システムがサーチクエリ１０２に対応する１つ又は複数のＮＬＰモデルを判定したら、システムは、サーチクエリに対応する１つ又は複数のＮＬＰモデルに近接しているその他のＮＬＰモデルについてＮＬＰモデルライブラリグラフ１３０をサーチすることができる。例えば、システムは、既定の閾値（例えば、０．５、０．６、０．７、０．８、０．９、０．９５、０．９９など）超の近接性関係重み値を有するその他のＮＬＰモデルを選択することができる。別の例においては、システムは、サーチクエリに対応する１つ又は複数のＮＬＰモデルに最も近接した特定数（例えば、５つ、６つ、７つ、８つ、９つ、１０個など）のＮＬＰモデルを選択することができる。キーワードサーチであるサーチクエリの場合には、システムは、ユーザー提供のサーチクエリ内において元々存在していないその他のＮＬＰモデル内の１つ又は複数のキーワード又はキーワードの組を付加することができる。有益には、サーチクエリは、ユーザーによって元々想定されていないが、依然として、関連している、キーワード及び／又はキーワードの組により、改善することができる。

[0068] また、いくつかの例においては、初期処理１０６において、類似のクエリにおいて頻繁に使用されている任意の関連するキーワードをサーチクエリ１０２に付加することもできる。例えば、システムは、類似のクエリにおいて頻繁に使用されている任意の関連するキーワードを付加することにより、サーチクエリを改善することができる。クエリの類似性は、更に後述する知識グラフなどを介して様々なエンティティ（例えば、記録、ユーザー、専門分野など）の間の関係を分析することにより、判定することできる。

[0069] システムは、クエリタイプを判定することにより、サーチクエリ１０２用の実行方法を解明することができる１０８。クエリタイプは、クエリをサブミットしたユーザーの意図のタイプを識別することができる。いくつかの例においては、クエリタイプは、クエリの分類のタイプでありうる。例えば、クエリタイプは、「who（だれ）」形態、「what（なに）」形態、「when（いつ）」形態、「where（どこ）」形態、「how（どのように）」形態、「why（なぜ）」形態、「list（リスト）」形態、又はその他の形態でありうる。クエリタイプに応じて、異なる改善のメカニズム（例えば、ＮＬＰに基づいたもの、ユーザーの振る舞いに基づいたもの、異なるエンティティの間の関係に基づいたものなど）を使用することができる。

[0070] クエリタイプは、予めトレーニングされたショートテキストＮＬＰモデルによって判定することができる。例えば、モデル定義は、キーワード及び発話の一部のタグのシーケンスとして定義することができる。発話の一部のタグは、発話の一部によってタグ付けされたテキスト（例えば、普通名詞、複数形の普通名詞、固有名詞、法助動詞、動詞の基本形、形容詞、比較級形容詞など）を有することができる。例として、「looking/VBG, for/IN, [NN], … , in/IN, [NN], …」という定義は、VBG（動詞動名詞）、IN（前置詞又は従属接続詞）、及びNN（普通名詞）というタグを有することができる。図３には、その他の発話の一部のタグの例が示されている。発話の一部のタグは、図３に示されているものに限定されるものではない。ＮＬＰモデルは、クエリタイプの認識のみならず、サーチクエリ内の情報の抽出のために使用することもできる。修飾サーチ（qualified search）などの、いくつかのサーチ方法は、ユーザー提供のサーチクエリから抽出された情報に依存しうると共に、抽出された情報に基づいた分類法コンポーネント又はその他のフィルタリング基準を含むことができる。

[0071] 一例として、発話の一部のタグが付与されたパターンは、「[NN] [VBG] tax/NN records/NNS」でありうる。このケースにおいては、第１のトークンは、非修飾名詞「[NN]」に、非修飾動詞「[VBG]」及び２つの修飾名詞「tax/NN」及び「records/NNS」が後続するものである。ユーザーは、パターンの合計重みが１となるようなパターンにおいて、それぞれのトークンごとに重みを定義することができる。トークン重みは、特定のパターンが、ＮＬＰモデル定義の最小閾値スコアと比較されうるパターン近接性スコアを判定するべく、スコアリングされる方式を決定することができる。以前の例を継続すれば、重み定義を有する同一のパターンは、「[NN-0.2] [VBG-0.1] tax/NN-0.4 records/NNS-0.3」であることが可能であり、この場合に、[NN]という非修飾名詞は、０．２の重みを有し、[VBG]という非修飾動詞は、０．１の重みを有し、「tax/NN」という修飾名詞は、０．４の重みを有し、且つ、「records/NNS」という修飾名詞は、０．３の重みを有する。ユーザーは、０．８などの、パターンに準拠するものとしてのテキストの受け付けのための最小閾値を更に定義することができる。１という相対的に厳格な最小閾値は、テキストが発話の一部のパターンに正確に準拠することを必要としうる。いくつかの例においては、０という最小閾値は、分類方法が、発話の一部のタグが付与されたパターンに対する準拠とは無関係に、任意のパターンのテキストを受け付けることを許容しうる。ユーザーは、任意の最小閾値を定義することができる。

[0072] システムは、サーチクエリテキストを発話の一部のタグによって自動的にタグ付けすることができる。タグ付けの後に、テキストは、キーワード及び発話の一部のタグを含むトークンにトークン化することができる。例えば、「information containing tax records」というテキストは、タグ付けすることが可能であり、且つ、「information/NN, containing/VBG, tax/NN, records/NNS」にトークン化することができる。テキストがタグ付けされ、且つ、トークン化されたら、システムは、ＮＬＰモデル内において定義されているパターンがテキスト内に存在しているかどうかを判定することにより、テキストをスコアリングすることができる。テキストは、個々のトークンと比較することができる。１つ又は複数の個々のトークンがマッチングしている場合には、パターン近接性スコアを判定するべく、パターン内の個々のトークンと関連している重みを集計することができる。すべてのトークンが処理されたら、パターン近接性スコアを最小閾値と比較することができる。いくつかの例においては、パターン近接性スコアが最小閾値以上である場合には、クエリをＮＬＰモデルのクエリタイプに分類することができる。

[0073] 図４は、サンプルクエリ及びその対応するクエリタイプを示している。例えば、「I need tax audit records」というサンプルサーチクエリは、クエリ内の発話の一部の「I need」パターンに少なくとも部分的に基づいて「what」のクエリタイプを有するものと判定することができる。別の例においては、「I need to audit tax records」というサンプルサーチクエリは、クエリ内の発話の一部の「I need to」パターン及びキーワードに少なくとも部分的に基づいて「how」のクエリタイプを有するものと判定することができる。別の例においては、「looking for tax forms in box 123」というサンプルサーチクエリは、クエリ内の発話の一部の「looking for」パターン及びキーワードに少なくとも部分的に基づいて「what qualified」のクエリタイプを有するものと判定することができる。別の例においては、「content of box 123」というサンプルサーチクエリは、クエリ内の発話の一部の「content of」パターン及びキーワードに少なくとも部分的に基づいて「list」のクエリタイプを有するものと判定することができる。

[0074] いくつかの例においては、クエリタイプ用のＮＬＰモデル定義は、以前のサーチから取得されたトレーニングデータからなどのように、それぞれのサーチの反復によってトレーニングすることができる。或いは、この代わりに、クエリタイプは、その他のＮＬＰモデルによって判定することもできる。

[0075] 異なるクエリタイプは、異なる実行方法に対してマッピングすることができる。いくつかの例においては、クエリタイプは、１つの実行方法に対してのみマッピングすることができる。いくつかの例においては、クエリタイプは、複数の実行方法に対してマッピングすることができる。いくつかの例においては、実行方法は、複数のクエリタイプに対してマッピングすることができる。クエリタイプが複数の実行方法にマッピングされる場合には、それぞれの実行方法によって検索されたサーチ結果を相対的な優先順位重み値によって重み付けすることができる。クエリタイプ、対応する実行方法、及び相対的な優先順位重み値は、システムの１つ又は複数のデータベース内などのように、クエリタイプレジストリ内において保存することができる。いくつかの例においては、すべてのクエリタイプ－実行方法のペアは、０の優先順位重み値を有するペアの場合にも、レジストリ内において保存することができる。その他の例においては、既定の閾値超の優先順位重み値（例えば、０．５、０．６、０．７、０．８、０．９、０．９５、０．９６、０．９７、０．９８、０．９９など）を有するクエリタイプ－実行方法のペアのみをレジストリ内において保存することができる。クエリタイプを実行するのに特に適した実行方法は、その他の実行方法よりも大きな優先順位重み値を有しうる。例えば、「what」形態を有するクエリタイプは、ユーザー振る舞いサーチよりもキーワードサーチに適する可能性があり、且つ、従って、「search_engine」実行方法が、「knowledge_graph」実行方法よりも大きな重み値を有しうる。別の例においては、「how」形態は、「search_engine」実行方法よりも「knowledge_graph」実行方法に適する可能性がある。

[0076] 図５は、サンプルクエリタイプレジストリを示している。クエリタイプレジストリ５００は、クエリタイプ列５０２、優先順位重み列５０４、及び実行方法列５０６を有することができる。いくつかの例においては、サーチクエリは、複数の方法、サーチ集合体、及びデータストアを使用することにより、実行することができる。優先順位重み値は、サーチクエリ用の実行方法を使用して検索されたサーチ結果に対して適用される優先順位係数を表することができる。例えば、クエリタイプレジストリ５００の場合に、サーチクエリのクエリタイプが「list」であり、且つ、サーチ結果を検索するべく、「search_engine」方法及び「knowledge_graph」方法の両方が使用される場合には、「search_engine」方法を使用して検索されるサーチ結果の部分を「０．６」という優先順位重み値によって重み付けすることが可能であり、且つ、「knowledge_graph」方法を使用して検索されるサーチ結果の部分を「０．８」という優先順位重み値によって重み付けすることができる。有益には、組み合わせられたサーチ結果が関連性などによってソートされる際には、相対的な優先順位重み値によって相対的に関連しているものと推測される「knowledge_graph」方法を使用して検索されたサーチ結果を「search_engine」方法を使用して検索されたサーチ結果よりも高い優先順位において提示することができる。或いは、この代わりに、又はこれに加えて、異なる優先順位重み及び／又は係数スコアリングシステム及び／又はスケールを適宜使用することができる。

[0077] クエリタイプレジストリは、手作業で定義することができる。例えば、当初、なんらかのサーチ反復がシステムによって実行される前に、実行方法をクエリタイプに手作業でマッピングすることが可能であり、且つ、優先順位重みをそれぞれのクエリタイプ－実行方法のペアごとに手作業で割り当てることができる。但し、例えば、ユーザーの振る舞いに基づいたサーチ結果の実際の優先順位に関するデータ（例えば、サーチ結果の実際の図など）などの、十分なトレーニングデータがサーチ反復から収集された後には、レジストリが、半教師付き状態となるように、或いは、場合によっては、教師付き状態とならないように、フィードバックループアルゴリズムなどを介して、クエリタイプレジストリを更新することができる。それぞれのサーチ反復は、トレーニングデータをもたらすことができる。例えば、十分なトレーニングデータにより、限られた手作業による介入を伴って、或いは、場合によっては、これを伴うことなしに、レジストリを更新することができる及び／又はレジストリは、動作することができる。いくつかの例においては、既定の実行方法は、従来のサーチエンジン（例えば、「search_engine」方法）でありうる。

[0078] 図１を再度参照すれば、システムは、ユーザーの振る舞いに基づいてサーチクエリ１０２を改善することができる１１０。ユーザー振る舞いフィードバックループ１５０は、特定のユーザーからの学習済みのユーザーの振る舞い１６０に関するデータを生成することができる。ユーザー振る舞いフィードバックループは、特定のユーザーにおけるユーザー提供のサーチクエリのすべての以前の改善に関係する情報のみならず、特定のサーチ結果との間における特定のユーザーのやり取りに関係する情報をも収集することができる。サーチ結果との間におけるユーザーのやり取りは、例えば、記録が選択されたのか又は選択されなかったのか、選択された記録を閲覧するべく使用された時間、記録内においてユーザーが実行したスクロール又はページングの程度、及びその他のやり取りでありうる。また、いくつかの例においては、システムは、いずれの記録が、一緒にアクセスされたのか、及び／又はユーザーの同一のサーチセッションにおいてアクセスされたのかに関する情報を収集することもできる。このような情報によれば、システムは、ユーザーの関心のエリアを判定することができる。ユーザーによる後続のクエリを改善することができると共にユーザーの振る舞い及び／又はユーザーの関心エリアに対して個人化することができる。

[0079] 図６は、ユーザー振る舞いフィードバックループの一例を示している。ユーザー振る舞いフィードバックループ６００は、ユーザーの個人的なサーチの好み及び関心のエリアを微細チューニングすることができる。このプロセスは、ユーザーが、サーチクエリ６００を提供し、サーチクエリに応答してサーチ結果を受け取り、且つ、サーチ結果内の特定の項目をクリックすることにより６０７、始まっている。サーチクエリは、本明細書のどこか別の場所において記述されているように、サーチクエリ自体の改善などのために６０１、実行される前に、分類法抽出６０２を経験することができる。同様に、いくつかの記録は、自身と関連する分類法項目を有することができる６０８。フィードバックループのプロセスにおいて、システムは、サーチクエリ及びユーザーがクリックした結果項目の両方から抽出された分類法に関する情報を収集することが可能であり、且つ、この情報を時系列で保存することができる６０６。時系列データは、それぞれのユーザーごとに、３か月分以下のデータを含むことができる。例えば、３か月よりも旧いすべてのデータは、削除することができる。その他の例においては、時系列データは、（例えば、数分、数時間、数日、数か月、数年、数１０年などの程度の）その他の持続時間のデータを含むことができる。この期限切れの目的は、ユーザーの振る舞いの変化に対して流動的に適合するというものである。例えば、ユーザーは、１つの仕事から別の仕事に、及び／又は１つの部署から別の部署に、移動する場合があり、これにより、いくつかの相対的に旧いデータが、相対的に関連性を失うことになり、或いは、いくつかの例においては、完全に関連性を失うことになる。従って、システムは、そのサーチの改善を採用することができる。時系列データを調節モジュール６０５によって処理することができる。調節モジュールは、まず、すべての異常値を除去し、且つ、次いで、ユーザーごとに最も使用された分類法に関する頻度情報を収集することにより、時系列データを分析することができる。そして、ユーザーの好み及び関心のエリアを判定するべく、この情報を使用することができる６０４。即ち、ユーザーの好み及び／又は関心のエリアが判定されたら（された場合には）、システムは、このようなユーザーの好み及び／又は関心のエリアに対応する分類法項目をユーザーのサーチクエリに付加することができる。

[0080] 学習済みのユーザー振る舞いデータに基づいた改善により、有益には、サーチクエリ及び後続のサーチ結果を特定のユーザーに対して個人化することができる。

[0081] 図１を再度参照すれば、システムは、ユーザー、記録、及び専門分野の間などの、様々なエンティティの間の文脈的関係を有する知識グラフ１４０に基づいて、サーチクエリ１０２及び／又はサーチ結果１０４を改善することができる１１２。

[0082] 知識グラフ１４０は、記録及び／又は電子記録の属性との間におけるユーザーのやり取りを分析するなどにより、異なる記録の間の文脈的関係を有することができる。例えば、記録の間の文脈的関係は、例えば、同一の組織又は同一の部署内において働くことにより、或いは、同一の専門分野を共有することにより、関係付けられたユーザーにより、同一のサーチセッションにおいて頻繁にアクセスされる、一緒に共有される、閲覧される、或いは、コメントされる、同一のフォルダ又は同一のボックス内において存在し、同一のサーチ結果において頻繁に出現する、記録について、判定することができる。いくつかの例においては、ユーザーは、タグ及び／又はメタデータの形態などにおいて、電子記録に対する特定の属性を定義することができる。特定の属性は、ユーザー固有のものであってもよく、或いは、そうでなくてもよい。特定の属性は、記録の間の文脈的関係を定義するための分類法要素として使用することができる。記録の間の文脈的関係は、それぞれのサーチ反復の実行に伴うなどのように、時間に伴って変化しうる。例えば、異なるサーチセッションにおいて関係するユーザーによってコメントされた２つの記録の間の関係は、相対的に近接したものになりうる。

[0083] 知識グラフは、異なる記録の間のみならず、異なるユーザーの間、異なる専門分野の間、異なる記録及びユーザーの間、異なる記録及び専門分野の間、異なるユーザー及び専門分野の間、及び／又は異なるエンティティの間の、文脈的関係を保存することができる。有益には、知識グラフは、記録の文脈的関係及びネットワーク、並びに、記録とユーザーの間の文脈的関係及び活動の両方を有することができる。このような文脈的関係を保存することにより、電子記録と分類法コンポーネントの間の関係のみならず、ユーザーの振る舞いの集計された機械学習済みのコンポーネントと記録又は分類法コンポーネントに対するその関係の間の関係をも含む情報クラスタの生成を許容することができる。グラフデータ構造は、機械学習アルゴリズムを動作させることにより、且つ、記録の操作及び／又はサーチセッションの追加データにより、常に更新することができる。

[0084] 図７は、サーチ結果を改善するべく調査することができる様々なエンティティの知識グラフデータベースを示している。知識グラフデータベース７００は、第１の記録７０２、第２の記録７０４、第１のユーザー７０６、第２のユーザー７０８、及び第１の専門分野７１０というエンティティを有することができる。知識グラフデータベースは、第１の記録７０２と第１のユーザー７０６の間の第１の記録関係７１２、第２の記録７０４と第１のユーザー７０６の間の第２の記録関係７１４、第１の記録７０２と第２のユーザー７１６の間の第３の記録関係７１６、第１のユーザー７０６と第２のユーザー７０８の間の第１のユーザー関係７１８、及び第１のユーザー７０６と第１の専門分野７１０の間の専門家関係、という、様々なエンティティの間の関係を有することができる。

[0085] ユーザーと記録の間の記録関係（例えば、７１２、７１４、７１６）は、例えば、ユーザーによる記録の閲覧の回数、記録の著者、並びに、記録を検索するべくユーザーによって使用されたサーチクエリを有することができる。２つのユーザーの間のユーザー関係（例えば、７１８）は、例えば、関係のタイプ（例えば、同僚関係、家族関係、友人関係、職務上の関係など）を有することができる。知識グラフ８００内のすべての文脈的関係は、近接性値に対応することができる。近接性値は、任意の２つのエンティティの間の関係の関連性又は近接性を通知することができる。いくつかの例においては、知識グラフ内のすべての２つのエンティティは、近接性関係を有することができる。いくつかの例においては、知識グラフ内の２つのエンティティは、近接性値が既定の閾値（例えば、０．５、０．６、０．７、０．８、０．９、又はその他のスケールなど）以上である場合にのみ、近接性関係を有することができる。

[0086] 知識グラフ７００の調査の例として、第２のユーザー７０８によって実行されたサーチが第１の記録７０２を検索する場合には、少なくとも３つの経路により、第２の記録７０４を文脈によって検索することができる。第１の経路は、第１の記録７０２とその他のユーザーの間の記録関係を伴っている。第１の記録７０２は、第２の記録７０４をも閲覧した第１のユーザー７０６によって閲覧されていることから、システムは、第２のユーザー７０８について、第２の記録７０４を文脈的に検索することができる。第２の経路は、第２のユーザー７０８と第１のユーザー７０６の間のユーザー関係を伴っている。第２のユーザー７０８及び第１のユーザー７０６は、同僚関係を有していることから、システムは、第２のユーザー７０８について、第２のユーザーの同僚である第１のユーザー７０６も閲覧した第２の記録７０４を文脈的に検索することができる。別の例においては、第１の記録７０２及び第２の記録７０４は、記録間関係（inter-records relationship）（図示されてはいない）を有することが可能であり、且つ、システムは、この記録間関係に基づいて、第２のユーザー７０８について第２の記録７０４を文脈的に検索することができる。或いは、この代わりに、又はこれに加えて、任意の２つのエンティティの間の知識グラフ７００を調査するべく、文脈関係の任意の組合せを使用することができる。

[0087] いくつかの例においては、システムは、文脈的関係の近接性値が既定の閾値以上である場合にのみ、２つのエンティティの間の知識グラフ（例えば、ユーザー、記録、専門分野など）を調査することができる。いくつかの例においては、知識グラフの文脈的調査によって検索される記録の優先順位値は、知識グラフ内において調査される文脈的関係の近接性値に少なくとも部分的に基づいたものでありうる。サーチ結果において検索された複数の記録の優先順位値は、（例えば、関連性の）優先順位によってサーチ結果をソートするべく、使用することができる。

[0088] いくつかの例においては、知識グラフは、以前の動作において判定された文脈情報を有することができる。更に詳しくは、知識グラフは、分類法に関係する情報のみならず、（例えば、図６のユーザー振る舞いフィードバックループを介して）過去のユーザーの振る舞いの分析を通じて判定されたユーザーの好みをも有することができる。システムは、例えば、グラフに基づいたデータ構造を調査するための開始点を判定するべく、このような文脈情報を使用することができる。例えば、システムは、サーチクエリに最も近接した特定数（例えば、１つ、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０個、２０個、３０個、４０個、５０個など）の記録を識別することができる。識別された記録のそれぞれは、個々の調査の開始点として使用することができる。いくつかの例においては、システムは、記録の間の類似性スコアを判定する調査アルゴリズムを使用することができる。類似性スコアは、調査済みの文脈関係の近接性値に少なくとも基づいたものであってもよい。いくつかの例においては、上述の、知識グラフ検索の結果の優先順位値は、類似性スコアに少なくとも部分的に基づいたものでありうる。

[0089] いくつかの例においては、システムは、既定の閾値（例えば、０．７、０．８、０．９など）を上回る類似性スコアを有する更なる記録のみを検索することができると共に改善されたサーチ結果として提示することができる。或いは、この代わりに、又はこれに加えて、システムは、その分野の専門家が関連性を有するものとして識別した記録を改善済みのサーチ結果として検索してもよく、この場合に、このような関連性は、記録関係にある専門家ユーザーによる記録の閲覧回数によって判定され、且つ、次いで、ユーザーの専門は、ユーザーと専門分野の間の専門家関係の近接性値により、判定される。

[0090] 例えば、本明細書において記述されているシステム及び方法によって改善された改善済みのサーチクエリは、サーチを実行するべく、ディスパッチすることができる１１４。クエリマッパ及びリデューサ１７０は、例えば、レジストリなどからの、（例えば、実行方法の解明１０８などの）クエリタイプから予め判定された１つ又は複数の実行方法に基づいて、サーチクエリを異なる実行モジュールにルーティングしてもよく、（「search_engine」実行方法のための）サーチエンジン１７２として、（「knowledge_graph」実行方法について）知識グラフ１７４をサーチしてもよく、及び／又は（「records_graph」実行方法について）記録グラフ１７６をサーチしてもよい。記録グラフは、上述の知識グラフに類似したものであってもよいが、記録及び記録の間の文脈関係を有する。いくつかの例においては、記録グラフは、知識グラフのサブユニットでありうる。システムは、実行に基づいてサーチ結果１０４を検索することができる。

[0091] いくつかの例においては、システムは、「ホット（hot）」及び「コールド（cold）」記録を弁別することができる。ホット記録は、最近６か月以内においてアクセスされた記録でありうると共に、コールド記録は、最近６か月以内においてアクセスされてはいない記録でありうる。或いは、この代わりに、ホット及びコールド記録を分割する時間フレームは、直近の１秒、直近の１分、直近の１時間、直近の２時間、直近の３時間、直近の４時間、直近の６時間、直近の１２時間、直近の１日、直近の２日、直近の３日、直近の４日、直近の１週間、直近の２週間、直近の３週間、直近の１か月、直近の２か月、直近の３か月、直近の４か月、直近の１年、直近の２年、直近の３年、直近の４年、直近の５年、直近の１０年、或いは、任意のその他の時間フレームなどの、任意のその他の時間フレームでありうる。いくつかの例においては、システムは、ホット記録のみを検索してもよい。有益には、ユーザーは、その他のユーザーがアクセスするべく十分な関連性を少なくとも有するものと既に見出した結果をすることができる。ユーザーは、コールド記録を更に検索するべく、サーチを反復するための選択肢を有することができる。例えば、ディスプレイなどの、結果をユーザーに提示するグラフィカルユーザーインターフェイス上において、システムは、ユーザーがサーチをトリガするべくやり取りしうる、ユーザー対話型オブジェクト（例えば、ボタン、スライダなど）を提供することができる。

[0092] 検索されたサーチ結果１０４は、その後、記録について割り当てられた優先順位値などにより、ソートすることができる。検索されたサーチクエリとの関係における、サーチクエリ、トークン化されたサーチクエリ、改善されたサーチクエリ、サーチ結果、改善されたサーチ結果、及びユーザー活動を含む、サーチセッションは、１つ又は複数のデータベース（例えば、知識グラフ、記録グラフ、トレーニングデータなど）内などにおいて、システムによって保存することができる。

[0093] 図１との関係における改善動作などの、本明細書において記述されている動作は、必ずしも、それらが記述されている順序において実行する必要はないことを理解されたい。例えば、知識グラフに基づいた改善は、ユーザーの振る舞いに基づいた改善の前に実行することができる。別の例においては、クエリが、ＮＬＰモデル、知識グラフ、及び／又はユーザーの振る舞いのうちの１つ又は複数を介して改善された後に、実行方法を解明することができる。システム及び方法は、流動的なものでありうる。

[0094] 図８は、本開示のシステム及び方法によるサンプルクエリ及び処理方法を示している。ユーザー生成されたクエリのクエリタイプは、例えば、図４を参照して記述されている、発話の一部に基づいたＮＬＰモデルを適用するなどにより、識別することができる。例えば、「I need tax audit records」というクエリは、「I need」という発話の一部のパターンに少なくとも部分的に基づいて「what」のクエリタイプとして識別することができる。「I need tax audit records」というクエリは、「I need to」という発話の一部のパターンに少なくとも基づいて「how」のクエリタイプとして識別することができる。「looking for tax forms in box 123」というクエリは、「looking for」という発話の一部のパターンに少なくとも基づいて「what qualified」のクエリタイプとして識別することができる。システムは、例えば、キーワードを判定するべく、クエリに対して分類法抽出を実行することができる。いくつかの例においては、分類法抽出は、正規表現（例えば、regex）及び／又は発話の一部のパターンに基づいたものでありうる。例えば、「looking for tax forms in box 123」というクエリは、修飾クエリタイプについて「box 123」という分類法コンポーネントを抽出することができる。

[0095] システムは、ＮＬＰモデルライブラリを有するグラフデータベースなどを介してサーチクエリをＮＬＰモデルライブラリにマッチングすることにより、クエリタイプの文脈を判定することができる。「I need tax audit records」というクエリの場合には、システムは、「options for tax」、「corporate tax」、及び「employee tax」という文脈を判定することができる。「looking for tax forms in box 123」というクエリの場合には、システムは、「options for tax」、「corporate tax」、及び「employee tax」という文脈を判定することができる。

[0096] システムは、クエリをサブミットしたユーザーに固有の使用法パターンを判定することができる。いくつかの例においては、システムは、本明細書のどこか別の場所において記述されているユーザー振る舞いフィードバックループを実行することができる。例えば、上述の３つのクエリサンプルを有するすべての３つのユーザーを企業金融において働いているものと識別することができると共に、システムは、「corporate tax（法人税）」の文脈に対して相対的に大きな重みを付与することを推奨することができる。

[0097] システムは、クエリタイプ、抽出された分類法、文脈、及び／又はサンプルクエリの使用法パターンに少なくとも部分的に基づいてサンプルクエリを改善することができる。例えば、「what」クエリタイプを有する「I need tax audit records」というクエリの場合に、システムは、（例えば、語彙辞書から）相対的に良好な同義語又はクエリの文脈に関係するオリジナルのクエリ内において含まれていない任意の更なるキーワードを識別することができる。例えば、これらのキーワードは、クエリについて識別された文脈ＮＬＰモデルに近接したＮＬＰモデルから識別することができる（例えば、「options for tax」、「corporate tax」、「employee tax」など）。例として、システムは、「IRS filings」というキーワードをオリジナルのクエリに付加することができる。別の例においては、「how」クエリタイプを有する「I need to audit tax audit records」というクエリの場合に、システムは、クエリを最良に実行するべく使用される分類法コンポーネントを識別することができる。例として、システムは、サーチの時点において使用される記録共有活動及び分類法を利用することができる。更に別の例においては、「what qualified」クエリタイプを有する「looking for tax forms in box 123」というクエリタイプの場合に、システムは、「box 123」という抽出された分類法コンポーネントの分類法フィルタを追加することができる。サーチは、クエリタイプにマッピングされた実行方法に基づいて実行することができる。例えば、「what」及び「what qualified」クエリタイプの場合に、キーワードタイプサーチ（例えば、「search_engine」方法）は、グラフタイプサーチ（例えば、「knowledge_graph」方法や「records_graph」方法など）よりも大きな重み（例えば、相対的に大きな優先順位重み値）を有することができる。別の例においては、「how」クエリタイプの場合に、グラフタイプサーチ（例えば、「knowledge_graph」方法や「records_graph」方法など”は、キーワードタイプサーチよりも大きな重みを有することができる。

[0098] いくつかの例においては、クエリの受け取り、初期処理、実行方法の解明、ユーザーの振る舞いに基づいた改善、ユーザー振る舞いフィードバックループの実行、サーチクエリの改善、サーチのディスパッチ、クエリのマッピング及び／又は低減、サーチの実行、サーチ結果の供給、及びその他の動作などの、本明細書において記述されている動作は、（例えば、プロセッサ及びメモリを有する）１つ又は複数のモジュールによって実行することができる又は稼働させることができる。１つ又は複数のモジュールは、個々に又は集合的に、本開示の動作又は動作の組合せを実行することができる。モジュールは、コンピュータシステムでありうる。

コンピュータ制御システム
[0099] 本開示は、本開示の方法を実装するべくプログラミングされるコンピュータ制御システムを提供している。図９は、その他の動作の加えて、クエリの受け取り、クエリの初期処理、クエリタイプの判定、クエリタイプ用の実行方法の解明、ユーザーの振る舞いに基づいたクエリの改善、ユーザー振る舞いフィードバックループの実行、知識グラフに基づいたクエリの改善、グラフデータベースの保存及びナビゲーション、サーチのディスパッチ、クエリのマッピング、及び／又は低減、サーチの実行、サーチ結果の供給、サーチ結果のフィルタリング及び／又はソート、トレーニングデータの保存及びこれからの学習のためにプログラミングされる又はその他の方法で構成されるコンピュータシステム９０１を示している。コンピュータシステム９０１は、ユーザーの電子装置でありうるか、又は電子装置との関係において遠隔配置されたコンピュータシステムでありうる。電子装置は、モバイル電子装置でありうる。

[0100] コンピュータシステム９０１は、中央処理ユニット（ＣＰＵであり、本明細書においては、「プロセッサ」及び「コンピュータプロセッサ」とも呼称される）を含み、中央処理ユニットは、シングルコア又はマルチコアのプロセッサ、或いは、並列処理用の複数のプロセッサ、でありうる。プロセッサ９０５は、コントローラ、マイクロプロセッサ、及び／又はマイクロコントローラでありうる。また、コンピュータシステム９０１は、メモリ又はメモリ場所９１０（例えば、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ）、電子ストレージユニット９１５（例えば、ハードディスク）、１つ又は複数のその他のシステムと通信するための通信インターフェイス９２０（例えば、ネットワークアダプタ）、並びに、キャッシュ、その他のメモリ、データストレージ、及び／又は電子表示アダプタなどの、周辺装置９２５をも含む。メモリ９１０、ストレージユニット９１５、インターフェイス９２０、及び周辺装置９２５は、マザーボードなどの、通信バス（実線）を通じて、ＣＰＵ９０５との通信状態にある。ストレージユニット９１５は、データを保存するためのデータストレージユニット（或いは、データリポジトリ）でありうる。コンピュータシステム９０１は、通信インターフェイス９２０の支援により、コンピュータネットワーク（「ネットワーク」）９３０に動作自在に結合することができる。ネットワーク９３０は、インターネット、インターネット、及び／又はエクストラネント、或いは、インターネットとの通信状態にあるイントラネット及び／又はエクストラネットでありうる。いくつかのケースにおけるネットワーク９３０は、電気通信及び／又はデータネットワークである。ネットワーク９３０は、１つ又は複数のコンピュータサーバーを含むことが可能であり、これらのコンピュータサーバーにより、クラウド演算などの、分散型の演算が可能となる。ネットワーク９３０は、コンピュータシステム９０１の支援を有するいくつかのケースにおいては、ピアツーピアネットワークを実装することが可能であり、ピアツーピアネットワークにより、コンピュータシステム９０１に結合された装置がクライアント又はサーバーとして振る舞うことが可能となりうる。

[0101] ＣＰＵ９０５は、機械可読命令のシーケンスを実行することが可能であり、機械可読命令のシーケンスは、プログラム又はソフトウェアにおいて実施することができる。命令は、メモリ９１０などの、メモリ場所において保存することができる。命令は、ＣＰＵ９０５に送付することが可能であり、命令は、その後に、本開示の方法を実装するように、ＣＰＵ９０５をプログラミングすることが可能であり、或いは、その他の方法で構成することができる。ＣＰＵ９０５によって実行される動作の例は、フェッチ、デコード、実行、及び書き戻しを含みうる。

[0102] ＣＰＵ９０５は、集積回路などの、回路の一部分でありうる。回路内には、システム９０１の１つ又は複数のその他のコンポーネントを含むことができる。いくつかのケースにおいては、回路は、用途固有の集積回路（ＡＳＩＣ：Application Specific Integrated Circuit）である。

[0103] ストレージユニット９１５は、ドライバ、ライブラリ、及び保存されたプログラムなどの、ファイルを保存することができる。ストレージユニット９１５は、例えば、ユーザーの好み及びユーザープログラムなどの、ユーザーデータを保存することができる。いくつかのケースにおけるコンピュータシステム９０１は、イントラネット又はインターネットを通じてコンピュータシステム９０１との通信状態にあるリモートサーバー上に配置されているものなどの、コンピュータシステム９０１の外部の１つ又は複数の更なるデータストレージユニットを含むことができる。

[0104] コンピュータシステム９０１は、ネットワーク９３０を通じて１つ又は複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム９０１は、ユーザー（例えば、記録管理システムのユーザー）のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例は、パーソナルコンピュータ（例えば、携帯型のＰＣ）、スレート又はタブレットＰＣ（例えば、Apple（登録商標） iPad、Samsung（登録商標） Galaxy Tab）、電話機、スマートフォン（例えば、Apple（登録商標） iPhone、Android対応型の装置、Blackberry（登録商標））、或いは、パーソナルデジタルアシスタントを含む。ユーザーは、ネットワーク９３０を介してコンピュータシステム９０１にアクセスすることができる。

[0105] 本明細書において記述されている方法は、例えば、メモリ９１０又は電子ストレージユニット９１５上などの、コンピュータシステム９０１の電子的ストレージ場所上において保存されている機械（例えば、コンピュータプロセッサ）実行可能コードによって実装することができる。機械実行可能又は機械可読コードは、ソフトウェアの形態において提供することができる。使用の際に、コードは、プロセッサ９０５によって実行することができる。いくつかのケースにおいては、コードは、ストレージユニット９１５から取得することができると共に、プロセッサ９０５による容易なアクセスのために、メモリ９１０上において保存することができる。いくつかの状況においては、電子ストレージユニット９１５を除外することが可能であり、且つ、機械実行可能命令は、メモリ９１０上において保存されている。

[0106] コードは、事前コンパイルすることができると共に、コードを実行するように適合されたプロセッサを有する機械と共に使用されるように、構成することが可能であり、或いは、実行時にコンパイルすることもできる。コードは、コードが予めコンパイルされる又は実行時にコンパイルされる方式において稼働することを可能にするように選択されうるプログラミング言語において供給することができる。

[0107] コンピュータシステム９０１などの、本明細書において提供されているシステム及び方法の態様は、プログラミングにおいて実施することができる。技術の様々な態様は、通常は、機械可読媒体のタイプにおいて担持された又は実施された、機械（或いは、プロセッサ）実行可能コード及び／又は関連するデータの形態における、「製品」又は「製造物品」であるものと見なすことができる。機械実行可能コードは、メモリ（例えば、読み出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ）又はハードディスクなどの、電子ストレージユニット上において保存することができる。「ストレージ」タイプのメディアは、ソフトウェアプログラミングのために、任意の時点において一時的ではない保存を提供することができる、様々な半導体メモリ、テープドライブ、ディスクドライブ、及びこれらに類似したものなどの、コンピュータ、プロセッサ、又はこれらに類似したもの、或いは、これらの関連するモジュール、の有体のメモリのいずれか又はすべてを含みうる。ソフトウェアのすべて又は一部分は、多くの場合に、インターネット又は様々なその他の電気通信ネットワークを通じて伝達することができる。例えば、このような通信は、例えば、管理サーバー又はホストコンピュータからアプリケーションサーバーのコンピュータプラットフォーム内へなどの、１つのコンピュータ又はプロセッサから別のものへの、ソフトウェアの読み込みを可能にすることができる。従って、ソフトウェア要素を搬送しうる、媒体の別のタイプは、有線又は光ランドラインネットワークを通じて、且つ、様々な無線リンク上において、ローカル装置の間において物理的なインターフェイスに跨って使用されているものなどの、光、電気、及び電磁波を含む。また、有線又は無線リンク、光リンク、或いは、これらに類似したものなどの、このような波を搬送する物理的要素も、ソフトウェアを担持する媒体と見なすことができる。本明細書において使用されている、コンピュータ又は機械「可読媒体」などの用語は、一時的ではない有体の「ストレージ」媒体に限定されていない限り、実行のためにプロセッサに命令を提供することに参画する任意の媒体を意味している。

[0108] 従って、コンピュータ実行可能コードなどの、機械可読媒体は、限定を伴うことなしに、有体のストレージ媒体、搬送波媒体、又は物理的な送信媒体を含む、多くの形態を有することができる。不揮発性ストレージ媒体は、例えば、図面に示されている、データベースを実装するべく使用されうるものなどのような、任意のコンピュータ内のストレージ装置又はこれに類似したもののうちの任意のものなどの、光又は磁気ディスクを含む。揮発性ストレージ媒体は、このようなコンピュータプラットフォームのメインメモリなどの、ダイナミックメモリを含む。有体の送信媒体は、コンピュータシステム内においてバスを構成しているワイヤを含む、同軸ケーブル、銅ワイヤ、及び光ファイバを含む。搬送波送信媒体は、高周波（ＲＦ：Radio Frequency）及び赤外線（ＩＲ：InfraRed）データ通信の際に生成されるものなどの、電気又は電磁信号、或いは、音波又は光波の形態を有することができる。従って、コンピュータ可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意のその他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤ又はＤＶＤ－ＲＯＭ、任意のその他の光媒体、パンチカード、紙テープ、孔のパターンを有する任意のその他の物理的ストレージ媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭ、及びＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意のその他のメモリチップ又はカートリッジ、データ又は命令を搬送する搬送波、このような搬送波を搬送するケーブル又はリンク、或いは、コンピュータがプログラミングコード及び／又はデータを読み取りうる任意のその他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のための１つ又は複数の命令の１つ又は複数のシーケンスのプロセッサへの搬送に関与することができる。

[0109] コンピュータシステム９０１は、ユーザーが、例えば、命令を記録管理システムに提供するための、及び／又は記録管理システムによってユーザー管理可能なインターフェイスとして提示される、ユーザーインターフェイス（ＵＩ：User Interface）９４０を有する、電子ディスプレイ９３５を含むことが可能であり、或いは、これとの通信状態にありうる。ＵＩの例は、限定を伴うことなしに、グラフィカルユーザーインターフェイス（ＧＵＩ：Graphical User Interface）及びウェブに基づいたユーザーインターフェイスを含む。コンピュータシステムは、サーチを促進するなどのために、グラフィカルユーザーインターフェイス及び／又はウェブに基づいたユーザーインターフェイスを表示することができる。ユーザーは、ＧＵＩ及び／又はウェブに基づいたユーザーインターフェイスを介して、サーチクエリを提供してもよく、サーチ結果を受け取ってもよく、クエリタイプレジストリの定義を提供してもよく、且つ、その他の動作を実行してもよい。

[0110] 本開示の方法及びシステムは、１つ又は複数のアルゴリズムによって実装することができる。アルゴリズムは、中央処理ユニット９０５によって実行された際にソフトウェアによって実装することができる。アルゴリズムは、その他の動作に加えて、例えば、クエリの受け取り、クエリの初期処理、クエリタイプの判定、クエリタイプ用の実行方法の解明、ユーザーの振る舞いに基づいたクエリの改善、ユーザー振る舞いフィードバックループの実行、知識グラフに基づいたクエリの改善、グラフデータベースの保存及びナビゲーション、サーチのディスパッチ、クエリのマッピング、及び／又は低減、サーチの実行、サーチ結果の供給、サーチ結果のフィルタリング、及び／又はソート、並びに、トレーニングデータの保存及び学習のためにプログラミングすることができる。

[0111] 本発明の好適な実施形態が本明細書において図示及び記述されているが、当業者には、これらの実施形態は、例として提供されたものに過ぎないことが明らかであろう。本発明は、本明細書において提供されている特定の例によって限定されるべく意図されてはいない。本発明は、上述の仕様を参照して記述されているが、本明細書における実施形態の記述及び図示は、限定の意味において解釈されるべく意図されてはいない。いまや、当業者には、本発明を逸脱することなしに、多数の変形、変更、及び置換が想起されよう。更には、本発明のすべての態様は、様々な条件及び変数に依存する、本明細書において記述されている特定の描画、構成、又は相対的な割合に限定されるものではないことを理解されたい。本発明を実施する際には、本明細書において記述されている本発明の実施形態にする様々な代替肢が利用されうることを理解されたい。従って、本発明は、任意のその他の代替肢、変更、変形、又は均等物をも包含するものと想定されている。添付の請求項は、本発明の範囲を定義しており、且つ、これらの請求項及びその均等物の範囲に含まれる方法及び構造は、これにより、包含されることが意図されている。

Claims

サーチクエリの文脈的改善のためのコンピュータ実装された方法であって、
（ａ）ユーザーから、ユーザインターフェースを介して、サーチクエリを受け取ることと、
（ｂ）１つ又は複数のコンピュータプロセッサの支援により、前記サーチクエリに対応する複数の自然言語処理（ＮＬＰ）モデルのうちの第１のＮＬＰモデルを判定することであって、前記第１のＮＬＰモデルは、１つ又は複数のキーワードの第１の組に対応する、ことと、
（ｃ）１つ又は複数のコンピュータプロセッサの支援により、前記複数のＮＬＰモデルのうちの第２のＮＬＰモデルを判定することであって、前記第２のＮＬＰモデルは、１つ又は複数キーワードの第２の組に対応し、前記第１のＮＬＰモデル及び前記第２のＮＬＰモデルは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
（ｄ）前記サーチクエリ内において元々存在していない前記１つ又は複数のキーワードの第２の組のキーワードによって前記サーチクエリを改善して改善されたサーチクエリを生成することと、
（ｅ）前記改善されたサーチクエリを実行することと
を含む、コンピュータ実装された方法。
前記複数のＮＬＰモデルは、１つ又は複数のデータベース内に保存される、請求項１に記載のコンピュータ実装された方法。
前記複数のＮＬＰモデルは、グラフデータベース内に保存される、請求項２に記載のコンピュータ実装された方法。
前記グラフデータベースは、前記複数のＮＬＰモデルの間の近接性関係を更に保存する、請求項３に記載のコンピュータ実装された方法。
前記１つ又は複数のコンピュータプロセッサの支援により、前記複数のＮＬＰモデルのうちの追加の１つ又は複数のＮＬＰモデルを判定することであって、前記追加の１つ又は複数のＮＬＰモデル及び前記第１のＮＬＰモデルのぞれぞれは、前記既定の閾値以上のそれぞれの重み値を有するそれぞれの近接性関係を有し、前記追加の１つ又は複数のＮＬＰモデルのぞれぞれは、１つ又は複数のキーワードのそれぞれの組に対応する、ことを更に含む、請求項１に記載のコンピュータ実装された方法。
前記１つ又は複数のキーワードのそれぞれの組によって前記サーチクエリを改善して前記改善されたサーチクエリを生成することを更に含む、請求項５に記載のコンピュータ実装された方法。
前記第１のＮＬＰモデルは、前記サーチクエリを１つ又は複数のトークンにトークン化してトークン化されたクエリを生成し、かつ前記トークン化されたクエリを前記１つ又は複数のキーワードの第１の組に対して処理することによって、前記サーチクエリに対応すると判定される、請求項５に記載のコンピュータ実装された方法。
前記サーチクエリは、前記複数のＮＬＰモデルのそれぞれに対して処理されて前記第１のＮＬＰモデルが前記サーチクエリに対応すると判定する、請求項５に記載のコンピュータ実装された方法。
サーチクエリの文脈的改善のためのコンピュータシステムであって、
１つ又は複数のプロセッサと、
以下の
（ａ）ユーザーから、ユーザインターフェースを介して、サーチクエリを受け取ることと、
（ｂ）１つ又は複数のコンピュータプロセッサの支援により、前記サーチクエリに対応する複数の自然言語処理（ＮＬＰ）モデルのうちの第１のＮＬＰモデルを判定することであって、前記第１のＮＬＰモデルは、１つ又は複数のキーワードの第１の組に対応する、ことと、
（ｃ）１つ又は複数のコンピュータプロセッサの支援により、前記複数のＮＬＰモデルのうちの第２のＮＬＰモデルを判定することであって、前記第２のＮＬＰモデルは、１つ又は複数キーワードの第２の組に対応し、前記第１のＮＬＰモデル及び前記第２のＮＬＰモデルは、既定の閾値以上の重み値を有する近接性関係を有する、ことと、
（ｄ）前記サーチクエリ内において元々存在していない前記１つ又は複数のキーワードの第２の組のキーワードによって前記サーチクエリを改善して改善されたサーチクエリを生成することと、
（ｅ）前記改善されたサーチクエリを実行することと
を行うべく、個々に又は集合的に、前記１つ又は複数のプロセッサによって実行可能である命令を含む、前記１つ又は複数のプロセッサに通信自在に結合されたメモリと
を含む、コンピュータシステム。
１つ又は複数のデータベースを更に含み、前記複数のＮＬＰモデルは、前記１つ又は複数のデータベース内に保存される、請求項９に記載のコンピュータシステム。
グラフデータベースを更に含み、前記複数のＮＬＰモデルは、前記グラフデータベース内に保存される、請求項９に記載のコンピュータシステム。
前記グラフデータベースは、前記複数のＮＬＰモデルの間の近接性関係を更に保存する、請求項１１に記載のコンピュータシステム。
前記１つ又は複数のプロセッサは、個々に又は集合的に、前記複数のＮＬＰモデルのうちの追加の１つ又は複数のＮＬＰモデルを判定するように更に構成され、前記追加の１つ又は複数のＮＬＰモデル及び前記第１のＮＬＰモデルのぞれぞれは、前記既定の閾値以上のそれぞれの重み値を有するそれぞれの近接性関係を有し、前記追加の１つ又は複数のＮＬＰモデルのぞれぞれは、１つ又は複数のキーワードのそれぞれの組に対応する、請求項９に記載のコンピュータシステム。
前記１つ又は複数のプロセッサは、個々に又は集合的に、前記１つ又は複数のキーワードのそれぞれの組によって前記サーチクエリを改善して前記改善されたサーチクエリを生成するように更に構成される、請求項１３に記載のコンピュータシステム。
前記１つ又は複数のプロセッサは、個々に又は集合的に、前記サーチクエリを１つ又は複数のトークンにトークン化してトークン化されたクエリを生成し、かつ前記トークン化されたクエリを前記１つ又は複数のキーワードの第１の組に対して処理することによって、前記第１のＮＬＰモデルが前記サーチクエリに対応すると判定するように更に構成される、請求項１３に記載のコンピュータシステム。
前記１つ又は複数のプロセッサは、個々に又は集合的に、前記サーチクエリを前記複数のＮＬＰモデルのそれぞれに対して処理して前記第１のＮＬＰモデルが前記サーチクエリに対応すると判定するように更に構成される、請求項１３に記載のコンピュータシステム。