JP7421740B1

JP7421740B1 - 分析プログラム、情報処理装置、および分析方法

Info

Publication number: JP7421740B1
Application number: JP2023147399A
Authority: JP
Inventors: 直也村上
Original assignee: Patentfield
Current assignee: Patentfield
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2024-01-25
Anticipated expiration: 2043-09-12

Abstract

【課題】大規模言語モデルを特許情報の分析に利用し、新たな価値を提供する技術を提供する。
【解決手段】特許情報の分析プログラムは、コンピュータに、技術的思想を含む技術情報を取得するステップと、技術情報と比較する対象の特許情報を取得するステップと、２つの情報の関連性を特定の観点から評価するための所定の指示文に対して、技術情報と特許情報とを指定するステップと、技術情報と特許情報とが指定された指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、技術情報と特許情報との関連性を示す評価結果を観点について出力するステップとを実行させる。
【選択図】図２

Description

本開示は、分析プログラム、情報処理装置、および分析方法に関する。

近年、様々な大規模言語モデルが開発されている。大規模言語モデルは、膨大な量のテキストデータを学習した言語モデルであり、様々な自然言語を処理可能なように学習されている。

非特許文献１は、大規模言語モデルの一例であるChatGPTの出力精度を向上させるための方法を開示している。具体的には、非特許文献１は、「Let's think step by step（一歩ずつ考えよう）」との指示文をChatGPTに入力することで、出力の正確性が向上することを開示している。

"ChatGPTを賢くする呪文"、日経経済新聞、[online]、2023年3月24日、[2023年9月6日検索]、インターネット＜URL:https://www.nikkei.com/article/DGXZQOUC22BVO0S3A320C2000000/＞

大規模言語モデルは、様々なサービスに適用され得るが、具体的なサービスとして実現されている例は未だ少ない。これに関して、大規模言語モデルを特許情報の分析に利用し、新たな価値を提供することが望まれている。

本開示の一例では、特許情報の分析プログラムが提供される。上記分析プログラムは、コンピュータに、技術的思想を含む技術情報を取得するステップと、上記技術情報と比較する対象の特許情報を取得するステップと、２つの情報の関連性を特定の観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定するステップと、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力するステップとを実行させる。

本開示の一例では、上記所定の指示文は、２つの情報の関連性を複数の観点から評価するよう規定されている。上記出力するステップでは、上記技術情報と上記特許情報との関連性を示す評価結果が上記複数の観点の各々について出力される。

本開示の一例では、上記複数の観点は、技術分野の観点と、課題の観点と、作用機能の観点と、内容示唆の観点と、パラメータの観点と、数値限定の観点と、技術用語の観点との内の少なくとも１つを含む。

本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記観点の別の上記評価結果を纏めた総合評価結果を出力するステップを実行させる。

本開示の一例では、上記複数の観点の各々には、重みが関連付けられている。上記総合評価結果は、上記観点の別の上記評価結果に対して上記重みを付けて算出される。

本開示の一例では、上記所定の指示文は、上記２つの情報の関連度を上記大規模言語モデルに出力させるための指示と、上記関連度の評価理由を上記大規模言語モデルに出力させるための指示とを含む。上記評価結果は、上記技術情報と上記特許情報とに係る上記関連度と、上記技術情報と上記特許情報とに係る上記評価理由とを含む。

本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記特許情報を上記技術情報と比較する際における概念レベルに関する入力を受け付けるステップを実行させる。上記指定するステップは、さらに、上記概念レベルに関する入力を上記指示文に反映することを含む。

本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、上記評価結果がディスプレイに表示されている際に、上記特許情報を上記技術情報と比較する際における概念レベルに関する入力を受け付けるステップと、上記概念レベルに関する入力を反映した再評価のための指示文を生成するステップと、上記再評価のための指示文を上記大規模言語モデルに入力することで当該大規模言語モデルから得られる結果を出力するステップとを実行させる。

本開示の一例では、上記分析プログラムは、上記コンピュータに、さらに、予め定められたアルゴリズムに基づいて、上記技術情報と上記特許情報との類似度を算出するステップを実行させる。上記評価結果は、上記大規模言語モデルから得られる上記結果と、上記類似度とに基づいて、上記観点の別に出力される。

本開示の一例では、上記複数の観点は、第１の観点と、上記第１の観点とは異なる第２の観点とを含む。上記大規模言語モデルは、第１の言語モデルと、上記第１の言語モデルとは異なる第２の言語モデルとを含む。上記第１の観点で上記技術情報と上記特許情報との関連性を評価するための上記指示文は、上記第１の言語モデルに入力される。上記第２の観点で上記技術情報と上記特許情報との関連性を評価するための上記指示文は、上記第２の言語モデルに入力される。

本開示の一例では、上記技術情報は、図面を含む。上記特許情報は、図面を含む。上記観点は、図面の内容の観点を含む。

本開示の一例では、上記指示文は、上記２つの情報の関連性を特定の観点で評価させるための第１の指示と、上記第１の指示に基づく上記２つの情報の関連性の評価結果を用いて、当該２つの情報の関連性を上記特定の観点でさらに評価させるための第２の指示とを含む。

本開示の他の例では、特許情報を分析することが可能な情報処理装置が提供される。上記情報処理装置は、上記情報処理装置をするための制御部を備える。上記制御部は、技術的思想を含む技術情報を取得する処理と、上記技術情報と比較する対象の特許情報を取得する処理と、２つの情報の関連性を観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定する処理と、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力する処理とを実行する。

本開示の他の例では、コンピュータによって実行される特許情報の分析方法が提供される。上記分析方法は、技術的思想を含む技術情報を取得するステップと、上記技術情報と比較する対象の特許情報を取得するステップと、２つの情報の関連性を複数の観点から評価するための所定の指示文に対して、上記技術情報と上記特許情報とを指定するステップと、上記技術情報と上記特許情報とが指定された上記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、上記技術情報と上記特許情報との関連性を示す評価結果を上記観点について出力するステップとを備える。

本発明の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解される本発明に関する次の詳細な説明から明らかとなるであろう。

情報処理システムの装置構成の一例を示す図である。関連性評価機能を説明するための図である。変形例に従う関連性評価機能を説明するための図である。情報処理装置のハードウェア構成の一例を示す模式図である。ユーザ端末のハードウェア構成の一例を示す模式図である。情報処理装置とユーザ端末とサーバとの間のデータフローの一例を示す図である。検索条件の入力画面の一例を示す図である。査読条件の入力画面の一例を示す図である。指示文の一例を示す図である。大規模言語モデルによって生成された回答の一例である回答情報を示す図である。評価結果画面の一例を示す図である。技術情報と特許情報との関連性評価に係るフローチャートを示す図である。観点別に対応付けられている重みの例を示す図である。他の例に従う関連性評価処理を概略的に示す図である。他の例に従う関連性評価処理を概略的に示す図である。指示文の他の例を示す図である。

以下、図面を参照しつつ、本発明に従う各実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがって、これらについての詳細な説明は繰り返さない。なお、以下で説明される各実施の形態および各変形例は、適宜選択的に組み合わされてもよい。

＜Ａ．情報処理システム１０＞
まず、図１を参照して、情報処理システム１０の装置構成について説明する。図１は、情報処理システム１０の装置構成の一例を示す図である。

図１に示されるように、情報処理システム１０は、情報処理装置１００と、ユーザ端末２００と、サーバ３００とを含む。情報処理装置１００、ユーザ端末２００、およびサーバ３００は、ネットワークＮＷ（たとえば、インターネット）を通じて互いに通信可能に構成される。

情報処理装置１００は、ノート型またはデスクトップ型のＰＣ（Personal Computer）、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム１０を構成する情報処理装置１００の数は、１つであってもよいし、２つ以上であってもよい。情報処理装置１００は、たとえば、企業「Ａ」によって運用されている。

ユーザ端末２００は、たとえば、ノート型またはデスクトップ型のＰＣ、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム１０を構成するユーザ端末２００の数は、１つであってもよいし、２つ以上であってもよい。情報処理装置１００は、たとえば、一般ユーザであるユーザ「Ａ」によって所有されている。

サーバ３００は、ノート型またはデスクトップ型のＰＣ（Personal Computer）、タブレット端末、スマートフォン、または、通信機能を備えたその他のコンピュータである。情報処理システム１０を構成するサーバ３００の数は、１つであってもよいし、２つ以上であってもよい。サーバ３００は、たとえば、企業「Ｂ」によって運用されている。

サーバ３００は、大規模言語モデル３２４を格納している。大規模言語モデル３２４は、数十億以上の膨大な量のテキストデータを学習した言語モデルであり、様々な自然言語を処理可能なように学習されている。大規模言語モデル３２４は、ＬＬＭ（Large Language Models）とも呼ばれている。大規模言語モデル３２４は、指示文の入力を受けると、当該指示文に応じた出力を生成するように学習されている。

大規模言語モデル３２４としては、たとえば、ＧＰＴ－３（Generative Pretrained Transformer）やＧＰＴ－４などのＧＰＴシリーズ、ＰａＬＭ（Scaling Language Modeling with Pathways）、ＬＬａＭＡ（Large Language Model Meta AI）、および、既知のＬＬＭが挙げられる。また、大規模言語モデルは、ＧＰＴシリーズの他、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）のようなＴｒａｎｓｆｏｒｍｅｒベースの大規模言語モデル、ＣＮＮ（Convolutional Neural Network）、ＲＮＮ（Recurrent Neural Network）、ＬＳＴＭ（Long Short Term Memory）など、種々の大規模言語モデルが用いられてもよい。

企業「Ｂ」は、たとえば、大規模言語モデル３２４の機能を利用するためのＡＰＩ（Application Programming Interface）を公開している。これにより、企業「Ａ」の設計者や一般ユーザは、当該ＡＰＩを通じて大規模言語モデル３２４の機能を利用することができる。

なお、本明細書に記載されている各種処理は、情報処理装置１００に実装されてもよいし、ユーザ端末２００に実装されてもよいし、サーバ３００に実装されてもよいし、その他のコンピュータに実装されてもよい。

また、上述では、情報処理システム１０がサーバ３００を含む例について説明を行ったが、情報処理システム１０は、サーバ３００を含まなくてもよい。この場合、情報処理システム１０は、１つ以上の情報処理装置１００と、１つ以上のユーザ端末２００とで構成される。

＜Ｂ．処理概要＞
情報処理装置１００は、特許情報に関する様々な分析機能をユーザ「Ａ」に提供する。一例として、情報処理装置１００は、技術情報と特許情報との関連性を評価するための機能をユーザ「Ａ」に提供する。

「特許情報」とは、特許文献に関するデータである。特許情報は、たとえば、公開特許公報、特許公報、公表特許公報、再公表特許、実用新案公報などの特許文献を含む。一例として、特許情報は、書誌事項と、明細書と、特許請求の範囲と、図面と、要約書とを含む。書誌事項としては、たとえば、出願番号と、公開番号と、特許登録番号と、出願日と、公開日と、登録日と、出願人と、特許権利者と、発明の名称と、代理人と、出願国とが挙げられる。なお、特許情報は、公開技報などの非特許文献であってもよい。

「技術情報」とは、技術的思想を含むデータを言う。技術的思想は、技術的課題を解決するための技術的手段である。技術情報は、たとえば、技術的手段を文字列で記述されたものである。技術情報は、たとえば、発明特定事項が記述された発明情報を含む。

以下では、図２を参照して、技術情報１２３と特許情報１２５との関連性を評価する機能の概要について説明する。図２は、関連性評価機能を説明するための図である。

情報処理装置１００は、ユーザ端末２００から技術情報１２３を取得する。技術情報１２３は、ユーザ端末２００のユーザ「Ａ」によって入力された文字列であってもよいし、ユーザ「Ａ」の操作に応じて特許情報から抽出されたデータであってもよい。

また、情報処理装置１００は、技術情報１２３と比較する特許情報１２５を取得する。特許情報１２５の取得先は任意である。一例として、特許情報１２５は、情報処理装置１００内の記憶装置内に格納されている後述の特許データベース１２４（図４参照）から取得される。他の例として、特許情報１２５は、特許庁で管理されているサーバ内の特許データベースから取得される。さらに他の例として、特許情報１２５は、他のサーバで管理されている特許データベースから取得される。

技術情報１２３と特許情報１２５との関連性評価は、大規模言語モデル３２４を利用することで実現される。より具体的には、まず、情報処理装置１００は、２つの情報の関連性を特定の観点から評価するための所定の指示文１２８に対して、技術情報１２３と特許情報１２５とを指定する。

指示文１２８は、たとえば、テンプレートとして情報処理装置１００内に予め登録されている。また、指示文１２８は、引数部１２９Ａと、引数部１２９Ｂとを含む。引数部１２９Ａには、技術情報１２３が指定される。一方で、引数部１２９Ｂには、特許情報１２５が指定される。

また、指示文１２８は、技術情報１２３および特許情報１２５の関連性をどのような観点で評価するか規定している。図２の例では、２つの情報を観点「α」で評価するように規定されている。観点「α」は、予め規定されていてもよいし、引数として規定されていてもよい。観点「α」が引数として規定されている場合は、当該観点は、ユーザ端末２００のユーザ「Ａ」によって任意に指定される。

技術情報１２３および特許情報１２５が指定された指示文１２８は、大規模言語モデル３２４に入力される。大規模言語モデル３２４は、指示文１２８の入力を受けると、指示文１２８に応じた回答を生成する。生成された回答は、情報処理装置１００に出力される。

情報処理装置１００は、大規模言語モデル３２４から得られる回答に基づいて、技術情報１２３と特許情報１２５との関連性を示す評価結果１３０を観点「α」について出力する。当該関連性は、関連度合いを示す数値で表わされてもよいし、説明文で表わされてもよい。図２の例では、当該関連性が数値で表わされている。

情報処理装置１００による評価結果１３０の出力先は任意である。一例として、当該出力先は、ユーザ端末２００である。ユーザ端末２００に出力された評価結果１３０は、たとえば、ユーザ端末２００のディスプレイに表示される。

以上のように、情報処理装置１００は、技術情報１２３と特許情報１２５との関連性評価に大規模言語モデル３２４を利用することで、ユーザに新たな価値を提供する。

関連性評価機能は、たとえば、以下の場合に有効である。これまで、特許調査においては、人間が何千件～何万件の特許文献を読むことによりスクリーニングまたは査読することが中心であった。このとき、ユーザが図２に示される関連性評価機能を利用すれば、調査対象の技術情報１２３が特許情報１２５とどの程度関連しているかを容易に判定することができる。これにより、ユーザは、スクリーニングまたは査読に要する時間を大幅に短縮することができる。

なお、図２の例では、指示文１２８が単一の観点「α」から関連性を評価するように規定されていたが、指示文１２８は、複数の観点から関連性を評価するように規定されていてもよい。

図３は、変形例に従う関連性評価機能を説明するための図である。図３に示される指示文１２８は、２つの情報の関連性を複数の観点「α」，「β」から評価するよう規定されている。大規模言語モデル３２４は、当該指示文１２８の入力を受けると、指示文１２８に応じた回答を生成する。

情報処理装置１００は、大規模言語モデル３２４から得られる結果に基づいて、技術情報１２３と特許情報１２５との関連性を示す評価結果１３０を出力する。評価結果１３０は、技術情報１２３と特許情報１２５との関連性を観点「α」，「β」の各々について示す。評価結果１３０は、情報処理装置１００からユーザ端末２００に送信され、ユーザ端末２００のディスプレイに表示される。

これにより、ユーザは、技術情報１２３が特許情報１２５に関連しているか否かを複数の観点の関連性に基づいて判断することができる。結果として、ユーザは、調査対象の技術情報１２３が特許情報１２５とどの程度関連しているかをさらに容易に判定することができる。

＜Ｃ．観点の種類＞
引き続き図２および図３を参照して、指示文１２８に規定されている観点「α」，「β」について説明する。

指示文１２８には、任意の観点が規定され得る。好ましくは、ユーザが技術情報１２３と特許情報１２５との関連性を評価する際に重視する事項が観点として規定され得る。一例として、審査基準「第ＩＩＩ部第２章第２節進歩性」に記載されている「主引用発明に副引用発明を適用する動機付け」の判断指標が観点「α」，「β」に規定される。

より具体的には、観点「α」，「β」は、技術分野の共通性の観点と、課題の共通性の観点と、作用機能の共通性の観点と、内容示唆の共通性の観点と、パラメータの共通性の観点と、数値限定の共通性の観点と、技術用語の共通性の観点との内の少なくとも１つを含む。これにより、技術情報１２３と特許情報１２５との共通性が進歩性の判断基準に合う評価軸で評価される。

なお、指示文１２８に規定される観点は、上記の例に限定されない。他の例として、指示文１２８に規定される観点は、用途探索に適した観点であってもよい。当該観点は、適用される用途または製品の共通性の観点であってもよいし、適用される産業分野の共通性の観点であってもよい。

さらに他の例として、指示文１２８に規定される観点は、図面の共通性の観点であってもよい。この具体例については後述する。

さらに他の例として、指示文１２８に規定される観点は、技術情報１２３に係る発明と特許情報１２５に係る発明との一方を他方に組み合わせることに関して阻害要因が存在するか否かを評価する観点であってもよい。

さらに他の例として、技術情報１２３に係る発明と特許情報１２５に係る発明との間の差異が設計変更であるか否かを評価する観点であってもよい。

＜Ｄ．ハードウェア構成＞
次に、図４および図５を参照して、上述の図１に示される情報処理装置１００とユーザ端末２００とのハードウェア構成について順に説明する。

なお、図１に示されるサーバ３００のハードウェア構成は、情報処理装置１００と同様であるので、その説明については繰り返さない。

（Ｄ１．情報処理装置１００）
まず、図４を参照して、図１に示される情報処理装置１００のハードウェア構成について説明する。図４は、情報処理装置１００のハードウェア構成の一例を示す模式図である。

情報処理装置１００は、制御装置１０１と、ＲＯＭ（Read Only Memory）１０２と、ＲＡＭ（Random Access Memory）１０３と、通信インターフェイス１０４と、表示インターフェイス１０５と、入力インターフェイス１０７と、補助記憶装置１２０とを含む。これらのコンポーネントは、バス１１０に接続される。

制御装置１０１は、たとえば、少なくとも１つの集積回路によって構成される。集積回路は、たとえば、少なくとも１つのＣＰＵ（Central Processing Unit）、少なくとも１つのＧＰＵ（Graphics Processing Unit）、少なくとも１つのＡＳＩＣ（Application Specific Integrated Circuit）、少なくとも１つのＦＰＧＡ（Field Programmable Gate Array）、またはそれらの組み合わせなどによって構成され得る。

制御装置１０１は、分析プログラム１２２やオペレーティングシステムなどの各種プログラムを実行することで情報処理装置１００の動作を制御する。制御装置１０１は、各種プログラムの実行命令を受け付けたことに基づいて、補助記憶装置１２０またはＲＯＭ１０２からＲＡＭ１０３に当該プログラムを読み出す。ＲＡＭ１０３は、ワーキングメモリとして機能し、各種プログラムの実行に必要な各種データを一時的に格納する。

通信インターフェイス１０４には、ＬＡＮ（Local Area Network）やアンテナなどが接続される。情報処理装置１００は、通信インターフェイス１０４を介して、外部機器との間でデータをやり取りする。当該外部機器は、たとえば、ユーザ端末２００、サーバ３００、その他の通信機器などを含む。

表示インターフェイス１０５には、ディスプレイ１０６が接続される。表示インターフェイス１０５は、制御装置１０１などからの指令に従って、ディスプレイ１０６に対して、画像を表示するための画像信号を送出する。ディスプレイ１０６は、たとえば、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ、またはその他の表示機器である。なお、ディスプレイ１０６は、情報処理装置１００と一体的に構成されてもよいし、情報処理装置１００とは別に構成されてもよい。

入力インターフェイス１０７には、入力デバイス１０８が接続される。入力デバイス１０８は、たとえば、マウス、キーボード、タッチパネル、またはユーザの操作を受け付けることが可能なその他の装置である。なお、入力デバイス１０８は、情報処理装置１００と一体的に構成されてもよいし、情報処理装置１００とは別に構成されてもよい。

補助記憶装置１２０は、たとえば、ハードディスク、フラッシュメモリ、ＳＳＤ（Solid State Drive）、およびその他の記憶媒体である。補助記憶装置１２０は、分析プログラム１２２、特許データベース１２４、および上述の指示文１２８などを格納する。特許データベース１２４は、複数の特許情報１２５を含む。分析プログラム１２２、特許データベース１２４、および指示文１２８の格納場所は、補助記憶装置１２０に限定されず、制御装置１０１の記憶領域（たとえば、キャッシュメモリなど）、ＲＯＭ１０２、ＲＡＭ１０３、外部機器などに格納されていてもよい。

なお、分析プログラム１２２は、単体のプログラムとしてではなく、任意のプログラムの一部に組み込まれて提供されてもよい。この場合、分析プログラム１２２に規定される各種処理は、後述の分析プログラム２２２などの任意のプログラムと協働して実現される。このような一部のモジュールを含まないプログラムであっても、本実施の形態に従う分析プログラム１２２の趣旨を逸脱するものではない。さらに、分析プログラム１２２によって提供される機能の一部または全部は、専用のハードウェアによって実現されてもよい。さらに、少なくとも１つのサーバが分析プログラム１２２の処理の一部を実行する所謂クラウドサービスのような形態で情報処理装置１００が構成されてもよい。

（Ｄ２．ユーザ端末２００）
次に、図５を参照して、図１に示されるユーザ端末２００のハードウェア構成について説明する。図５は、ユーザ端末２００のハードウェア構成の一例を示す模式図である。

ユーザ端末２００は、制御装置２０１と、ＲＯＭ２０２と、ＲＡＭ２０３と、通信インターフェイス２０４と、表示インターフェイス２０５と、入力インターフェイス２０７と、補助記憶装置２２０とを含む。これらのコンポーネントは、バス２１０に接続される。

制御装置２０１は、たとえば、少なくとも１つの集積回路によって構成される。集積回路は、たとえば、少なくとも１つのＣＰＵ、少なくとも１つのＧＰＵ、少なくとも１つのＡＳＩＣ、少なくとも１つのＦＰＧＡ、またはそれらの組み合わせなどによって構成され得る。

制御装置２０１は、分析プログラム２２２やオペレーティングシステムなどの各種プログラムを実行することでユーザ端末２００の動作を制御する。制御装置２０１は、各種プログラムの実行命令を受け付けたことに基づいて、補助記憶装置２２０またはＲＯＭ２０２からＲＡＭ２０３に当該プログラムを読み出す。ＲＡＭ２０３は、ワーキングメモリとして機能し、当該プログラムの実行に必要な各種データを一時的に格納する。

通信インターフェイス２０４には、ＬＡＮやアンテナなどが接続される。ユーザ端末２００は、通信インターフェイス２０４を介して、外部機器との間でデータをやり取りする。当該外部機器は、たとえば、情報処理装置１００、サーバ３００、およびその他の通信機器などを含む。ユーザ端末２００は、情報処理装置１００から分析プログラム２２２をダウンロード可能に構成されてもよい。

表示インターフェイス２０５には、ディスプレイ２０６が接続される。表示インターフェイス２０５は、制御装置２０１などからの指令に従って、ディスプレイ２０６に対して、画像を表示するための画像信号を送出する。ディスプレイ２０６は、たとえば、液晶ディスプレイ、有機ＥＬディスプレイ、またはその他の表示機器である。なお、ディスプレイ２０６は、ユーザ端末２００と一体的に構成されてもよいし、ユーザ端末２００とは別に構成されてもよい。

入力インターフェイス２０７には、入力デバイス２０８が接続される。入力デバイス２０８は、たとえば、マウス、キーボード、タッチパネル、またはユーザの操作を受け付けることが可能なその他の装置である。なお、入力デバイス２０８は、ユーザ端末２００と一体的に構成されてもよいし、ユーザ端末２００とは別に構成されてもよい。

補助記憶装置２２０は、たとえば、ハードディスク、フラッシュメモリ、ＳＳＤ（Solid State Drive）、およびその他の記憶媒体である。補助記憶装置２２０は、分析プログラム２２２などを格納する。分析プログラム２２２の格納場所は、補助記憶装置２２０に限定されず、制御装置２０１の記憶領域（たとえば、キャッシュメモリなど）、ＲＯＭ２０２、ＲＡＭ２０３、外部機器（たとえば、サーバー）などに格納されていてもよい。

なお、分析プログラム２２２は、単体のプログラムとしてではなく、任意のプログラムの一部に組み込まれて提供されてもよい。この場合、分析プログラム２２２に規定される各種処理は、上述の分析プログラム１２２などの任意のプログラムと協働して実現される。このような一部のモジュールを含まないプログラムであっても、本実施の形態に従う分析プログラム２２２の趣旨を逸脱するものではない。さらに、分析プログラム２２２によって提供される機能の一部または全部は、専用のハードウェアによって実現されてもよい。さらに、少なくとも１つのサーバが分析プログラム２２２の処理の一部を実行する所謂クラウドサービスのような形態でユーザ端末２００が構成されてもよい。

＜Ｅ．データフロー＞
次に、図６～図１１を参照して、技術情報１２３と特許情報１２５との関連性評価に係る情報処理システム１０の動作について説明する。図６は、情報処理装置１００とユーザ端末２００とサーバ３００との間のデータフローの一例を示す図である。

なお、上述のように、情報処理装置１００は、技術情報１２３と特許情報１２５との関連性評価機能を提供するが、以下では、当該関連性評価機能を特許情報１２５の査読に応用する前提で説明を行う。

（Ｅ１．ステップＳ１１０）
ステップＳ１１０において、ユーザ端末２００は、図７に示される入力画面４００Ａを表示する。図７は、一例としての入力画面４００Ａを示す図である。

入力画面４００Ａは、上述の特許データベース１２４（図４参照）から特許情報１２５を検索するための検索条件を受け付ける。ユーザは、当該検索条件を入力することで、技術情報１２３と比較する１つ以上の特許情報１２５を指定することができる。入力画面４００Ａは、たとえば、選択欄４１０と、入力欄４１２とを含む。

選択欄４１０は、検索種別の選択入力を受け付ける。一例として、選択欄４１０で指定可能な検索種別は、「全文検索」、「フィールド検索」、「コマンド検索」、「セマンティック検索」、「番号検索」などが挙げられる。

入力欄４１２は、各種の検索条件の入力を受け付ける。入力欄４１２に入力可能な検索条件は、たとえば、特許文献の番号、当該番号の種別（たとえば、出願番号や公開番号など）、出願の公開国などが挙げられる。

（Ｅ２．ステップＳ１１２）
次に、ステップＳ１１２において、ユーザ端末２００は、図８に示される入力画面４００Ａを表示する。図８は、一例としての入力画面４００Ｂを示す図である。

入力画面４００Ｂは、査読条件の設定を受け付ける。一例として、入力画面４００Ｂは、入力欄４２０と、選択欄４２２と、入力欄４２４と、選択欄４２６と、開始ボタン４２８とを含む。

入力欄４２０は、査読対象の設定を受け付ける。一例として、入力欄４２０は、査読する特許情報１２５の最大件数と、特許情報１２５中の査読箇所との入力を受け付ける。指定可能な査読箇所としては、たとえば、要約書、発明の名称、特許請求の範囲におけるトップクレーム（すなわち、請求項１）、技術分野、背景技術、発明が解決しようとする課題、発明の効果、課題を解決するための手段、および明細書などが挙げられる。

選択欄４２２は、査読種別の選択を受け付ける。選択可能な査読種別は、たとえば、関連性評価、要約・情報抽出などのユーザ指示、ユーザタグ／評価などが挙げられる。

入力欄４２４は、上述の技術情報１２３の入力を受け付ける。入力欄４２４は、たとえば、技術的思想を示す文の入力を受け付ける。一例として、ユーザは、自身または他社が発明した内容を入力欄４２４に入力する。他の例として、ユーザは、自社製品の仕様を入力欄４２４に入力する。

選択欄４２６は、利用する大規模言語モデル３２４の選択を受け付ける。選択欄４２６で選択された大規模言語モデル３２４は、技術情報１２３と特許情報１２５との関連性評価に利用される。

ユーザが査読の開始ボタン４２８を押したことに基づいて、ユーザ端末２００は、図７に示される入力画面４００Ａに入力された検索条件と、図８に示される入力画面４００Ｂに入力された査読条件とを情報処理装置１００に送信する。

（Ｅ３．ステップＳ１２０）
次に、ステップＳ１２０において、情報処理装置１００は、上述の特許データベース１２４に登録されている特許情報１２５の内から、上述の入力画面４００Ａ（図７参照）に入力された検索条件に合致する特許情報１２５を検索する。情報処理装置１００は、当該検索条件に合致した特許情報１２５を、技術情報１２３と比較する母集団とみなす。

（Ｅ４．ステップＳ１２２）
次に、ステップＳ１２２において、情報処理装置１００は、大規模言語モデル３２４に入力するための上述の指示文１２８（図２および図３参照）を生成する。

図９は、一例としての指示文１２８を示す図である。指示文１２８は、複数の引数部１２９Ａと、複数の引数部１２９Ｂとを含む。情報処理装置１００は、複数の引数部１２９Ａの各々に対して技術情報１２３を指定し、複数の引数部１２９Ｂの各々に対して特許情報１２５を指定する。指示文１２８は、ステップＳ１２０で検索された特許情報１２５の各々について生成される。

好ましくは、図９に示されるように、指示文１２８は、２つの情報の関連度を大規模言語モデル３２４に出力させるための指示１３１Ａと、当該関連度の評価理由を大規模言語モデル３２４に出力させるための指示とを含む。これにより、ユーザによる関連度の判断指標が増える。

また、指示文１２８は、各観点での評価結果を総合して２つの情報の関連度を大規模言語モデル３２４に出力させるための指示１３１Ｃと、当該総合評価の理由を大規模言語モデル３２４に出力させるための指示１３１Ｄとを含む。

情報処理装置１００は、ステップＳ１２２で生成した指示文１２８をサーバ３００に送信する。

（Ｅ５．ステップＳ１３０）
次に、ステップＳ１３０において、サーバ３００は、情報処理装置１００から指示文１２８を受信したことに基づいて、当該指示文１２８を大規模言語モデル３２４に入力する。これにより、大規模言語モデル３２４は、指示文１２８に応じた回答を生成する。

図１０は、大規模言語モデル３２４によって生成された回答の一例である回答情報３２６を示す図である。図１０の例では、回答情報３２６が表形式で示されているが、回答情報３２６の形式は任意である。大規模言語モデル３２４の出力形式は、たとえば、指示文１２８に予め規定されており、大規模言語モデル３２４は、指示文１２８に規定されている出力形式に従って回答情報３２６を出力する。

回答情報３２６は、技術情報１２３と特許情報１２５との関連性の評価結果３２７を特許情報１２５の別に含む。評価結果３２７は、技術情報１２３と特許情報１２５との関連度を示す関連性スコアと、当該関連度の評価理由とを含む。当該関連性スコアは、指示文１２８で指示された評価観点ごとに含まれている。同様に、当該評価理由は、指示文１２８で指示された評価観点ごとに含まれている。また、評価結果３２７は、各評価観点での総合評価スコアと、当該総合評価理由とを含む。

評価結果３２７は、特許情報１２５の識別子で一意に特定され得る。当該識別子は、たとえば、特許情報１２５の出願番号、特許情報１２５の公開番号、特許情報１２５の登録公報番号、特許情報１２５の出願人情報などで規定される。

情報処理装置１００は、ステップＳ１３０で生成した回答情報３２６を情報処理装置１００に送信する。

（Ｅ６．ステップＳ１４０，Ｓ１５０）
次に、ステップＳ１４０において、情報処理装置１００は、サーバ３００から受信した回答情報３２６に基づいて、評価結果画面を生成する。当該評価結果画面は、たとえば、ＨＴＭＬ（HyperText Markup Language）などの言語で記述される。

次に、ステップＳ１５０において、ユーザ端末２００は、情報処理装置１００によって生成された評価結果画面を表示する。図１１は、一例としての評価結果画面４００Ｃを示す図である。評価結果画面４００Ｃは、たとえば、ユーザ端末２００のディスプレイ２０６に表示される。

評価結果画面４００Ｃは、技術情報１２３に係る情報を表示する表示領域４３０と、技術情報１２３および特許情報１２５の関連性の評価結果を表示する表示領域４４０とを含む。表示領域４４０は、表示領域４４２と、評価結果の表示領域４４４，４４６とを含む。表示領域４４０は、技術情報１２３と比較した特許情報１２５の数に応じて並べて設けられる。

表示領域４３０は、上述の入力画面４００Ａ，４００Ｂ（図７，図８参照）に入力された情報などを表示する。一例として、表示領域４３０は、「ＩＤ」（Identification）と、「査読種別」と、「モデル」と、「ステータス」と、「取扱時間」と、「査読対象」と、「調査観点」とを表示する。

「ＩＤ」は、査読評価結果を一意に識別するための識別子である。「査読種別」は、上述の選択欄４２２（図８参照）で設定された事項に対応する。「モデル」は、関連性評価時に使用された大規模言語モデル３２４の種類を示し、上述の選択欄４２６（図８参照）で設定された情報に対応している。「ステータス」は、関連性評価処理が正常に終了したか否かを示す。「取扱時間」は、関連性評価処理の実行を開始してから終了するまでに要した時間を示す。「査読対象」は、上述の入力欄４２０（図８参照）に入力された情報に対応している。「調査観点」は、技術情報１２３の内容を示し、上述の入力欄４２０（図８参照）に入力された事項に対応している。

表示領域４４２は、関連性評価の対象となった特許情報１２５に係る情報を表示する。表示領域４４２には、たとえば、「発明の名称」と、「出願番号」と、「公開番号」と、「ステータス」と、「要約」とが表示される。

「要約」には、たとえば、特許情報１２５の内容の概略が表示される。一例として、当該概略は、特許情報１２５の内容を要約するように大規模言語モデル３２４に指示して大規模言語モデル３２４から出力される結果から生成されたものである。他の例として、当該概略は、特許情報１２５に含まれている要約書から生成されたものである。

表示領域４４４には、大規模言語モデル３２４の回答情報３２６（図１０参照）から生成された評価結果がグラフで表示される。図１１の例では、当該評価結果は、各観点での評価スコアがレーダーチャートで示されている。好ましくは、表示領域４４４に表示するグラフの種類は、ユーザによって任意に設定され得る。

表示領域４４６には、大規模言語モデル３２４の回答情報３２６（図１０参照）から生成された評価結果が表形式で表示される。図１１の例では、表示領域４４６において、回答情報３２６に含まれている観点別の関連性スコアと、回答情報３２６に含まれている観点別の評価理由と、回答情報３２６に含まれている総合評価スコアと、回答情報３２６に含まれている総合評価理由とが表示されている。

このように、情報処理装置１００は、観点別の評価結果を纏めた総合評価結果を出力する。これにより、ユーザは、技術情報１２３と特許情報１２５との関連度を容易に認識することができる。

好ましくは、総合評価結果として「合計スコア」が表示領域４４６にさらに表示される。「合計スコア」は、観点別の評価結果スコアの合計値に相当する。なお、「合計スコア」の代わりに観点別の評価結果スコアの「平均スコア」が表示されてもよい。

なお、評価結果画面４００Ｃに表示する評価結果は、評価観点ごとに選択可能に構成されてもよい。一例として、ユーザは、「課題の共通性の観点」に着目して関連性を評価する場合、「課題の共通性の観点」以外の観点を非選択とする。これにより、評価結果画面４００Ｃには、「課題の共通性の観点」に係る評価結果のみが表示される。このように構成されることで、ユーザは、技術情報１２３と特許情報１２５との関連性を自身の目的に合わせて評価することができる。なお、評価観点の選択は、回答情報３２６の生成前に指示文１２８に反映されてもよいし、評価結果画面４００Ｃの表示内容にのみ反映されてもよい。

また、評価結果画面４００Ｃに表示される評価観点は、並び替え可能に構成されてもよい。これにより、ユーザは、自身の目的に応じたより優先度の高い評価項目を上位に表示することが可能になる。

さらに、評価結果画面４００Ｃに表示される複数の表示領域４４０は、選択したソート条件に従って並び替え可能に構成される。選択可能なソート条件としては、たとえば、評価スコアの昇順／降順、総合評価スコアの昇順／降順、および合計スコアの昇順／降順などが挙げられる。

さらに、評価結果画面４００Ｃに表示される内容は、図１１の例に限定されない。評価結果画面４００Ｃには、さらに多くの情報（以下、「付加情報」ともいう。）が表示されてもよい。付加情報としては、たとえば、特許情報１２５の技術要約、特許情報１２５の課題要約、特許情報１２５に含まれる特徴的なキーワード、特許情報１２５に付与されている分類などが挙げられる。これらの付加情報は、大規模言語モデル３２４によって生成される。

＜Ｉ．フローチャート＞
次に、図１２を参照して、情報処理装置１００の制御フローの一例について説明する。図１２は、技術情報１２３と特許情報１２５との関連性評価に係るフローチャートを示す図である。

図１２に示される処理は、情報処理装置１００の制御装置１０１が上述の分析プログラム１２２を実行することにより実現される。他の局面において、処理の一部または全部が、回路素子またはその他のハードウェアによって実行されてもよい。

ステップＳ２１０において、制御装置１０１は、関連性評価の開始ボタン４２８（図８参照）が押されたか否かを判断する。制御装置１０１は、関連性評価の開始ボタン４２８が押されたと判断した場合（ステップＳ２１０においてＹＥＳ）、制御をステップＳ２１２に切り替える。そうでない場合には（ステップＳ２１０においてＮＯ）、制御装置１０１は、ステップＳ２１０の処理を再び実行する。

ステップＳ２１２において、制御装置１０１は、上述の特許データベース１２４に登録されている特許情報１２５の内から、上述の入力画面４００Ａ（図７参照）に入力された検索条件に合致する特許情報１２５を検索する。

ステップＳ２１４において、制御装置１０１は、大規模言語モデル３２４に入力するための上述の指示文１２８を生成する。指示文１２８の生成処理については上述の通りであるので、その説明については繰り返さない。制御装置１０１は、生成した指示文１２８をサーバ３００に送信する。

サーバ３００は、受信した指示文１２８を大規模言語モデル３２４に入力し、指示文１２８に応じた回答情報３２６（図１０参照）を生成する。回答情報３２６は、情報処理装置１００に送信される。

ステップＳ２１６において、制御装置１０１は、サーバ３００から受信した回答情報３２６に基づいて、上述の評価結果画面４００Ｃ（図１１参照）を生成する。評価結果画面４００Ｃについては上述の通りであるので、その説明については繰り返さない。

ステップＳ２１８において、制御装置１０１は、ステップＳ２１６で生成した評価結果画面４００Ｃをユーザ端末２００に出力する。これにより、ユーザ端末２００は、評価結果画面４００Ｃをディスプレイ２０６に表示する。

＜Ｊ１．その他＞
次に、上記実施の形態の他の例について説明する。

上述の通り、図１１に示される「総合評価スコア」や「合計スコア」などの総合評価結果は、技術情報１２３と特許情報１２５との関連性を各観点で評価した結果に基づいて生成されている。このとき、各観点に係る評価結果に対して重み付けがされてもよい。

図１３は、観点別に対応付けられている重みの例を示す図である。図１３の例では、観点「α」に対しては、重み「ｗ１」が関連付けられている。観点「β」に対しては、重み「ｗ２」が関連付けられている。観点「γ」に対しては、重み「ｗ３」が関連付けられている。観点「δ」に対しては、重み「ｗ４」が関連付けられている。重み「ｗ１」～「ｗ４」は、予め設定されていてもよいし、ユーザによって任意に設定されてもよい。

また、図１３には、観点「α」での評価結果として、関連性スコア「ｓ１」が示されている。観点「β」での評価結果として、関連性スコア「ｓ２」が示されている。観点「γ」での評価結果として、関連性スコア「ｓ３」が示されている。観点「δ」での評価結果として、関連性スコア「ｓ４」が示されている。

情報処理装置１００は、観点の別の評価結果「ｓ１」～「ｓ４」に対して重み「ｗ１」～「ｗ４」を考慮して総合評価結果を算出する。一例として、情報処理装置１００は、評価結果「ｓ１」～「ｓ４」に対して重み「ｗ１」～「ｗ４」をそれぞれ乗算することで加重平均を算出する。情報処理装置１００は、当該算出した加重平均を総合評価結果として出力する。

＜Ｊ２．その他＞
次に、上記実施の形態のさらに他の例について説明する。

場合によっては、技術情報１２３および特許情報１２５が想定よりも広い概念で比較されていることがある。この場合に備えて、情報処理装置１００は、技術情報１２３および特許情報１２５の関連性を再評価可能に構成される。具体的には、情報処理装置１００は、評価結果画面４００Ｃ（図１１参照）がユーザ端末２００のディスプレイ２０６に表示されている際に、特許情報１２５を技術情報１２３と比較する際における概念レベルに関する入力を受け付ける。

ある局面において、「概念レベルに関する入力」は、評価結果画面４００Ｃ内の入力欄（図示しない）において実現される。一例として、技術情報１２３と特許情報１２５との評価結果として、「両特許ともに情報処理システムとその方法に関連している。」との結果が表示されたとする。この場合、ユーザは、たとえば、「概念レベルに関する入力」として［「情報処理システムとその方法」といった概念は広すぎるため、「戦略を適切に評価する情報処理システム」、など具体的な概念で比較して下さい。］との文言を入力する。このような指示文の入力により、「概念レベルに関する入力」が実現される。

他の局面において、「概念レベルに関する入力」は、評価結果画面４００Ｃ内の選択欄（図示しない）において実現される。当該選択欄の選択肢には、評価時における概念レベルが示されている。選択肢としては、たとえば、概念「広い」、概念「普通」および概念「狭い」が挙げられる。

概念「広い」には、第１の概念を基準に関連性を再評価するための指示文が関連付けられている。概念「中」には、第２の概念を基準に関連性を再評価するための指示文が関連付けられている。第２の概念は、第１の概念よりも狭い。概念「狭い」には、第３の概念で関連性を再評価するための指示文が関連付けられている。第３の概念は、第２の概念よりも狭い。

その後、情報処理装置１００は、「概念レベルに関する入力」を反映した再評価のための指示文を生成する。反映の方法は、任意である。一例として、情報処理装置１００は、「概念レベルに関する入力」を再評価のための指示文に含める。

その後、情報処理装置１００は、生成した再評価のための指示文を大規模言語モデル３２４に入力する。そして、情報処理装置１００は、大規模言語モデル３２４から得られる結果を出力する。これにより、ユーザは、概念レベルを段階的に狭めながら関連性評価を行うことができる。

なお、「概念レベルに関する入力」を受け付けるタイミングは、関連性評価の実行後に限定されず、関連性評価の実行前であってもよい。

一例として、「概念レベルに関する入力」は、関連性評価に係る条件を設定するための上述の入力画面４００Ａ，４００Ｂ（図７，図８参照）で受け付けられてもよい。「概念レベルに関する入力」は、上述の指示文１２８（図９など参照）に反映する。これにより、ユーザは、概念レベルを指定して関連性評価を行うことができる。

＜Ｊ３．その他＞
次に、上記実施の形態のさらに他の例について説明する。

上述の図１１の例では、大規模言語モデル３２４から出力される評価スコアや評価理由が評価結果画面４００Ｃにそのまま出力されていた。しかしながら、大規模言語モデル３２４の出力が評価結果画面４００Ｃに必ずしもそのまま出力される必要はない。

一例として、情報処理装置１００は、予め定められたアルゴリズムに基づいて、技術情報１２３と特許情報１２５との類似度を算出する。類似度の算出アルゴリズムには、任意の技術が採用され得る。一例として、情報処理装置１００は、技術情報１２３および特許情報１２５のそれぞれから、文章、画像または特許分類などに基づく特徴ベクトルを抽出する。そして、情報処理装置１００は、技術情報１２３から抽出された特徴ベクトルと、特許情報１２５から抽出された特徴ベクトルとの類似度を算出する。当該類似度は、たとえば、コサイン類似度である。特徴ベクトルを抽出するためには、たとえば、単語のＴＦ、ＴＦＩＤＦ、ＢＭ２５、その他頻度に応じた指標や、Ｗｏｒｄ２Ｖｅｃ、ＦａｓｔＴｅｘｔなどの単語ベクトルを生成するモデルによって得られる指標、ＢＥＲＴなど文エンコーダーモデルによって得られる指標が用いられ得る。

そして、情報処理装置１００は、大規模言語モデル３２４から得られる観点別の評価結果と、上記算出された類似度と総合し、評価結果として出力する。当該観点別の評価結果と当該類似度とを総合する方法は、任意である。一例として、情報処理装置１００は、大規模言語モデル３２４から得られる観点別の評価結果に対して、上記算出された類似度を加算することで総合する。

＜Ｊ４．その他＞
次に、上記実施の形態のさらに他の例について説明する。

上述の例では、情報処理装置１００は、技術情報１２３と特許情報１２５との関連性を各観点で評価する際に、１つの大規模言語モデル３２４を用いていた。しかしながら、情報処理装置１００は、観点ごとに異なる大規模言語モデル３２４を用いて、技術情報１２３と特許情報１２５との関連性を評価してもよい。

図１４は、本例における関連性評価の処理を概略的に示す図である。図１４には、異なる種類の大規模言語モデル３２４Ａ，３２４Ｂが示されている。

大規模言語モデル３２４Ａには、技術情報１２３と特許情報１２５との関連性を観点「α」で評価するための指示文１２８Ａが入力される。一方で、大規模言語モデル３２４Ｂには、技術情報１２３と特許情報１２５との関連性を観点「β」で評価するための指示文１２８Ｂが入力される。このように、本例においては、利用する大規模言語モデル３２４Ａ，３２４Ｂは、評価観点別に決められている。

典型的には、大規模言語モデル３２４Ａは、観点「α」での関連性評価に適するようにチューニングされている。同様に、大規模言語モデル３２４Ｂは、観点「β」での関連性評価に適するようにチューニングされている。当該チューニングには、たとえば、ＣｈａｔＧＰＴＡＰＩのファインチューニング、またはＬｌａｍａ２、ＪａｐａｎｅｓｅＳｔａｂｌｅＬＭなどのオープンソースモデルのファインチューニングが使用される。

＜Ｊ５．その他＞
次に、上記実施の形態のさらに他の例について説明する。

上述の例では、情報処理装置１００は、技術情報１２３の文章内容と特許情報１２５の文章内容との関連性を評価していた。これに対して、本例では、情報処理装置１００は、技術情報１２３に含まれる図面の内容と特許情報１２５に含まれる図面との関連性を評価する。

図１５は、本例における関連性評価の処理を概略的に示す図である。図１５に示されるように、技術情報１２３は、１つ以上の図面１２３Ｆを含む。同様に、特許情報１２５は、１つ以上の図面１２５Ｆを含む。また、指示文１２８は、２つの情報の関連性を図面の内容の観点で評価するように規定されている。図面１２３Ｆ，１２５Ｆは、たとえば、画像データである。画像の形式については特に限定されない。

情報処理装置１００は、指示文１２８の引数部１２９Ａに対して技術情報１２３を指定し、指示文１２８の引数部１２９Ｂに対して特許情報１２５を指定する。技術情報１２３と特許情報１２５とが指定された指示文１２８は、情報処理装置１００からサーバ３００に送信され、サーバ３００内の大規模言語モデル３２４に入力される。

大規模言語モデル３２４は、指示文１２８の入力を受けると、指示文１２８に応じた回答を生成する。なお、大規模言語モデル３２４は、画像の内容を解釈可能に学習されている。これにより、大規模言語モデル３２４は、技術情報１２３に含まれている図面１２３Ｆの内容を解釈するとともに、特許情報１２５に含まれている図面１２５Ｆの内容を解釈する。画像の内容を解釈可能な大規模言語モデルとして、たとえば、ＣＬＩＰ（Contrastive Language-Image Pretraining）、ＢＬＩＰ（Bootstrapping Language Image Pre-training for unified vision-language understanding and generation）、ＶｉＬＢＥＲＴ（Vision-and-Language BERT）などが用いられ得る。

情報処理装置１００は、大規模言語モデル３２４から得られる各解釈結果に基づいて、技術情報１２３と特許情報１２５との関連性を示す評価結果１３０を図面の内容の観点について出力する。当該関連性は、関連度合いを示す数値で表わされてもよいし、説明文で表わされてもよい。図１５の例では、当該関連性が数値で表わされている。

上記関連性が説明文で出力される場合、当該説明文は、「技術情報１２３に含まれる図面１２３Ｆは、XXXという構造を有しており、特許情報１２５に含まれる図面１２５Ｆと比べて、XXXという部分が一致していない。」などの文言で示される。

＜Ｊ６．その他＞
次に、上記実施の形態のさらに他の例について説明する。

本例では、情報処理装置１００は、技術情報１２３と特許情報１２５との関連性を同一の観点に関して段階的に評価する。これにより、関連性評価の精度が向上する。

図１６は、本例における指示文１２８Ｃを示す図である。指示文１２８Ｃは、指示１３２Ａ（第１の指示）と、指示１３２Ｂ（第２の指示）とを含む。指示１３２Ａは、２つの情報の関連性を特定の観点で評価させるための指示である。指示１３２Ｂは、指示１３２Ａに基づく２つの情報の関連性の評価結果を用いて、当該２つの情報の関連性を同一の観点でさらに評価させるための指示である。

情報処理装置１００は、指示文１２８Ｃの引数部１２９Ａに対して技術情報１２３を指定し、指示文１２８Ｃの引数部１２９Ｂに対して特許情報１２５を指定する。技術情報１２３と特許情報１２５とが指定された指示文１２８Ｃは、大規模言語モデル３２４に入力される。大規模言語モデル３２４は、指示文１２８Ｃの入力を受けると、指示文１２８Ｃに応じて、技術情報１２３と特許情報１２５との関連性を多段階で評価する。

今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。

１０情報処理システム、１００情報処理装置、１０１制御装置、１０２ＲＯＭ、１０３ＲＡＭ、１０４通信インターフェイス、１０５表示インターフェイス、１０６ディスプレイ、１０７入力インターフェイス、１０８入力デバイス、１１０バス、１２０補助記憶装置、１２２分析プログラム、１２３技術情報、１２３Ｆ図面、１２４特許データベース、１２５特許情報、１２５Ｆ図面、１２８指示文、１２８Ａ指示文、１２８Ｂ指示文、１２８Ｃ指示文、１２９Ａ引数部、１２９Ｂ引数部、１３０評価結果、１３２Ａ指示、１３２Ｂ指示、２００ユーザ端末、２０１制御装置、２０２ＲＯＭ、２０３ＲＡＭ、２０４通信インターフェイス、２０５表示インターフェイス、２０６ディスプレイ、２０７入力インターフェイス、２０８入力デバイス、２１０バス、２２０補助記憶装置、２２２分析プログラム、３００サーバ、３２４大規模言語モデル、３２４Ａ大規模言語モデル、３２４Ｂ大規模言語モデル、３２６回答情報、４００Ａ入力画面、４００Ｂ入力画面、４００Ｃ評価結果画面、４１０選択欄、４１２入力欄、４２０入力欄、４２２選択欄、４２４入力欄、４２６選択欄、４２８開始ボタン、４３０表示領域、４４０表示領域、４４２表示領域、４４４表示領域、４４６表示領域、ＮＷネットワーク。

Claims

特許情報の分析プログラムであって、
前記分析プログラムは、コンピュータに、
技術的思想を含む技術情報を取得するステップと、
前記技術情報と比較する対象の特許情報を取得するステップと、
２つの情報の関連性を特定の観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定するステップと、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力するステップとを実行させる、分析プログラム。
前記所定の指示文は、２つの情報の関連性を複数の観点から評価するよう規定されており、
前記出力するステップでは、前記技術情報と前記特許情報との関連性を示す評価結果が前記複数の観点の各々について出力される、請求項１に記載の分析プログラム。
前記複数の観点は、技術分野の観点と、課題の観点と、作用機能の観点と、内容示唆の観点と、パラメータの観点と、数値限定の観点と、技術用語の観点との内の少なくとも１つを含む、請求項２に記載の分析プログラム。
前記分析プログラムは、前記コンピュータに、さらに、
前記観点の別の前記評価結果を纏めた総合評価結果を出力するステップを実行させる、請求項２または３に記載の分析プログラム。
前記複数の観点の各々には、重みが関連付けられており、
前記総合評価結果は、前記観点の別の前記評価結果に対して前記重みを付けて算出される、請求項４に記載の分析プログラム。
前記所定の指示文は、
前記２つの情報の関連度を前記大規模言語モデルに出力させるための指示と、
前記関連度の評価理由を前記大規模言語モデルに出力させるための指示とを含み、
前記評価結果は、
前記技術情報と前記特許情報とに係る前記関連度と、
前記技術情報と前記特許情報とに係る前記評価理由とを含む、請求項１～３のいずれか１項に記載の分析プログラム。
前記分析プログラムは、前記コンピュータに、さらに、
前記特許情報を前記技術情報と比較する際における概念レベルに関する入力を受け付けるステップを実行させ、
前記指定するステップは、さらに、前記概念レベルに関する入力を前記指示文に反映することを含む、請求項１～３のいずれか１項に記載の分析プログラム。
前記分析プログラムは、前記コンピュータに、さらに、
前記評価結果がディスプレイに表示されている際に、前記特許情報を前記技術情報と比較する際における概念レベルに関する入力を受け付けるステップと、
前記概念レベルに関する入力を反映した再評価のための指示文を生成するステップと、
前記再評価のための指示文を前記大規模言語モデルに入力することで当該大規模言語モデルから得られる結果を出力するステップとを実行させる、請求項１～３のいずれか１項に記載の分析プログラム。
前記分析プログラムは、前記コンピュータに、さらに、
予め定められたアルゴリズムに基づいて、前記技術情報と前記特許情報との類似度を算出するステップを実行させ、
前記評価結果は、前記大規模言語モデルから得られる前記結果と、前記類似度とに基づいて、前記観点の別に出力される、請求項１～３のいずれか１項に記載の分析プログラム。
前記複数の観点は、
第１の観点と、
前記第１の観点とは異なる第２の観点とを含み、
前記大規模言語モデルは、
第１の言語モデルと、
前記第１の言語モデルとは異なる第２の言語モデルとを含み、
前記第１の観点で前記技術情報と前記特許情報との関連性を評価するための前記指示文は、前記第１の言語モデルに入力され、
前記第２の観点で前記技術情報と前記特許情報との関連性を評価するための前記指示文は、前記第２の言語モデルに入力される、請求項２または３に記載の分析プログラム。
前記技術情報は、図面を含み、
前記特許情報は、図面を含み、
前記観点は、図面の内容の観点を含む、請求項１～３のいずれか１項に記載の分析プログラム。
前記指示文は、
前記２つの情報の関連性を特定の観点で評価させるための第１の指示と、
前記第１の指示に基づく前記２つの情報の関連性の評価結果を用いて、当該２つの情報の関連性を前記特定の観点でさらに評価させるための第２の指示とを含む、請求項１～３のいずれか１項に記載の分析プログラム。
特許情報を分析することが可能な情報処理装置であって、
前記情報処理装置をするための制御部を備え、
前記制御部は、
技術的思想を含む技術情報を取得する処理と、
前記技術情報と比較する対象の特許情報を取得する処理と、
２つの情報の関連性を観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定する処理と、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力する処理とを実行する、情報処理装置。
コンピュータによって実行される特許情報の分析方法であって、
技術的思想を含む技術情報を取得するステップと、
前記技術情報と比較する対象の特許情報を取得するステップと、
２つの情報の関連性を複数の観点から評価するための所定の指示文に対して、前記技術情報と前記特許情報とを指定するステップと、
前記技術情報と前記特許情報とが指定された前記指示文を大規模言語モデルに入力することで当該大規模言語モデルから得られる結果に基づいて、前記技術情報と前記特許情報との関連性を示す評価結果を前記観点について出力するステップとを備える、分析方法。