JP6812157B2 - 新着情報の検索システム、検索方法、およびプログラム - Google Patents

新着情報の検索システム、検索方法、およびプログラム Download PDF

Info

Publication number
JP6812157B2
JP6812157B2 JP2016145688A JP2016145688A JP6812157B2 JP 6812157 B2 JP6812157 B2 JP 6812157B2 JP 2016145688 A JP2016145688 A JP 2016145688A JP 2016145688 A JP2016145688 A JP 2016145688A JP 6812157 B2 JP6812157 B2 JP 6812157B2
Authority
JP
Japan
Prior art keywords
information
teacher
learning model
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016145688A
Other languages
English (en)
Other versions
JP2018018167A5 (ja
JP2018018167A (ja
Inventor
亮 王
亮 王
加藤 玲雄
玲雄 加藤
聡 永沼
聡 永沼
龍太郎 田嶋
龍太郎 田嶋
廣本 英久
英久 廣本
高野 誠司
誠司 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2016145688A priority Critical patent/JP6812157B2/ja
Priority to PCT/JP2017/026648 priority patent/WO2018021227A1/ja
Publication of JP2018018167A publication Critical patent/JP2018018167A/ja
Publication of JP2018018167A5 publication Critical patent/JP2018018167A5/ja
Application granted granted Critical
Publication of JP6812157B2 publication Critical patent/JP6812157B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、新着情報を検索する技術に関する。
特許情報の調査を行う分野において、SDI(Selective Dissemination of Information)検索が広く行われている(特許文献1参照)。SDI検索とは、予めユーザが設定した検索条件に従って、新たに発行された公報に対して検索処理を行い、検索結果をユーザに提供する技術である。SDI検索は、例えば、技術情報のウォッチングなどに用いられる。
特開2007−233910号公報
SDI検索においては、所望する検索結果が得られるような検索条件を、ユーザが設定する。SDI検索で得られる結果はユーザの習熟度に依存する側面があり、不必要なノイズ成分が含まれる場合や、必要な公報の抽出漏れが生じる可能性がある。
本発明に係る検索システムは、少なくとも1つの公報に関する入力データと、前記入力データに対応する少なくとも1つの公報に関する出力データとの関係を示す教師データに基づいて、学習モデルを構築するモデル構築部と、所定の期間の間に発行された公報に関する新着情報を、前記入力データとして、前記学習モデルに入力する新着情報入力部と、前記新着情報の入力に応じて前記学習モデルから出力された結果をユーザ端末に提供する出力結果提供部と、前記ユーザ端末から、前記教師データの元となる教師情報を受信する受信部と、前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入部とを有する。
本発明によれば、SDI検索の精度を高めることができる。
検索システムを含む構成の一例を示す図である。 学習モデルの構成の一例を示す図である。 初期教師データを説明する図である。 検索システムが行う処理のフローチャートの一例を示す図である。 初期教師データ取得処理の一例を説明するフローチャートである。 教師候補の検索条件を設定するUI画面の例である。 新着情報の設定及び出力結果の設定を行うUI画面の例である。 新着情報の絞り込みを説明する概念図である。 出力結果と教師情報の入力の例とを説明する図である。 教師情報の入力の例を説明する図である。 検索システムが行う処理の概要を時系列で説明する図である。 検索システムを含む構成の他の例を示す図である。 検索システムを含む構成の他の例を示す図である。
以下、図面を参照しながら本発明の実施形態について詳細に説明する。なお、以下の実施形態において説明する構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<実施形態の概要と背景>
実施形態の概要とその背景を概略的に説明する。近年、人工知能(AI:Artificial Intelligence)の発展が目覚ましい。人工知能にはいわゆる「教師あり学習」によって学習モデルを構築する機械学習装置と、「教師なし学習」によって学習モデルを構築する機械学習装置とがある。「教師あり学習」の場合、教師データが機械学習装置に投入され、機械学習装置はこの投入された教師データに基づく学習モデルを構築する。このようにして構築された学習モデルに処理対象のデータを入力すると、学習モデルは、学習済みの内容に従った結果を出力する。
AIを用いることによってユーザの所望する公報が自動的に抽出されることが理想である。しかしながら、各種の公報は、現在までに大量に発行されており、全ての公報を教師データとする学習モデルを構築するにはデータ量が膨大過ぎる。ここで「公報」とは、特許、実用新案、意匠、商標などの出願公開公報、特許掲載公報などの各種の公報を含む。特許庁が発行する公報のみならず、定期的に発行される技術文献、技術論文を含んでもよい。AIを用いてこれらの発行済みの公報の中から所望の公報を抽出するには、相当な時間を要する。特に、オンラインでのリアルタイムでの検索結果を提供するサービスにおいてはユーザの待機時間が長期にわたってしまいサービスとして成り立たない。
一方、SDI検索は、特許庁等が定期的に発行する新着情報に対して行われるサービスである。つまり、現時点での発行済みの全ての公報に対して検索処理が行われるわけではない。したがって、1回のSDI検索において扱われるデータ量は、現在までに発行済みの全ての公報を対象として検索が行われる場合と比べてはるかに少ない。このように、扱うデータ量が比較的少ない点がSDI検索の特徴の一つである。
さらに、SDI検索を行う場合、検索結果が必ずしもユーザが所望する結果にならないことがある。所望する結果ではない検索結果を、所望とする検索結果になるべく近づけるように試みることがユーザによって行われている。具体的には、例えば検索漏れが生じた内容を含めるように、次回以降のSDI検索で用いる検索条件を修正することがユーザによって行われる。あるいは、ノイズ成分の公報が含まれてしまった場合、そのノイズ成分の公報を含まないように検索条件を修正することがユーザによって行われる。つまり、所望の結果を得るために検索条件が適宜修正され得る点がSDI検索の特徴の一つである。
以上のような点を鑑みると、SDI検索はAIを適用するに好適な対象であるといえる。つまり、扱うデータ量が少ないので比較的短い学習時間で学習モデルを構築することができる。また、発行される公報の間隔が空いているので、学習モデルの構築に余裕を持たせることができる。また、ユーザが検索条件を模索しながら所望とする検索結果を求めようとする過程は、AIが行う機械学習に適する工程といえる。
以下で説明する実施形態は、AIをSDI検索に応用することで、所望とする検索結果を精度良く効率的にユーザに提供することを可能とする形態を説明する。
<実施形態1>
<構成>
図1は、実施形態にかかる検索システム100の構成の一例を示す図である。検索システム100は、モデル構築部110、学習モデル115、初期教師データ取得部120、教師データ投入部140、新着情報入力部150、出力結果提供部160、教師情報受信部170、及び教師データ生成部180を有する。図1は構成の一例を示したものに過ぎず、他の構成を含んでもよい。また、図1に記載された構成の全てが必須の要件であるとは限らない。検索システム100は、公報データベース(DB)130とネットワークを通じて通信可能に構成されてよい。
検索システム100は、情報処理装置として実現することができる。情報処理装置は、CPU、メモリ、HDD、及びネットワークインタフェースを有してよい。図1に示す各部は、HDDに格納されたプログラムが一時的にメモリに読み出され、CPUがメモリに読み出されたプログラムを実行することで、CPUが図1に示す各部として機能してよい。また、図1に示す各部のうちの少なくとも一部が、各種のネットワークを通じて相互に接続された複数の情報処理装置によって実現されてよい。また、図1に示す各部のうちの少なくとも一部(例えばモデル構築部110及び学習モデル115)は、複数の情報処理装置による分散処理によって実現されてよい。
検索システム100は、ユーザが使用する端末(以下、ユーザ端末135と呼ぶ)との間で通信が可能に構成されており、ユーザ端末135に検索結果を提供したり、ユーザ端末135から検索条件や後述する教師情報などを、ネットワークを通じて受信したりしてよい。
ユーザ端末135は、パーソナルコンピュータ、タブレット、モバイル端末など任意の種類の端末であってよい。検索システム100は、ユーザをログイン管理しており、ログインしたユーザに固有の検索条件や検索結果などを、ユーザ端末135に提供することができる。
本実施形態の検索システム100は、ユーザ毎に異なるように構成してよい。A社がA社用にカスタマイズした教師データに基づいて構築された学習モデル115を、A社と異なるB社が用いると、B社の所望する結果が得られないからである。また、A社がA社用にカスタマイズした学習モデル115を、A社とライバルのC社に使わせることはA社の意図に反し、情報保護の観点からも適切でないからである。したがって、本実施形態の検索システム100は、ユーザ毎に学習モデル115がカスタマイズされることになる。なお、実施形態3で説明するように、複数のユーザ(例えばA社内の複数の社員)によって共有されるSDI検索を行う場合には、モデル構築部110、学習モデル115、教師データ投入部140、出力結果提供部160、教師情報受信部170、及び教師データ生成部180は、複数のユーザによって共有されてよい。
モデル構築部110は、学習モデル115を構築する。なお、本明細書において「構築」とは、新たにモデルを生成すること、生成済のモデルを変更、更新すること、及び新たに生成したモデルで既存のモデルを置き換えることを含む概念として用いることとする。例えば、モデル構築部110は、構築されている学習モデルがない場合、新たにモデルを生成してよい。モデル構築部110は、既に構築されている学習モデルがある場合、その学習モデルの一部の構成を変更または更新することで新たに学習モデルを構築してよい。モデル構築部110は、新たに学習モデルを生成し生成した学習モデルで、既に構築されている学習モデルを置き換えてもよい。モデル構築部110は、学習モデル115として、例えば図2に示すようなニューラルネットワークを構築してよい。ニューラルネットワークは、入力層210、中間層220、及び出力層230を含む。それぞれの層は、複数のノードで構成される。図2では、入力層210は、ノード211、212、213を含み、中間層220は、ノード221、222、223を含み、出力層230は、ノード231、232、233を含む例を示している。各層に含まれるノードの数は図示した例に限られるものではなく、多数のノードから構成される形態が一般的である。中間層220は一層に限られるものではなく、複数の層から構成されてよい。それぞれのノードには重みが設定されており、入力されたデータに重みを掛け合わせた値を後段のノードに伝えていく。
教師あり学習では、例えば、教師データとして、入力データと入力データに対応する出力データとを用意する。モデル構築部110は、入力データが出力データと等しくなるように各ノードに設定される重みを調整する処理を繰り返す。このようにして、モデル構築部110は学習モデル115を構築する。その後、処理対象のデータが学習モデル115に入力されると、学習モデル115は構築されたモデルに従った結果を出力することになる。
本実施形態において、モデル構築部110は、公知の機械学習処理を実行することで学習モデル115を構築してよい。例えば、モデル構築部110は、CNN(Convolutional Neural Network)を用いてもよいし、RNN(Recurrent Neural Network)を用いてもよい。その他の手法を用いてもよい。ニューラルネットワークではなく、SVM(Support Vector Machine)で学習モデル115を構築してもよい。本実施形態において学習モデル115それ自体は任意の種類のものを用いてよい。
初期教師データ取得部120は、初期教師データを取得し、教師データ投入部140に出力する。初期教師データ取得部120は、公報DB130に格納されている公報を用いて初期教師データを取得してよい。公報DB130は、例えば利用可能な発行済みの全ての公報が格納されたDBである。公報DB130は、前述のように、特許、実用新案、意匠、商標などの出願公開公報、特許掲載公報などの各種の公報を含み、また、特許庁が発行する公報のみならず、定期的に発行される技術文献、技術論文を含んでもよい。このように、公報DB130は、単一のDBである必要はなく、複数のDBの集合であってよい。公報DB130は、日本国内の公報のみならず、諸外国の公報のDBを含んでよい。
初期教師データ取得部120は、例えば類似検索、概念検索、検索式などの各種の検索を行った結果を初期教師データとして取得してよい。説明の便宜上、この検索のことを初期検索と呼ぶ。なお、類似検索とは、ユーザが特定の公報を指定すると、その公報に類似する公報を、関連度を示すスコアと共に抽出する手法のことを指す。概念検索とは、ユーザが特定の文章を入力すると、その特定の文章に類似する公報を、関連度を示すスコアと共に抽出する手法のことを指す。検索式とは、一般的なキーワード検索や、出願人名など、各種の検索式を指定する手法のことを指す。初期教師データ取得部120は、所定の期間、所定の分類(例えば所定の国際特許分類)によって抽出された公報を母集合として用いて初期検索を実行してもよい。このような検索を行った結果、ユーザが適切と考えた公報を初期教師データとして用いてよい。例えば5件の公報を検索結果の中から抽出して初期教師データとして用いてよい。なお、初期教師データは、各種の検索処理を行った結果を必ずしも用いなくてよい。例えば、ユーザ端末135に格納されている任意の公報が初期教師データ取得部120に送信されてよく、初期教師データ取得部120は、送信された公報を初期教師データとして用いてもよい。
初期教師データは、少なくとも1つの公報に関する入力データと、その入力データに対応する少なくとも1つの公報に関する出力データとの関係を示す教師データとしてよい。具体的な入力データの例としては、母集合として含まれる各公報のデータを用いればよい。例えば、公報のうちの「要約文」や「特許請求の範囲」などのように公報のうちの一部のテキストデータを入力データとして用いてよい。出力データの具体例としては、入力データに対する近似度を示す値を用いてよい。例えば、本実施形態においては値1が最も近似している値を示すものとする。入力データに用いるある公報を公報P1とする。ユーザは、公報P1に似た公報を抽出する学習モデルを構築したい場合、この入力データ(公報P1)に対応する出力データとして値1が設定された教師データを用いればよい。逆に、ユーザが例えば公報P3に似た公報を抽出したくないことが予めユーザが認識できている場合には、公報P3を入力データとした場合の出力データとして値0が設定された教師データを用いればよい。本実施形態において値0は全く近似していないことを示すものとする。
図3は、初期教師データの一例を示す図である。図3では、概念検索として「要約」を対象とし、用語として「人工知能 自動車」をキーワードとして用いて概念検索を実行して得られた公報の中から一部の公報を初期教師データとして用いる例を示している。例えば、初期教師データ取得部120は、公報の要約文の文書に対して形態素解析などを行い、ベクトル演算によって関連度を示すスコアをそれぞれの公報について算出する。
初期教師データとしては、スコアが所定値以上の公報を入力データとして用いてよい。具体的には、それぞれの公報の要約文の文章のテキストデータを入力データとして用い、出力データとして近似を示す値1を用いればよい。なお、スコアが所定値以上の公報であっても、不適切であるとユーザが判断した公報については、例えば公報P3のように、近似していないことを示す値0を用いてもよい。
モデル構築部110は、この教師データを用いて学習モデル115の構築を行う。例えば、学習モデルを構成するニューラルネットワークの各ノードの重みを変える。このような学習モデル115が構築されると、その後の処理対象の公報のデータを入力した際に、「人工知能 自動車」をキーワードとして概念検索を行った場合と同等の結果を学習モデル115は出力データとして出力することができる。出力データとしては、例えば0から1までの間の近似度が出力される。この近似度を概念検索の結果のスコアに正規化することで、概念検索を行った場合と同等のスコアを得ることができる。
なお、例えば図3に示す初期教師データを用いて構築された学習モデル115に対して、処理対象の入力データとして再度公報P1を入力した場合、学習済みの内容と全く同じデータが入力されていることになるので、学習モデル115は、近似を示す値1に限りなく近い値を出力することになる。
なお、図3に示す例では、概念検索を行った結果を初期教師データとして用いる例を説明したが、前述のとおり、初期学習データとして用いる公報は任意の方法で得られたものを用いてよい。
また図3の例では文章の場合を例に挙げて説明したが、その他、例えば意匠公報や商標公報の場合には、該当する画像データを入力データ及び出力データとして用いればよい。その他、書誌情報を用いてもよい。これらを組み合わせたデータでもよい。教師データには、公報のどの部分(例えば、書誌情報、要約、請求の範囲、図面など)を用いて学習したかを示す付加情報が含まれてよい。モデル構築部110は、付加情報を参照して、新着情報として入力される公報の中の対応する箇所を入力データとして用いてよい。
教師データ投入部140は、入力された教師データをモデル構築部110に投入する。教師データ投入部140に入力される教師データには、前述の初期教師データと、教師データ生成部180によって生成された教師データとが含まれる。
新着情報入力部150は、公報DB130から新着情報を取得する。新着情報入力部150は、所定のタイミングで新着情報を取得してよい。例えば、公報DB130の更新の都度、新着情報を取得してよい。ウィークリー、マンスリーなどのように、前回の新着情報の取得時期から所定の期間間隔で新着情報を取得してもよい。新着情報とは、新着情報入力部150が前回の新着情報を取得した時点から新たに発行された公報としてよい。
出力結果提供部160は、新着情報が学習モデル115に入力され、学習モデル115が出力した出力結果をユーザ端末135に提供する。例えば出力結果提供部160は、学習モデル115が出力した出力結果をユーザ端末135のディスプレイに表示してよい。図3の例で説明すると、入力データとして「公報X」の要約文が学習モデル115に入力されると、学習モデル115は、例えば近似度を示す値として「0.8」のようなデータを出力する。学習モデル115は、入力データとして用いた「公報X」という識別番号と、例えば「近似度0.8」というデータとを対応付けた出力データを出力してよい。出力結果提供部160は、学習モデル115が出力する出力データ(近似度を示す値)に所定の閾値を設定してもよい。例えば、閾値として0.7を設定する場面を想定する。このとき、出力結果提供部160は、学習モデル115から出力された出力データ(近似度を示す値)が0.7以上となる入力データを、ユーザ端末135のディスプレイに出力結果として表示してもよい。出力結果提供部160は、出力結果が抽出されたことを、登録済みのユーザのメールアドレスなどに通知する。この通知を受けてユーザ端末からアクセスがあった場合、出力結果提供部160は、アクセスをしたユーザ端末135に出力結果を提示してもよい。
出力結果提供部160は、学習モデル115から出力された出力結果を所定の条件に従って並び順を変えてユーザ端末135にしてよい。例えば、図3に示す初期教師データを用いて構築された学習モデル115から出力された出力データを正規化して新着情報の公報のスコアをそれぞれ出力してもよい。つまり、学習モデル115の学習内容に、より近似している公報に対してより高いスコアを出力してもよい。出力結果提供部160は、スコアが高い順に並び順を変更した出力結果をユーザ端末135に提供してよい。
教師情報受信部170は、出力結果提供部160から出力結果が提供されたことに応じてユーザ端末135から送信される教師情報を受信する。教師情報とは、出力結果提供部160が出力した結果(すなわち、学習モデル115の出力した内容)が正しい(適切か)か、あるいは間違っているか(不適切か)をユーザが指定した情報としてよい。正誤の二択だけではなく、正しいか間違っているかわからない、といった選択肢があってよい。このような2段階または3段階の指定に限らず、多段階の中から任意の段を指定する情報でもよい。例えば適切度合や不適切度合を指定する情報でもよい。教師情報受信部170は、ユーザ端末135から受信した教師情報を教師データ生成部180に出力する。
教師データ生成部180は、教師情報に基づいて、教師データを生成して教師データ投入部140に出力する。例えば教師情報が、公報P11は適切な結果であり、公報P12は不適切な結果であることをユーザが指定した情報であると想定する。この場合、教師データとしては、公報P11と公報P12とを入力データとし、公報P11の近似度を示す値を1にし、公報P12の近似度を示す値を0に設定した出力データとする教師データが生成されてよい。
教師データ投入部140に出力された教師データは、教師データ投入部140によってモデル構築部110に投入される。モデル構築部110は、教師データを用いて学習モデル115を構築する。その後、構築された学習モデル115に、新着情報入力部150から新着情報が入力されると、学習モデル115はモデルに従った結果を出力する。以下、このサイクルが繰り返される。モデル構築部110は、教師データを用いて学習モデルを構築する処理を繰り返すことで、精度の高い学習モデル115を構築することができ、学習モデル115は精度の高い結果を出力することができる。つまり、新着情報の中からユーザが所望とする結果(例えばスコアが高い順に並んだ公報一覧)を抽出することができる。
図4は、本実施形態にかかる処理の一例を示すフローチャートである。図4に示す処理は、ユーザがユーザ端末135を用いて検索システム100にログインし、SDI検索の設定を最初に行う際に検索システム100において実行される。
ステップS401において初期教師データ取得部120は、初期データを取得する。ステップS401の詳細な処理の例を説明する。
図5は、図4のステップS401の処理の一例を示すフローチャートである。図5に示す処理は、初期教師データ取得部120によって実行される。
ステップS501において初期教師データ取得部120は、初期教師データの候補である教師候補の検索条件を設定する。例えば、初期教師データ取得部120は、ユーザ端末135に図6に示すようなUI画面600を表示させる。UI画面600には、教師出願をユーザが指定する領域601、教師文章をユーザが指定する領域602、絞り込み条件(検索式)をユーザが指定する領域603、及び実行ボタン604が含まれる。
領域601には、例えば類似検索を行う出願番号、公報番号などを入力することができる。領域602には、例えばユーザが概念検索を行う文章を入力することができる。領域603には、例えばユーザが絞り込み条件を入力することができる。例えば特定の技術分野に絞って検索を実行したいような場合には、国際特許分類(IPC)などを入力する。
入力後に実行ボタン604が押下されると、入力されたデータがユーザ端末135から検索システム100(初期教師データ取得部120)に送られる。
ステップS502において初期教師データ取得部120は、ステップ501で設定された検索条件(ユーザ端末135から送信された検索条件)に従って公報DB130を検索する。例えば、領域601に番号が入力された場合、初期教師データ取得部120は、入力された番号に従った類似検索を、検索システム100を用いて実行してよい。領域602に文章が入力された場合、初期教師データ取得部120は、入力された文章に従った概念検索を、検索システム100を用いて実行してよい。領域603に絞り込み条件が入力された場合、初期教師データ取得部120は、絞り込み条件に従った検索を実行してよい。
ステップS503において初期教師データ取得部120は、検索結果を取得する。初期教師データ取得部120は、検索の結果得られた公報を初期教師データとして取得してよい。
ステップS504において初期教師データ取得部120は、ユーザからの教師情報を受信してもよい。ステップS504は、実行されてもよいし、実行されなくてもよい。ステップS504の処理は、後述するS404と同じ処理としてよい。
ステップS505において初期教師データ取得部120は、初期教師データを生成する。つまり、ステップS503で得られた結果をそのまま初期教師データとして用いてもよいし、ステップS504で教師情報を受信した場合には、その結果(つまり、ユーザが初期検索結果の妥当性を判断した結果と)を反映して生成した教師データを、初期教師データとしてもよい。
なお、図5のフローチャートにおいては、各種の検索を行って得られた結果を初期教師データとして用いる例を説明しているが、任意の公報を初期教師データとして用いてもよい。また、任意の文章をユーザが入力したテキストデータを初期教師データとして用いてもよい。
図4に戻り説明を続ける。このようにしてステップS401において初期教師データ取得部120が初期教師データを取得すると、ステップS402において教師データ投入部140は、初期教師データ取得部が取得した初期教師データをモデル構築部110に投入する。モデル構築部110は、投入された初期教師データを用いて学習モデル115を構築する。なお、初期教師データは任意の教師データを用いてよく、説明した例に限定されるものではない。また、既に学習モデルが構築されている状態においては、ステップS401及びステップS402の処理は省略してよい。
ステップS403において新着情報入力部150は、公報DB130から新着情報を取得する。新着情報入力部150は、所定の期間に発行された公報に関する新着情報を取得する。新着情報入力部150は、例えばユーザ端末135によって設定された条件に従って新着情報を取得する。
図7は、ユーザ端末135においてSDIの配信の詳細条件を設定するUI画面700の一例を示す図である。UI画面700は、ユーザ端末135に表示される。領域701は、配信頻度を設定する領域である。例えば、公報が発行される都度、ウィークリー、マンスリーなどをユーザ端末135において設定できる。新着情報入力部150は、設定された頻度に従って新着情報を公報DB130から取得する。領域705は、新着情報の絞り込み条件を設定する領域である。例えば、所定の出願人、国際特許分類などで絞り込み条件を設定してよい。新着情報入力部150は、新着情報のうち、ユーザが設定した絞り込み条件で新着情報を絞り込み、絞り込み済みの新着情報を学習モデル115に入力してもよい。なお、領域702から705は、出力結果提供部160が出力する出力結果の設定に用いられる。領域702から705の説明は後述する。
新着情報入力部150は、取得した新着情報を学習モデル115に入力する。学習モデル115は、入力された新着情報に基づく結果を出力する。例えば、新着情報に含まれる公報それぞれに対して近似を示す値を出力する。
ステップS404において出力結果提供部160は、学習モデル115から出力された結果に対して、必要に応じて所定の処理を行い、ユーザ端末135に結果を提供する。例えば、出力結果提供部160は、学習モデル115が出力した近似を示す値を正規化したスコアを、学習モデル115に入力された新着情報に含まれる公報にそれぞれ付与してよい。また出力結果提供部160は、スコアが付与された公報を、スコアが高い順に並び変えてよい。
出力結果提供部160は、図7に示すような、ユーザによって設定された項目に従った結果を、ユーザ端末135に提供してもよい。例えば、領域702は、ユーザ端末135に提供する件数を設定する領域である。領域702において件数が100件と設定されている場合、出力結果提供部160は、例えばスコアの高い順から上位100件をユーザ端末135に提供してよい。
なお、提供の方法は、一般的に行われている検索システムと同等としてよい。例えば、100件のリストをユーザ端末135に提供し、ユーザ端末135からそのうちの特定の案件の指定がなされた場合、その特定の案件の詳細な情報をユーザ端末135に提供する、などの処理を行ってよい。
領域703はスコア閾を設定する領域である。出力結果提供部160は、スコアが設定された閾値以上の公報のリストをユーザ端末135に提供してよい。
なお、図7の例では、近似を示す値を正規化したスコアを基準に件数を指定したり、閾値を設定する例を示しているが、これに限られない。例えば近似を示す値そのものを用いて設定してもよい。
領域704は、演算式を設定する領域である。設定された各種の条件の論理積(AND)、論理和(OR),否定(NOT)などの、各種の演算を設定できる。
領域705は絞り込み条件を設定する領域である。出力結果提供部160は、学習モデル115が出力した結果に対して、領域705で設定された条件に従って絞り込みを行い、絞り込み済みの結果をユーザ端末135に提供してよい。例えば特定の出願人や特定の国際特許分類に絞り込みを行ってよい。
なお、図7の領域701〜705は任意の設定領域であり、必ずしも設定がされていなくてもよい。設定がされていない場合には、初期値に基づく設定がなされてよい。
図8は、絞り込みを行う場合の概念を説明する図である。図8(a)は、出力結果提供部160が絞り込みを行う場合の例を示している。つまり、新着情報801が学習モデル115に入力されて出力結果802が得られる。そして、出力結果802に対して絞り込みが行われ、絞り込み結果803が得られる例を示している。図8(b)は、新着情報入力部150が絞り込みを行う場合の例を示している。つまり、新着情報851に対してまず絞り込みが行われ絞り込み結果852が得られる。そして、絞り込み結果852が学習モデル115に入力されて出力結果853が得られる例を示している。本実施形態で行われる絞り込みは、いずれの形態でもよい。
図4に戻り説明を続ける。ステップS405において、教師情報受信部170は、ユーザからの教師情報を受信する。教師情報について図9を用いて説明する。
図9は、出力結果提供部160が提供するUI画面900の例を示している。図9では、出力結果提供部160がスコアの高い順に新着情報に含まれる公報を並び替えた例を示している。
ユーザは、各公報の内容を検討し、所望とする結果であるか否かを例えばチェックボックス931をチェックするか、チェックボックス932をチェックするかで指定することができる。この指定した内容が教師情報となり、次回以降のモデル構築部110が構築する学習モデル115に反映されることになる。
図9の例においては、再一覧ボタン910と次回反映ボタン920とがUI画面900に含まれている。いずれのボタンを押下した場合であっても、教師情報は、教師情報受信部170から教師データ生成部180に出力される点は共通である。異なる点としては、再一覧ボタン910を押下した場合には、教師情報に応じた教師データを用いてモデル構築部110が学習モデル115を構築し、この構築された学習モデル115に再度同じ新着情報を入力した結果が提供される点が挙げられる。そして、再度の新着情報の入力に応じて学習モデル115から出力された結果を、出力結果提供部160がユーザ端末135に表示する。
例えば、UI画面900に示すようなチェックがなされた場合に、再一覧ボタン910が押下されると、UI画面950のような画面が表示されてよい。図9の例では、UI画面900で「○」にチェックされた公報を入力データとし、出力データとして近似を示す値1を設定した教師データが生成される。また、「×」にチェックされた公報を入力データとし、出力データとして近似しないことを示す値0を設定した教師データが生成される。このような教師データを用いてモデル構築部110は学習モデル115を構築する。構築された学習モデル115に対して、再度同じ新着情報を入力する。UI950は、このような場合の結果出力の例を示している。教師データに基づいてモデル構築部110が学習モデル115を構築するので、例えば学習モデルを構成するニューラルネットワークのノードの重みが変更される。したがって、再度同じ新着情報を入力した場合、UI画面900で「○」にチェックされた公報は、UI画面900よりも高いスコアが付与され、上位に表示される。一方、UI画面900で「×」にチェックされた公報は、UI画面950には表示されていない。なお、図示するスコアの増減例は、説明を簡便にする趣旨で示した例に過ぎず、これに限られるものではない。
次回反映ボタン920は、同じ新着情報を用いた結果の出力をせずに、次回の新着情報に教師情報を反映させる指示を入力するボタンである。
なお、教師情報受信部170は、例えば再一覧を要求するか否かを示すフラグを含めた教師情報を教師データ生成部180に送ることができる。教師データ生成部180は、このフラグが立っている場合には、新着情報入力部150に、学習モデル115に対して再度の新着情報(同じ新着情報)の入力を行わせる指示を出力してよい。
図9の例では、チェックボックスを用いて、正しいか、間違っているか、およびそれ以外の3段階の選択をユーザが行い得る形態を説明したがこれに限られない。図10は、各種のUI部品の例を示す図である。図10に示すように、チェックボックスの代わりにUI部品1001やUI部品1002をUI画面に含めてもよい。UI部品1001は、プラスに近づくほど所望の結果の公報であることを指示し、マイナスに近づくほど所望の結果の公報ではないことを指示するスライドバーである。UI部品1002は、5段階で指示するラジオボタンの例を示している。例えば、UI部品1002の例では、教師データの出力データとして用いられる近似値を「1」、「0.9」、「0.6」、「0.3」、「0」のように細分化して設定することができる。
また、教師情報として用いる対象を細分化して指定することもできる。UI部品1003は、ある特定の公報の中の特定の請求項が正しいとチェックすることが可能な形態を示している。UI部品1004は、ある特定の公報の中の特定の項目が正しいとチェックすることが可能な形態を示している。UI部品1003や1004を用いる場合には、チェックされた項目のみを教師情報において用いてよい。
図4に戻り説明を続ける。ステップS405において教師データ生成部180は、教師情報をもとに教師データを生成する。例えば、図9のUI画面900に示すようなチェックがされた場合、○にチェックされた公報を入力データとし、出力データとして近似を示す値1を設定した教師データを生成する。また、マイナスにチェックされた公報を入力データとし、出力データとして近似しないことを示す値0を設定した教師データを生成するこのように生成された教師データを、教師データ生成部180は教師データ投入部140に出力する。
ステップS406において、教師データ投入部140は、教師データ生成部180から出力された教師データを、モデル構築部110に投入する。モデル構築部110は、投入された教師データを用いて学習モデル115を構築する。
このように、本実施形態においては、SDI検索においてユーザが通常、検索を試行しながら所望の結果を得ようとする部分の処理を、モデル構築部110に学習モデル115を構築させることで代用する。そして、ユーザは学習モデル115が出力する結果を利用する。そして、所望の結果となるように再度、結果の適否を教師情報として用いて学習モデル115の構築を行わせる。このような学習モデル115の構築を繰り返すことで、ユーザの熟練度に関わらず、所望とする結果を学習モデル115が出力することが可能となる。
ステップS407では、新着情報入力部150は、新着情報を再度学習モデル115に入力するかを判定する。この判定は、図9の再一覧ボタン910が押されたことを示す所定のフラグに基づいて行われて良い。再度入力する場合は、ステップS403に進み、新着情報入力部407が、先のステップS403の処理で入力した新着情報と同じ新着情報を学習モデル115に入力する。そうでない場合、ステップS408に進む。
ステップS408では、次の新着情報の取得タイミングまで待機し、新着情報の取得タイミングが来た場合、ステップS403に進む。
なお、図示していないが、ユーザ端末135からSDI検索の中止の指示を受け付けた時点で、図4に示す処理が終了してよい。
図11は、実施形態1の処理を時系列に模式的に表した図である。初期の処理においては、教師候補を例えば概念検索などを用いて抽出する。抽出した教師候補の中からユーザが似ていると考える公報を選択して教師情報として用いる。このようにして時間T1において初期教師データが取得される。初期教師データがモデル構築部に投入されることで、時間T2において学習モデルM1が構築される。時間T3においてこの学習モデルM1に新着情報N1が入力されると、時間T4においてSDI結果R1が求められる。次に、このSDI結果R1を用いた教師情報が出力される。この教師情報に基づいて時間T5において教師データD1が生成される。教師データD1がモデル構築部に投入されることで、時間T6において学習モデルM2が構築される。時間T7においてこの学習モデルM2に新着情報N2が入力されると、時間T8においてSDI結果R2が求められる。次に、このSDI結果R2を用いた教師情報が出力される。この教師情報に基づいて時間T9において教師データD2が生成される。教師データD2がモデル構築部に投入されることで、時間T10において学習モデルM3が構築される。時間T11においてこの学習モデルM3に新着情報N3が入力されると、時間T12においてSDI結果R3が求められる。以下、同様の処理が繰り返される。図11においては、新着情報N1、新着情報N2、新着情報N3はいずれも異なる新着情報である。つまり、各新着情報には異なる公報が含まれる。新着情報N2には、新着情報N1は含まれない。入力される新着情報が異なるので、SDI結果R1、SDI結果R2、SDI結果R3は、それぞれ異なる結果となる。学習モデルM1、学習モデルM2、学習モデルM3は、それぞれ異なる教師データに応じてモデル構築部によって構築された学習モデルであり、例えばノードの重みが他の学習モデルから適宜変更された学習モデルである。このように、本実施形態においては、新着情報が、都度異なる情報であり、この異なる情報を用いることで、多様な教師データを用いてモデル構築部が学習モデルを構築するので、学習モデルが精度良く進化することができる。また、新着情報は、比較的データ量が少ないので、学習モデルの構築に要する時間が長期間に渡らずに済む。
以上説明したように、本実施形態においては、AIと親和性の高いSDI検索にAIを適用する形態を説明した。かかる構成によれば、ユーザが所望するSDI検索の結果を精度良く、効率的に抽出することが可能となる。
<実施形態2>
実施形態1で説明したように、モデル構築部110は、教師データを用いて学習モデル115の構築を繰り返す。この結果、例えば学習モデル115を構成するニューラルネットワークのノードの重みは、学習モデルが構築される度に異なる重みとなり得る。つまり、学習モデル115は、モデルが構築される度に進化しているといえる。
実施形態2では、学習モデル115を所定の時点の状態に、つまり、AIの脳の状態を、所定の時点の脳の状態に戻すことが可能な構成を説明する。
例えば特許文献の調査などを行う場合、ある時点Y1において所定のキーワードで検索S1を実行した場合に抽出された文献が3件であったとする。その時点Y1から所定期間が経過した(例えば、数年経過)後の時点Y2において、その事実を検証したい場合がある。しかしながら、時点Y2においては、既に学習モデル115は相当数のモデル構築を経て進化した状態となっている。時点Y2において検索S1と同様の検索対象期間を指定し、検索S1と同様のキーワードで検索を実行したとしても、時点Y1と検索結果が異なることが想定される。例えば、文献が20件抽出される、というような状態や、あるいは抽出される文献が0件である、という状態も想定される。このように、学習モデル115は進化し続けるので、将来的に、ある時点における学習モデル115の状態を検証することが困難になる場合もある。
実施形態2では、所定の状態に学習モデル115を戻すことを可能とする構成を説明する。
図12は、実施形態2に係るブロック図の例を示す図である。履歴情報格納部1210が図1の構成に新たに追加されている。他の構成は実施形態1で説明したものと同様であるので、同じ符号を付し説明を省略する。
履歴情報格納部1210は、学習モデル115の履歴情報を格納する。履歴情報は、例えるならば、AIの脳が進化する毎の、それぞれ脳の状態をスキャンしたデータに相当するものである。具体的には、所定の時点における学習モデル115に対応するニューラルネットワークの構成、及び各ノードの重みを示すデータとすることができる。なお、実施形態1で説明したように、教師データが入力される度に学習モデル115が構築され、進化する。履歴情報格納部1210は、例えば、学習モデル115が構築される毎に、学習モデル115の構成(例えばニューラルネットワークの構成及び各ノードの重み)を示すデータを格納してよい。あるいは、履歴情報格納部1210は、一定の期間、例えば毎月の月末の時点での学習モデル115の構成を示すデータを格納してもよい。学習モデル115の構成が複雑になるほど格納するデータも増えるので、学習を実行する毎のデータを都度格納するのではなく、所定の時点での学習モデル115の構成を示すデータを格納する形態でよい。
履歴情報格納部1210は、モデル構築部110に投入された教師データを履歴として格納してもよい。履歴情報格納部1210は、上記の所定の時点での学習モデル115の構成を示すデータと、その後に投入された教師データとを格納してよい。これらを格納しておけば、例えばモデル構築部110は、まず、ある時点の学習モデル115の構成(例えばニューラルネットワークの構成及び各ノードの重み)を再現する。その後、モデル構築部110は、履歴として格納されている教師データを用いて学習モデル115の構築を繰り返すことで、特定の時点の学習モデル115の状態を後から再現することができる。
<実施形態3>
実施形態3は、複数のユーザによって共有されるSDI検索を行うことが可能な形態について説明する。モデル構築部110、学習モデル115、教師データ投入部140、出力結果提供部160、教師情報受信部170、及び教師データ生成部180は、複数のユーザによって共有されてよい。
図13は、実施形態3における構成の一例を示すブロック図である。図13では、教師情報受信部1370が複数のユーザ端末1351、1352、1353からそれぞれ教師情報を受信する。教師情報受信部1370が受信する複数の教師情報を統合する教師情報統合部1390が図1に示す構成から新たに追加されている。その他の構成は、実施形態1で説明したものと同様の構成とすることができるので、同じ符号を付し、説明を省略する。
例えばA社の同じ部署内の3人のユーザX、Y、ZがSDI検索の結果を共有する場合を想定する。この場合、例えばユーザXの教師情報に従って構築された学習モデル115を、ユーザYが用いることも可能である。
ここで、出力結果提供部160が提供する出力結果に対して、複数のユーザが評価をして、それぞれが教師情報を入力するケースが想定される。つまり、教師情報受信部1370は、複数の教師情報を受信する場合が想定される。本実施形態においては、教師情報統合部1390が、複数の教師情報を統合し、教師データ生成部180に教師情報を出力する。
教師情報統合部1390は、例えば全てのユーザが共通の評価をした教師情報のみを、教師データ生成部180に出力してよい。換言すれば、教師情報統合部1390は、一部のユーザが異なる評価をした場合には、その公報については教師情報として採用しなくてよい。かかる構成によれば、全てのユーザの意見が一致した教師データが反映されることになるので、より堅固な学習モデル115を構築することができる。
教師情報統合部1390は、一部のユーザが異なる評価をした場合には、多数決によって教師情報を採用してもよい。多数のユーザが同一のSDI結果を評価するような場面においては、全てのユーザの評価が完全に一致しない場合が多くなることも想定される。採用できる教師情報が少ないと教師データも十分なサンプル数とはならない。この結果、学習モデル115の進化が進まず、十分な成果が得られない場合もある。よって、一部のユーザが異なる評価をした場合には、教師情報統合部1390は、多数決によって教師情報を採用してもよい。
教師情報統合部1390は、ユーザ毎に重みを変えてよい。ユーザ毎に熟練度は異なる。したがって、熟練度の高いユーザには重みを重くし、熟練度の低いユーザには重みを軽くする。そして、それぞれのユーザの評価した値(つまり、教師情報)を重みづけ平均した結果を、教師データ生成部180に出力する教師情報として採用してもよい。かかる構成によれば、それぞれのユーザの評価が反映され、かつ、熟練度に応じて異なる重みで採用されることになるので、適切な教師情報が採用されることになる。
教師情報統合部1390は、リーダとなるユーザからの指示を受け付け可能に構成してよい。複数のユーザのうち、一部のユーザが異なる評価をした場合には、リーダからの指示によって、教師情報として採用するか否かを決定してもよい。具体的には、教師情報統合部1390は、他と異なる教師情報が含まれているか否かを判定する。異なる教師情報が含まれている場合、リーダとして登録されているユーザ端末に、どの教師情報を採用するかを問い合わせるUI画面を提供する。そのユーザ端末から採用すべき教師情報の指定を受信すると、教師情報統合部1390は、指定された教師情報を採用する。
このように、教師情報統合部1390によって統合された教師情報は、教師データ生成部180に出力され、以降は、実施形態1で説明した処理と同等の処理が行われる。
本実施形態によれば、複数のユーザが共通のSDIの結果を評価し、教師情報を指示することができる。複数のユーザによる教師情報の指示を用いた教師データを用いて学習モデルを構築することでより精度の高い結果を得ることができる。また、複数のユーザが共通のSDIの結果を評価する場合、様々なシーンに応じて教師情報を統合することができるので、柔軟性に富んだシステムを提供することができる。
実施形態3は、実施形態1の変形例を例に挙げて説明したが、実施形態2の変形例として構成してもよい。
上述した実施形態の機能を実現するための各部は、例えばハードウェアまたはソフトウェアによって実装することができる。ソフトウェアによって実装される場合、ハードウェアを制御するプログラムコードをCPU、MPUなどの各種のプロセッサによって実行されてもよい。プログラムコードの機能を実現するための回路等のハードウェアを設けてもよい。プログラムコードの一部をハードウェアで実現し、残りの部分を各種プロセッサが実行してもよい。
なお、上記実施形態においては、教師データとしては、ユーザが所望する公報と近似度を学習モデル115に学習させる例を示したが、出願人が既に提供している検索サービスの一機能である概念検索及び類似検索で出力されるスコアとユーザが所望する公報とを教師データとして学習させる構成であってもよい。ここで、これまで、教師あり学習の例(入力:公報、ラベル(出力):近似度)を示して説示してきたが、教師なし学習を本願発明として構成することもでき(入力:公報(所望の公報のみで学習))、半教師あり学習を本願発明として構成することもできる。
また、上記実施形態においては、再一覧ボタン910で新着データを学習させた後にこの新着データを入力して出力させる例が記載されているが、新規のデータで学習させる場合には学習に時間を要する場合もあるので、学習が完了した時点でその旨をユーザに連絡する構成でもよいし、学習が完了した場合に新着データを入力して出力させた出力データをユーザに通知する構成でもよい。
また、上記実施形態においては、ユーザが保有する公報と近似値を教師データとして入力して学習し、学習した後に新着の公報を入力して出力し、新着の公報と近似値を入力して学習する構成を説明しているが、本願発明の構成としては、このような追加で新着の公報と近似値を用いて学習させる構成がないものであってもよく、例えば、初期の教師データと追加の教師データを用いて一から学習させて学習モデルを形成する構成であってもよい。
100 検索システム
110 モデル構築部
115 学習モデル
120 初期教師データ取得部120
130 公報DB
140 教師データ投入部
150 新着情報入力部
160 出力結果提供部
170 教師情報受信部
180 教師データ生成部

Claims (16)

  1. 少なくとも1つの公報に関する入力データと、前記入力データに対応する少なくとも1つの公報に関する出力データとの関係を示す教師データに基づいて、学習モデルを構築するモデル構築部と、
    所定の期間の間に発行された公報に関する新着情報を、前記入力データとして、前記学習モデルに入力する新着情報入力部と、
    前記新着情報の入力に応じて前記学習モデルから出力された結果をユーザ端末に提供する出力結果提供部と、
    前記ユーザ端末から、前記教師データの元となり、再一覧を要求するか否かを示すフラグを含む教師情報を受信する受信部と、
    前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入部とを有し、
    前記モデル構築部は、前記教師情報に応じた前記教師データに基づいて、前記学習モデルを再構築し、
    前記新着情報入力部は、前記フラグが再一覧を要求することを示す場合に、前記新着情報を前記入力データとして、再構築された前記学習モデルに入力し、
    前記出力結果提供部は、再構築された前記学習モデルから出力された結果を前記ユーザ端末に提供する、
    検索システム。
  2. 前記出力データには、前記公報の近似度を示す値が含まれる、請求項1に記載の検索システム。
  3. 前記教師情報は、特定の公報が適切か若しくは不適切かを示す情報、特定の公報の適切度合を示す情報若しくは不適切度合を示す情報、または、特定の公報のうちの特定の箇所の記載内容が適切か若しくは不適切かを示す情報を含む、請求項に記載の検索システム。
  4. 前記モデル構築部は、前記教師情報が適切であることを示す場合、当該特定の公報に対して近似を示す値を付与し、教師情報が不適切であることを示す場合、当該特定の公報に対して近似しないことを示す値を付与する学習モデルを構築する、請求項に記載の検索システム。
  5. 前記出力結果提供部は、前記学習モデルから出力された公報の中から予め設定された条件に従った公報を抽出して提供する、請求項からのいずれか一項に記載の検索システム。
  6. 前記条件は、前記近似度に対応するスコアの閾値、前記近似度に対応するスコア上位からの件数、または検索式の少なくとも1つを含む、請求項に記載の検索システム。
  7. 前記新着情報入力部は、新着情報の中から予め設定された条件に従って抽出された公報を、前記入力データとして、前記学習モデルに入力する、請求項1からのいずれか一項に記載の検索システム。
  8. 前記教師データ投入部は、概念検索、類似検索、または、所定の検索式を実行した結果得られる公報の中から所定の公報を初期教師データとして用いる、請求項1からのいずれか一項に記載の検索システム。
  9. 所定の時点の前記学習モデルの構成を示す情報を含む、前記学習モデルの履歴情報を格納する履歴情報格納部をさらに有する、請求項1からのいずれか一項に記載の検索システム。
  10. 前記履歴情報は、前記所定の時点から前記モデル構築部に投入された教師データをさらに含む、請求項に記載の検索システム。
  11. 前記受信部は、複数のユーザ端末からそれぞれ教師情報を受信し、
    受信した複数の教師情報を統合する統合部をさらに有する、請求項1から10のいずれか一項に記載の検索システム。
  12. 前記統合部は、一部のユーザ端末の教師情報が他のユーザ端末の教師情報と異なっている場合、採用する教師情報を多数決によって決定する、請求項11に記載の検索システム。
  13. 前記統合部は、
    ユーザ毎に設定された重み情報を取得し、
    一部のユーザ端末の教師情報が他のユーザ端末の教師情報と異なっている場合、ユーザ毎の重みを加味して教師情報を決定する、請求項11に記載の検索システム。
  14. 前記統合部は、
    ユーザの中でリーダを識別可能であり、
    一部のユーザ端末の教師情報が他のユーザ端末の教師情報と異なっている場合、リーダからの指示を受信し、受信した指示に基づいて教師情報を決定する、請求項11に記載の検索システム。
  15. 少なくとも1つの公報に関する入力データと、前記入力データに対応する少なくとも1つの公報に関する出力データとの関係を示す教師データに基づいて、学習モデルを構築するモデル構築部を有する検索システムの制御方法であって、
    所定の期間の間に発行された公報に関する新着情報を、前記入力データとして、前記学習モデルに入力する新着情報入力ステップと、
    前記新着情報の入力に応じて前記学習モデルから出力された結果をユーザ端末に提供する出力結果提供ステップと、
    前記ユーザ端末から、前記教師データの元となり、再一覧を要求するか否かを示すフラグを含む教師情報を受信する受信ステップと、
    前記教師情報に応じた前記教師データを前記モデル構築部に投入する教師データ投入ステップと、
    前記モデル構築部によって、前記教師情報に応じた前記教師データに基づいて、前記学習モデルを再構築する学習モデル再構築ステップと、
    前記フラグが再一覧を要求することを示す場合に、前記新着情報を前記入力データとして、再構築された前記学習モデルに入力する新着情報再入力ステップと、
    再構築された前記学習モデルから出力された結果を前記ユーザ端末に提供する出力結果再提供ステップと、
    を有する、検索システムの制御方法。
  16. コンピュータを、請求項1から14のいずれか一項に記載の検索システムの各部として機能させるためのプログラム。
JP2016145688A 2016-07-25 2016-07-25 新着情報の検索システム、検索方法、およびプログラム Active JP6812157B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016145688A JP6812157B2 (ja) 2016-07-25 2016-07-25 新着情報の検索システム、検索方法、およびプログラム
PCT/JP2017/026648 WO2018021227A1 (ja) 2016-07-25 2017-07-24 新着情報の検索システム、検索方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016145688A JP6812157B2 (ja) 2016-07-25 2016-07-25 新着情報の検索システム、検索方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2018018167A JP2018018167A (ja) 2018-02-01
JP2018018167A5 JP2018018167A5 (ja) 2019-06-13
JP6812157B2 true JP6812157B2 (ja) 2021-01-13

Family

ID=61016405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016145688A Active JP6812157B2 (ja) 2016-07-25 2016-07-25 新着情報の検索システム、検索方法、およびプログラム

Country Status (2)

Country Link
JP (1) JP6812157B2 (ja)
WO (1) WO2018021227A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101969A (ja) * 1995-10-06 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 適合フィードバックを用いた全文検索方法および装置
JP3870666B2 (ja) * 2000-06-02 2007-01-24 株式会社日立製作所 文書検索方法および装置並びにその処理プログラムを記録した記録媒体
JP2004005751A (ja) * 2003-09-04 2004-01-08 Matsushita Electric Ind Co Ltd 情報フィルタ装置及びその方法
JP2004118877A (ja) * 2004-01-19 2004-04-15 Toshiba Corp 情報フィルタリング装置

Also Published As

Publication number Publication date
JP2018018167A (ja) 2018-02-01
WO2018021227A1 (ja) 2018-02-01

Similar Documents

Publication Publication Date Title
US10958748B2 (en) Resource push method and apparatus
US11669744B2 (en) Regularized neural network architecture search
US11971884B2 (en) Interactive search experience using machine learning
WO2021027256A1 (zh) 处理交互序列数据的方法及装置
WO2021027260A1 (zh) 处理交互序列数据的方法及装置
US8843427B1 (en) Predictive modeling accuracy
US20190005399A1 (en) Learning device, generation device, learning method, generation method, and non-transitory computer readable storage medium
JP7316453B2 (ja) オブジェクト推薦方法及び装置、コンピュータ機器並びに媒体
US11657371B2 (en) Machine-learning-based application for improving digital content delivery
JP7038499B2 (ja) 分類システム、分類システムの制御方法、およびプログラム
JP7350590B2 (ja) 反復的な人工知能を用いて、通信決定木を通る経路の方向を指定する
JP2018101399A (ja) 機械学習集団行列因子分解フレームワークを使った作業者適性の予測
KR20190075277A (ko) 콘텐트 검색을 위한 방법 및 그 전자 장치
US12099803B2 (en) Training a model in a data-scarce environment using added parameter information
JP6812157B2 (ja) 新着情報の検索システム、検索方法、およびプログラム
US9934002B2 (en) Technology recommendation for software environment
US20230012316A1 (en) Automation of leave request process
CN115203366A (zh) 一种结果获取的方法、装置、电子设备及存储介质
JP6751955B1 (ja) 学習方法、評価装置、及び評価システム
JP6475565B2 (ja) スコア付与対象を分類可能な装置、システム、プログラム及び方法
CN111897910A (zh) 信息推送方法和装置
WO2019241829A1 (en) Data visualisation method and apparatus
KR102456646B1 (ko) 문자열의 의도 분류 방법 및 컴퓨터 프로그램
JP2020123053A (ja) 情報処理装置および情報処理方法ならびにプログラム
KR102641660B1 (ko) 생성형 ai를 활용하여 문제해결을 최적화하기 위한 서버 및 그 동작방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190425

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201216

R150 Certificate of patent or registration of utility model

Ref document number: 6812157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250