JP6779405B1

JP6779405B1 - 侵害情報抽出システム、方法及びプログラム

Info

Publication number: JP6779405B1
Application number: JP2020108064A
Authority: JP
Inventors: 将仁谷口
Original assignee: Ipsign
Current assignee: Ipsign
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2020-11-04
Anticipated expiration: 2040-06-23
Also published as: JP2022003486A

Abstract

【課題】人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高める。【解決手段】侵害情報抽出サーバ１０は、対象となる知的財産の権利を示す権利情報を取得し（ステップＳ１）、必要に応じて、他の知的財産の権利を示すデータを加工した学習データ１８を機械学習してモデルを生成する（ステップＳ２、Ｓ３）。次に、対象となる知的財産の権利を示す権利情報を解析し、検索するために必要な文字または画像を判断する（ステップＳ４、Ｓ５）。判断した文字または画像を用いて、検索エンジンで検索を行い、検索の結果から、対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する（ステップＳ６、Ｓ７）。そして、抽出した侵害情報に対する評価を取得して、取得した評価を機械学習し、機械学習の結果を侵害情報の抽出の精度に反映する（ステップＳ８〜Ｓ１０）。【選択図】図１

Description

本発明は、侵害情報抽出システム、方法及びプログラムに関し、更に具体的には、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高める、人工知能技術に関する。

近年、人工知能で知的財産を扱う技術が注目されている。例えば、過去に審査された審査結果を機械学習して権利取得の可能性が上がる補正情報を生成する技術がある（特許文献１）。

他には、知的財産情報を機械学習して知的財産の権利取得の可能性を算出する技術がある（特許文献２）。

特開２０１９−１７９４９３号公報特開２０１９−１７９５７８号公報

知的財産を取得して競合優位性を構築した状態であっても、その知的財産権を侵害している競合他社を野放しにしたままでは、競合優位性を保った状態で事業を行うことができない。知的財産を侵害している競合他社を把握するには模倣調査が必要であるが、知的財産の模倣調査には専門的なスキルと経験が必要となる。専門家を使って模倣調査を行うと手間とコストが大きくかかる問題や、そもそも専門家が不足している問題があるため、競合優位性を護れていない企業が多くある。そこで、専門家を必要とせずに、手間もコストも削減して、企業の競合優位性を護るためには、人工知能技術が有効となる。

しかしながら、特許文献１及び特許文献２の技術では、過去に審査された審査結果を機械学習して権利取得の可能性が上がる補正情報を生成することや、知的財産情報を機械学習して知的財産の権利取得の可能性を算出することはできるが、侵害情報を抽出する精度を機械学習によって高める人工知能技術を提供することはできない。

従って、本発明は、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高める侵害情報抽出システム、方法及びプログラムを提供することを目的とする。

本発明は、対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する解析手段と、前記解析の結果から、検索するために必要な文字または画像を判断する判断手段と、前記判断した文字または画像を用いて、検索エンジンで検索する検索手段と、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出する抽出手段と、前記抽出した侵害情報に対する評価を取得する評価取得手段と、前記取得した評価を機械学習する機械学習手段と、前記機械学習の結果を、前記抽出手段が侵害情報を抽出する精度に反映する反映手段と、を備える侵害情報抽出システムを提供する。

また、本発明は、対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析するステップと、前記解析の結果から、検索するために必要な文字または画像を判断するステップと、前記判断した文字または画像を用いて、検索エンジンで検索するステップと、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、前記抽出した侵害情報に対する評価を取得するステップと、前記取得した評価を機械学習するステップと、前記機械学習の結果を、前記抽出するステップで侵害情報を抽出する精度に反映するステップと、を備える侵害情報抽出方法を提供する。

更に、本発明は、コンピュータに、対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析するステップと、前記解析の結果から、検索するために必要な文字または画像を判断するステップと、前記判断した文字または画像を用いて、検索エンジンで検索するステップと、前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、前記抽出した侵害情報に対する評価を取得するステップと、前記取得した評価を機械学習するステップと、前記機械学習の結果を、前記抽出するステップで侵害情報を抽出する精度に反映するステップと、
を実行させるためのプログラムを提供する。

本発明によれば、対象となる知的財産の権利を示す権利情報を解析して、前記解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出して、抽出した侵害情報に対する評価を取得して、取得した評価を機械学習して、機械学習の結果を侵害情報の抽出の精度に反映することとした。

このように、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高めるため、知的財産の権利を侵害している可能性のある侵害情報を精度よく抽出できるという効果がある。

本発明の一実施形態の侵害情報抽出システムの全体構成を示す概念図である。前記実施形態の侵害情報抽出サーバのハードウェア構成を示すブロック図である。前記実施形態の侵害情報抽出サーバの機能構成を示すブロック図である。前記実施形態のユーザ端末の構成を示すブロック図である。前記実施形態の学習データの一例を示す図である。前記実施形態の学習データの他の一例を示す図である。前記実施形態の学習データの他の一例を示す図である。前記実施形態のユーザ端末に表示される対象となる知的財産の権利を示す権利情報を取得するための画面の一例を示す図である。前記実施形態のユーザ端末に表示される画面の一例を示す図である。前記実施形態による侵害情報抽出処理の一例を示すフローチャートである。

本発明は、対象となる知的財産の権利を示す権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出して、抽出した侵害情報に対する評価を取得して、取得した評価を機械学習して、機械学習の結果を侵害情報の抽出の精度に反映するものである。以下、本発明を実施するための最良の形態を、実施例に基づいて詳細に説明する。

＜基本概念＞・・・まず、本発明の侵害情報抽出技術の基本的な概念について説明する。本発明は、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高める、人工知能技術に関する。具体的には、対象となる知的財産の権利を示す権利情報（例えば、登録時の公報）を解析し、解析の結果から、検索するために必要な文字または画像（例えば、特許の独立項に記載されている文字や、意匠の実線と破線の画像など）を判断し、前記判断した文字または画像を用いて、検索エンジンで検索（文字検索または画像検索）し、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出し（例えば、検索結果に表示された、Ｗｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出）、前記抽出した侵害情報に対する評価を取得し（例えば、「いいねボタン」や「悪いねボタン」などを設置して取得するや、役に立った度合いの入力を受け付けて取得する、など）、前記取得した評価を機械学習（例えば、強化学習または深層強化学習）し、前記機械学習の結果を、前記抽出手段が侵害情報を抽出する精度に反映するものである。例えば、抽出する精度が高くなるということは、抽出する侵害情報が「いいねボタン」が押されやすい侵害情報や、役に立つ度合いが高い侵害情報になるということを意味する。

ここで、他の知的財産の権利を示すデータ（登録時の公報）を加工した学習データ（丸付けした画像データまたはテキストデータ）を機械学習してモデルを生成し、前記解析にあたり、生成したモデルを利用して、前記対象となる知的財産の権利を示す権利情報を解析してもよい。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

以下、本発明を実施するための最良の形態を、実施例に基づいて詳細に説明する。

＜全体構成＞・・・図１は、本実施形態による侵害情報抽出システムの全体構成を示す概念図である。図１に示すように、侵害情報抽出システム１００は、侵害情報抽出サーバ１０と、ユーザ８０のユーザ端末８２により構成されている。これらは、図示しないインターネットなどのネットワークを介して、相互にデータ通信可能となっている。ユーザ８０には、後述するグループを構成するメンバーや、その他の者が含まれてもよい。

図１に示すように、まず、侵害情報抽出サーバ１０は、対象となる知的財産の権利を示す権利情報（登録時の公報など）を、ユーザ８０がユーザ端末８２によって入力した内容から取得する。例えば、ユーザ８０によって入力された登録番号によって権利情報を取得してもよいし、ユーザ８０によって入力された内容をそのままを権利情報として取得してもよい（例えば、ユーザ８０によって入力された特許請求の範囲など）。

また、侵害情報抽出サーバ１０は、必要に応じて、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して（ステップＳ２）、モデルを生成してもよい（ステップＳ３）。具体的には、色々な知的財産権（特許権、実用新案権、意匠権、商標権）の権利情報を示す画像の特徴部分（キーワードや図形の特徴点など）に丸付けをして加工した学習データ１８を、数十〜数万個用意して、その学習データ１８を機械学習してモデルを生成する。丸付けは、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

分野を示す分野情報は、特許であれば、ＩＰＣ分類、ＦＩ、Ｆタームなどであり、商標であれば、商品・役務の区分などであり、意匠であれば、意匠分類、意匠に係る物品などである。実用新案については、特許と同様である。

また、内容を示す内容情報は、特許であれば、請求の範囲の独立項のキーワード、従属項のキーワードなどであり、商標であれば、登録商標の文字または図形であり、意匠であれば、図面の実線、破線などである。実用新案については、特許と同様である。

なお、学習データとしては、文字と図形の両方に対応して認識できるため画像の学習データが好ましいが、テキストの学習データを利用することを妨げるものではない。

以上のような学習データを機械学習すると、その学習データにカスタマイズされたモデルが生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが機械学習されたモデルが生成される。

次に、侵害情報抽出サーバ１０は、ユーザ８０がユーザ端末８２によって入力した対象となる知的財産の権利を示す権利情報を解析する（ステップＳ４）。この解析は、公報に何が記載されているかを把握するために行うものである。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。

公報の決まった場所に、分野を示す分野情報や、内容を示す内容情報が記載されているため、機械学習を必須としなくても解析は可能であるが、解析の精度を上げるために、前記ステップＳ３で生成したモデルを使用して、解析を行うようにしてもよい。例えば、モデルを利用して解析する場合には、対象となる知的財産の権利を示す画像（権利情報）を入力すると、権利情報からどの部分（分野情報や内容情報を示すキーワードや図形の特徴点など）を抜き出すかを解析する。

そして、侵害情報抽出サーバ１０は、前記解析の結果から、検索するために必要な文字または画像を判断する（ステップＳ５）。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、分野情報であれば、特許のＩＰＣ分類の文字や、商標の商品・役務の区分などの文字を判断する。内容情報であれば、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。

次に、侵害情報抽出サーバ１０は、前記判断した文字または画像を用いて、検索エンジンで検索を行う（ステップＳ６）。前記ステップＳ５で判断した文字または画像を使って、既知の検索エンジンで、文字検索や画像検索を行う。

次に、侵害情報抽出サーバ１０は、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する（ステップＳ７）。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよい。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。

次に、侵害情報抽出サーバ１０は、前記抽出した侵害情報に対する評価を取得する（ステップＳ８）。例えば、ユーザ（企業の社内の役員または従業員）や、サポーター（企業がサポーターとして契約している専門家など）に、抽出した侵害情報に対して評価をしてもらい、その評価を取得する。具体的には、「いいねボタン」や「悪いねボタン」などを設置して、そのボタンを押してもらうことを評価を取得するようにしてもよいし、所定数（例えば５個）の星を表示し、星の数が多いほど高評価、星の数が少ないほど低評価を示すような表示をし、ユーザやサポーターに星の数を選んでもらって評価を取得するようにしてもよい。

そして、侵害情報抽出サーバ１０は、前記ステップＳ８で取得した評価を機械学習する（ステップＳ９）。例えば、評価を機械学習するには、機械学習のうちの手法である、強化学習または深層強化学習を行ってもよい。深層強化学習は、強化学習に深層学習を掛け合わせたものである。強化学習の例としては、「いいねボタン」が押された侵害情報を１点加点とし、「悪いねボタン」が押された侵害情報を１点減点として、スコアを最大化する侵害情報とはどういう情報なのかを機械学習するという具合である。例えば、星５個で評価を取得する場合には、星５個と評価された侵害情報を２点加点、星４個と評価された侵害情報を１点加点、星３個と評価された侵害情報を加減無し、星２個と評価された侵害情報を１点減点、星１個と評価された侵害情報を２点減点、としてスコアを最大化する侵害情報とはどういう情報なのかを機械学習する。

次に、侵害情報抽出サーバ１０は、前記ステップＳ９の機械学習の結果を、侵害情報を抽出する精度に反映する（ステップＳ１０）。例えば、強化学習の結果である、「スコアを最大化する侵害情報とはどういう情報なのか」を、侵害情報の抽出に反映することで、抽出する精度を上げることができる。つまり、抽出する精度が高くなるということは、抽出する侵害情報が「いいねボタン」が押されやすい侵害情報や、役に立つ度合いが高い侵害情報になるということを意味する。

このように、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高めるため、知的財産の権利を侵害している可能性のある侵害情報を精度よく抽出することができる。

＜侵害情報抽出サーバのハードウェア構成＞・・・図２は、本実施形態の侵害情報抽出サーバ１０のハードウェア構成を示すブロック図である。侵害情報抽出サーバ１０は、例えば、プロセッサ１２、メモリ１４、ストレージ１６、通信部３４を備え、これらは図示しないバスにより接続されている。プロセッサ１２は、例えば、ＣＰＵ（Central Processing Unit）により構成され、メモリ１４に記憶された各種プログラムを読み出して実行することで、各種処理を行う。

前記メモリ１４は、プロセッサ１２により実行されるプログラムを記憶するものであり、例えば、ＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）により構成される。例えば、図３に示す各種手段が記憶されている。ストレージ１６は、例えば、学習データ１８、モデル２０、権利情報２２、判断結果２４、検索結果２５、侵害情報２６、評価２８、学習結果３０、グループ情報３２や、図示しない制御プログラムなどを記憶するものである。通信部３４は、ネットワークを介して、ユーザ端末８２や、他の外部装置とデータ通信を行うものである。

ストレージ１６に記憶される学習データ１８は、例えば、色々な知的財産の権利（特許権、実用新案権、意匠権、商標権）を示すデータ（例えば、登録時の公報）に丸付けをして加工したものである。学習データ１８は、例えば、数十〜数万用意され、これらの学習データ１８を機械学習して、モデル２０が生成される。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

図５は、分野を示す分野情報に関する学習データの一例を示す図であり、(A)は特許権に関する学習データ１８Ａ、(B)は意匠権に関する学習データ１８Ｂ、(C)は商標権に関する学習データ１８Ｃの一例を示す。分野を示す分野情報は、特許であれば、ＩＰＣ分類、ＦＩ、Ｆタームなどである。図５(A)の例では、ＩＰＣ分類、ＦＩタームに囲み線Ｃで丸付け加工されている。実用新案についても同様である。また、分野を示す分野情報は、意匠であれば、意匠分類、意匠に係る物品などであり、図５(B)の例では、意匠に係る物品、意匠分類、国際意匠分類、Ｄタームに囲み線Ｃで丸付け加工されている。また、分野を示す分野情報は、商標であれば、商品・役務の区分などであり、図５(C)の例では、「第９類」、「第３７類」といった区分に囲み線Ｃで丸付け加工がされている。

図６は、特許の内容を示す内容情報に関する学習データ１８Ａの一例を示す図である。権利の内容を示す内容情報は、特許であれば、請求の範囲の独立項のキーワード、従属項のキーワードなどである。図６の例では、学習データとして、特許請求の範囲を示す画像が用いられる。そして、権利範囲の画像に丸付けをして加工したものを学習データ１８Ａとする。丸付けは、図６に示すように、キーワードを囲み線Ｃで囲うことにより行われる。図示の例では、囲み線Ｃにより、「本人」、「認定する」、「画像を」、「正当性」、「同時」、「写真付証明書」、「顔」、「ユーザ」、「一致」の文言がキーワードとして囲み線Ｃにより囲まれている。実用新案についても同様である。

また、ＩＰＣ分類を学習データに紐づけて機械学習してもよい。更に、キーワードに加えて、特許権や実用新案権の権利範囲をもっともよく反映している図面のうち、前記キーワードに対応する部分を丸付けした画像を学習データとして加えてもよい

図７は、意匠の内容を示す内容情報に関する学習データ１８Ｂの一例を示す図である。意匠権の権利内容は、図面に表されたものによって決まるものであり、学習データとして、図面の画像が用いられる。そして、権利範囲の画像の特徴部分に丸付けをして加工したものを学習データ１８Ｂとする。図７は、部分意匠の例であり、丸付けは、例えば、「正面及び平面側斜視図」の全体、すなわち、破線部分も含めて囲み線Ｃ１で囲むとともに、意匠登録を受けようとする部分、すなわち、実線部分を囲み線Ｃ２で囲むことにより行われる。

なお、図７では、「正面及び平面側斜視図」についてのみ示したが、他の図面についても同様の丸付けを行うようにしてもよい。また、図面の丸付けに加え、「意匠の説明」からキーワードに丸付けをして、あわせて学習データ１８Ｂとしてもよい。また、意匠の分類を、学習データに紐づけて機械学習してもよい。

また、商標の権利内容に関する学習データは、文字商標の場合は、特許権や実用新案権と同様にキーワードを丸付けすることで学習データとされる。例えば、商標の文字全体を一つのキーワードとして丸付けしてもよいし、２以上の語からなる結合商標の場合には、全体をキーワードとして丸付けすることに加え、商標を構成する各語をキーワードとして丸付けしてもよい。また、前記キーワードに加えて、区分を学習データに紐づけて機械学習してもよい。

文字商標以外の商標についても、同様に画像を用い、全体を特徴部分として丸付けして囲ったり、文字と結合した画像部分を特徴部分として丸付けして囲って、学習データを用意してもよい。

前記ストレージ１６に記憶されるモデル２０は、学習データ１８を機械学習して生成されるもので、ユーザ８０から取得した対象となる知的財産の権利を示す権利情報の解析に利用される。

権利情報２２は、ユーザ８０から入力された知的財産の権利を示す権利情報（登録番号、特許請求の範囲、権利者情報など）である。例えば、特許権であれば、登録番号に対して、特許請求の範囲、権利者情報、ＩＰＣ分類などが紐づけて記憶される。実用新案権についても同様である。

意匠権であれば、登録番号に対して、図面、権利者情報、分類などが紐づけて記憶される。商標権であれば、登録番号に対して、商標、権利者情報、区分などが紐づけて記憶される。

判断結果２４は、ユーザ８０から入力された対象となる知的財産の侵害情報の抽出のための検索に必要な文字または画像として判断されたものである。

検索結果２５は、判断結果２４である文字または画像を用いて、検索エンジンで検索（文字検索または画像検索）した結果である。

侵害情報２６は、判断結果２４に基づいて、検索エンジンを利用して検索した検索結果２５から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出したものである。検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツは削除されるものも多数あるため、抽出した侵害情報は、ダウンロードして、ダウンロードした内容と日時とを紐づけて記憶してもよい。また、侵害情報は一つとは限らず、複数の侵害情報が検索によりヒットした場合には、それら複数の侵害情報が、ユーザ８０から入力された知的財産権に紐づけて記憶される。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザが保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザに提供して、ユーザが保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

評価２８は、抽出した侵害情報２６に対する評価である。評価２８の取得は、例えば、侵害情報２６をユーザ端末８２に表示する際に、その侵害情報が役立った場合に押す「いいねボタン」や、侵害情報が役立たたなかった場合に押す「悪いねボタン」を表示し、ユーザ８０がこれらのボタンを押すことによって、その評価内容が取得される。また、所定数（例えば５個）の星を表示し、星の数が多いほど高評価、星の数が少ないほど低評価を示すような表示をし、ユーザやサポーターに星の数を選んでもらって評価を取得するようにしてもよい。

学習結果３０は、前記取得した評価２８を機械学習した結果である。例えば、評価を機械学習するには、機械学習の手法は、例えば、強化学習または深層強化学習が用いられる。深層強化学習は、強化学習に深層学習を掛け合わせたものである。強化学習の例としては、「いいねボタン」が押された侵害情報を１点加点とし、「悪いねボタン」が押された侵害情報を１点減点として、スコアを最大化する侵害情報とはどういう情報なのかを機械学習するという具合である。学習結果３０は、例えば、前記侵害情報２６と上述したスコアを紐づけて記憶される。例えば、星５個で評価を取得する場合には、星５個と評価された侵害情報を２点加点、星４個と評価された侵害情報を１点加点、星３個と評価された侵害情報を加減無し、星２個と評価された侵害情報を１点減点、星１個と評価された侵害情報を２点減点、としてスコアを最大化する侵害情報とはどういう情報なのかを機械学習する。

グループ情報３２は、所定のメンバーからなるグループに関する情報である。グループは、例えば、企業の企画経営部、知的財産部、〇〇チーム、社外の専門家など、所定のメンバーで構成されるものであり、メンバーの組み合わせは調整できる。当該グループ内で、抽出した侵害情報２６が共有される。グループ総意の評価として、評価２８をつけることもできる。

＜侵害情報抽出サーバの機能構成＞・・・図３は、侵害情報抽出サーバ１０の機能構成を示すブロック図である。侵害情報抽出サーバ１０は、解析手段４０、生成手段４２、判断手段４３、検索手段４４、抽出手段４６、評価取得手段４８、機械学習手段４９、反映手段５０、通知手段５１、ダウンロード手段５２、保存手段５４、グループ作成手段５６、共有手段５８、権利者情報取得手段６０、根拠特定手段６２、キーワード受付手段６４、管理手段６６、出力手段６８、算出手段７０、並替手段７２を備えている。

解析手段４０は、対象となる知的財産の権利を示す権利情報を解析するものである。この解析は、公報に何が記載されているかを把握するために行う。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。対象となる知的財産の権利を示す権利情報は、例えば、ユーザ８０によって入力された登録番号によって、外部データベースから当該登録番号に該当する権利の権利情報を取得してもよいし、ユーザ８０によって入力された権利範囲そのまま（例えば、特許請求の範囲の文言や、意匠の図面など）を権利情報としてもよい。

なお、ユーザ８０による入力は、解析手段４０がネットワークを介してユーザ端末８２の表示部９２（図１参照）に、対象となる知的財産の権利を示す権利情報を入力させるための画面を表示し、画面を見たユーザ８０が、入力部９０によって行う。当該入力した内容を、通信部及びネットワークを介して、侵害情報抽出サーバ１０に送信することにより、侵害情報抽出サーバ１０は、権利情報を取得する。

図８には、ユーザ端末８２の表示部９２に表示される画面１１０の一例が示されている。画面１１０には、特許、商標、意匠、実用新案などを選択できるプルダウンメニュー１１２、登録番号入力欄１１４、特許や実用新案のためのＩＰＣ分類入力欄１１６Ａ、意匠の分類のための分類入力欄１１６Ｂ、商標の区分のための区分入力欄１１６Ｃが表示されている。

このほか、キーワードの追加により判断精度をカスタマイズするためのキーワード入力欄１１８、指定された権利者が保有する知的財産権の登録番号を一括で取得するための権利者情報入力欄１２０、登録公報を直接入力するための登録公報入力欄１２２が表示されている。これらの入力欄に１１８〜１２２については、後述する。

生成手段４２は、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して、モデルを生成するものである。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。具体的には、色々な知的財産権の登録時の公報の画像に丸付などをした画像の学習データ１８を、数十〜数万個用意して、その学習データ１８を機械学習してモデル２０を生成する。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す分野情報と、内容を示す内容情報の両方に行う。

学習データ１８は、例えば、特許権については、図５(A)の学習データ１８Ａに示すように、分野を示す分野情報として、ＩＰＣ分類、ＦＩ、Ｆタームなどに囲み線Ｃで丸付けを行ったものと、図６の学習データ１８Ａに示すように、内容を示す内容情報として、請求の範囲の独立項のキーワード、従属項のキーワードなどに囲み線Ｃで丸付けを行ったものが利用される。文字商標についても同様である。生成手段４２は、特許や実用新案については、ＩＰＣ分類を学習データ１８Ａに紐づけて機械学習し、文字商標については区分を学習データに紐づけて機械学習する。また、特許や文字商標の、丸付けして抜き出したキーワードとその類語もまとめて機械学習してもよい。

また、意匠権については、図５(B)の学習データ１８Ｂに示すように、分野を示す分野情報として、意匠分類や意匠に係る物品などの囲み線Ｃで丸付けを行ったものと、図７の学習データ１８Ｂに示すように、内容を示す内容情報として、画像全体、および画像中の特徴ある図形部分を囲み線Ｃ１、Ｃ２で丸付けしてものが利用される。囲み線Ｃ１、Ｃ２で抜き出した図形（特徴点）と、それに似た図形（似た特徴点）もまとめて機械学習してもよい。図形商標や、図形と文字が結合した結合商標のうちの図形部分についても、同様に丸付けが行われた部分と、その部分に似た特徴点をまとめて機械学習してもよい。生成手段４２は、意匠の分類を学習データ１８Ｂに紐づけて機械学習してもよいし、商標の区分を商標権の学習データに紐づけて機械学習してもよい。

なお、図５〜図７に示す丸付けは一例であり、権利範囲を示す画像の特徴部分（キーワードや図形などの特徴点）をハイライトで示したり、色分けによって他の部分と分けるようにしてもよい。むろん、これらの加工例も一例であり、これらを組み合わせてもよいし、同様の効果を奏する範囲内で、適宜変更してよい。

以上のような学習データ１８を機械学習すると、その学習データ１８にカスタマイズされたモデル２０が生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが学習されたモデル２０が生成される。生成されたモデル２０は、ストレージ１６に記憶される。

前記解析手段４０は、前記生成されたモデル２０を利用して、対象となる知的財産の権利を示す権利情報を解析してもよい。例えば、モデル２０に、対象となる知的財産の権利を示す権利情報の画像（ユーザ８０が保有する知的財産権の権利情報を表す画像）を入力し、権利情報からどの部分を抜き出すかを解析する。抜き出す部分は、例えば、キーワードや図形などの特徴部分である。

判断手段４３は、前記解析手段４０の解析の結果から、検索するために必要な文字または画像を判断するものである。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。判断結果２４は、ストレージ１６に記憶される。

検索手段４４は、前記判断手段４３によって判断した文字または画像を用いて、検索エンジンで検索を行うものである。検索結果２５は、ストレージ１６に記憶される。

抽出手段４６は、前記検索手段４４による検索の結果から、対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出するものである。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよい。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。抽出した侵害情報２６は、ストレージ１６に記憶される。

なお、検索エンジンで検索した場合、例えば、学術論文や権利者自身の商品販売サイトなどの侵害情報とはならないノイズを拾ってしまうことがある。そこで、抽出手段４６は、フィルタ機能を備えている。

例えば、キーワードでノイズ除去する場合、検索エンジンによって検索すると、検索一覧ページではページタイトルが表示されるので、そのページタイトルから、学術系、販売系のキーワードが含まれていれば排除して、ノイズ除去を行う。

または、除外するＵＲＬリストを作成し、そのリスト内のＵＲＬに該当する場合には、抽出する侵害情報から除外してもよい。むろん、他の手法によるノイズ除去を行うことを妨げるものではない。

評価取得手段４８は、抽出手段４６によって抽出した侵害情報２６に対する評価２８を取得するものである。評価２８の取得は、例えば、ユーザ（企業の社内の役員または従業員）や、サポーター（企業がサポーターとして契約している専門家など）に、抽出した侵害情報に対して評価をしてもらい、その評価を取得する。具体的には、「いいねボタン」や「悪いねボタン」などを設置して、そのボタンを押してもらうことで評価を取得するようにしてもよいし、所定数（例えば５個）の星を表示し、星の数が多いほど高評価、星の数が少ないほど低評価を示すような表示をし、ユーザやサポーターに星の数を選んでもらって評価を取得するようにしてもよい。取得した評価２８は、ストレージ１６に記憶される。「いいねボタン」や「悪いねボタン」、所定数の星などは、どこに表示してもよいし、メールなどで評価依頼を通知してもよい。

図９は、抽出した複数の侵害情報１３２〜１４０のうち、ユーザ８０が侵害情報１３６を選択した場合に、画面１５０に侵害情報１３６の詳細が示される様子を示す。画面１５０には、侵害情報ページのＵＲＬ１５２、侵害情報ページ１５４、文章１５６、当該文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表した根拠部分１５８、いいねボタン１６０、悪いねボタン１６２が表示されている。前記評価取得手段４８は、いいねボタン１６０や、悪いねボタン１６２が押された結果を取得して、ストレージ１６に記憶する。あくまで一例であって、図９の通りに配置されていなくても構わない。例えば、いいねボタン１６０、悪いねボタン１６２は、図９左側の侵害情報の一覧に配置されてもよい。例えば、示される侵害情報１３６がダウンロードされた情報である場合は、侵害情報ページのＵＲＬ１５２は示さなくてもよい。

機械学習手段４９は、前記評価取得手段４８によって取得した評価２８を機械学習するものである。例えば、評価を機械学習するには、機械学習のうちの手法である、強化学習または深層強化学習を行ってもよい。深層強化学習は、強化学習に深層学習を掛け合わせたものである。強化学習の例としては、「いいねボタン」が押された侵害情報を１点加点とし、「悪いねボタン」が押された侵害情報を１点減点として、スコアを最大化する侵害情報とはどういう情報なのかを機械学習するという具合である。例えば、星５個で評価を取得する場合には、星５個と評価された侵害情報を２点加点、星４個と評価された侵害情報を１点加点、星３個と評価された侵害情報を加減無し、星２個と評価された侵害情報を１点減点、星１個と評価された侵害情報を２点減点、としてスコアを最大化する侵害情報とはどういう情報なのかを機械学習する。

反映手段５０は、前記機械学習手段４９による機械学習の結果３０を、前記抽出手段４６が侵害情報を抽出する精度に反映するものである。例えば、強化学習の結果である、「スコアを最大化する侵害情報とはどういう情報なのか」を、侵害情報の抽出に反映することで、抽出する精度を上げることができる。つまり、抽出する精度が高くなるということは、抽出する侵害情報が「いいねボタン」が押されやすい侵害情報や、役に立つ度合いが高い侵害情報になるということを意味する。このように、ユーザ８０から取得した評価２８をフィードバックする強化学習機能により、抽出の精度をあげていくことができる。

また、反映手段５０は、前記機械学習の結果３０を、前記判断手段４３が判断する精度にも反映してもよい。例えば、強化学習の結果である、「スコアを最大化する侵害情報とはどういう情報なのか」を、侵害情報の抽出に反映することで、抽出する精度を上げることができる。検索するための文字または画像の精度が高くなれば、検索の精度が高くなり、抽出するための母数である検索結果の精度が高くなるため、間接的に抽出精度が高くなる。

次に、通知手段５１は、前記抽出手段４６が定期的（例えば、毎日１回／週１回／隔週１回／月１回など）に侵害情報を抽出し、今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることをユーザ８０に通知するものである。侵害情報の変更とは、例えば、前回の抽出では５個の侵害情報が抽出され、今回の抽出では７個の侵害情報が抽出した場合などである。なお、定期的に抽出していても抽出結果に変更があるケースとしては、抽出の精度が高くなり、これまで抽出できていなかった侵害情報を抽出できるようになった場合や、新しい侵害情報を誰かがインターネット上に掲載したために抽出した場合などがある。なお、ユーザ８０側へ通知される情報には、単に侵害情報に変更があったことのみならず、変更のあった侵害情報へアクセスする手段を含んでもよい。このように定期的に判断して変化があれば通知することで、監視通知機能を持たせることができる。ユーザ８０側が把握している侵害情報をアップデートするのに役立つ。

ダウンロード手段５２は、前記抽出手段４６によって抽出した侵害情報をダウンロードするものである。保存手段５４は、ダウンロード手段５２によってダウンロードした内容と日時とを紐づけて、ストレージ１６に侵害情報２６として自動的に保存するものである。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザ８０が保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザ８０に提供して、ユーザ８０が保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

グループ作成手段５６は、所定のメンバーからなるグループを作成するものである。例えば、ユーザ端末８２の表示部９２に、グループのメンバーを指定するための画面を表示させ、当該画面に入力された所定のメンバーごとに、グループ情報３２としてストレージ１６に記憶する。グループは、例えば、企業の企画経営部、知的財産部、〇〇チームや、社外の専門家など、所定のメンバーで構成されるものであるが、これに限定されない。また、作成したグループ内で、侵害情報についてチャット可能なチャットルームも作成できる。

共有手段５８は、グループ作成手段５６で作成されたグループ内で、抽出した侵害情報２６を共有するものである。これにより、部内共有、チーム共有、社外の専門家との共有などが可能となり、侵害情報２６を効率的に供給することができる。

権利者情報取得手段６０は、ユーザ８０から対象となる知的財産の権利者の情報を取得するものである。例えば、ユーザ８０から権利情報を取得するための画面１１０に表示された権利者情報入力欄１２０に入力された権利者情報をネットワークを介して取得する。また、ユーザ８０によって入力された登録番号から、対象となる知的財産の権利者の情報を取得してもよい。

そして、前記解析手段４０は、取得した権利者が保有する知的財産を示す権利情報を一括で解析する。その権利者が保有する知的財産を示す権利情報を一括で解析するため、１つ１つ登録番号を入力する手間を省くことができる。具体的には、知的財産権の種類と登録番号によって特定される権利の登録公報などから権利情報を解析する。解析においては、必要に応じて前記モデル２０を使用してもよい。生成されたモデル２０に、解析した権利情報の画像などを入力すると、解析手段４０が、どのキーワードを抜き出すか、あるいは、どの図形や特徴点を抜き出すかを一括で解析し、検索手段４４が、解析結果にもとづいて、既知の検索エンジンを利用して検索し、抽出手段４６が、検索結果から、取得した権利者が保有する知的財産権を侵害している可能性のある侵害情報を一括で抽出する。

次に、根拠特定手段６２は、前記抽出手段４６によって抽出した侵害情報のどの部分に、侵害の根拠があるかを特定するものである。例えば、図９に示す画面１３０において、ユーザ８０が、侵害情報１３６を選択すると、図９の右側に示す画面１５０のように、侵害情報１３６のＵＲＬ１５２と、侵害情報ページ１５４と、侵害情報ページ１５４に記載された文章１５６が表示される。根拠特定手段６２は、例えば、前記文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表して根拠部分１５８を明示する。

キーワード受付手段６４は、ユーザ８０からキーワードの指定を受け付けるものである。例えば、図８に示すように、ユーザ８０から権利情報を取得するための画面１１０に表示されたキーワード入力欄１１８に、ユーザ８０が、ユーザ端末８２を用いて入力したキーワードの指定を受け付ける。指定されたキーワードは、前記抽出手段４６が侵害情報を抽出する際に、キーワードを反映して抽出するように用いられる。キーワードを追加することにより、判断精度をカスタマイズすることができる。また、前記判断手段４３が判断した文字を、変更したり追加したりすることもできる。

管理手段６６は、抽出手段４６で抽出した侵害情報のＵＲＬを管理するものである。出力手段６８は、管理手段６６によって管理された複数のＵＲＬを一覧にしたレポートを出力するものである。例えば、抽出した全ての侵害情報のＵＲＬを一覧にすると膨大になるので、所定の期間を設定して、その期間中に抽出した侵害情報のＵＲＬを一覧にしたレポートを出力してもよい。出力するレポートのファイル形式は、ＣＳＶ形式やＰＤＦ形式が好ましが、他のファイル形式を妨げるものではない。

算出手段７０は、前記抽出手段４６によって抽出した侵害情報２６の侵害可能性を算出するものである。侵害可能性の算出は、例えば、特許権や実用新案権であれば、同じキーワードを含む個数が多いほど侵害可能性が高く、同じキーワードを含む個数が少ないほど侵害可能性が低いと算出する。例えば、図形の意匠権や商標権であれば、図形の特徴点が似ている度合いが高いほど侵害可能性が高く、図形の特徴点が似ている度合いが低いほど侵害可能性が低いと算出する。このような侵害可能性の算出結果は、例えば、パーセンテージで示されてもよい。

並替手段７２は、判断手段７０で算出した侵害可能性の高い順に、抽出した侵害情報２６を並び替えるものである。例えば、図９の左側の画面１３０であれば、侵害情報１３２が最も侵害可能性が高く、最上段に表示され、侵害情報１３４以降になるほど侵害可能性が低くなるという具合である。このような並び替えにより、ユーザ８０は、侵害可能性の高い侵害情報から順に詳細を確認することができる。

＜ユーザ端末の構成＞・・・図４は、本実施形態のユーザ端末８２の構成を示すブロック図である。ユーザ端末８２は、例えば、プロセッサ８４、メモリ８６、ストレージ８８、入力部９０、表示部９２、通信部９４を備え、これらは図示しないバスにより接続されている。プロセッサ８４は、例えば、ＣＰＵ（Central Processing Unit）により構成され、メモリ８６に記憶された各種プログラムを読み出して実行することで、各種処理を行う。

前記メモリ８６は、プロセッサ８４により実行されるプログラムを記憶するものであり、例えば、ＲＯＭ（Read Only Memory）やＲＡＭ（Random Access Memory）により構成される。ストレージ８８は、例えば、侵害情報抽出サーバ１０から取得した情報や、図示しない制御プログラムなどを記憶するものである。入力部９０は、キーボードやタッチパネルがあるが、これに限定されない。表示部９２は、ディスプレイやタッチパネルである。通信部９４は、ネットワークを介して、侵害情報抽出サーバ１０と各種データ通信を行うものである。むろん、必要に応じて、他の外部装置とデータ通信を行うようにしてもよい。

このようなユーザ端末８２としては、スマートフォンやパソコン、タブレットなどが利用されるが、これに限定されるものではない。また、ユーザ８０ごとに異なる種類のユーザ端末８２を用いてもよい。

なお、上述した各種手段は、本実施形態では、侵害情報抽出サーバ１０に備えることとしたが、全部または一部をユーザ端末８２や、クラウド上の他の端末やサーバに設けるようにしてもよい。

＜侵害情報抽出処理＞・・・次に、侵害情報抽出システム１００による侵害情報抽出処理の一例について、図１０も参照して説明する。図１０は、本実施形態の侵害情報抽出処理の一例を示すフローチャートである。

まず、侵害情報抽出サーバ１０の解析手段４０は、対象となる知的財産の権利を示す権利情報を解析する（ステップＳ２０）。対象となる知的財産の権利を示す権利情報（登録時の公報など）は、ユーザ８０がユーザ端末８２によって入力した内容から取得する。例えば、ユーザ８０によって入力された登録番号によって権利情報を取得してもよいし、ユーザ８０によって入力された内容をそのままを権利情報として取得してもよい（例えば、ユーザ８０によって入力された特許請求の範囲など）。この解析は、公報に何が記載されているかを把握するために行うものである。例えば、登録時の公報を画像キャプチャして画像解析してもよいし、登録時の公報を文字としてテキストマイニングしてもよい。

このほか、キーワードの追加により判断精度をカスタマイズするためのキーワード入力欄１１８、指定された権利者が保有する知的財産権の登録番号を一括で取得するための権利者情報入力欄１２０、登録公報を直接入力するための登録公報入力欄１２２が表示されている。ユーザ８０が、前記画面１１０において、所望の情報を入力ないし選択することで、侵害情報抽出サーバ１０は、ユーザ８０から入力された対象となる知的財産の権利を示す権利情報を取得することができる。

なお、解析手段４０による解析にあたり、侵害情報抽出サーバ１０は、必要に応じて、生成手段４２によって、他の知的財産の権利を示すデータ（登録時の公報など）を加工した学習データを機械学習して、モデル２０を生成しておいてもよい。具体的には、色々な知的財産権（特許権、実用新案権、意匠権、商標権）の権利情報を示す画像の特徴部分（キーワードや図形の特徴点など）に丸付けをして加工した学習データ１８を、数十〜数万個用意して、その学習データ１８を機械学習してモデル２０を生成する。丸付は、例えば、どのような分野のどのような内容か、を認識するために、分野を示す情報と、内容を示す情報の両方に行う。例えば、画像データを機械学習してモデルを生成するには、機械学習のうちの手法である深層学習を行ってもよい。

以上のような学習データを機械学習すると、その学習データにカスタマイズされたモデルが生成される。すなわち、公報のどの箇所に分野情報があって、どのような文字が記載されているか、どの箇所に内容情報があって、どのような文字または図形なのか、などが学習されたモデル２０が生成される。前記解析手段４０は、生成したモデル２０に、対象となる知的財産の権利を示す画像（権利情報）を入力し、権利情報からどの部分（キーワードや図形の特徴点など）を抜き出すかを解析する。

次に、侵害情報抽出サーバ１０の判断手段４３は、前記解析手段４０の解析の結果から、検索するために必要な文字または画像を判断する（ステップＳ２２）。具体的には、検索エンジンで、文字検索または画像検索をするために、検索に必要な文字または画像がどれなのかを判断する。検索に必要な文字または画像とは、例えば、分野情報は文字を判断し、内容情報は文字または図形を判断することになる。具体的には、分野情報であれば、特許のＩＰＣ分類の文字や、商標の商品・役務の区分などの文字を判断する。内容情報であれば、特許の独立項に記載されている文字や、意匠の実線と破線の画像などを判断する。

次に、侵害情報抽出サーバ１０の検索手段４４は、前記判断した文字または画像を用いて、検索エンジンで検索を行う（ステップＳ２４）。前記ステップＳ２２で判断した文字または画像を使って、既知の検索エンジンで、文字検索や画像検索を行う。

そして、侵害情報抽出サーバ１０の抽出手段４６は、前記検索の結果から、前記対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する（ステップＳ２６）。具体的には、検索結果に表示されたＷｅｂページ／動画／画像などのコンテンツの中から侵害情報を抽出する。なお、これらのコンテンツを解析して侵害情報を抽出してもよいし、解析せずにランダムに抽出してもよい。例えば、解析の精度が高い場合には、Ｗｅｂページ／動画／画像などのコンテンツを解析して侵害情報を抽出すると、最終的な強化学習後の抽出の精度がより高くなることが期待できる。

検索エンジンで検索した場合、例えば、学術論文や権利者自身の商品販売サイトなどの侵害情報とはならないノイズを拾ってしまうことがある。そこで、抽出手段４６が備えるフィルタ機能により、ノイズが除去される。

例えば、キーワードでノイズ除去する場合、検索エンジンによって検索すると、検索一覧ページではページタイトルが表示されるので、そのページタイトルから、学術系、販売系のキーワードが含まれていれば排除して、ノイズ除去を行う。または、除外するＵＲＬリストを作成し、そのリスト内のＵＲＬに該当する場合には、抽出する侵害情報から除外してもよい。むろん、他の手法によるノイズ除去を行うことを妨げるものではない。

侵害情報抽出サーバ１０の管理手段６６は、抽出手段４６で抽出した侵害情報のＵＲＬを管理し、出力手段６８が、前記管理手段６６によって管理された複数のＵＲＬを一覧にしたレポートを出力する。出力するレポートのファイル形式は、ＣＳＶ形式やＰＤＦ形式が好ましいが、他のファイル形式を妨げるものではない。

このとき、抽出した侵害情報全てを表示すると件数が多い場合には、並替手段７２によって、算出手段７０で算出された侵害可能性の高い順に、抽出した侵害情報２６を並び替え、侵害の可能性が高いベスト１０だけをユーザ端末８２の表示部９２に表示してもよい。また、前記出力手段６８は、抽出した侵害情報全件のＵＲＬの一覧をＣＳＶ形式やＰＤＦ形式などで出力してもよい。

そして、図９の画面１３０に示すように、表示された複数の侵害情報から、ユーザ８０によって選択された侵害情報１３６の詳細を、図９の画面１５０に示すように表示してもよい。

ここで、根拠特定手段６２によって、抽出手段４６によって抽出した侵害情報のどの部分に、侵害の根拠があるかを具体的に特定してもよい。例えば、図９に示す画面１３０において、ユーザ８０が、侵害情報１３６を選択すると、図９の右側に示す画面１５０のように、侵害情報１３６のＵＲＬ１５２と、侵害情報ページ１５４と、侵害情報ページ１５４に記載された文章１５６が表示される。根拠特定手段６２は、例えば、前記文章１５６中の侵害の根拠となる部分を、アンダーライン、太字、ハイライトなどで表して根拠部分１５８を明示する。

本実施形態では、通知手段６０は、前記抽出手段４６が定期的（例えば、毎日１回／週１回／隔週１回／月１回など）に侵害情報を抽出し、今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることを通知する（ステップＳ３８でＹｅｓ、ステップＳ４０）。侵害情報の変更とは、例えば、前回の抽出では５個の侵害情報が抽出され、今回の抽出では７個の侵害情報が抽出した場合などである。なお、定期的に抽出していても抽出結果に変更があるケースとしては、抽出の精度が高くなり、これまで抽出できていなかった侵害情報を抽出できるようになった場合や、新しい侵害情報を誰かがインターネット上に掲載したために抽出した場合などがある。なお、ユーザ８０側へ通知される情報には、単に侵害情報に変更があったことのみならず、変更のあった侵害情報へアクセスする手段を含んでもよい。このように定期的に判断して変化があれば通知することで、監視通知機能を持たせることができる。ユーザ８０側が把握している侵害情報をアップデートするのに役立つ。

また、本実施形態では、評価取得手段４８がステップＳ２６で抽出した侵害情報２６に対する評価２８を取得する（ステップＳ３０）。例えば、ユーザ（企業の社内の役員または従業員）や、サポーター（企業がサポーターとして契約している専門家など）に、抽出した侵害情報に対して評価をしてもらい、その評価を取得する。具体的には、「いいねボタン」や「悪いねボタン」などを設置して、そのボタンを押してもらうことで評価を取得するようにしてもよいし、所定数（例えば５個）の星を表示し、星の数が多いほど高評価、星の数が少ないほど低評価を示すような表示をし、ユーザやサポーターに星の数を選んでもらって評価を取得するようにしてもよい。取得した評価２８は、ストレージ１６に記憶される。「いいねボタン」や「悪いねボタン」、所定数の星などは、どこに表示してもよいし、メールなどで評価依頼を通知してもよい。図９の画面１５０の侵害情報ページ１５４の下方には、いいねボタン１６０及び悪いねボタン１６２が表示されている。評価手段４８は、いいねボタン１６０や、悪いねボタン１６２が押された結果を取得して、ストレージ１６に記憶する。

そして、機械学習手段４９が、前記ステップＳ３０で取得した評価２８を機械学習する（ステップＳ３２）。例えば、機械学習のうちの手法である、強化学習または深層強化学習を行ってもよい。深層強化学習は、強化学習に深層学習を掛け合わせたものである。強化学習の例としては、いいねボタン１６０が押された侵害情報を１点加点とし、悪いねボタン１６２が押された侵害情報を１点減点として、スコアを最大化する侵害情報とはどういう情報なのかを機械学習するという具合である。例えば、星５個で評価を取得する場合には、星５個と評価された侵害情報を２点加点、星４個と評価された侵害情報を１点加点、星３個と評価された侵害情報を加減無し、星２個と評価された侵害情報を１点減点、星１個と評価された侵害情報を２点減点、としてスコアを最大化する侵害情報とはどういう情報なのかを機械学習する。

次に、反映手段５０が、前記ステップＳ３２の機械学習の結果を、抽出手段４６で抽出する侵害情報の精度が良くなるように反映する（ステップＳ３４）。例えば、強化学習の結果である、「スコアを最大化する侵害情報とはどういう情報なのか」を、侵害情報の抽出に反映することで、抽出する精度を上げることができる。つまり、抽出する精度が高くなるということは、抽出する侵害情報が、いいねボタン１６０が押されやすい侵害情報や、役に立つ度合いが高い侵害情報になるということを意味する。このように、ユーザ８０から取得した評価２８をフィードバックする強化学習機能により、抽出の精度をあげていくことができる。

更に、本実施形態では、ダウンロード手段５２が、抽出手段４６によって抽出した侵害情報２６をダウンロードし、保存手段５４によって、ダウンロードした内容と日時とを紐づけて、ストレージ１６に侵害情報２６として自動的に保存することもできる。ネットワーク上の情報は保存しないとすぐに消されてしまうことがあるが、本実施形態によれば、自動的にダウンロードして保存するため、ネットワーク上から侵害情報が消されたとしても、証拠を残すことができる。また、抽出した全ての侵害情報をダウンロードするとストレージコストが膨大になるため、例えば保存ボタンを設置して、ユーザ８０が保存ボタンを押した侵害情報だけを保存して、保存ボタンが押されなかった侵害情報は一定期間後に破棄してもよい。逆に、抽出した侵害情報のＵＲＬだけをユーザ８０に提供して、ユーザ８０が保存ボタンを押した侵害情報だけをダウンロードして保存してもよい。

なお、本実施形態において、侵害情報抽出サーバ１０のグループ作成手段５６により、所定のメンバーからなるグループを作成してもよい。例えば、ユーザ端末８２の表示部９２に、グループのメンバーを指定するための画面を表示させ、当該画面に入力された所定のメンバーごとに、グループ情報３２としてストレージ１６に記憶する。グループは、例えば、企業の企画経営部、知的財産部、〇〇チームや、社外の専門家など、所定のメンバーで構成されるものであるが、これに限定されない。また、作成したグループ内で、侵害情報についてチャット可能なチャットルームも作成できる。

共有手段５８は、グループ作成手段５６で作成されたグループ内で、前記ステップＳ２６で抽出した侵害情報２６を共有する。これにより、部内共有、チーム共有、社外の専門家との共有などが可能となり、侵害情報２６を効率的に供給することができる。

また、本実施形態において、侵害情報抽出サーバ１０のキーワード受付手段６４によって、ユーザ８０からキーワードの指定を受け付けてもよい。例えば、図８に示すように、ユーザ８０から権利情報を取得するための画面１１０に表示されたキーワード入力欄１１８に入力されたキーワードの指定を受け付ける。指定されたキーワードは、前記抽出手段４６が侵害情報を抽出する際に、キーワードを反映して抽出するように用いられる。キーワードを追加することにより、判断精度をカスタマイズすることができる。また、前記判断手段４３が判断した文字を、変更したり追加したりすることもできる。

更に、本実施形態において、権利者情報取得手段６０によって、ユーザ８０から権利者の情報を取得してもよい。例えば、ユーザ８０から権利情報を取得するための画面１１０に表示された権利者情報入力欄１２０に入力された権利者情報をネットワークを介して取得してもよい。また、ユーザ８０によって入力された登録番号から、対象となる知的財産の権利者の情報を取得してもよい。

そして、前記解析手段４０は、取得した権利者が保有する知的財産を示す権利情報を一括で解析する。その権利者が保有する知的財産を示す権利情報を一括で解析するため、１つ１つ登録番号を入力する手間を省くことができる。具体的には、知的財産権の種類と登録番号によって特定される権利の登録公報などから権利情報を解析する。そして、生成されたモデル２０に、解析した権利情報の画像などを入力すると、解析手段４０が、どのキーワードを抜き出すか、あるいは、どの図形や特徴点を抜き出すかを一括で解析し、検索手段４４が、解析結果にもとづいて、既知の検索エンジンを利用して検索し、抽出手段４６が、検索結果から、取得した権利者が保有する知的財産権を侵害している可能性のある侵害情報を一括で抽出する。

＜効果＞・・・以上説明した実施形態によれば、侵害情報抽出システム１００は、対象となる知的財産の権利を示す権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出して、抽出した侵害情報に対する評価を取得して、取得した評価を機械学習して、機械学習の結果を侵害情報の抽出の精度に反映する。このように、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高めるため、知的財産の権利を侵害している可能性のある侵害情報を精度よく抽出できるという効果がある。

なお、上述した実施形態は一例であり、同様の効果を奏する範囲内で適宜変更が可能である。また、侵害情報抽出サーバ１０は、単体のコンピュータであってもよく、例えば、端末であってもよい。また、上述した機能構成が、それぞれ異なるコンピュータで実行されるコンピュータシステム（クラウド）であってもよい。更に、本実施形態では、多くの処理を侵害情報抽出サーバ１０で実行することとしたが、その機能の全部または一部を、ユーザ端末８２で実行するようにしてもよい。

また、上述した手段、機能は、コンピュータ（ＣＰＵ、情報処理装置、各種端末を含む）が、所定のプログラムを読み込んで、実行することによって実現される。プログラムは、例えば、単数又は複数のコンピュータからネットワーク経由で提供される（クラウドサービス、ＳａａＳ：ソフトウェア・アズ・ア・サービス）形態で提供される。また、プログラムは、例えば、コンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記録装置又は外部記録装置に転送し記録して実行する。

更に、本発明は、方法またはプログラムの発明として提供されてもよい。また、そのプログラムを、例えば、磁気ディスク、光ディスク、光磁気ディスクなどの記録装置（記録媒体）に予め記録しておき、その記録装置から通信回線を介してコンピュータに提供するようにしてもよい。

本発明によれば、対象となる知的財産の権利を示す権利情報を解析して、解析の結果から、検索するために必要な文字または画像を判断して、判断した文字または画像を用いて検索エンジンで検索して、検索の結果から対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出して、抽出した侵害情報に対する評価を取得して、取得した評価を機械学習して、機械学習の結果を侵害情報の抽出の精度に反映することとした。

このように、人工知能で対象となる知的財産の権利を侵害している可能性のある侵害情報を抽出する精度を高めるため、知的財産の権利を侵害している可能性のある侵害情報を精度よく抽出できるため、侵害情報抽出システムの用途に適用できる。

１０：侵害情報抽出サーバ
１２：プロセッサ
１４：メモリ
１６：ストレージ
１８、１８Ａ、１８Ｂ：学習データ
２０：モデル
２２：権利情報
２４：判断結果
２５：検索結果
２６：侵害情報
２８：評価
３０：学習結果
３２：グループ情報
３４：通信部
４０：解析手段
４２：生成手段
４３：判断手段
４４：検索手段
４６：抽出手段
４８：評価取得手段
４９：機械学習手段
５０：反映手段
５１：通知手段
５２：ダウンロード手段
５４：保存手段
５６：グループ作成手段
５８：共有手段
６０：権利者情報取得手段
６２：根拠特定手段
６４：キーワード受付手段
６６：管理手段
６８：出力手段
７０：算出手段
７２：並替手段
８０：ユーザ
８２：ユーザ端末
８４：プロセッサ
８６：メモリ
８８：ストレージ
９０：入力部
９２：表示部
９４：通信部
１００：侵害情報抽出システム
１１０：画面
１１２：プルダウンメニュー
１１４：登録番号入力欄
１１６Ａ：ＩＰＣ分類入力欄
１１６Ｂ：分類入力欄
１１６Ｃ：区分入力欄
１１８：キーワード入力欄
１２０：権利者情報入力欄
１２２：登録公報入力欄
１３０：画面
１３２、１３４、１３６、１４０：侵害情報
１５０：画面
１５２：ＵＲＬ
１５４：侵害情報ページ
１５６：根拠情報
１６０：いいねボタン
１６２：悪いねボタン
Ｃ、Ｃ１、Ｃ２：囲み線

Claims

対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する解析手段と、
前記解析の結果から、検索するために必要な文字または画像を判断する判断手段と、
前記判断した文字または画像を用いて、検索エンジンで検索する検索手段と、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出する抽出手段と、
前記抽出した侵害情報に対する評価を取得する評価取得手段と、
前記取得した評価を機械学習する機械学習手段と、
前記機械学習の結果を、前記抽出手段が侵害情報を抽出する精度に反映する反映手段と、
を備える侵害情報抽出システム。
他の特許、実用新案、意匠及び商標のいずれか一つの権利を示すデータを加工した学習データを機械学習して、モデルを生成する生成手段を備え、
前記解析手段は、前記モデルを利用して、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析する請求項１に記載の侵害情報抽出システム。
前記機械学習手段は、前記取得した評価を、強化学習または深層強化学習する請求項１に記載の侵害情報抽出システム。
前記反映手段は、前記機械学習の結果を、前記判断手段が判断する精度にも反映する請求項１に記載の侵害情報抽出システム。
前記抽出手段は、定期的に抽出し、
今回抽出した侵害情報が、前回抽出した侵害情報から変更がある場合に、抽出の結果に変更があることを通知する通知手段、
を備える請求項１に記載の侵害情報抽出システム。
前記抽出した侵害情報をダウンロードするダウンロード手段と、
前記ダウンロードした内容と日時とを紐づけて保存する保存手段と、
を備える請求項１に記載の侵害情報抽出システム。
所定のメンバーからなるグループを作成するグループ作成手段と、
前記作成したグループ内で、前記抽出した侵害情報を共有する共有手段と、
を備える請求項１に記載の侵害情報抽出システム。
前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利者の情報を取得する権利者情報取得手段を備え、
前記解析手段は、前記取得した権利者が保有する特許、実用新案、意匠及び商標のいずれか一つを示す権利情報を一括で解析する請求項１に記載の侵害情報抽出システム。
前記抽出した侵害情報を解析して、どの部分に侵害の根拠があるかを特定する根拠特定手段、
を備える請求項１に記載の侵害情報抽出システム。
キーワードの指定を受け付けるキーワード受付手段を備え、
前記抽出手段は、前記指定されたキーワードを反映して抽出する、
請求項１に記載の侵害情報抽出システム。
前記抽出した侵害情報のＵＲＬを管理する管理手段と、
前記管理した複数のＵＲＬを一覧にしたレポートを出力する出力手段と、
を備える請求項１に記載の侵害情報抽出システム。
前記抽出した侵害情報の侵害可能性を算出する算出手段と、
前記算出した侵害可能性の高い順に、前記抽出した侵害情報を並び替える並替手段と、
を備える請求項１に記載の侵害情報抽出システム。
対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析するステップと、
前記解析の結果から、検索するために必要な文字または画像を判断するステップと、
前記判断した文字または画像を用いて、検索エンジンで検索するステップと、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、
前記抽出した侵害情報に対する評価を取得するステップと、
前記取得した評価を機械学習するステップと、
前記機械学習の結果を、前記抽出するステップで侵害情報を抽出する精度に反映するステップと、
を備える侵害情報抽出方法。
コンピュータに、
対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を示す権利情報を解析するステップと、
前記解析の結果から、検索するために必要な文字または画像を判断するステップと、
前記判断した文字または画像を用いて、検索エンジンで検索するステップと、
前記検索の結果から、前記対象となる特許、実用新案、意匠及び商標のいずれか一つの権利を侵害している可能性のある侵害情報を抽出するステップと、
前記抽出した侵害情報に対する評価を取得するステップと、
前記取得した評価を機械学習するステップと、
前記機械学習の結果を、前記抽出するステップで侵害情報を抽出する精度に反映するステップと、
を実行させるための侵害情報抽出プログラム。