JP6123143B1

JP6123143B1 - 特許要件適否予測装置および特許要件適否予測プログラム

Info

Publication number: JP6123143B1
Application number: JP2016027034A
Authority: JP
Inventors: 和之白井
Original assignee: 和之白井
Priority date: 2016-02-16
Filing date: 2016-02-16
Publication date: 2017-05-10
Anticipated expiration: 2036-02-16
Also published as: JP2017146720A

Abstract

【課題】特許要件の適否に関する予測を審査実務に適合した内容で行い、特許出願の監視負担を有効に軽減する。【解決手段】特許要件適否予測サーバは、公報データ抽出手段と、予測対象データによって特定される予測対象出願について、予測対象発明の要旨を特定し得る要旨データを予測対象データから抽出する要旨データ抽出手段と、要旨データを記憶する要旨データ記憶手段と、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有する。【選択図】図４

Description

本発明は、出願公開された特許出願に係る発明について、新規性、進歩性といった特許要件に適合しているか否かの適否を予測する特許要件適否予測装置および特許要件適否予測プログラムに関する。

従来、電力需要や株価の予測、商品の購買予測、不動産の将来価格の予測といった様々な場面で予測が行われ、そのための装置や方法も数多く提案されている。発明を特許出願して権利化する権利化業務に関しても、出願された発明に関する特許可能性（特許性、パテンタビリティともいう）を予測する技術が提案されている（例えば、特許文献１参照）。特許文献１には、次のような特許性予測装置が記載されている。この装置は、審査結果通知済の特許出願（既通知出願）を特許データベースから取得して、既通知出願の請求項についての情報量と、類似する先行出願の数を検出し、既通知出願を対象とする回帰分析を実行して、これらから算出した登録予見式にしたがい、審査結果未通知出願の特許性の予測値を算出する。

また、従来、特許可能性の予測のほか、発明の特許性や発明の質、特許出願や特許権の価値を評価する装置や方法も提案されている（例えば、特許文献２，３，４，５，６参照）。

特開２００９−２３８０７４号公報特開２０１５−２０７１９４号公報特開２０００−１８１９６６号公報特開２０００−１３２６０６号公報特開２０１５−１８７８８３号公報特開２００７−１０８８０３号公報

上記のとおり、従来技術によれば特許出願について特許可能性を予測することや特許権を評価することが可能である。

しかし、前述の従来技術、例えば、特許文献１記載の特許性予測装置では、特許性の予測が、既通知出願の請求項についての情報量や、類似する先行出願数といった情報に基づき算出された登録予見式にしたがって行われる。この予測は、請求項の広狭、技術分野の疎密および特許性との間の統計的な相関関係に基づいて行われ、特許法や特許・実用新案審査基準に基づくものではなかった。そのため、特許文献１記載の特許性予測装置では、特許実務に沿った予測結果が得られないおそれが高いという課題があった。

ところで、一般に、他社がどのような特許出願をし、どのような特許権を取得しようとしているのかは、自社にとって重大な関心事である。そのため、特許権に関する権利化業務の中には、自社のみならず、他社の特許出願を監視して、特許権の成否を予測する場面が少なからず存在している。その予測のためには、出願書類を読み込み、先行技術調査を行い、特許要件の適否を判断しなければならないから、とりわけ他社出願の監視負担は相当なものである。

この点、従来技術のような特許性予測装置を用いれば、審査結果未通知出願の特許性が予測されるため、権利化業務の中でその予測結果を活用する場面も考えられる。

しかし、特許要件の審査は、特許庁審査官が特許法や特許・実用新案審査基準に沿って行うものであるから（特許法47条）、これらが考慮されない特許性の予測は、審査実務に適合していないおそれがあり、したがって、特許出願の監視負担を軽減するのに有効であるとはいえない。

したがって、特許要件に適合しているか否かの予測が審査実務に適合した内容で行われることによって、特許出願の監視負担をできる限り有効に軽減することが望まれていた。

本発明は、上記課題を解決するためになされたもので、特許要件の適否に関する予測が審査実務に適合した内容で行われ、特許出願の監視負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムを提供することを目的とする。

上記課題を解決するため、本発明は、公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶する要旨データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行う特許要件適否予測装置を特徴とする。

また、本発明は、公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶する要旨データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行い、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、予測対象出願の各請求項に応じた要旨ベクトルと、主引用発明検索部による概念検索の結果、最も類似度が高いとされた最類似文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置を提供する。

上記特許要件適否予測装置の場合、文書分類部は、訓練データとして、学習文書ベクトルが第１の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトルとの組み合わせと、学習文書ベクトルが第２の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、第１の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていた進歩性拒絶出願のその拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で主たる刊行物として引用されていた主引用文献に応じた引用文書ベクトルとの差分に応じた第１の移動文書ベクトルであり、第２の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項１に応じた文書ベクトルと、拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第２の移動文書ベクトルであるようにすることができる。

さらに、本発明は、コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、そのコンピュータを公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶させる要旨データ記憶制御手段と、要旨データ記憶制御手段の制御によって記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、進歩性予測処理部が公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、主引用発明検索部が要旨データ記憶制御手段の制御によって記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部が要旨データ記憶制御手段の制御によって記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行うように、コンピュータを特許要件適否予測処理手段として機能させる特許要件適否予測プログラムを提供する。

以上詳述したように、本発明によれば、特許要件の適否に関する予測が審査実務に適合した内容で行われ、特許出願の監視負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムが得られるる。

本発明の実施の形態に係る特許要件適否予測サーバを含む特許要件適否予測システムのシステム構成図である。特許要件適否予測サーバの内部の構成を中心に示すブロック図である。ユーザ端末装置の内部の構成を中心に示すブロック図である。本発明の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。要旨データ抽出部の主要な構成を示す機能ブロック図である。特許要件適否予測処理部の主要な構成を示す機能ブロック図である。入力ベクトル生成部の主要な構成を示す機能ブロック図である。要旨データ記憶部のレコードレイアウトの一例を示す図である。ＣＴデータ記憶部のレコードレイアウトの一例を示す図である。予測結果記憶部のレコードレイアウトの一例を示す図である。機械学習部のネットワーク構造の一例を示す図である。特許要件適否予測処理の動作手順の一例を示すフローチャートである。特許要件適否予測ルーチンの動作手順の一例を示すフローチャートである。新規性・拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。進歩性予測ルーチンの動作手順の一例を示すフローチャートである。単一独立項ルーチンの一例を示すフローチャートである。複数独立項ルーチンの動作手順の一例を示すフローチャートである。独立項検索処理の一例を示すフローチャートである。主引用発明検索処理の一例を示すフローチャートである。副引用発明検索処理の一例を示すフローチャートである。従属項検索処理の一例を示すフローチャートである。審査対象となる特許出願と、複数の特許公開公報との関係を模式的に示した図である。独立項テーブルのレコードレイアウトの一例を示す図である。特許要件適否予測リストの一例を示す図である。

以下、本発明の実施の形態について図面を参照しつつ説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。

(特許要件適否予測システムの全体構成）
まず、本発明の実施の形態に係る特許要件適否予測サーバ１０を含む特許要件適否予測システム１の構成について説明する。

図１は特許要件適否予測システム１のシステム構成図である。図１に示すように、特許要件適否予測システム１は、特許要件適否予測サーバ１０と、ユーザが操作する複数のユーザ端末装置３０（図１では、固定端末装置３０Ａ、３０Ｂ、３０Ｃ）とを有し、これらがインターネットＮ１を介して互いに接続される構成を有している。

特許要件適否予測サーバ１０は、特許要件適否予測プログラムにしたがったデータ処理を行い、公開済の特許出願（以下「公開済出願」という）のうち、ユーザが指定した出願公開番号（または出願番号）に応じた特許出願（予測対象出願）について、特許要件（本実施形態では、新規性（特許法第２９条第１項３号）、拡大先願（特許法第２９条の２）および進歩性（特許法第２９条第２項））に適合しているか否かを予測する。ユーザ端末装置３０は、特許要件適否予測サーバ１０との間でデータの受信または送信を行う。

特許要件適否予測システム１では、特許要件適否予測サーバ１０が、予測対象出願について、後述する主引用発明検索および副引用発明検索を行うとともに、進歩性違反の拒絶理由が見つかる可能性が高いか低いかを審査実績に基づく複数の訓練データで機械学習を行った人工知能プログラムで予測して、特許要件の適否を予測する。特許要件適否予測サーバ１０によって、特許要件の適否の予測が審査実務に適合した内容で行われるため、特許出願の監視負担を有効に軽減することができる。

（特許要件適否予測サーバ１０の構成）
次に、図２を参照して特許要件適否予測サーバ１０の構成について説明する。図２は、特許要件適否予測サーバ１０の内部の構成を中心に示すブロック図である。特許要件適否予測サーバ１０は、公開済出願の特許要件適否の予測に関するサービスを提供する専門事業者が運用するサーバである。

特許要件適否予測サーバ１０は、ＣＰＵ（Central Processing Unit）１１と、ＲＯＭ(Read Only Memory)１２と、ＲＡＭ（Random Access Memory）１３とを有している。ＣＰＵ１１は、ＲＯＭ１２に記憶されているプログラムにしたがい作動して、ＫＢＣ（Key board controller）１７を介してキーボード１９やマウス２０の操作入力で得られる入力データをメインバス１９Ａを介して入力する一方、他の構成要素との信号の入出力を行い、特許要件適否予測サーバ１０全体の動作制御を行う。ＣＰＵ１１は、後述する特許要件適否予測プログラムにしたがい、後述する公報データ抽出部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、対象公報抽出部１０４、予測結果編集処理部１０５としての動作を行う。ＲＯＭ１２には、特許要件適否予測プログラム等のＣＰＵ１１が実行する制御プログラムと、恒久的なデータが記憶されている。ＲＡＭ１３にはＣＰＵ１１が作動する際に用いるデータやプログラムが記憶されている。

そのほか特許要件適否予測サーバ１０は、ハードディスク装置（Hard disk drive,ＨＤＤ）１４と、通信制御部１５と、通信処理部１６と、ビデオコントローラ１８とを有している。

ハードディスク装置１４には、特許要件適否予測プログラムの実行に必要な図４に示す各種記憶部またはＤＢ（database）と、その他の記憶部またはＤＢが形成されている。ハードディスク装置１４には、指定ナンバトランザクション記憶部（指定ナンバＴＲ記憶部）１５１と、予測対象トランザクション記憶部（予測対象ＴＲ記憶部）１５２と、要旨データ記憶部１５３と、クレームツリーデータ記憶部１５４と、対象公報記憶部１５５と、予測結果ファイル記憶部１５６とが形成されている。各記憶部またはＤＢについては後述する。

通信制御部１５は、ＣＰＵ１１の指示にしたがい作動して、ユーザ端末装置３０や、図示しない特許庁サーバとの通信を行うための回線の接続および切断を制御する。通信処理部１６は、通信制御部１５の指示にしたがい作動して、インターネットＮ１を介して行われるデータの送受信を実行する。

ビデオコントローラ１８は、図示しないディスプレイ装置における画像表示を制御して、各種の設定に用いられる画面等を表示させる。

そして、ハードディスク装置１４の各種記憶部またはＤＢについて説明すると次のとおりである。指定ナンバＴＲ記憶部１５１には、ユーザ端末装置３０から送信されるユーザ特定に必要なデータ（例えば、会員ＩＤ）と、そのユーザが指定した出願公開番号または出願番号（これらを「指定番号」という）とが記憶されている。予測対象ＴＲ記憶部１５２には、公報データ抽出部１０１が公開公報ＤＢ１５０から指定番号に応じて抽出した予測対象出願の出願書類電子データ（予測対象データ）が記憶されている。公開公報ＤＢ１５０は、公開特許公報の電子データが公開公報データとして格納されている。公開公報ＤＢ１５０として、図４では、工業所有権情報・研修館により運営されている特許情報プラットフォーム（Ｊ−ＰｌａｔＰａｔ）のデータベースまたはそこからダウンロードした電子データを記憶しているデータベースを想定している。後者のデータベースは、図示しないサーバに格納することができるし、ＨＤＤ１４に格納してもよい。

要旨データ記憶部１５３には、要旨データ抽出部１０２が抽出・生成した要旨データが記憶されている。要旨データは、予測対象出願に開示されている発明（予測対象発明）の要旨を特定し得る用語を示す用語データであって、少なくとも後述する特徴部分データと課題データとが含まれている。

要旨データ記憶部１５３には、例えば図８に示すように、データ種別エリア１５３ａ、項番エリア１５３ｂ、用語記憶部１５３ｃを有するレコードが記憶されている。データ種別エリア１５３ａは、各レコードに記憶されているデータが予測対象出願のどの部分のデータであるのかを示すデータ（「データ種別」という）が記憶されている。本実施の形態では、データ種別として、"Ｃ"、"Ｐ"、"Ｔ"、"Ｄ"の４種類が設定されている。"Ｃ"は特許請求の範囲のデータ、"Ｐ"は発明が解決しようとする課題の欄のデータ、"Ｔ"は技術分野の欄のデータ、"Ｄ"は発明の実施の形態の欄のデータをそれぞれ示している。項番エリア１５３ｂには、請求項の番号が記憶されている。用語記憶部１５３ｃは、用語エリア１５３ｃ１、展開度エリア１５３ｃ２および必須フラグエリア１５３ｃ３を有している。図８では、これらの組み合わせが１５通り用意されているが、この組み合わせは１５通りより多くてもよいし、少なくてもよい。そして、用語エリア１５３ｃ１，展開度エリア１５３ｃ２，必須フラグエリア１５３ｃ３には、それぞれ要旨の特定に用いられる用語、後述する展開度（Ｅｄ）、必須フラグ（Ｅｆ）が記憶されている。

図８では、一例として、特開２００８−６２２８２号公報から抽出した要旨データ（上半分のデータ）と、特開２０１１−１８６７３５号公報から抽出した要旨データ（下半分のデータ）とが記載されている。前者は、独立形式で記載されている請求項（独立項）が１つの場合、後者は独立項が複数の場合の例示である。

クレームツリーデータ記憶部（ＣＴデータ記憶部）１５４には、後述するクレームツリーデータ（claim tree データ、ＣＴデータともいう）が記憶されている。ＣＴデータ記憶部１５４には、例えば図９（Ａ）に示すように、独立区分エリア１５４ａと、ナンバエリア１５４ｂと、ＭＡＸ区分エリア１５４ｃと、従属項エリア１５４ｄと、サーチフラグエリア１５４ｅを含むレコードが記憶されている。

独立区分エリア１５４ａには、予測対象出願の各請求項が独立項か、従属形式で記載されている請求項（従属項）のいずれであるかを示す独立区分（独立項がスペース、従属項が"Ｄ"）が記憶されている。ナンバエリア１５４ｂには各請求項の番号（請求項ナンバ）が記憶されている。ＭＡＸ区分エリア１５４ｃには、ＭＡＸ区分が記憶されている。ＭＡＸ区分には、同じ独立項を引用する従属項が複数あった場合の最も番号の大きい請求項（最大従属項）に"Ｍ"、それ以外にスペースがセットされている。

図９（Ａ）は、特開２００８−６２２８２号公報のＣＴデータを示しているが、該公報では、従属項の中で請求項９が最大従属項なので、請求項ナンバが"９"のレコードのＭＡＸ区分に"Ｍ"、それ以外の請求項ナンバのＭＡＸ区分にスペースがセットされている。また、図９（Ｂ）は、特開２０１１−１８６７３５号公報のＣＴデータを示しているが、該公報では、請求項１、請求項６が独立項であり、請求項５、請求項７が最大従属項なので、請求項ナンバが"５"のレコードと、"７"のレコードのＭＡＸ区分に"Ｍ"、これら以外のＭＡＸ区分にスペースがセットされている。

従属項エリア１５４ｄには、従属項が引用している請求項の番号が記憶されている。サーチフラグエリア１５４ｅには、サーチフラグ、すなわち、後述する主引用発明検索が実行済である否かの区分が記憶されている。スペースは主引用発明検索の実行前、"９"は実行済を示している。

対象公報記憶部１５５には、主引用発明検索および副引用発明検索の対象とされる公開公報データ（検索対象公報データ）が記憶されている。予測結果記憶部１５６には、図１０に示すような後述する予測結果ファイルが記憶されている。

続いて、要旨データ抽出部１０２、特許要件適否予測処理部１０３について説明する。要旨データ抽出部１０２は、図５に示すように、候補抽出部１１１、要部データ抽出部１１２、ＣＴデータ生成部１１３、テキスト分析・用語抽出部１１４、展開度・必須要件分析部１１５、係り受け解析部１１６、パターンデータ抽出部１１７およびファイル生成部１１８を有している。なお、図示の都合上、図５では、詳細な説明データ記憶部（詳細な説明ＴＲ）１６０、請求の範囲データ記憶部（請求の範囲ＴＲ）１６１、要部データ記憶部（要部データＴＲ）１６２が要旨データ抽出部１０２に含まれているが、これらはデータ記憶手段であるＨＤＤ１４に設けられている。

候補抽出部１１１は、予測対象ＴＲ記憶部１５２に記憶されている予測対象データを読み込み、そこから不要なデータをスキップ（読み飛ばし）して要旨データ作成に必要なデータを抽出し、抽出後のデータを詳細な説明データ（明細書データ）と、特許請求の範囲データとに分けて、それぞれ詳細な説明ＴＲ１６０、請求の範囲ＴＲ１６１に記憶させる。ここでは、「前記」、「該」、「当該」と、段落番号がスキップされる。

要部データ抽出部１１２は、予測対象ＴＲ記憶部１５２に記憶されている予測対象データを読み込み、そこから明細書の要部に相当する部分のデータ（要部データ）を抽出し、抽出した要部データを要部データ記憶部１６２に記憶させる。ここでは、要部データとして、明細書中の「発明の名称」の欄のデータ（発明の名称）および「技術分野」の欄のデータと、「発明が解決しようとする課題」の欄の「本発明」または「この発明」の文字列を含む一文のデータとを抽出する。

ＣＴデータ生成部１１３は、予測対象ＴＲ記憶部１５２に記憶されている予測対象データを読み込み、そのうちの特許請求の範囲の欄に記載されているデータを読み込んで前述したクレームツリーデータ（ＣＴデータ）を生成し、それＣＴデータ記憶部１５４に記憶させる。

テキスト分析・用語抽出部１１４は、詳細な説明ＴＲ１６０、請求の範囲ＴＲ１６１からそれぞれテキストデータを入力し、そのそれぞれについて、特徴語を抽出して（特許請求の範囲は請求項ごと）、各特徴語を重要とされる順序で出力する。この場合、例えば、形態素解析またはＮ−Ｇｒａｍなどの索引文字列抽出処理を実行して、各単語の出現頻度、各単語の共起頻度を調べ、その結果に応じて各特徴語を出力する。

展開度・必須要件分析部１１５は、請求の範囲ＴＲ１６１から特許請求の範囲データを読み込んで，テキスト分析・用語抽出部１１４で抽出された各特徴語について、展開度と、必須要件に該当するか否かとを調べ、その結果を出力する。ここで、展開度（Ｅｄ）とは、各特徴語がいくつの請求項に展開されているのか（用いられているのか）、展開されている請求項の個数を示すデータである。一般に、特許出願の出願書類では、できるだけ広い範囲の発明思想がカバーされるように、より重要な事項が請求項１（または他の独立項）に広い範囲で記載され、そこから下位の請求項に段階的に範囲を縮小（具体化）されながら記載されることが多い。そのため、展開度（Ｅｄ）が大きいほど、重要度がより高いと考えられるので、展開度は発明の要旨を把握するのに有益な情報と考えられる。例えば、図８に示すデータ種別"Ｃ"、項番"１"の用語エリア１５３ｃ１が"用語１"のエリアに「パンチ」という用語がセットされているが、この「パンチ」という用語は、特開２００８−６２２８２号公報の特許請求の範囲において、請求項１、２、３、４、５に記載されているので、展開度エリア１５３ｃ２に"５"がセットされている。

必須要件に該当するか否かは、各請求項の特徴部分に記載されているか否かであって、必須フラグ（Ｅｆ）によって示されている。本件出願に係る発明の実施の形態では、各請求項における最終段落、または「ことを特徴とする」の文字列を含む一文を各請求項の特徴部分としていて、そのデータが特徴部分データであり、ここに含まれている用語が必須要件を満たすものとしている。特徴部分から抽出された用語には、必須要件を満たすことを示す"Ｘ"が必須フラグ（Ｅｆ）にセットされる。

係り受け解析部１１６は、要部データ記憶部１６２に記憶されている要部データについて係り受け解析を行い、その結果をパターンデータ抽出部１１７に出力する。

パターンデータ抽出部１１７は、係り受け解析部１１６の解析結果を入力して、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとなる文字列と、発明の名称のうち、先頭に記載されているもの（筆頭名称）を出力する。例えば、特開２００８−６２２８２号公報の「発明が解決しようとする課題」の欄の「本発明」の文字列を含む一文の中に、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとして、「調整」および「行わず」と、「同心性」および「得る」と、「精密打ち抜き型」および「提供」がある。これらがパターンデータ抽出部１１７から出力される。本実施の形態において、パターンデータ抽出部１１７から出力されるデータのうち、「発明が解決しようとする課題」の欄から抽出されたデータが課題データに相当していて、例えば図８のデータ種別"Ｐ"のレコードのようなデータとすることができる。

ファイル生成部１１８はテキスト分析・用語抽出部１１４、展開度・必須要件分析部１１５およびパターンデータ抽出部１１７から出力されるデータを用いて要旨データを生成し、要旨データ記憶部１５３に記憶させる。この場合、テキスト分析・用語抽出部１１４および展開度・必須要件分析部１１５の出力データを用いて、データ種別"Ｃ"、"Ｄ"のデータが生成され、パターンデータ抽出部１１７の出力データを用いて、データ種別"Ｐ"、"Ｔ"のデータが生成される。

特許要件適否予測処理部１０３は、図６に示すように、新規性・拡大先願予測処理部１２５と、進歩性予測処理部１２６とを有している。新規性・拡大先願予測処理部１２５は、要旨データ記憶部１５３に記憶されている要旨データを検索タームに用いて対象公報記憶部１５５の検索対象公報データの全文検索を行い、その結果にしたがい、新規性・拡大先願予測データＮｄを予測結果ファイル生成部１２７に出力する。新規性・拡大先願予測処理部１２５の機能、動作手順については、後に詳しく説明する。

進歩性予測処理部１２６は、引用発明検索部１３１と、入力ベクトル生成部１３２と、機械学習部１３３とを有している。引用発明検索部１３１は、後述する主引用発明検索を行う主引用発明検索部および副引用発明検索を行う副引用発明検索部を有している。また、引用発明検索部１３１は、主引用発明検索および副引用発明検索の結果にしたがい、進歩性予測データＶｄ１を予測結果ファイル生成部１２７に出力し、検索の対象となった請求項に応じた請求項要旨データｉｅｄと概念検索データＶｄ２を入力ベクトル生成部１３２に出力する。概念検索データＶｄ２には、概念検索の結果、最も類似度が高いとされた文献（最類似文献）の公開公報データが含まれている。引用発明検索部１３１の機能、動作手順については、後に詳しく説明する。

入力ベクトル生成部１３２は、図７に示すように、要旨ベクトル生成部１３２ａと、引用候補ベクトル生成部１３２ｂと、移動ベクトル生成部１３２cとを有している。

要旨ベクトル生成部１３２ａは、請求項要旨データｉｅｄを入力してその特徴語を抽出し、各語に応じた重み付けを行って、各請求項の記載に応じた要旨ベクトルＥＶを生成する。引用候補ベクトル生成部１３２ｂは、概念検索データＶｄ２に含まれる最類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って最類似文献に応じた文書ベクトル（引用候補ベクトル）ＲｆＶを生成する。移動ベクトル生成部１３２ｃは、要旨ベクトルＥＶと、引用候補ベクトルＲｆＶとの差分を計算して、双方の文書ベクトルの差分に応じた要旨移動ベクトルＶ３を生成する。

最類似文献は、主引用発明検索部による概念検索の結果、最も類似度が高いとされた文献であるため、予測対象発明の進歩性の審査で主引用発明の開示文献として引用される確率が最も高いと推測される。そのため、最類似文献を引用候補として引用候補ベクトルＲｆＶを求め、これと要旨ベクトルＥＶとの差分を計算して要旨移動ベクトルＶ３を求めれば、予測対象発明と、最類似文献に開示されている発明との相違に応じた文書ベクトル（要旨移動ベクトルＶ３に相当する）が生成される。

機械学習部１３３は、本発明の実施の形態にかかる文書分類部であって、次のような訓練データ（学習パターンともいう）を用いた機械学習（教師付き学習）によって、後述する要旨移動ベクトルＶ３を進歩性の要件に適合するクラスと適合しないクラス（拒絶理由が無いクラスと有るクラス）に分類し、その分類結果に応じた出力信号（要件適否文書ベクトル）Ｖ４を出力するように構築されている。本発明の実施の形態の場合、学習パターンは次に述べるＨＬパターンとすることができる。

ＨＬパターンは、学習文書ベクトルが第１の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトル（例えば、正解のクラスに対応した次元だけが"１"で、他が"０"のベクトル）との組み合わせと、学習文書ベクトルが第２の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル（例えば、上記とは別の次元だけが"１"で、他が"０"のベクトル）との組み合わせのパターンである。

第１の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知（１ｓｔアクション）が発行された出願であって、その１ｓｔアクションで進歩性違反の拒絶理由（特許法第２９条第２項の要件を満たしていないとする拒絶理由）が指摘されていた出願（進歩性拒絶出願）の該拒絶理由が指摘されていた（拒絶理由通知発行時点の）請求項に応じた文書ベクトルと、そのときの引用文献１（主たる刊行物として引用されていた主引用文献）に応じた文書ベクトル（引用文書ベクトル）との差分に応じた第１の移動文書ベクトルである。

第２の学習文書ベクトルは、公開済出願の中で審査の結果、１ｓｔアクションが発行されずに特許査定が発行された出願（拒絶無し出願）または１ｓｔアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願（進歩性拒絶無し出願）の（拒絶理由通知が発行された時点の）請求項１に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献（学習用最類似文献）に応じた文書ベクトル（非引用文書ベクトル）との差分に応じた第２の移動文書ベクトルである。

機械学習部１３３は、上記のようなＨＬパターンの学習パターンで学習を繰り返し行うことにより、要旨移動ベクトルＶ３を進歩性の拒絶理由有りまたは無しのいずれかのクラスに分類し、その分類したクラスに応じた要件適否文書ベクトルＶ４を出力する。前者は、予測対象出願について、進歩性違反の拒絶理由が発行される可能性が高い場合、後者は低い場合に相当する。

機械学習部１３３は、入力される要旨移動ベクトルＶ３を進歩性の拒絶理由が有るクラスと無いクラスに分類して、その分類結果に応じた要件適否文書ベクトルＶ４を出力すればよいので、機械学習部１３３にサポートベクターマシーン（ＳＶＭ）と呼ばれる学習アルゴリズムを適用することができる。サポートベクターマシーン（ＳＶＭ）によれば、決定境界との距離（マージン）が最大になるように、決定境界を得ることができる。

また、機械学習部１３３の情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができる。ニューラルネットワークには、階層型ニューラルネットワークと、相互結合型ニューラルネットワークがある。たとえば、機械学習部１３３の学習アルゴリズムとして、階層型ニューラルネットワークのパーセプトロンを適用することができる。

パーセプトロンはＳ層、Ａ層、Ｒ層と呼ばれる３層からなる階層型ネットワークで構成され（図示せず）、Ｓ層からＡ層、Ａ層からＲ層という片方向の結合だけが存在している。前述のＨＬパターンの学習パターンが与えられると、第１の学習文書ベクトルまたは第２の学習文書ベクトルが入力されたときの出力ベクトルがそれぞれの教師ベクトルと異なっていたときに、その誤差に応じて結合の重みが修正され、出力ベクトルと教師ベクトルとの誤差が一定値以下になったときに学習が終了する。

しかしながら、パーセプトロンでは、学習パターンが線形分離不可能な場合にアルゴリズムが停止しないおそれがある。そのため、機械学習部１３３が学習によって非線形な決定境界を獲得できるようにするため、階層型ニューラルネットワークの中で応用例が多く、誤識別の少ない非線形識別面が学習できるＢＰ（バックプロパゲーション）ネットワークを適用することが好ましい。

ＢＰネットワークは、図１１に示すように、入力層および出力層と、その間の中間層とを有し、誤差逆伝播アルゴリズムと呼ばれる学習アルゴリズムによって、ユニット間のすべての結合の重みが学習可能になっている。誤差逆伝播アルゴリズムでは、入力信号が入力層、中間層、出力層と伝わり、その一方、誤差信号が逆に伝わることによって、重み調整が行われる。

そして、図１１に示すＢＰネットワークに、学習パターンｘ_ｐ（ｘ_０、ｘ_１・・・ｘ_ｎ）が入力されたとき、ある階層のｊ（０≦ｊ≦ｎ）番目のユニットには、そのユニットｊとの結合を有する１階層前のユニットから重み付きの信号が入力される。そこで、１階層前のｉ（０≦ｉ≦ｎ）番目のユニットからの信号をｔ_ｉｐ，重みをｗ_ｉｊとすると、ユニットｊへの入力は、式１のようになり、ユニットｊの出力は、閾値関数をｆとして、式２のようになる。

式１

式２

学習パターンｘ_ｐに対する誤差Ｄ_ｐは、出力層のユニットｋの出力と、教師信号ｂ_ｋｐの差の２乗和で定義されるから、以下の式３のようになる。この誤差Ｄ_ｐをすべての学習パターンに対して足しあげて式４のＤを求め、そのＤが最小になるように、ユニット間の結合重みが調整されて機械学習部１３３における学習が行われる。この場合、個々の学習パターンが入力されるごとに、式５によって重みが調整される。ｗ_ｉｊは更新前の重み、ｗ'_ijは更新後の重み、ρは学習係数である。これは確率的最急降下法と呼ばれる。なお、ユニットの入出力関数は式６に示すシグモイド関数が用いられる。

式３

式４

式５

式６

（ユーザ端末装置３０の構成）
ユーザ端末装置３０は、図１に示すように、インターネットＮ１への接続環境を備え、特許要件適否予測サーバ１０と通信を行うことができる。なお、ユーザ端末装置３０は、据え置き型（または持ち運び可能なノート型）のパーソナルコンピュータを想定しているが、タブレット型の端末装置でもよい。

ユーザ端末装置３０は、図３に示すように、ＣＰＵ３１、ＲＯＭ３２、ＲＡＭ３３、データ記憶部３４、液晶表示部３５を有している。また、ユーザ端末装置３０は、音声変換処理部３６、通信制御部３７、通信処理部３８ａ、無線通信部３８ｂ、スピーカ３９およびマイク４０を有している。

ＣＰＵ３１は、ＲＯＭ３２に記憶されているプログラムにしたがい作動してユーザ端末装置３０全体の動作制御を司る。ＲＯＭ３２はＣＰＵ３１が実行するプログラム、例えば、データ通信を行うための通信制御プログラムが記憶されている。ＲＡＭ３３には、ＣＰＵ３１によるプログラムの実行に必要なデータ等が記憶される。

データ記憶部３４には種々のデータが記憶されている。液晶表示部３５は、ＬＣＤ（Liquid Crystal Display）とその駆動部を有し、文字、図形、記号などの画像表示を行う画像表示手段である。音声変換処理部３６は、音声データを伸張してスピーカ３９に出力する一方、マイク４０から入力するアナログ音声信号をデジタルの音声データに変換および圧縮して、通信処理部３８ａに入力する。通信制御部３７はＣＰＵ３１の指示を受けて作動し、データ通信を行うための回線の接続および切断を制御する。通信処理部３８ａは、通信制御部３７の指示にしたがい作動して、インターネットＮ１を介して行われるデータの送受信を実行する。無線通信部３８ｂは通信制御部３７の制御にしたがい、無線によるデータの送受信を実行する無線通信手段である。スピーカ３９は、音声を出力する音声出力手段であり、マイク４０はユーザの会話内容等の音声を入力し、電気信号に変換する。

(特許要件適否予測システムの動作内容）
次に、図４とともに図１２から図２２までを参照して、特許要件適否予測サーバ１０による特許要件適否予測処理の動作内容について説明する。

ここで、図４は、特許要件適否予測処理を実現する特許要件適否予測サーバ１０の主要な構成を示す機能ブロック図である。特許要件適否予測サーバ１０では、ＣＰＵ１１が特許要件適否予測プログラムにしたがい、公開公報ＤＢ１５０、要旨データ記憶部１５３等に記憶されている各種ファイルやＤＢにアクセスしながら、公報データ抽出部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、予測結果編集処理部１０５としての動作を行う。これにより、特許要件適否予測処理が実行される。なお、特許要件適否予測プログラムは、特許要件適否予測サーバ１０を公報データ抽出部１０１、要旨データ抽出部１０２、特許要件適否予測処理部１０３、予測結果編集処理部１０５等として機能させるためのプログラムである。

そして、特許要件適否予測サーバ１０が特許要件適否予測処理を行うときは、ＣＰＵ１１が特許要件適否予測プログラムにしたがい図１２に示すフローチャートに沿った動作を行う。図１２は、特許要件適否予測プログラムにしたがったＣＰＵ１１の特許要件適否予測処理の動作手順の一例を示すフローチャートである。なお、図１２、図１３等において"Ｓ"とはステップを略記したものである。

ＣＰＵ１１は、特許要件適否予測プログラムにしたがい動作を開始すると、ステップ１に進み、ユーザ認証処理を行う。ここでは、ユーザがユーザ端末装置３０を用いて入力したユーザＩＤおよびパスワードを確認する等してユーザ認証処理を行う。次に、ＣＰＵ１１は、ステップ２に進み、ポイント残高確認処理を行う。ここでは、ユーザのポイント残高が一定値以上あるかどうかをＣＰＵ１１が確認し、ポイント残高不足であれば、特許要件適否予測処理を終了するか、ポイント残高不足を知らせるメッセージの送信などを行う。

続いて、ＣＰＵ１１は、ステップ３に進み、指定番号の入力画面データをユーザ端末３０に送信して、ユーザの指定番号の入力があるまで待機する。ここで、指定番号の入力があると、その指定番号を指定ナンバＴＲ記憶部１５１に記憶させ、入力のあった指定番号の件数（例えば３件）を公報カウンタＭＡＸにセットし、公報カウンタに"０"をセットする。

次に、ＣＰＵ１１は、処理をステップ４に進めて予測終了条件が成立しているか否かを判定する。ここで、ＣＰＵ１１は予測終了条件が成立しているときはステップ６に進むが、そうでないときはステップ５に進む。ＣＰＵ１１はステップ５に進むと、後述する特許要件適否予測ルーチンを実行するが、ステップ６に進むと、終了処理を実行し、そのユーザに対する特許要件適否予測処理を終了する。このようにすることで、予測終了条件が成立している限り、特許要件適否予測処理が自動的かつ継続的に実行される。

そして、ＣＰＵ１１はステップ５に進むときは、図１３に示すフローチャートに沿って特許要件適否予測ルーチンを実行する。

ＣＰＵ１１は特許要件適否予測ルーチンを開始すると、ステップ１１に進み、公報カウンタに"１"を加算する。続くステップ１２では、公報カウンタが公報カウンタＭＡＸよりも大きいか否かを判定し、大きくなければ処理をステップ１３に進めるが、そうでなければ（公報カウンタが公報カウンタＭＡＸより大きいとき）はステップ１６に処理を進める。

ＣＰＵ１１は、ステップ１３に処理を進めると、公報データ抽出部１０１としての動作を行って指定番号に応じたデータ抽出を行うとともに、対象公報抽出部１０４としての動作を行って公開公報データの抽出を行い、抽出したデータをそれぞれ予測対象ＴＲ記憶部１５２、対象公報記憶部１５５に記憶させる。また、ＣＰＵ１１は、要旨データ抽出部１０２としての動作を行って前述した要旨データおよびＣＴデータを生成し、それぞれ要旨データ記憶部１５３、ＣＴデータ記憶部１５４に記憶させる。対象公報抽出部１０４は、出願日が予測対象出願の出願日よりも前の公開公報データを抽出する。

続いてＣＰＵ１１は、ステップ１４に処理を進めて後述する新規性・拡大先願予測ルーチンを実行してからステップ１５に進み、進歩性予測ルーチンを実行する。その後、ＣＰＵ１１は、ステップ１１に戻って上記同様の処理を繰り返す。ステップ１６では、ＣＰＵ１１が予測結果編集処理部１０５としての動作を行い、後述する予測結果リストＬ１を編集出力する。その後、ステップ１７のポイント消費処理を実行して、特許要件適否予測を行った公開済出願の件数に応じて、ポイント残高を減らす。その後、特許要件適否予測ルーチンが終了する。

そして、ＣＰＵ１１は、ステップ１４に処理を進めると、前述した新規性・拡大先願予測処理部１２５としての動作を行い、図１４、図１５に示すフローチャートに沿って、新規性・拡大先願予測ルーチンを実行する。

この場合、ＣＰＵ１１は、新規性・拡大先願予測ルーチンをスタートするとステップ２１に処理を進め、文献カウンタ（文献ｃｔ）および文献ＭＡＸに"０"をセットし、項番カウンタ（項番ｃｔ）に"１"をセットする。続いてステップ２２に処理が進み、要旨データ記憶部１５３に記憶されている要旨データの項番ｃｔに応じたデータを検索タームに用いて、対象公報記憶部１５５の検索対象公報データについて全文検索が行われ、ヒットした文献の件数が文献ＭＡＸにセットされる。この場合、ステップ２１で項番カウンタに"１"がセットされているので、項番エリア１５３ｂが"１"のデータ、すなわち請求項１の要旨データを用いて検索タームが設定される。

続いて処理がステップ２３に進み、ステップ２２でヒットした文献があったか否か（文献ＭＡＸが１以上か否か）が判定され、ヒットした文献があればステップ２４に処理が進み、そうでなければ新規性・拡大先願予測ルーチンが終了する。

ステップ２４では、文献カウンタに"１"が加算され、続くステップ２５では、文献カウンタが文献ＭＡＸ以下であるか否かが判定され、これが成立しているときはステップ２６に処理が進み、そうでなければステップ２９に処理が進む。ステップ２６では、ヒットした文献の出願公開日（ヒット文献公開日）が予測対象出願の出願日（対象出願日）よりも小さいか否か（ヒット文献公開日＜対象出願日が成立するか否か）が判定され、これが成立しているときはステップ２７に処理が進み、そうでなければステップ２８に処理が進む。ステップ２７では、新規性無しを示す新規性フラグ"Ｎ１"を含むように新規性・拡大先願予測データＮｄが生成される。その後、ステップ２４に戻り、上記同様の処理が繰り返えされる。

そして、ステップ２８では、後述する拡大先願予測ルーチンが実行される。ステップ２９では、ＣＴデータ記憶部１５４を参照して、他の独立項が有るか否かが判定され、ほかの独立項があるときはステップ３０に処理が進み、そうでなければステップ３１で新規性・拡大先願予測データＮｄが出力された後、新規性・拡大先願予測ルーチンが終了する。ステップ３０では、ＣＰＵ１１が文献カウンタおよび文献ＭＡＸに"０"をセットし、項番カウンタに"１"よりも大きい請求項ナンバがセットされる。その後、処理がステップ２２に戻り、上記同様の処理が繰り返される。

一方、ＣＰＵ１１は、図１５に示すフローチャートに沿って拡大先願予測ルーチンを実行する。拡大先願予測ルーチンがスタートすると、ステップ４１に処理が進み、ヒットした文献の出願日（文献出願日）が対象出願日よりも前であるか否か（文献出願日＜対象出願日が成立するか否か）が判定され、これが成立しているときはステップ４２に処理が進むが、そうでなければ拡大先願予測ルーチンを終了する。ステップ４２では、予測対象出願とヒットした文献とで発明者が同一であるか否かが判定され、これが成立していないときはステップ４３に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。ステップ４３では、予測対象出願とヒットした文献とで出願人が同一であるか否かが判定され、これが成立していないときはステップ４４に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。そして、ＣＰＵ１１は、ステップ４４に処理を進めると、拡大先願の要件（特許法第２９条の２に規定される要件）を満たしていないことを示す拡大先願フラグ"Ｆ１"を含むように新規性・拡大先願予測データＮｄを生成する。その後、拡大先願予測ルーチンが終了する。

以上で新規性・拡大先願予測ルーチンが終了すると、図１３において処理がステップ１４からステップ１５に進み、ＣＰＵ１１が進歩性予測処理部１２６としての動作を行い、進歩性予測ルーチンを実行する。ＣＰＵ１１は、図１６〜図２２に示すフローチャートに沿って進歩性予測ルーチンを実行する。

ＣＰＵ１１は、進歩性予測ルーチンをスタートするとステップ５１に処理を進め、ＣＴデータ記憶部１５４から、独立区分エリア１５４ａの独立区分がスペースのレコードにつき、そのナンバエリア１５４ｂの請求項ナンバを取得して、後述する独立項テーブル１６５のナンバエリア（Ｎｏエリア）１６５ｂにセットする。続くステップ５２では、ＣＴデータ記憶部１５４から、サーチフラグエリア１５４ｅのサーチフラグがスペースで、ＭＡＸ区分エリア１５４ｃのＭＡＸ区分が"Ｍ"のレコードからそのナンバエリア１５４ｂの請求項ナンバを取得したうえで、取得した請求項ナンバの最小値（ＭＩＮ）を求め、それをＭＡＸカウンタにセットする。図９（Ｂ）のように、ＭＡＸ区分が"Ｍ"のレコードが複数あるときはそのうちの最も小さい請求項ナンバがＭＡＸカウンタにセットされる。

そして、ＣＰＵ１１は、ステップ５３に処理を進めて独立項テーブル１６５のＮｏエリア１６５ｂをサーチし、続くステップ５４で、"１"よりも大きい請求項ナンバがあるか否かを判定し、"１"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"１"よりも大きい請求項ナンバがなければ処理がステップ５５に進み、あれば処理がステップ５６に進む。ステップ５５は予測対象出願に含まれる請求項の中で独立項が１つだけの場合の処理（単一独立項ルーチン）、ステップ５６は独立項が複数の場合の処理（複数独立項ルーチン）に相当している。前者は例えば予測対象出願が特開２００８−６２２８２号公報に開示されている出願の場合、後者は例えば予測対象出願が特開２０１１−１８６７３５号公報に開示されている出願の場合に相当している。

独立項テーブル１６５は、図２４に示すように、カウンタエリア１６５ａ，Ｎｏエリア１６５ｂおよびサーチフラグエリア１６５ｃを有している。カウンタエリア１６５ａには、記憶されるデータの件数に応じた数値が記憶されている。Ｎｏエリア１６５ｂには、独立項の番号が記憶される。サーチフラグエリア１６５ｃにはサーチフラグが記憶されている。図２４には、一例として、予測対象出願が特開２０１１−１８６７３５号公報に開示されている出願の場合が示されている。

そして、ＣＰＵ１１は、ステップ５５に処理を進めると、図１７に示すフローチャートに沿って単一独立項ルーチンを実行する。ＣＰＵ１１は、単一独立項ルーチンを開始すると、ステップ６１に処理を進め、ＣＴデータ記憶部１５４から、サーチフラグエリア１５４ｅのサーチフラグがスペースのレコードについて、そのナンバエリア１５４ｂから請求項ナンバを取得して、そのうちの最小値（ＭＩＮ）を項番カウンタにセットする。続くステップ６２では、後述する独立項検索処理が行われる。続くステップ６３で検索フラグ（検索ｆｌａｇ）が"ＶＸ"または"ＶＹ"であるか否かが判定され、検索フラグが"ＶＸ"または"ＶＹ"であれば処理がステップ６４に進み、そうでなければ単一独立項ルーチンを終了する。

ＣＰＵ１１は、ステップ６４に処理を進めると項番カウンタに"１"を加算する。続くステップ６５では、項番カウンタが、ステップ５２でセットしたＭＡＸカウンタ以下であるか否かが判定され、項番カウンタがＭＡＸカウンタ以下ならステップ６６に処理を進めて後述する従属項検索処理が実行されるが、そうでなければ独立項検索処理が終了する。

そして、ＣＰＵ１１は図１８に示すフローチャートに沿って、複数独立項ルーチンを実行する。ＣＰＵ１１は処理をスタートすると、ステップ５２に処理を進め、前述同様の処理を実行し、その後、ステップ５５に進んで、上記同様にして単一独立項ルーチンを実行する。その後、ＣＰＵ１１は処理をステップ６７に進め、ＣＴデータ記憶部１５４に、サーチフラグエリア１５４ｅのサーチフラグがスペースのレコードがあるか否か（すなわち、検索処理が行われていないレコードがあるか否か）が判定され、あればステップ５２に戻って上記同様の処理が実行されるが、そうでなければ複数独立項ルーチンが終了する。

また、ＣＰＵ１１は図１９に示すフローチャートに沿って、独立項検索処理を実行する。独立項検索処理では、ＣＰＵ１１が引用発明検索部１３１としての動作を行い、独立項について主引用発明検索および副引用発明検索を行う。

ＣＰＵ１１は、独立項検索処理を開始すると、ステップ７１に処理を進めて後述する主引用発明検索処理を実行する。続くステップ７２では、主引用発明検索処理で主引用発明があったか否か（後述する主引用文献がセットされているか否か）が判定され、主引用発明があればステップ７３に処理が進むが、主引用発明がなければステップ７６に処理が進む。続くステップ７３では、後述する副用発明検索処理が実行され、そのあとのステップ７４で、副引用発明検索処理で副引用発明があったか否か（後述する副引用文献がセットされているか否か）が判定される。副引用発明があればステップ７５に処理が進み、副引用発明がなければステップ７７に処理が進む。

ＣＰＵ１１はステップ７５に処理を進めると、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＸ"をセットし、ステップ７７では、検索フラグ（検索ｆｌａｇ）に"ＶＹ"をセットする。また、ＣＰＵ１１はステップ７６に処理を進めると、ＣＴデータ記憶部１５４に記憶されているレコードのうち、ナンバエリア１５４ｂの請求項ナンバが項番カウンタに一致しているレコードについて、サーチフラグエリア１５４ｅのサーチフラグＥｆにサーチ済み（検索済み）を示す"９"をセットする。また、ＣＰＵ１１はセットされた検索フラグを含むように進歩性予測データＶｄ１を生成して、それを予測結果ファイル生成部１２７に出力する。また、ＣＰＵ１１は検索結果に応じた請求項要旨データｉｅｄと概念検索データＶｄ２を入力ベクトル生成部１３２に出力する。この場合、請求項要旨データｉｅｄは、検索の対象となった請求項の要旨データとすることができるが、予測対象ＴＲ記憶部１５２に記憶されている予測対象出願の検索の対象となった請求項のデータでもよい。検索フラグは、主引用発明が見つかった場合に"ＶＸ"または"ＶＹ"がセットされるが、主引用発明が見つかると、それによって、進歩性の要件を満たさないと判断される可能性が高いため、進歩性違反の拒絶理由が見つかるか否かは主引用発明が見つかるか否かに大きく左右される。進歩性予測データＶｄ１は、このような検索フラグを含むことによって、進歩性の要件適否を示すものとなる。

そして、ＣＰＵ１１は図２０に示すフローチャートに沿って、主引用発明検索処理を実行する。主引用発明検索処理は、予測対象発明に最も近い主引用発明を検索する処理である。

ＣＰＵ１１は、主引用発明検索処理を開始すると、ステップ８１に処理を進めて、展開度カウンタｔｃに"０"をセットする。続いてＣＰＵ１１は、ステップ８２に処理を進め、要旨データ記憶部１５３から、次のデータを読みだして主検索文書データ（主引用発明を概念検索で検索するときの文書データ）を設定する。１つは、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコード（項番カウンタには、ステップ６１で独立項の最小値がセットされている）から必須フラグＥｆが"Ｘ"で、展開度Ｅｄが展開度の最大値（展開度ＭＡＸ）−展開度カウンタｔｃの用語（例えば、展開度ＭＡＸが"５"なら、展開度Ｅｄが"５"−ｔｃの用語）であり、もう１つは、課題データ、すなわち、データ種別が"Ｐ"のレコードのデータである。

続くステップ８３では、ＣＰＵ１１が主引用発明の検索処理、すなわち、主検索文書データを入力文書に用いて、対象公報記憶部１５５に記憶されている検索対象公報データについて概念検索を行う。この概念検索では、主検索文書データと、検索される文書それぞれを特徴語の抽出、重み付けを行う等してそれぞれの文書に応じたベクトル（文書ベクトル）が生成され、各ベクトルの内積が求められて類似度が算出される。次にステップ８４では、ステップ８３の概念検索の結果から、最も大きい類似度が一定値以上になっているか否かが判定され、一定値以上の場合はステップ８５に処理が進むが、そうでなければステップ８７に処理が進む。ステップ８５では、類似度が一定値以上の文献が複数あったか否かが判定され、なければステップ８６に処理が進み、あれば処理がステップ８９に進む。主引用発明検索処理では、類似度が一定値以上の文献があったときだけ主引用文献がセットされる。

ステップ８６では、ヒットした文献が主引用文献（主引用発明が開示されている先行技術文献）にセットされて主引用発明検索処理が終了する。ステップ８７では、展開度カウンタｔｃに"１"が加算され、その後のステップ８８では、展開度ＭＡＸ−展開度カウンタｔｃが"０"以下であるか否かが判定され、"０"以下なら主引用発明検索処理を終了するが、そうでなければステップ８２に戻って上記の処理を繰り返す。

こうすることで、はじめに展開度Ｅｄが展開度ＭＡＸのより重要な用語で概念検索が行される。概念検索では、文献の類似度に応じて、複数の文献が抽出され得るが、最も高い類似度が一定値に達していないときは、その文献が主引用文献に該当しないおそれが高い。そのため、類似度が一定値以上の文献が見つからなかった場合に展開度Ｅｄが展開度ＭＡＸよりも小さい用語を含めて再び概念検索が実行される。

ステップ８９では、類似度の最も大きい文献（最類似文献ともいう）を主引用文献にセットし、その後、主引用発明検索処理が終了する。

そして、ＣＰＵ１１は図２１に示すフローチャートに沿って、副引用発明検索処理を実行する。副引用発明検索処理は、予測対象発明と主引用発明との相違点を含む副引用発明を検索する処理であり、主引用発明検索処理で主引用発明が見つかったときだけ実行される。

ＣＰＵ１１は、副引用発明検索処理を開始すると、ステップ９１に処理を進めて、要旨データ記憶部１５３から、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない用語（検索未使用データ）と、データ種別が"Ｐ"のレコードのデータとを読み出し、それらを副検索ターム（副引用発明を全文検索で検索するときのキーワード）に設定する。

続くステップ９２では、ＣＰＵ１１が副引用発明の検索処理、すなわち、副検索タームを検索キーワードに用いて、対象公報記憶部１５５に記憶されている検索対象公報データについて全文検索を行う。続くステップ９３では、ステップ９２でヒットした文献があったか否かが判定され、ヒットした文献があればステップ９４に処理が進み、そうでなければ処理がステップ９６に進む。ステップ９４では、ヒットした文献が複数あったか否かが判定され、ヒットした文献が複数なければステップ９５に処理が進み、ヒットした文献が複数あれば処理がステップ９８に進む。

ステップ９５では、ヒットした文献が副引用文献（副引用発明が開示されている先行技術文献）にセットされて副引用発明検索処理が終了する。ステップ９６では、副検索タームが変更されて再び全文検索が行われる。ここでは、副検索タームが、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない検索未使用データと、データ種別が"Ｔ"のレコードのデータに変更される。次のステップ９７でヒットした文献があったか否かが判定され、ヒットした文献があればステップ９４に処理が進み、なければ副引用発明検索処理が終了する。さらに、ステップ９８では、ヒットした文献のそれぞれについて、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコードの必須フラグＥｆが"Ｘ"の用語との一致数がカウントされ、その一致数が副引用ファイルにセットされる。次のステップ９９で副引用ファイルが一致数の降順にソートされ、続くステップ１００で副引用ファイルの先頭から３件が副引用文献にセットされ、その後、副引用発明検索処理が終了する。副引用発明検索で複数の文献がヒットしたときは、そのそれぞれについて、予測対象発明の特徴部分がどの程度開示されているのかが、必須フラグＥｆが"Ｘ"の用語との一致数で調べられ、その一致数の多い文献が副引用文献にセットされる。

そして、ＣＰＵ１１は図２２に示すフローチャートに沿って、従属項検索処理を実行する。従属項検索処理は、検索フラグ（検索ｆｌａｇ）が"ＶＸ"または"ＶＹ"であったとき（主引用発明がみつかったとき）だけ実行される。ＣＰＵ１１が従属項検索処理を開始すると、ステップ１１１に処理が進み、要旨データ記憶部１５３から、データ種別が"Ｃ"で、項番エリア１５３ｂの番号が項番カウンタに相当するレコード（項番カウンタには、ステップ６４で独立項の最小値に順次"１"が加算される）から必須フラグＥｆが"Ｘ"の用語が読み出され、それが従属検索ターム（従属項に記載されている発明を全文検索で検索するときのキーワード）に設定される。次のステップ１１２でＣＰＵ１１が従属検索タームを検索キーワードに用いて、主引用文献について全文検索を行い、従属項に記載されている発明が主引用文献に開示されているか否かを調べる。

次のステップ１１３で、ヒットした文献があったか否かが判定され、ヒットした文献があればステップ１１４に処理が進み、そうでなければ処理がステップ１１６に処理が進む。ステップ１１４では、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＸ"がセットされ、ヒットした文献が該当する請求項ナンバの主引用文献にセットされる。その後、処理がステップ１１５に進み、ＣＴデータ記憶部１５４に記憶されているレコードのうち、ナンバエリア１５４ｂの請求項ナンバが項番カウンタに一致するレコードについて、サーチフラグエリア１５４ｅのサーチフラグＥｆに"９"がセットされ、その後、従属項検索処理が終了する。また、ステップ１１６では、従属検索タームで副引用文献について全文検索が行われ、次のステップ１１７で、ヒットした文献があったか否かが判定される。ヒットした文献があればステップ１１８を実行したあとステップ１１５に進み、なければ従属項検索処理が終了する。ステップ１１８では、該当する請求項ナンバの検索フラグ（検索ｆｌａｇ）に"ＶＹ"がセットされ、ヒットした文献が該当する請求項ナンバの副引用文献にセットされる。

以上のようにして、新規性・拡大先願予測ルーチンと、進歩性予測ルーチンとが実行されると、それぞれの結果に応じて、新規性・拡大先願予測データＮｄと、進歩性予測データＶｄ１とが予測結果ファイル生成部１２７に出力される。また、機械学習部１３３から要件適否文書ベクトルＶ４が出力されるので、これらを用いて予測結果ファイル生成部１２７が図１０に示した予測結果ファイルを生成し、予測結果記憶部１５６に記憶させる。

予測結果ファイルは、図１０に示すように、公開番号、請求項、主検索文書データ、副検索ターム、検索フラグ、ヒット文献、マシン予測の各項目のデータが予測対象出願ごとに記憶されている。マシン予測とは、機械学習記憶部１３３からの要件適否文書ベクトルＶ４に応じたデータであって、進歩性予測ルーチンで見つかった主引用文献および副引用文献を引用した進歩性違反の拒絶理由が見つかる可能性が高いか低いか（高い場合は"Ｈ"、低い場合は"Ｌ"）を示している。

また、予測結果編集部１０５が予測結果ファイルを読み込み、図２５に示すような特許要件適否予測リストＬ１を編集および出力して、ユーザ端末装置３０に送信する。特許要件適否予測リストＬ１には、予測対象出願の出願公開番号、請求項の番号とともに、新規性（拡大先願）、進歩性の要件適否がその根拠となる文献（主引用文献、副引用文献）とともに示されている。新規性（拡大先願）、進歩性の要件に適合しない（満たさない）と予測される場合は、"Ｘ"、適合する（満たす）と予測される場合は"Ａ"が記載される。これらは、予測結果ファイルの検索フラグで判断される。

進歩性の要件に適合しないと予測される場合の"Ｘ"（主引用文献、副引用文献有り）、"Ｙ"（主引用文献のみ有り）、には、"Ｈ"、"Ｌ"が併記される（図２５では、"Ｈ"が併記されるばあいのみ例示）これは、機械学習部１３３の要件適否文書ベクトルＶ４にしたがったもので、"Ｈ"は主引用文献で進歩性違反の拒絶理由が発行される可能性が高い場合、"Ｌ"は低い場合を示している。

以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ１０では、予測対象出願の記載事項から要旨データを生成し、これを用いて主引用発明検索、副引用発明検索を行っている。主引用発明検索は、予測対象出願とその骨格において共通する、すなわち、先行技術発明のうち、予測対象発明に最も近い主引用発明を要旨データで探し出す処理であり、特許法や特許・実用新案審査基準に沿って行われる。副引用発明検索は、主引用発明検索で主引用発明が見つかった場合に、発明が解決しようとする課題や、技術分野を特定する用語を用いた全文検索で行われており、これも特許法や特許・実用新案審査基準に沿って行われる。したがって、本発明の実施の形態にかかる特許要件適否予測サーバ１０では、特許要件の適否に関する予測が審査実務に適合した内容で行われるので、特許出願の監視負担を有効に軽減することができる。

一方、前述したように、特許要件適否予測処理部１０３が機械学習部１３３を有しているが、その機械学習部１３３は過去の審査実績に基づく学習データで訓練された人工知能プログラムで構築されている。

ところで、平成２６年の実績ベースで年間３２万数千件程度の特許出願が出されており、その一部またはそれ以前の多数の特許出願について１ｓｔアクションがすでに発行されている。その中には、拒絶理由通知で進歩性違反の拒絶理由が指摘されている出願（進歩性拒絶出願）が多数存在している。

進歩性拒絶出願では、審査結果が、審査時点の請求項に記載された発明と主引用発明とに相違点があったものの、その相違点だけでは、進歩性があるとは審査官によって判断されなかったということを意味している。これに対し、特許出願の中には、１ｓｔアクションが発行されることなく特許査定が発行された出願や、拒絶理由通知が発行されたものの、その理由に進歩性違反の拒絶理由が指摘されていなかった出願（進歩性拒絶無し出願）も存在している。

そして、例えば図２３に示すように、審査対象となる特許出願Ｐｄがあり、その出願日がｔ_０であったとすると、特許出願Ｐｄに対する主引用発明または副引用発明となりえるのは、公知、公用、文献公知およびインターネット公知の発明であり、主に出願日ｔ_０より前にすでに公開されている出願の特許公開公報（図２３では、ｒｆ１〜ｒｆ６）に開示されている発明である。

ここで、仮に、審査の結果、公報ｒｆ６に開示されている発明が主引用発明に該当すると判断されたとする。すると、その場合、特許出願Ｐｄに係る発明と、その公報ｒｆ６に開示されている発明とに相違点があったものの、その相違点に応じた距離ｄｐが、特許出願Ｐｄに係る発明の進歩性を肯定するに足りる大きさではなかったと考えられる。逆に、公報ｒｆ６に開示されている発明が主引用発明には該当しないと判断されていたとすれば、距離ｄｐが、出願Ｐｄに係る発明の進歩性を肯定するに足りる大きさであったと考えられる。

もし、発明の進歩性が肯定されるときの相違がどの程度で、否定されるときの相違がどの程度なのかが割り出せれば、それが特許要件適否の客観的な判断材料になると考えられるが、以上を考慮すると、そのためには、２つの発明の相違に応じた距離ｄｐがどの程度なのかを割り出すのが有効であると考えられる。これを過去の審査実績に基づく訓練データの学習によって割り出し、進歩性が否定されるおそれが高いのか、それとも低いのかの目安を付けるのが機械学習部１３３である。

機械学習部１３３の学習において、本件出願にかかる発明（本願発明）では、距離ｄｐを２つの文書ベクトルの差分と捉え、進歩性の拒絶理由有りの場合、無しの場合それぞれの距離ｄｐを学習するため、前述のＨＬパターンによる訓練データで学習が行われている。

そして、特許要件の適否を予測する場合は、予測対象出願について、その要旨データを求め、それを用いて概念検索で最類似文献を探し出す。最類似文献は、予測対象出願の文書ベクトル（正確には、独立項の記載事項などから求めた文書ベクトル）に最も類似度が高い文書ベクトルを有しているので、公開済出願の中で主引用文献になる可能性が最も高いと認められる。

その最類似文献から求めた引用候補ベクトルＲｆＶと、予測対象出願の要旨データから求めた要旨ベクトルＥＶとの差分を求めて要旨移動ベクトルＶ３を生成し、これを機械学習部１３３に入力して、主引用発明検索で見つかった主引用文献を引用する進歩性違反の拒絶理由が有るのか、無いのかが出力されるようにしている。これにより、進歩性違反の拒絶理由が見つかる可能性が高いのか、低いのかの目安を付けることが可能になる。

以上のように、特許要件適否予測サーバ１０では、機械学習部１３３を備えていることによって、特許庁の審査実績を反映させる形で特許要件適否の予測が行われることになる。従前のような審査官や弁理士などの専門家の経験や勘だけに頼らざるを得ない判断結果に人工知能の判断結果を生かせるようになるため、予測結果に客観性を持たせることが可能になり、他社出願の監視負担の軽減や、自社出願の審査請求有無の判断効率化などとも相まって業務効率の向上が期待できる。

また、進歩性予測処理部１２６が主引用発明検索では概念検索を行い、副引用発明検索で全文検索を行っている。進歩性違反の拒絶理由が有るのかどうかは主引用発明が見つかるか否かが大きく左右するが、その主引用発明を探す主引用発明検索で全文検索を行うと、複数の文献がヒットする可能性があり、主引用発明（主引用文献）を特定できない場合がある。この点、概念検索では、文書ベクトルの内積から求めた類似度にしたがい類似している文献が順番付けされるので、最も類似度の高い文献を選ぶことで主引用文献を特定できる。こうして見つけた主引用文献に機械学習部１３３による予測を併用することで、その主引用文献を引用した進歩性違反の拒絶理由が出るおそれが高いのか、低いのかを予測することができる。また、副引用発明検索で全文検索を行うことで、副引用文献があるのかどうかを明確にすることができる。

（変形例）
以上述べた実施の形態では、特許要件適否予測サーバ１０に特許要件適否予測プログラムがインストールされることによって、特許要件適否予測サーバ１０が特許要件適否予測装置として機能する場合を例にとって説明している。その他、本発明は、ユーザ端末装置３０が特許要件適否予測装置として機能する場合についても適用がある。この場合、前述した特許要件適否予測プログラムについて少なくとも以下の変更点１）、２）にしたがった変更を行い、その変更後の特許要件適否予測プログラムを特許要件適否予測サーバ１０からユーザ端末装置３０にダウンロードし、ユーザ端末装置３０にインストールすればよい。

変更点１）指定ナンバなどの入力操作を行うための画像データを特許要件適否予測サーバ１０からユーザ端末装置３０に送信することなくユーザ端末装置３０に表示させる。
変更点２）特許要件適否予測リストをユーザ端末装置３０が出力する。

以上の説明は、本発明の実施の形態についての説明であって、この発明の装置及び方法を限定するものではなく、様々な変形例を容易に実施することができる。また、各実施形態における構成要素、機能、特徴あるいは方法ステップを適宜組合わせて構成される装置又は方法も本発明に含まれるものである。

例えば、ユーザ端末装置は高機能携帯電話機や、タブレット型の端末装置ではなく、ノートパソコンや、ＰＤＡでもよい。なお、ＣＰＵ１１が実行する特許要件適否予測プログラムは、磁気記録媒体、ＣＤ−ＲＯＭ，ＤＶＤ等の各種記録媒体に記録することができるし、ネットワークを介して図示しないサーバからダウンロードすることもできる。

本発明を適用することにより、特許要件の適否に関する予測が審査実務に適合した内容で行われ、監視負担を有効に軽減することができる。本発明は、特許要件適否予測装置および特許要件適否予測プログラムの分野で利用することができる。

１…特許要件適否予測システム、１０…特許要件適否予測サーバ、１１，３１…ＣＰＵ、３０…ユーザ端末装置、１０１…抽出部、１０２…要旨データ抽出部、１０３…特許要件適否予測処理部、１０５…予測結果編集処理部、１２５…新規性・拡大先願予測処理部、１２６…進歩性予測処理部、１３２…入力ベクトル生成部、１３２ａ…要旨ベクトル生成部、１３２ｂ…引用候補ベクトル生成部、１３２ｃ…移動ベクトル生成部、１５３…要旨データ記憶部、１５４…ＣＴデータ記憶部、１５６…予測結果記憶部、Ｌ１…予測結果リスト。

Claims

公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
該要旨データ抽出手段によって抽出された前記要旨データを記憶する要旨データ記憶手段と、
前記要旨データ記憶手段に記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、
前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
前記副引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行う特許要件適否予測装置。
公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
該要旨データ抽出手段によって抽出された前記要旨データを記憶する要旨データ記憶手段と、
前記要旨データ記憶手段に記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
前記副引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行い、
前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、前記予測対象出願の各請求項に応じた要旨ベクトルと、前記主引用発明検索部による前記概念検索の結果、最も類似度が高いとされた最類似文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置。
前記文書分類部は、前記訓練データとして、前記学習文書ベクトルが第１の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由有りを示すベクトルとの組み合わせと、前記学習文書ベクトルが第２の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、
前記第１の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、該拒絶理由通知で進歩性の拒絶理由が指摘されていた進歩性拒絶出願の該拒絶理由が指摘されていた請求項に応じた文書ベクトルと、該拒絶理由で主たる刊行物として引用されていた主引用文献に応じた引用文書ベクトルとの差分に応じた第１の移動文書ベクトルであり、
前記第２の学習文書ベクトルは、前記公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、該拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項１に応じた文書ベクトルと、前記拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第２の移動文書ベクトルである請求項２記載の特許要件適否予測装置。
コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、該コンピュータを
公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
該要旨データ抽出手段によって抽出された前記要旨データを記憶させる要旨データ記憶制御手段と、
前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、
前記進歩性予測処理部が前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、
前記主引用発明検索部が前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
前記副引用発明検索部が前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行うように、前記コンピュータを前記特許要件適否予測処理手段として機能させる特許要件適否予測プログラム。