JP6123143B1 - 特許要件適否予測装置および特許要件適否予測プログラム - Google Patents

特許要件適否予測装置および特許要件適否予測プログラム Download PDF

Info

Publication number
JP6123143B1
JP6123143B1 JP2016027034A JP2016027034A JP6123143B1 JP 6123143 B1 JP6123143 B1 JP 6123143B1 JP 2016027034 A JP2016027034 A JP 2016027034A JP 2016027034 A JP2016027034 A JP 2016027034A JP 6123143 B1 JP6123143 B1 JP 6123143B1
Authority
JP
Japan
Prior art keywords
data
prediction
search
document
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016027034A
Other languages
English (en)
Other versions
JP2017146720A (ja
Inventor
和之 白井
和之 白井
Original Assignee
和之 白井
和之 白井
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 和之 白井, 和之 白井 filed Critical 和之 白井
Priority to JP2016027034A priority Critical patent/JP6123143B1/ja
Application granted granted Critical
Publication of JP6123143B1 publication Critical patent/JP6123143B1/ja
Publication of JP2017146720A publication Critical patent/JP2017146720A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】特許要件の適否に関する予測を審査実務に適合した内容で行い、特許出願の監視負担を有効に軽減する。【解決手段】特許要件適否予測サーバは、公報データ抽出手段と、予測対象データによって特定される予測対象出願について、予測対象発明の要旨を特定し得る要旨データを予測対象データから抽出する要旨データ抽出手段と、要旨データを記憶する要旨データ記憶手段と、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有する。【選択図】図4

Description

本発明は、出願公開された特許出願に係る発明について、新規性、進歩性といった特許要件に適合しているか否かの適否を予測する特許要件適否予測装置および特許要件適否予測プログラムに関する。
従来、電力需要や株価の予測、商品の購買予測、不動産の将来価格の予測といった様々な場面で予測が行われ、そのための装置や方法も数多く提案されている。発明を特許出願して権利化する権利化業務に関しても、出願された発明に関する特許可能性(特許性、パテンタビリティともいう)を予測する技術が提案されている(例えば、特許文献1参照)。特許文献1には、次のような特許性予測装置が記載されている。この装置は、審査結果通知済の特許出願(既通知出願)を特許データベースから取得して、既通知出願の請求項についての情報量と、類似する先行出願の数を検出し、既通知出願を対象とする回帰分析を実行して、これらから算出した登録予見式にしたがい、審査結果未通知出願の特許性の予測値を算出する。
また、従来、特許可能性の予測のほか、発明の特許性や発明の質、特許出願や特許権の価値を評価する装置や方法も提案されている(例えば、特許文献2,3,4,5,6参照)。
特開2009−238074号公報 特開2015−207194号公報 特開2000−181966号公報 特開2000−132606号公報 特開2015−187883号公報 特開2007−108803号公報
上記のとおり、従来技術によれば特許出願について特許可能性を予測することや特許権を評価することが可能である。
しかし、前述の従来技術、例えば、特許文献1記載の特許性予測装置では、特許性の予測が、既通知出願の請求項についての情報量や、類似する先行出願数といった情報に基づき算出された登録予見式にしたがって行われる。この予測は、請求項の広狭、技術分野の疎密および特許性との間の統計的な相関関係に基づいて行われ、特許法や特許・実用新案審査基準に基づくものではなかった。そのため、特許文献1記載の特許性予測装置では、特許実務に沿った予測結果が得られないおそれが高いという課題があった。
ところで、一般に、他社がどのような特許出願をし、どのような特許権を取得しようとしているのかは、自社にとって重大な関心事である。そのため、特許権に関する権利化業務の中には、自社のみならず、他社の特許出願を監視して、特許権の成否を予測する場面が少なからず存在している。その予測のためには、出願書類を読み込み、先行技術調査を行い、特許要件の適否を判断しなければならないから、とりわけ他社出願の監視負担は相当なものである。
この点、従来技術のような特許性予測装置を用いれば、審査結果未通知出願の特許性が予測されるため、権利化業務の中でその予測結果を活用する場面も考えられる。
しかし、特許要件の審査は、特許庁審査官が特許法や特許・実用新案審査基準に沿って行うものであるから(特許法47条)、これらが考慮されない特許性の予測は、審査実務に適合していないおそれがあり、したがって、特許出願の監視負担を軽減するのに有効であるとはいえない。
したがって、特許要件に適合しているか否かの予測が審査実務に適合した内容で行われることによって、特許出願の監視負担をできる限り有効に軽減することが望まれていた。
本発明は、上記課題を解決するためになされたもので、特許要件の適否に関する予測が審査実務に適合した内容で行われ、特許出願の監視負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムを提供することを目的とする。
上記課題を解決するため、本発明は、公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶する要旨データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行う特許要件適否予測装置を特徴とする。
また、本発明は、公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶する要旨データ記憶手段と、要旨データ記憶手段に記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、進歩性予測処理部は、公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、主引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部は、要旨データ記憶手段に記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行い、文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、その要旨移動ベクトルは、予測対象出願の各請求項に応じた要旨ベクトルと、主引用発明検索部による概念検索の結果、最も類似度が高いとされた最類似文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置を提供する。
上記特許要件適否予測装置の場合、文書分類部は、訓練データとして、学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトルとの組み合わせと、学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、第1の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていた進歩性拒絶出願のその拒絶理由が指摘されていた請求項に応じた文書ベクトルと、その拒絶理由で主たる刊行物として引用されていた主引用文献に応じた引用文書ベクトルとの差分に応じた第1の移動文書ベクトルであり、第2の学習文書ベクトルは、公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、その拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項1に応じた文書ベクトルと、拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第2の移動文書ベクトルであるようにすることができる。
さらに、本発明は、コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、そのコンピュータを公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、その公報データ抽出手段によって抽出された予測対象データによって特定される予測対象出願について、その予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして予測対象データから抽出する要旨データ抽出手段と、その要旨データ抽出手段によって抽出された要旨データを記憶させる要旨データ記憶制御手段と、要旨データ記憶制御手段の制御によって記憶されている要旨データを用いて公開公報データを検索し、その検索結果に応じて、予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、その新規性予測データおよび進歩性予測データを用いて予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、進歩性予測処理部が公開公報データによって特定される先行技術発明のうち、予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、予測対象発明と主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、主引用発明検索部が要旨データ記憶制御手段の制御によって記憶されている要旨データのうちの各請求項の特徴部分データおよび課題データを主検索文書データとして公開公報データを対象とする概念検索を行い、副引用発明検索部が要旨データ記憶制御手段の制御によって記憶されている要旨データのうちの主検索文書データに応じた請求項のデータであって、主検索文書データに含まれていない検索未使用データおよび課題データを副検索タームに用いて全文検索を行うように、コンピュータを特許要件適否予測処理手段として機能させる特許要件適否予測プログラムを提供する。
以上詳述したように、本発明によれば、特許要件の適否に関する予測が審査実務に適合した内容で行われ、特許出願の監視負担を有効に軽減し得る特許要件適否予測装置および特許要件適否予測プログラムが得られるる。
本発明の実施の形態に係る特許要件適否予測サーバを含む特許要件適否予測システムのシステム構成図である。 特許要件適否予測サーバの内部の構成を中心に示すブロック図である。 ユーザ端末装置の内部の構成を中心に示すブロック図である。 本発明の実施の形態に係る特許要件適否予測サーバの主要な構成を示す機能ブロック図である。 要旨データ抽出部の主要な構成を示す機能ブロック図である。 特許要件適否予測処理部の主要な構成を示す機能ブロック図である。 入力ベクトル生成部の主要な構成を示す機能ブロック図である。 要旨データ記憶部のレコードレイアウトの一例を示す図である。 CTデータ記憶部のレコードレイアウトの一例を示す図である。 予測結果記憶部のレコードレイアウトの一例を示す図である。 機械学習部のネットワーク構造の一例を示す図である。 特許要件適否予測処理の動作手順の一例を示すフローチャートである。 特許要件適否予測ルーチンの動作手順の一例を示すフローチャートである。 新規性・拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。 拡大先願予測ルーチンの動作手順の一例を示すフローチャートである。 進歩性予測ルーチンの動作手順の一例を示すフローチャートである。 単一独立項ルーチンの一例を示すフローチャートである。 複数独立項ルーチンの動作手順の一例を示すフローチャートである。 独立項検索処理の一例を示すフローチャートである。 主引用発明検索処理の一例を示すフローチャートである。 副引用発明検索処理の一例を示すフローチャートである。 従属項検索処理の一例を示すフローチャートである。 審査対象となる特許出願と、複数の特許公開公報との関係を模式的に示した図である。 独立項テーブルのレコードレイアウトの一例を示す図である。 特許要件適否予測リストの一例を示す図である。
以下、本発明の実施の形態について図面を参照しつつ説明する。なお、同一要素には同一符号を用い、重複する説明は省略する。
(特許要件適否予測システムの全体構成)
まず、本発明の実施の形態に係る特許要件適否予測サーバ10を含む特許要件適否予測システム1の構成について説明する。
図1は特許要件適否予測システム1のシステム構成図である。図1に示すように、特許要件適否予測システム1は、特許要件適否予測サーバ10と、ユーザが操作する複数のユーザ端末装置30(図1では、固定端末装置30A、30B、30C)とを有し、これらがインターネットN1を介して互いに接続される構成を有している。
特許要件適否予測サーバ10は、特許要件適否予測プログラムにしたがったデータ処理を行い、公開済の特許出願(以下「公開済出願」という)のうち、ユーザが指定した出願公開番号(または出願番号)に応じた特許出願(予測対象出願)について、特許要件(本実施形態では、新規性(特許法第29条第1項3号)、拡大先願(特許法第29条の2)および進歩性(特許法第29条第2項))に適合しているか否かを予測する。ユーザ端末装置30は、特許要件適否予測サーバ10との間でデータの受信または送信を行う。
特許要件適否予測システム1では、特許要件適否予測サーバ10が、予測対象出願について、後述する主引用発明検索および副引用発明検索を行うとともに、進歩性違反の拒絶理由が見つかる可能性が高いか低いかを審査実績に基づく複数の訓練データで機械学習を行った人工知能プログラムで予測して、特許要件の適否を予測する。特許要件適否予測サーバ10によって、特許要件の適否の予測が審査実務に適合した内容で行われるため、特許出願の監視負担を有効に軽減することができる。
(特許要件適否予測サーバ10の構成)
次に、図2を参照して特許要件適否予測サーバ10の構成について説明する。図2は、特許要件適否予測サーバ10の内部の構成を中心に示すブロック図である。特許要件適否予測サーバ10は、公開済出願の特許要件適否の予測に関するサービスを提供する専門事業者が運用するサーバである。
特許要件適否予測サーバ10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13とを有している。CPU11は、ROM12に記憶されているプログラムにしたがい作動して、KBC(Key board controller)17を介してキーボード19やマウス20の操作入力で得られる入力データをメインバス19Aを介して入力する一方、他の構成要素との信号の入出力を行い、特許要件適否予測サーバ10全体の動作制御を行う。CPU11は、後述する特許要件適否予測プログラムにしたがい、後述する公報データ抽出部101、要旨データ抽出部102、特許要件適否予測処理部103、対象公報抽出部104、予測結果編集処理部105としての動作を行う。ROM12には、特許要件適否予測プログラム等のCPU11が実行する制御プログラムと、恒久的なデータが記憶されている。RAM13にはCPU11が作動する際に用いるデータやプログラムが記憶されている。
そのほか特許要件適否予測サーバ10は、ハードディスク装置(Hard disk drive,HDD)14と、通信制御部15と、通信処理部16と、ビデオコントローラ18とを有している。
ハードディスク装置14には、特許要件適否予測プログラムの実行に必要な図4に示す各種記憶部またはDB(database)と、その他の記憶部またはDBが形成されている。ハードディスク装置14には、指定ナンバトランザクション記憶部(指定ナンバTR記憶部)151と、予測対象トランザクション記憶部(予測対象TR記憶部)152と、要旨データ記憶部153と、クレームツリーデータ記憶部154と、対象公報記憶部155と、予測結果ファイル記憶部156とが形成されている。各記憶部またはDBについては後述する。
通信制御部15は、CPU11の指示にしたがい作動して、ユーザ端末装置30や、図示しない特許庁サーバとの通信を行うための回線の接続および切断を制御する。通信処理部16は、通信制御部15の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。
ビデオコントローラ18は、図示しないディスプレイ装置における画像表示を制御して、各種の設定に用いられる画面等を表示させる。
そして、ハードディスク装置14の各種記憶部またはDBについて説明すると次のとおりである。指定ナンバTR記憶部151には、ユーザ端末装置30から送信されるユーザ特定に必要なデータ(例えば、会員ID)と、そのユーザが指定した出願公開番号または出願番号(これらを「指定番号」という)とが記憶されている。予測対象TR記憶部152には、公報データ抽出部101が公開公報DB150から指定番号に応じて抽出した予測対象出願の出願書類電子データ(予測対象データ)が記憶されている。公開公報DB150は、公開特許公報の電子データが公開公報データとして格納されている。公開公報DB150として、図4では、工業所有権情報・研修館により運営されている特許情報プラットフォーム(J−PlatPat)のデータベースまたはそこからダウンロードした電子データを記憶しているデータベースを想定している。後者のデータベースは、図示しないサーバに格納することができるし、HDD14に格納してもよい。
要旨データ記憶部153には、要旨データ抽出部102が抽出・生成した要旨データが記憶されている。要旨データは、予測対象出願に開示されている発明(予測対象発明)の要旨を特定し得る用語を示す用語データであって、少なくとも後述する特徴部分データと課題データとが含まれている。
要旨データ記憶部153には、例えば図8に示すように、データ種別エリア153a、項番エリア153b、用語記憶部153cを有するレコードが記憶されている。データ種別エリア153aは、各レコードに記憶されているデータが予測対象出願のどの部分のデータであるのかを示すデータ(「データ種別」という)が記憶されている。本実施の形態では、データ種別として、"C"、"P"、"T"、"D"の4種類が設定されている。"C"は特許請求の範囲のデータ、"P"は発明が解決しようとする課題の欄のデータ、"T"は技術分野の欄のデータ、"D"は発明の実施の形態の欄のデータをそれぞれ示している。項番エリア153bには、請求項の番号が記憶されている。用語記憶部153cは、用語エリア153c1、展開度エリア153c2および必須フラグエリア153c3を有している。図8では、これらの組み合わせが15通り用意されているが、この組み合わせは15通りより多くてもよいし、少なくてもよい。そして、用語エリア153c1,展開度エリア153c2,必須フラグエリア153c3には、それぞれ要旨の特定に用いられる用語、後述する展開度(Ed)、必須フラグ(Ef)が記憶されている。
図8では、一例として、特開2008−62282号公報から抽出した要旨データ(上半分のデータ)と、特開2011−186735号公報から抽出した要旨データ(下半分のデータ)とが記載されている。前者は、独立形式で記載されている請求項(独立項)が1つの場合、後者は独立項が複数の場合の例示である。
クレームツリーデータ記憶部(CTデータ記憶部)154には、後述するクレームツリーデータ(claim tree データ、CTデータともいう)が記憶されている。CTデータ記憶部154には、例えば図9(A)に示すように、独立区分エリア154aと、ナンバエリア154bと、MAX区分エリア154cと、従属項エリア154dと、サーチフラグエリア154eを含むレコードが記憶されている。
独立区分エリア154aには、予測対象出願の各請求項が独立項か、従属形式で記載されている請求項(従属項)のいずれであるかを示す独立区分(独立項がスペース、従属項が"D")が記憶されている。ナンバエリア154bには各請求項の番号(請求項ナンバ)が記憶されている。MAX区分エリア154cには、MAX区分が記憶されている。MAX区分には、同じ独立項を引用する従属項が複数あった場合の最も番号の大きい請求項(最大従属項)に"M"、それ以外にスペースがセットされている。
図9(A)は、特開2008−62282号公報のCTデータを示しているが、該公報では、従属項の中で請求項9が最大従属項なので、請求項ナンバが"9"のレコードのMAX区分に"M"、それ以外の請求項ナンバのMAX区分にスペースがセットされている。また、図9(B)は、特開2011−186735号公報のCTデータを示しているが、該公報では、請求項1、請求項6が独立項であり、請求項5、請求項7が最大従属項なので、請求項ナンバが"5"のレコードと、"7"のレコードのMAX区分に"M"、これら以外のMAX区分にスペースがセットされている。
従属項エリア154dには、従属項が引用している請求項の番号が記憶されている。サーチフラグエリア154eには、サーチフラグ、すなわち、後述する主引用発明検索が実行済である否かの区分が記憶されている。スペースは主引用発明検索の実行前、"9"は実行済を示している。
対象公報記憶部155には、主引用発明検索および副引用発明検索の対象とされる公開公報データ(検索対象公報データ)が記憶されている。予測結果記憶部156には、図10に示すような後述する予測結果ファイルが記憶されている。
続いて、要旨データ抽出部102、特許要件適否予測処理部103について説明する。要旨データ抽出部102は、図5に示すように、候補抽出部111、要部データ抽出部112、CTデータ生成部113、テキスト分析・用語抽出部114、展開度・必須要件分析部115、係り受け解析部116、パターンデータ抽出部117およびファイル生成部118を有している。なお、図示の都合上、図5では、詳細な説明データ記憶部(詳細な説明TR)160、請求の範囲データ記憶部(請求の範囲TR)161、要部データ記憶部(要部データTR)162が要旨データ抽出部102に含まれているが、これらはデータ記憶手段であるHDD14に設けられている。
候補抽出部111は、予測対象TR記憶部152に記憶されている予測対象データを読み込み、そこから不要なデータをスキップ(読み飛ばし)して要旨データ作成に必要なデータを抽出し、抽出後のデータを詳細な説明データ(明細書データ)と、特許請求の範囲データとに分けて、それぞれ詳細な説明TR160、請求の範囲TR161に記憶させる。ここでは、「前記」、「該」、「当該」と、段落番号がスキップされる。
要部データ抽出部112は、予測対象TR記憶部152に記憶されている予測対象データを読み込み、そこから明細書の要部に相当する部分のデータ(要部データ)を抽出し、抽出した要部データを要部データ記憶部162に記憶させる。ここでは、要部データとして、明細書中の「発明の名称」の欄のデータ(発明の名称)および「技術分野」の欄のデータと、「発明が解決しようとする課題」の欄の「本発明」または「この発明」の文字列を含む一文のデータとを抽出する。
CTデータ生成部113は、予測対象TR記憶部152に記憶されている予測対象データを読み込み、そのうちの特許請求の範囲の欄に記載されているデータを読み込んで前述したクレームツリーデータ(CTデータ)を生成し、それCTデータ記憶部154に記憶させる。
テキスト分析・用語抽出部114は、詳細な説明TR160、請求の範囲TR161からそれぞれテキストデータを入力し、そのそれぞれについて、特徴語を抽出して(特許請求の範囲は請求項ごと)、各特徴語を重要とされる順序で出力する。この場合、例えば、形態素解析またはN−Gramなどの索引文字列抽出処理を実行して、各単語の出現頻度、各単語の共起頻度を調べ、その結果に応じて各特徴語を出力する。
展開度・必須要件分析部115は、請求の範囲TR161から特許請求の範囲データを読み込んで,テキスト分析・用語抽出部114で抽出された各特徴語について、展開度と、必須要件に該当するか否かとを調べ、その結果を出力する。ここで、展開度(Ed)とは、各特徴語がいくつの請求項に展開されているのか(用いられているのか)、展開されている請求項の個数を示すデータである。一般に、特許出願の出願書類では、できるだけ広い範囲の発明思想がカバーされるように、より重要な事項が請求項1(または他の独立項)に広い範囲で記載され、そこから下位の請求項に段階的に範囲を縮小(具体化)されながら記載されることが多い。そのため、展開度(Ed)が大きいほど、重要度がより高いと考えられるので、展開度は発明の要旨を把握するのに有益な情報と考えられる。例えば、図8に示すデータ種別"C"、項番"1"の用語エリア153c1が"用語1"のエリアに「パンチ」という用語がセットされているが、この「パンチ」という用語は、特開2008−62282号公報の特許請求の範囲において、請求項1、2、3、4、5に記載されているので、展開度エリア153c2に"5"がセットされている。
必須要件に該当するか否かは、各請求項の特徴部分に記載されているか否かであって、必須フラグ(Ef)によって示されている。本件出願に係る発明の実施の形態では、各請求項における最終段落、または「ことを特徴とする」の文字列を含む一文を各請求項の特徴部分としていて、そのデータが特徴部分データであり、ここに含まれている用語が必須要件を満たすものとしている。特徴部分から抽出された用語には、必須要件を満たすことを示す"X"が必須フラグ(Ef)にセットされる。
係り受け解析部116は、要部データ記憶部162に記憶されている要部データについて係り受け解析を行い、その結果をパターンデータ抽出部117に出力する。
パターンデータ抽出部117は、係り受け解析部116の解析結果を入力して、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとなる文字列と、発明の名称のうち、先頭に記載されているもの(筆頭名称)を出力する。例えば、特開2008−62282号公報の「発明が解決しようとする課題」の欄の「本発明」の文字列を含む一文の中に、ひらがなの「を」の直前の名詞と、それに対応した動詞の組み合わせとして、「調整」および「行わず」と、「同心性」および「得る」と、「精密打ち抜き型」および「提供」がある。これらがパターンデータ抽出部117から出力される。本実施の形態において、パターンデータ抽出部117から出力されるデータのうち、「発明が解決しようとする課題」の欄から抽出されたデータが課題データに相当していて、例えば図8のデータ種別"P"のレコードのようなデータとすることができる。
ファイル生成部118はテキスト分析・用語抽出部114、展開度・必須要件分析部115およびパターンデータ抽出部117から出力されるデータを用いて要旨データを生成し、要旨データ記憶部153に記憶させる。この場合、テキスト分析・用語抽出部114および展開度・必須要件分析部115の出力データを用いて、データ種別"C"、"D"のデータが生成され、パターンデータ抽出部117の出力データを用いて、データ種別"P"、"T"のデータが生成される。
特許要件適否予測処理部103は、図6に示すように、新規性・拡大先願予測処理部125と、進歩性予測処理部126とを有している。新規性・拡大先願予測処理部125は、要旨データ記憶部153に記憶されている要旨データを検索タームに用いて対象公報記憶部155の検索対象公報データの全文検索を行い、その結果にしたがい、新規性・拡大先願予測データNdを予測結果ファイル生成部127に出力する。新規性・拡大先願予測処理部125の機能、動作手順については、後に詳しく説明する。
進歩性予測処理部126は、引用発明検索部131と、入力ベクトル生成部132と、機械学習部133とを有している。引用発明検索部131は、後述する主引用発明検索を行う主引用発明検索部および副引用発明検索を行う副引用発明検索部を有している。また、引用発明検索部131は、主引用発明検索および副引用発明検索の結果にしたがい、進歩性予測データVd1を予測結果ファイル生成部127に出力し、検索の対象となった請求項に応じた請求項要旨データiedと概念検索データVd2を入力ベクトル生成部132に出力する。概念検索データVd2には、概念検索の結果、最も類似度が高いとされた文献(最類似文献)の公開公報データが含まれている。引用発明検索部131の機能、動作手順については、後に詳しく説明する。
入力ベクトル生成部132は、図7に示すように、要旨ベクトル生成部132aと、引用候補ベクトル生成部132bと、移動ベクトル生成部132cとを有している。
要旨ベクトル生成部132aは、請求項要旨データiedを入力してその特徴語を抽出し、各語に応じた重み付けを行って、各請求項の記載に応じた要旨ベクトルEVを生成する。引用候補ベクトル生成部132bは、概念検索データVd2に含まれる最類似文献の公開公報データを入力してその特徴語を抽出し、各語に応じた重み付けを行って最類似文献に応じた文書ベクトル(引用候補ベクトル)RfVを生成する。移動ベクトル生成部132cは、要旨ベクトルEVと、引用候補ベクトルRfVとの差分を計算して、双方の文書ベクトルの差分に応じた要旨移動ベクトルV3を生成する。
最類似文献は、主引用発明検索部による概念検索の結果、最も類似度が高いとされた文献であるため、予測対象発明の進歩性の審査で主引用発明の開示文献として引用される確率が最も高いと推測される。そのため、最類似文献を引用候補として引用候補ベクトルRfVを求め、これと要旨ベクトルEVとの差分を計算して要旨移動ベクトルV3を求めれば、予測対象発明と、最類似文献に開示されている発明との相違に応じた文書ベクトル(要旨移動ベクトルV3に相当する)が生成される。
機械学習部133は、本発明の実施の形態にかかる文書分類部であって、次のような訓練データ(学習パターンともいう)を用いた機械学習(教師付き学習)によって、後述する要旨移動ベクトルV3を進歩性の要件に適合するクラスと適合しないクラス(拒絶理由が無いクラスと有るクラス)に分類し、その分類結果に応じた出力信号(要件適否文書ベクトル)V4を出力するように構築されている。本発明の実施の形態の場合、学習パターンは次に述べるHLパターンとすることができる。
HLパターンは、学習文書ベクトルが第1の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由有りを示すベクトル(例えば、正解のクラスに対応した次元だけが"1"で、他が"0"のベクトル)との組み合わせと、学習文書ベクトルが第2の学習文書ベクトルで教師ベクトルが進歩性の拒絶理由無しを示すベクトル(例えば、上記とは別の次元だけが"1"で、他が"0"のベクトル)との組み合わせのパターンである。
第1の学習文書ベクトルは、公開済出願の中で特許庁の審査の結果、初めての拒絶理由通知(1stアクション)が発行された出願であって、その1stアクションで進歩性違反の拒絶理由(特許法第29条第2項の要件を満たしていないとする拒絶理由)が指摘されていた出願(進歩性拒絶出願)の該拒絶理由が指摘されていた(拒絶理由通知発行時点の)請求項に応じた文書ベクトルと、そのときの引用文献1(主たる刊行物として引用されていた主引用文献)に応じた文書ベクトル(引用文書ベクトル)との差分に応じた第1の移動文書ベクトルである。
第2の学習文書ベクトルは、公開済出願の中で審査の結果、1stアクションが発行されずに特許査定が発行された出願(拒絶無し出願)または1stアクションは発行されたがその拒絶理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)の(拒絶理由通知が発行された時点の)請求項1に応じた文書ベクトルと、それら拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる文献(学習用最類似文献)に応じた文書ベクトル(非引用文書ベクトル)との差分に応じた第2の移動文書ベクトルである。
機械学習部133は、上記のようなHLパターンの学習パターンで学習を繰り返し行うことにより、要旨移動ベクトルV3を進歩性の拒絶理由有りまたは無しのいずれかのクラスに分類し、その分類したクラスに応じた要件適否文書ベクトルV4を出力する。前者は、予測対象出願について、進歩性違反の拒絶理由が発行される可能性が高い場合、後者は低い場合に相当する。
機械学習部133は、入力される要旨移動ベクトルV3を進歩性の拒絶理由が有るクラスと無いクラスに分類して、その分類結果に応じた要件適否文書ベクトルV4を出力すればよいので、機械学習部133にサポートベクターマシーン(SVM)と呼ばれる学習アルゴリズムを適用することができる。サポートベクターマシーン(SVM)によれば、決定境界との距離(マージン)が最大になるように、決定境界を得ることができる。
また、機械学習部133の情報処理に脳神経回路網をモデルにしたニューラルネットワークを適用することができる。ニューラルネットワークには、階層型ニューラルネットワークと、相互結合型ニューラルネットワークがある。たとえば、機械学習部133の学習アルゴリズムとして、階層型ニューラルネットワークのパーセプトロンを適用することができる。
パーセプトロンはS層、A層、R層と呼ばれる3層からなる階層型ネットワークで構成され(図示せず)、S層からA層、A層からR層という片方向の結合だけが存在している。前述のHLパターンの学習パターンが与えられると、第1の学習文書ベクトルまたは第2の学習文書ベクトルが入力されたときの出力ベクトルがそれぞれの教師ベクトルと異なっていたときに、その誤差に応じて結合の重みが修正され、出力ベクトルと教師ベクトルとの誤差が一定値以下になったときに学習が終了する。
しかしながら、パーセプトロンでは、学習パターンが線形分離不可能な場合にアルゴリズムが停止しないおそれがある。そのため、機械学習部133が学習によって非線形な決定境界を獲得できるようにするため、階層型ニューラルネットワークの中で応用例が多く、誤識別の少ない非線形識別面が学習できるBP(バックプロパゲーション)ネットワークを適用することが好ましい。
BPネットワークは、図11に示すように、入力層および出力層と、その間の中間層とを有し、誤差逆伝播アルゴリズムと呼ばれる学習アルゴリズムによって、ユニット間のすべての結合の重みが学習可能になっている。誤差逆伝播アルゴリズムでは、入力信号が入力層、中間層、出力層と伝わり、その一方、誤差信号が逆に伝わることによって、重み調整が行われる。
そして、図11に示すBPネットワークに、学習パターンx(x、x・・・x)が入力されたとき、ある階層のj(0≦j≦n)番目のユニットには、そのユニットjとの結合を有する1階層前のユニットから重み付きの信号が入力される。そこで、1階層前のi(0≦i≦n)番目のユニットからの信号をtip,重みをwijとすると、ユニットjへの入力は、式1のようになり、ユニットjの出力は、閾値関数をfとして、式2のようになる。
式1
Figure 0006123143
式2
Figure 0006123143
学習パターンxに対する誤差Dは、出力層のユニットkの出力と、教師信号bkpの差の2乗和で定義されるから、以下の式3のようになる。この誤差Dをすべての学習パターンに対して足しあげて式4のDを求め、そのDが最小になるように、ユニット間の結合重みが調整されて機械学習部133における学習が行われる。この場合、個々の学習パターンが入力されるごとに、式5によって重みが調整される。wijは更新前の重み、w'ijは更新後の重み、ρは学習係数である。これは確率的最急降下法と呼ばれる。なお、ユニットの入出力関数は式6に示すシグモイド関数が用いられる。
式3
Figure 0006123143
式4
Figure 0006123143
式5
Figure 0006123143
式6
Figure 0006123143
(ユーザ端末装置30の構成)
ユーザ端末装置30は、図1に示すように、インターネットN1への接続環境を備え、特許要件適否予測サーバ10と通信を行うことができる。なお、ユーザ端末装置30は、据え置き型(または持ち運び可能なノート型)のパーソナルコンピュータを想定しているが、タブレット型の端末装置でもよい。
ユーザ端末装置30は、図3に示すように、CPU31、ROM32、RAM33、データ記憶部34、液晶表示部35を有している。また、ユーザ端末装置30は、音声変換処理部36、通信制御部37、通信処理部38a、無線通信部38b、スピーカ39およびマイク40を有している。
CPU31は、ROM32に記憶されているプログラムにしたがい作動してユーザ端末装置30全体の動作制御を司る。ROM32はCPU31が実行するプログラム、例えば、データ通信を行うための通信制御プログラムが記憶されている。RAM33には、CPU31によるプログラムの実行に必要なデータ等が記憶される。
データ記憶部34には種々のデータが記憶されている。液晶表示部35は、LCD(Liquid Crystal Display)とその駆動部を有し、文字、図形、記号などの画像表示を行う画像表示手段である。音声変換処理部36は、音声データを伸張してスピーカ39に出力する一方、マイク40から入力するアナログ音声信号をデジタルの音声データに変換および圧縮して、通信処理部38aに入力する。通信制御部37はCPU31の指示を受けて作動し、データ通信を行うための回線の接続および切断を制御する。通信処理部38aは、通信制御部37の指示にしたがい作動して、インターネットN1を介して行われるデータの送受信を実行する。無線通信部38bは通信制御部37の制御にしたがい、無線によるデータの送受信を実行する無線通信手段である。スピーカ39は、音声を出力する音声出力手段であり、マイク40はユーザの会話内容等の音声を入力し、電気信号に変換する。
(特許要件適否予測システムの動作内容)
次に、図4とともに図12から図22までを参照して、特許要件適否予測サーバ10による特許要件適否予測処理の動作内容について説明する。
ここで、図4は、特許要件適否予測処理を実現する特許要件適否予測サーバ10の主要な構成を示す機能ブロック図である。特許要件適否予測サーバ10では、CPU11が特許要件適否予測プログラムにしたがい、公開公報DB150、要旨データ記憶部153等に記憶されている各種ファイルやDBにアクセスしながら、公報データ抽出部101、要旨データ抽出部102、特許要件適否予測処理部103、予測結果編集処理部105としての動作を行う。これにより、特許要件適否予測処理が実行される。なお、特許要件適否予測プログラムは、特許要件適否予測サーバ10を公報データ抽出部101、要旨データ抽出部102、特許要件適否予測処理部103、予測結果編集処理部105等として機能させるためのプログラムである。
そして、特許要件適否予測サーバ10が特許要件適否予測処理を行うときは、CPU11が特許要件適否予測プログラムにしたがい図12に示すフローチャートに沿った動作を行う。図12は、特許要件適否予測プログラムにしたがったCPU11の特許要件適否予測処理の動作手順の一例を示すフローチャートである。なお、図12、図13等において"S"とはステップを略記したものである。
CPU11は、特許要件適否予測プログラムにしたがい動作を開始すると、ステップ1に進み、ユーザ認証処理を行う。ここでは、ユーザがユーザ端末装置30を用いて入力したユーザIDおよびパスワードを確認する等してユーザ認証処理を行う。次に、CPU11は、ステップ2に進み、ポイント残高確認処理を行う。ここでは、ユーザのポイント残高が一定値以上あるかどうかをCPU11が確認し、ポイント残高不足であれば、特許要件適否予測処理を終了するか、ポイント残高不足を知らせるメッセージの送信などを行う。
続いて、CPU11は、ステップ3に進み、指定番号の入力画面データをユーザ端末30に送信して、ユーザの指定番号の入力があるまで待機する。ここで、指定番号の入力があると、その指定番号を指定ナンバTR記憶部151に記憶させ、入力のあった指定番号の件数(例えば3件)を公報カウンタMAXにセットし、公報カウンタに"0"をセットする。
次に、CPU11は、処理をステップ4に進めて予測終了条件が成立しているか否かを判定する。ここで、CPU11は予測終了条件が成立しているときはステップ6に進むが、そうでないときはステップ5に進む。CPU11はステップ5に進むと、後述する特許要件適否予測ルーチンを実行するが、ステップ6に進むと、終了処理を実行し、そのユーザに対する特許要件適否予測処理を終了する。このようにすることで、予測終了条件が成立している限り、特許要件適否予測処理が自動的かつ継続的に実行される。
そして、CPU11はステップ5に進むときは、図13に示すフローチャートに沿って特許要件適否予測ルーチンを実行する。
CPU11は特許要件適否予測ルーチンを開始すると、ステップ11に進み、公報カウンタに"1"を加算する。続くステップ12では、公報カウンタが公報カウンタMAXよりも大きいか否かを判定し、大きくなければ処理をステップ13に進めるが、そうでなければ(公報カウンタが公報カウンタMAXより大きいとき)はステップ16に処理を進める。
CPU11は、ステップ13に処理を進めると、公報データ抽出部101としての動作を行って指定番号に応じたデータ抽出を行うとともに、対象公報抽出部104としての動作を行って公開公報データの抽出を行い、抽出したデータをそれぞれ予測対象TR記憶部152、対象公報記憶部155に記憶させる。また、CPU11は、要旨データ抽出部102としての動作を行って前述した要旨データおよびCTデータを生成し、それぞれ要旨データ記憶部153、CTデータ記憶部154に記憶させる。対象公報抽出部104は、出願日が予測対象出願の出願日よりも前の公開公報データを抽出する。
続いてCPU11は、ステップ14に処理を進めて後述する新規性・拡大先願予測ルーチンを実行してからステップ15に進み、進歩性予測ルーチンを実行する。その後、CPU11は、ステップ11に戻って上記同様の処理を繰り返す。ステップ16では、CPU11が予測結果編集処理部105としての動作を行い、後述する予測結果リストL1を編集出力する。その後、ステップ17のポイント消費処理を実行して、特許要件適否予測を行った公開済出願の件数に応じて、ポイント残高を減らす。その後、特許要件適否予測ルーチンが終了する。
そして、CPU11は、ステップ14に処理を進めると、前述した新規性・拡大先願予測処理部125としての動作を行い、図14、図15に示すフローチャートに沿って、新規性・拡大先願予測ルーチンを実行する。
この場合、CPU11は、新規性・拡大先願予測ルーチンをスタートするとステップ21に処理を進め、文献カウンタ(文献ct)および文献MAXに"0"をセットし、項番カウンタ(項番ct)に"1"をセットする。続いてステップ22に処理が進み、要旨データ記憶部153に記憶されている要旨データの項番ctに応じたデータを検索タームに用いて、対象公報記憶部155の検索対象公報データについて全文検索が行われ、ヒットした文献の件数が文献MAXにセットされる。この場合、ステップ21で項番カウンタに"1"がセットされているので、項番エリア153bが"1"のデータ、すなわち請求項1の要旨データを用いて検索タームが設定される。
続いて処理がステップ23に進み、ステップ22でヒットした文献があったか否か(文献MAXが1以上か否か)が判定され、ヒットした文献があればステップ24に処理が進み、そうでなければ新規性・拡大先願予測ルーチンが終了する。
ステップ24では、文献カウンタに"1"が加算され、続くステップ25では、文献カウンタが文献MAX以下であるか否かが判定され、これが成立しているときはステップ26に処理が進み、そうでなければステップ29に処理が進む。ステップ26では、ヒットした文献の出願公開日(ヒット文献公開日)が予測対象出願の出願日(対象出願日)よりも小さいか否か(ヒット文献公開日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ27に処理が進み、そうでなければステップ28に処理が進む。ステップ27では、新規性無しを示す新規性フラグ"N1"を含むように新規性・拡大先願予測データNdが生成される。その後、ステップ24に戻り、上記同様の処理が繰り返えされる。
そして、ステップ28では、後述する拡大先願予測ルーチンが実行される。ステップ29では、CTデータ記憶部154を参照して、他の独立項が有るか否かが判定され、ほかの独立項があるときはステップ30に処理が進み、そうでなければステップ31で新規性・拡大先願予測データNdが出力された後、新規性・拡大先願予測ルーチンが終了する。ステップ30では、CPU11が文献カウンタおよび文献MAXに"0"をセットし、項番カウンタに"1"よりも大きい請求項ナンバがセットされる。その後、処理がステップ22に戻り、上記同様の処理が繰り返される。
一方、CPU11は、図15に示すフローチャートに沿って拡大先願予測ルーチンを実行する。拡大先願予測ルーチンがスタートすると、ステップ41に処理が進み、ヒットした文献の出願日(文献出願日)が対象出願日よりも前であるか否か(文献出願日<対象出願日 が成立するか否か)が判定され、これが成立しているときはステップ42に処理が進むが、そうでなければ拡大先願予測ルーチンを終了する。ステップ42では、予測対象出願とヒットした文献とで発明者が同一であるか否かが判定され、これが成立していないときはステップ43に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。ステップ43では、予測対象出願とヒットした文献とで出願人が同一であるか否かが判定され、これが成立していないときはステップ44に処理が進むが、成立していれば拡大先願予測ルーチンを終了する。そして、CPU11は、ステップ44に処理を進めると、拡大先願の要件(特許法第29条の2に規定される要件)を満たしていないことを示す拡大先願フラグ"F1"を含むように新規性・拡大先願予測データNdを生成する。その後、拡大先願予測ルーチンが終了する。
以上で新規性・拡大先願予測ルーチンが終了すると、図13において処理がステップ14からステップ15に進み、CPU11が進歩性予測処理部126としての動作を行い、進歩性予測ルーチンを実行する。CPU11は、図16〜図22に示すフローチャートに沿って進歩性予測ルーチンを実行する。
CPU11は、進歩性予測ルーチンをスタートするとステップ51に処理を進め、CTデータ記憶部154から、独立区分エリア154aの独立区分がスペースのレコードにつき、そのナンバエリア154bの請求項ナンバを取得して、後述する独立項テーブル165のナンバエリア(Noエリア)165bにセットする。続くステップ52では、CTデータ記憶部154から、サーチフラグエリア154eのサーチフラグがスペースで、MAX区分エリア154cのMAX区分が"M"のレコードからそのナンバエリア154bの請求項ナンバを取得したうえで、取得した請求項ナンバの最小値(MIN)を求め、それをMAXカウンタにセットする。図9(B)のように、MAX区分が"M"のレコードが複数あるときはそのうちの最も小さい請求項ナンバがMAXカウンタにセットされる。
そして、CPU11は、ステップ53に処理を進めて独立項テーブル165のNoエリア165bをサーチし、続くステップ54で、"1"よりも大きい請求項ナンバがあるか否かを判定し、"1"よりも大きい請求項ナンバがあるか否かで処理が分岐する。この場合、"1"よりも大きい請求項ナンバがなければ処理がステップ55に進み、あれば処理がステップ56に進む。ステップ55は予測対象出願に含まれる請求項の中で独立項が1つだけの場合の処理(単一独立項ルーチン)、ステップ56は独立項が複数の場合の処理(複数独立項ルーチン)に相当している。前者は例えば予測対象出願が特開2008−62282号公報に開示されている出願の場合、後者は例えば予測対象出願が特開2011−186735号公報に開示されている出願の場合に相当している。
独立項テーブル165は、図24に示すように、カウンタエリア165a,Noエリア165bおよびサーチフラグエリア165cを有している。カウンタエリア165aには、記憶されるデータの件数に応じた数値が記憶されている。Noエリア165bには、独立項の番号が記憶される。サーチフラグエリア165cにはサーチフラグが記憶されている。図24には、一例として、予測対象出願が特開2011−186735号公報に開示されている出願の場合が示されている。
そして、CPU11は、ステップ55に処理を進めると、図17に示すフローチャートに沿って単一独立項ルーチンを実行する。CPU11は、単一独立項ルーチンを開始すると、ステップ61に処理を進め、CTデータ記憶部154から、サーチフラグエリア154eのサーチフラグがスペースのレコードについて、そのナンバエリア154bから請求項ナンバを取得して、そのうちの最小値(MIN)を項番カウンタにセットする。続くステップ62では、後述する独立項検索処理が行われる。続くステップ63で検索フラグ(検索flag)が"VX"または"VY"であるか否かが判定され、検索フラグが"VX"または"VY"であれば処理がステップ64に進み、そうでなければ単一独立項ルーチンを終了する。
CPU11は、ステップ64に処理を進めると項番カウンタに"1"を加算する。続くステップ65では、項番カウンタが、ステップ52でセットしたMAXカウンタ以下であるか否かが判定され、項番カウンタがMAXカウンタ以下ならステップ66に処理を進めて後述する従属項検索処理が実行されるが、そうでなければ独立項検索処理が終了する。
そして、CPU11は図18に示すフローチャートに沿って、複数独立項ルーチンを実行する。CPU11は処理をスタートすると、ステップ52に処理を進め、前述同様の処理を実行し、その後、ステップ55に進んで、上記同様にして単一独立項ルーチンを実行する。その後、CPU11は処理をステップ67に進め、CTデータ記憶部154に、サーチフラグエリア154eのサーチフラグがスペースのレコードがあるか否か(すなわち、検索処理が行われていないレコードがあるか否か)が判定され、あればステップ52に戻って上記同様の処理が実行されるが、そうでなければ複数独立項ルーチンが終了する。
また、CPU11は図19に示すフローチャートに沿って、独立項検索処理を実行する。独立項検索処理では、CPU11が引用発明検索部131としての動作を行い、独立項について主引用発明検索および副引用発明検索を行う。
CPU11は、独立項検索処理を開始すると、ステップ71に処理を進めて後述する主引用発明検索処理を実行する。続くステップ72では、主引用発明検索処理で主引用発明があったか否か(後述する主引用文献がセットされているか否か)が判定され、主引用発明があればステップ73に処理が進むが、主引用発明がなければステップ76に処理が進む。続くステップ73では、後述する副用発明検索処理が実行され、そのあとのステップ74で、副引用発明検索処理で副引用発明があったか否か(後述する副引用文献がセットされているか否か)が判定される。副引用発明があればステップ75に処理が進み、副引用発明がなければステップ77に処理が進む。
CPU11はステップ75に処理を進めると、該当する請求項ナンバの検索フラグ(検索flag)に"VX"をセットし、ステップ77では、検索フラグ(検索flag)に"VY"をセットする。また、CPU11はステップ76に処理を進めると、CTデータ記憶部154に記憶されているレコードのうち、ナンバエリア154bの請求項ナンバが項番カウンタに一致しているレコードについて、サーチフラグエリア154eのサーチフラグEfにサーチ済み(検索済み)を示す"9"をセットする。また、CPU11はセットされた検索フラグを含むように進歩性予測データVd1を生成して、それを予測結果ファイル生成部127に出力する。また、CPU11は検索結果に応じた請求項要旨データiedと概念検索データVd2を入力ベクトル生成部132に出力する。この場合、請求項要旨データiedは、検索の対象となった請求項の要旨データとすることができるが、予測対象TR記憶部152に記憶されている予測対象出願の検索の対象となった請求項のデータでもよい。検索フラグは、主引用発明が見つかった場合に"VX"または"VY"がセットされるが、主引用発明が見つかると、それによって、進歩性の要件を満たさないと判断される可能性が高いため、進歩性違反の拒絶理由が見つかるか否かは主引用発明が見つかるか否かに大きく左右される。進歩性予測データVd1は、このような検索フラグを含むことによって、進歩性の要件適否を示すものとなる。
そして、CPU11は図20に示すフローチャートに沿って、主引用発明検索処理を実行する。主引用発明検索処理は、予測対象発明に最も近い主引用発明を検索する処理である。
CPU11は、主引用発明検索処理を開始すると、ステップ81に処理を進めて、展開度カウンタtcに"0"をセットする。続いてCPU11は、ステップ82に処理を進め、要旨データ記憶部153から、次のデータを読みだして主検索文書データ(主引用発明を概念検索で検索するときの文書データ)を設定する。1つは、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコード(項番カウンタには、ステップ61で独立項の最小値がセットされている)から必須フラグEfが"X"で、展開度Edが展開度の最大値(展開度MAX)−展開度カウンタtcの用語(例えば、展開度MAXが"5"なら、展開度Edが"5"−tcの用語)であり、もう1つは、課題データ、すなわち、データ種別が"P"のレコードのデータである。
続くステップ83では、CPU11が主引用発明の検索処理、すなわち、主検索文書データを入力文書に用いて、対象公報記憶部155に記憶されている検索対象公報データについて概念検索を行う。この概念検索では、主検索文書データと、検索される文書それぞれを特徴語の抽出、重み付けを行う等してそれぞれの文書に応じたベクトル(文書ベクトル)が生成され、各ベクトルの内積が求められて類似度が算出される。次にステップ84では、ステップ83の概念検索の結果から、最も大きい類似度が一定値以上になっているか否かが判定され、一定値以上の場合はステップ85に処理が進むが、そうでなければステップ87に処理が進む。ステップ85では、類似度が一定値以上の文献が複数あったか否かが判定され、なければステップ86に処理が進み、あれば処理がステップ89に進む。主引用発明検索処理では、類似度が一定値以上の文献があったときだけ主引用文献がセットされる。
ステップ86では、ヒットした文献が主引用文献(主引用発明が開示されている先行技術文献)にセットされて主引用発明検索処理が終了する。ステップ87では、展開度カウンタtcに"1"が加算され、その後のステップ88では、展開度MAX−展開度カウンタtcが"0"以下であるか否かが判定され、"0"以下なら主引用発明検索処理を終了するが、そうでなければステップ82に戻って上記の処理を繰り返す。
こうすることで、はじめに展開度Edが展開度MAXのより重要な用語で概念検索が行される。概念検索では、文献の類似度に応じて、複数の文献が抽出され得るが、最も高い類似度が一定値に達していないときは、その文献が主引用文献に該当しないおそれが高い。そのため、類似度が一定値以上の文献が見つからなかった場合に展開度Edが展開度MAXよりも小さい用語を含めて再び概念検索が実行される。
ステップ89では、類似度の最も大きい文献(最類似文献ともいう)を主引用文献にセットし、その後、主引用発明検索処理が終了する。
そして、CPU11は図21に示すフローチャートに沿って、副引用発明検索処理を実行する。副引用発明検索処理は、予測対象発明と主引用発明との相違点を含む副引用発明を検索する処理であり、主引用発明検索処理で主引用発明が見つかったときだけ実行される。
CPU11は、副引用発明検索処理を開始すると、ステップ91に処理を進めて、要旨データ記憶部153から、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない用語(検索未使用データ)と、データ種別が"P"のレコードのデータとを読み出し、それらを副検索ターム(副引用発明を全文検索で検索するときのキーワード)に設定する。
続くステップ92では、CPU11が副引用発明の検索処理、すなわち、副検索タームを検索キーワードに用いて、対象公報記憶部155に記憶されている検索対象公報データについて全文検索を行う。続くステップ93では、ステップ92でヒットした文献があったか否かが判定され、ヒットした文献があればステップ94に処理が進み、そうでなければ処理がステップ96に進む。ステップ94では、ヒットした文献が複数あったか否かが判定され、ヒットした文献が複数なければステップ95に処理が進み、ヒットした文献が複数あれば処理がステップ98に進む。
ステップ95では、ヒットした文献が副引用文献(副引用発明が開示されている先行技術文献)にセットされて副引用発明検索処理が終了する。ステップ96では、副検索タームが変更されて再び全文検索が行われる。ここでは、副検索タームが、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの主検索文書データに含まれていない検索未使用データと、データ種別が"T"のレコードのデータに変更される。次のステップ97でヒットした文献があったか否かが判定され、ヒットした文献があればステップ94に処理が進み、なければ副引用発明検索処理が終了する。さらに、ステップ98では、ヒットした文献のそれぞれについて、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコードの必須フラグEfが"X"の用語との一致数がカウントされ、その一致数が副引用ファイルにセットされる。次のステップ99で副引用ファイルが一致数の降順にソートされ、続くステップ100で副引用ファイルの先頭から3件が副引用文献にセットされ、その後、副引用発明検索処理が終了する。副引用発明検索で複数の文献がヒットしたときは、そのそれぞれについて、予測対象発明の特徴部分がどの程度開示されているのかが、必須フラグEfが"X"の用語との一致数で調べられ、その一致数の多い文献が副引用文献にセットされる。
そして、CPU11は図22に示すフローチャートに沿って、従属項検索処理を実行する。従属項検索処理は、検索フラグ(検索flag)が"VX"または"VY"であったとき(主引用発明がみつかったとき)だけ実行される。CPU11が従属項検索処理を開始すると、ステップ111に処理が進み、要旨データ記憶部153から、データ種別が"C"で、項番エリア153bの番号が項番カウンタに相当するレコード(項番カウンタには、ステップ64で独立項の最小値に順次"1"が加算される)から必須フラグEfが"X"の用語が読み出され、それが従属検索ターム(従属項に記載されている発明を全文検索で検索するときのキーワード)に設定される。次のステップ112でCPU11が従属検索タームを検索キーワードに用いて、主引用文献について全文検索を行い、従属項に記載されている発明が主引用文献に開示されているか否かを調べる。
次のステップ113で、ヒットした文献があったか否かが判定され、ヒットした文献があればステップ114に処理が進み、そうでなければ処理がステップ116に処理が進む。ステップ114では、該当する請求項ナンバの検索フラグ(検索flag)に"VX"がセットされ、ヒットした文献が該当する請求項ナンバの主引用文献にセットされる。その後、処理がステップ115に進み、CTデータ記憶部154に記憶されているレコードのうち、ナンバエリア154bの請求項ナンバが項番カウンタに一致するレコードについて、サーチフラグエリア154eのサーチフラグEfに"9"がセットされ、その後、従属項検索処理が終了する。また、ステップ116では、従属検索タームで副引用文献について全文検索が行われ、次のステップ117で、ヒットした文献があったか否かが判定される。ヒットした文献があればステップ118を実行したあとステップ115に進み、なければ従属項検索処理が終了する。ステップ118では、該当する請求項ナンバの検索フラグ(検索flag)に"VY"がセットされ、ヒットした文献が該当する請求項ナンバの副引用文献にセットされる。
以上のようにして、新規性・拡大先願予測ルーチンと、進歩性予測ルーチンとが実行されると、それぞれの結果に応じて、新規性・拡大先願予測データNdと、進歩性予測データVd1とが予測結果ファイル生成部127に出力される。また、機械学習部133から要件適否文書ベクトルV4が出力されるので、これらを用いて予測結果ファイル生成部127が図10に示した予測結果ファイルを生成し、予測結果記憶部156に記憶させる。
予測結果ファイルは、図10に示すように、公開番号、請求項、主検索文書データ、副検索ターム、検索フラグ、ヒット文献、マシン予測の各項目のデータが予測対象出願ごとに記憶されている。マシン予測とは、機械学習記憶部133からの要件適否文書ベクトルV4に応じたデータであって、進歩性予測ルーチンで見つかった主引用文献および副引用文献を引用した進歩性違反の拒絶理由が見つかる可能性が高いか低いか(高い場合は"H"、低い場合は"L")を示している。
また、予測結果編集部105が予測結果ファイルを読み込み、図25に示すような特許要件適否予測リストL1を編集および出力して、ユーザ端末装置30に送信する。特許要件適否予測リストL1には、予測対象出願の出願公開番号、請求項の番号とともに、新規性(拡大先願)、進歩性の要件適否がその根拠となる文献(主引用文献、副引用文献)とともに示されている。新規性(拡大先願)、進歩性の要件に適合しない(満たさない)と予測される場合は、"X"、適合する(満たす)と予測される場合は"A"が記載される。これらは、予測結果ファイルの検索フラグで判断される。
進歩性の要件に適合しないと予測される場合の"X"(主引用文献、副引用文献有り)、"Y"(主引用文献のみ有り)、には、"H"、"L"が併記される(図25では、"H"が併記されるばあいのみ例示)これは、機械学習部133の要件適否文書ベクトルV4にしたがったもので、"H"は主引用文献で進歩性違反の拒絶理由が発行される可能性が高い場合、"L"は低い場合を示している。
以上のように、本発明の実施の形態にかかる特許要件適否予測サーバ10では、予測対象出願の記載事項から要旨データを生成し、これを用いて主引用発明検索、副引用発明検索を行っている。主引用発明検索は、予測対象出願とその骨格において共通する、すなわち、先行技術発明のうち、予測対象発明に最も近い主引用発明を要旨データで探し出す処理であり、特許法や特許・実用新案審査基準に沿って行われる。副引用発明検索は、主引用発明検索で主引用発明が見つかった場合に、発明が解決しようとする課題や、技術分野を特定する用語を用いた全文検索で行われており、これも特許法や特許・実用新案審査基準に沿って行われる。したがって、本発明の実施の形態にかかる特許要件適否予測サーバ10では、特許要件の適否に関する予測が審査実務に適合した内容で行われるので、特許出願の監視負担を有効に軽減することができる。
一方、前述したように、特許要件適否予測処理部103が機械学習部133を有しているが、その機械学習部133は過去の審査実績に基づく学習データで訓練された人工知能プログラムで構築されている。
ところで、平成26年の実績ベースで年間32万数千件程度の特許出願が出されており、その一部またはそれ以前の多数の特許出願について1stアクションがすでに発行されている。その中には、拒絶理由通知で進歩性違反の拒絶理由が指摘されている出願(進歩性拒絶出願)が多数存在している。
進歩性拒絶出願では、審査結果が、審査時点の請求項に記載された発明と主引用発明とに相違点があったものの、その相違点だけでは、進歩性があるとは審査官によって判断されなかったということを意味している。これに対し、特許出願の中には、1stアクションが発行されることなく特許査定が発行された出願や、拒絶理由通知が発行されたものの、その理由に進歩性違反の拒絶理由が指摘されていなかった出願(進歩性拒絶無し出願)も存在している。
そして、例えば図23に示すように、審査対象となる特許出願Pdがあり、その出願日がtであったとすると、特許出願Pdに対する主引用発明または副引用発明となりえるのは、公知、公用、文献公知およびインターネット公知の発明であり、主に出願日tより前にすでに公開されている出願の特許公開公報(図23では、rf1〜rf6)に開示されている発明である。
ここで、仮に、審査の結果、公報rf6に開示されている発明が主引用発明に該当すると判断されたとする。すると、その場合、特許出願Pdに係る発明と、その公報rf6に開示されている発明とに相違点があったものの、その相違点に応じた距離dpが、特許出願Pdに係る発明の進歩性を肯定するに足りる大きさではなかったと考えられる。逆に、公報rf6に開示されている発明が主引用発明には該当しないと判断されていたとすれば、距離dpが、出願Pdに係る発明の進歩性を肯定するに足りる大きさであったと考えられる。
もし、発明の進歩性が肯定されるときの相違がどの程度で、否定されるときの相違がどの程度なのかが割り出せれば、それが特許要件適否の客観的な判断材料になると考えられるが、以上を考慮すると、そのためには、2つの発明の相違に応じた距離dpがどの程度なのかを割り出すのが有効であると考えられる。これを過去の審査実績に基づく訓練データの学習によって割り出し、進歩性が否定されるおそれが高いのか、それとも低いのかの目安を付けるのが機械学習部133である。
機械学習部133の学習において、本件出願にかかる発明(本願発明)では、距離dpを2つの文書ベクトルの差分と捉え、進歩性の拒絶理由有りの場合、無しの場合それぞれの距離dpを学習するため、前述のHLパターンによる訓練データで学習が行われている。
そして、特許要件の適否を予測する場合は、予測対象出願について、その要旨データを求め、それを用いて概念検索で最類似文献を探し出す。最類似文献は、予測対象出願の文書ベクトル(正確には、独立項の記載事項などから求めた文書ベクトル)に最も類似度が高い文書ベクトルを有しているので、公開済出願の中で主引用文献になる可能性が最も高いと認められる。
その最類似文献から求めた引用候補ベクトルRfVと、予測対象出願の要旨データから求めた要旨ベクトルEVとの差分を求めて要旨移動ベクトルV3を生成し、これを機械学習部133に入力して、主引用発明検索で見つかった主引用文献を引用する進歩性違反の拒絶理由が有るのか、無いのかが出力されるようにしている。これにより、進歩性違反の拒絶理由が見つかる可能性が高いのか、低いのかの目安を付けることが可能になる。
以上のように、特許要件適否予測サーバ10では、機械学習部133を備えていることによって、特許庁の審査実績を反映させる形で特許要件適否の予測が行われることになる。従前のような審査官や弁理士などの専門家の経験や勘だけに頼らざるを得ない判断結果に人工知能の判断結果を生かせるようになるため、予測結果に客観性を持たせることが可能になり、他社出願の監視負担の軽減や、自社出願の審査請求有無の判断効率化などとも相まって業務効率の向上が期待できる。
また、進歩性予測処理部126が主引用発明検索では概念検索を行い、副引用発明検索で全文検索を行っている。進歩性違反の拒絶理由が有るのかどうかは主引用発明が見つかるか否かが大きく左右するが、その主引用発明を探す主引用発明検索で全文検索を行うと、複数の文献がヒットする可能性があり、主引用発明(主引用文献)を特定できない場合がある。この点、概念検索では、文書ベクトルの内積から求めた類似度にしたがい類似している文献が順番付けされるので、最も類似度の高い文献を選ぶことで主引用文献を特定できる。こうして見つけた主引用文献に機械学習部133による予測を併用することで、その主引用文献を引用した進歩性違反の拒絶理由が出るおそれが高いのか、低いのかを予測することができる。また、副引用発明検索で全文検索を行うことで、副引用文献があるのかどうかを明確にすることができる。
(変形例)
以上述べた実施の形態では、特許要件適否予測サーバ10に特許要件適否予測プログラムがインストールされることによって、特許要件適否予測サーバ10が特許要件適否予測装置として機能する場合を例にとって説明している。その他、本発明は、ユーザ端末装置30が特許要件適否予測装置として機能する場合についても適用がある。この場合、前述した特許要件適否予測プログラムについて少なくとも以下の変更点1)、2)にしたがった変更を行い、その変更後の特許要件適否予測プログラムを特許要件適否予測サーバ10からユーザ端末装置30にダウンロードし、ユーザ端末装置30にインストールすればよい。
変更点1) 指定ナンバなどの入力操作を行うための画像データを特許要件適否予測サーバ10からユーザ端末装置30に送信することなくユーザ端末装置30に表示させる。
変更点2) 特許要件適否予測リストをユーザ端末装置30が出力する。
以上の説明は、本発明の実施の形態についての説明であって、この発明の装置及び方法を限定するものではなく、様々な変形例を容易に実施することができる。また、各実施形態における構成要素、機能、特徴あるいは方法ステップを適宜組合わせて構成される装置又は方法も本発明に含まれるものである。
例えば、ユーザ端末装置は高機能携帯電話機や、タブレット型の端末装置ではなく、ノートパソコンや、PDAでもよい。なお、CPU11が実行する特許要件適否予測プログラムは、磁気記録媒体、CD−ROM,DVD等の各種記録媒体に記録することができるし、ネットワークを介して図示しないサーバからダウンロードすることもできる。
本発明を適用することにより、特許要件の適否に関する予測が審査実務に適合した内容で行われ、監視負担を有効に軽減することができる。本発明は、特許要件適否予測装置および特許要件適否予測プログラムの分野で利用することができる。
1…特許要件適否予測システム、10…特許要件適否予測サーバ、11,31…CPU、30…ユーザ端末装置、101…抽出部、102…要旨データ抽出部、103…特許要件適否予測処理部、105…予測結果編集処理部、125…新規性・拡大先願予測処理部、126…進歩性予測処理部、132…入力ベクトル生成部、132a…要旨ベクトル生成部、132b…引用候補ベクトル生成部、132c…移動ベクトル生成部、153…要旨データ記憶部、154…CTデータ記憶部、156…予測結果記憶部、L1…予測結果リスト。

Claims (4)

  1. 公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
    該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
    該要旨データ抽出手段によって抽出された前記要旨データを記憶する要旨データ記憶手段と、
    前記要旨データ記憶手段に記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
    前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、
    前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
    前記副引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行う特許要件適否予測装置。
  2. 公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
    該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
    該要旨データ抽出手段によって抽出された前記要旨データを記憶する要旨データ記憶手段と、
    前記要旨データ記憶手段に記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段とを有し、
    前記進歩性予測処理部は、前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部と、文書ベクトルの分類を行う文書分類部とを有し、
    前記主引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
    前記副引用発明検索部は、前記要旨データ記憶手段に記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行い、
    前記文書分類部は、学習文書ベクトルと教師ベクトルとを含む複数の訓練データを用いた機械学習によって、入力される要旨移動ベクトルを進歩性の要件に適合するか否かのいずれかに分類してその分類結果に応じた要件適否文書ベクトルを出力するように構築され、該要旨移動ベクトルは、前記予測対象出願の各請求項に応じた要旨ベクトルと、前記主引用発明検索部による前記概念検索の結果、最も類似度が高いとされた最類似文献に応じた引用候補ベクトルとの差分に応じたベクトルである特許要件適否予測装置。
  3. 前記文書分類部は、前記訓練データとして、前記学習文書ベクトルが第1の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由有りを示すベクトルとの組み合わせと、前記学習文書ベクトルが第2の学習文書ベクトルで前記教師ベクトルが進歩性の拒絶理由無しを示すベクトルとの組み合わせが用いられ、
    前記第1の学習文書ベクトルは、すでに公開されている公開済出願の中で拒絶理由通知が発行された出願であって、該拒絶理由通知で進歩性の拒絶理由が指摘されていた進歩性拒絶出願の該拒絶理由が指摘されていた請求項に応じた文書ベクトルと、該拒絶理由で主たる刊行物として引用されていた主引用文献に応じた引用文書ベクトルとの差分に応じた第1の移動文書ベクトルであり、
    前記第2の学習文書ベクトルは、前記公開済出願の中で拒絶理由通知が発行されずに特許査定が発行された拒絶無し出願または拒絶理由通知が発行された出願であって、該拒絶理由通知で進歩性の拒絶理由が指摘されていなかった進歩性拒絶無し出願の請求項1に応じた文書ベクトルと、前記拒絶無し出願または進歩性拒絶無し出願を対象とする概念検索の結果、最も類似度が高いとされる学習用最類似文献に応じた非引用文書ベクトルとの差分から求めた第2の移動文書ベクトルである請求項2記載の特許要件適否予測装置。
  4. コンピュータを特許要件適否予測装置として機能させるための特許要件適否予測プログラムであって、該コンピュータを
    公開特許公報の電子データが公開公報データとして格納されている公開公報データ記憶部から、指定された番号に応じた予測対象データを抽出する公報データ抽出手段と、
    該公報データ抽出手段によって抽出された前記予測対象データによって特定される予測対象出願について、該予測対象出願に開示されている予測対象発明の要旨を特定し得る用語を示す用語データであって、少なくとも各請求項の特徴部分から抽出された特徴部分データおよび発明が解決しようとする課題の欄から抽出された課題データを含むデータを要旨データとして前記予測対象データから抽出する要旨データ抽出手段と、
    該要旨データ抽出手段によって抽出された前記要旨データを記憶させる要旨データ記憶制御手段と、
    前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データを用いて前記公開公報データを検索し、該検索結果に応じて、前記予測対象発明の新規性の要件適否を示す新規性予測データを生成する新規性予測処理部と、前記予測対象発明の進歩性の要件適否を示す進歩性予測データを生成する進歩性予測処理部と、該新規性予測データおよび進歩性予測データを用いて前記予測対象発明の特許要件適否を示す予測結果ファイルを生成する予測結果ファイル生成部とを有する特許要件適否予測処理手段として機能させ、
    前記進歩性予測処理部が前記公開公報データによって特定される先行技術発明のうち、前記予測対象発明に最も近い主引用発明を検索する主引用発明検索部と、前記予測対象発明と前記主引用発明との相違点を含む副引用発明を検索する副引用発明検索部とを備えた引用発明検索部を有し、
    前記主引用発明検索部が前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データのうちの各請求項の前記特徴部分データおよび前記課題データを主検索文書データとして前記公開公報データを対象とする概念検索を行い、
    前記副引用発明検索部が前記要旨データ記憶制御手段の制御によって記憶されている前記要旨データのうちの前記主検索文書データに応じた請求項のデータであって、前記主検索文書データに含まれていない検索未使用データおよび前記課題データを副検索タームに用いて全文検索を行うように、前記コンピュータを前記特許要件適否予測処理手段として機能させる特許要件適否予測プログラム。
JP2016027034A 2016-02-16 2016-02-16 特許要件適否予測装置および特許要件適否予測プログラム Active JP6123143B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016027034A JP6123143B1 (ja) 2016-02-16 2016-02-16 特許要件適否予測装置および特許要件適否予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016027034A JP6123143B1 (ja) 2016-02-16 2016-02-16 特許要件適否予測装置および特許要件適否予測プログラム

Publications (2)

Publication Number Publication Date
JP6123143B1 true JP6123143B1 (ja) 2017-05-10
JP2017146720A JP2017146720A (ja) 2017-08-24

Family

ID=58704656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016027034A Active JP6123143B1 (ja) 2016-02-16 2016-02-16 特許要件適否予測装置および特許要件適否予測プログラム

Country Status (1)

Country Link
JP (1) JP6123143B1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6232607B1 (ja) * 2017-05-29 2017-11-22 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP6306786B1 (ja) * 2017-08-17 2018-04-04 株式会社ゴールドアイピー 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP6308708B1 (ja) * 2017-08-25 2018-04-11 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP6457058B1 (ja) * 2017-12-06 2019-01-23 株式会社ゴールドアイピー 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2019036284A (ja) * 2018-03-08 2019-03-07 株式会社ゴールドアイピー 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP2020112663A (ja) * 2019-01-10 2020-07-27 株式会社AI Samurai 情報処理装置、サーバの制御方法、およびサーバの制御プログラム
JP2020205105A (ja) * 2017-05-31 2020-12-24 株式会社半導体エネルギー研究所 システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7100513B2 (ja) * 2018-06-29 2022-07-13 株式会社エヌケービー 映像審査装置、コンピュータプログラム及び映像審査方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132569A (ja) * 1998-10-23 2000-05-12 Inpatekku Kk 特許情報の新規性等自動分析装置
JP2002092234A (ja) * 2000-09-18 2002-03-29 Sony Corp アイデア評価装置、アイデア評価システムおよびそれらの方法
EP1276059A2 (en) * 2001-07-11 2003-01-15 Rohm And Haas Company Data processing system
JP2010231564A (ja) * 2009-03-27 2010-10-14 Nomura Research Institute Ltd 特許出願評価装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132569A (ja) * 1998-10-23 2000-05-12 Inpatekku Kk 特許情報の新規性等自動分析装置
JP2002092234A (ja) * 2000-09-18 2002-03-29 Sony Corp アイデア評価装置、アイデア評価システムおよびそれらの方法
EP1276059A2 (en) * 2001-07-11 2003-01-15 Rohm And Haas Company Data processing system
JP2003141288A (ja) * 2001-07-11 2003-05-16 Rohm & Haas Co データ処理システム
JP2010231564A (ja) * 2009-03-27 2010-10-14 Nomura Research Institute Ltd 特許出願評価装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018200621A (ja) * 2017-05-29 2018-12-20 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP6232607B1 (ja) * 2017-05-29 2017-11-22 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP2020205106A (ja) * 2017-05-31 2020-12-24 株式会社半導体エネルギー研究所 システム
JP2022019832A (ja) * 2017-05-31 2022-01-27 株式会社半導体エネルギー研究所 システム
JP2020205105A (ja) * 2017-05-31 2020-12-24 株式会社半導体エネルギー研究所 システム
JP6306786B1 (ja) * 2017-08-17 2018-04-04 株式会社ゴールドアイピー 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP2019036177A (ja) * 2017-08-17 2019-03-07 株式会社ゴールドアイピー 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP6308708B1 (ja) * 2017-08-25 2018-04-11 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP2019040402A (ja) * 2017-08-25 2019-03-14 和之 白井 特許要件適否予測装置および特許要件適否予測プログラム
JP6457058B1 (ja) * 2017-12-06 2019-01-23 株式会社ゴールドアイピー 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2019101944A (ja) * 2017-12-06 2019-06-24 株式会社AI Samurai 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2019036284A (ja) * 2018-03-08 2019-03-07 株式会社ゴールドアイピー 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
JP2020112663A (ja) * 2019-01-10 2020-07-27 株式会社AI Samurai 情報処理装置、サーバの制御方法、およびサーバの制御プログラム

Also Published As

Publication number Publication date
JP2017146720A (ja) 2017-08-24

Similar Documents

Publication Publication Date Title
JP6123143B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
JP6232607B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
JP6308708B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
EP1835422A1 (en) Information processing device and method, and program
CN109947902B (zh) 一种数据查询方法、装置和可读介质
JP4170296B2 (ja) 事例分類装置および方法
CN111723256A (zh) 一种基于信息资源库的政务用户画像构建方法及其系统
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
JP2023076413A (ja) 言語モデルを利用してドメインに特化した対話を提供する方法、コンピュータ装置、およびコンピュータプログラム
US11308146B2 (en) Content fragments aligned to content criteria
CN109271624A (zh) 一种目标词确定方法、装置及存储介质
CN115374781A (zh) 文本数据信息挖掘方法、装置、设备
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP6188172B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
KR101273646B1 (ko) 멀티 모달리티 데이터 색인 및 검색 방법, 그 시스템
KR101134615B1 (ko) 사용자 적응형 이미지 관리 시스템 및 사용자 적응형 이미지 관리 방법
CN110516236B (zh) 一种社交短文本细粒度情感采集方法
JP6308706B1 (ja) 特許要件適否予測装置および特許要件適否予測プログラム
CN115062135A (zh) 一种专利筛选方法与电子设备
CN114639044A (zh) 标签确定方法、装置、电子设备及存储介质
AU2019290658B2 (en) Systems and methods for identifying and linking events in structured proceedings
JP6039057B2 (ja) 文書分析装置及び文書分析プログラム
JP2005092443A (ja) クラスター分析装置およびクラスター分析方法
CN116681408B (zh) 系统管理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170317

R150 Certificate of patent or registration of utility model

Ref document number: 6123143

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250