1.本発明は、上記従来の問題点に鑑みてなされたものであり、特許または実用新案の公開公報、特許公報、登録実用新案公報等の特許明細書データより、出願人や代理人の権利取得能力について客観的に分析することができる特許情報分析装置、特許情報分析方法、特許情報分析プログラム、およびコンピュータ読み取り可能な記録媒体を提供することを目的としている。
本発明の特許情報分析装置は、上記課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項により示される権利範囲の広さを数値化する請求項分析手段と、上記請求項分析手段により権利範囲の広さが数値化された特許明細書データの合計件数を集計し、その数値化された権利範囲の広さの平均値を算出する第1の分析処理手段とを備えていることを特徴としている。
なお、特許明細書データとは、各国の特許法等の法令に基づき(例えば、日本国の場合には特許法36条2項または実用新案法5条2項によって)規定された、明細書、特許請求の範囲(または実用新案登録請求の範囲)に記載された内容を示すデータを意味しており、公開特許公報や登録特許公報(または公開実用新案公報や登録実用新案公報)等の電子データから得られるものである。なお、特許明細書データには)、WIPO(世界知的所有権機関)のもとで制定されているINIDコード(Internationally agreed Numbers for the Identification of Data 書誌的事項の識別番号)を含む。
また、特許明細書データには、審査経過や登録後の経過に関する情報、たとえば、拒絶理由が発せられた際の引用文献を特定する番号、無効審判の請求、異議申し立て、および閲覧請求がなされた回数が含まれる場合もある。これらの審査経過や登録後の経過に関する情報は、特許明細書データがどれだけ他社(当該出願人以外)から注目を集めているかということを示す注目度データとしても利用できるものである。
注目度データは、公知の特許情報データベースから容易に取得することができる。さらに、注目度データは、特許明細書データに含まれる構成とされてもよいし、特許明細書データと独立した構成とされてもよい。
上記構成によれば、請求項により示される権利範囲の広さが、請求項分析手段により数値化されるので、権利範囲の広さを客観的に判断することができる。また、第1の分析処理手段により権利範囲の広さの平均値が算出されるので、出願人や代理人等の権利取得能力を客観的に分析することができる。
すなわち、一般的に特許出願の件数(特許明細書データの合計件数)が多ければ権利取得能力が高いと単純に判断されがちであるが、実際は、特許明細書データの合計件数が多くても、各特許明細書データに含まれる請求項の権利範囲が狭いなら、必ずしも権利取得能力が高いとはいえない。
しかしながら、上記構成の特許情報分析装置によれば、単に特許明細書データの合計件数だけに注目するのではなく、これらの特許明細書データに含まれる請求項の権利範囲の平均値を、第1の分析処理手段により算出することができる。この平均値は、出願人や代理人がどれだけ権利範囲が広い特許を何件創出できているかを判断するための目安となるものであるから、出願人や代理人の権利取得能力を的確に分析することが可能となる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の分析処理手段により算出された権利範囲の広さの平均値を、異なる出願人の間で比較評価する第1の比較評価手段を備えていることが好ましい。
上記構成によれば、第1の比較評価手段により、権利範囲の広さの平均値が、異なる出願人の間で比較評価されるので、単に各出願人の出願数の多さだけを比較するのではなく、各出願人がどれだけ権利範囲の広い出願を数多くしているか、すなわち、各出願人の権利取得能力を相対的に分析することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の分析処理手段により算出された権利範囲の広さの平均値を、異なる代理人の間で比較評価する第1の比較評価手段を備えていることが好ましい。
上記構成によれば、第1の比較評価手段により、権利範囲の広さの平均値が、異なる代理人の間で比較評価されるので、単に各代理人の出願数の多さだけを比較するのではなく、各代理人がどれだけ権利範囲の広い出願を数多くしているか、すなわち、各代理人の権利取得能力を相対的に分析することができる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の比較評価手段が、上記権利範囲の広さの平均値を、同一の技術分野に関連するものとして設定するものであることが好ましい。
上記構成によれば、第1の比較評価手段は、同一の技術分野に関連する権利範囲の広さの平均値を、出願人や代理人の間で比較評価する。
すなわち、技術分野毎に、請求項の記載の仕方や発明特定事項の内容は大きく異なる。たとえば、液晶ディスプレイ関連の技術分野の中でも(1)駆動技術(日本独自の特許分類Fターム2H093)の特許と、(2)基板、絶縁膜および配向部材に関する技術(日本独自の特許分類Fターム2H090)の特許との平均文字数を比較した場合には、(1)の技術の特許の方が回路構成や駆動手順等の発明特定事項が一般的に多くなる傾向にあるため、(2)の技術の特許よりも文字数が多くなっている。上記の例では日本独自の特許分類について説明したが、国際的な特許分類であるIPC分類または米国独自の特許分類であるUSクラスによって、(1)駆動技術の特許と(2)基板、絶縁膜および配向部材に関する技術の特許との平均文字数を比較した場合においても、(1)の技術の特許の方が回路構成や駆動手順等の発明特定事項が一般的に多くなる傾向にあるという結果は同じである。
このように、異なる技術分野間では、請求項の文字数や発明特定事項の数の傾向が異なるので、この傾向の相違が、請求項分析手段により数値化される権利範囲の広さに影響を及ぼす場合がある。したがって、権利範囲の広さを示す数値を、関連性が乏しい技術分野の間で比較しても、権利取得能力を適切に評価できない場合がある。
しかしながら、上記構成の特許情報分析装置では、第1の比較評価手段が、同一の技術分野に関連する権利範囲の広さの平均値を、出願人や代理人の間で比較評価するので、より公平かつ適切に、出願人や代理人の権利取得能力を比較評価することができる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記特許明細書データが、公開特許公報から得られるものであることが好ましい。
上記構成によれば、公開特許公報から特許明細書データを得るので、出願時点での出願人や代理人の出願明細書作成能力について分析を行うことができる。つまり、公開特許公報には、出願当初の請求項が掲載されるので、当該請求項により示される権利範囲の広さを請求項分析手段により数値化すれば、余分な限定の無い適切な権利範囲の広さの請求項が出願時に作成されているかを客観的に分析することができる。
これにより、権利取得能力の一例としての出願明細書作成能力を、的確に分析することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記特許明細書データが、登録特許公報から得られるものであることが好ましい。
上記構成によれば、登録特許公報から特許明細書データを得るので、出願人や代理人の出願明細書作成能力および中間処理対応能力等の権利取得能力について分析を行うことができる。
つまり、登録特許公報には、設定登録時の請求項が掲載されるので、当該請求項により示される権利範囲の広さを請求項分析手段により数値化すれば、余分な限定の無い適切な権利範囲の広さの請求項が特許されているかを客観的に分析することができる。
そして、本発明者らにおいては、設定登録時において請求項により示される権利範囲が適切な広さに設定されているならば、出願時点における請求項により示される権利範囲の広さも、ほぼ適切に設定されているという相関関係を見出している。したがって、設定登録時の請求項により示される権利範囲の広さを数値化すれば、出願時点において余分な限定の無い適切な権利範囲の広さの請求項が出願時に作成されているかも判断することができる。よって、権利取得能力の一例としての出願明細書作成能力を分析することができる。
また、設定登録時において請求項により示される権利範囲の広さが適切な値ならば、いわゆる中間処理の時点において、不要な限定を請求項に加えずに特許査定が受けられているともいえる。したがって、設定登録時の請求項により示される権利範囲の広さを数値化すれば、中間処理に適切に対応し得る能力(中間処理対応能力)を分析することができる。
また、本発明の特許情報分析装置は、上記課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項により示される権利範囲の広さを数値化する請求項分析手段と、上記請求項分析手段にて数値化された権利範囲の広さを、同じ出願に関連する複数の特許明細書データの間で比較する第2の分析処理手段とを備えていることを特徴としている。
上記構成によれば、第2の分析処理手段により、数値化された権利範囲の広さを、同じ出願に関連する複数の特許明細書データの間で比較することによって、出願から登録までの間に発生する中間処理の対応能力等の権利取得能力について分析を行うことができる。
つまり、第2の分析処理手段により権利範囲の広さが比較される複数の特許明細書データを、たとえば、特許公開公報から得られる特許明細書データ、および特許登録公報から得られる特許明細書データというように、同じ出願において異なる時点に発行される特許明細書データとして設定する。
これにより、ある出願について審査が進むにつれて、権利範囲の広さがどれだけ変化しているかを、第2の分析処理手段にて比較した差分結果から客観的に判断することができる。よって、たとえば中間処理の段階で、余分な限定を加えず適切な請求項の補正が行えているかどうかを示す中間処理対応能力について、客観的かつ的確な分析を行うことができる。
この中間処理対応能力は、権利取得能力の一例をなすものであるから、上記構成によれば、権利取得能力について客観的かつ的確な分析を行うことができるといえる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記複数の特許明細書データが、出願番号に基づき特定されたものであることが好ましい。
上記構成によれば、出願番号に基づき同じ出願に関する複数の特許明細書データを特定するので、第2の分析処理手段が比較すべき特許明細書データを容易に特定することができる。これにより、中間処理対応能力を、より容易に分析することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記複数の特許明細書データが、公開特許公報から得られる特許明細書データ、および登録特許公報から得られる特許明細書データであることが好ましい。
上記構成によれば、公開特許公報から得られる特許明細書データに含まれる請求項により示される権利範囲の広さを、請求項分析手段により数値化することで、出願当初の請求項に係る権利範囲の広さを客観的に判断することができる。また、登録特許公報から得られる特許明細書データに含まれる請求項により示される権利範囲の広さを、請求項分析手段により数値化することで、設定登録時の請求項に係る権利範囲の広さを客観的に判断することができる。
よって、第2の分析処理手段により、公開特許公報に掲載された請求項に係る権利範囲を示す数値と、登録特許公報に掲載された請求項に係る権利範囲を示す数値とを比較することで、中間処理時に請求項の減縮がどの程度行われたかを客観的に判断することができ、中間処理対応能力をさらに的確に分析することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第2の分析処理手段にて比較した複数の差分結果を比較評価する際、同一の技術分野に関連する上記差分結果どうしを比較する第1の比較評価手段を備えていることが好ましい。
上述したとおり、異なる技術分野間では、請求項の文字数や発明特定事項の数の傾向が異なるので、この傾向の相違が、請求項分析手段により数値化される権利範囲の広さに影響を及ぼす場合がある。したがって、出願人や代理人別の権利取得能力を比較評価するために、第2の分析処理手段の差分結果を複数用意してそれらを比較評価する際、関連性が乏しい技術分野に関するものを比較しても、適切な評価ができない場合がある。
しかしながら、上記構成の特許情報分析装置では、第1の比較評価手段が、同一の技術分野に関連する第2の分析処理手段の差分結果を比較評価するので、より公平かつ適切に、出願人や代理人の権利取得能力を比較評価することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、出願が登録査定された割合を示す特許登録率のデータを用いて、上記第2の分析処理手段にて比較した差分結果の分析を行う第3の分析処理手段を備えていることを特徴としている。
上記構成によれば、特許登録率のデータを用いて第2の分析処理手段にて比較した差分結果を分析するので、出願人や代理人の特許取得戦略を評価することができる。
つまり、第2の分析処理手段による差分結果から、ある出願人からなされた出願について、請求項により示される権利範囲を示す数値が、中間処理時に大幅に増えていることが判断できているとする。このような場合、第3の分析処理手段により当該出願人の特許登録率が高いと判断された場合には、その出願人は、中間処理時点で大幅に請求項を限定してでも登録させる方針で、特許取得の戦略を立てていると分析することができる。
逆に、ある出願人からなされた出願について、請求項により示される権利範囲を示す数値が、中間処理時にそれほど増えていないことが判断できているとする。この場合、第3の分析処理手段により当該出願人の特許登録率が低いと判断されれば、その出願人は、中間処理時点で無理せず権利化できるものだけ登録させる方針で、特許取得の戦略を立てていると分析することができる。
なお、特許登録率とは、出願した件数に対してどの程度の件数が登録できたかという比率であり、たとえば1年間の特許登録率を計算するのであれば、1年間の登録件数/(1年間の登録件数+1年間の拒絶査定件数+1年間の取下および放棄件数)という計算式で、特許登録率を計算することができる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、出願が登録査定された割合を示す特許登録率のデータを用いて、上記第1の比較評価手段の比較結果の分析を行う第3の分析処理手段を備えていることが好ましい。
上記構成によれば、第3の分析処理手段により、特許登録率のデータを用いて、第1の比較評価手段による比較結果の分析を行うので、出願人や代理人の特許取得戦略を適切に比較評価することができる。
つまり、第1の比較評価手段が比較する対象は、第2の分析処理手段による差分結果であるから、第3の分析処理手段により第1の比較評価手段の比較結果の分析を行うことは、特許登録率のデータを用いて、第2の分析処理手段による差分結果を判断することに等しい。つまり、特許登録率のデータを用いて、第1の比較評価手段の比較結果を分析することにより、出願人や代理人の特許取得戦略を評価することができる。
ここで、第1の比較評価手段は、上述したとおり、同一の技術分野に関連する第2の分析処理手段の差分結果を比較評価するものであるから、第1の比較評価手段の比較結果は、出願人や代理人の特許取得戦略を比較評価するために好適なものである。
したがって、上記構成によれば、出願人や代理人の特許取得戦略を適切に比較評価することができる。
また、本発明の特許情報分析装置は、上記課題を解決するために、登録特許公報または公開特許公報を含む特許明細書データを分析する特許情報分析装置であって、上記特許明細書データの件数を集計するとともに、上記特許明細書データに対する注目度を示す注目度データにより上記特許明細書データの分析を行う第4の分析処理手段を備えていることを特徴としている。
上記構成によれば、特許明細書データの件数を集計するとともに、その特許明細書データに対する注目度を示す注目度データを用いて特許明細書データを分析することによって、出願人の権利取得能力について客観的に分析することができる。
すなわち、一般的に特許出願の件数(特許明細書データの合計件数)が多ければ特許力が強いと単純に判断されがちである。しかしながら、上記構成では、単に特許明細書データの合計件数だけに注目するのではなく、これらの特許明細書データはどれだけ他社(当該出願人以外)から注目を集めているかという注目度データを用いて、特許明細書データを分析する。
ここで、ある出願人が、他社からの注目度が高い出願を数多くなしているならば、その出願人は、今後の技術動向や他社の実施製品を見越してライセンス契約等につながる可能性がある出願を数多くなしており、権利取得能力が高いといえる。
よって、上記構成によれば、出願人がどれだけ重要な出願をなしえているかという観点から、出願人の権利取得能力を分析することが可能となる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第4の分析処理手段から得られる複数の分析結果を比較評価する際、同一の技術分野に関連する上記分析結果どうしを比較する第1の比較評価手段を備えていることが好ましい。
上述したとおり、異なる技術分野間では、請求項の文字数や発明特定事項の数の傾向が異なる。したがって、出願人や代理人別の権利取得能力を比較評価するために、第4の分析処理手段の比較結果を複数用意してそれらを比較評価する際、関連性が乏しい技術分野に関するものを比較しても、適切な評価ができない場合がある。
しかしながら、上記構成の特許情報分析装置では、第1の比較評価手段が、同一の技術分野に関連する第4の分析処理手段の比較結果を比較評価するので、より公平かつ適切に、出願人や代理人の権利取得能力を比較評価することができる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記注目度データが、異議申立または無効審判または再審査請求を受けた件数であることが好ましい。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記注目度データが、他の出願に係る発明の新規性または進歩性を否定するための引用文献、または明細書中に記載される先行技術文献として特許明細書データが引用された件数であってもよい。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記注目度データが、上記特許明細書データに含まれる記録事項の閲覧請求の件数であってもよい。
すなわち、他社から注目を集めている出願に関しては、他社から無効審判や異議申立または再審査請求がなされることも多い。よって、無効審判や異議申立または再審査請求の件数は、注目度データとして利用できるといえる。
さらに、他社から注目を集めている出願は、特許庁の審査段階において、先行技術文献として引用されることも多く、また出願人自らも従来技術文献として引用することも多くなる。よって、特許明細書データが、他の出願に係る発明の新規性または進歩性を否定するための引用文献、または明細書中に記載される先行技術文献として引用された件数も、注目度データとして利用できる。
また、他社から包袋(各出願について特許庁に提出された各種記録書類をまとめて保管したもの)を確認するための閲覧請求が行われた際には、異議申立または無効審判に繋がるような注目を集める案件であると考えられる。よって、特許明細書データに含まれる記録事項の閲覧請求の件数も、注目度データとして利用できる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記特許明細書データに含まれる請求項により示される権利範囲の広さを数値化する請求項分析手段を備えていることが好ましい。
上記構成によれば、請求項分析手段により権利範囲の広さが数値化されるので、出願人や代理人がどれだけ適切な権利範囲の請求項を作成しているかを判断することができる。よって、出願人や代理人の権利取得能力を、より的確に把握することができる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記請求項分析手段が、上記請求項のうち独立請求項を構成する文字数または単語数を数えることが好ましい。
上記構成によれば、請求項分析手段は、独立請求項を構成する文字数または単語数を数えることによって、請求項が示す権利範囲の広さを分析する。すなわち、請求項が示す権利範囲は、そこに記載された言葉(文字)で決められていくものであり、限定する言葉が多い場合には限定事項が増えるため、その分権利範囲が狭くなる傾向にあるが、逆に余分な限定事項を減らせば、権利範囲は広くなる傾向にある。このことからも明らかなように、独立請求項を構成する文字数または単語数を数えて、文字数または単語数が少なければ、権利範囲が広い可能性が高く、一方、文字数または単語数が多ければ権利範囲が狭い可能性が高いと分析することができる。
したがって、上記構成によれば、請求項により示される権利範囲の適切な評価が可能となる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記請求項分析手段が、上記請求項のうち独立請求項を構成する構成要件の数を数える構成であってもよい。
上記の構成によれば、請求項分析手段は、独立請求項を構成する構成要件の数を数えることによって、請求項が示す権利範囲の広さを分析する。すなわち、請求項が示す権利範囲は、そこに記載された発明特定事項を構成する複数の構成要件からなるものであり、構成要件の数が多い場合には限定事項が増えるため、その分権利範囲が狭くなる傾向にあるが、逆に構成要件の数を減らせば、権利範囲は広くなる傾向にある。
たとえば、(3)「Aと、Bとを備えた装置。」というAおよびBの2つの構成要件からなる請求項に対して、(4)「Aと、Bと、Cと、Dとを備えた装置。」というA〜Dの4つの構成要件からなる請求項を比較した場合、明らかに、構成要件数が少ない(3)請求項の方が権利範囲は広いと分析でき、一方、(4)請求項の方は(3)請求項よりも権利範囲が狭いと分析することができる。
したがって、上記構成によれば、請求項により示される権利範囲の適切な評価が可能となる。
さらに、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の比較評価手段が、上記特許明細書データに付与された実質的に同一の特許分類記号に基づき、技術分野の同一性を判断するものであることが好ましい。
上記構成によれば、第1の比較評価手段が、特許明細書データに付与された特許分類記号(たとえば、IPC(国際特許分類)、日本のFI(ファイルインデックス)、日本のFターム、または米国ではUSクラス 等)に基づき、技術分野の同一性を判断する。よって、正確かつ容易に、技術分野の同一性を判断することができる。
なお、「実質的に同一の特許分類記号」とは、記号としての表現上の違いはあるものの、実際には互いに同一のものとみなすことができる特許分類記号を意味する。たとえば、特許分類記号の一例であるIPCは、発明の分野の大枠を示す大項目、大項目よりもさらに分野を絞った中項目、および小項目を含んでいる。これにより、互いに大項目が同一であるが、中項目や小項目が異なる2つのIPCは、記号全体として表現上は完全に同一ではないが、示す分野は同一であるとみなすことができるため、実質的に同一の特許分類記号である。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の比較評価手段による比較評価の結果を、出願人別に出力装置に表示させる出力手段を備えていることが好ましい。
上記構成によれば、出力装置における表示内容を確認することで、出願人別の権利取得能力を、第1の比較評価手段による比較結果から一目で把握することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記第1の比較評価手段による比較評価の結果を、代理人別に出力装置に表示させる出力手段を備えていることが好ましい。
上記構成によれば、出力装置における表示内容を確認することで、代理人別の権利取得能力を、第1の比較評価手段による比較結果から一目で把握することができる。
また、本発明の特許情報分析装置は、上記構成の特許情報分析装置において、上記出力手段が、上記第1の比較評価手段が比較評価を行う際に用いた技術分野全体の出願人または代理人の平均的な権利取得能力を、出力装置に表示させることが好ましい。
上記構成によれば、同一技術分野の出願をなす出願人や代理人の平均的な権利取得能力を、出力装置の表示を確認することで把握できる。よって、出願人や代理人の権利取得能力を、業界平均の権利取得能力と比較評価することが可能となる。
また、本発明の特許情報分析方法は、上記課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析方法であって、上記請求項により示される権利範囲の広さを数値化する第1ステップと、上記第1ステップにより権利範囲の広さが数値化された特許明細書データの合計件数を集計し、その数値化された権利範囲の広さの平均値を算出する第2ステップとを備えていることを特徴としている。
また、本発明の特許情報分析方法は、上記課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析方法であって、上記請求項により示される権利範囲の広さを数値化する第1ステップと、上記第1ステップにて数値化された権利範囲の広さを、同じ出願に関連する複数の特許明細書データの間で比較する第2ステップとを備えていることを特徴としている。
また、本発明の特許情報分析方法は、上記課題を解決するために、登録特許公報または公開特許公報を含む特許明細書データを分析する特許情報分析方法であって、上記特許明細書データの件数を集計するとともに、上記特許明細書データに対する注目度を示す注目度データにより上記特許明細書データの分析を行うことを特徴としている。
上記構成の特許情報分析方法によれば、本発明の特許情報分析装置と同様の機能が実現されているので、本発明の特許情報分析装置と同様の作用効果を得ることができる。
以上のように、本発明では、特許明細書データを利用して、出願人の権利取得能力について客観的に分析することができる。
2.また、本発明は上記の課題を解決するためになされたものであり、その目的は、特許明細書の請求項に記載の発明が権利を行使しやすいものであるか否かを客観的に分析する特許情報分析装置、特許情報分析方法、特許情報分析プログラムおよび記録媒体を提供することにある。
本発明に係る特許情報分析装置は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較する文字列比較手段と、上記文字列比較手段による比較結果に基づき、上記請求項に記載されている発明の種類を判別する発明種判別手段とを備えていることを特徴としている。
上記の構成によれば、本装置は、特許明細書データの請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較することによって、上記請求項に記載されている発明の種類を判別する。一般に、特許権が権利を行使しやすいものであるか否かを、請求項に記載の発明の種類に基づき決定できることが知られている。したがって、本装置は、判別した発明の種類に基づき、分析対象の発明に関する特許権が、権利を行使しやすいものであるか否かを分析できる効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較する文字列比較ステップと、上記文字列比較ステップによる比較結果に基づき、上記請求項に記載されている発明の種類を判別する発明種判別ステップとを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
本発明に係る他の特許情報分析装置は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明に数値限定があることを特徴付ける文字列とを比較する文字列比較手段と、上記文字列比較手段による比較結果に基づき、上記請求項に記載されている発明が、数値限定発明であるか否かを判別する数値限定発明判別手段とを備えていることを特徴としている。
上記の構成によれば、本装置は、特許明細書データの請求項に含まれる文字列と、あらかじめ定められた、数値限定があることを特徴付ける文字列とを比較することによって、上記請求項に記載されている発明が、数値限定があることを特徴付ける文字列であるか否かを判別する。一般に、発明を特定する事項を数値や数式によって限定している発明であれば、その特許権を権利行使しにくいものであると決定できることが知られている。したがって、本装置は、判別した発明の種類に基づき、分析対象の発明に関する特許権が、権利を行使しやすいものであるか否かを分析できる効果を奏する。
本発明に係る他の特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明に数値限定があることを特徴付ける文字列とを比較する文字列比較ステップと、上記文字列比較ステップにおける比較結果に基づき、上記請求項に記載されている発明が、数値限定発明であるか否かを判別する数値限定発明判別ステップとを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
本発明に係る他の特許情報分析装置は、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較することによって、上記請求項に記載されている発明の種類を判別する発明種判別手段と上記請求項に含まれる文字列と、あらかじめ定められた、発明に数値限定があることを特徴付ける文字列とを比較することによって、上記請求項に記載されている発明が、数値限定発明であるか否かを判別する数値限定発明判別手段とを備えていることを特徴としている。
上記の構成によれば、本装置は、特許明細書データの請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較することによって、上記請求項に記載されている発明の種類を判別する。さらに、特許明細書データの請求項に含まれる文字列と、あらかじめ定められた、数値限定があることを特徴付ける文字列とを比較することによって、上記請求項に記載されている発明が、数値限定があることを特徴付ける文字列であるか否かを判別する。一般に、特許権が権利を行使しやすいものであるか否かを、請求項に記載の発明の種類に基づき決定できることが知られている。さらに、発明を特定する事項を数値や数式によって限定している発明であれば、その特許権を権利行使しにくい発明であると決定できることが知られている。
このように、本装置は、分析対象の発明の種類を判別するとともに、その発明が数値限定発明であるか否かを判別する。これにより、本装置は、分析対象の発明が権利を行使しやすいものであるか否かを、より正確に分析できる効果を奏する。
本発明に係る他の特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較することによって、上記請求項に記載されている発明の種類を判別する発明種判別ステップと上記請求項に含まれる文字列と、あらかじめ定められた、発明に数値限定があることを特徴付ける文字列とを比較することによって、上記請求項に記載されている発明が、数値限定発明であるか否かを判別する数値限定発明判別ステップとを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記請求項が独立請求項であることが好ましい。
上記の構成によれば、本装置は、独立請求項に係る発明の種類を判別する。一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。これにより、本装置は、より権利範囲の広い発明に関する請求項を分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記独立請求項は、上記特許明細書データの特許請求の範囲における最初の請求項であることが好ましい。
上記の構成によれば、本装置は、特許明細書データの特許請求の範囲における最初の請求項、すなわち請求項1に記載の発明の種類を判別する。一般に、特許請求の範囲において最初に記載される請求項1は、1つの特許明細書において、もっとも重要な発明に関する請求項である可能性が高い。すなわち、特許明細書において、独立請求項は、もっとも重要なメインの請求項となりうる。したがって、本装置は、特許明細書データに記載されている発明のうち、もっとも重要な発明の種類を判別できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記発明の種類を特徴付ける文字列は、物の発明であることを特徴付ける文字列であり、上記発明種判別手段は、上記請求項に記載されている発明を物の発明に判別することが好ましい。このとき、さらに、上記物の発明であることを特徴付ける文字列は、日本の特許明細書(日本語)の場合、装置、機器、デバイス、回路、システム、プログラム、および記録媒体の少なくともいずれかであることが好ましい。また、米国の特許明細書(英語)の場合には、apparatus等の物の発明であることを特徴付ける単語(文字列)であってもよい。なお、本発明に係る特許情報分析装置は、このような日本語及び英語表記に限らず、各国の特許明細書に合わせて、その国の言語で物の発明であることを特徴付ける単語(文字列)を判別するようにしてもよい。上記の構成によれば、本装置は、請求項に記載の発明が物の発明であることを、確実に判別できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記発明の種類を特徴付ける文字列は、方法の発明であることを特徴付ける文字列であり、上記発明種判別手段は、上記請求項に記載されている発明を方法の発明に判別することが好ましい。このとき、さらに、上記方法の発明であることを特徴付ける文字列は、日本の特許明細書(日本語)の場合、方法、製法、およびプロセスの少なくともいずれかであることが好ましい。また、米国の特許明細書(英語)の場合には、process等の方法の発明であることを特徴付ける単語(文字列)であってもよい。なお、本発明に係る特許情報分析装置は、このような日本語及び英語表記に限らず、各国の特許明細書に合わせて、その国の言語で物の発明であることを特徴付ける単語(文字列)を判別するようにしてもよい。上記の構成によれば、本装置は、請求項に記載の発明が方法の発明であることを、確実に判別できる。
また、本発明に係る特許情報分析装置では、さらに、上記発明種判別手段は、上記方法の発明であることを特徴付ける文字列が、上記請求項に記載されていない発明を、物の発明に判別することが好ましい。このとき発明種判別手段は、方法の発明であると判別しない発明を、物の発明であると判別する。すなわち、一般に、請求項に方法の発明であることを特徴付ける文字列が記載されている場合、そのような請求項に係る発明を、ほぼ確実に方法の発明であると判別できる。したがって、それ以外の発明を物の発明であると判別することによって、本装置は、請求項に記載されている発明が、物の発明であることをより確実に判別できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記数値限定があることを特徴付ける文字列は、単位を表す記号や、数式を表す記号や、数量の程度を表す記号であることが好ましい。上記の構成によれば、本装置は、請求項に記載の発明が数値限定発明であることを、確実に判別できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記発明種判別手段が判別した発明の数をカウントする発明数カウント手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、どのくらいの数の請求項が、権利行使しやすい発明に関するものであるか、または、権利行使しにくい発明に関するものであるかを分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記数値限定発明判別手段が判別した数値限定発明の数をカウントする数値限定発明数カウント手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、どのくらいの数の請求項が、権利行使しやすい発明に関するものであるか、または、権利行使しにくい発明に関するものであるかを分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記発明数カウント手段による発明のカウント結果に基づき、上記特許明細書データを評価する第2の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、発明の種類の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、権利行使しやすい発明の数や、権利行使しにくい発明の数に基づき、特許明細書データを評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記数値限定発明数カウント手段による数値限定発明のカウント結果に基づき、上記特許明細書データを評価する第2の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、数値限定発明の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、権利行使しやすい発明の数や、権利行使しにくい発明の数に基づき、特許明細書データを評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記発明数カウント手段は、上記発明種判別手段による分析結果のうち、同一分野の特許明細書データの請求項に記載されている発明の数をカウントすることが好ましい。
一般に、分野が異なれば、発明の種類を物の発明にするか、または、方法の発明にするかの判断基準が、大きく異なってくる可能性がある。そのため、ある分野では70%の発明が物の発明であるが、別の分野では20%の発明が物の発明である、などのように、発明の種類の構成比率が大きく変化する可能性がある。
そこで本装置は、同一分野の特許明細書データの請求項に記載されている発明の数をカウントする。これにより、本装置は、分析対象の特許明細書データを、より公平かつ客観的に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記数値限定発明数カウント手段は、上記数値限定発明判別手段による分析結果のうち、同一分野の特許明細書データの請求項に記載されている数値限定発明の数をカウントすることが好ましい。
一般に、分野が異なれば、発明の種類を数値限定発明にするか、または、数値限定がなされていない発明にするかの判断基準が、大きく異なってくる可能性がある。そのため、ある分野では15%の発明が数値限定発明であるが、別の分野では75%の発明が数値限定がなされていない発明である、などのように、発明の種類の構成比率が大きく変化する可能性がある。
そこで本装置は、同一分野の特許明細書データの請求項に記載されている数値限定発明の数をカウントする。これにより、本装置は、分析対象の特許明細書データを、より公平かつ客観的に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記同一分野の特許明細書データとは、実質的に同一の特許分類記号が付与されている特許明細書データであることが好ましい。
上記の構成によれば、本装置は、実質的に同一の特許分類記号が付与されている特許明細書データを分析する。ここで、特許分類記号とは、たとえば、日本の特許出願明細書であれば、特許明細書に付与されているIPC(国際特許分類)または日本独自の特許分類であるFI(ファイルインデックス)並びにFターム等を意味する。また、米国特許出願明細書であれば、USクラスを意味する。これにより、本装置は、分析対象の特許明細書データがどの分野に属するのかを、正確かつ容易に決定できる効果を奏する。
なお、「実質的に同一の特許分類記号」とは、記号としての表現上の違いはあるものの、実際には互いに同一のものとみなすことができる特許分類記号を意味する。たとえば、特許分類記号の一例であるIPCは、発明の分野の大枠を示す大項目、大項目よりもさらに分野を絞った中項目、および小項目を含んでいる。これにより、互いに大項目が同一であるが、中項目や小項目が異なる2つのIPCは、記号全体として表現上は完全に同一ではないが、示す分野は同一であるとみなすことができるため、実質的に同一の特許分類記号である。
また、本発明に係る特許情報分析装置では、さらに、上記発明数カウント手段は、上記発明種判別手段による分析結果のうち、発明の数を特許明細書データの出願人別にカウントすることが好ましい。
上記の構成によれば、本装置は、発明の数を特許明細書データの出願人別にカウントする。これにより、本装置は、出願人が保有している特許権について、出願人別に相対的に比較評価できる効果を奏する。
また、本発明に係る特許情報分析装置は、上記第2の比較評価手段による比較評価の結果を、出願人別に出力装置に表示させる出力手段をさらに備えていることが好ましい。
上記構成によれば、出力装置における表示内容を確認することで、権利行使しやすい発明の数や、権利行使しにくい発明の数を、出願人別に一目で把握することができる効果を奏する。
以上のように、本発明によれば、特許明細書の請求項に記載の発明が権利を行使しやすいものであるか否かを客観的に分析する効果を奏する。
3.また、本発明は上記の課題を解決するためになされたものであり、その目的は、発明に係る特許(または実用新案)の特許請求の範囲(または実用新案登録請求の範囲)の広さを客観的に分析する特許情報分析装置、特許情報分析方法、特許情報分析プログラムおよび記録媒体を提供することにある。
本発明に係る特許情報分析装置は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に記載されている発明を特定することに直接関わらない、形式的な文字列の少なくとも一部を、上記請求項から削除する発明非特定事項文字削除手段と、上記少なくとも一部の形式的な文字列が削除された請求項に含まれる文字の数をカウントする発明特定事項文字数カウント手段とを備えていることを特徴としている。
上記の構成によれば、本装置は、特許明細書データに含まれる請求項に記載されている発明を特定することに直接関わらない形式的な文字列の少なくとも一部を、上記請求項から削除する。
このとき、本装置は、日本の特許明細書における形式的な文字列として、「読点記号(、)」、「句点記号(。)」、「カンマ(,)」、「セミコロン(;)」、「コロン(:)」「(スペース文字)」などの記号類や、「該」、「前記」、「上記」、「下記」、「この」、「これらの」等の、先行する他の用語を引用したり、あとに出てくる他の用語を指し示したりする指示語や、「ことを特徴とする」、「ことを特徴とした」、「ことが特徴である」等の、請求項の記載に形式的に用いられるのみであり、発明を特定する用語として機能していない形式文字列を削除する。
さらに、本装置は、これらの文字列の少なくとも1つを削除したあと、請求項に含まれる文字の数をカウントする。これにより、本装置は、より正確に、発明特定事項の文字の数をカウントできる。
一般に、特許明細書に含まれる請求項の書き方は、出願人によって様々に異なる。たとえば、読点記号「、」が非常に多い請求項や、「前記」が非常に多い請求項がある一方、これらの文字が少ない請求項もある。そこで本装置は、請求項の文字の数をカウントするときに、これらの形式文字列による影響をより少なくすることができる。
また、一般に、特許請求の範囲の広さは、請求項に記載されている文字の数に比例することが知られている。たとえば、40文字からなる請求項と、100文字からなる請求項を比較した場合、前者の方が、後者に比べて、より権利範囲が広いといえる。すなわち、請求項が示す権利範囲は、そこに記載された言葉(文字)で決められていくものであり、限定する言葉が多い場合には限定事項が増えるため、その分権利範囲が狭くなる傾向にあるが、逆に余分な限定事項を減らせば、権利範囲は広くなる傾向にある。このことからも明らかなように、請求項の文字数を数えて、文字数が少なければ、権利範囲が広い可能性が高く、一方、文字数が多ければ権利範囲が狭い可能性が高いと分析することができる。
以上のことから、本装置は、日本の特許明細書の請求項に記載されている発明に係る特許請求の範囲の広さを、より正確かつ客観的に分析できる効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に記載されている発明を特定することに直接関わらない、形式的な文字列の少なくとも一部の上記形式的な文字列を、上記請求項から削除する発明非特定事項文字削除ステップと、上記少なくとも一部の形式的な文字列が削除された上記請求項に含まれる文字の数をカウントする発明特定事項文字数カウントステップとを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
本発明に係る特許情報分析装置は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれる文字列と、あらかじめ定められた、所定の発明構成要件検索文字列とを比較することによって、上記請求項に含まれている発明構成要件を上記特許明細書データから抽出する発明構成要件抽出手段と、上記発明構成要件抽出手段が抽出した発明構成要件の数をカウントする発明構成要件数カウント手段とを備えていることを特徴としている。
上記の構成によれば、本装置は、請求項に含まれる文字列と、あらかじめ定められた、所定の発明構成要件検索文字列とを比較することによって、請求項に含まれている発明構成要件を抽出し、その数をカウントする。一般に、特許請求の範囲は、請求項に含まれる発明構成要件の数に比例して狭くなることが知られている。たとえば、日本の特許明細書の請求項において、(5)「Aと、Bとを備えた装置。」というAおよびBの2つの構成要件からなる請求項に対して、(6)「Aと、Bと、Cと、Dとを備えた装置。」というA〜Dの4つの構成要件からなる請求項を比較した場合、構成要件数が少ない(5)請求項の方が権利範囲は広いと分析でき、一方、(6)請求項の方は(5)請求項よりも権利範囲が狭いと分析することができる。
したがって、本装置は、請求項に含まれる発明構成要件の数をカウントすることによって、分析対象の請求項に係る特許請求の範囲の広さを、客観的に分析できる効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれる文字列と、あらかじめ定められた、所定の発明構成要件検索文字列とを比較することによって、上記請求項に含まれている発明構成要件を上記特許明細書データから抽出する発明構成要件抽出ステップと上記発明構成要件抽出ステップにおいて抽出した発明構成要件の数をカウントする発明構成要件数カウントステップとを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
本発明に係る特許情報分析装置は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれている上位概念用語を上記特許明細書データから抽出する上位概念用語抽出手段を備えていることを特徴としている。
上記の構成によれば、本装置は、請求項を構成する文字列中から上位概念用語を抽出することによって、請求項が示す権利範囲の広さを分析することができる。すなわち、請求項が示す権利範囲は、そこに記載された言葉で決められていくものであり、特に発明を広く表現した上位概念用語が用いられた請求項であれば、権利範囲は広くなる傾向にある。そこで、独立請求項を構成する文字列中に上位概念用語があるか否かについて確認することにより、特許請求の範囲が広いか否かを分析することができる。たとえば、日本の特許明細書における請求項中に、「バネ」や「ゴム」等の用語が用いられるのではなく、それらの上位概念である「弾性体」等の用語が用いられていることが抽出できれば、特許請求の範囲がより広い可能性が高いと分析することができる。
このように、本装置は、請求項に記載されている発明に係る特許請求の範囲の広さを、客観的に分析できる効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれている上位概念用語を上記特許明細書データから抽出する上位概念用語抽出ステップを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを分析する特許情報分析装置であって、上記請求項に含まれている少なくともスペース文字の数をカウントすることによって、上記請求項に含まれている単語の数をカウントする単語数カウント手段を備えていることを特徴としている。
上記の構成によれば、本装置は、特に米国特許等の英文で構成される請求項において、請求項のうち独立請求項を構成する文字の中で、単語と単語との間の空白の部分であるスペース文字の数を数えることによって、スペース文字で区切られている単語の数を数えることができる。これにより、請求項が示す権利範囲の広さを客観的に分析することができる。すなわち、英文の請求項が示す権利範囲は、そこに記載された言葉(単語)で決められていくものであり、限定する単語が多い場合には限定事項が増えるため、その分権利範囲が狭くなる傾向にある。逆に余分な限定事項を減らせば、権利範囲は広くなる傾向にある。
そこで本装置は、米国の特許明細書における請求項を構成する文字の中でスペース文字の数(すなわち単語数)を数えて、スペース文字の数が少なければ、単語数が少ないため権利範囲が広い可能性が高く、一方、スペース文字の数が多ければ、単語数が多いため権利範囲が狭い可能性が高いと分析することができる。
このように、本装置は、請求項に記載されている発明に係る特許請求の範囲の広さを、客観的に分析できる効果を奏する。
本発明に係る特許情報分析方法は、上記の課題を解決するために、請求項を含む特許明細書データを処理する特許情報分析装置において、特許明細書データを分析する特許情報分析方法であって、上記請求項に含まれている少なくともスペース文字の数をカウントすることによって、上記請求項に含まれている単語の数をカウントする単語数カウントステップを含んでいることを特徴としている。
上記の方法によれば、本発明の特許情報分析装置と同様の作用効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記請求項が独立請求項であることが好ましい。
上記の構成によれば、本装置は、独立請求項に係る特許請求の範囲の広さを分析する。一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。これにより、本装置は、より権利範囲の広い発明に関する請求項を分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記独立請求項は、上記特許明細書データの権利範囲における最初の請求項であることが好ましい。
上記の構成によれば、本装置は、特許明細書データの権利範囲における最初の請求項、すなわち請求項1に記載の発明に係る特許請求の範囲の広さを分析する。一般に、特許請求の範囲において最初に記載される請求項1は、1つの特許明細書において、もっとも重要な発明に関する請求項に位置づけられる可能性が高い。すなわち、特許明細書において、独立請求項は、もっとも重要なメインの請求項となりうる。したがって、本装置は、特許明細書データに記載されている発明のうち、もっとも重要な請求項に係る権利範囲の広さを分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記発明構成要件抽出手段が抽出した発明構成要件に含まれる文字の数をカウントする発明構成要件文字数カウント手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、発明構成要件に含まれる文字の数をカウントする。これにより、本装置は、カウントした文字の数に基づき、数が多ければ権利範囲が狭く、少なければ広いなどのように、特許請求の範囲を客観的に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記上位概念用語抽出手段が抽出した上位概念用語の数をカウントする上位概念用語数カウント手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、請求項に含まれる上位概念用語の数をカウントする。一般に、上位概念用語を多く含んでいるほど、特許明細書の請求項に係る発明は、より請求の範囲が広いと分析できる。したがって、本装置は、請求項に含まれる上位概念用語の数をカウントすることによって、請求項に係る特許請求の範囲の広さについて、よりいっそう客観的に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、外部からのデータ入力を受け付ける入力手段をさらに備えており、上記発明非特定事項文字削除手段は、上記入力手段を通じて入力された上記形式的な文字列の少なくとも一部を、上記請求項から削除することが好ましい。
上記の構成では、ユーザが発明構成要素非特定文字を任意に指定することができるので、本装置は、分析対象とする特許明細書の技術分野などの違いに合わせて、削除する文字を調整することが可能となる。したがって、より状況に応じたきめ細かい分析を行うことができる。
また、本発明に係る特許情報分析装置では、さらに、上記発明特定事項文字数カウント手段によるカウント結果に基づき、上記特許明細書データを評価する第3の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、発明構成要素非特定文字の少なくとも一部を除いた請求項の文字の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、請求項の文字の数の多少に基づき、特許明細書データを互いに比較し評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記発明構成要件数カウント手段によるカウント結果に基づき、上記特許明細書データを評価する第3の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、請求項に含まれる発明構成要件の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、発明構成要件の数の多少に基づき、特許明細書データを互いに比較し評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記発明構成要件文字数カウント手段によるカウント結果に基づき、上記特許明細書データを評価する第3の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、請求項に含まれる発明構成要件の文字の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、発明構成要件の文字の数の多少に基づき、特許明細書データを互いに比較し評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、上記上位概念用語数カウント手段によるカウント結果に基づき、上記特許明細書データを評価する第3の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、請求項に含まれる上位概念用語の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、上位概念用語の数の多少に基づき、特許明細書データを互いに比較し評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記単語数カウント手段によるカウント結果に基づき、上記特許明細書データを評価する第3の比較評価手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、請求項に含まれる単語の数に基づき、特許明細書データを評価する。したがって、分析対象として複数の特許明細書データを分析するとき、単語の数の多少に基づき、特許明細書データを互いに比較し評価できる。これにより、本装置は、特許明細書データの価値を客観的に評価できる効果を奏する。
上記第3の比較評価手段は、ある分野の特許明細書データにおけるカウント結果と、この特許明細書データの分野と同一分野の特許明細書データにおけるカウント結果とを評価することによって、これらの特許明細書データを評価する。
一般に、分野が異なれば、請求項の記載の仕方や発明特定事項の内容が大きく異なってくる可能性がある。たとえば、液晶ディスプレイ関連の技術分野の中でも(7)駆動技術(日本独自の特許分類Fターム2H093)の請求項と、(8)基板、絶縁膜および配向部材に関する技術(日本独自の特許分類Fターム2H090)の請求項とを比較した場合、平均文字数は、(7)技術の請求項の文字数の方が、回路構成や駆動手順等の発明特定事項が一般的に多くなる傾向にあるため、(8)技術の請求項の文字数よりも多くなっている。上記の例では日本独自の特許分類について説明したが、国際的な特許分類であるIPC分類または米国独自の特許分類であるUSクラスによって、(7)駆動技術の特許と(8)基板、絶縁膜および配向部材に関する技術の特許との平均文字数を比較した場合においても、(7)の技術の特許の方が回路構成や駆動手順等の発明特定事項が一般的に多くなる傾向にあるという結果は同じである。
そこで、このような(7)技術の特許と(8)技術の特許とを同列に比較分析するよりも、特定の同分野の特許明細書同士を比較する方が、より公平に信頼性の高い分析結果を得ることができる。
したがって、本装置は、ある分野の特許明細書データにおけるカウント結果と、この特許明細書データの分野と同一分野の特許明細書データにおけるカウント結果とを評価することによって、複数の特許明細書データを、より公平かつ客観的に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記同一分野の特許明細書データとは、実質的に同一の特許分類記号が付与されている特許明細書データであることが好ましい。
上記の構成によれば、本装置は、実質的に同一の特許分類記号が付与されている特許明細書データを分析する。なお「特許分類記号」および「実質的に同一の特許分類記号」の意味は上述のとおりである。
これにより、本装置は、分析対象の特許明細書データがどの分野に属するのかを、正確かつ容易に決定できる効果を奏する。
また、本発明に係る特許情報分析装置は、上記第3の比較評価手段による比較評価の結果を、出願人別に出力装置に表示させる出力手段をさらに備えていることが好ましい。
上記構成によれば、出力装置における表示内容を確認することで、権利範囲の広い発明の数や、権利範囲の狭い発明の数を、出願人別に一目で把握することができる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記カウント結果を、カウント数の多い順または少ない順に順位付けする順位付け手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、上記カウント結果を、カウント数の多い順または少ない順に順位付けする。このように本装置は、大量の特許明細書から、特許権の強さ(特許請求の範囲の広さ)に関する情報を抽出できる。すなわち、ユーザは、大量の特許明細書データから、必要なものと、必要でないものとを、効率的に見極めることができる。
たとえば、ユーザは、文字の数の少ない請求項1を含む特許明細書の情報を確認することによって、他社へ活用しやすい、有力な特許明細書から順に確認できる。逆に、文字列の多い請求項1を含む特許明細書の情報を確認することによって、特許請求の範囲が狭く、他社へ有効活用し難い特許権から、順に確認できる。これにより、ユーザは、権利範囲が狭く、活用しづらい特許権の棚卸し作業を、効率的に進めることができる。すなわち、不要であり放棄してもよい特許権を、効率的に検索できる。
また、本発明に係る特許情報分析装置では、さらに、上記請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較することによって、上記請求項に記載されている発明の種類を判別する第2の発明種判別手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、たとえば、物の発明に関するものと判別した請求項データから、発明構成要素非特定文字を削除することができる。これにより、本装置は、より特許請求の範囲の広い特許明細書の請求項について分析できるため、特許明細書データをより詳細に分析できる効果を奏する。
また、本発明に係る特許情報分析装置では、さらに、上記請求項に含まれる文字列と、あらかじめ定められた、発明に数値限定があることを特徴付ける文字列とを比較することによって、上記請求項に記載されている発明が、数値限定発明であるか否かを判別する第2の数値限定発明判別手段をさらに備えていることが好ましい。
上記の構成によれば、本装置は、たとえば、数値限定がなされていない発明に関するものと判別した請求項データから、発明構成要素非特定文字を削除することができる。これにより、本装置は、より特許請求の範囲の広い特許明細書の請求項について分析できるため、特許明細書データをより詳細に分析できる。
なお、上記特許情報分析装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記特許情報分析装置をコンピュータにおいて実現する特許情報分析プログラム、およびその特許情報分析プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係る特許情報分析装置によれば、特許明細書データの請求項に記載されている発明に係る特許請求の範囲の広さを、客観的に分析できる効果を奏する。
以下、本発明の実施形態について、図面を参照して説明する。
特許明細書は、複数の請求項を含んでいることが多くあり、一般に、特許請求の範囲において最初に記載される請求項1が、もっとも重要な発明に関する請求項である可能性が高い。すなわち、特許明細書において、請求項1は、もっとも重要なメインの請求項となりうる。そこで、以下に示す実施形態の特許情報分析装置は、メイン請求項である請求項1のみを分析対象として説明する。
〔第1の実施形態〕
<1.装置構成>
本発明の一実施形態として、出願時または登録時における出願人の権利取得能力を分析する特許情報分析装置および特許情報分析方法について、図1〜4を用いて説明する。
図1は、本実施形態に係る特許情報分析装置1の構成を示すブロック図である。図1に示すように、特許情報分析装置10は、入力部20と、データ処理部50と、出力部(出力手段)30と、記憶部40とを備えている。
入力部20は、入力インターフェイスとして機能するものであり、キーボード等により構成される。
データ処理部50は、各種のデータ処理を行うものであり、より具体的には、請求項分析処理部(請求項分析手段)60と、第1の分析処理部(第1の分析処理手段)61と、比較評価部(第1の比較評価手段)80とを備えている。これらのデータ処理部50を構成する各ブロックの機能については、後述する。
出力部30は、データ処理部50におけるデータ処理の結果を出力装置に出力するためのものであり、出力装置はモニターやプリンター等により構成される。
記憶部40は、各種特許明細書データをテキスト形式等のデータとしてあらかじめ格納している。たとえば記憶部40は、特許明細書データとして、特許庁発行の公開特許公報データを格納している。他にも、登録特許公報、および登録実用新案公報を格納しているものでもよい。または、自社で活用している特許明細書データを格納してもよい。記憶部40は、このようなデータを格納するCD−ROMやDVD−ROMまたはハードディスクであればよい。
次に、データ処理部50を構成する各ブロックの機能について、より具体的な説明をする。
請求項分析処理部60は、請求項に係る発明の技術的範囲(以下、単に権利範囲という)の広さを数値化するものである。より具体的には、請求項分析処理部60は、請求項のうち独立請求項である請求項1を構成する文字の数を数えることにより、権利範囲の広さを数値化する。
第1の分析処理部61は、請求項分析処理部60により権利範囲の広さが数値化された請求項の数を集計するとともに、請求項分析処理部60にて数値化された権利範囲を示す数値の平均値を算出するものである。
比較評価部80は、同じ技術分野に関連する出願にかかる特許明細書データ同士を比較するものである。
次に、図1に示す特許情報分析装置の動作について説明する。
まず、入力部20を介して、分析対象とする案件を特定するための番号(出願番号、公開番号、登録番号等)を入力する。そして、入力部20から入力された番号に基づいて、データ処理部50は、分析対象の案件に係る特許明細書データを、テキスト形式のデータとして、記憶部40から読み出す。
そして、請求項分析処理部60は、データ処理部50により読み出された特許明細書データに含まれる独立請求項である請求項1の部分について、テキスト形式のデータに含まれる文字数または単語数を数える。日本語の場合、たとえば、特許明細書データがシフトJISコードによるテキスト形式のデータであれば、全角1文字が2バイトで示されるので、対象データのバイト数を数えることにより、文字数を数えることができる。英語の場合、テキスト形式のデータであれば、1文字が1バイトで示されるので、対象データのバイト数を数えることにより、文字数を数えることができる。または、スペース、ピリオド、コンマ、コロン、セミコロンの数を数えることにより、単語数をほぼ正確に推測することができる。
次に、第1の分析処理部61では、入力部20に入力された特許明細書データの件数を集計するとともに、請求項分析処理部60にて数えた文字数の平均値を算出する。
そして、第1の分析処理部61による処理結果は、出力部30から出力装置に出力され、モニター表示またはプリンターで印刷等される。
また、複数の特許明細書データにおける請求項が示す権利範囲の広さを相対比較する際、比較評価部80は、特定の技術分野に属する複数の特許明細書データ同士を比較する。このような相対比較を行う場合には、予め入力部20を介して、複数の特許明細書データの特許番号を入力したり、同じセクションやサブグループに属するIPCを指定したりすることにより、複数の特許明細書データを入力する。そして、複数の特許明細書データについて、請求項分析処理部60により、請求項の部分の文字数を数えておく。
そして、比較評価部80において、ユーザに指定されたIPC、FIまたはFターム等の実質的に同一の特許分類記号に基づき、技術分野が共通する複数の特許明細書データを抽出する。さらに、比較評価部80を用いて、抽出された複数の特許明細書データのそれぞれに含まれる、請求項の文字数の平均値を求める。これにより、同じ業界から出願された発明に係る請求項の文字数を評価することができる。
そして、比較評価部80は、同業界の請求項に係る文字数の平均値に対して、自社保有特許または他社保有特許の文字数の多少を相対比較し、各社の特許力等の比較評価を行う。そして、比較評価部80は、その比較評価結果を出力部30に出力する。
<2.動作フロー>
次に、図2を参照しつつ、データ処理部50の動作についてより具体的に説明する。なお、図2の(a)部分は、データ処理部50にて文字数を数えて各種処理を行う際のフローチャートであり、図2の(b)〜(d)部分は、作業用メモリー(データ処理部50内の図示していないメモリー)内に格納されるデータ構造を示しており、図2の(e)部分は、出力部30からの出力に基づく、出力装置の表示画面の一例を示す図である。
まず、図2の(a)部分に示すように、データ処理部50は、入力部20から調査対象とする特許番号等が入力されると、その特許番号等に基づいて、対象特許の特許明細書データの請求項部分を日本語のテキスト形式のデータとして記憶部40から読み出し、図示しないデータ処理部50内の作業用メモリーに格納する(S1)。この際、作業用メモリー内に格納されるデータ構造の例は、図2の(b)部分に示すとおりである。
次に、請求項分析処理部60は、作業用メモリー内のデータから、請求項1に関する文字列だけを抽出するために、作業メモリー内のデータに請求項2以降が存在するか否かを検索する(S2)。
S2における検索は、たとえば、請求項2の存在を示す文字列“[請求項2]”が、作業用メモリー内のデータに含まれるかどうかを検索することにより実現可能である。
なお、“[”の文字は、
文字列“[請求項2]”が検索の結果見つかった場合には、請求項分析処理部60は、文字列“[請求項2]”を含め、それ以降の全ての文字列を削除する(S3)。このことにより、請求項1に関する文字列だけが抽出される。なお、S3の処理が終了したら、作業メモリー内には、たとえば図2の(c)部分に示すような構造のデータが格納される。
なお、文字列をテキスト形式のデータの中から検索するには、検索対象の文字列を予め図示しない検索文字用のメモリーに記憶させておき、その文字列と、作業用メモリー内のデータの文字列とを、パターンマッチング等の文字検索技術を用いて照合すればよい。
さらに、請求項分析処理部60は、S3の処理が終了したら、作業用メモリー内のデータに含まれる文字数を数える(S4)。
たとえば、作業用メモリー内のデータが、シフトJISコードによる日本語のテキスト形式のデータであれば、全角1文字は2バイトのデータ量なので、対象とするデータのデータ量を調べることにより文字数を数えることができる。つまり、対象とするデータ量が200バイトであれば、そのデータに含まれる文字数は100文字であると判断できる。
S4の処理が終了したら、第1の分析処理部61は、請求項分析処理部60が文字数を数えた特許明細書データの件数、特許番号、請求項の文字数等の集計を行う(S5)。集計結果は、作業用メモリーに、図2の(d)部分に示すようなデータ構造にて格納される。
図2の(d)部分に示されるデータ構造においては、1件分の特許明細書データについてデータ処理部50によるデータ処理が行われた結果が、通し番号、特許番号、請求項1の文字数(請求項分析処理部60からの出力)の順で、コンマ(,)で区切られて格納されている。また、特定の特許明細書データについての項目と、それ以外の特許明細書データについての項目とは、改行文字で区切られている。
S5の後、第1の分析処理部61は、複数の特許明細書データのそれぞれについて、作業用メモリー内に格納された、請求項1の文字数の平均値を算出する(S6)。
そして、出力部30は、第1の分析処理部61の分析結果である特許明細書データの合計件数および平均文字数の出力を行う(S7)。出力部30からの出力に基づく出力装置の表示画面の一例を、図2の(e)部分に示す。
以上のS1〜S7を踏むことにより、データ処理部50により複数の特許明細書データのそれぞれについて請求項1の文字数がカウントされ、そのカウント結果が出力部30により出力される。
次に、複数の特許明細書データのそれぞれに含まれる請求項が示す権利範囲の広さを相対比較して分析する際のフローについて、図3を用いて説明する。
図3の(a)部分は、複数の特許明細書データのそれぞれに含まれる請求項により示される権利範囲の広さが、比較評価部80により相対比較されて分析されるフローチャートである。また、図3の(b)〜(e)部分は、作業用メモリー(データ処理部50内の図示していないメモリー)内のデータ構造の例を示すものである。
複数の特許明細書データを相対比較する際には、まず、作業用メモリーに、図3の(b)部分に示すようなデータを準備する。
すなわち、図3の(b)部分に示すデータ構造においては、1件分の特許明細書データについての項目が、通し番号、特許番号、Fターム、出願人名、請求項1の文字数の順でコンマ(,)で区切られて、作業用メモリーに格納されている。また、特定の特許明細書データについての項目と、それ以外の特許明細書データについての項目とは、改行文字により区切られている。
なお、これらの項目は、予め入力部20から複数の特許明細書データの特許番号を入力したり、またはIPC等を用いて特定の技術分野を指定したりして、複数の特許明細書データを入力しておき、さらに、請求項分析処理部60により各特許明細書データに含まれる請求項の文字数を数えておくことで格納可能となる。
まず、比較評価部80は、図3の(b)部分に示すデータより、予め指定された特定の技術分野(本実施形態ではFターム:2H090)の特許明細書データだけを抽出して、作業用メモリーに格納する(S10)。この際、作業用メモリーには、たとえば図3の(c)部分に示すような構造のデータが格納される。
さらに、比較評価部80は、各出願人が保有する特許の保有件数および請求項の文字数の多少を相対比較するために、各出願人の特許明細書データの合計件数、および出願人毎の平均文字数を求める(S11)。この際、作業用メモリーには、図3の(d)部分に示すように、出願人名、合計件数、請求項1の平均文字数が、この順で、コンマ(,)で区切られて格納される。
そして、比較評価部80は、各出願人についての請求項1の文字数や、合計件数を相対比較する(S12)。すなわち、比較評価部80は、請求項1の文字数が少なく、次いで合計件数が多い出願人が上位になるように、出願人の順位をつける。本実施形態では、比較評価部80は、最も平均文字数が少ないA社を1位として、次いでC社、B社と順位付けしている。なお、S12の相対比較が行われた後、作業用メモリー内のデータは、図3の(d)部分に示すように、順位、出願人名の順でコンマ(,)で区切られて格納されている。
なお、図3の(d)部分に示すデータを出力部30から出力装置へ出力する際には、図4(a)に示すように、順位、出願人、件数、および平均文字数が対応付けられた表を表示してもよい。
また、図4(b)に示すように、横軸に合計件数、縦軸に請求項の平均文字数が設定され、各出願人の値をプロットしたグラフを表示してもよい。このようなグラフ形式で表示することにより、各出願人が保有する特許の合計件数と、請求項の平均文字数との多少が一見して把握することができる。
なお、上記の説明においては、出願人ごとの特許明細書データを集計することについて記載したが、特許出願の代理人ごとに特許明細書データを集計し、平均文字数を代理人ごとに表示しても構わない。これにより、代理人ごとの権利取得能力を判断することも可能となる。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置1によれば、複数の特許明細書データについて、請求項に記載された発明の権利範囲の広さを数値化して、それらの平均値を算出し、さらに特許明細書データの合計件数を求めることによって、出願人の権利取得能力について客観的に分析することができる。
また、複数の特許明細書データから算出された権利範囲の広さの平均値および特許明細書データの合計数の結果について、出願人毎に相対的に比較することにより、単に各企業の出願数の多さだけを比較するのではなく、各出願人の出願に係る発明がどれだけ権利範囲が広いものであるかを判断することができる。
ここで、ある出願人が、かなりの件数の出願をしていたとしても、その出願に係る発明の権利範囲が狭いものであるならば、その出願人は権利取得能力が必ずしも高いとはいえない。むしろ、ある出願人について、たとえ出願件数が少なくても、その出願人が権利範囲の広い出願を多く有しているならば、その出願人は権利取得能力が高いといえる。このように、権利取得能力は、出願件数と、権利範囲との総合評価で決定することが好ましい。
本実施形態の特許情報分析装置1によれば、各出願人について、権利範囲の広い特許をどれくらいの数有しているかを判断することができるので、各出願人の権利取得能力を相対的に分析することができる。
なお、本実施形態の特許情報分析装置1は、特許明細書データを登録公報から得て分析を行うので、権利取得能力として、出願人の出願明細書作成能力および中間処理対応能力について分析することができる。つまり、ある出願人が、登録時点において権利範囲の広い特許を数多く有しているならば、その出願人は、明細書の作成能力が高いといえる。さらに、その出願人は、出願当初請求項を中間処理時に不要に減縮せずに登録させることができる能力を有しているともいえるから、中間処理対応能力が高いともいえる。
また、特許明細書データを、公開公報から得て分析を行うことにより、権利取得能力として、出願時点での出願明細書作成能力について分析を行うことができる。
また、権利範囲の広さを数値化する手法は、請求項の文字数を数える方法に限られるものではない。請求項の文字数に代えて請求項の単語数によって数値化しても良い。
さらに、請求項のうち独立請求項を構成する構成要件の数を数えることで、権利範囲の広さを数値化してもよい。
つまり、下記表1の「請求項のタイプ」欄に列挙されている、構成要件が「“と、”」等の文字列で区切られて列挙されている請求項については、下記の「数え方」を適用することで、構成要件数を算出することができる。
「数え方」:以下の文字列(1)〜(3)が請求項中にいくつあるか検索して、その数を数える。
文字列(1):「助詞“と”+読点“、”」つまり「“と、”」
文字列(2):「“とを”」
文字列(3):「“とからなる”」
また、ここでは、特許情報分析装置は、請求項1のみを分析対象としているが、これに限らず、すべての請求項を分析対象としてもよく、その場合は、独立請求項に係る発明を分析対象とすることが好ましい。すなわち、一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。そこで、独立請求項に係る発明を判別することが好ましい。
また、独立請求項及び従属請求項の判別方法としては、例えば、請求項を構成する文字列を検索するやり方がある。すなわち、従属請求項の場合は、一つの請求項を構成する文字列の中に「・・ことを特徴とする請求項1または3に記載の装置」等の他の請求項を引用することを示す記載が有り、必ず「請求項」という文字列が含まれ、一方、独立請求項の場合は、他の請求項を引用しないため、請求項を構成する文字列の中に「請求項」という文字列が含まれない。そこで、一つの請求項を構成する文字列の中に「請求項」という文字列があるか否かを検索することにより、独立請求項及び従属請求項の判別を行うことができる。
〔第2の実施形態〕
以下に示す実施形態の特許情報分析装置は、メイン請求項である請求項1のみを分析対象として説明する。
<1.装置構成>
本発明の他の実施形態として、中間処理時点から登録時点までにおける出願人の権利取得能力について分析する特許情報分析装置および特許情報分析方法について、図5〜10を用いて説明する。なお、本実施形態の特許情報分析装置の各構成要件については、第1の実施形態に係る特許情報分析装置と同様の機能を有するものに同一の参照符号を付すことで説明を省略する。
図5に示すように、本実施の形態の特許情報分析装置11は、入力部20と、データ処理部51と、出力部30と、記憶部40とを備えている。
データ処理部51は、各種のデータ処理を行うものであり、請求項分析処理部(請求項分析手段)62と、第2の分析処理部(第2の分析処理手段)70と、比較評価部(第1の比較評価手段)81と、第3の分析処理部(第3の分析処理手段)71とを備えている。
請求項分析処理部62は、請求項に記載された発明の権利範囲の広さを数値化するものである。本実施形態では、請求項のうち独立請求項である請求項1を構成する文字数を数えることにより、権利範囲の広さを数値化する。
第2の分析処理部70は、請求項分析処理部62にて数値化された数値を、同じ出願に関連する複数の特許明細書データ同士で比較するものである。
比較評価部81は、複数の特許明細書データにおける請求項が示す権利範囲の広さを相対比較するものである。
第3の分析処理部71は、各出願人からなされた出願の特許登録率のデータにより、第2の分析処理部70または比較評価部81の比較結果の分析を行うものである。
次に、上記構成の特許情報分析装置11の動作を説明する。
まず、入力部20から調査対象とする出願番号等を入力する。そして、入力された出願番号等に基づいて、データ処理部51は、記憶部40から対象特許の特許明細書データの公開公報および登録公報を、テキスト形式のデータとして読み出す。
さらに、請求項分析処理部62は、読み出された公開公報および登録公報の各々に含まれる独立請求項である請求項1の部分について、テキスト形式のデータに含まれる文字数を数える。
次に、第2の分析処理部70は、請求項分析処理部62にて数えた公開公報および登録公報の各々の文字数を比較し、差分を算出する。差分の算出結果は、出力部30により、モニター表示またはプリンター出力等の方法で出力装置において出力される。
また、複数の特許明細書データにおける請求項が示す権利範囲の広さを相対比較して分析する際には、比較評価部81にて、特定の技術分野に関連する特許明細書データ同士が比較される。
また、第3の分析処理部71では、第2の分析処理部70または比較評価部81の比較結果を、特許登録率のデータを用いて分析を行う。そして、その分析結果を出力部30に出力する(詳細は後述する)。
<2.動作フロー>
次に、データ処理部51の動作について図6を参照しつつ説明する。図6の(a)部分は、データ処理部51にて請求項の文字数を数えて各種処理を行う際のフローチャートであり、図6の(b)部分は、作業用メモリー(データ処理部51内の図示していないメモリー)内のデータ構造を示すものであり、図6の(c)部分および(d)部分は、出力部30からの出力に基づく、出力装置の表示画面の例を示すものである。
まず、データ処理部51は、S21〜S24を踏むことにより、公開公報に記載された請求項1の文字数を数える。S21〜S24における処理は、図2の(a)部分に示したS1〜S4の処理と同様のため、詳細な説明は省略する。
また、データ処理部51は、S21’〜S24’を踏むことにより、登録公報に記載された請求項1の文字数を数える。S21’〜S24’における処理は、図2の(a)部分に示したS1〜S4の処理と同様のため、詳細な説明は省略する。
S24およびS24’の処理が終了した後、第2の分析処理部70は、S24で数えた公開公報の請求項1の文字数と、S24’で数えた登録公報の請求項1の文字数とを比較し、差分を算出する(S25)。なお、第2の分析処理部70は、図6の(b)部分に示すように、公開文字数(公開公報の請求項1の文字数)と、登録文字数(登録公報の請求項1の文字数)と、公開文字数と登録文字数との差分を、作業用メモリー内に格納する。
さらに、出力部30は、S25での比較処理の結果を出力する(S26)。たとえば、図6の(c)部分に示すように、出力部30は、公開文字数と登録文字数との差分を、出願番号と対応づけて、モニターに表示する。また、複数の特許明細書データから請求項の文字数を数えた場合、出力部30は、図6の(d)部分に示すように、出願番号と、公開文字数と、登録文字数と、差分とを対応づけた表を、出力装置に表示させてもよい。
次に、複数の特許明細書データを相対比較する場合について、図7を参照しつつ説明する。
図7の(a)部分は、比較評価部81にて、複数の特許明細書データを相対比較して分析する際のフローチャートであり、図7の(b)〜(e)部分は、作業用メモリー(データ処理部51内の図示していないメモリー)内のデータ構造例を示すものである。
複数の特許明細書データを相対比較する際、まず、作業用メモリーに、図7の(b)部分に示す構造のデータを準備する。図7の(b)部分に示すデータ構造は、1件分の特許明細書データの項目が、通し番号、特許番号、Fターム、出願人名、公開文字数、登録文字数、および公開文字数と登録文字数との差分が、この順でコンマ(,)で区切られて格納されている。また、特定の特許明細書データについての項目と、それ以外の特許明細書データについての項目とは、改行文字により区切られている。
なお、これらの項目は、予め入力部20から複数の特許明細書データの出願番号を入力したり、またはIPC等を用いて特定の技術分野を指定したりして、複数の特許明細書データを入力しておき、さらに、請求項分析処理部62により各特許明細書データに含まれる請求項の文字数を数えておくことで格納可能となる。
まず、比較評価部81は、図7の(b)部分に示すデータより、予め指定された特定の技術分野(本実施形態ではFターム:2H090)の特許明細書データだけを抽出して、作業用メモリーに格納する(S31)。この際、作業用メモリーには、たとえば図7の(c)部分に示すような構造のデータが格納される。
さらに、比較評価部81は、各出願人が保有する特許間で、公開文字数と登録文字数との差分の多少を相対比較するために、出願人毎に、公開文字数の平均値、登録文字数の平均値、およびそれらの差分を求める(S32)。その際、作業用メモリーには、図7の(d)部分に示すように、出願人名、公開文字数の平均値、登録文字数の平均値、およびそれらの差分値が、この順番でコンマ(,)で区切られて格納される。
さらに、比較評価部81は、登録文字数の平均値が少なく、次いで公開文字数と登録文字数との差分が少ない出願人が上位になるように優先順位をつける(S33)。本実施形態では、最も登録文字数の平均値が少ないA社が1位となり、次いでB社、C社の順番になる。この際、作業用メモリー内のデータは、図7の(e)部分に示すように、順位、出願人名がこの順でコンマ(,)で区切られて格納されている。
図7の(e)部分に示すように格納されたデータを出力部30より出力する際には、図8(a)に示すように、順位、出願人、公開文字数(平均値)、登録文字数(平均値)、および公開文字数と登録文字数の差分が対応付けられた表を、出力装置に表示してもよい。
また、図8(b)に示すように、横軸に出願人、縦軸に請求項の平均文字数を設定し、各出願人についての公開文字数の平均値および登録文字数の平均値が棒グラフで示されたものを表示してもよい。このようにグラフ形式で出願人間の相対比較結果を表示することにより、図8(b)中の破線または一点鎖線で示した業界の平均値(同Fターム全体の平均文字数)に対して、各出願人についての公開文字数または登録文字数の多少を一見して把握することができ、出願人間の相対比較を容易に行うことができる。なお、公開文字数や登録文字数に関する業界の平均値は、たとえば同じFタームを有する複数の特許明細書データについて、公開文字数や登録文字数の平均値を求めることで算出される。また、本実施形態における業界とは、同一分野としてFターム「2H090」が付与されている特許明細書データを分析対象としているので、液晶ディスプレイ関連の技術分野の業界を指している。
なお、上記の説明においては、公開文字数と登録文字数との差分を出願人ごとに求めることについて記載したが、特許出願の代理人ごとに求めても構わない。そして、図8(a)や図8(b)に示す表示を、出願人ではなく代理人ごとに行っても構わない。これにより、代理人ごとの権利取得能力を判断することも可能となる。
次に、第2の分析処理部70または比較評価部81の比較結果に加えて、特許登録率のデータを用いて分析を行う場合について、図9を用いて説明する。図9の(a)部分は、第3の分析処理部71にて、複数の特許明細書データを比較して分析する際のフローチャートであり、図9の(b)部分および(c)部分は、作業用メモリー(データ処理部51内の図示していないメモリー)内のデータ構造を示すものである。
先ず、第3の分析処理部71は、出願人毎に、特許登録率の読み出し処理を行う(S41)。登録率は、記憶部40または別のメモリー等に予め格納しておいてもよいし、以下のように算出してもよい。
すなわち、1年間の登録率を計算するのであれば、1年間の登録件数/(1年間の登録件数+1年間の拒絶査定件数+1年間の取下および放棄件数)という計算式を用いればよい。
なお、出願人毎の登録率を読み出し、作業用メモリーに格納したデータは、たとえば図9の(b)部分に示すように、出願人名、登録率がこの順でコンマ(,)で区切られている。
さらに、第3の分析処理部71は、表2に示すような評価判断テーブルを、予め記憶部40または別のメモリーに格納しておき、この評価判断テーブルに従い、登録率、登禄文字数、および公開文字数と登録文字数との差分の3つの条件から評価を行う(S42)。
なお、表2において、登録文字数および差分について格納されている「多/中/少」の評価は、たとえば、上述の業界の平均値に対して前後10%程度の文字数であれば「中」とし、「中」よりも平均文字数が多い場合は「多」、「中」よりも平均文字数が少ない場合は「少」として設定可能である。
また、登録率について格納されている「高/中/低」の評価は、たとえば、出願人全ての平均登録率を算出して、その平均登録率の前後10%程度の登録率を有する出願人であれば「中」とし、「中」よりも登録率が高い出願人の場合は「大」、「中」よりも登録率が低い出願人の場合は「低」として設定可能である。
図9の(b)部分に示すようなデータを評価すると、A社は、登録率が高く且つ登録文字数が少ないので、表2の判断テーブルに基づき、評価No.1の「権利範囲の広い特許を効率的に取得」と判断される。
また、B社は、登録率が高く且つ登録文字数が多く、さらに差分が中〜多程度であるため、表2の判断テーブルに基づき、評価No.3の「権利範囲を限定してでも登録させている」と判断される。
また、C社は、登録率が低く且つ登録文字数が多いため、表2の判断テーブルに基づき、評価No.5の「権利取得が下手」と判断される。
なお、このように各社についての権利取得能力が第3の分析処理部71により判断された結果は、図9の(c)部分に示すように、出願人名、評価Noがこの順で作業用メモリーに格納される。
また、第3の分析処理部71による分析結果が、判断テーブルの判断条件に複数該当する場合には、複数の評価を出してもよい。たとえば、登録率=高、登録時文字数=少、差分=少という条件であれば、評価No.1およびNo.2の2つの評価と判断してもよい。
そして、図9の(c)部分に示すように作業用メモリーに格納されたデータを出力部30より出力する際には、図10(a)に示すように、出願人と評価結果とが対応づけられた表を出力装置に表示させてもよい。
また、図10(b)に示すように、横軸に登録率、縦軸に登録文字数の平均値が設定され、各出願人についての登録率と登録文字数の平均値とがプロットされたグラフを表示してもよい。このようなグラフ形式で表示することにより、各出願人の権利取得能力や特許取得戦略等の違いを一見して把握することができ、出願人同士の相対比較が容易に行える。
もちろん、図10(a)や図10(b)における表示は、代理人ごとに行っても構わない。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置11によれば、権利範囲の広さを数値化し、その数値を、同じ出願に関連する特許明細書データ同士(公開公報および登録公報)で比較することによって、権利取得能力としての中間処理対応能力について分析を行うことができる。
また、複数の特許明細書データから分析された結果を相対比較する際に、特定の技術分野に関連する複数の特許明細書データから得られた分析結果同士を比較することによって、より信頼性の高い分析結果を得ることができる。さらに、特許登録率のデータを用いて分析することによって、より詳細な分析を行うことができる。
なお、権利範囲の広さを数値化する手法としては、第1の実施形態と同様に、請求項の文字数をカウントしてもよいし、請求項のうち独立請求項を構成する構成要件の数を数えてもよい。
また、ここでは、特許情報分析装置は、請求項1のみを分析対象としているが、これに限らず、すべての請求項を分析対象としてもよく、その場合は、独立請求項に係る発明を分析対象とすることが好ましい。すなわち、一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。そこで、独立請求項に係る発明を判別することが好ましい。
〔第3の実施形態〕
<1.装置構成>
本発明のさらに他の実施形態として、登録後における出願人の権利活用能力について分析する特許情報分析装置および特許情報分析方法について、図11〜14を用いて説明する。なお、本実施形態の特許情報分析装置の各構成要件については、第1の実施形態に係る特許情報分析装置と同様の機能を有するものに同一の参照符号を付すことで説明を省略する。
図11に示すように、本実施形態の特許情報分析装置12は、入力部20と、データ処理部52と、出力部30と、記憶部40とを備えている。
データ処理部52は、各種のデータ処理を行うものであり、第4の分析処理部(第4の分析処理手段)72と、比較評価部(第1の比較評価手段)82とを備えている。
第4の分析処理部72は、入力部20に入力された特許明細書データの件数を集計するとともに、特許明細書データに対する世間の注目度を示すデータ(注目度データ)により特許明細書データの分析を行うものである。
比較評価部82は、複数の特許明細書データにおける請求項が示す権利範囲の広さを相対比較するものである。
次に、上記構成の特許情報分析装置12の動作を説明する。まず、入力部20から調査対象とする複数の特許番号等を入力する。そして、入力された特許番号等に基づいて、データ処理部52は、記憶部40から対象特許の特許明細書データをテキスト形式のデータとして読み出す。
次に、第4の分析処理部72は、調査対象の特許明細書データの件数を集計するとともに、他社に注目されている特許であることを示す異議申立または無効審判を受けた特許に係る特許番号を、記憶部40または別の図示しないメモリー等より読み出す。そして、第4の分析処理部72は、入力部20から入力された複数の特許番号の中に、異議申立または無効審判を受けた特許に係る特許番号が、何件含まれるかを検索する。
この第4の分析処理部72による検索結果は、出力部30により、モニター表示またはプリンター出力等の方法で出力装置に出力される。
または、複数の特許明細書データにおける請求項が示す権利範囲の広さを相対比較して分析する際には、比較評価部82にて、特定の技術分野に関連する特許明細書データ同士が比較される。
<2.動作フロー>
次に、図12を参照しつつ、データ処理部52の動作についてより具体的に説明する。なお、図12の(a)部分は、主にデータ処理部52にて他社注目度を考慮した分析動作を行う際のフローチャートであり、図12の(b)部分は、作業用メモリー(データ処理部52内の図示していないメモリー)内に格納されるデータ構造を示しており、図12の(c)部分は、出力部30からの出力に基づく、出力装置の表示画面の一例を示す図である。
先ず、データ処理部52は、入力部20から調査対象とする特許番号等が入力されると、その特許番号等に基づいて記憶部40から対象特許の特許明細書データをテキスト形式のデータとして読み出し、図示しないデータ処理部52内の作業用メモリーに格納する(S51)。
次に、第4の分析処理部72は、入力部20に入力された複数の特許明細書データの件数、および特許番号の集計を行う(S52)。
さらに、第4の分析処理部72は、たとえば異議申立または無効審判を受けた特許に係る特許番号を、注目度データとして、記憶部40または別の図示しないメモリー等より読み出す(S53)。この際、作業用メモリーには、図12の(b)部分に示すように、異議申立または無効審判を受けた特許に係る特許番号が格納される。
また、第4の分析処理部72は、調査対象の複数の特許番号中に、異議申立または無効審判を受けた特許番号が、何件含まれるかを検索する(S54)。
そして、出力部30は、S54における第4の分析処理部72の検索結果を、モニター表示またはプリンター出力等の手法により、出力装置に出力させる(S55)。たとえば、出力部30は、図12の(c)部分に示すように、合計件数と注目案件の件数との画面を、出力装置に表示する。なお、合計件数とは、第4の分析処理部72により分析される特許明細書データの件数であり、注目案件とは、第4の分析処理部72により検索された、異議申立または無効審判を受けた特許番号の件数である。
次に、複数の特許明細書データを相対比較する場合について、図13を参照しつつ説明する。図13の(a)部分は、比較評価部82にて、複数の特許明細書データを相対比較して分析する際のフローチャートであり、図13の(b)〜(e)部分は、作業用メモリー(データ処理部52内の図示していないメモリー)内のデータ構造例を示すものである。
複数の特許明細書データを相対比較する際に、まず、作業用メモリーに、図13の(b)部分に示す構造のデータを準備する。図13の(b)部分に示すデータ構造は、1件分の特許明細書データの項目が、通し番号、特許番号、Fターム、および出願人名が、この順でコンマ(,)で区切られて格納されている。また、特定の特許明細書データについての項目と、それ以外の特許明細書データについての項目とは、改行文字により区切られている。
なお、これらの項目は、予め入力部20から複数の特許明細書データの出願番号を入力したり、またはIPC等を用いて特定の技術分野を指定したりして、複数の特許明細書データを入力したりすることで、作業用メモリーに格納される。さらに、請求項分析処理部60(第1の実施形態参照)と同様の構成を、特許情報分析装置12に設けて各特許明細書データに含まれる請求項の文字数を数えておき、その文字数を作業用メモリー内に格納してもよい。
まず、比較評価部82は、図13の(b)部分に示すデータより、予め指定された特定の技術分野(本実施形態ではFターム:2H090)の特許明細書データだけを抽出して、作業用メモリーに格納する(S61)。この際、作業用メモリーには、たとえば図13の(c)部分に示すような構造のデータが格納される。
さらに、比較評価部82は、各出願人が保有する特許の件数、および異議申立または無効審判を受けた件数の多少を、出願人間で相対比較するために、各出願人の特許明細書データの合計件数、および異議申立または無効審判を受けた件数をまとめる(S62)。その際、作業用メモリーには、図13の(d)部分に示すように、出願人名、合計件数、異議申立または無効審判を受けた件数が、この順番でコンマ(,)で区切られて格納される。
そして、比較評価部82は、合計件数に対する異議申立または無効審判を受けた件数の割合が大きい出願人が上位になるように優先順位をつける(S63)。本実施形態では、割合が最も高いA社(25件÷600件=4.2%)を1位として、次いでC社(26件÷800件=3.3%)、B社(20件÷1000件=2.0%)と順位付けされる。この際、作業用メモリー内のデータは、図13の(e)部分に示すように、順位、出願人名がこの順でコンマ(,)で区切られて格納されている。
図13の(e)部分に示すように格納されたデータを出力部30より出力する際には、図14に示すように、順位、出願人、特許明細書データの合計件数、異議申立または無効審判を受けた件数(注目件数)、および合計件数と注目件数との割合が対応付けられた表を、出力装置において表示してもよい。もちろん、図14に示す表示は、代理人ごとに行っても構わない。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置12によれば、複数の特許明細書データの件数を集計するとともに、各特許明細書データに対する注目度データ(異議申立または無効審判を受けた件数)を用いて分析することによって、これらの特許明細書データはどれだけ他社(当該出願人以外)から注目を集めているかということを分析することができる。したがって、出願人がどれだけ重要な出願をなしえているかという観点から、出願人の権利取得能力について客観的に分析することができる。また、特定の技術分野に関連する複数の特許明細書データ同士を比較することによって、より信頼性の高い分析結果を得ることができる。
なお、注目度データとして、異議申立または無効審判を受けた件数に限られるものではない。たとえば、当該特許明細書データが、他の出願に係る発明の新規性や進歩性を否定するための引用文献として引用された件数(被引用特許の件数)、または、特許庁への記録事項の閲覧請求がなされた件数を、注目度データとして用いてもよい。また、これらの各種データを組合せて、注目度データとして用いてもよい。
<第1から第3の実施形態の補足事項>
また、上記第1〜3の実施形態に示したデータ処理部50・51・52を適宜組合せて、総合的な出願人の権利取得能力について分析してもよい。
また、上記第3の実施形態のデータ処理部52から得られる分析結果を、上記第1または第2の実施形態に示したデータ処理部50・51から得られる分析結果の確認用に用いてもよい。すなわち、最終的に他社から注目されるような重要な特許が取得できたかという点を、データ処理部52から得られる分析結果を用いて確認することにより、データ処理部50または51から得られる権利取得能力を見直すことができる。
〔第4の実施形態〕
本発明の一実施形態について、図15〜図18を参照して以下に説明する。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置13の構成について、図15を参照して以下に説明する。図15は、第4の実施形態に係る特許情報分析装置13の構成を示すブロック図である。この図に示すように、特許情報分析装置13は、入力部20、出力部30(出力手段)、記憶部40、およびデータ処理部53を備える。
入力部20、出力部30、記憶部40については、第一の実施形態と同様なので、その説明を省略する。
データ処理部53は、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部53は、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部53は、特許明細書データの請求項1部分を読み出す。本実施形態では、データ処理部53は、特許明細書データの請求項1部分を日本語のテキストデータとして読み出す。データ処理部53は、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部53は、図示しない作業用メモリー内のテキストデータを分析する。
データ処理部53について、さらに詳細に説明する。図15に示すように、データ処理部53は、発明種判別部63(文字列比較手段、発明種判別手段)、発明数カウント部73(発明数カウント手段)、および比較評価部83(第2の比較評価手段)を備える。
発明種判別部63は、特許明細書データの請求項1に記載された発明の種類を判別する。このとき発明種判別部63は、請求項1に係る発明が、物の発明であるか、または方法の発明であるかを判別する。発明種判別部63は、発明の種類の判別に、パターンマッチング等の文字列検索技術を使用する。
特許情報分析装置13は、発明の種類を特定する文字列を、図示しないROM(Read Only Memory:読み出し専用メモリー)にあらかじめ格納している。これにより、発明種判別部63は、このデータをROMから読み出し、パターンマッチングに使用する。なお、発明の種類を特定する文字列をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
日本の特許明細書の請求項は、一般に、発明の種類を特定する文字列に、「句点記号(。)」を加えた形の文字列で終了する。たとえば、物の発明に関する請求項では、末尾の文言が、「装置」、「機器」、「デバイス」、「回路」、「システム」、「プログラム」、または「記録媒体」等の文字列に、「。」が続く形となる。また、方法の発明に関する請求項では、末尾の文言が、「方法」、「製法」、「プロセス」等の文字列に、「。」が続く形となる。
そこで、発明種判別部63は、これらの発明の種類を特徴付ける文字列をROMから読み出す。これにより発明種判別部63は、分析対象の請求項の末尾の文言と、ROMから読み出した発明種特徴付け文字列とを比較することによって、請求項の末尾の文言が、所定の発明種特徴付け文字列で終了しているか否かを判定する。ここで、請求項の末尾の文言が、物の発明であることを特徴付ける文字列で終了すると判定するとき、発明種判別部63は、分析対象の請求項を、物の発明に関する請求項であると判別する。一方、請求項の末尾の文言が、方法の発明であることを特徴付ける文字列で終了すると判定するとき、発明種判別部63は、分析対象の請求項を、方法の発明に関する請求項であると判別する。
なお、英語の特許明細書の請求項(独立請求項)は、大きく分けて3つのパートで構成されていることが多く、すなわち、前提部分(請求すべき対象を記述した導入部)、移行部分(前提部分と実体部分とをつなぐ部分)及び実体部分(発明の特徴を表現した重要部分)から構成されている。そして、発明の種類を特徴付ける単語(文字列)は、主に前提部分に記載されている。そこで、発明種判別部63は、前提部分の各単語と、ROMから読み出した発明種特徴付け文字列(英語の場合、物の発明であれば「apparatus」等、方法の発明であれば「process」等)とを比較することによって、物の発明又は方法の発明に関する請求項であると判別する。
発明種判別部63は、分析対象の特許明細書データの特許番号と、判別した発明種特徴付け文字列とを関連づける。たとえば、発明種判別部63は、特許番号「特許・・・号」と、文字列「方法発明」とを関連づける。発明種判別部63は、この関連づけによって生成したデータを、発明数カウント部73および比較評価部83へ出力する。
特許情報分析装置13は、複数の特許明細書データを分析できる。そこで発明数カウント部73は、発明種判別部63が判別した発明の種類の数をカウントする。具体的には、発明数カウント部73は、特許番号と発明種特徴付け文字列とが関連づけられているテキストデータを発明種判別部63から受け取る。これにより発明数カウント部73は、分析対象の特許明細書データのうち、物の発明に関するものが何個あるのかをカウントする。さらに、分析対象の特許明細書データのうち、方法の発明に関するものが何個あるのかをカウントする。発明数カウント部73は、カウントした数を出力部30へ出力する。
なお、特許明細書データのすべての請求項を対象とする場合は、個々の特許明細書データ毎に、発明の種類の数をカウントすればよい。
比較評価部83は、同分野の特許明細書データを互いに比較する。具体的には、比較評価部83は、ある分野に関する特許明細書データと、この特許明細書データの分野と同一分野の特許明細書データとを比較する。ここでいう同一分野の特許明細書データとは、実質的に同一の特許分類記号が付与されている特許明細書データである。
なお、「実質的に同一の特許分類記号」とは、記号としての表現上の違いはあるものの、実際には互いに同一のものとみなすことができる特許分類記号を意味する。たとえば、特許分類記号の一例であるIPCは、発明の分野の大枠を示す大項目、大項目よりもさらに分野を絞った中項目、および小項目を含んでいる。これにより、互いに大項目が同一であるが、中項目や小項目が異なる2つのIPCは、記号全体として表現上は完全に同一ではないが、示す分野は同一であるとみなすことができるため、実質的に同一の特許分類記号である。
比較評価部83には、処理すべき分野の特許分類記号が入力される。比較評価部83は、特許分類記号として、ユーザが入力部20を通じて入力する特許分類記号を使用してもよい。または、特許分類記号として、図示しない作業用メモリーにあらかじめ格納している特許分類記号を使用してもよい。たとえば、特許分類記号として、日本特許出願明細書であれば、特許明細書データに含まれるIPC(国際特許分類)、FI(ファイルインデックス)、Fターム等を使用する。また、米国特許出願明細書であれば、USクラスを使用してもよい。これにより比較評価部83は、所定の特許分類記号に基づき、この特許分類記号が定義されている特許明細書データの分析結果を抽出する。したがって、分析対象の特許明細書データがどの分野に属するのかを、正確かつ容易に決定できる。
たとえば、比較評価部83は、分析結果から、物の発明のものを抽出する。さらに、比較評価部83は、出願人別に、物の発明の数をカウントする。さらに、比較評価部83は、物の発明の総数を、出願人の数で除算することによって、物の発明の、ある分野における業界平均件数(同一分野全体の平均件数)を算出する。比較評価部83は、方法の発明についても、同様に処理する。
このようにして比較評価部83は、複数の特許明細書データを対象に、請求項に記載の発明の特許権が、権利を行使しやすいものであるかを相対的に比較する。比較評価部83は、比較結果を出力部30へ出力する。また、比較評価部83は、自社が保有する特許権の数と、他社が保有する特許権の数とを、相対的に比較する。これにより、各社の特許権の強さ等を分析する。比較評価部83は、その比較結果を出力部30へ出力する。
<2.動作フロー>
特許情報分析装置13の動作について、図16および図17を参照して以下に説明する。図16は、第4の実施形態に係る特許情報分析装置13の動作を説明する図であり、図16の(a)は特許情報分析装置13の動作を示すフローチャートであり、図16の(b)は特許情報分析装置13が処理するテキストデータ、および、出力する分析結果の例を示す図である。この図に示すように、ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、発明種判別部63は、この特許番号の特許明細書データを記憶部40から読み出す(S71)。
図16の(b)に示すように、本実施形態では、発明種判別部63は、記憶部40から、Z21に示すテキストデータを読み出す。すなわち、「Aステップと、Bステップと、Cステップとを実行することを特徴とする製造方法」なる文字列が含まれる〔請求項1〕のテキストデータを読み出す。
つぎに発明種判別部63は、分析対象の請求項に係る発明の種類を判別する(S72)。このとき、発明種判別部63は、請求項の末尾の文言を検索する。図16の(b)に示す例では、この請求項は「製造方法。」で終了する。これにより、発明種判別部63は、この請求項に係る発明を方法の発明であると決定する。発明種判別部63は、複数の特許明細書データに対し、このような処理を繰り返して、分析結果を発明数カウント部73および比較評価部83へ出力する。
発明種判別部63による分析結果が入力されると、発明数カウント部73が、発明の種類別に、発明の数をカウントする(S73)。図16の(b)に示す例では、物の発明が250件あるとカウントし、方法の発明が170件あるとカウントする。発明数カウント部73は、カウント結果を出力部30へ出力する。
つぎに、出力部30は分析結果を出力装置へ出力する(S74)。このとき、出力部30は、Z22に示す分析結果を出力する。これにより出力装置は、特許番号「特許xxxxx1号」が方法の発明であることを、モニター表示または印刷等する。
さらに、複数の特許明細書データを分析した場合、出力部30は、Z23に示す分析結果を出力する。すなわち、複数の発明の特許番号と、その発明の種類とを対応付けた表を出力する。これにより、Z23の例の場合、出力装置は、特許番号「特許xxxxx1号」が、方法の発明であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx2号」が、物の発明であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx3号」が、方法の発明であることをモニター表示または印刷等する。
さらに出力部30は、発明数カウント部73によるカウント結果を出力する。このとき、出力部30は、Z24に示す分析結果を出力する。すなわち、出力部30は、物の発明の数と、方法の発明の数とを出力する。図16の(b)に示す例では、出力部30は、物の発明が250件であり、方法の発明が170件であることを出力する。したがって、出力装置は、Z24に示す分析結果をモニター表示または印刷等する。
つぎに、特許情報分析装置13が同分野の特許明細書データを分析し、比較する例について、図17を参照して以下に説明する。図17は、第4の実施形態に係る特許情報分析装置13の動作を説明する図であり、図17の(a)は特許情報分析装置13の動作を示すフローチャートであり、図17の(b)は特許情報分析装置13が処理するテキストデータ、および、出力する分析結果の例を示す図である。
発明種判別部63は、入力された特許番号に基づき、この特許番号の特許明細書データを記憶部40から読み出す。発明種判別部63は、上述した分析を行い、特許明細書データの請求項に係る発明の種類を決定する。さらに、発明種判別部63は、各特許明細書データから、日本独自の特許分類であるFタームと、出願人とを抽出する(S81)。これにより、発明種判別部63は、図17の(b)のZ31に示す形式のデータを生成する。すなわち、1から始まる通し番号と、特許番号と、Fタームと、出願人と、発明の種類とが互いに関連づけられたデータを生成する。図17の(b)に示す、発明種判別部63が生成するデータは、各項目がコンマ(,)で区切られ、改行文字によって1件分のデータを区切られている。
比較評価部83は、図17の(b)のZ31に示すデータに基づき、複数の特許明細書データを相対的に比較する(S82)。まず、比較評価部83は、図17の(b)のZ32に示すように、Fタームが「2H090」である行データを全て抽出する。さらに、比較評価部83は、図17の(b)のZ33に示すように、出願人別に物の発明の数をカウントする。この例では、比較評価部83は、A社の物の発明が、88件であるとカウントする。さらに、B社の物の発明が、125件であるとカウントする。さらに、C社の物の発明が、145件であるとカウントする。
比較評価部83は、さらに、業界平均の物の発明の数を算出する。この例では、比較評価部83は、業界平均の物の発明を、120件であると算出する。
なお、本実施形態における業界とは、同一分野としてFターム「2H090」が付与されている特許明細書データを分析対象としているので、液晶ディスプレイ関連の技術分野の業界を指している。
出力部30は、図17の(b)のZ34に示すように、各出願人が保有する物の発明の数を、グラフにして出力する。これにより、出力装置は、Z34に示すグラフをモニター表示または印刷等する。このとき、図中の点線で示すように、業界平均値を同時にモニター表示または印刷等する。これにより、ユーザは、このグラフを見ることによって、各出願人が保有する特許権の多少を、一見して把握できる。したがって、出願人同士を相対的に比較できる。これにより、特許明細書データを、より公平かつ高い信頼性のもとに分析できる。
なお、特許情報分析装置13は、上記以外の他の方法によって、請求項に係る発明の種類を判別してもよい。すなわち、物の発明または方法の発明であることを判別できる、他の判別技術を使用してもよい。たとえば、請求項を構成する文字列の末尾の文言が、物を示す名詞であるか否かに基づき、発明の種類を判別してもよい。
〔第5の実施形態〕
本発明の第5の実施形態について、図18〜図20を参照して以下に説明する。
本実施形態の特許情報分析装置13aは、特許明細書データの請求項に記載された発明が、数値限定発明であるか否かを判別する。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置13aの構成について、図18を参照して以下に説明する。図18は、第5の実施形態に係る特許情報分析装置13aの構成を示すブロック図である。この図に示すように、特許情報分析装置13aは、入力部20、出力部30、記憶部40、およびデータ処理部54を備える。
これらのうち、入力部20、出力部30、および記憶部40については、図15に示す各部と同一であるため、その説明を省略する。
データ処理部54について、図18を参照して以下に説明する。図18に示すように、データ処理部54は、数値限定発明判別部64(文字列比較手段、数値限定発明判別手段)、数値限定発明数カウント部74(数値限定発明数カウント手段)、および比較評価部84(第2の比較評価手段)を備える。
数値限定発明判別部64は、特許明細書データの請求項1に記載された発明の種類を判別する。このとき数値限定発明判別部64は、請求項1に係る発明が、数値限定発明であるか否かを判別する。数値限定発明判別部64は、発明の種類の判別に、パターンマッチング等の文字列検索技術を使用する。
特許情報分析装置13aは、所定の数値限定があることを特徴付ける文字列を、図示しないROMにあらかじめ格納している。これにより、数値限定発明判別部64は、このデータをROMから読み出し、パターンマッチングに使用する。なお、数値限定があることを特徴付ける文字列をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
数値限定があることを特徴付ける文字列として、単位を表す記号(たとえば、「°」、「μ」、「%」等)がある。また、数式等を構成する記号(たとえば、「≧」、「>」、「≦」、「<」等)がある。さらに、数量の程度を示す文字列(「以下」、「未満」等)等がある。特許明細書の請求項に係る発明が、数値限定発明である場合、その請求項は、これらの、数値限定があることを特徴付ける文字列を含んでいる。
そこで、数値限定発明判別部64は、これらの数値限定があることを特徴付ける文字列をROMから読み出す。これにより数値限定発明判別部64は、分析対象の請求項に含まれる文字列と、ROMから読み出した、数値限定があることを特徴付ける文字列とを比較することによって、請求項に、所定の数値限定があることを特徴付ける文字列が含まれているか否かを判定する。ここで、請求項に、数値限定があることを特徴付ける文字列が含まれていると判定するとき、数値限定発明判別部64は、分析対象の請求項を、数値限定発明に関する請求項であると判別する。一方、請求項に、数値限定があることを特徴付ける文字列が含まれていないと判定するとき、数値限定発明判別部64は、分析対象の請求項を、数値限定を含んでいない発明に関する請求項であると判別する。
数値限定発明判別部64は、分析対象の特許明細書データの特許番号と、判別した発明種特徴付け文字列とを関連づける。たとえば、数値限定発明判別部64は、特許番号「特許・・・号」と、文字列「数値限定発明」とを関連づける。数値限定発明判別部64は、この関連づけによって生成したデータを、数値限定発明数カウント部74および比較評価部84へ出力する。
特許情報分析装置13aは、複数の特許明細書データを分析できる。そこで数値限定発明数カウント部74は、数値限定発明判別部64が判別した発明の数を、発明の種類別にカウントする。具体的には、数値限定発明数カウント部74は、特許番号と発明種特徴付け文字列とが関連づけられているテキストデータを数値限定発明判別部64から受け取る。これにより数値限定発明数カウント部74は、分析対象の特許明細書データのうち、数値限定発明に関するものが何個あるのかをカウントする。さらに、分析対象の特許明細書データのうち、数値限定がなされていない発明に関するものが何個あるのかをカウントする。数値限定発明数カウント部74は、カウントした数を出力部30へ出力する。
なお、特許明細書データのすべての請求項を対象とする場合は、個々の特許明細書データ毎に、数値限定発明数をカウントすればよい。
比較評価部84は、同分野の特許明細書データを互いに比較する。具体的には、比較評価部84は、ある分野に関する特許明細書データと、この特許明細書データの分野と同一分野の特許明細書データとを比較する。ここでいう同一分野の特許明細書データとは、実質的に同一の特許分類記号が付与されている特許明細書データである。
なお、「実質的に同一の特許分類記号」とは、記号としての表現上の違いはあるものの、実際には互いに同一のものとみなすことができる特許分類記号を意味する。たとえば、特許分類記号の一例であるIPCは、発明の分野の大枠を示す大項目、大項目よりもさらに分野を絞った中項目、および小項目を含んでいる。これにより、互いに大項目が同一であるが、中項目や小項目が異なる2つのIPCは、記号全体として表現上は完全に同一ではないが、示す分野は同一であるとみなすことができるため、実質的に同一の特許分類記号である。
比較評価部84には、処理すべき分野の特許分類記号が入力される。比較評価部84は、特許分類記号として、ユーザが入力部20を通じて入力する特許分類記号を使用してもよい。または、特許分類記号として、図示しない作業用メモリーにあらかじめ格納している特許分類記号を使用してもよい。たとえば、特許分類記号として、特許明細書データに含まれるIPC、または日本独自の特許分類であるFI並びにFタームを使用する。これにより比較評価部84は、所定の特許分類記号に基づき、この特許分類記号が定義されている特許明細書データの分析結果を抽出する。
たとえば、比較評価部84は、分析結果から、数値限定発明のものを抽出する。さらに、比較評価部84は、出願人別に、数値限定発明の数をカウントする。さらに、比較評価部84は、数値限定発明の総数を、出願人の数で除算することによって、数値限定発明の、ある分野における業界平均件数を算出する。比較評価部84は、数値限定がなされていない発明についても、同様に処理する。
このようにして比較評価部84は、複数の特許明細書データを対象に、請求項に記載の発明の特許権が、権利を行使しやすいものであるかを相対的に比較する。比較評価部84は、比較結果を出力部30へ出力する。また、比較評価部84は、自社が保有する特許権の数と、他社が保有する特許権の数とを、相対的に比較する。これにより、各社の特許権の強さ等を分析する。比較評価部84は、その比較結果を出力部30へ出力する。
<2.動作フロー>
特許情報分析装置13aの動作について、図19および図20を参照して以下に説明する。図19は、第5の実施形態に係る特許情報分析装置13aの動作を説明する図であり、図19の(a)は特許情報分析装置13aの動作を示すフローチャートであり、図19の(b)は特許情報分析装置13aが処理するテキストデータ、および、出力する分析結果の例を示す図である。この図に示すように、ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、数値限定発明判別部64は、この特許番号の特許明細書データを記憶部40から読み出す(S91)。
図19の(b)に示すように、本実施形態では、数値限定発明判別部64は、記憶部40から、Z51に示すテキストデータを読み出す。すなわち、「Aと、Bと、Cとからなり、該Cの固定角度が5°≦θ<40°であることを特徴とする装置。」なる文字列が含まれる〔請求項1〕のテキストデータを読み出す。
つぎに数値限定発明判別部64は、分析対象の請求項に係る発明の種類を判別する(S92)。このとき、数値限定発明判別部64は、請求項の文字列を検索する。図19の(b)に示す例では、この請求項に、「°」、「≦」、「<」が含まれている。これらは、いずれも、数値限定があることを特徴付ける文字列である。これにより、数値限定発明判別部64は、この請求項に係る発明を数値限定発明であると決定する。数値限定発明判別部64は、複数の特許明細書データに対し、このような処理を繰り返して、分析結果を数値限定発明数カウント部74および比較評価部84へ出力する。
数値限定発明判別部64による分析結果が入力されると、数値限定発明数カウント部74が、発明の種類別に、発明の数をカウントする(S93)。図19の(b)に示す例では、数値限定発明が50件あるとカウントし、数値限定がなされていない発明が280件あるとカウントする。数値限定発明数カウント部74は、これらのカウント結果を出力部30へ出力する。
つぎに、出力部30は分析結果を出力する(S94)。このとき、出力部30は、Z52に示す分析結果を出力する。Z52に示す例では、出力部30は、特許番号「特許xxxxx1号」が、数値限定発明であることを出力する。
さらに、複数の特許明細書データを分析した場合、出力部30は、Z53に示す分析結果を出力装置に出力する。Z53に示す例では、「○」は数値限定発明であることを示す記号であり、「×」は数値限定がなされていない発明であることを示す記号である。すなわち、出力部30は、複数の発明の特許番号と、その発明の種類とを対応付けた表を出力する。
これにより、Z53の例の場合、出力装置は、特許番号「特許xxxxx1号」が、数値限定発明であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx2号」が、数値限定がなされていない発明であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx3号」が、数値限定発明であることをモニター表示または印刷等する。
出力部30は、数値限定発明数カウント部74によるカウント結果を出力装置に出力する。このとき、出力部30は、Z54に示す分析結果を出力する。すなわち、出力部30は、数値限定発明の総数と、数値限定がなされていない発明の総数とを出力する。図19の(b)に示す例では、出力部30は、数値限定発明が50件であり、数値限定がなされていない発明が280件であることを出力する。
つぎに、特許情報分析装置13aが同分野の特許明細書データを分析し、比較する例について、図20を参照して以下に説明する。図20は、第5の実施形態に係る特許情報分析装置13aの動作を説明する図であり、図20の(a)は特許情報分析装置13aの動作を示すフローチャートであり、図20の(b)は特許情報分析装置13aが処理するテキストデータ、および、出力する分析結果の例を示す図である。
数値限定発明判別部64は、入力された特許番号に基づき、この特許番号の特許明細書データを記憶部40から読み出す。数値限定発明判別部64は、上述した分析を行い、特許明細書データの請求項に係る発明の種類を決定する。さらに、数値限定発明判別部64は、各特許明細書データから、Fタームと、出願人とを抽出する(S101)。これにより、数値限定発明判別部64は、図20の(b)のZ61に示す形式のデータを生成する。すなわち、1から始まる通し番号と、特許番号と、Fタームと、出願人と、発明の種類(数値限定発明か否か)とが互いに関連づけられたデータを生成する。図20の(b)に示す、数値限定発明判別部64が生成するデータは、各項目がコンマ(,)で区切られ、改行文字によって1件分のデータを区切られている。
比較評価部84は、図20の(b)のZ61に示すテキストデータに基づき、複数の特許明細書データを相対的に比較する(S102)。まず、比較評価部84は、図20の(b)のZ62に示すように、Fタームが「2H090」である行データを全て抽出する。さらに、比較評価部84は、図20の(b)のZ63に示すように、出願人別に数値限定がなされていない発明の数をカウントする。この例では、比較評価部84は、A社が保有する、数値限定がなされていない発明を、250件であるとカウントする。さらに、B社の保有する、数値限定がなされていない発明を、190件であるとカウントする。さらに、C社の保有する、数値限定がなされていない発明を、290件であるとカウントする。
比較評価部84は、さらに、数値限定がなされていない発明の業界平均値を算出する。この例では、比較評価部84は、数値限定がなされていない発明の業界平均を、240件であると算出する。
出力部30は、図20の(b)のZ64に示すように、各出願人が保有する、数値限定がなされていない発明の数を、グラフにして出力装置に出力する。これにより、出力装置は、Z64に示すグラフをモニター表示または印刷等する。このとき、図中の点線で示すように、業界平均値を同時に表示する。これにより、ユーザは、このグラフを見ることによって、各出願人が保有する特許権の多少を、一見して把握できる。したがって、出願人同士を相対的に比較できる。これにより、特許明細書データを、より公平かつ高い信頼性のもとに分析できる。
なお、特許情報分析装置13aは、上記以外の他の方法によって、請求項に係る発明の種類を判別してもよい。すなわち、数値限定発明であることを判別できる、他の判別技術を使用してもよい。たとえば、請求項を構成する文字列に、数式が記載されていることを示す「〔数〕等の文字列が含まれているか否かを判定してもよい。ここで示す「〔〕は、実際には、特許明細書に含まれる制御記号の一つである墨付き括弧である。
<3.まとめ>
以上のように、本実施形態によれば、請求項に記載された発明の種類を判別する。さらに、その発明が数値限定発明であるかを判別する。これにより、その発明が権利を行使しやすいものであるかを、より正確に分析できる。
〔第6の実施形態〕
本発明の第6の実施形態について、図21を参照して以下に説明する。
本実施形態の特許情報分析装置13bは、特許明細書データの請求項に記載された発明が、物の発明であるか、または方法の発明であるかを判別する。特許情報分析装置13bは、さらに、この発明が、数値限定発明であるか否かも判別する。すなわち、特許情報分析装置13bの構成は、第4の実施形態に係る特許情報分析装置13と、第5の実施形態に係る特許情報分析装置13aとを組み合わせたものである。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置13bの構成について、図21を参照して以下に説明する。図21は、第6の実施形態に係る特許情報分析装置13bの構成をブロック図である。この図に示すように、特許情報分析装置13bは、入力部20、出力部30、記憶部40、データ処理部53、およびデータ処理部54を備える。
これらの各部は、いずれも、特許情報分析装置13または特許情報分析装置13aが備えているものと同一である。そのため、詳細な説明を省略する。
<2.動作フロー>
特許情報分析装置13bの動作について、以下に説明する。まず、ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部53およびデータ処理部54は、この特許番号の特許明細書データを記憶部40から読み出す。つぎにデータ処理部53は、請求項に係る発明が、物の発明または方法の発明であるかを判別する。さらに、データ処理部54は、請求項に係る発明が、数値限定発明であるか否かを判別する。データ処理部53およびデータ処理部54は、分析結果を出力部30へ出力する。
以上の構成により、特許情報分析装置13bは、請求項に係る発明が、権利を行使しやすいものであるか否かを、より正確に分析できる。
なお、本実施形態では、データ処理部53とデータ処理部54とは、同時に並列してテキストデータを分析する。これに限らず、特許情報分析装置13bでは、データ処理部53がテキストデータを分析したあと、データ処理部54が分析するようにしてもよい。逆に、データ処理部54がテキストデータを分析したあと、データ処理部53が分析するようにしてもよい。
〔第7の実施形態〕
本発明の第7の実施形態について、図22を参照して以下に説明する。
本実施形態の特許情報分析装置13cは、特許明細書データの請求項に記載された発明が、物の発明であるか、または方法の発明であるかを判別する。特許情報分析装置13cは、さらに、この発明が、数値限定発明であるか否かも判別する。特許情報分析装置13cは、さらに、複数の特許明細書データの分析結果を仕分けする。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置13cの構成について、図22を参照して以下に説明する。図22は、第7の実施形態に係る特許情報分析装置13cの構成を示すブロック図である。この図に示すように、特許情報分析装置13cは、入力部20、出力部30、記憶部40、およびデータ処理部55を備える。
これらのうち、入力部20、出力部30、および記憶部40は、図15に示す各部と同一であるため、説明を省略する。
データ処理部55について、さらに詳しく説明する。図22に示すように、データ処理部55は、データ処理部53、データ処理部54、および仕分け部90(仕分け手段)を備える。これらのうち、データ処理部53およびデータ処理部54は、第6の実施形態に係る特許情報分析装置13bが備える各部と同一であるため、説明を省略する。
仕分け部90は、データ処理部53による分析結果、および、データ処理部54による分析結果に基づき、複数の特許明細書データの分析結果を、適宜、権利を行使しやすいものである可能性が高いものと、権利を行使しやすいものである可能性が低いものとに仕分けする。たとえば、仕分け部90は、分析結果から、物の発明かつ数値限定がなされていない発明であるものを、権利行使しやすい発明である分類に仕分けする。さらに、分析結果から、方法の発明かつ数値限定発明であるものを、権利行使しにくい発明である分類に仕分けする。
<2.動作フロー>
特許情報分析装置13cの動作について、図23を参照して以下に説明する。まず、ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部53およびデータ処理部54は、この特許番号の特許明細書データを記憶部40から読み出す。つぎにデータ処理部53は、請求項に係る発明が、物の発明であるか、または方法の発明であるかを判別する。さらに、データ処理部54は、請求項に係る発明が、数値限定発明であるか否かを判別する。データ処理部53およびデータ処理部54は、分析結果を仕分け部90へ出力する。
仕分け部90は、入力された分析結果を、図23の(b)のZ91に示す形式テキストデータにまとめる(S111)。すなわち、仕分け部90は、1から始まる通し番号と、特許番号と、物の発明か方法の発明かを示す項目と、数値限定発明か数値限定がなされていない発明かを示す項目とが互いに関連づけられたデータを生成する。なお、Z91に示すテキストデータでは、「物」は物の発明であることを表す。さらに、「方法」は方法の発明であることを表す。さらに、「数値」は数値限定発明であることを表す。さらに、「他」は数値限定がなされていない発明であることを表す。また、図23の(b)に示す、仕分け部90が生成するデータは、各項目がコンマ(,)で区切られ、改行文字によって1件分のデータを区切られている。
仕分け部90は、Z91に示すテキストデータから、権利行使しやすい発明を仕分けする(S112)。すなわち、仕分け部90は、Z92に示すように、物の発明かつ数値限定がなされていない発明である行データを抽出する。すなわち、仕分け部90は、通し番号が2番、4番、5番のデータを、権利行使しやすい発明として抽出している。仕分け部90は、仕分けした分析結果を出力部30へ出力する。
出力部30は、仕分け部90による仕分けした分析結果を、権利行使しやすい発明と、権利行使しにくい発明とに仕分けして出力装置に出力する。これにより、図23の(b)に示す例では、出力装置は、Z93に示すように、物の発明かつ数値限定がなされていない発明に関する特許明細書の特許番号を、一覧にしてモニター表示または印刷等する。さらに、Z94に示すように、方法の発明かつ数値限定発明に関する特許明細書の特許番号を、一覧にしてモニター表示または印刷等する。
<3.まとめ>
このように、特許情報分析装置13cは、大量の特許明細書から、権利行使しやすい発明に関する情報を抽出できる。これにより、ユーザは、本装置による分析結果を確認することによって、他社へ活用しやすい、有力な特許権を、自社がいくつ保有しているのかを知ることができる。
一方、特許情報分析装置13cは、大量の特許明細書から、権利行使しにくい発明に関する情報も抽出できる。これにより、ユーザは、本装置による分析結果を確認することによって、活用しづらい特許権の棚卸し作業を効率的に進めることができる。すなわち、不要であり放棄してもよい特許権を、効率的に検索できる。
<第4〜第7の実施形態の補足事項>
また、第4〜第7の実施形態では、特許情報分析装置は、特許明細書データを分析しているが、これに限らず、実用新案明細書データであっても分析できる。すなわち、本発明でいう特許情報とは、特許明細書データおよび実用新案明細書データを含む意である。
また、発明種判別部63は、方法の発明であることを特徴付ける文字列が、請求項に記載されていない発明を、物の発明に判別することが好ましい。このとき発明種判別部63は、方法の発明であると判別しない発明を、物の発明であると判別する。すなわち、一般に、請求項に方法の発明であることを特徴付ける文字列が記載されている場合、そのような請求項に係る発明を、ほぼ確実に方法の発明であると判別できる。したがって、特許情報分析装置は、それ以外の発明を物の発明であると判別することによって、請求項に記載されている発明が、物の発明であることをより確実に判別できる。
また、第4〜第7の実施形態では、特許情報分析装置は、請求項1のみを分析対象としているが、本発明は、これらに限定されない。すべての請求項を分析対象としてもよく、その場合は、独立請求項に係る発明を分析対象とすることが好ましい。すなわち、一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。そこで、独立請求項に係る発明の種類を判別することが好ましい。また、独立請求項および従属請求項の判別方法としては、例えば、請求項を構成する文字列を検索するやり方がある。すなわち、従属請求項の場合は、一つの請求項を構成する文字列の中に「・・ことを特徴とする請求項1または3に記載の装置」等の他の請求項を引用することを示す記載が有り、必ず「請求項」という文字列が含まれ、一方、独立請求項の場合は、他の請求項を引用しないため、請求項を構成する文字列の中に「請求項」という文字列が含まれない。そこで、一つの請求項を構成する文字列の中に「請求項」という文字列があるか否かを検索することにより、独立請求項及び従属請求項の判別を行うことができる。
第4〜第7の実施形態では、特許情報分析装置は、2つの特許明細書データが同分野の特許情報か否かを、IPC、FI、Fターム、またはUSクラス等の特許分類記号によって判定する。しかし、特許情報分析装置は、複数の特許明細書データが同分野の特許情報か否かを、キーワード検索等で任意に調査してもよい。この場合、特許明細書データが同分野の特許情報か否かを、キーワード検索の結果に基づき決定する。
〔第8の実施形態〕
本発明の一実施形態について、図24〜図27を参照して以下に説明する。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14の構成について、図24を参照して以下に説明する。図24は、第8の実施形態に係る特許情報分析装置14の構成を示すブロック図である。この図に示すように、特許情報分析装置14は、入力部20、出力部30(出力手段)、記憶部40、およびデータ処理部56を備える。
入力部20、出力部30、記憶部40については、第一の実施形態と同様なので、その説明を省略する。
データ処理部56は、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部56は、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部56は、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部56は、特許明細書データの請求項部分を日本語のテキストデータとして読み出す。データ処理部56は、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部56は、図示しない作業用メモリー内のテキストデータを分析する。
データ処理部56について、さらに詳細に説明する。図24に示すように、データ処理部56は、発明非特定事項文字削除部65(文字列比較手段、発明非特定事項文字削除手段)、発明特定事項文字数カウント部75(発明特定事項文字数カウント手段)、および比較評価部85(第3の比較評価手段)を備える。
発明非特定事項文字削除部65は、特許明細書データの請求項に記載された発明構成要素非特定文字を抽出し、削除する。発明構成要素非特定文字とは、請求項に記載されている発明を特定することに直接関わらない、形式的な用語を意味する。この発明構成要素非特定文字には、たとえば、記号類、指示語、および形式文字列がある。
日本の特許明細書における記号類の例として、「読点記号(、)」、「句点記号(。)」、「コンマ(,)」、「セミコロン(;)」、「コロン(:)」「(スペース文字)」等がある。
日本の特許明細書における指示語は、先行する他の用語を引用したり、あとに出てくる他の用語を指し示したりする用語を意味する。この指示語の例として、「該」、「前記」、「上記」、「下記」、「この」、「これらの」等がある。
日本の特許明細書における形式文字列は、請求項の記載に形式的に用いられるのみであり、発明を特定する用語として機能していない文字列である。この形式文字列の例として、「ことを特徴とする」、「ことを特徴とした」、「ことが特徴である」等の文字列がある。
特許情報分析装置14は、このような発明構成要素非特定文字を、図示しないROM(Read Only Memory:読み出し専用メモリー)にあらかじめ格納している。これにより、発明非特定事項文字削除部65は、このデータをROMから読み出し、パターンマッチングに使用する。なお、発明構成要素非特定文字をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
そこで、発明非特定事項文字削除部65は、これらの発明構成要素非特定文字をROMから読み出す。つぎに発明非特定事項文字削除部65は、分析対象の請求項に含まれる各文字列と、ROMから読み出した発明構成要素非特定文字とを比較することによって、請求項から発明構成要素非特定文字を抽出する。これにより発明非特定事項文字削除部65は、請求項に含まれる発明構成要素非特定文字の少なくとも1つを削除する。発明非特定事項文字削除部65は、発明構成要素非特定文字を削除したあとの請求項データを、発明特定事項文字数カウント部75に出力する。
発明特定事項文字数カウント部75は、入力された請求項に含まれる文字の数をカウントする。すなわち、発明特定事項文字数カウント部75は、発明構成要素非特定文字の少なくとも1つが削除された請求項に含まれる文字の数をカウントする。これにより、発明特定事項文字数カウント部75は、分析対象の請求項に含まれる文字の数をカウントする。発明特定事項文字数カウント部75は、カウントした文字の数を出力部30へ出力する。
一般に、文字コードがシフトJISであるテキストデータでは、全角1文字は2バイトに相当する。そこで、発明特定事項文字数カウント部75は、たとえば、分析対象のテキストデータのバイト数をカウントすることによって、発明構成要素非特定文字を削除した後の請求項に含まれる文字の数を算出する。なお、発明特定事項文字数カウント部75は、バイト数をカウントする数え方とは異なる他の数え方を使用することによって、請求項に含まれる文字の数をカウントしてもよい。
比較評価部85は、同分野の特許明細書データを互いに比較する。具体的には、比較評価部85は、ある分野に関する特許明細書データと、この特許明細書データの分野と同一分野の特許明細書データとを比較し評価する。ここでいう同一分野の特許明細書データとは、実質的に同一の特許分類記号が付与されている特許明細書データである。
比較評価部85には、処理すべき分野の特許分類記号が入力される。なお、比較評価部85における特許分類記号の処理は、第4の実施形態における比較評価部83と同様なので、説明を省略する。
このようにして比較評価部85は、複数の特許明細書データを対象に、請求項に記載の発明に係る特許請求の範囲の広さを、相対的に比較する。たとえば、比較評価部85は、含んでいる文字の数がより少ない請求項の発明に係る特許権を、含んでいる文字の数がより多い請求項の発明に係る特許権に比べて、権利範囲(特許請求の範囲)がより広いものであると評価する。比較評価部85は、このような比較結果を出力部30へ出力する。また比較評価部85は、自社が保有する特許権の数と、他社が保有する特許権の数とを相対的に比較する。これにより、各社の特許権の強さ等を分析する。
<2.動作フロー>
特許情報分析装置14の動作について、図25および図26を参照して以下に説明する。図25は、第8の実施形態に係る特許情報分析装置14の動作を説明する図であり、図25の(a)は特許情報分析装置14の動作を示すフローチャートであり、図25の(b)は特許情報分析装置14が処理するテキストデータ、および、出力する分析結果の例を示す図である。ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部56は、この特許番号の特許明細書データ(特に請求項部分のデータ)を、記憶部40から読み出す(S121)。
つぎに発明非特定事項文字削除部65は、読み出した日本の特許明細書の請求項データから独立請求項である請求項1を抽出する。図25の(b)に示すように、本実施形態では、発明非特定事項文字削除部65は、記憶部40から、Z101に示すテキストデータを読み出す。すなわち、
〔請求項1〕Aと、Bと、Cとからなり、該Cが、前記Aに固定されていることを特徴とする装置。
〔請求項2〕前記Aは、xxxである請求項1記載の装置。
〔請求項3〕前記Bは、xxxである請求項1記載の装置。
なる文字列が含まれる請求項のテキストデータを読み出す。
つぎに発明非特定事項文字削除部65は、読み出した請求項データに、請求項2以降のテキストデータが存在するか否かを判定する(S122)。たとえば、請求項データに「〔請求項2〕」の文字列が存在するか否かを判定する。ここで、「〕」および「〔」は、実際には、特許明細書における制御記号である墨付き括弧である。S122における判定結果が「真」である場合、発明非特定事項文字削除部65は、分析対象の請求項データから、請求項2以降のテキストデータを削除する(S123)。これにより発明非特定事項文字削除部65は、独立請求項である請求項1のテキストデータを抽出する。一方、S122における判定結果が「偽」である場合、発明非特定事項文字削除部65は、S123における処理をスキップする。
これにより発明非特定事項文字削除部65は、Z102に示すテキストデータを取得する。以降、発明非特定事項文字削除部65は、
〔請求項1〕Aと、Bと、Cとからなり、該Cが、前記Aに固定されていることを特徴とする装置。
なる文字列が含まれる請求項のテキストデータを処理する。
つぎに発明非特定事項文字削除部65は、Z102に示すテキストデータに、発明構成要素非特定文字が含まれるか否かを判定する(S124)。ここで、この判定結果が「真」である場合、発明非特定事項文字削除部65は、発明構成要素非特定文字を、請求項1のテキストデータから削除する(S125)。発明構成要素非特定文字を削除すると、発明非特定事項文字削除部65は、現在処理しているデータが、請求項1のデータ列の最後であるか否かを判定する(S126)この判定結果が「偽」である場合、発明非特定事項文字削除部65はS124の処理を再開する。一方、判定結果が「真」である場合、発明非特定事項文字削除部65は、発明構成要素非特定文字を取り除いたテキストデータを、発明特定事項文字数カウント部75に出力する。
図25の(b)に示すように、Z102のテキストデータには、「読点記号(、)」「句点記号(。)」、「該」、「上記」、「ことを特徴とする」などの、発明構成要素非特定文字が含まれる。そこで発明非特定事項文字削除部65は、これらの発明構成要素非特定文字を抽出することによって、処理対象のテキストデータから削除する。これにより発明非特定事項文字削除部65は、Z103に示す、発明構成要素非特定文字を取り除いたテキストデータを生成する。Z103に示すように、このテキストデータは、請求項に係る発明の構成要件を表現する核心的な部分の文字列のみを含んでいる。
発明非特定事項文字削除部65は、Z103に示すテキストデータ、すなわち、発明構成要素非特定文字を取り除いた請求項1のテキストデータを、発明特定事項文字数カウント部75に出力する。発明特定事項文字数カウント部75は、入力されたテキストデータに含まれる文字の数をカウントする。この例では、発明特定事項文字数カウント部75は、請求項1の文字の数を「23文字」であるとカウントする。発明特定事項文字数カウント部75は、このカウント結果を出力部30に出力する。
つぎに出力部30が、発明特定事項文字数カウント部75によるカウント結果を出力装置に出力する(S128)。これにより、出力装置は、Z104に示すカウント結果をモニター表示または印刷等する。すなわち、出力装置は、特許番号「特許xxxxx1号」の特許明細書の請求項1に、23個の文字が含まれていることをモニター表示または印刷等する。
さらに、複数の特許明細書データを分析した場合、出力部30は、Z105に示す分析結果を出力装置に出力する。すなわち、複数の発明の特許番号と、その特許番号の特許明細書に含まれる請求項1の文字の数とを対応付けた表を出力する。これにより、Z105の例の場合、出力装置は、特許番号「特許xxxxx1号」の特許明細書に含まれる請求項1の文字の数が、「23」文字であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx2号」の特許明細書に含まれる請求項1の文字の数が、「100」文字であることをモニター表示または印刷等する。さらに、特許番号「特許xxxxx3号」の特許明細書に含まれる請求項1の文字の数が、「200」文字であることをモニター表示または印刷等する。
つぎに、特許情報分析装置14が同分野の特許明細書データを分析し、比較する例について、図26を参照して以下に説明する。図26は、第8の実施形態に係る特許情報分析装置14の動作を説明する図であり、図26の(a)は特許情報分析装置14の動作を示すフローチャートであり、図26の(b)は特許情報分析装置14が処理するテキストデータ、および、出力する分析結果の例を示す図である。
データ処理部56は、入力された特許番号に基づき、この特許番号の特許明細書データを記憶部40から読み出す。発明非特定事項文字削除部65は、上述した分析を行い、特許明細書データに含まれる請求項1の文字列のうち、発明構成要素非特定文字を削除する。発明特定事項文字数カウント部75は、請求項1の文字の数をカウントする。さらに、発明特定事項文字数カウント部75は、各特許明細書データから、Fタームと、出願人とを抽出する。これにより、発明特定事項文字数カウント部75は、図26の(b)のZ111に示す形式のデータを生成する。すなわち、1から始まる通し番号と、特許番号と、Fタームと、出願人と、請求項1の文字の数とが互いに関連づけられたデータを生成する。図26の(b)に示す、発明特定事項文字数カウント部75が生成するデータは、各項目がコンマ(,)で区切られ、改行文字によって1件分のデータを区切られている。
比較評価部85は、図26の(b)のZ111に示すデータに基づき、複数の特許明細書データを相対的に比較する。まず、比較評価部85は、図26の(b)のZ112に示すように、Fタームが「2H090」である行データを全て抽出する。さらに、比較評価部85は、図26の(b)のZ113に示すように、出願人別に、文字の平均数を算出する。この例では、比較評価部85は、A社の請求項1の文字の平均数を、175文字であると算出する。さらに、B社の請求項1の文字の平均数を、250文字であると算出する。さらに、C社の請求項1の文字の平均数を、290文字であると算出する。
比較評価部85は、さらに、請求項1の文字の数の業界平均値(同じFタームを有する特許明細書データ全体の平均文字数)を算出する。この例では、比較評価部85は、業界平均の文字の数を、240文字であると算出する。なお、業界平均値の算出の仕方は、同Fタームにおける各出願人の文字の平均数を基にして、さらにそれらの平均値を求めたものを用いてもよい。また、本実施形態における業界とは、同一分野としてFターム「2H090」が付与されている特許明細書データを分析対象としているので、液晶ディスプレイ関連の技術分野の業界を指している。
出力部30は、図26の(b)のZ114に示すように、各出願人が保有する特許権に関する特許明細書における、請求項1の文字の平均数を、グラフにして出力装置に出力する。このとき、図中の点線で示すように、業界平均値を同時に出力する。これにより、出力装置は、Z114に示すグラフをモニター表示または印刷等する。したがって、ユーザは、このグラフを見ることによって、各出願人が保有する特許権における、請求項1の文字の数の多少を、一見して把握できる。したがって、出願人同士の特許力を相対的に比較して容易に確認することができる。これにより、特許明細書データを、より公平かつ高い信頼性のもとに分析できる。
〔第9の実施形態〕
本発明の第9の実施形態について、図27および図28を参照して以下に説明する。
本実施形態の特許情報分析装置14aは、複数の特許明細書データを対象に、請求項1に含まれる文字の数を順位付けする。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14aの構成について、図27を参照して以下に説明する。図27は、第9の実施形態に係る特許情報分析装置14aの構成を示すブロック図である。この図に示すように、特許情報分析装置14aは、入力部20、出力部30、記憶部40、およびデータ処理部56aを備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部56aについて、図27を参照して以下に説明する。図27に示すように、データ処理部56aは、発明非特定事項文字削除部65(文字列比較手段、発明非特定事項文字削除手段)、発明特定事項文字数カウント部75(発明特定事項文字数カウント手段)、順位付け部91(順位付け手段)、および比較評価部85(第3の比較評価手段)を備える。
これらのうち、発明非特定事項文字削除部65、発明特定事項文字数カウント部75、および比較評価部85は、いずれも、図24に示す各部と同一であるため、その説明を省略する。
順位付け部91は、発明特定事項文字数カウント部75によるカウント結果に基づき、複数の特許明細書データの分析結果を、適宜、請求項の文字の数が少ない順に順位付けする。または、請求項の文字の数が多い順に順位付けする。
<2.動作フロー>
特許情報分析装置14aの動作について、図28を参照して以下に説明する。図28は、第9の実施形態に係る特許情報分析装置14aの動作を説明する図であり、図28の(a)は特許情報分析装置14aの動作を示すフローチャートであり、図28の(b)は特許情報分析装置14aが処理するテキストデータ、および、出力する分析結果の例を示す図である。
ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部56aは、この特許番号の特許明細書データを記憶部40から読み出す。つぎに発明非特定事項文字削除部65は、請求項1に含まれる発明構成要素非特定文字を削除する。発明非特定事項文字削除部65は、分析結果を発明特定事項文字数カウント部75に出力する。
発明特定事項文字数カウント部75は、入力された分析結果を、図28の(b)のZ121に示す形式テキストデータにまとめる(S141)。すなわち、発明特定事項文字数カウント部75は、1から始まる通し番号と、特許番号と、請求項1の文字の数とが互いに関連づけられたデータを生成する。
順位付け部91は、Z121に示す、図示しない作業用メモリー内のテキストデータを処理する。このとき順位付け部91は、Z121に示す、複数の特許明細書データの分析結果を、Z122に示すように、適宜、請求項の文字の数が少ない順に順位付けする(S142)。または、請求項の文字の数が多い順に順位付けする(S142)。順位付け部91は、順位付け結果を出力部30に出力する。
出力部30は、順位付け部91によって順位付けされた分析結果を出力装置に出力する。これにより、図28の(b)に示す例では、出力装置は、Z123に示すように、請求項1の文字の数の少ない順に、特許明細書データの分析結果をモニター表示または印刷等する。さらに、Z124に示すように、請求項1の文字の数の多い順に、特許明細書データの分析結果をモニター表示または印刷等する。
<3.まとめ>
このように特許情報分析装置14aは、大量の特許明細書から、特許権の強さ(特許請求の範囲の広さ)に関する情報を抽出できる。したがって、ユーザは、大量の特許明細書データから、必要なものと、必要でないものとを、効率的に見極めることができる。
たとえば、ユーザは、文字の数の少ない請求項1を含む特許明細書の情報を確認することによって、他社へ活用しやすい、有力な特許権から順に確認できる。逆に、文字列の多い請求項1を含む特許明細書の情報を確認することによって、権利範囲が狭く、他社へ有効活用し難い特許権から、順に確認できる。これにより、ユーザは、権利範囲が狭く、活用しづらい特許権の棚卸し作業を、効率的に進めることができる。すなわち、不要であり放棄してもよい特許権を、効率的に検索できる。
〔第10の実施形態〕
本発明の第10の実施形態について、図29〜図32を参照して以下に説明する。
本実施形態の特許情報分析装置14bは、特許明細書データの独立請求項に含まれる発明構成要件を抽出する。さらに、抽出した発明構成要件の数をカウントする。さらに、抽出した発明構成要件の文字数をカウントする。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14bの構成について、図29を参照して以下に説明する。図29は、第10の実施形態に係る特許情報分析装置14bの構成を示すブロック図である。この図に示すように、特許情報分析装置14bは、入力部20、出力部30、記憶部40、およびデータ処理部57を備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部57について、図29を参照して以下に説明する。図29に示すように、データ処理部57は、発明構成要件抽出部66(文字列比較手段、発明構成要件抽出手段)、発明構成要件数カウント部76(発明構成要件数カウント手段)、発明構成要件文字数カウント部77(発明構成要件文字数カウント手段)、および比較評価部86(第3の比較評価手段)を備える。
データ処理部57は、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部57は、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部57は、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部57は、特許明細書データの請求項部分を日本語のテキストデータとして読み出す。データ処理部57は、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部57は、図示しない作業用メモリー内のテキストデータを分析する。
発明構成要件抽出部66は、作業用メモリー内から特許明細書データの請求項に含まれる発明構成要件を抽出する。このとき発明構成要件抽出部66は、発明構成要件の抽出に、パターンマッチング等の文字列検索技術を使用する。たとえば、分析対象の日本の特許明細書の独立請求項が、「Aと、Bとを備えた装置。」という文字列を含むとき、発明構成要件抽出部66は、この請求項から、「A」および「B」という2つの発明構成要件を抽出する。具体的には、発明構成要件抽出部66は、請求項テキストデータから、「と、」および「と、」に囲まれた文字列、または「と、」および「とを」に囲まれた文字列を、いずれも発明構成要件として抽出する。なお、上述の「と、」とは、助詞である「と」および読点記号である「、」が組み合わされた文字列のことである。
また、他の抽出の仕方としては、発明構成要件抽出部66は、テキストデータの中から、改行文字を検索する。一般に、文字コードがASCIIコードであるテキストデータの場合、改行を示す制御文字は「LF(ラインフィード)」である。そこで発明構成要件抽出部66は、請求項データの中から、このような改行を示す制御文字を検索することによって、段落の区切りを抽出する。このように、発明構成要件抽出部66は、段落ごとの文字列を、一つの発明構成要件として抽出するようにしてもよい。
発明構成要件抽出部66は、請求項データから抽出した発明構成要件を、テキストデータとして、発明構成要件数カウント部76および発明構成要件文字数カウント部77に出力する。
特許情報分析装置14bは、上述した「と、」「とを」などの、所定の発明構成要件検索文字列を、図示しないROMにあらかじめ格納している。これにより、発明構成要件抽出部66は、このデータをROMから読み出し、パターンマッチングに使用する。なお、発明構成要件検索文字列をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
発明構成要件数カウント部76は、発明構成要件抽出部66が抽出した発明構成要件の数をカウントする。一方、発明構成要件文字数カウント部77は、発明構成要件抽出部66が抽出した発明構成要件の文字の数をカウントする。このとき、発明構成要件文字数カウント部77は、第8の実施形態における発明特定事項文字数カウント部75と同様のやりかたで、文字の数をカウントする。
比較評価部86は、同分野の特許明細書データを互いに比較する。具体的には、比較評価部86は、ある分野に関する特許明細書データと、この特許明細書データの分野と同一分野の特許明細書データとを比較する。
比較評価部86には、処理すべき分野の特許分類記号が入力される。比較評価部86は、特許分類記号として、ユーザが入力部20を通じて入力する特許分類記号を使用してもよい。または、特許分類記号として、図示しない作業用メモリーにあらかじめ格納している特許分類記号を使用してもよい。たとえば、特許分類記号として、特許明細書データに含まれるIPC、FI、またはFタームを使用する。これにより比較評価部86は、所定の特許分類記号に基づき、この特許分類記号が定義されている特許明細書データの分析結果を抽出する。
このようにして比較評価部86は、複数の特許明細書データを対象に、請求項に記載の発明に係る特許請求の範囲の広さを、相対的に比較する。たとえば、比較評価部86は、含んでいる発明構成要件の数がより少ない請求項の発明に係る特許権を、含んでいる発明構成要件の数がより多い請求項の発明に係る特許権に比べて、権利範囲がより広いと評価する。さらに、比較評価部86は、含んでいる発明特定要件の文字数がより少ない請求項の発明に係る特許権を、含んでいる発明特定要件の文字数がより多い請求項の発明に係る特許権に比べて、権利範囲がより広いと評価する。
比較評価部86は、比較結果を出力部30へ出力する。また、比較評価部86は、自社が保有する特許権の数と、他社が保有する特許権の数とを、相対的に比較する。これにより、各社の特許権の強さ等を分析する。比較評価部86は、その比較結果を出力部30へ出力する。
<2.動作フロー>
特許情報分析装置14bの動作について、図30〜図32を参照して以下に説明する。図30は、第10の実施形態に係る特許情報分析装置14bの動作を説明する図である。ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部57は、この特許番号の特許明細書データの請求項データを、記憶部40から読み出す(S151)。発明構成要件抽出部66は、読み出した請求項データから、発明構成要件を抽出する(S152)。発明構成要件数カウント部76は、発明構成要件抽出部66が抽出した発明構成要件の文字の数をカウントする(S153)。出力部30は、発明構成要件数カウント部76による分析結果を出力装置に出力する(S154)。
図31は、第10の実施形態に係る特許情報分析装置14bの動作を説明する図である。ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部57は、この特許番号の特許明細書データの請求項データを、記憶部40から読み出す(S161)。発明構成要件抽出部66は、読み出した請求項データから、発明構成要件を抽出する(S162)。発明構成要件文字数カウント部77は、発明構成要件抽出部66が抽出した発明構成要件の文字の数をカウントする(S163)。出力部30は、発明構成要件文字数カウント部77による分析結果を出力装置に出力する(S164)。
図32は、第10の実施形態に係る特許情報分析装置14bに備えられた比較評価部86の動作を説明する図である。
上述の通り、発明構成要件数カウント部76は、各特許明細書データの独立請求項に含まれる発明構成要件の数をカウントする。さらに、発明構成要件文字数カウント部77は、各特許明細書データの独立請求項に含まれる発明特定要件の文字数をカウントする。このように各種処理を行ったデータの中から、比較評価部86は、同分野の特許情報の特許明細書データに関する特許情報を抽出する(S171)。
つぎに比較評価部86が、同分野の特許情報の特許明細書データを相対的に比較する(S172)。たとえば、比較評価部86は、請求項1の発明構成要件の数の、同分野の業界平均値を算出し、それに対する自社保有特許又は他社保有特許の構成要件数又は文字数の多少を相対比較し、各社の特許力の比較評価を行う。
以上のように、本実施形態の特許情報分析装置14bは、発明構成要件の数および発明特定要件の文字数を、それぞれ別々に処理する。これに限らず、特許情報分析装置14bは、発明構成要件の数と発明特定要件の文字数とを組み合わせることによって、特許明細書データを分析してもよい。これにより、たとえば、特許情報分析装置14bは、発明構成要件の数が少なくかつ発明特定要件の文字数が少ない請求項を含んでいる特許明細書データを、より特許請求の範囲が広い特許明細書データである、というふうに、特許明細書データをより詳細に分析できる。
〔第11の実施形態〕
本発明の第11の実施形態について、図33〜図35を参照して以下に説明する。
本実施形態の特許情報分析装置14cは、特許明細書データの独立請求項に含まれる文字列から、上位概念用語を抽出する。さらに、抽出した上位概念用語の数をカウントする。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14cの構成について、図33を参照して以下に説明する。図33は、第11の実施形態に係る特許情報分析装置14cの構成を示すブロック図である。この図に示すように、特許情報分析装置14cは、入力部20、出力部30、記憶部40、およびデータ処理部58を備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部58について、図33を参照して以下に説明する。図33に示すように、データ処理部58は、上位概念用語抽出部67(文字列比較手段、上位概念用語抽出手段)、上位概念用語数カウント部78(上位概念用語数カウント手段)、および比較評価部87(第3の比較評価手段)を備える。
データ処理部58は、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部58は、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部58は、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部58は、特許明細書データの請求項部分を日本語のテキストデータとして読み出す。データ処理部58は、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部58は、図示しない作業用メモリー内のテキストデータを分析する。
上位概念用語抽出部67は、作業用メモリー内から特許明細書データの請求項に含まれる上位概念用語を抽出する。ここで、上位概念用語とは、同族的もしくは同類的事項を集めて統括した概念、または、ある共通する性質に基づいて複数の事項を統括した概念を表した用語であり、下位概念を意味する用語に比べて、より抽象度が高い概念を意味する用語をいう。たとえば、日本の特許明細書における上位概念用語には、「バネ、ゴム」等の用語の上位概念である「弾性体」がある。また、「スポンジ材、ウレタン材、空気袋」等の用語の上位概念である「伸縮性部材」がある。
特許情報分析装置14cは、このような上位概念用語を、図示しないROMにあらかじめ格納している。これにより、上位概念用語抽出部67は、このデータをROMから読み出し、パターンマッチングに使用する。なお、上位概念用語をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
そこで、上位概念用語抽出部67は、これらの上位概念用語をROMから読み出す。つぎに上位概念用語抽出部67は、分析対象の請求項に含まれる各文字列と、ROMから読み出した上位概念用語とを比較することによって、請求項から上位概念用語を抽出する。上位概念用語抽出部67は、抽出した上位概念用語を、上位概念用語数カウント部78に出力する。
上位概念用語数カウント部78は、上位概念用語抽出部67が抽出した上位概念用語の数をカウントする。上位概念用語数カウント部78は、カウントした上位概念用語の数を出力部30へ出力する。
<2.動作フロー>
特許情報分析装置14cの動作について、図34および図35を参照して以下に説明する。図34は、第11の実施形態に係る特許情報分析装置14cの動作を説明する図である。ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部58は、この特許番号の特許明細書データの請求項データを、記憶部40から読み出す(S181)。上位概念用語抽出部67は、読み出した請求項データから、上位概念用語を抽出する(S182)。上位概念用語抽出部67は、上位概念用語を抽出したか否かの結果を出力部30に出力する(S184)。また、上位概念用語数カウント部78は、上位概念用語抽出部67が抽出した上位概念用語の数をカウントする(S183)。出力部30は、上位概念用語数カウント部78によるカウント結果を、出力装置に出力する(S184)。
図35は、第11の実施形態に係る特許情報分析装置14cに備えられた比較評価部87の動作を説明する図である。
上述の通り、上位概念用語数カウント部78は、各特許明細書データの独立請求項に含まれる上位概念用語の数をカウントする。このように各種処理を行ったデータの中から、比較評価部87は、同分野の特許情報の特許明細書データに関する特許情報を抽出する(S191)。
つぎに比較評価部87が、同分野の特許情報の特許明細書データを相対的に比較する(S192)。たとえば、比較評価部87は、請求項1の上位概念用語数の、同分野の業界平均値を算出し、それに対する自社保有特許又は他社保有特許の上位概念用語数の多少を相対比較し、各社の特許力の比較評価を行う。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置14cは、特許明細書データの独立請求項に含まれる上位概念用語を抽出する。これにより、特許情報分析装置14cは、分析対象の請求項に係る特許請求の範囲の広さを分析できる。さらに、複数の特許明細書データを分析する場合、同分野の特許情報の特許明細書データを比較することによって、特許明細書データを、より公平かつ高い信頼性のもとに分析できる。
〔第12の実施形態〕
本発明の第12の実施形態について、図36〜図39を参照して以下に説明する。
本実施形態の特許情報分析装置14dは、特に米国特許明細書等の英文で構成される特許明細書データの請求項に含まれる単語の数をカウントする。具体的には、特許情報分析装置14dは、特許明細書データの独立請求項に含まれるスペース文字を抽出することによって、スペース文字の数をカウントする。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14dの構成について、図36を参照して以下に説明する。図36は、第12の実施形態に係る特許情報分析装置14dの構成を示すブロック図である。この図に示すように、特許情報分析装置14dは、入力部20、出力部30、記憶部40、およびデータ処理部59を備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部59は、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部59は、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部59は、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部59は、特許明細書データの請求項部分をテキストデータとして読み出す。データ処理部59は、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部59は、図示しない作業用メモリー内のテキストデータを分析する。
データ処理部59について、図36を参照して以下に説明する。図36に示すように、データ処理部59は、単語数カウント部79(単語数カウント手段)、および比較評価部88(第3の比較評価手段)を備える。
単語数カウント部79は、特許明細書データの請求項に含まれる単語を抽出する。このとき単語数カウント部79は、分析対象の請求項に含まれるスペース文字を抽出する。これにより単語数カウント部79は、請求項に含まれているスペース文字の数をカウントする。一般に、米国特許明細書等の、欧米語による特許明細書では、請求項が、スペース文字に囲まれた単語によって構成されている。そのため、特許情報分析装置14dは、このような特許明細書のテキストデータを分析するとき、スペース文字の数をカウントすることによって、単語数を大まかに決定できる。
なお、単語数カウント部79は、スペース文字に加えて、テキストデータにおける改行を示す改行文字をあわせてカウントしてもよい。たとえば、テキストデータがASCIIコードによるものであるとき、単語数カウント部79は、改行を示す制御文字「LF(ラインフィード)」の数もあわせてカウントしてもよい。これにより、単語数カウント部79は、単語数をより正確にカウントできる。
<2.動作フロー>
特許情報分析装置14dの動作について、図37〜図39を参照して以下に説明する。図37は、第12の実施形態に係る特許情報分析装置14dの動作を説明する図であり、図37の(a)は特許情報分析装置14dの動作を示すフローチャートであり、図37の(b)は特許情報分析装置14dが処理するテキストデータ、および、出力する分析結果の例を示す図である。ユーザは、入力部20を通じて、分析対象の特許番号を入力する。入力された特許番号に基づき、データ処理部59は、この特許番号の特許明細書データ(特に請求項部分のデータ)を、記憶部40から読み出す(S201)。
図37の(b)に示すように、本実施形態では、データ処理部59は、記憶部40から、Z141に示すテキストデータを読み出す。すなわち、
1.A device comprising:element A;element B;and element C.
2.The device of claim 1、wherein the element A is xxxxx.
3.The device of claim 1、wherein the element B is xxxxx.
なる単語が含まれる請求項のテキストデータを読み出す。Z141に示すテキストデータのデータ形式は、各単語をスペース文字によって区切り、改行文字によって、各請求項を区切っているものである。なお、Z141およびZ142において、スペース文字は「□」記号(白い正方形)で示している。
つぎに単語数カウント部79は、読み出した請求項データに、請求項2以降があるか否かを判定する(S202)。たとえば、単語数カウント部79は、請求項2の存在を示す「2.」が、テキストデータに含まれるか否かを判定する。ここで、判定結果が「真」である場合、単語数カウント部79は、読み出した請求項データから、請求項2以降のテキストデータを削除する(S203)。すなわち、単語数カウント部79は、分析対象のテキストデータから、「2.」を含むこれ以降のデータを全て削除する。これにより単語数カウント部79は、請求項1のみのテキストデータを抽出する。一方、判定結果が「偽」である場合、単語数カウント部79は、S202における処理をスキップする。
以上の処理により、単語数カウント部79は、Z142に示すテキストデータを取得する。以降、単語数カウント部79は、
1.A device comprising:element A;element B;and element C.
なる単語が含まれる請求項のテキストデータを処理する。
単語数カウント部79は、つぎに、Z142に示すテキストデータに、スペース文字が存在するか否かを判定する(S204)。本実施形態では、単語数カウント部79は、スペース文字がテキストデータに含まれるか否かを判定する。ここで、この判定結果が「真」である場合、単語数カウント部79は、現在カウントしているスペース文字数に、1を加算する(S205)。このあと、単語数カウント部79は、現在処理しているデータが、データ列の最後であるか否かを判定する(S206)この判定結果が「偽」である場合、単語数カウント部79は、S204の処理を再開する。すなわち、単語数カウント部79は、スペース文字の検索と、スペース文字数の加算とを、テキストデータの最初から最後まで繰り返し実行する。一方、S206における判定結果が「真」である場合、単語数カウント部79は、カウントしたスペース文字数、つまり、単語数を出力部30に出力する。
Z142に示すテキストデータは、10個のスペース文字を含んでいる。これにより単語数カウント部79は、Z142に示すテキストデータから、10個のスペース文字数を算出する。
つぎに、出力部30はカウント結果を出力装置に出力する(S207)。これにより、出力装置は、Z143に示す分析結果をモニター表示または印刷等する。すなわち出力部30は、特許番号「USPxxxxx1」の請求項1(クレーム1)の単語数が、10であることをモニター表示または印刷等する。
さらに、複数の特許明細書データを分析した場合、出力部30は、Z144に示す分析結果を出力装置に出力する。すなわち、複数の特許明細書の特許番号と、その特許番号の特許明細書に含まれる請求項1の単語数とを対応付けた表を出力する。これにより、Z144の例の場合、出力装置は、特許番号「USPxxxxx1号」の特許明細書に含まれる請求項1の単語数が、「10」であることをモニター表示または印刷等する。さらに、特許番号「USPxxxxx2号」の特許明細書に含まれる請求項1の単語数が、「100」であることをモニター表示または印刷等する。さらに、特許番号「USPxxxxx3号」の特許明細書に含まれる請求項1の単語数が、「200」であることをモニター表示または印刷等する。
図38は、第12の実施形態に係る特許情報分析装置14dが分析する他の形式のテキストデータを示す図である。出力部30は、図38のZ151に示す形式のテキストデータを処理することもできる。Z151に示すテキストデータは、
1.A devlce comprising:<改行>
element A;<改行>
element B;<改行>
and element C.
のような形式になっている。すなわち、段落や行の最後が、必ず改行文字(図中「<改行>」で示す)で終了している。
このような形式のテキストデータから、単語数をカウントする場合、単語数カウント部79は、スペース文字に加えて、上述したように、改行を示す改行文字(ASCIIコードの場合は制御文字「LF(ラインフィード)」)をカウントする。これにより、改行文字によって区切られた直前の単語をカウントできる。したがって、単語数カウント部79は、分析対象のテキストデータに含まれる単語数を、より正確にカウントできる。
つぎに、特許情報分析装置14dが同分野の特許情報の特許明細書データを相対的に比較する例について、図39を参照して以下に説明する。図39は、第12の実施形態に係る特許情報分析装置14dに備えられた比較評価部88の動作を説明する図である。上述の通り、単語数カウント部79は、各特許明細書データの独立請求項に含まれるスペース文字をカウントすることによって、独立請求項に含まれる単語をカウントする。このように各種処理を行ったデータの中から、比較評価部88は、同分野の特許情報の特許明細書データに関する特許情報を抽出する(S211)。
つぎに比較評価部88が、同分野の特許情報の特許明細書データを相対的に比較する(S212)。たとえば、比較評価部88は、請求項1の単語数の、同分野の業界平均値を算出し、それに対する自社保有特許又は他社保有特許の単語数の多少を相対比較し、各社の特許力の比較評価を行う。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置14dは、特許明細書データの独立請求項に含まれる単語数をカウントする。これにより、特許情報分析装置14dは、分析対象の請求項に係る特許請求の範囲の広さを分析できる。さらに、複数の特許明細書データを分析する場合、同分野の特許情報の特許明細書データを比較することによって、特許明細書データを、より公平かつ高い信頼性のもとに分析できる。
〔第13の実施形態〕
本発明の第13の実施形態について、図40を参照して以下に説明する。
<1.装置構成>
本実施形態の特許情報分析装置14’(図示せず)は、第8の実施形態の特許情報分析装置14および第9の実施形態の特許情報分析装置14aの変形例である。この特許情報分析装置14’では、入力部20(入力手段)が、外部からのデータ入力を受け付ける。そこでユーザは、入力部20(入力手段)を通じて、請求項から削除したい発明構成要素非特定文字を入力する。これにより入力部20は、ユーザによって入力された発明構成要素非特定文字を受け付け、データとして作業用メモリーに格納する。特許情報分析装置14’では、発明非特定事項文字削除部65が、ユーザによって入力部20を通じて入力された発明構成要素非特定文字を作業用メモリーから取り出し、請求項から削除する文字として使用する。
<2.動作フロー>
特許情報分析装置14’における処理について、図40を参照して以下に説明する。図40は、第13の実施形態に係る特許情報分析装置14’の動作を説明する図であり、図40の(a)は特許情報分析装置14’の動作を示すフローチャートであり、図40の(b)は特許情報分析装置14’が処理するテキストデータ、および、出力する分析結果の例を示す図である。特許情報分析装置14’は、図示しない表示部において、Z171に示す表示画面を表示する。すなわち、この画面を表示することによって、ユーザに対し、請求項から削除する発明構成要素非特定文字の入力を求めている。ユーザは、テキストボックスJ170に、削除したい発明構成要素非特定文字を入力する(S221)。Z171の例では、ユーザは、「該、前記、上記、」と入力する。入力部20は、ユーザによって入力されるこれらの発明構成要素非特定文字を受け付け、図示しない作業用メモリーに格納する。
また、特許情報分析装置14’は、ユーザ入力画面の別の例として、Z172に示す表示画面を表示してもよい。Z172の表示画面は、チェックボックスJ171、チェックボックスJ172、チェックボックスJ173を含んでいる。チェックボックスJ171は、指示語(例「該」「前記」「上記」)を選択するためのものである。チェックボックスJ172は、記号類(例「、」「。」「,」「;」)を選択するためのものである。チェックボックスJ173は、形式文字列(例「ことを特徴とする」)を選択するためのものである。この画面を表示することによって、特許情報分析装置14’は、ユーザに対し、請求項から削除すべき発明構成要素非特定文字を選択させる。
Z172に示す例では、ユーザは、チェックボックスJ171およびJ172をチェックしている(「■」(黒い正方形)により表示)。一方、ユーザは、チェックボックスJ171をチェックしていない(「□」(白い正方形)により表示)。
発明非特定事項文字削除部65は、ユーザが選択した発明構成要素非特定文字を格納する(S222)。すなわち、Z173に示すように、ユーザがチェックしたチェックボックスの項目である、「該」、「前記」、「上記」、「、」、「。」、「,」、および「;」を格納する。これにより、発明非特定事項文字削除部65は、これらの単語を、請求項データから抽出し、削除する。
<3.まとめ>
以上のように、本実施形態の特許情報分析装置14’は、ユーザが発明構成要素非特定文字を任意に指定することができるので、分析対象とする特許明細書の技術分野などの違いに合わせて、削除する文字を調整することが可能となり、より状況に応じたきめ細かい分析を行うことができる。
〔第14の実施形態〕
本発明の第14の実施形態について、図41を参照して以下に説明する。
本実施形態の特許情報分析装置14eは、特許明細書データに含まれる請求項に係る発明の種類を判別する。さらに、この請求項に含まれる発明構成要素非特定文字を削除する。これにより、特許情報分析装置14eは、発明の種類の判別と、発明構成要素非特定文字の削除とを、同じ分析対象の請求項に適用する。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14eの構成について、図41を参照して以下に説明する。図41は、第14の実施形態に係る特許情報分析装置14eの動作を説明する図である。この図に示すように、特許情報分析装置14eは、入力部20、出力部30、記憶部40、およびデータ処理部56bを備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部56bは、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部56bは、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部56bは、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部56bは、特許明細書データの請求項部分を日本語のテキストデータとして読み出す。データ処理部56bは、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部56bは、図示しない作業用メモリー内のテキストデータを分析する。
データ処理部58について、図41を参照して以下に説明する。図41に示すように、データ処理部58は、発明非特定事項文字削除部65(文字列比較手段、発明非特定事項文字削除手段)、発明特定事項文字数カウント部75(発明特定事項文字数カウント手段)、発明種判別部67(文字列比較手段、発明構成要件抽出手段、第2の発明種判別手段)、および比較評価部85(第3の比較評価手段)を備える。
これらのうち、発明非特定事項文字削除部65、発明特定事項文字数カウント部75、および比較評価部85は、いずれも、図24に示す各部と同一であるため、その説明を省略する。
発明種判別部67は、特許明細書データの請求項に記載された発明の種類を判別する。このとき発明種判別部67は、ある請求項に係る発明が、物の発明であるか、または方法の発明であるかを判別する。発明種判別部67は、発明の種類の判別に、パターンマッチング等の文字列検索技術を使用する。
特許情報分析装置14eは、発明の種類を特徴付ける文字列を、図示しないROMにあらかじめ格納している。これにより、発明種判別部67は、このデータをROMから読み出し、パターンマッチングに使用する。なお、発明の種類を特徴付ける文字列をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
日本の特許明細書の請求項は、一般に、発明の種類を特定する単語に、「句点記号(。)」を加えた形の文字列で終了する。たとえば、物の発明に関する請求項では、末尾の文言が、「装置」、「機器」、「デバイス」、「回路」、「システム」、「プログラム」、または「記録媒体」等の単語に、「。」が続く形となる。また、方法の発明に関する請求項では、末尾の文言が、「方法」、「製法」、「プロセス」等の単語に、「。」が続く形となる。
そこで、発明種判別部67は、これらの発明の種類を特徴付ける文字列をROMから読み出す。これにより発明種判別部67は、分析対象の請求項の末尾の文言と、ROMから読み出した発明種特徴付け文字列とを比較することによって、請求項の末尾の文言が、所定の発明種特徴付け文字列で終了しているか否かを判定する。ここで、請求項の末尾の文言が、物の発明であることを特徴付ける文字列で終了すると判定するとき、発明種判別部67は、分析対象の請求項を、物の発明に関する請求項であると判別する。一方、請求項の末尾の文言が、方法の発明であることを特徴付ける文字列で終了すると判定するとき、発明種判別部67は、分析対象の請求項を、方法の発明に関する請求項であると判別する。あるいは、請求項の末尾の文言が、方法の発明であることを特徴付ける文字列で終了しないと判定するとき、発明種判別部67は、分析対象の請求項を、物の発明に関する請求項であると判別する。
なお、英語の特許明細書の請求項(独立請求項)は、大きく分けて3つのパートで構成されていることが多く、すなわち、前提部分(請求すべき対象を記述した導入部)、移行部分(前提部分と実体部分とをつなぐ部分)及び実体部分(発明の特徴を表現した重要部分)から構成されている。そして、発明の種類を特徴付ける単語(文字列)は、主に前提部分に記載されている。そこで、発明種判別部67は、前提部分の各単語と、ROMから読み出した発明種特徴付け文字列(英語の場合、物の発明であれば「apparatus」等、方法の発明であれば「process」等)とを比較することによって、物の発明又は方法の発明に関する請求項であると判別する。
発明種判別部67は、分析対象の特許明細書データの特許番号と、判別した発明種特徴付け文字列とを関連づける。たとえば、発明種判別部67は、特許番号「特許・・・号」と、文字列「方法発明」とを関連づける。発明種判別部67は、この関連づけによって生成したデータを、発明非特定事項文字削除部65へ出力する。
このように、本実施形態の特許情報分析装置14eは、発明非特定事項文字削除部65および発明種判別部67を備えている。これにより、特許情報分析装置14eは、たとえば、物の発明に関するものと判別した請求項データから、発明構成要素非特定文字を削除することができる。この場合、特許情報分析装置14eは、より特許請求の範囲の広い請求項について分析できる。すなわち、特許情報分析装置14eは、特許明細書データをより詳細に分析できる。
<2.まとめ>
以上のように、本実施形態の特許情報分析装置14eは、第8の実施形態の特許情報分析装置14に、発明種判別部67を組み合わせたものである。しかし、本発明はこれに限定されず、他の任意の実施形態に記載の各特許情報分析装置に、発明種判別部67を組み合わせたものとしても実現できる。
〔第15の実施形態〕
本発明の第15の実施形態について、図42を参照して以下に説明する。
本実施形態の特許情報分析装置14fは、特許明細書データに含まれる請求項に係る発明が、数値限定発明であるか否かを判別する。さらに、請求項に含まれる発明構成要素非特定文字を削除する。これにより、特許情報分析装置14fは、数値限定発明であるか否かの判別と、発明構成要素非特定文字の削除とを、同じ分析対象の請求項に適用する。
<1.装置構成>
まず、本実施形態に係る特許情報分析装置14fの構成について、図42を参照して以下に説明する。図42は、第15の実施形態に係る特許情報分析装置14fの動作を説明する図である。この図に示すように、特許情報分析装置14fは、入力部20、出力部30、記憶部40、およびデータ処理部56cを備える。
これらのうち、入力部20、出力部30、および記憶部40については、図24に示す各部と同一であるため、その説明を省略する。
データ処理部56cは、入力部20を通じて入力された特許番号に基づき、この特許番号の特許明細書データを分析する。このときデータ処理部56cは、入力された特許番号が付与されている特許明細書データを、記憶部40から読み出す。特に、データ処理部56cは、特許明細書データの請求項部分を読み出す。本実施形態では、データ処理部56cは、特許明細書データの請求項部分を日本語のテキストデータとして読み出す。データ処理部56cは、読み出したテキストデータを図示しない作業用メモリーに格納する。これによりデータ処理部56cは、図示しない作業用メモリー内のテキストデータを分析する。
数値限定発明判別部68(第2の数値限定発明判別手段)は、特許明細書データの請求項に記載された発明の種類を判別する。このとき数値限定発明判別部68は、ある請求項に係る発明が、数値限定発明であるか否かを判別する。数値限定発明判別部68は、発明の種類の判別に、パターンマッチング等の文字列検索技術を使用する。
特許情報分析装置14fは、所定の数値限定があることを特徴付ける文字列を、図示しないROMあらかじめ格納している。これにより、数値限定発明判別部68は、このデータをROMから読み出し、パターンマッチングに使用する。なお、数値限定があることを特徴付ける文字列をあらかじめ格納しておく記録媒体は、CD−ROMやDVD−ROMまたはハードディスク等であってもよい。
数値限定があることを特徴付ける文字列として、単位を表す記号(たとえば、「°」、「μ」、「%」等)がある。また、数式等を構成する記号(たとえば、「≧」、「>」、「≦」、「<」等)がある。さらに、数量の程度を示す文字列(「以下」、「未満」等)等がある。特許明細書の請求項に係る発明が、数値限定発明である場合、その請求項は、これらの、数値限定があることを特徴付ける文字列を含んでいる。
数値限定発明判別部68は、特許明細書データの請求項に記載された発明の種類を判別する。このとき数値限定発明判別部68は、ある請求項に係る発明が、数値限定発明であるか否かを判別する。数値限定発明判別部68は、発明の種類の判別に、パターンマッチング等の文字列検索技術を使用する。
そこで、数値限定発明判別部68は、これらの数値限定があることを特徴付ける文字列をROMから読み出す。これにより数値限定発明判別部68は、分析対象の請求項に含まれる文字列と、ROMから読み出した、数値限定があることを特徴付ける文字列とを比較することによって、請求項に、所定の数値限定があることを特徴付ける文字列が含まれているか否かを判定する。ここで、請求項に、数値限定があることを特徴付ける文字列が含まれていると判定するとき、数値限定発明判別部68は、分析対象の請求項を、数値限定発明に関する請求項であると判別する。一方、請求項に、数値限定があることを特徴付ける文字列が含まれていないと判定するとき、数値限定発明判別部68は、分析対象の請求項を、数値限定を含んでいない発明に関する請求項であると判別する。
数値限定発明判別部68は、分析対象の特許明細書データの特許番号と、判別した発明種特徴付け文字列とを関連づける。たとえば、数値限定発明判別部68は、特許番号「特許・・・号」と、文字列「数値限定発明」とを関連づける。数値限定発明判別部68は、この関連づけによって生成したデータを、発明非特定事項文字削除部65へ出力する。
<2.まとめ>
以上のように、本実施形態の特許情報分析装置14fは、第8の実施形態の特許情報分析装置14に、数値限定発明判別部68を組み合わせたものである。しかし、本発明はこれに限定されず、他の任意の実施形態に記載の各特許情報分析装置に、数値限定発明判別部68を組み合わせたものとしても実現できる。
<第8〜第15の実施形態の補足事項>
特許情報分析装置は、第8〜第15の実施形態に示す個別分析を組み合わせてもよい。たとえば、請求項に含まれる構成要件の抽出と、同じ項に含まれる上位概念用語の抽出とを組み合わせれば、より特許請求の範囲が広い特許明細書データを検索することができる。
また、第8〜第15の実施形態では、特許情報分析装置は、特許明細書データを分析しているがこれに限らず、実用新案明細書データであっても分析できる。すなわち、本発明でいう特許情報とは、特許明細書データおよび実用新案明細書データを含む意である。
また、第8〜第15の実施形態では、特許情報分析装置は、請求項1のみを分析対象としているが、本発明はこの構成に限定されるものではない。すべての請求項を分析対象としてもよく、その場合は、独立請求項に係る発明を分析対象とすることが好ましい。すなわち、一般に、独立請求項に係る発明の限定事項は、従属請求項に係る発明のそれよりも少ない。そこで、独立請求項に係る発明の種類を判別することが好ましい。
また、独立請求項及び従属請求項の判別方法としては、例えば、請求項を構成する文字列を検索するやり方がある。すなわち、従属請求項の場合は、一つの請求項を構成する文字列の中に「・・ことを特徴とする請求項1または3に記載の装置」等の他の請求項を引用することを示す記載が有り、必ず「請求項」という文字列が含まれ、一方、独立請求項の場合は、他の請求項を引用しないため、請求項を構成する文字列の中に「請求項」という文字列が含まれない。そこで、一つの請求項を構成する文字列の中に「請求項」という文字列があるか否かを検索することにより、独立請求項及び従属請求項の判別を行うことができる。
第8〜第15の実施形態では、特許情報分析装置は、2つの特許明細書データが同分野の特許情報か否かを、IPC、FI、Fターム、またはUSクラス等の特許分類記号によって判定する。しかし、特許情報分析装置は、複数の特許明細書データが同分野の特許情報か否かを、キーワード検索等で任意に調査してもよい。この場合、特許明細書データが同分野の特許情報か否かを、キーワード検索の結果に基づき決定する。
<全体の補足事項>
第1〜第15の実施形態では、特許情報分析装置は、記憶部40にテキストデータを格納している。この特許明細書データは、特許情報分析装置が処理できるデータであれば、テキストデータ以外の他の形式のデータであってもよい。たとえば、特許明細書データは、HTML(Hyper Text Markup Language)形式のデータであってもよい。さらに、XML(Extensible Markup Language)形式のデータであってもよい。
また、第1〜第15の実施形態では、主に日本の特許明細書(日本語)又は米国の特許明細書(英語)を分析対象としたが、本発明は、これらに限らず、各国の特許明細書に合わせて、その国の言語での各単語(文字列)を適宜判別して分析してもよい。
以上のように、発明種判別部63は、特許明細書データの請求項に含まれる文字列と、あらかじめ定められた、発明の種類を特徴付ける文字列とを比較する。この比較結果に基づき、発明種判別部63は、分析対象の請求項に記載されている発明の種類を判別する。発明数カウント部73は、発明種判別部63が判別した発明の数をカウントする。比較評価部83は、発明数カウント部73による発明のカウント結果に基づき、特許明細書データを評価する。従って、特許明細書の請求項に記載の発明が権利を行使しやすいものであるか否かを客観的に分析することが可能となる。
また、発明非特定事項文字削除部65は、請求項に含まれる文字列と、あらかじめ定められた、上記請求項に記載されている発明を特定することに直接関わらない、形式的な文字列とを比較する。これにより、発明非特定事項文字削除部65は、請求項に含まれている少なくとも一部の形式的な文字列を、分析対象の特許明細書データから削除する。発明特定事項文字数カウント部75は、少なくとも一部の形式的な文字列を削除した請求項に含まれる単語数をカウントする。従って、特許明細書の請求項に記載の発明に係る特許請求の範囲の広さを客観的に分析することが可能となる。
なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
また、本発明の目的は、上述した特許情報分析装置の各機能を実現するソフトウェアである特許情報分析プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、装置に供給し、その装置のコンピュータ(またはCPU(Central Processing Unit)やMPU(Micro Processing Unit)、DSP(Digital Signal Processor))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記プログラムコードを供給するための記録媒体は、装置と分離可能に構成できる。また、上記記録媒体は、プログラムコードを供給可能であるように固定的に担持する媒体であってもよい。そして、上記記録媒体は、記録したプログラムコードをコンピュータが直接読み取ることができるように装置に装着されるものであっても、外部記憶装置として装置に接続されたプログラム読み取り装置を介して読み取ることができるように装着されるものであってもよい。
たとえば、上記記録媒体としては、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R/DVD−R/DVD−RAM等の光ディスクを含むディスク系、ICカード(メモリーカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリー系などを用いることができる。
また、装置を通信ネットワークと接続可能に構成し、上記プログラムコードを、通信ネットワークを介して供給してもよい。そして、通信ネットワークとしては、特に限定されず、具体的には、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、具体的には、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された搬送波あるいはデータ信号列の形態でも実現され得る。上述した機能は、コンピュータが読み出した上記プログラムコードを実行することによって実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(Operating System)などが実際の処理の一部または全部を行うことによっても実現される。
さらに、上述した機能は、上記記録媒体から読み出された上記プログラムコードが、コンピュータに装着された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリーに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても実現される。