JP5159410B2 - 特許明細書分析表示装置 - Google Patents

特許明細書分析表示装置 Download PDF

Info

Publication number
JP5159410B2
JP5159410B2 JP2008110211A JP2008110211A JP5159410B2 JP 5159410 B2 JP5159410 B2 JP 5159410B2 JP 2008110211 A JP2008110211 A JP 2008110211A JP 2008110211 A JP2008110211 A JP 2008110211A JP 5159410 B2 JP5159410 B2 JP 5159410B2
Authority
JP
Japan
Prior art keywords
character string
components
patent specification
case
total number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008110211A
Other languages
English (en)
Other versions
JP2009259154A (ja
Inventor
元 安彦
Original Assignee
元 安彦
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 元 安彦 filed Critical 元 安彦
Priority to JP2008110211A priority Critical patent/JP5159410B2/ja
Publication of JP2009259154A publication Critical patent/JP2009259154A/ja
Application granted granted Critical
Publication of JP5159410B2 publication Critical patent/JP5159410B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、特許明細書に記載された情報を抽出してこれを表示する際に好適な特許明細書分析表示装置、特許明細書分析システムに関する。
従来、短時間で特許明細書のチェックを行うことを目的とするものであって、特に、クレーム数を極力小さく抑える場合においても、かかる中間概念の記載を含めてより簡単に、かつ権利範囲や特許率をも考慮してチェックすることができ、さらには明細書の記載の方向性そのものを中間概念をも含めて容易にチェックすることができる明細書分析表示装置が特許文献1に開示されている。
特開2006−155151号公報
本発明は、特許明細書における特許請求の範囲に定義された発明の限定度合をカウントして表示することが可能な特許明細書分析表示装置、特許明細書分析表示用のプログラム、特許明細書分析表示システムを提供することを目的とする。
本発明は、上述した課題を解決するために、特許明細書に記載された情報を抽出してこれを表示するための特許明細書分析表示装置において、電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出手段と、上記文字列抽出手段により抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウント手段と、上記カウント手段によりカウントされた総格成分数を、発明の限定度合いとして表示する表示手段とを備えることを特徴とする。
本発明は、上述した課題を解決するために、特許明細書に記載された情報を抽出してこれを表示するための特許明細書分析表示用のプログラムにおいて、電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出ステップと、上記文字列抽出ステップにより抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウントステップと、上記カウントステップによりカウントされた総格成分数を、発明の限定度合いとして表示する表示ステップとをコンピュータに実行させることを特徴とする。
本発明は、上述した課題を解決するために、特許明細書を電子データ化してネットワークを介して送信する送信端末と、上記ネットワークを介して送信されてきた上記電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出手段と、上記文字列抽出手段により抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウント手段と、上記カウント手段によりカウントされた総格成分数を発明の限定度合いとし、これを上記ネットワークを介して上記送信端末へ通知する通知手段とを有することを特徴とする。
上述した構成からなる本発明では、特許明細書における特許請求の範囲に定義された発明の限定度合をカウントして表示することが可能となる。
以下、本発明を実施するための最良の形態として、特許明細書に記載された情報を抽出してこれを表示する明細書分析表示装置について、図面を参照しながら詳細に説明する。
本発明の理論的説明
本発明では、特許発明の技術的範囲の広さを定量化、数値化するための数値化方法における最小抽出単位として、新たに格成分を提案する。
特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cには、動詞句が係り受けする。即ち、各構成要素A、B、Cを主語としたとき、これらにはそれぞれ動詞句が係り受けし、主語と述語とからなる文を成立させることができる。これら動詞句における動詞は、述語として文を形成するにあたり、自らの表す動き、状態、関係を実現させるために、どのような名詞句の組み合わせを取るかが基本的に決まっている。動詞が自らの帯びている語彙的意味の類的なあり方に応じて、文の形成に必要な名詞句の組み合わせを選択的に要求する働きを、動詞の格支配と仮称するならば、動詞により文の成分として要求された名詞句は、動詞を補足する上での格成分ということができる。
例を挙げて説明するならば、構成要素“信号生成手段”が下記のB−1)により定義されているものとする。
B−1)「ユーザからの要求に応じて駆動信号を生成する信号生成手段と、〜」
このとき、「ユーザからの要求に応じて駆動信号を生成する」という動詞句が信号生成手段に係り受けする。この動詞句において「生成する」という動詞の動作を実現・完成させるために、「ユーザからの要求(に応じて)」、「駆動信号(を)」という名詞句を要求する働きが格支配であり、これら名詞句が格成分である。そして、「ユーザからの要求(に応じて)」、「駆動信号(を)」といった名詞句が、それぞれ「生成する」という動詞に対して「動作開始条件」「対象」といった類的な関係的意味が格である。この格成分を実現している名詞句の担っている語彙的意味、またそれらの名詞句が帯びている関係的意味としての格によって形成されるものが、この動詞「生成する」により実現すべき命題の中核部分となる。上記例で言うならば “生成する”という動詞による命題を実現するための動作開始条件として、“ユーザからの要求に応じて”いなければならず、さらにその対象として“駆動信号”を生成しなければならないため、これら2つが動詞による命題実現のため条件数となっている。
図1に示すように、このような動詞による命題実現のためにクリアしなければならない条件数が少ない場合を模式的に表したものである。動詞による動作開始のための条件の数が少なくなるため、命題を実現できる可能性が向上する。これに対して、図2は、動詞による命題実現のためにクリアしなければならない条件数が増加した場合を模式的に表したものであり、かかる場合には命題を実現できる可能性が低下する。
条件数が増加するほど、実際に動作が開始されるまでに条件を満たすか否かの判断のステップ数が増加することになる。各条件を満たす確率に多少の差異があることを考慮しても、この条件の判断ステップ数が増加するに従い、換言すれば条件を規定する格成分が増加するに従い、その動詞句が係り受けする構成要素Aに該当する可能性が低くなることを意味しており、その可能性の低下した分、技術的範囲が狭まることを示している。逆に、格成分数が少ない場合には、その動詞句が係り受けする構成要素Aに該当する可能性が高くなることを意味しており、その分において技術的範囲が広がることを示している。
このように格成分数(条件数)が、動詞による動作開始可能性、ひいては命題実現の可能性を支配し、これが技術的範囲の広狭に影響を及ぼすものであるから、特許請求の範囲の数値化方法の最小抽出単位を格成分として、この動詞句に含められている格成分数をカウントすることにより、技術的範囲の広さに応じた数値化を実現することができるものと考えられる。
上述したB−1)の例では、構成要素「信号生成手段」の命題を実現するための動詞「生成する」に係り受けする2つの格成分「ユーザからの要求に応じて」「駆動信号を」が存在するため、格成分数が2となる。このとき、動詞「生成する」の動作開始条件を規定する「ユーザからの要求に応じて」という格成分が存在しない場合には、格成分数が1となり、ユーザからの要求の有無に関係なく、いつでも「駆動信号」を「生成する」ことができることになり、「信号生成手段」の命題を実現できる可能性が高くなる。これは構成要素「信号生成手段」により、侵害被疑製品の技術的要素の同一性を立証できる可能性を向上させることができることを示唆しており、かかる可能性の向上させた分が、侵害被疑製品に対する特許発明の捕捉容易性、ひいては特許発明の技術的範囲の広さに相当するものと考えられる。このため、構成要素の命題実現可能性を格成分数を介して表現することにより、技術的範囲の広さに応じた、より最適な数値化、定量化を図ることができるものと考えられる。
特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cについてそれぞれ格成分数を求め、その総和を特許発明としての○○装置の格成分数とする。仮に、構成要素Aの格成分数が1、構成要素Bの格成分数が3、構成要素Cの格成分数が2とした場合に、これらにより構成される特許発明としての○○装置の格成分数は、その総和である6となる。
実際に各構成要素の格成分数を求める際に、上述したB−1)の例では、「生成する」という動詞に係り受けする格成分「ユーザからの要求に応じて」「駆動信号を」を抽出することになるが、この格成分の実際の抽出作業は、「応じて」「を」等、形態素を目印にして行っていくことになる。
表1に格成分を抽出する際に、目印として参照する形態素の例を示す。
Figure 0005159410
特許請求の範囲は、B−1)のようなオーソドックスな形で定義されている場合のみならず、例えばC−1)に示すように定義される場合もある。
C−1)「第1のレンズによりスポット径を制御された光束を反射板により全反射する反射手段と、〜」
例えば、特許請求の範囲を構成する構成要素「反射手段」には、「全反射する」という動詞が係り受けする。この「全反射する」という動詞の動作開始条件を規定する格成として、「光束(を)」と、「反射板(により)」が存在することになり、先ず格成分数2をカウントすることができる。しかし、このうち一の格成分「光束」に着目した場合に、「第1のレンズによりスポット径を制御された」という動詞句がさらに係り受けしているのが分かる。あらゆる光束を「全反射する」対象として定義するよりも、むしろ条件が付加された光束を「全反射する」対象として定義した方が、技術的に限定が付加され、構成要素「反射手段」の命題実現可能性が低下する。このため、この命題実現可能性の低下分を格成分数として補正する必要が出てくる。
かかる場合には、「光束」に係り受けする動詞句「第1のレンズによりスポット径を制御される」において、「制御する」という動詞により格支配される2つの格成分「第1のレンズ(により)」、「スポット径(を)」が存在しているため、さらに格成分数2を加算する。その結果、C−1)は合計の格成分数は4となる。
なお、この特許請求の範囲の記載C−1)は、明細書作成者によっては下記のC−2)のように定義される場合もある。
C−2)「第1のレンズにより光束のスポット径を制御する光束制御手段と、かかる光束を反射板により全反射する反射手段と、〜」
このC−2)における「光束制御手段」並びに「反射手段」により形成される技術的範囲は、C−1)と実質的に同一である。C−2)では、C−1)において「光束」に係り受けする動詞句の内容を、「光束制御手段」により実現すべき命題と位置づけて定義し直している。実際にC−1)においても、定義されている「光束」を作り出すためには、何らかの手段や部材を利用することになるが、あえて「光束制御手段」を挙げて定義していないに過ぎない。このC−2)についても同様に格成分数をカウントすると、光束制御手段で格成分数2、反射手段で格成分数2で合計で格成分数4となり、C−1)と同様の結果となる。
上述のように、構成要素の命題を実現するために要求される格成分の数を介して技術的範囲の広さをカウントするものであるため、互いに記載方法や単語数が異なるものの実質的に同一の技術的範囲からなるC−1)、C−2)を同等の格成分数で表現することができる。仮に最小抽出単位を構成要素とした場合にC−1)は1、C−2)は2となり、最小抽出単位を単語とした場合にC−1)は7、C−2)は、9となることを鑑みても、この格成分数は、より好適な数値化方法の最小抽出単位になり得るものと考えられる。
なお、C−1)、C−2)の構成は、以下のC−3)により定義される場合もあり得る。
C−3)「第1のレンズにより光束のスポット径を制御する光束制御手段と、上記光束制御手段によりスポット径が制御された光束を反射板により全反射する反射手段と、〜」
このC−3)の波線部は、C−2)における「かかる光束」の部分に相当する。しかし、この波線部に記載されている動詞句の内容は、「光束制御手段」に係り受けする直線部により既に実現されてしまった命題であり、波線部の記載をあえて入れたのは「反射手段」が全反射する対象としての「光束」について解釈上の疑義が生じないようにするための確認的なものに過ぎない。このため、格成分数を計算する際に、この波線部の記載をも同様にカウントすることになれば、下線部の内容を二重カウントすることになり測定精度の悪化を招く結果となる。
このため、既に命題として実行済みの波線部の記載は、改めてカウントしないように留意することにより、クレームの記載順序や記載方法による格差に伴う格成分数のずれを解消することが可能となる。実際には、この直線部の記載と、波線部の記載とにより実現される命題が同一か否かを判断する必要がある。
最小抽出単位を格成分とした数値化方法では、特に命題の同一性を判断する際において有用なものとなる。格成分は単語と異なり、動詞により支配される性質を持つため、格成分が同一であるということは、格成分の内容に加えてこれを支配する動詞も同一でなければならないことを意味している。格成分と、これを支配する動詞の双方が同一であれば、これにより実現される命題も同一となる。このため、格成分の同一性の判断を介して、命題が同一か否かを識別することが可能となり、ひいては二重カウントか否かを容易に識別することが可能となる。また、明細書作成者間の記載方法の相違により、得られる数値に影響が及ぶこともなくなる。
なお、上述した例では、特許請求の範囲の記載が構成要件列挙型で記載されている場合を例にとり説明をしたが、他の形式で記載されていても同様にカウントすることができる。例えば、ジェプソン型で記載されていた場合には、公知部分とされる「おいて書き」の記載についても同様の方法によりカウントする。このとき、「おいて書き」の記載のカウント方法が分からない場合には、ジェプソン型から構成要件列挙型に書き換えた上でカウントするようにしてもよい。ちなみに、このジェプソン型から構成要件列挙型への書き換え方法は、従来から周知であり、例えば文献[39]において、その方法が言及されている。
また、特許請求の範囲が書き流し型で記載されていた場合も同様の手法によりカウントすることができる。例えば、C−2)が書き流し型で記載されていた場合には、以下のC−4)のようになる。
C−4)「第1のレンズにより光束のスポット径を制御し、かかる光束を反射板により全反射し、〜」
この書き流し型で記載されたC−4)は、C−2)と比較して、「光束制御手段」並びに「反射手段」の文言が抜けている点が相違するが、それ以外は同一である。「光束制御手段」並びに「反射手段」は、主語であってこれをカウントの対象とせず、あくまでこの主語に係り受けする名詞句をカウントするため、書き流し型と構成要件列挙型との間で格成分数が異なることはない。
上述の提案した数値化方法における最小抽出単位があまりに大きい場合には、特許請求の範囲中の条件や要素を正確に拾い出すことができず、逆に最小抽出単位があまりに小さい場合には、実際に測定した数値が動詞による動作開始のための条件数に対応しなくなり、却って測定の精度を悪化させてしまう。いかなる最小抽出単位が最も有効であるかは、過去の侵害訴訟の判例において特許の請求の範囲から技術的範囲がいかに解釈されてきたか、統計的なデータに基づいて決定していく必要がある。
一般に、特許発明の技術的範囲が広い場合には、侵害被疑製品を特許発明の技術的範囲に捕捉することができる確率が高くなり、特許発明の技術的範囲が狭い場合には、侵害被疑製品を特許発明の技術的範囲に捕捉することができる確率が低くなる。その結果、技術的範囲の広狭に対する侵害被疑製品の捕捉成功確率は、理想的には技術的範囲が広くなるにつれて上昇し、逆に技術的範囲が狭くなるにつれて減少する。これは、理想的な“ものさし”により測定した特許請求の範囲の文節構造体数が多ければ捕捉成功度数が多くなることを意味している。
これに対して、技術的範囲の広狭に対する侵害被疑製品の捕捉失敗確率は、理想的には技術的範囲が広くなるにつれて減少し、逆に技術的範囲が狭くなるにつれて上昇する。これは、理想的な“ものさし”により測定した特許請求の範囲の文節構造体数が多ければ捕捉失敗度数が多くなることを意味している。
このため、提案した数値化方法により特許請求の範囲を数値化表示し、この数値化された値と、侵害被疑製品に対する技術的範囲の捕捉成功(失敗)度数との関係から、その数値化方法における最小抽出単位の妥当性を、上述の如き理想的な“ものさし”と比較することにより、判断することができるものと考えられる。
提案した数値化方法により技術的範囲を数値化した結果、例えば侵害被疑製品の捕捉成功度数が低めに偏在し、逆に捕捉失敗度数が高めに偏在する場合には、理想的な“ものさし”に近く、その提案した数値化方法の最小抽出単位は、技術的範囲を数値化、定量化する上で好適なものと判断することができる。
これに対して、例えば図3に示すように、数値化方法による技術的範囲の実測値分布が、技術的範囲捕捉成功/失敗との間で、明確な関係付けを行うことができない場合には、理想的な“ものさし”からはほど遠く、その提案した数値化方法の最小抽出単位は、技術的範囲を数値化、定量化する上で不適合なものであると判断することができる。
一般に理想的なスケールを持った“ものさし”では、対象物を測定した結果、測定対象物を他との間で正確に見分けることができ、しかもその外延を明確化することができる。即ち、提案した数値化方法を利用しても測定対象物を他との間で見分けることができなければ、かかる測定対象物を測定する上で、そのスケールは、理想的な“ものさし”と比較してふさわしいものとは言えない。
実際の特許侵害訴訟の対象となった特許発明について、提案した数値化方法の最小抽出単位としての格成分により、その技術的範囲の広さを数値化し、これと技術的範囲捕捉成功度数/解析件数との関係を調査した。
実際の調査は、裁判所ホームページの知的財産裁判例集において、判例検索システムを活用し、権利種別“特許権”、訴訟類型“民事訴訟”の条件の下で検索を行ったところ、2006年8月11日現在で882件ヒットした。その中から、特許権侵害差止等請求事件、特許権侵害損害賠償請求事件の地方裁判決を直近の案件から計199件抽出した。東京高裁判決は、調査対象から除外した。また数値限定により技術的範囲の広狭が左右されやすい化学、材料、生物等の分野の判決例は調査対象から除外することとし、あくまでステップ数や動作数、条件数により技術的範囲の広狭が主に支配されると考えられる電気、機械分野を調査対象の中心に据えた。また、平成5年以降に提起された特許侵害訴訟を調査対象とし、それ以前に提起された判決例は除外している。
次に、このような条件の下で抽出した199件に亘る各裁判例について、その内容を精査し、侵害被疑製品(イ号物件)に対して実際に直接侵害である旨を主張している本件特許発明の特許請求の範囲を特定する。そして、この特定した特許請求の範囲の記載に対して、各最小抽出単位を格成分とした数値化方法により、その技術的範囲の数値化を行う。この数値化は、上述した各最小抽出単位によるカウント方法に則って、著者による手作業で行った。
さらに、判決文における「当裁判所の判断」の欄を精査し、侵害被疑製品が本件特許発明の技術的範囲に含まれているか否かの見解を読み取った。これにより、実際に数値化方法で技術的範囲の広さを数値化した特許請求の範囲により、侵害被疑製品を技術的範囲内に捕捉できたか否かを判断することにした。ちなみに侵害被疑製品を本件特許発明の技術的範囲内に捉えることができても、被告による各種抗弁(例えば、権利濫用の抗弁等)や無効審判の認容審決等により実際に侵害訴訟には負けてしまう場合もあるが、かかる要素までを考慮に入れると調査の目的から逸脱してしまう可能性がある。なお、このような各種抗弁を考慮に入れなければ、技術的範囲の広狭の議論につながらないという見方もあるが、本発明の目的は、数値化した特許請求の範囲と技術低範囲の広狭との間にある程度の対応関係があることを確認することを目的としており、技術的範囲を誤差なく測定する理想的な「ものさし」までを提案することを目的としていない。このため、本調査では、あくまで特許発明の侵害被疑製品に対する技術的範囲捕捉成功/失敗か、のみに着目して判断することにしている。
図4は、最小抽出単位を格成分とした数値化方法による、技術的範囲の測定数値に対する技術的範囲捕捉成功/失敗と関係を示している。即ち、この図4は、横軸を格成分数とし、縦軸を成功率として表したものである。格成分数が小さいほど成功度数並びに成功率が高くなり、逆に格成分数が大きいほど成功率が低くなる傾向は示されていた。
因みに、数値化方法の最小抽出単位(総格成分数)に対する技術的範囲捕捉成功度数分布と失敗度数分布の有意差を統計的に判断するために、t検定を行ったところ、5.69であった。
また、本発明では、新たに補正度合という着想を提出する。補正度合とは、一の特許請求の範囲につき、出願から権利化に至る権利形成過程において、当初の請求の範囲の記載から実際に改変が行われた格成分数(以下、改変格成分数という。)を示すものである。
ここでいう格成分数の改変は、あくまで新規性、進歩性欠如の拒絶理由通知を受けて、あくまで引用文献との間で構成上の差異を見出し、特許性を向上させることを目的とした特許請求の範囲への補正に基づくものである。しかし、自発的な補正や、記載不備を解消するための補正によるものも含めてもよい。
一般に、新規性、進歩性欠如の拒絶理由通知を受けて、特許請求の範囲に対して行われる補正は、構成要件を限定することにより、実際の総格成分数がC(0)からC(n)に至るまで増加する傾向にある。その理由として、進歩性欠如の拒絶理由通知に対して特許請求の範囲の記載を補正する場合、通常は構成要件を追加することになり、その追加した分について動作条件が増加し、ひいては総格成分数が増加することになる。このため、権利化時における特許請求の範囲の格成分数と、当初明細書における当該特許請求の範囲の格成分数との差分値が、補正度合に相当するものとする。
これに加えて、この補正度合は、以下に説明する概念も含む。
出願人は、調査した先行技術と抵触しない範囲においてできるだけ広い権利を取得することができるように、特許請求の範囲を記載していくことになるが、これがにおけるC(0)に反映されることになる。どれだけ出願人が広い権利を取得しようと意図していたかは、このC(0)に反映される。このC(0)はいわば出願人が広い権利の取得を期待していた期待値である。
しかしながら審査段階において拒絶理由通知を受けた場合には、これに対応するために特許請求の範囲の記載に構成要件を追加することを余儀なく行わざるを得ず、その結果、構成要件の限定が係る分、技術的範囲が狭くなり、格成分数の改変が生じる。その結果、最終的に特許請求の範囲の記載を状態C(n)まで限定した場合に、このC(n)は現実に先行文献との差異があり特許を取得することができる現実値と考えることができる。このC(0)とC(n)との差分が改変格成分数であるとしたとき、期待値が大きい場合には、この改変された格成分数も大きくなる。即ち、出願人が、先行技術と抵触しない範囲においてできるだけ広い権利を取得しようとする期待値は、この改変格成分数として反映されると考えることも可能となる。
ここで改変格成分数が権利の活用性に対して与える影響について考えてみる。特に進歩性等欠如の拒絶理由に対して余儀なく補正し、構成要件を追加し、又は入れ替えることにより、特許請求の範囲の記載を改変する際には、権利の活用性よりもむしろ特許性そのものに焦点が移りがちになることから、最終的に権利化された特許請求の範囲C(n)の技術的範囲が、予め想定した権利活用の場面と大きく異なる場合があり、これが却って構成要件の充足性を阻害する原因となることもある。
一方、進歩性等欠如の拒絶理由通知を受けて特許請求の範囲の記載を補正することにより、引用文献と構成上の差異がはっきりと見出されて発明の技術的特徴がより明確化され、これにより権利活用の方向性も明確化することができ、ひいては実際の活用の場面において構成要件の充足性が向上する可能性も否定できない。
このため、改変された格成分数も有用特許性を支配する可能性があることから、これを意思決定パラメータに含めるものとして考えるものとする。
なお、本発明では、カウントされた総格成分数を分母とした特許明細書評価値を更に表示するようにしてもよい。このときの評価値APIを、API=定数/総格成分数、と定義する。この少なくとも、この総格成分数は、大きいほど構成要件の充足性が低下することから、小さいほうが望ましい。このため、総格成分数を分母とした評価値としている。
本発明の実施方法
本発明を実施する上で、パーソナルコンピュータ(PC)を利用し、これに読み込まれたプログラムに基づいて行う。
先ず、電子データ化された特許明細書の記載を読み込む。電子データ化された特許明細書における特定の欄(特許請求の範囲の記載)に記載されている文字列を抽出する。また、この特定の欄とは、特許請求の範囲の1請求項分に相当する。
次に、抽出した文字列から総格成分数をカウントする。総格成分数とは、1請求項における格成分数を意味している。メインクレームの場合は、そのメインクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントすればよいが、サブクレームの場合には、そのサブクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントするとともに、当該サブクレームが従属するメインの請求項の格成分数をこれに加算する。
そして、カウントされた総格成分数を、発明の限定度合いとして例えばディスプレイ等を介して表示する。
このとき、総格成分数のカウントは、表1に示すような形態素を目印にして行ってもよい。ちなみに、ここでいう表1はあくまで一例であり、他のいかなる形態素に基づいてカウントしてもよいことは勿論である。
このとき上記カウントは、抽出された文字列において互いに重複する動作が定義されている文言を抽出し、当該抽出した文言に含まれる重複の格成分数をカウントし、カウントされた総格成分数から重複の格成分数を減算した値を、発明の限定度合いとして表示するようにしてもよい。これは上述した二重カウントを考慮したものである。
また、上記カウントは、上記抽出された文字列において互いに重複する動作が定義されている文言を抽出し、上記カウントにより抽出された文言を表示するとともに、ユーザからの総格成分数の減算値の入力を受け付け、さらに上記カウントされた総格成分数から、ユーザから入力された減算値を減算した値を、発明の限定度合いとして表示するようにしてもよい。ユーザに対して二重カウントか否か判断をしてもらう機会を与え、ユーザの判断結果の入力を受けて実際に減算値を出すプロセスを入れることで、精度の向上を図ろうとするものである。
また、本発明では、補正前の特許明細書における特定の欄に記載されている文字列を抽出し、更に補正後の特許明細書における特定の欄に記載されている文字列を抽出し、補正前の特許明細書から抽出された文字列、並びに補正後の特許明細書から抽出された文字列からそれぞれ総格成分数をカウントし、カウントされた補正前の特許明細書の総格成分数と、補正後の特許明細書の総格成分数との差分を求め、これを特許請求の範囲の上述したような補正度合として表示するようにしてもよい。
また、本発明は、上述した分析表示を行うプログラムがインストールされたPC等のような装置として具体化されていてもよいし、これらをPCに実行させるためのプログラム、又はこれが記録された記録媒体として具体化されていてもよい。
また、本発明は、ネットワークシステムにおいて適用されるようにしてもよい。先ず、クライアント側において、PC等の端末装置に格納されている特許明細書の電子ファイルを暗号化して、ネットワークを介して解析側へと送る。
解析側では、この送られてきた特許明細書の電子ファイルから文字列を抽出し、上述したプロセスに基づいて、総格成分数をカウントし、発明の限定度合を出す。そして、その発明の限定度合いを上記ネットワークを介してクライアント側の端末装置へ通知する。
構成要件列挙方式
「送信用光信号を/出射する発光手段(A)と、
上記発光手段の発した送信用光信号を/光ファイバの端面に/入射させる光束入射手段(B)と、
上記光ファイバの端面から出射する上記受信用光信号を/受光する受光手段(C)とを備え、
上記光束入射手段(B)は、/上記光ファイバの端面より射出される受信用光信号の光束の開口数よりも小なる開口数にて/該光ファイバに上記送信用光信号の光束を/入射させることを特徴とする光送受信装置。」
(“/”で囲まれた太字部分が格成分)
解説:
発光手段(A)と、光束入射手段(B)と、受光手段(C)の3つの構成要素からなる。発光手段(A)はまず、「送信用光信号を」出射するため、格成分数が1。光束入射手段(B)は、「上記発光手段の発した送信用光信号を」という対象の限定がかかり、また「光ファイバの端面」という場所の限定がかかり、条件数が2つあるため、格成分数が2。さらに受光手段(C)は、「上記光ファイバの端面から出射する上記受信用光信号を」という対象の限定がかかっているため、格成分数が1。ここで「上記光ファイバの端面から出射する」という文言は、既に光束入射手段(B)において光ファイバの端面に光信号を入射させる旨の限定がなされており、その結果当然光信号は出射されるため、二重カウントを防止するためにカウントしない。
光束入射手段(B)は、「光ファイバの端面より射出される受信用光信号の光束の開口数よりも小なる開口数にて」がさらに条件として加わっているため1格成分追加される。「光ファイバの端面より射出される受信用光信号」も二重カウントを避ける観点からカウントしない。また波線部の「該光ファイバに」、「上記送信用光信号の光束を」も既に定義した内容であるため、二重カウントを避けるためにカウントしない。
その結果、この請求項では、格成分数が合計5である。
ジェプソン形式
「レーザ光を変調して/外部に出射することにより/情報を送信する送信部と、/外部から入射されたレーザ光を/復調する受信部とを有する光空間伝送装置(D)において、
受光したレーザ光を/光電変換して受信信号を/生成する光電変換手段(E)と、
上記光電変換手段により生成された受信信号を/増幅する第1の増幅手段(F)と、
上記第1の増幅手段により増幅された受信信号を/増幅する第2の増幅手段(G)と、
上記第1の増幅手段により増幅された受信信号の低周波成分を/検出し、/検出した低周波成分に基づき/上記第1の増幅手段の出力が一定となるように/上記第1の増幅手段の増幅度を/制御する第1の制御手段(H)と、
上記第1の増幅手段により増幅された受信信号の高周波成分を/検出し、/検出した高周波成分に基づき/上記第2の増幅手段の出力が一定となるように/上記第2の増幅手段の増幅度を/制御する第2の制御手段(I)と、
を備えることを特徴とする光空間伝送装置。」
(“/”で囲まれた太字部分が格成分)
解説:
いわゆるおいて書きで記載された前段部としての光空間伝送装置(D)と、光電変換手段(E)と、第1の増幅手段(F)と、第2の増幅手段(G)と、第1の制御手段(H)と、第2の制御手段(I)と、の構成要素からなる。
光空間伝送装置(D)は、「レーザ光を変調して」、「外部に出射することにより」、「外部から入射されたレーザ光を」の3つの条件からなるため、格成分数が3.ちなみに波線の「情報を」は、何ら条件を規定するものではなく、動詞としての「送信」の補語に相当する非カウント要素とみなして格成分数としてカウントしない。光電変換手段(E)は、「受光したレーザ光を」、「光電変換して受信信号を」の2格成分数からなる。第1の増幅手段(F)は、「上記光電変換手段により生成された受信信号を」の1格正分数からなる。第2の増幅手段(G)は、「上記第1の増幅手段により増幅された受信信号を」の1格成分数からなる。第1の制御手段(H)は、「第1の増幅手段により増幅された受信信号の低周波成分を」、「検出した低周波成分に基づき」、「上記第1の増幅手段の出力が一定となるように」、「上記第1の増幅手段の増幅度を」の4つの条件からなるため、4格成分数となる。第2の制御手段(I)は、「上記第1の増幅手段により増幅された受信信号の高周波成分を」、「検出した高周波成分に基づき」、「上記第2の増幅手段の出力が一定となるように」、「上記第2の増幅手段の増幅度を」の4つの条件からなるため4格成分数となる。
即ち、ジェプソン形式においても、前段部を同様に格成分を介してカウントする。この請求項の合計の格成分数は、15である。
順次列挙方式
「所定の時間単位で/データを区切ったユニットにより/構成される時系列信号から、/ユニット単位で/時間順序を入れ換えるインターリーブ処理を/施した伝送信号を/生成し(J)、
上記伝送信号を/光信号に変換して/空間に/射出し(K)、
空間に射出された上記光信号を/受信して/伝送信号を/再生し(L)、
この伝送信号を/ユニット単位で/元の時間順序に入れ換えるデインターリーブ処理を/施し(M)、
順序を入れ換えられた上記伝送信号の品質の悪いデータのユニットを/その前後のユニットのデータに基づき/データの補間を/する(N)
ことを特徴とする光信号伝送方法。」
(“/”で囲まれた太字部分が格成分)
解説:
(J)〜(N)の構成要素からなる。
(J)は、「所定の時間単位で」、「データを区切ったユニットにより」、「構成される時系列信号から」、「ユニット単位で」、「時間順序を入れ換えるインターリーブ処理を」の5格成分数からなる。「データを区切ったユニットにより」は、「区切られたデータからなるユニット」と読み替えれば1格成分数、「構成される時系列信号から」は、「時系列信号を構成し」と読み替えれば1格成分数。
(K)は、「変換し」という動詞により要求されている格は、「上記伝送信号を」である。「光信号に変換し」における「光信号に」は「変換し」という動詞の補語であるため非カウント要素。「空間に」は場所を特定する格成分であり条件が一つ加わっているためカウント要素。このため、(K)は合計2格成分数。
(L)は、「空間に射出された上記光信号を」、「伝送信号を」の2格成分数。「空間に射出された」は、二重カウントとなるため、カウントしないが、「光信号を」は対象を特定している。また「伝送信号を」も同じく対象を特定。このため格成分数は2。
(M)は、「伝送信号を」、「ユニット単位で」、「元の時間順序に入れ換えるデインターリーブ処理を」の3条件で3格成分数。
(N)は、「順序を入れ換えられた上記伝送信号の品質の悪いデータのユニットを」、「その前後のユニットのデータに基づき」、「データの補間を」の3条件で3格成分数。
格成分について説明するための図である。 格成分について説明するための他の図である。 本発明の効果について説明するための図である。 最小抽出単位を格成分とした数値化方法による、技術的範囲の測定数値に対する技術的範囲捕捉成功/失敗と関係を示す図である。

Claims (8)

  1. 特許明細書に記載された情報を抽出してこれを表示するための特許明細書分析表示装置において、
    電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出手段と、
    上記文字列抽出手段により抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウント手段と、
    上記カウント手段によりカウントされた総格成分数を、発明の限定度合いとして表示する表示手段とを備えること
    を特徴とする特許明細書分析表示装置。
  2. 上記カウント手段は、形態素に基づいて上記格成分を抽出し、上記総格成分数をカウントすること
    を特徴とする請求項1記載の特許明細書分析表示装置。
  3. 上記カウント手段は、上記形態素として"を"、"により"、"基づいて"、"応じて"、"対応させて"、"場合には"、"時"、"から"、"に"、"へ"、"に対して"、"介して"、"介在させて"、"からなる"、"を有する"、"より"、"としての"、"状態で"に基づいて総格成分数をカウントすること
    を特徴とする請求項2記載の特許明細書分析表示装置。
  4. 上記カウント手段は、上記抽出された文字列において、上記格成分と、これが係り受けする動詞との同一性を判断することにより、互いに重複する動作が定義されている文言を抽出し、当該抽出した文言に含まれる重複の格成分数をカウントし、
    上記表示手段は、上記カウント手段によりカウントされた総格成分数から上記重複の格成分数を減算した値を、発明の限定度合いとして表示すること
    を特徴とする請求項1〜3のうち何れか1項記載の特許明細書分析表示装置。
  5. 上記カウント手段は、上記抽出された文字列において、上記格成分と、これが係り受けする動詞との同一性を判断することにより、互いに重複する動作が定義されている文言を抽出し、
    上記表示手段は、上記カウント手段により抽出された文言を表示するとともに、ユーザからの総格成分数の減算値の入力を受け付け、さらに上記カウント手段によりカウントされた総格成分数から、ユーザから入力された減算値を減算した値を、発明の限定度合いとして表示すること
    を特徴とする請求項1〜3のうち何れか1項記載の特許明細書分析表示装置。
  6. 上記文字列抽出手段は、補正前の特許明細書における特定の欄に記載されている文字列を抽出し、更に補正後の特許明細書における特定の欄に記載されている文字列を抽出し、
    上記カウント手段は、上記文字列抽出手段により補正前の特許明細書から抽出された文字列、並びに補正後の特許明細書から抽出された文字列から、それぞれ総格成分数をカウントし、
    上記表示手段は、上記カウント手段によりカウントされた補正前の特許明細書の総格成分数と、補正後の特許明細書の総格成分数との差分を求め、これを特許請求の範囲の補正度合として表示すること
    を特徴とする請求項1記載の特許明細書分析表示装置。
  7. 特許明細書に記載された情報を抽出してこれを表示するための特許明細書分析表示用のプログラムにおいて、
    電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出ステップと、
    上記文字列抽出ステップにより抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウントステップと、
    上記カウントステップによりカウントされた総格成分数を、発明の限定度合いとして表示する表示ステップとをコンピュータに実行させること
    を特徴とする特許明細書分析表示用のプログラム。
  8. 特許明細書を電子データ化してネットワークを介して送信する送信端末と、
    上記ネットワークを介して送信されてきた上記電子データ化された特許明細書における特許請求の範囲の欄に記載されている文字列を抽出する文字列抽出手段と、上記文字列抽出手段により抽出された文字列から、当該文字列に含まれる各構成要素に係る動詞に係り受けする名詞句としての格成分を抽出し、当該文字列中の格成分の数を示す総格成分数をカウントするカウント手段と、上記カウント手段によりカウントされた総格成分数を発明の限定度合いとし、これを上記ネットワークを介して上記送信端末へ通知する通知手段とを有すること
    を特徴とする特許明細書分析システム。
JP2008110211A 2008-04-21 2008-04-21 特許明細書分析表示装置 Active JP5159410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008110211A JP5159410B2 (ja) 2008-04-21 2008-04-21 特許明細書分析表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008110211A JP5159410B2 (ja) 2008-04-21 2008-04-21 特許明細書分析表示装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012254649A Division JP5361099B2 (ja) 2012-11-20 2012-11-20 特許明細書分析表示装置

Publications (2)

Publication Number Publication Date
JP2009259154A JP2009259154A (ja) 2009-11-05
JP5159410B2 true JP5159410B2 (ja) 2013-03-06

Family

ID=41386472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008110211A Active JP5159410B2 (ja) 2008-04-21 2008-04-21 特許明細書分析表示装置

Country Status (1)

Country Link
JP (1) JP5159410B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5572784B2 (ja) * 2012-09-11 2014-08-20 技術経営ソリューション株式会社 格成分の係り受け表示プログラム
JP5311319B1 (ja) * 2012-11-06 2013-10-09 株式会社野村総合研究所 格成分抽出プログラム
JP5361099B2 (ja) * 2012-11-20 2013-12-04 技術経営ソリューション株式会社 特許明細書分析表示装置
JP6366902B2 (ja) * 2013-05-13 2018-08-01 技術経営ソリューション株式会社 英文の特許明細書からの格成分抽出プログラム
JP6206874B2 (ja) * 2013-10-02 2017-10-04 株式会社野村総合研究所 格成分抽出プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197699B2 (ja) * 2002-10-23 2008-12-17 有限会社アイ・アール・ディー 情報処理装置、情報処理方法、およびプログラム
KR101035197B1 (ko) * 2005-05-26 2011-05-18 샤프 가부시키가이샤 특허 정보 분석 장치, 특허 정보 분석 방법, 및 특허 정보 분석 프로그램을 기록하고 있는 컴퓨터 판독 가능한 기록 매체

Also Published As

Publication number Publication date
JP2009259154A (ja) 2009-11-05

Similar Documents

Publication Publication Date Title
JP5159410B2 (ja) 特許明細書分析表示装置
CN110462619B (zh) 检测系统、检测方法、以及计算机程序
US20170142327A1 (en) Digital image capturing device system and method
US8006180B2 (en) Spell checking in network browser based applications
Cormier et al. The relevance of XBRL voluntary disclosure for stock market valuation: The role of corporate governance
Cortegiani et al. Citations and metrics of journals discontinued from Scopus for publication concerns: the GhoS (t) copus Project
Sjoding et al. Gaming hospital-level pneumonia 30-day mortality and readmission measures by legitimate changes to diagnostic coding
Wang et al. Quantifying scientific breakthroughs by a novel disruption indicator based on knowledge entities
US20190156348A1 (en) Market-based Fact Verification Media System and Method
Human et al. Data protection and consenting communication mechanisms: Current open proposals and challenges
Wijlaars et al. Contribution of recurrent admissions in children and young people to emergency hospital admissions: retrospective cohort analysis of hospital episode statistics
JP5361099B2 (ja) 特許明細書分析表示装置
Gu et al. A high precision laser‐based autofocus method using biased image plane for microscopy
JP6291441B2 (ja) ウェブシステム、ウェブクライアント装置および改ざん検査装置
CN105447196A (zh) 一种重点博主追踪确认方法及装置
CN115034626A (zh) 一种区域性主流媒体的全媒体综合指数评估方法
Kampman et al. Appreciation of literature by the anaesthetist: A comparison of citations, downloads and Altmetric Attention Score
Sæbø et al. Official statistics as a safeguard against fake news
JP6366902B2 (ja) 英文の特許明細書からの格成分抽出プログラム
JP6006051B2 (ja) 格成分抽出プログラム
Henderson et al. Reporting guidelines and Journal quality in otolaryngology
Giachetti et al. Do I see what you see? Institutional quality, action observability, and multimarket contact in the global mobile phone industry
Kannan Synthetic time series data generation for edge analytics
JP6206874B2 (ja) 格成分抽出プログラム
CN112149037B (zh) 基于逻辑回归的实时识别异常关注的方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110419

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121211

R150 Certificate of patent or registration of utility model

Ref document number: 5159410

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250