JP6006051B2 - 格成分抽出プログラム - Google Patents

格成分抽出プログラム Download PDF

Info

Publication number
JP6006051B2
JP6006051B2 JP2012192721A JP2012192721A JP6006051B2 JP 6006051 B2 JP6006051 B2 JP 6006051B2 JP 2012192721 A JP2012192721 A JP 2012192721A JP 2012192721 A JP2012192721 A JP 2012192721A JP 6006051 B2 JP6006051 B2 JP 6006051B2
Authority
JP
Japan
Prior art keywords
extracted
case component
case
noun
verb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012192721A
Other languages
English (en)
Other versions
JP2014048987A (ja
Inventor
元 安彦
元 安彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Management of Technology Solution Cooperation
Original Assignee
Management of Technology Solution Cooperation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Management of Technology Solution Cooperation filed Critical Management of Technology Solution Cooperation
Priority to JP2012192721A priority Critical patent/JP6006051B2/ja
Priority to PCT/JP2013/004024 priority patent/WO2014006856A1/ja
Publication of JP2014048987A publication Critical patent/JP2014048987A/ja
Application granted granted Critical
Publication of JP6006051B2 publication Critical patent/JP6006051B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、特許明細書等を始めとした電子データ化された文書に記載された文字列から格成分を抽出する格成分抽出プログラムに関する。
従来、短時間で特許明細書のチェックを行うことを目的とするものであって、特に、クレーム数を極力小さく抑える場合においても、かかる中間概念の記載を含めてより簡単に、かつ権利範囲や特許率をも考慮してチェックすることができ、さらには明細書の記載の方向性そのものを中間概念をも含めて容易にチェックすることができる明細書分析表示装置が特許文献1に開示されている。
また、特許明細書における特許請求の範囲に定義された発明の限定度合をカウントして表示することが可能な特許明細書分析表示装置が特許文献2に開示されている。
特開2006−155151号公報 特願2008−110211号公報
本発明は、特許明細書等を始めとした電子データ化された文書に定義された格成分を高精度に抽出することが可能な格成分抽出プログラムを提供することを目的とする。
請求項1記載の格成分抽出プログラムは、電子データ化された特許明細書中の文字列から格成分を抽出する抽出ステップを有し、上記抽出ステップでは、特許請求の範囲の記載から抽出した文字列中に主語と動詞の関係が含まれていた場合であって、その主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、当該主語に相当する文言を抽出すべき格成分に含めることをコンピュータに実行させることを特徴とする
請求項3記載の格成分抽出プログラムは、電子データ化された特許明細書中の文字列から格成分を抽出する抽出ステップを有し、上記抽出ステップは、特許請求の範囲の記載から抽出した文字列から動詞を順次抽出し、抽出した動詞が、その上段で既に定義されているか識別を行う識別工程と、上記識別工程における識別の結果、当該抽出した動詞が、その上段で既に定義されていた旨を識別した場合には、その上段で既に定義されている動詞に係り受けする名詞又は名詞句、並びにその上段で既に定義されている動詞が係り受けする主体を示す名詞又は名詞句を特定する特定工程と、上記特定工程において特定した名詞又は名詞句と、当該抽出した動詞に係り受けする名詞又は名詞句との間で同一性を判定する同一性判定工程と、当該抽出した動詞に係り受けする名詞又は名詞句のうち、上記同一性判定工程において同一と判定されたものについては、抽出すべき格成分から除外する除外処理工程とを有することをコンピュータに実行させることを特徴とする。
上述した構成からなる本発明では、特許明細書における特許請求の範囲に定義された発明の限定度合としての格成分を高精度に抽出することが可能となる。
格成分について説明するための図である。 格成分について説明するための他の図である。 スケルトン表示を行う例を示す図である。 一の請求項について格成分を視覚的に示す図である。 一の請求項について格成分を視覚的に示す他の図である。 視覚化表示の他の例を示す図である。
以下、本発明を実施するための形態として、特許明細書等を始めとした電子データ化された文書に記載された文字列から格成分を抽出する格成分抽出プログラムについて、図面を参照しながら詳細に説明する。
以下の例では、文書として特許明細書における特許請求の範囲の記載から格成分を抽出する場合について説明をするが、これに限定されるものではなく、他のいかなる文書に対して本発明を適用してもよいことは勿論である。
第1実施形態
特許発明の技術的範囲の広さを定量化、数値化するための数値化方法における最小抽出単位として、格成分が提案されている。
特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cには、動詞句が係り受けする。即ち、各構成要素A、B、Cを主語としたとき、これらにはそれぞれ動詞句が係り受けし、主語と述語とからなる文を成立させることができる。これら動詞句における動詞は、述語として文を形成するにあたり、自らの表す動き、状態、関係を実現させるために、どのような名詞句の組み合わせを取るかが基本的に決まっている。動詞が自らの帯びている語彙的意味の類的なあり方に応じて、文の形成に必要な名詞句の組み合わせを選択的に要求する働きを、動詞の格支配と仮称するならば、動詞により文の成分として要求された名詞句は、動詞を補足する上での格成分ということができる。
例を挙げて説明するならば、構成要素“信号生成手段”が下記のB−1)により定義されているものとする。
B−1)「ユーザの要求に応じて駆動信号を生成する信号生成手段と、〜」
このとき、「ユーザの要求に応じて駆動信号を生成する」という動詞句が信号生成手段に係り受けする。この動詞句において「生成する」という動詞の動作を実現・完成させるために、「ユーザの要求(に応じて)」、「駆動信号(を)」という名詞句を要求する働きが格支配であり、これら名詞句が格成分である。そして、「ユーザの要求(に応じて)」、「駆動信号(を)」といった名詞句が、それぞれ「生成する」という動詞に対して「動作開始条件」「対象」といった類的な関係的意味が格である。この格成分を実現している名詞句の担っている語彙的意味、またそれらの名詞句が帯びている関係的意味としての格によって形成されるものが、この動詞「生成する」により実現すべき命題の中核部分となる。上記例で言うならば “生成する”という動詞による命題を実現するための動作開始条件として、“ユーザの要求に応じて”いなければならず、さらにその対象として“駆動信号”を生成しなければならないため、これら2つが動詞による命題実現のため条件数となっている。
図1に示すように、このような動詞による命題実現のためにクリアしなければならない条件数が少ない場合を模式的に表したものである。動詞による動作開始のための条件の数が少なくなるため、命題を実現できる可能性が向上する。これに対して、図2は、動詞による命題実現のためにクリアしなければならない条件数が増加した場合を模式的に表したものであり、かかる場合には命題を実現できる可能性が低下する。
条件数が増加するほど、実際に動作が開始されるまでに条件を満たすか否かの判断のステップ数が増加することになる。各条件を満たす確率に多少の差異があることを考慮しても、この条件の判断ステップ数が増加するに従い、換言すれば条件を規定する格成分が増加するに従い、その動詞句が係り受けする構成要素Aに該当する可能性が低くなることを意味しており、その可能性の低下した分、技術的範囲が狭まることを示している。逆に、格成分数が少ない場合には、その動詞句が係り受けする構成要素Aに該当する可能性が高くなることを意味しており、その分において技術的範囲が広がることを示している。
このように格成分数(条件数)が、動詞による動作開始可能性、ひいては命題実現の可能性を支配し、これが技術的範囲の広狭に影響を及ぼすものであるから、特許請求の範囲の数値化方法の最小抽出単位を格成分として、この動詞句に含められている格成分数をカウントすることにより、技術的範囲の広さに応じた数値化を実現することができるものと考えられる。
上述したB−1)の例では、構成要素「信号生成手段」の命題を実現するための動詞「生成する」に係り受けする2つの格成分「ユーザの要求に応じて」「駆動信号を」が存在するため、格成分数が2となる。このとき、動詞「生成する」の動作開始条件を規定する「ユーザの要求に応じて」という格成分が存在しない場合には、格成分数が1となり、ユーザの要求の有無に関係なく、いつでも「駆動信号」を「生成する」ことができることになり、「信号生成手段」の命題を実現できる可能性が高くなる。これは構成要素「信号生成手段」により、侵害被疑製品の技術的要素の同一性を立証できる可能性を向上させることができることを示唆しており、かかる可能性の向上させた分が、侵害被疑製品に対する特許発明の捕捉容易性、ひいては特許発明の技術的範囲の広さに相当するものと考えられる。このため、構成要素の命題実現可能性を格成分数を介して表現することにより、技術的範囲の広さに応じた、より最適な数値化、定量化を図ることができるものと考えられる。
特許請求の範囲が、各構成要素A、B、Cを「〜Aと、〜Bと、Cとを備える○○装置(方法)」と列挙することにより定義する、いわゆる要件列挙方式で記載されていることを前提としたとき、各構成要素A、B、Cについてそれぞれ格成分数を求め、その総和を特許発明としての○○装置の格成分数とする。仮に、構成要素Aの格成分数が1、構成要素Bの格成分数が3、構成要素Cの格成分数が2とした場合に、これらにより構成される特許発明としての○○装置の格成分数は、その総和である6となる。
実際に各構成要素の格成分数を求める際に、上述したB−1)の例では、「生成する」という動詞に係り受けする格成分「ユーザの要求に応じて」「駆動信号を」を抽出することになるが、この格成分の実際の抽出作業は、「応じて」「を」等、形態素を目印にして行っていくことになる。
表1に格成分を抽出する際に、目印として参照する形態素の例を示す。
Figure 0006006051
特許請求の範囲は、B−1)のようなオーソドックスな形で定義されている場合のみならず、例えばC−1)に示すように定義される場合もある。
C−1)「第1のレンズによりスポット径を制御された光束を反射板により全反射する反射手段と、〜」
例えば、特許請求の範囲を構成する構成要素「反射手段」には、「全反射する」という動詞が係り受けする。この「全反射する」という動詞の動作開始条件を規定する格成として、「光束(を)」と、「反射板(により)」が存在することになり、先ず格成分数2をカウントすることができる。しかし、このうち一の格成分「光束」に着目した場合に、「第1のレンズによりスポット径を制御された」という動詞句がさらに係り受けしているのが分かる。あらゆる光束を「全反射する」対象として定義するよりも、むしろ条件が付加された光束を「全反射する」対象として定義した方が、技術的に限定が付加され、構成要素「反射手段」の命題実現可能性が低下する。このため、この命題実現可能性の低下分を格成分数として補正する必要が出てくる。
かかる場合には、「光束」に係り受けする動詞句「第1のレンズによりスポット径を制御される」において、「制御する」という動詞により格支配される2つの格成分「第1のレンズ(により)」、「スポット径(を)」が存在しているため、さらに格成分数2を加算する。その結果、C−1)は合計の格成分数は4となる。
なお、この特許請求の範囲の記載C−1)は、明細書作成者によっては下記のC−2)のように定義される場合もある。
C−2)「第1のレンズにより光束のスポット径を制御する光束制御手段と、かかる光束を反射板により全反射する反射手段と、〜」
このC−2)における「光束制御手段」並びに「反射手段」により形成される技術的範囲は、C−1)と実質的に同一である。C−2)では、C−1)において「光束」に係り受けする動詞句の内容を、「光束制御手段」により実現すべき命題と位置づけて定義し直している。実際にC−1)においても、定義されている「光束」を作り出すためには、何らかの手段や部材を利用することになるが、あえて「光束制御手段」を挙げて定義していないに過ぎない。このC−2)についても同様に格成分数をカウントすると、光束制御手段で格成分数2、反射手段で格成分数2で合計で格成分数4となり、C−1)と同様の結果となる。
上述のように、構成要素の命題を実現するために要求される格成分の数を介して技術的範囲の広さをカウントするものであるため、互いに記載方法や単語数が異なるものの実質的に同一の技術的範囲からなるC−1)、C−2)を同等の格成分数で表現することができる。仮に最小抽出単位を構成要素とした場合にC−1)は1、C−2)は2となり、最小抽出単位を単語とした場合にC−1)は7、C−2)は、9となることを鑑みても、この格成分数は、より好適な数値化方法の最小抽出単位になり得るものと考えられる。
なお、C−1)、C−2)の構成は、以下のC−3)により定義される場合もあり得る。
C−3)「第1のレンズにより光束のスポット径を制御する光束制御手段と、上記光束制御手段によりスポット径が制御された光束を反射板により全反射する反射手段と、〜」
このC−3)の波線部は、C−2)における「かかる光束」の部分に相当する。しかし、この波線部に記載されている動詞句の内容は、「光束制御手段」に係り受けする直線部により既に実現されてしまった命題であり、波線部の記載をあえて入れたのは「反射手段」が全反射する対象としての「光束」について解釈上の疑義が生じないようにするための確認的なものに過ぎない。このため、格成分数を計算する際に、この波線部の記載をも同様にカウントすることになれば、下線部の内容を二重カウントすることになり測定精度の悪化を招く結果となる。
このため、既に命題として実行済みの波線部の記載は、改めてカウントしないように留意することにより、クレームの記載順序や記載方法による格差に伴う格成分数のずれを解消することが可能となる。実際には、この直線部の記載と、波線部の記載とにより実現される命題が同一か否かを判断する必要がある。
最小抽出単位を格成分とした数値化方法では、特に命題の同一性を判断する際において有用なものとなる。格成分は単語と異なり、動詞により支配される性質を持つため、格成分が同一であるということは、格成分の内容に加えてこれを支配する動詞も同一でなければならないことを意味している。格成分と、これを支配する動詞の双方が同一であれば、これにより実現される命題も同一となる。このため、格成分の同一性の判断を介して、命題が同一か否かを識別することが可能となり、ひいては二重カウントか否かを容易に識別することが可能となる。また、明細書作成者間の記載方法の相違により、得られる数値に影響が及ぶこともなくなる。
なお、上述した例では、特許請求の範囲の記載が構成要件列挙型で記載されている場合を例にとり説明をしたが、他の形式で記載されていても同様にカウントすることができる。例えば、ジェプソン型で記載されていた場合には、公知部分とされる「おいて書き」の記載についても同様の方法によりカウントする。このとき、「おいて書き」の記載のカウント方法が分からない場合には、ジェプソン型から構成要件列挙型に書き換えた上でカウントするようにしてもよい。ちなみに、このジェプソン型から構成要件列挙型への書き換え方法は、従来から周知である。
また、特許請求の範囲が書き流し型で記載されていた場合も同様の手法によりカウントすることができる。例えば、C−2)が書き流し型で記載されていた場合には、以下のC−4)のようになる。
C−4)「第1のレンズにより光束のスポット径を制御し、かかる光束を反射板により全反射し、〜」
この書き流し型で記載されたC−4)は、C−2)と比較して、「光束制御手段」並びに「反射手段」の文言が抜けている点が相違するが、それ以外は同一である。「光束制御手段」並びに「反射手段」は、主語であってこれをカウントの対象とせず、あくまでこの主語に係り受けする名詞句をカウントするため、書き流し型と構成要件列挙型との間で格成分数が異なることはない。
第2実施形態(今回追加分)
格成分を抽出する際には、下記のルールに基づくものであってもよい。この第2実施形態において、下線部が続いているところが、抽出すべき1格成分に相当する。以下「カウント」と称しているものは、何れも格成分として抽出するという意味である。
(1)名詞に対して可能性又は自在性を含む文言が付加される場合について
名詞+可能に、名詞+可能な、名詞+自在に、名詞+自在な等のように、「名詞+〜できる」という動詞的意味で記載されている文言については、抽出すべき格成分に含めない
例)配置できる →名詞+〜できる、という動詞的意味だからカウントしない。
検出可能な→名詞+可能な という形容詞的意味だからカウントせず。
「同期できる」 →〜できる はカウントしない。
入力可能、突出・収納可能、選択可能→〜可能に はカウントしない。
高さ位置変更可能に〜可能に はカウントしない。
スライド自在な→〜自在な、と〜可能な、 はカウントしない。
即ち、名詞に「〜可能」、「〜自在」、「〜自由」等が付加されている場合のように、抽出した文字列中に、名詞に対して可能性又は自在性を含む文言が付加された文字列が含まれていた場合には、当該文字列を抽出すべき格成分から除外するようなアルゴリズムを設けるようにしてもよい。
(2)主語のルール
1)主語を先ず抽出する。「●●●が、」、「●●●は、」「●●●には、」「●●●も、」等となっているものを、主語とみなして全て抽出する。(このとき、●●●について「前記」「当該」「上記」等が付いていても付いていなくても一切関係なし)
2) 抽出した主語(●●●)が、それより以前に記載されているかをソートして確認する。その結果、抽出した主語(●●●)と100%一致するもの、或いはそれを一部含むものがあった場合、3)へ移行する。それ以外は、抽出した主語(●●●)が初めて登場したものであるから、その抽出した主語(●●●)を格成分として特定する。
3) 上記2)において3)に移行する場合に、いずれも格成分としてカウントしない。
即ち、抽出した文字列中に主語と動詞の関係が含まれているか否かをまず判断する。その結果、抽出した文字列中に主語と動詞の関係が含まれている場合には、その主語に相当する文言が、その上段で既に記載されているか否かを確認する。そしてその主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、新たに登場したものであるから、当該主語に相当する文言を抽出すべき格成分に含める。
これにより主語が多い特許請求の範囲の記載において、主語の数が多いほど格成分が多くなるという不合理を解消することが可能となる。
以上のプロセスを行うようなプログラムを設けるようにしてもよい。
(3)二重定義のルール
(二重定義のロジックの説明)
動詞が係り受ける主体を先ず特定し、次にその動詞の動作条件を満足する格成分を抽出する。
例えば、下記の文章の場合、以下のように、“動詞が係り受けする主体”、“動詞”、“格成分”が特定される。
「内燃機関の出力軸により出力される回転角度信号を検出する回転角度信号検出手段と」
Figure 0006006051
このようなリストを順次作っておく。リストは作ることは必須ではなく、“動詞が係り受けする主体”、“動詞”、“格成分”のペアを記憶させるようにしてもよい。
その後段で例えば、「前記回転角度信号検出手段により検出される回転角度信号に基づいて〜」、という文言が定義されていたものとする。
“検出される”という動詞に係り受けする「前記回転角度信号検出手段」を格成分としてカウントするか否かの判断を以下のロジックで行う。
「前記回転角度信号検出手段」、「検出する(される)」というペアは、以前記憶させておいたところと一致する。このため、これは既に実行されている命題であることからカウントしない。
「〜検出される回転角度信号」は、「検出される」という動詞に係り受けしていない(逆に動詞によって修飾されている)ため、そもそも「検出される」という動詞との関係で格成分か否かの判定は行うまでもなく、素直に格成分としてカウントする。
このように、“動詞が係り受けする主体”、“動詞”、“格成分”のペアを記憶しておき、“動詞”に対して、これらの、“動詞が係り受けする主体”、“格成分”が係り受けするものが後段で出てきた場合には、二重定義としてカウントしないようにする。
例1 p2000-196550の請求項1
「駆動源として内燃機関を搭載した車両において、車両の車速を検出する車速検出手段と、運転者により操作される車両の制動装置に対する操作入力の状態を検出する制動操作検出手段と、内燃機関の排気経路から排ガスの一部を吸気管内に還流させる排ガス還流手段と、前記車速検出手段により検出された車速に基づいて車両が停止状態にあると認められたとき、前記排ガス還流手段により吸気管内に排ガスを還流させるとともに、この停止状態において前記制動操作検出手段により前記操作入力の解除が検出されたとき、前記排ガス還流手段による排ガスの還流量を低減させる制御手段とを具備したことを特徴とする車両用内燃機関の制御装置。」
この場合、下記のリストができる。
Figure 0006006051
例えば、6の「前記車速検出手段により検出された車速に基づいて」は、
“前記車速検出手段により”は、“検出された”という動詞との関係で、すでに既に2で実行されているため、格成分としてはカウントしない。
8の「前記排ガス還流手段により吸気管内に排ガスを還流させる」は、“前記排ガス還流手段により”、“吸気管内に”は“還流させる”という動詞の関係で、既に5で実現されているためカウントしない、“排ガス”は、“還流させる”という動詞の関係で、初めて出てきたため1格成分としてカウントする。
このように、既に実行されたか否かのチェックは、“動詞”と“動詞が係り受けする主体”のペアのみに着目すればよいというわけではなく、“動詞”と“格成分”のペアについても着目する。
9「前記制動操作検出手段により前記操作入力の解除が検出された」については、“制動操作検出手段により”、“検出された”は、4の条件を満たすためカウントしない。操作入力の解除は初めて出てくる。(前記操作入力の解除が)を格成分としてカウントする。
ポイントは、この抽出の過程でリストを参照する際に、リストに記述されている動詞について能動態と受動態の変更がありえることは考慮に入れなければならない。
例2 P2000-258811の請求項1
「それぞれが異なる解像度を有する複数種類のプリンタを制御するプリンタ制御装置において,複数の画像の中からプリントすべき画像を選択する画像選択手段,上記画像選択手段によって選択された画像の画素数と上記解像度とにもとづいて,上記複数種類のプリンタの中から使用すべきプリンタを決定するプリンタ決定手段,および上記プリンタ決定手段によって決定されたプリンタに,上記画像選択手段によって選択された画像を表す画像データを送信する送信手段,を備えたプリンタ制御装置。」
この場合、下記のリストができる。
Figure 0006006051
4の「上記画像選択手段によって選択された画像の画素数」は、「選択する」という動詞に対する「上記画像選択手段」というペアが3にあるため、既に実行されている。
同様に6の「上記プリンタ決定手段によって決定されたプリンタに」は、「決定する」という動詞に対して「記プリンタ決定手段によって」というペアが5にあるため、既に実行されている。
また7の「上記画像選択手段によって選択された画像」は、「選択する」という動詞に対する「上記画像選択手段」というペアが3にあるため、既に実行されている。
既に実行されているものは格成分としてカウントしないようにする。
つまり、この二重定義のルールでは、結局のところ以下のアルゴリズムに基づき、抽出すべき格成分に含めるか、除外するかの判断を行っている。
ステップ1
Figure 0006006051
動詞をベースにして、これに係り受けする格成分と、その動詞が係り受けする主体を特定する。次に、上段に同一の動詞(能動態と受動態の違いはあるにしても)があるか否かをチェックする。その結果、上段に同一の動詞が無い場合は、特に二重定義のチェックは行わない。これに対して、上段に同一の動詞がある場合には、以下のステップ2へと移行する。
ステップ2
Figure 0006006051
個々の動詞について、動詞が係り受けする主体、格成分との間での同一性の判定を行う。上記は、最初に出てきた同一の動詞(5番)に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞(8番)に関する格成分との間で同一性を判定する例である。
ステップ3
最初に出てきた同一の動詞に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞に関する格成分との間で同一のものがあった場合には、後から出てきた同一の動詞の格成分を、格成分とみなさない(既に上段で命題が実行されてしまっているため)。
Figure 0006006051
以上の処理動作を、他の全ての動詞についても同様に行っていく。
つまり、アルゴリズムとしては、順次動詞を拾っていく。拾った動詞が、既に以前に登場しているかチェックする。登場していたら、最初に出てきた同一の動詞に関する“動詞が係り受けする主体”及び“格成分”と、後から出てきた同一の動詞に関する格成分との間で同一性を判定する。判定した結果、同一のものが出てきたら、後から出てきた同一の動詞の格成分を、格成分とみなさない。
このとき、以下の工程を通じて実現するようにしてもよい。
動詞を順次抽出し、抽出した動詞が、その上段で既に定義されているか識別を行う識別工程。識別工程における識別の結果、当該抽出した動詞が、その上段で既に定義されていた旨を識別した場合には、その上段で既に定義されている動詞に係り受けする名詞又は名詞句、並びにその上段で既に定義されている動詞が係り受けする主体を示す名詞又は名詞句を特定する特定工程。特定工程において特定した名詞又は名詞句と、当該抽出した動詞に係り受けする名詞又は名詞句との間で同一性を判定する同一性判定工程。当該抽出した動詞に係り受けする名詞又は名詞句のうち、上記同一性判定工程において同一と判定されたものについては、抽出すべき格成分から除外する除外処理工程。
また、識別工程では、形態素で結ばれた複数の名詞又は名詞句からなる文言を順次抽出し、上記抽出した文言がその上段で既に定義されているか識別を行うようにしてもよい。そして、除外処理工程では、識別工程における識別の結果、当該抽出した文言が、その上段で既に定義されていた旨を識別した場合には、当該抽出した文言を抽出すべき格成分から除外するようにしてもよい。
例えば、「マルチコントロールユニットとの接続時に・・・・・・」とあった場合には、初回は、下線部を格成分として抽出する。また、同じ請求項において、「上記マルチコントロールユニットとの接続時に・・・」と2回目以降で同一の文言が現れた場合、2回目以降は、二重カウントを避けるためにこれらをまとめて1格成分とするか、或いは、これらを格成分として抽出しないように処理動作を行う。
即ち、「名詞又は名詞句」+「形態素」+「名詞又は名詞句」についても同様に、二重定義となっていないかチェックを行う。
(4)形態素について
「名詞又は名詞句」+「A」+「名詞又は名詞句」からなる文言を抽出した場合において、A=「までの」、「への」、「との」、「にて」、「や」の何れかの場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を別々に格成分として抽出する。
また、A=「のうち」の場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を1つの格成分として抽出する。
(5)おいて書き(プリアンブル)の発明の名称はカウントしない
「〜Aにおいて、・・・・・を特徴とするB。」という請求項の記載において、「〜Aにおいて」は、おいて書き(プリアンブル)と呼ばれる。このプリアンブルでは、Aについて発明の名称を入れる場合が多い。発明の名称は、特許請求の範囲の語尾「〜を特徴とするB。」においても、Bについて発明の名称を入れる場合が多い。このような発明の名称は、格成分として抽出しないようにする。発明の名称の文言は、明細書中の発明の名称の記載から引用すればよい。Bは発明の名称と100%一致している場合が多いが、Aは一致していない場合も多々ある。このため、「おいて、」、「であって、」の前にあるA[名詞]を拾い出し、これがB(発明の名称と100%一致が前提)の一部分が含まれていれば、発明の名称とみなして、これを格成分として抽出しないような処理を行うようにしてもよい。つまり、Aについては、発明の名称と100%一致しなくても、少しでも重複していればよいという趣旨である。
即ち、この(5)では、抽出した文字列に発明の名称と同一又はその一部に相当する文言が含まれていた場合には、当該文言を抽出すべき格成分から除外するような処理を行うことでもよい。
(6)代名詞等について
「これ」、「それ」、「あれ」、「どれ」、「ここ」、「そこ」、「あそこ」、「どこ」の何れかからなる代名詞については、抽出すべき格成分に含めるようにしてもよい。これらは、代名詞であっても、役割としては上述した格成分としての働きをするものであり、本来格成分に含めるべきものであるからである。これにより高精度な格成分抽出が可能となる。
これに対して、副詞(「こう」、「そう」、「ああ」、「どう」の何れか)、連体詞(「この」、「その」、「あの」、「どの」の何れか)を抽出すべき格成分から除外するようにしてもよい。
(7)明細書の参酌について
自動抽出では、一の名詞と判断すべきか、2以上の名詞で構成されているのか紛らわしい場合がある。係る場合には、明細書の記載を参酌するようにしてもよい。
例えば、「背もたれの後傾範囲を」→「背」と「後傾範囲」で格成分を分けて抽出してしまう場合もある。背もたれの斜傾移動→「背も」たれの「傾斜移動を」で格成分を分けて抽出してしまう場合もある。前記背もたれの背面→まとめて1格成分なのに格成分を分けて抽出してしまう場合もある。第1のテーブル書き込み手段→格成分を分けて抽出してしまう場合もある。プリンタ割り当て指示手段→格成分を分けて抽出してしまう場合もある。
このため、明細書の記載に基づいたチェック機能を設ける。例えば、上述の「背もたれの後傾範囲を」の例の場合、明細書中の[符号の説明]には「背もたれ」という構成があるはずである。この符号の説明を参照すれば、「背もたれ」を「背も」で切ってしまうようなことは避けられるはずである。また[実施の形態]にも ●●●5、とか●●●8とか、構成に符号が付いているのでそこからソートして、名詞を拾い出していくことで、チェックができるはずである。つまり、請求の範囲のみならず、明細書の記載も積極的に活用し、チェックを行っていく。即ち、特許請求の範囲の記載から抽出した文字列から格成分を構成する名詞を抽出する際に、その名詞を構成する文字列か否かの判断を、明細書中の記載を参酌しつつ実行する。これにより、名詞の抽出精度を向上させることができる。
(8)ORのルールの補充
「〜のうち少なくとも1つ」という文言があった場合には、「〜の少なくとも1つ」に係り受けするものをまとめて1格成分でカウントする。
例)「それらベースのうちの少なくとも一つ」→1格成分。「背もたれの左右両側部のうち少なくともいずれか一方の下部」→まとめて1格成分。「座部の後端部における迫り上がりの基端部に若しくは該基端部よりも前方位置」→「まとめて1格成分」。「同一方向に横一列に隣接させて並べるか、あるいは相互に直交する方向に配列するかして」→「又は」に相当するため、まとめて1格成分。「ビンのユーザのうち少なくとも一方」→まとめて1格成分。「入力されたページ情報のうちの画像情報」→まとめて1格成分。
つまり、抽出された文字列が、複数の名詞又は名詞句を示す文言の後に、それら複数の名詞又は名詞句の「少なくとも1つ」以上を示す条件が付加されていた場合には、当該複数の名詞又は名詞句を個々に格成分として抽出することなく、まとめて1つの格成分として抽出する。
(9)その他
「動詞」+「こと」で表示される文言は、これのみで1格成分として抽出する。例えば、「操作されることに」→「操作される」は動詞だが、「こと」で一つの名詞句を構成する。名詞句は格成分になる。「経過したこと」→名詞形であるため、カウントする。つまり、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出する。
また、「略」、「若干」、「順次」は、抽出すべき格成分から除外する。
更に、「名詞」+「の」+「形容詞」+「名詞」からなる文言があった場合には、これらをまとめて1つの格成分として抽出するようにしてもよい。例えば、「仰角の大きいGPS衛星」は、この形態に相当するが、これらをまとめて1つの格成分として抽出する。
また、「数値〜数値」のように、「〜」を介して数値範囲を決める文言もある。例えば、「温度が19〜30℃」は、「温度が19℃から30℃」に書き換えることができ、「から」は形態素であるから、19℃、30℃はそれぞれ独立した格成分として抽出されるべきであって、これらをまとめて一つの格成分として抽出されるべきものではない。つまり、このような記載があった場合には、当該「〜」で隔てられた数値をそれぞれ格成分として抽出する。
本発明の実施方法
本発明を実施する上で、パーソナルコンピュータ(PC)を利用し、これに読み込まれたプログラムに基づいて行う。
先ず、電子データ化された特許明細書の記載から、電子データ化された特許明細書における特定の欄(特許請求の範囲の記載)に記載されている文字列を抽出する。また、この特定の欄とは、特許請求の範囲の1請求項分に相当する。
次に、抽出した文字列から上述したルールに基づいて格成分を抽出する。この抽出した格成分に基づいて格成分数を求めるようにしてもよい。格成分数とは、1請求項における格成分の数を意味している。メインクレームの場合は、そのメインクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントすればよいが、サブクレームの場合には、そのサブクレームが定義されている請求項から抽出した文字列からそのまま格成分数をカウントするとともに、当該サブクレームが従属するメインの請求項の格成分数をこれに加算する。
そして、カウントされた格成分数を、発明の限定度合いとして例えばディスプレイ等を介して表示する。
このとき、格成分の抽出は、表1に示すような形態素を目印にして行ってもよい。ちなみに、ここでいう表1はあくまで一例であり、他のいかなる形態素に基づいてカウントしてもよいことは勿論である。
また、格成分の抽出は、第2実施形態に基づいて行うようにしてもよい。
このとき上記カウントは、抽出された文字列において互いに重複する動作が定義されている文言を抽出し、当該抽出した文言に含まれる重複の格成分数をカウントし、カウントされた総格成分数から重複の格成分数を減算した値を、発明の限定度合いとして表示するようにしてもよい。これは上述した二重カウントを考慮したものである。
また、本発明では、補正前の特許明細書における特定の欄に記載されている文字列を抽出し、更に補正後の特許明細書における特定の欄に記載されている文字列を抽出し、補正前の特許明細書から抽出された文字列、並びに補正後の特許明細書から抽出された文字列からそれぞれ総格成分数をカウントし、カウントされた補正前の特許明細書の総格成分数と、補正後の特許明細書の総格成分数との差分を求め、これを特許請求の範囲の上述したような補正度合として表示するようにしてもよい。
また、本発明は、上述した分析を行うプログラムがインストールされたPC等のような装置として具体化されていてもよいし、これらをPCに実行させるためのプログラム、又はこれが記録された記録媒体として具体化されていてもよい。
また、本発明は、ネットワークシステムにおいて適用されるようにしてもよい。先ず、サーバー側において、特許明細書について格成分数を予め数値化したデータをサーバーに記憶させておく。そして、クライアント側から、所望の特許について格成分数の送信要求があった場合、当該特許の格成分数をサーバーから読み出し、これをネットワークを介してクライアント側に送るようにしてもよい。
また、クライアント側から送信要求のあった特許について未だ格成分数が求められていない場合には、サーバーは当該要求を受けた特許について格成分数をカウントし、これをネットワークを介してクライアント側に送るようにしてもよい。
格成分の抽出においては既存のあらゆるテキストマイニング技術、データマイニング技術、言語解析処理技術等を用いるようにしてもよい。そして、これらの技術を利用し、上述したルールに基づいて、分析対象の各文字列について、格成分に相当するか否かを判断し、最終的に1請求項分の格成分を特定する。そして、この特定した格成分の1請求項分の総数を求め、これを当該請求項の格成分数として出力する。
なお、本発明では、単に請求項毎の格成分数を出力するのみならず、この出力したデータを、パテントマップやグラフ、その他の評価値等、あらゆる情報に付加するようにしてもよい。
また、本発明では、請求項毎に特定した格成分を、画面上に表示し、又は印刷し、或いはデータ化するようにしてもよい。つまり、以下の実施例に示すように、請求項について特定した格成分を視覚的に把握可能なように下線やハイライト表示等を行うようにしてもよい。
また、本発明では、例えば図1に示すような、動詞による命題実現のためにクリアしなければならない条件(格成分)を模式的に画面上に表示し、又は印刷し、或いはデータ化するようにしてもよい。この図1では、構成要素を描き、そこを始点とした矢印を引く(以下、この矢印を基本矢印という。)。そして、この構成要素が動作開始のための条件を、この基本矢印に対して合流するような矢印で表示する。この条件は格成分に相当するが、この格成分から基本矢印に合流させるように引かれた矢印を、支流矢印という。その結果、構成要素から伸びた基本矢印に対して、格成分から伸びる支流矢印が合流する、スケルトンのような図が描かれることとなる。そして、この基本矢印の終端には、動詞を記入するようにしてもよい。
図3は、実際に、特許請求の範囲において「ユーザの要求に応じて駆動信号を生成する信号生成手段」と定義された信号生成手段という構成要素を実際に上述のルールに基づいて図示したものである。基本矢印の始点には、「構成要素“信号生成手段”」を描き、条件1としての格成分「ユーザの要求に応じて」と、「駆動信号を」とに対応した四角形のマスを始点とした支流矢印をこの基本矢印に合流させる。そして、この基本矢印の終端に、この信号生成手段の動詞(生成する)を記入する。ちなみに、この動詞は記入してもよいし、記入しなくてもよい。
また、本発明では、例えば図4に示すようなマッピング図を表示し、又は印刷し、或いはデータ化するようにしてもよい。
図4は、一の請求項において「“A手段”、“B手段”、“C手段”、“D手段”からなる構成要素を備える〇〇装置が定義されていた場合における模式図を示している。
この図4では、“A手段”は、条件1〜4を満たすことで自ら命題が達成され、その次に“B手段”は、かかる“A手段”により達成された命題に基づく成果物を利用して初めて自らの動作を実行でき、命題を実現することが可能となる。この成果物の利用は、例えば“B手段”に規定されている条件5等において具現化される場合もある。そして、“C手段”は、かかる“B手段”により達成された命題に基づく成果物を利用して条件6〜8をクリアして自らの命題を達成し、“D手段”も同様に“C手段”の成果物を受けて自らの命題を実現することになる。このD手段による命題の実現を終了させることにより、この請求項に係る発明である○○装置の作用効果が起きることになる。そして、この請求項に係る発明が意図する作用効果が生じるためには、これら条件1〜10からなる全部で10条件をクリアする必要がある。そして、この条件を規定しているのが格成分であることから、この発明が意図する作用効果が生じるためには、全部で10格成分必要になることが分かる。即ち、請求項に係る発明の〇〇装置の総格成分数は10である。
なお発明によっては、構成要素間の前段の2以上の構成要素でそれぞれ実現した命題の成果を後段の構成要素が利用する場合や、前段の1の構成要素が実現した命題の成果を後段の2以上の構成要素が利用する場合、さらには後段の構成要素により実現された命題の成果を再び前段の構成要素が利用して更なる命題を実現する場合等もある。かかる場合には、図5に示すように、構成要素間の命題の成果物の利用フローは、合流したり、或いは分岐したり、戻ったりすることになる。
しかし、このような場合においても、構成要素Aから順に条件を満たすように動詞による動作を実行していくことにより、最終段の構成要素Bによる命題の実現を終了させることにより、この請求項に係る発明である○○装置の作用効果が起きることになる。そして、この条件を規定している格成分は、全部で10格成分であるため、この請求項に係る発明の○○装置の総格成分数も10ということになる。即ち、構成要素間における命題の成果物の利用関係が複雑なものであっても、格成分数のカウントを通じて、技術的範囲の広さに応じた数値化を実現することができる。
また、他の例として、構成要素“情報記憶手段”が下記のC−1)により定義されているものとする。
C−1)「当該参照時刻に最も近い出力時刻が記述された画像データが格納された領域を判別するための判別情報を上記ハードディスクに記憶させる情報記憶手段と、〜」
この情報記憶手段を規定するC−1)は、一見複雑に定義されているが、その原因として、情報記憶手段に直接係り受けする「記憶する」の動詞の格成分である判別情報には、さらに「判別する」という動詞が係り受けし、さらにその格成分である領域には「格納する」という動詞が係り受けし、さらにその格成分である画像データには「記述する」の動詞が係り受けし、合計4つの動詞が入っているためである。
図6は、このC−1)のケースを同様に関係図で示したものである。条件1における[判別情報]を見かけ上構成要素とみなして、これを主語に書き換えると動詞[判別する]の格成分になるのが[領域]であり、この[領域]を見かけ上構成要素とみなして、これを主語に書き換えると動詞[格納する]の格成分になるのが[画像データ]となり、このような認定を繰り返し実行していくことにより、図5に示す関係図ができることになる。
請求項がこのような形式で記載されていた場合であっても、動詞に係り受けする格成分を上述したように主語にして、動詞、格成分の関係を順に認定していくことにより、元の構成要素が命題を実現する上で必要な条件を抽出することができ、その条件数から格成分数をカウントすることが可能となる。C−1)のケースにおいても図6に示すように条件数は5であるため、構成要素[情報記憶手段]は5格成分数であることが分かる。
このように、本発明では、いずれの特許請求の範囲の記載においても、同様のルールで図示して表示等することが可能となる。このとき格成分数も同時に併記するようにしてもよい。
なお、本発明は、特許明細書の特許請求の範囲の記載の格成分抽出に限定されるものではなく、他のいかなる書類についても同様の方法に基づいて格成分を抽出する際にも適用することができる。

Claims (17)

  1. 電子データ化された特許明細書中の文字列から格成分を抽出する抽出ステップを有し、
    上記抽出ステップでは、特許請求の範囲の記載から抽出した文字列中に主語と動詞の関係が含まれていた場合であって、その主語に相当する文言が、その上段で既に記載されている場合には、当該主語に相当する文言を抽出すべき格成分から除外し、その主語に相当する文言が、その上段で未だ記載されていない場合には、当該主語に相当する文言を抽出すべき格成分に含めること
    をコンピュータに実行させることを特徴とする格成分抽出プログラム。
  2. 上記抽出手段は、抽出した文字列中に、名詞に対して可能性又は自在性を含む文言が付加された文字列が含まれていた場合には、当該文字列を抽出すべき格成分から除外すること
    をコンピュータに実行させることを特徴とする請求項1記載の格成分抽出プログラム。
  3. 電子データ化された特許明細書中の文字列から格成分を抽出する抽出ステップを有し、
    上記抽出ステップは、特許請求の範囲の記載から抽出した文字列から動詞を順次抽出し、抽出した動詞が、その上段で既に定義されているか識別を行う識別工程と、
    上記識別工程における識別の結果、当該抽出した動詞が、その上段で既に定義されていた旨を識別した場合には、その上段で既に定義されている動詞に係り受けする名詞又は名詞句、並びにその上段で既に定義されている動詞が係り受けする主体を示す名詞又は名詞句を特定する特定工程と、
    上記特定工程において特定した名詞又は名詞句と、当該抽出した動詞に係り受けする名詞又は名詞句との間で同一性を判定する同一性判定工程と、
    当該抽出した動詞に係り受けする名詞又は名詞句のうち、上記同一性判定工程において同一と判定されたものについては、抽出すべき格成分から除外する除外処理工程とを有すること
    をコンピュータに実行させることを特徴とする格成分抽出プログラム。
  4. 上記識別工程では、形態素で結ばれた複数の名詞又は名詞句からなる文言を順次抽出し、上記抽出した文言がその上段で既に定義されているか識別を行い、
    上記除外処理工程では、上記識別工程における識別の結果、当該抽出した文言が、その上段で既に定義されていた旨を識別した場合には、当該抽出した文言を抽出すべき格成分から除外するか、又はその下段に現れた、当該抽出した文言を一まとめにして一つの格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項3記載の格成分抽出プログラム。
  5. 上記抽出ステップでは、「名詞又は名詞句」+「A」+「名詞又は名詞句」からなる文言を抽出した場合において、A=「までの」、「への」、「との」、「にて」、「や」の何れかの場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を別々に格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項1〜4のうち何れか1項記載の格成分抽出プログラム。
  6. 上記抽出ステップでは、A=「のうち」の場合には、この「A」によって隔てられる個々の「名詞又は名詞句」を1つの格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項5記載の格成分抽出プログラム。
  7. 上記抽出ステップでは、抽出した文字列に発明の名称と同一又はその一部に相当する文言が含まれていた場合には、当該文言を抽出すべき格成分から除外すること
    をコンピュータに実行させることを特徴とする請求項1〜6のうち何れか1項記載の格成分抽出プログラム。
  8. 上記抽出ステップでは、「これ」、「それ」、「あれ」、「どれ」、「ここ」、「そこ」、「あそこ」、「どこ」の何れかからなる代名詞を抽出すべき格成分に含めること
    をコンピュータに実行させることを特徴とする請求項1〜7のうち何れか1項記載の格成分抽出プログラム。
  9. 上記抽出ステップでは、副詞(「こう」、「そう」、「ああ」、「どう」の何れか)、連体詞(「この」、「その」、「あの」、「どの」の何れか)を抽出すべき格成分から除外すること
    をコンピュータに実行させることを特徴とする請求項8記載の格成分抽出プログラム。
  10. 上記抽出ステップでは、特許請求の範囲の記載から抽出した文字列から格成分を構成する名詞を抽出する際に、その名詞を構成する文字列か否かの判断を、明細書中の記載を参酌しつつ実行すること
    をコンピュータに実行させることを特徴とする請求項1〜9のうち何れか1項記載の格成分抽出プログラム。
  11. 上記抽出ステップでは、抽出された文字列が、複数の名詞又は名詞句を示す文言の後に、それら複数の名詞又は名詞句の「少なくとも1つ」以上を示す条件が付加されていた場合には、当該複数の名詞又は名詞句を個々に格成分として抽出することなく、まとめて1つの格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項1〜10のうち何れか1項記載の格成分抽出プログラム。
  12. 上記抽出ステップでは、動詞を「こと」につなげた、動詞の名詞形を格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項1〜11のうち何れか1項記載の格成分抽出プログラム。
  13. 上記抽出ステップでは、「略」、「若干」、「順次」は、抽出すべき格成分から除外すること
    をコンピュータに実行させることを特徴とする請求項1〜12のうち何れか1項記載の格成分抽出プログラム。
  14. 上記抽出ステップでは、「名詞」+「の」+「形容詞」+「名詞」からなる文言を1つの格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項1〜13のうち何れか1項記載の格成分抽出プログラム。
  15. 上記抽出ステップでは、「数値〜数値」のように、「〜」を介して数値範囲を決める文言があった場合には、当該「〜」で隔てられた数値をそれぞれ格成分として抽出すること
    をコンピュータに実行させることを特徴とする請求項1〜14のうち何れか1項記載の格成分抽出プログラム。
  16. 請求項1〜15のうち何れか1項記載の格成分抽出プログラムを実装したことを特徴と する格成分抽出装置。
  17. 請求項1〜15のうち何れか1項記載の格成分抽出プログラムによって得られた格成分数を記憶するサーバーと、
    クライアント側から要求された特許の格成分数を上記サーバーから読み出し、これをネットワークを介してクライアント側に送信する送信手段とを備えること
    を特徴とする格成分情報送信システム。
JP2012192721A 2012-07-01 2012-09-02 格成分抽出プログラム Active JP6006051B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012192721A JP6006051B2 (ja) 2012-09-02 2012-09-02 格成分抽出プログラム
PCT/JP2013/004024 WO2014006856A1 (ja) 2012-07-01 2013-06-27 格成分抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012192721A JP6006051B2 (ja) 2012-09-02 2012-09-02 格成分抽出プログラム

Publications (2)

Publication Number Publication Date
JP2014048987A JP2014048987A (ja) 2014-03-17
JP6006051B2 true JP6006051B2 (ja) 2016-10-12

Family

ID=50608563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012192721A Active JP6006051B2 (ja) 2012-07-01 2012-09-02 格成分抽出プログラム

Country Status (1)

Country Link
JP (1) JP6006051B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7363577B2 (ja) * 2020-02-28 2023-10-18 株式会社村田製作所 文書分類装置、学習方法および、学習プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090112642A1 (en) * 2005-05-26 2009-04-30 Kentaro Uekane Patent information analyzing apparatus, patent information analyzing method, patent information analyzing program, and computer-readable storage medium
JP2011257817A (ja) * 2010-06-04 2011-12-22 Kenichiro Ayaki 特許明細書分析装置、及び文章分析装置。

Also Published As

Publication number Publication date
JP2014048987A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
AU2011296030B2 (en) Methods and systems for annotating electronic documents
US8205150B2 (en) Document changes
US20130061139A1 (en) Server-based spell checking on a user device
KR20190003773A (ko) 다중 사용자 메시지 교환 스레드에서 자동화 어시스턴트와의 상호 작용을 위한 제안 제공
US20130060560A1 (en) Server-based spell checking
CN102317936A (zh) 识别评论以连同文档一起示出
US20100325539A1 (en) Web based spell check
US8682917B2 (en) Method, system and computer program product for currency searching
US20140304579A1 (en) Understanding Interconnected Documents
US20090055721A1 (en) Patent claim visualization system and method
US20210191964A1 (en) Method, apparatus, and computer-readable medium for generating headlines
CN111079494B (zh) 一种学习内容推送方法及电子设备
Beck et al. Representation problems in linguistic annotations: Ambiguity, variation, uncertainty, error and bias
CN114902229A (zh) 识别来自机器翻译模型的建议中最合适的语法建议的系统和方法
US9141867B1 (en) Determining word segment boundaries
US20110214048A1 (en) Method and system for automatic data aggregation
US9158748B2 (en) Correction of quotations copied from electronic documents
JP6006051B2 (ja) 格成分抽出プログラム
EP3224739B1 (en) Method and system for storage retrieval
Ball The dynamics of reasoning: Chronometric analysis and dual-process theories
JP5572784B2 (ja) 格成分の係り受け表示プログラム
JP2020016964A (ja) 格成分学習プログラム
JP5311319B1 (ja) 格成分抽出プログラム
JP6206874B2 (ja) 格成分抽出プログラム
JP6366902B2 (ja) 英文の特許明細書からの格成分抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160908

R150 Certificate of patent or registration of utility model

Ref document number: 6006051

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250