JP2004246559A - 請求の範囲についての補助資料作成方法 - Google Patents
請求の範囲についての補助資料作成方法 Download PDFInfo
- Publication number
- JP2004246559A JP2004246559A JP2003034871A JP2003034871A JP2004246559A JP 2004246559 A JP2004246559 A JP 2004246559A JP 2003034871 A JP2003034871 A JP 2003034871A JP 2003034871 A JP2003034871 A JP 2003034871A JP 2004246559 A JP2004246559 A JP 2004246559A
- Authority
- JP
- Japan
- Prior art keywords
- data
- word
- sentence
- displayed
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】請求の範囲の補助資料をコンピュータで作成する方法で、コンピュータ処理を容易かつ正確に行わせ、補助資料作成の人手を軽減する。
【解決手段】電気的データからなる出願書類等の請求の範囲の文で、文中に参照番号を記載したものを処理対象とし、請求の範囲の文から、要約文と修飾語句とをコンピュータ処理にて別個に分離して作成し、要約文を第1欄に表示し、第2欄に修飾語句を主要語との対応関係が明らかとなるように表示する補助資料作成方法において、符号を検索対象として出願書類等における請求の範囲以外の部分を検索して、符号に対応する単語データを収集し、単語データと請求の範囲の文中の文字列とを照合して請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行ってコンピュータ処理を行う。
【選択図】 図3
【解決手段】電気的データからなる出願書類等の請求の範囲の文で、文中に参照番号を記載したものを処理対象とし、請求の範囲の文から、要約文と修飾語句とをコンピュータ処理にて別個に分離して作成し、要約文を第1欄に表示し、第2欄に修飾語句を主要語との対応関係が明らかとなるように表示する補助資料作成方法において、符号を検索対象として出願書類等における請求の範囲以外の部分を検索して、符号に対応する単語データを収集し、単語データと請求の範囲の文中の文字列とを照合して請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行ってコンピュータ処理を行う。
【選択図】 図3
Description
【0001】
【発明の属する技術分野】
この発明は、特許または実用新案登録出願にかかる出願書類をはじめとする手続書類、あるいはこれらに基づいて発行される特許公報や実用新案登録公報または公開特許公報もしくは公開実用新案公報等の公報類(以下、出願書類等という)に表示される,特許請求の範囲や実用新案登録請求の範囲(以下、単に請求の範囲という)についての補助資料作成方法に関するものである。
【0002】
【従来の技術】
前記の出願書類等のうちの特許公報等の公報類については、従来から二次資料が作成され、特許調査等の便宜に広く供されている。しかし、従来のこの種の二次資料は、特許公報等の一部の欄を抽出してそのまま表示している。
【0003】
したがって、従来の二次資料では、特許公報等に記載されている請求の範囲についても公報の原文がそのまま表示されているに過ぎず、格別には解釈の便宜は図られていない。
【0004】
【発明が解決しようとする課題】
ところで、これらの出願書類等のうちで重要な記載の一つである請求の範囲は、記載されている技術内容が複雑であるうえに文章表現としての複雑さが重複している。
【0005】
すなわち、出願書類等の請求の範囲に記載されている文章は、一般に抽象的な記載が多い上、修飾語が多用された複雑な文章となっている。
【0006】
そのため、特許の知識や文章読解力の豊かでない一般人や技術者等にとっては、その記載内容の理解や解釈が容易ではなく、記載内容の理解や解釈ができるにしても時間を要する。
【0007】
この発明は、このような事情に基づいてなされたもので、請求の範囲の記載内容を理解や解釈する上での読者の負担を軽減することのできる補助資料をコンピュータを利用して作成する方法であって、そのコンピュータ処理を比較的容易でかつ正確に行わせるようにして、補助資料作成に要する人手への依存を軽減あるいは解消することを解決しようとする課題とするものである。
【0008】
【課題を解決するための手段】
この課題を解決するために、請求項1に記載した発明は、電気的データからなる出願書類等における請求の範囲の文であって、その文中に図面中に使用した符号を記載してあるものを処理対象とし、当該請求の範囲の文から、その文の骨組みを示す主要語を含ませた要約文をコンピュータ処理にて作成するとともに、前記要約文に含ませた主要語についての修飾語句をコンピュータ処理にて前記要約文とは別個に分離して作成するものとし、前記要約文を第1欄に表示するとともに、前記第1欄とは異なる第2欄に前記修飾語句を主要語との対応関係が明らかとなるように表示する請求の範囲についての補助資料作成方法において、前記符号を検索対象として、前記出願書類等における当該請求の範囲以外の部分を検索して、その符号に対応する単語データを収集し、その単語データと請求の範囲の文中の文字列とを照合させて請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行って当該請求の範囲のコンピュータ処理を行うことを特徴とする。
【0009】
また、請求項2に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の符号の説明の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0010】
また、請求項3に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0011】
また、請求項4に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の要約書の要約の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0012】
また、請求項5に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載と、当該書類中の明細書の符号の説明の記載と、当該書類中の要約書の要約の記載とのうち、少なくとも2以上のものからなることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0013】
【発明の実施の形態】
以下、具体例の補助資料の作成方法に関して、図面を参照しながら実施の形態を説明する。
【0014】
以下に説明する具体例は、いずれも「特許123456」に関するものである。特許公報等の公報類の内容は、対応する出願書類を始めとする手続書類等に由来する内容であるから、公報類であってもその内容は本願でいう出願書類等の内容に他ならず、これを処理対象とする意味で本願発明の実施の形態となるものである。
【0015】
図1に示す第1の具体例は表形式としたものであり、図2に示す第2の具体例は改行表示形式としたものである。以下においては、基本的に第1、第2の具体例に共通して説明を行うこととし、個々の具体例としてはその具体例に固有の事項についてのみ個別的に説明を行うこととする。
【0016】
出願書類等の一例に該当する「特許123456」の特許公報(特許公報の内容はすべて電気的データからなる)には、特許権者は「ABC株式会社」、発明の名称は「環状の工作物用円筒バレル研磨方法」であると表示されている。
【0017】
そして、その特許公報の特許請求の範囲の欄の請求項1には、次のクレーム原文Aが表示されており、同原文A中には図面中に使用した符号(以下、参照番号という)が部品名称等の単語の後に対応して表示されている。
【0018】
クレーム原文A:「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、前記環状の工作物20の内面側及び外面側に適量の研磨材25を装入し、前記皿状の回転槽4を回転して研磨材25を流動させ、前記環状の工作物20の内外面を同時に研磨するようにしたことを特徴とする環状の工作物用円筒バレル研磨方法。」
【0019】
このような特許公報については、次のような補助資料が作成される。
【0020】
前記のクレーム原文Aは、3つの文を組み合わせた複合文であるので、まず次の(1)から(3)の3部分に区分される。
【0021】
(1) 環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、
【0022】
(2) 前記環状の工作物20の内面側及び外面側に適量の研磨材25を装入し、
【0023】
(3) 前記皿状の回転槽4を回転して研磨材25を流動させ、前記環状の工作物20の内外面を同時に研磨するようにしたことを特徴とする環状の工作物用円筒バレル研磨方法。
【0024】
これらの(1)から(3)の各部分についての処理内容を順に概略説明すると次のようである。
【0025】
なお、この明細書においては、修飾語句により修飾される被修飾語であって、その修飾語句を含んだ状態の文においてその文の骨組みを構成する自立語(例えば、名詞や動詞等)を、主要語ということとする。
【0026】
まず、(1)の部分のうち、「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、」について、「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される」は主要語「研磨槽1」の修飾語句である。
【0027】
次に、「環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、」については、「前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように」は主要語「挿入して」の態様を説明する修飾語句である。
【0028】
したがって、前記から、(1)の部分において主要語を含む要約文は「研磨槽1内に、環状の工作物20を挿入して環状の固定槽6に装着する」である。
【0029】
主要語「研磨槽1」の修飾語句は前記のとおりであるが、その修飾語句が表示文として本例のように複雑である場合には、図2に示す第2の具体例のように、その修飾語句内でさらに「皿状の回転槽4」を主要語として扱い、これに関する修飾語句「該環状の固定槽6の下部を塞ぐ」を別表示させることとしてもよい。このようにすることによって、主要語の「研磨槽1」の修飾語句を「環状の固定槽6と皿状の回転槽6とにより構成される」とし、主要語「皿状の回転槽4」の修飾語句「環状の固定槽6の下部を塞ぐ」を分離すれば内容がより一層理解しやすくなる。
【0030】
なお、請求の範囲の文中では、文の流れによって動詞が終止形以外の状態であることがあるが、その場合には補助資料としての表示内容の理解の便宜の観点からその動詞を終止形に修正することが望ましい。また、請求の範囲の文中では、「前記」、「該」等の指示的表示が多用されがちであるので、その場合には補助資料としての誤解の可能性を考慮したうえで、これらの文字を省略してもよい。
【0031】
次に(2)の部分については、その構造が単純文であり、表示内容の理解が難しいほど煩雑でもないので、基本的にはそのまま表示することとし、文頭の「前記」を省略すると共に、文末の「装入し」を終止形の「装入する」との調整のみをおこなって補助資料の表示とする。なお、図2に示す第2の具体例においては、(2)の文中から主要語「研磨剤25」の修飾語句「適量の」を分離して、前記(1)の部分に準じた別記載としている。
【0032】
さらに、(3)の部分について、その構造は複合文であるが、表示内容が煩雑ではないので、請求の範囲の文末としての常套語句で発明の名称と一致した表示である「ことを特徴とする環状の工作物用円筒バレル研磨方法」の部分を省略すると共に、「前記」の表示を省略して補助資料の内容表示とする。
【0033】
このようにして作成した補助資料の実体的内容は、例えば図1あるいは図2に示す形態で表示される。なお、以下の各具体例において、後述する文書処理が済んだ後の最終的な表示の段階で、請求の範囲中に記載されていた参照番号の表示を省略するようにしてもよい。
【0034】
図1に示す第1の具体例の補助資料は、補助資料の表示形態を表形式としたものであり、以下に記載する各表示欄は罫線によって区画して設けてある。
【0035】
この第1の具体例は紙片Pに印刷したものであるが、電気的信号のまま、例えばCRTデイスプレイや液晶デイスプレイ等の電気的表示装置に表示するようにしてもよい。
【0036】
図1において、紙片Pには、表形式に形成された補助資料の表示枠1が形成されている。
【0037】
表示枠1には、書誌的事項の表示欄2と、補助資料としての特許請求の範囲の実体的な内容を表示する表示欄3とが設けられている。
【0038】
書誌的事項の表示欄2内には、表示欄3に表示される特許公報についての特許権者名の表示欄4と、当該特許公報の番号の表示欄5と、当該特許公報の発明の名称の表示欄6と、請求の範囲中で処理対象とした請求項番号の表示欄7とが設けられている。
【0039】
なお、前記表示欄5には、該当公報が補正公報や訂正公報である場合には、その公報が対応する出願公開番号あるいは特許番号を表示するとともに、表示欄3の表示内容が補正公報あるいは訂正公報にかかるものである旨をあわせて表示することが望ましい。
【0040】
補助資料の実体的内容の表示欄3は、前記クレーム原文Aの(1)から(3)に対応してそれぞれの表示内容が表示される3つの表示欄11,12,13が形成されている。各表示欄11,12,13に表示される内容は前記したとおりであるが、とくに、表示欄11においては要約文表示欄14に表示された主要語「研磨槽」、「挿入して」と、それぞれの右側の修飾語句表示欄15に表示された内容とを対応するように表示させて内容理解の容易化を図っている。
【0041】
図2に示す第2の具体例の補助資料は、第1の具体例のように表形式とはせず、改行と行頭位置とで表示欄を区別するようにしたものである。
【0042】
この第2の具体例においても、図2に参照番号で示すように、書誌的事項の表示欄2と、特許請求の範囲の表示内容についての補助資料内容の表示欄3とが設けられており、表示欄4〜7と、実体的な表示内容が表示される3つの表示欄21,22,23とが形成されていることは第1の具体例と同様である。
【0043】
この第2の具体例においては、表示欄23には前記原文Aの(3)の前記した表示をそのまま表示することとし、前記表示欄21、22にはそれぞれ原文Aの(1)、(2)に対応する要約文を冒頭に表示するとともに、各表示欄21,22の下方の行には行頭位置を少し右側に下げて各要約文中の主要語とこの主要語に対応する修飾語句とを表示する修飾語句表示欄24,25、26を設けている。
【0044】
これらの修飾語句表示欄24,25,26においては、行頭部分に修飾語句により修飾される主要語を配置し、主要語の後方に連なる形態で対応する修飾語句を表示する。これは、主要語と修飾語句との関係を明確にかつ容易に認識できるようにするためである。
【0045】
そして、この第2の具体例の修飾語句表示欄24においては、前記のように修飾語句を表示しているが、その修飾語句の認識をより容易なものとするために、さらに表示欄27を設けいる。この表示欄27は、行頭位置をさらに右側に下げて前記修飾語句表示欄24の修飾語句中の「皿状の回転槽」を主要語として、これを修飾する修飾語句をその主要語「皿状の回転槽」の右側にコロン「:」を介して表示している。
【0046】
なお、表示欄24に示したように、名詞を主要語とした場合にはその修飾語句の文末に文言「もの」を付加すると、語句としてのまとまりが良くなって内容の理解がしやすくなる。
【0047】
この第2の具体例によっても、第1の具体例と概ね同様に「特許123456」の特許公報の請求項1の表示内容を理解するうえでの読者の文理解釈面での負担を軽減でき、容易に内容を理解することができる。
【0048】
次に、前記のような補助資料の作成作業として行うコンピュータ処理の具体的内容について、主に図3のフローチャートに基づいて説明する。
【0049】
まず、初期処理S1として、本コンピュータ処理の基本となる辞書をロードする。ここでロードされる辞書は、主に原文中のいずれの部分が主要語、即ち自立語であるか否かの判断を行うためのものである。
【0050】
初期処理S1でロードされた辞書によってコンピュータに蓄積された言語データは、第1言語データと第2言語データとから成る。
【0051】
第1言語データは、いわゆるワープロソフトを構成する日本語辞書として一般的に市販されている言語データであり、第2言語データは、本発明のコンピュータ処理で一語と判断しがたい単語を予め登録するもので、所謂ユーザー辞書を構成している。
【0052】
なお、この第2言語データは、前記第1言語データと全く別個に構成しても良いが、第1言語データ内に含まれる形で登録するように構成しても良い。
【0053】
この第2言語データには、例えば名詞、状態を表す単語、削除対象文字、及び汎用専門用語などが予め登録されている。
【0054】
第2言語データとして登録すべき名詞としては、一般的にコンピュータが名詞として判別し難いものが挙げられる。例えば、仮名書きの名詞や、英字又は仮名混じりの名詞が、一つの名詞として登録される。
【0055】
状態を表す単語として登録すべきものは、被修飾部を形成するときに、体言を表さない単語が挙げられる。即ち、漢字のストリングであっても、その単語が体言を表さないときは、その前の文字列が連体修飾語になれないからである。かかる状態を表す単語としては、例えば、「即ち」や「複数個」等である。
【0056】
削除対象文字として登録すべきものは、数詞や代名詞以外でプログラムの中に組み込めていない文字(例えば「当該」「前記」「該」など)が挙げられる。
【0057】
汎用専門用語として登録すべきものは、一定の業界内で特定のものを指し示さない単語又は複合語が挙げられる。これらは、特定固有名詞ではないので、修飾語の分離のときに要約文での説明対象から除外するためである。
【0058】
修飾語句の分離(後述のS9参照)の対象から外すものとして登録すべきものは、上記汎用専門用語の他、以下のようなものが挙げられる。
【0059】
後続の「の」で区切らないものとして登録すべきものは、「通常」や「時」などが挙げられる。
【0060】
また、後続の「の」の後で名詞としないものとして登録すべきものは、「組合せ」や「複数個」などが挙げられる。
【0061】
更に、例えば、「及び」や「又は」などのように、漢字を含む接続語等は修飾語句の分離対象から外すものとする。
【0062】
尚、本実施例においては、第2言語データに上記のような登録を行っているが、これらのうち何れかのみを登録、又は他のものを登録するようにしてもよい。
【0063】
また、主に原文中のいずれの部分が主要語、即ち自立語であるか否かの判断は、後から説明するように、読み込み特許データから収集された第3言語データをも参照しつつ行われる。
【0064】
次に、原文を取得して所定の処理を行う(原文取得処理S2)。かかる原文の取得は、CD−ROM、DVD−ROM、FD又はインターネット等から例えばテキストデータとしての電気的データを取り込むことにより行われるのであるが、例えば当該請求の範囲が記載された特許公報等の出力紙をスキャナでスキャンした後、文字変換して得られた電気的データであってもよい。
【0065】
原文取得としてコンピュータに読み込まれる電気的データの内容は、この実施例の場合は「特許123456」の特許公報に記載された全ての記載事項に該当するテキストデータであり、図面そのもののデータは除かれている(以下において、読み込み特許データという)。なお、このように図面そのもののデータを除外せずに出願書類等の全ての記載事項に相当するものを読み込んで、そのうちのテキストデータ部分を用いて処理することにしてもよい。
【0066】
次に、まず、第3言語データの作成処理についての説明を行う。
【0067】
この読み込み特許データの中で、前記の具体例で表示する所要の書誌的データと、請求の範囲(この実施例では請求項1のみ)のデータとが補助資料作成のための直接的な処理対象であるが、第3言語データを作成するために、この実施例では、前記特許公報中の明細書の実施の形態の欄の記載と、同特許公報中の明細書の符号の説明の欄の記載とのテキストデータが用いられる。なお、この第3言語データ用のデータとしては、前記特許に対応する出願書類中の要約書の要約の欄の記載を前記テキストデータの代替とし、あるいは併用するようにしてもよい。
【0068】
この実施例における第3言語データは、以下に説明するように、第1データ収集処理と第2データ収集処理とからなるもので、これらの処理で収集される言語データはいずれも第3言語データである。
【0069】
第1データ収集処理は、前記特許公報中の明細書の符号の説明の欄に記載されたテキストデータから、言語データの収集を行うものである。
【0070】
「特許123456」の特許公報においては、その特許公報中の明細書の符号の説明欄には、図面中に使用した符号である参照番号と、その説明としての名称とが次に記載するように互いに対応してテキストデータで表示されている。
【0071】
すなわち、同公報の符号の説明欄には、「2…回転軸、3…軸受、4…回転槽、6…固定槽、7…ライニング、12…外筒、14…ネジ、15…中心軸、20…環状の工作物、21…外周面、22…内周面、23…環状ベアリング、25…研磨材、29…環状摺動板、30…連結板。」との記載がある。
【0072】
この第1データ収集処理においては、前記した符号の説明欄の記載中で、参照番号と説明としての名称の単語とが対をなすデータとして収集される。すなわち、第1データ収集処理で収集され記憶されるデータは、「(2回転軸)(3軸受)(4回転槽)(6固定槽)(7ライニング)(12外筒)(14ネジ)(15中心軸)(20環状の工作物)(21外周面)(22内周面)(23環状ベアリング)(25研磨材)(29環状摺動板)(30連結板)」である。なお、前記中の()は対であることを示すものであり、データ内容ではない。
【0073】
第1データ収集処理で得られたこのようなデータは、前記請求の範囲中に表示された参照番号を検索キーとして順次検索されて、参照番号が一致した対の単語と、請求の範囲中の参照番号の直近前側に連なる文字列と比較が行われる。請求の範囲中の前記文字列が、前記の単語と一致していれば、請求の範囲中の文字列中の一致している文字数の範囲がその単語であるとの認識を行う。
【0074】
例えば、請求の範囲中の参照番号20についての「…内に、環状の工作物20を…」の部分の処理は、参照番号「20」により、前記の収集データから「(20環状の工作物)」が選択され、参照番号20の前方に連なって6文字の範囲の単語であるという条件が設定される。この条件下で、請求の範囲の前記の部分での比較対象は「環状の工作物」の範囲であるから、収集したデータと一致しており、この部分は、「環状の工作物」という単語認識とする。一般に、日本語のコンピュータ処理において、漢字かな混じりの単語の認識が難しいとされているが、このような処理を行うことにより比較的容易な処理でありながら正確な単語認識が確保されることになる。
【0075】
ところで、前記した符号の説明欄に基づく第1データ収集処理では、請求の範囲中に表示されている参照番号の全てについての単語データを収集できない場合がある。前記の例では、「研磨槽1」についてのデータが不足している。
【0076】
次に説明する第2データ収集処理は、前記特許公報中の明細書の実施の形態の欄の記載のデータを用いて、言語データの収集を行うもので、前記のように第1データ収集処理のみではデータが不足している場合や、念入りに単語認識の正確さを確認する場合などに行う。なお、特許公報等や出願書類の発行年度等によっては法規の改変等の理由から、実施の形態の欄の代わりに実施例の欄が設けられているものがあり、その記載内容の面でも類似の性質を有している。この明細書においては、このような実施例の欄をも包含する意味で実施の形態の欄の文言を用いている。
【0077】
第2データ収集処理は、前記特許公報の明細書の実施の形態の欄のテキストデータを、各参照番号を検索キーとして検索し、その参照番号の直前にどのような文字列が連なっているかのデータを複数個集めて、それらの文字列データの共通部分をもって当該参照番号に対応する単語として決定するものである。
【0078】
前記してきた本願の実施の形態の場合には、請求の範囲中の参照番号「1」については、第1データ収集処理で得られたデータでは単語認識が得られないので、実施の形態の部分に対応する読み込み特許データから参照番号1に対応するテキストデータを参照番号から前側に連なって文字数で10文字の範囲で収集する。
【0079】
その結果、たとえば、参照番号1に対応して次のような4つのテキストデータを得たものとする。すなわち、参照番号の前側に文字数で10文字の範囲で収集したテキストデータを列記すると、データ1「より構成された研磨槽1」、データ2「コンパウンドを研磨槽1」、データ3「が停止した後、研磨槽1」、データ4「が近接するまでナット1」の4つである。
【0080】
このように得られた4つのデータの照合は、次のように行う。すなわち、まず、参照番号1の直前の1文字目を比較すると、データ1から3は参照番号「1」の直前の文字が「槽」で一致しているが、データ4は「ト」であり不一致である。ここで、少数派のデータ4は不採用として、参照番号の前側2文字目についてデータ1から3を比較すると、いずれも「磨」で一致しており、同様に参照番号の前側3文字目も「研」で一致している。参照番号の前方4文字目においては、データ1は「た」、データ2は「を」、データ3は「、」と各データが不一致となるので、データ1から3が完全に一致して共通している3文字前までの部分の「研磨槽」を、参照番号1に対応する単語と判断してデータとして採用する。これによって、参照番号「1」の直前に連なる3文字の範囲で、前記請求の範囲での表示「…される研磨槽1内…」を比較すると、一致しており、「研磨槽」という単語認識が行われる。これによっても正確な単語認識が確保されることになる。
【0081】
前記してきた本願の実施の形態の場合は、これで第2データ収集処理を終了する。なお、これに限らず、順次、その他の参照番号についても、これと同様に処理して、実施の形態に表示されている全ての参照番号についてのデータ収集を行うようにしてもよい。その場合、実施の形態の欄に記載されている全ての参照番号についてこの一連の処理が終了すれば、第2データ収集処理による言語データの収集作業が終了する。
【0082】
この実施の形態では、参照番号とこれに対応する単語を収集するのに、参照番号の前側に文字数で10文字の範囲でテキストデータを収集したが、データ収集を行う文字数の範囲は適宜に設定してもよく、また、その参照番号を含む一文全体を収集するようにして、前記と同様の手法で単語を判断させるようにしてもよい。その場合には、実施の形態の記載全体からその参照番号を含む全ての記載が一文単位で収集されることになるので、その明細書におけるその単語に関する記載が網羅され、このデータをその明細書に関する技術的な記載内容についてのデータベースとして活用することが可能となる。
【0083】
以上のように、この実施の形態においては、第1データ収集処理と第2データ収集処理と行うものであるが、第1データ収集処理あるいは第2データ収集処理の一方のみを行って第3言語デーを得ることにしてもよい。
【0084】
このようにして、読み込み特許データから、第3言語データを作成して、記憶させた後、処理対象である請求の範囲に対応するテキストデータに対して、以下のような解析処理が行われる。
【0085】
すなわち、この原文取得処理S2においては、上記の如く取得した請求の範囲の原文(クレーム原文A)につき、文字単位の解析を行う。かかる解析は、原文を1文字単位に区分けし、それぞれを以下の如き記号化することにより行われる。例えば、ひらがなを記号「1」、カタカナを記号「2」、英字を記号「3」、数字を記号「4」、記号を記号「5」、漢字を記号「6」、句読点(括弧或いは2重括弧)を記号「7」、句読点(閉じ括弧或いは2重閉じ括弧)を記号「8」、その中の句読点を記号「9」の如きである。
【0086】
上記のような1文字単位毎に記号化しておけば、以降の解析を容易に行うことができる。尚、文字は、全角半角変換を利用して、どちらで入力してあっても解析を可能としておくのが好ましい。また、上記記号(記号「1」〜「9」)は、一例であって、1文字単位毎に所謂コード化することができれば他の記号を用いてもよい。
【0087】
上記文字単位の解析の後、初期処理S1でロードしておいた辞書(第1言語データと第2言語データ)および読み込み特許データに基づいて作成された前記の第3言語データに基づき、名詞部分を記号化(例えば記号「10」等)しておく。
【0088】
とくに、ロードした第2言語データには、一般的にコンピュータが名詞として判別し難い名詞が登録されているため、その後の解析時において名詞を判別する際に役立たせることができる。また、読み込み特許データに基づいて作成された第3言語データは、出願書類や特許公報等の性格上、処理対象とする請求の範囲と一定の関係のあるテキストデータから、結果的に主に名詞を中心とする単語が収集されるため、後の解析時の判別に役立てて名詞の判別が正確になる。
【0089】
その後、一定の条件下による各単語の成り立ち(品詞が何であるか等)について解析するとともに、それを記号化しておく。例えば、句読点より前の助詞、助詞より前の名詞、及び助詞より前の動詞を明確にして記号化するとともに、接続詞、副詞、連体詞、数詞、代名詞、指示語を明確にして記号化し、加えて、連体修飾部と連用修飾部とを明確にして記号化しておく。
【0090】
以上で、原文取得処理S2が終了するのであるが、最後に行った処理(各単語の成り立ちの解析を記号化)とその前処理で行った記号化とが重複した場合、当該最後に行った処理で付与された記号を使用する。これは、かかる処理で付与した記号は、先に解析した内容を含んでいるからである。上記のように、本実施形態によれば、読み込み特許データに基づいて作成された第3言語データを用いて請求の範囲の文における解析を行うので、主に名詞の単語認識がより正確な解析をすることが可能となる。
【0091】
次に、複合文分割S3について説明する。このS3は、上記の如き解析を行った文中に、句読点である「。」があるか否かを判別し、ある場合は、その位置で文を分割する。これは、「。」がある位置では、文章が区切れているのが明らかであり、当初から区切っておいた方が続く処理を容易とすることができるからである。一方、かかる文中に「。」がない場合は、複合文分割S3においては、なにも処理されない。
【0092】
次に、S4の「おいて」書き分割について説明する。このS4では、文中に「おいて、」なる文言があるか否かを判別し、該文言があると判断された場合は、当該文言の前と後に分割する。即ち、請求の範囲の記載中に「おいて、」なる文言がある場合、そのほとんどが、当該文言の前が発明又は考案の前提部分、後ろが発明又は考案の特徴部分であるからである。
【0093】
上記「おいて」書き分割S4の終了後、S5の文章分割にすすむ。この文章分割S5においては、句読点である「、」がある位置で文章を分割する。なお、以下のこの明細書において、文章分割S5の処理後の各文のことを、セグメントという。
【0094】
文章分割S5された各セグメントについては、次に指定文字削除S6が行われる。かかる指定文字削除S6においては、予め定められた条件に該当する文字を文中から削除する作業が行われ、例えば以下の如き処理が施される。
【0095】
各セグメントになされる指定文字削除S6の内容は、(1)セグメントの先頭が、副詞や代名詞であるとき、(2)セグメントの先頭が接続詞のとき、(3)セグメントの末端が「…とともに、」などのとき、それらを削除する。
【0096】
但し、上記(3)において、「とともに」の前が動詞であるときは削除しないこととする。
【0097】
また、「前記」「上記」「当該」などの文言がセグメント中にあれば、それらを削除するとともに、セグメント中に「該」があって、続く文言が助詞でなければ削除する。加えて、セグメント中にある空白文字、及び初期処理S1でロードされた辞書に登録されている削除対象文字を削除する。
【0098】
その後、セグメントの先頭が「英字」「数字」「記号」又は「括弧」の集合体であれば削除する処理を行う(英数字削除S7)。但し、その後に続く文言が助詞のときは削除しないこととする。
【0099】
そして、上記した一連の処理後、セグメントが10文字以内のときは、次に続くセグメントと併合する(文章併合S8)。即ち、あまりに短い文に区切ってしまうと、要約文とした際に却って読みづらくなる虞があるからである。尚、この文字数は10文字に限らず適宜に設定してもよい。
【0100】
次に、S9の修飾語の分離にすすむ。このステップでは、上記の如く調整された各セグメントにおいて、末尾に位置する被修飾部に対する連体修飾部の分離を行う。これによって、クレーム原文A中に表示された文から、修飾語句と、かかる修飾語句によって修飾された被修飾部である主要語とを見つけ出し、補助資料の実体的内容の作成処理が可能となる。
【0101】
具体的には、例えば以下の方法により、セグメント中の修飾部を見つけ出すことができる。
【0102】
(1)まず、セグメント中の動詞を見つける。但し、動詞が複数ある場合には、最初の動詞を採用する。
(2)その動詞の後がひらがなでなければ修飾部であると認識し、そこで分離する。
(3)また、セグメント中に助詞の「の」があれば、修飾部であると認識し、そこで分離する。
(4)更に、セグメント中の助詞或いは形容動詞を見つけ、連体修飾になるときは、そこで分離する。
(5)尚、かかる分離作業は、連体修飾部に対して最大3回程度行うのが好ましい。
【0103】
例えば、元のセグメントが(A)(…する)((B)と)であるとしたら、分離後の被修飾部は、((B)と)となり、分離後の連体修飾部は、(A)(…する)となる。更に分離処理を行うと、分離後の連体修飾部は、(A)((a)(…した)((b)を)(…する)となり、分離後の被修飾部分は、(a)(…した)となるとともに、分離後の連体修飾部は、((b)を)となる。
【0104】
この後、S10の要約文の作成にすすむ。このステップでは、セグメントから上記の如き修飾語の分離を行った後の主要語を含む部分、又はいくつかのこのような主要語を含む部分が連なったものが、以下のパターンに該当するものであるときは、その形式に従った要約文を作成する。
【0105】
(i)クレーム原文Aの文の中間に「おいて」なる文言がある場合、当該文言の前にある前提部分と、後ろにある特徴部分とに分けて別個の要約文を作成する。但し、分けた後のそれぞれのセグメントが以下のパターンに該当する際には、そのパターンに従って各要約文を作成する。
【0106】
(ii)要約文がいくつかのセグメントで構成され、各セグメントの末尾の助詞が、最後のセグメント以外は全て接続助詞になっているパターン(具体的には、「…と」「…と」…「とからなる〜」といった文章)のときは、最後のセグメントを除き、各セグメントにおける主要語としての名詞を選択抽出して1つの文章としての要約文を作成する。この名詞を選択抽出の際に、前記第3言語データの各単語の有無を、各セグメントに対して検索することによって、そのセグメント中での単語認識が正確なものとなり、適切な主要語の選択抽出が可能となるので適切な要約文を作成することができる。
【0107】
そのうえで、このように作成された要約文の各主要語との位置関係がそれぞれ対応するように、連体修飾語を説明として表示する。かかるパターンに該当するときは、例えば図1の要約文表示欄14中の「研磨槽」とその右側に位置する修飾語句表示欄15中の記載とのような対応関係となるように出力する。また、図2の第2の具体例の場合は、要約文表示欄21の下行に修飾語句表示欄24を配置するので、修飾語句表示欄24の文頭に主要語「研磨槽」を配置し、コロン「:」を介してその右側にその修飾語句を表示するように出力して対応を明確にしている。
【0108】
(iii)要約文がいくつかのセグメントで構成され、要件定義文(具体的には、「(a)に」「(b)し」「(A)を備え」といった文章)のときは、以下の如き階層構造とする。なお、この説明において、前記(a)、(b)、(A)はそれぞれ各セグメントから前記した末尾の助詞等の文言を除外した文字列を表示している。
【0109】
「(A1)は以下の要件を満たす。」を、要約文として表示し、各セグメントの主要語と修飾語句とは、次の(1)〜(3)のようにそれぞれ列記して表示する。なお、ここでいう(A1)、(a1)、(b1)は、各文字列(A)、(a)、(b)中における主要語を示すものである。
(1) (a1):(a)中の(a1)に対する連体修飾部分
(2) (b1):(b)中の(b1)に対する連体修飾部分
(3) (A1):(A)中の(A1)に対する連体修飾部分
【0110】
(iv)要約文がいくつかのセグメントで構成された一般文(例えば、「(a)と」「(b)が」「(c)を」「(d)し〜といった文章」のときは、次のように取り扱って要約文を作成する。なお、(a)、(b)、(c)、(d)は、各セグメントにおいて、前記した末尾の助詞等の文言を除外した文字列を表すものである。
(1)各セグメントが次のセグメントと関係がある(或いはつながる)か否かを判別する。
(2)前後のセグメントが関係がある(つながる)場合は、関係がある前後のセグメントを合体させて要約文を作成する。
(3)一方、前後のセグメントが関係がない(つながらない)場合は、そのセグメントは独立して取り扱って別個の要約文を作成する。
【0111】
最後に、上記の如くして作成した要約文を出力する(要約文の出力S11)のであるが、その出力時に以下の処理も行う。
【0112】
即ち、要約文が、「動詞」や「形容動詞」で終わるときは変格活用を終止形とする。また、要約文中の主要語が名詞の場合、その主要語の説明文となるときには、その文末を「…もの」或いは「…するもの」とする。これにより、動詞の「…し、」等のように文として中途半端な形で終わるのを回避し、おさまりのよい文章として、補助資料の理解しやすさを高めている。
【0113】
また、前記第1または第2の具体例で触れたように、補助資料に設けられた書誌的事項の表示欄2内の各表示欄4,5,6,7に表示すべきテキストデータが、順次前記読み込み特許データ中から検索されて、補助資料中の所要の表示欄4,5,6,7に表示されることになる。
【0114】
すなわち、例えば特許権者名の表示欄4に表示されるべきテキストデータは、前記読み込み特許データ中で「特許権者」の文字列を検索キーとしてこれに連なる文字列の「ABC株式会社」をコピーして、表示欄4に転記させるようにする。特許公報の番号の表示欄5の場合は、「特許番号」の文字列を検索キーとし、特許公報の発明の名称表示欄6の場合は「発明の名称」の文字列を検索キーとして、それぞれ前記読み込み特許データを検索、コピーして転記させる。
【0115】
なお、これらの項目については、国際的に統一されたINIDコード(Internationally agree Numbers for Identification of Data,データ確認のための国際合意番号)が付与されているので、前記読み込み特許データ中をこれを用いて検索して、コピーおよび転記を行うようにしてもよい。ちなみに、表示欄4に対応する特許権者名はINIDコード(73)、表示欄5に対応する特許番号はINIDコード(11)、表示欄6に対応する発明の名称はINIDコード(54)である。
【0116】
請求項番号の表示欄7の場合は、読み込み特許データ中から処理対象として指定した「請求項1」を読み取り、それを表示すればよい。あるいは、ユーザーによる処理指示の入力信号をそのまま転記することにしてもよい。
【0117】
これらの処理を行った後、あるいはこれらの処理を行いながら、前記した処理結果を補助資料の、例えば第1の具体例の表形式の書式としての表示枠1中の所要の欄に出力する。なお、第2の具体例にあっても、表示枠は用いられてはいないが、表示内容に応じて表示位置が調整され補助資料全体として表示内容相互の関係の見やすさが確保されているので、各項目は所定の表示欄に表示されたものとなる。
【0118】
以上の処理結果が、紙片Pに表示された結果は、図1に示す第1の具体例または図2に示す第2の具体例のようになるが、これらと同様のものを、CRTデイスプレイや液晶デイスプレイ等の電気的表示装置に表示するようにしてもよい。
【0119】
以上説明したように、請求の範囲の内容を要約文と修飾語句とに区分けして、別の欄に表示するようにしたので、この補助資料を参照することにより、請求の範囲の文理解釈が容易となる。とくに、請求の範囲の文言処理に、その特許公報等の請求の範囲以外の部分での単語データを用いることにしたので、単語認識が正確になるから、主要語と修飾語句との識別が正確となる。これによって、補助資料の作成に要する人手を軽減または解消しながら、補助資料において正確な要約文の作成と主要語に対する正確な修飾語句の提示とが可能となる。
【0120】
このような補助資料に発明または考案の名称を表示するようにしたので、補助資料の識別性が確保されるとともに、請求の範囲の文末に定型文として表示されている部分を資料内容として表示することを省略することができる。
【0121】
このような補助資料に公報番号を表示するようにしたので、補助資料を当該公報と照合することが容易となり、補助資料を参照しながら当該公報を検討することが容易となる。
【0122】
このような補助資料に当該公報にかかる権利者名を表示するので、同一権利者によりなされることの多い関連権利保有の状況下での補助資料整理が行いやすく、当該公報との照合も行いやすい。
【0123】
【発明の効果】
以上説明したように、請求項1記載の発明によれば、電気的データからなる出願書類等における請求の範囲の文であって、その文中に図面中に使用した符号を記載してあるものを処理対象とし、当該請求の範囲の文から、その文の骨組みを示す主要語を含ませた要約文をコンピュータ処理にて作成するとともに、前記要約文に含ませた主要語についての修飾語句をコンピュータ処理にて前記要約文とは別個に分離して作成するものとし、前記要約文を第1欄に表示するとともに、前記第1欄とは異なる第2欄に前記修飾語句を主要語との対応関係が明らかとなるように表示する請求の範囲についての補助資料作成方法において、前記符号を検索対象として、前記出願書類等における当該請求の範囲以外の部分を検索して、その符号に対応する単語データを収集し、その単語データと請求の範囲の文中の文字列とを照合させて請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行って当該請求の範囲のコンピュータ処理を行うので、請求の範囲の内容を要約文と修飾語句とに区分けして別の欄に表示した補助資料を参照することにより、請求の範囲の文理解釈が容易となる。
【0124】
とくに、請求の範囲の言語処理に、図面中に使用した符号を用いてデータ収集を行うこととし、その特許公報等の請求の範囲以外の部分での単語データを用いて処理することにしたので、単語認識が正確になり、主要語と修飾語句とを識別するためのコンピュータ処理が比較的容易で正確となる。そして、補助資料作成に要する人手への依存を軽減あるいは解消しつつ、補助資料において正確な要約文の作成と主要語に対する正確な修飾語句の提示とが可能となる。
【0125】
請求項2記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の符号の説明の記載であるので、わずかなテキストデータから当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく収集することができ、そのための処理も容易である。
【0126】
請求項3記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載であるので、当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく重点的に収集することができる。
【0127】
請求項4記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の要約書の要約の記載であるので、わずかなテキストデータから当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく収集することができる。
【0128】
請求項5記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載と、当該書類中の明細書の符号の説明の記載と、当該書類の中の要約書の要約の記載とのうち、少なくとも2以上のものからなるので、当該出願書類等における技術内容の記載がほとんど網羅され、当該書類中で記載されている技術内容に関して使用されている用語について信頼性の高い単語認識を得ることができる。
【図面の簡単な説明】
【図1】補助資料の第1の具体例の説明図である。
【図2】補助資料の第2の具体例の説明図である。
【図3】実施例の処理手順概略を示すフローチャートである。
【符号の説明】
P 紙片
1 表示枠
2 書誌的事項の表示欄
3 補助資料内容の表示欄
4 表示欄
5 表示欄
6 表示欄
11 表示欄
12 表示欄
13 表示欄
14 要約文表示欄
15 修飾語句表示欄
21 要約文表示欄
22 要約文表示欄
23 表示欄
24 修飾語句表示欄
25 修飾語句表示欄
26 修飾語句表示欄
27 修飾語句表示欄
【発明の属する技術分野】
この発明は、特許または実用新案登録出願にかかる出願書類をはじめとする手続書類、あるいはこれらに基づいて発行される特許公報や実用新案登録公報または公開特許公報もしくは公開実用新案公報等の公報類(以下、出願書類等という)に表示される,特許請求の範囲や実用新案登録請求の範囲(以下、単に請求の範囲という)についての補助資料作成方法に関するものである。
【0002】
【従来の技術】
前記の出願書類等のうちの特許公報等の公報類については、従来から二次資料が作成され、特許調査等の便宜に広く供されている。しかし、従来のこの種の二次資料は、特許公報等の一部の欄を抽出してそのまま表示している。
【0003】
したがって、従来の二次資料では、特許公報等に記載されている請求の範囲についても公報の原文がそのまま表示されているに過ぎず、格別には解釈の便宜は図られていない。
【0004】
【発明が解決しようとする課題】
ところで、これらの出願書類等のうちで重要な記載の一つである請求の範囲は、記載されている技術内容が複雑であるうえに文章表現としての複雑さが重複している。
【0005】
すなわち、出願書類等の請求の範囲に記載されている文章は、一般に抽象的な記載が多い上、修飾語が多用された複雑な文章となっている。
【0006】
そのため、特許の知識や文章読解力の豊かでない一般人や技術者等にとっては、その記載内容の理解や解釈が容易ではなく、記載内容の理解や解釈ができるにしても時間を要する。
【0007】
この発明は、このような事情に基づいてなされたもので、請求の範囲の記載内容を理解や解釈する上での読者の負担を軽減することのできる補助資料をコンピュータを利用して作成する方法であって、そのコンピュータ処理を比較的容易でかつ正確に行わせるようにして、補助資料作成に要する人手への依存を軽減あるいは解消することを解決しようとする課題とするものである。
【0008】
【課題を解決するための手段】
この課題を解決するために、請求項1に記載した発明は、電気的データからなる出願書類等における請求の範囲の文であって、その文中に図面中に使用した符号を記載してあるものを処理対象とし、当該請求の範囲の文から、その文の骨組みを示す主要語を含ませた要約文をコンピュータ処理にて作成するとともに、前記要約文に含ませた主要語についての修飾語句をコンピュータ処理にて前記要約文とは別個に分離して作成するものとし、前記要約文を第1欄に表示するとともに、前記第1欄とは異なる第2欄に前記修飾語句を主要語との対応関係が明らかとなるように表示する請求の範囲についての補助資料作成方法において、前記符号を検索対象として、前記出願書類等における当該請求の範囲以外の部分を検索して、その符号に対応する単語データを収集し、その単語データと請求の範囲の文中の文字列とを照合させて請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行って当該請求の範囲のコンピュータ処理を行うことを特徴とする。
【0009】
また、請求項2に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の符号の説明の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0010】
また、請求項3に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0011】
また、請求項4に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の要約書の要約の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0012】
また、請求項5に記載した発明は、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載と、当該書類中の明細書の符号の説明の記載と、当該書類中の要約書の要約の記載とのうち、少なくとも2以上のものからなることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法である。
【0013】
【発明の実施の形態】
以下、具体例の補助資料の作成方法に関して、図面を参照しながら実施の形態を説明する。
【0014】
以下に説明する具体例は、いずれも「特許123456」に関するものである。特許公報等の公報類の内容は、対応する出願書類を始めとする手続書類等に由来する内容であるから、公報類であってもその内容は本願でいう出願書類等の内容に他ならず、これを処理対象とする意味で本願発明の実施の形態となるものである。
【0015】
図1に示す第1の具体例は表形式としたものであり、図2に示す第2の具体例は改行表示形式としたものである。以下においては、基本的に第1、第2の具体例に共通して説明を行うこととし、個々の具体例としてはその具体例に固有の事項についてのみ個別的に説明を行うこととする。
【0016】
出願書類等の一例に該当する「特許123456」の特許公報(特許公報の内容はすべて電気的データからなる)には、特許権者は「ABC株式会社」、発明の名称は「環状の工作物用円筒バレル研磨方法」であると表示されている。
【0017】
そして、その特許公報の特許請求の範囲の欄の請求項1には、次のクレーム原文Aが表示されており、同原文A中には図面中に使用した符号(以下、参照番号という)が部品名称等の単語の後に対応して表示されている。
【0018】
クレーム原文A:「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、前記環状の工作物20の内面側及び外面側に適量の研磨材25を装入し、前記皿状の回転槽4を回転して研磨材25を流動させ、前記環状の工作物20の内外面を同時に研磨するようにしたことを特徴とする環状の工作物用円筒バレル研磨方法。」
【0019】
このような特許公報については、次のような補助資料が作成される。
【0020】
前記のクレーム原文Aは、3つの文を組み合わせた複合文であるので、まず次の(1)から(3)の3部分に区分される。
【0021】
(1) 環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、
【0022】
(2) 前記環状の工作物20の内面側及び外面側に適量の研磨材25を装入し、
【0023】
(3) 前記皿状の回転槽4を回転して研磨材25を流動させ、前記環状の工作物20の内外面を同時に研磨するようにしたことを特徴とする環状の工作物用円筒バレル研磨方法。
【0024】
これらの(1)から(3)の各部分についての処理内容を順に概略説明すると次のようである。
【0025】
なお、この明細書においては、修飾語句により修飾される被修飾語であって、その修飾語句を含んだ状態の文においてその文の骨組みを構成する自立語(例えば、名詞や動詞等)を、主要語ということとする。
【0026】
まず、(1)の部分のうち、「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される研磨槽1内に、」について、「環状の固定槽6と該環状の固定槽6の下部を塞ぐ皿状の回転槽4とにより構成される」は主要語「研磨槽1」の修飾語句である。
【0027】
次に、「環状の工作物20を前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように挿入して環状の固定槽6に装着し、」については、「前記皿状の回転槽4と同心円状に、且つ該環状の工作物20の下端が前記皿状の回転槽4と近接するように」は主要語「挿入して」の態様を説明する修飾語句である。
【0028】
したがって、前記から、(1)の部分において主要語を含む要約文は「研磨槽1内に、環状の工作物20を挿入して環状の固定槽6に装着する」である。
【0029】
主要語「研磨槽1」の修飾語句は前記のとおりであるが、その修飾語句が表示文として本例のように複雑である場合には、図2に示す第2の具体例のように、その修飾語句内でさらに「皿状の回転槽4」を主要語として扱い、これに関する修飾語句「該環状の固定槽6の下部を塞ぐ」を別表示させることとしてもよい。このようにすることによって、主要語の「研磨槽1」の修飾語句を「環状の固定槽6と皿状の回転槽6とにより構成される」とし、主要語「皿状の回転槽4」の修飾語句「環状の固定槽6の下部を塞ぐ」を分離すれば内容がより一層理解しやすくなる。
【0030】
なお、請求の範囲の文中では、文の流れによって動詞が終止形以外の状態であることがあるが、その場合には補助資料としての表示内容の理解の便宜の観点からその動詞を終止形に修正することが望ましい。また、請求の範囲の文中では、「前記」、「該」等の指示的表示が多用されがちであるので、その場合には補助資料としての誤解の可能性を考慮したうえで、これらの文字を省略してもよい。
【0031】
次に(2)の部分については、その構造が単純文であり、表示内容の理解が難しいほど煩雑でもないので、基本的にはそのまま表示することとし、文頭の「前記」を省略すると共に、文末の「装入し」を終止形の「装入する」との調整のみをおこなって補助資料の表示とする。なお、図2に示す第2の具体例においては、(2)の文中から主要語「研磨剤25」の修飾語句「適量の」を分離して、前記(1)の部分に準じた別記載としている。
【0032】
さらに、(3)の部分について、その構造は複合文であるが、表示内容が煩雑ではないので、請求の範囲の文末としての常套語句で発明の名称と一致した表示である「ことを特徴とする環状の工作物用円筒バレル研磨方法」の部分を省略すると共に、「前記」の表示を省略して補助資料の内容表示とする。
【0033】
このようにして作成した補助資料の実体的内容は、例えば図1あるいは図2に示す形態で表示される。なお、以下の各具体例において、後述する文書処理が済んだ後の最終的な表示の段階で、請求の範囲中に記載されていた参照番号の表示を省略するようにしてもよい。
【0034】
図1に示す第1の具体例の補助資料は、補助資料の表示形態を表形式としたものであり、以下に記載する各表示欄は罫線によって区画して設けてある。
【0035】
この第1の具体例は紙片Pに印刷したものであるが、電気的信号のまま、例えばCRTデイスプレイや液晶デイスプレイ等の電気的表示装置に表示するようにしてもよい。
【0036】
図1において、紙片Pには、表形式に形成された補助資料の表示枠1が形成されている。
【0037】
表示枠1には、書誌的事項の表示欄2と、補助資料としての特許請求の範囲の実体的な内容を表示する表示欄3とが設けられている。
【0038】
書誌的事項の表示欄2内には、表示欄3に表示される特許公報についての特許権者名の表示欄4と、当該特許公報の番号の表示欄5と、当該特許公報の発明の名称の表示欄6と、請求の範囲中で処理対象とした請求項番号の表示欄7とが設けられている。
【0039】
なお、前記表示欄5には、該当公報が補正公報や訂正公報である場合には、その公報が対応する出願公開番号あるいは特許番号を表示するとともに、表示欄3の表示内容が補正公報あるいは訂正公報にかかるものである旨をあわせて表示することが望ましい。
【0040】
補助資料の実体的内容の表示欄3は、前記クレーム原文Aの(1)から(3)に対応してそれぞれの表示内容が表示される3つの表示欄11,12,13が形成されている。各表示欄11,12,13に表示される内容は前記したとおりであるが、とくに、表示欄11においては要約文表示欄14に表示された主要語「研磨槽」、「挿入して」と、それぞれの右側の修飾語句表示欄15に表示された内容とを対応するように表示させて内容理解の容易化を図っている。
【0041】
図2に示す第2の具体例の補助資料は、第1の具体例のように表形式とはせず、改行と行頭位置とで表示欄を区別するようにしたものである。
【0042】
この第2の具体例においても、図2に参照番号で示すように、書誌的事項の表示欄2と、特許請求の範囲の表示内容についての補助資料内容の表示欄3とが設けられており、表示欄4〜7と、実体的な表示内容が表示される3つの表示欄21,22,23とが形成されていることは第1の具体例と同様である。
【0043】
この第2の具体例においては、表示欄23には前記原文Aの(3)の前記した表示をそのまま表示することとし、前記表示欄21、22にはそれぞれ原文Aの(1)、(2)に対応する要約文を冒頭に表示するとともに、各表示欄21,22の下方の行には行頭位置を少し右側に下げて各要約文中の主要語とこの主要語に対応する修飾語句とを表示する修飾語句表示欄24,25、26を設けている。
【0044】
これらの修飾語句表示欄24,25,26においては、行頭部分に修飾語句により修飾される主要語を配置し、主要語の後方に連なる形態で対応する修飾語句を表示する。これは、主要語と修飾語句との関係を明確にかつ容易に認識できるようにするためである。
【0045】
そして、この第2の具体例の修飾語句表示欄24においては、前記のように修飾語句を表示しているが、その修飾語句の認識をより容易なものとするために、さらに表示欄27を設けいる。この表示欄27は、行頭位置をさらに右側に下げて前記修飾語句表示欄24の修飾語句中の「皿状の回転槽」を主要語として、これを修飾する修飾語句をその主要語「皿状の回転槽」の右側にコロン「:」を介して表示している。
【0046】
なお、表示欄24に示したように、名詞を主要語とした場合にはその修飾語句の文末に文言「もの」を付加すると、語句としてのまとまりが良くなって内容の理解がしやすくなる。
【0047】
この第2の具体例によっても、第1の具体例と概ね同様に「特許123456」の特許公報の請求項1の表示内容を理解するうえでの読者の文理解釈面での負担を軽減でき、容易に内容を理解することができる。
【0048】
次に、前記のような補助資料の作成作業として行うコンピュータ処理の具体的内容について、主に図3のフローチャートに基づいて説明する。
【0049】
まず、初期処理S1として、本コンピュータ処理の基本となる辞書をロードする。ここでロードされる辞書は、主に原文中のいずれの部分が主要語、即ち自立語であるか否かの判断を行うためのものである。
【0050】
初期処理S1でロードされた辞書によってコンピュータに蓄積された言語データは、第1言語データと第2言語データとから成る。
【0051】
第1言語データは、いわゆるワープロソフトを構成する日本語辞書として一般的に市販されている言語データであり、第2言語データは、本発明のコンピュータ処理で一語と判断しがたい単語を予め登録するもので、所謂ユーザー辞書を構成している。
【0052】
なお、この第2言語データは、前記第1言語データと全く別個に構成しても良いが、第1言語データ内に含まれる形で登録するように構成しても良い。
【0053】
この第2言語データには、例えば名詞、状態を表す単語、削除対象文字、及び汎用専門用語などが予め登録されている。
【0054】
第2言語データとして登録すべき名詞としては、一般的にコンピュータが名詞として判別し難いものが挙げられる。例えば、仮名書きの名詞や、英字又は仮名混じりの名詞が、一つの名詞として登録される。
【0055】
状態を表す単語として登録すべきものは、被修飾部を形成するときに、体言を表さない単語が挙げられる。即ち、漢字のストリングであっても、その単語が体言を表さないときは、その前の文字列が連体修飾語になれないからである。かかる状態を表す単語としては、例えば、「即ち」や「複数個」等である。
【0056】
削除対象文字として登録すべきものは、数詞や代名詞以外でプログラムの中に組み込めていない文字(例えば「当該」「前記」「該」など)が挙げられる。
【0057】
汎用専門用語として登録すべきものは、一定の業界内で特定のものを指し示さない単語又は複合語が挙げられる。これらは、特定固有名詞ではないので、修飾語の分離のときに要約文での説明対象から除外するためである。
【0058】
修飾語句の分離(後述のS9参照)の対象から外すものとして登録すべきものは、上記汎用専門用語の他、以下のようなものが挙げられる。
【0059】
後続の「の」で区切らないものとして登録すべきものは、「通常」や「時」などが挙げられる。
【0060】
また、後続の「の」の後で名詞としないものとして登録すべきものは、「組合せ」や「複数個」などが挙げられる。
【0061】
更に、例えば、「及び」や「又は」などのように、漢字を含む接続語等は修飾語句の分離対象から外すものとする。
【0062】
尚、本実施例においては、第2言語データに上記のような登録を行っているが、これらのうち何れかのみを登録、又は他のものを登録するようにしてもよい。
【0063】
また、主に原文中のいずれの部分が主要語、即ち自立語であるか否かの判断は、後から説明するように、読み込み特許データから収集された第3言語データをも参照しつつ行われる。
【0064】
次に、原文を取得して所定の処理を行う(原文取得処理S2)。かかる原文の取得は、CD−ROM、DVD−ROM、FD又はインターネット等から例えばテキストデータとしての電気的データを取り込むことにより行われるのであるが、例えば当該請求の範囲が記載された特許公報等の出力紙をスキャナでスキャンした後、文字変換して得られた電気的データであってもよい。
【0065】
原文取得としてコンピュータに読み込まれる電気的データの内容は、この実施例の場合は「特許123456」の特許公報に記載された全ての記載事項に該当するテキストデータであり、図面そのもののデータは除かれている(以下において、読み込み特許データという)。なお、このように図面そのもののデータを除外せずに出願書類等の全ての記載事項に相当するものを読み込んで、そのうちのテキストデータ部分を用いて処理することにしてもよい。
【0066】
次に、まず、第3言語データの作成処理についての説明を行う。
【0067】
この読み込み特許データの中で、前記の具体例で表示する所要の書誌的データと、請求の範囲(この実施例では請求項1のみ)のデータとが補助資料作成のための直接的な処理対象であるが、第3言語データを作成するために、この実施例では、前記特許公報中の明細書の実施の形態の欄の記載と、同特許公報中の明細書の符号の説明の欄の記載とのテキストデータが用いられる。なお、この第3言語データ用のデータとしては、前記特許に対応する出願書類中の要約書の要約の欄の記載を前記テキストデータの代替とし、あるいは併用するようにしてもよい。
【0068】
この実施例における第3言語データは、以下に説明するように、第1データ収集処理と第2データ収集処理とからなるもので、これらの処理で収集される言語データはいずれも第3言語データである。
【0069】
第1データ収集処理は、前記特許公報中の明細書の符号の説明の欄に記載されたテキストデータから、言語データの収集を行うものである。
【0070】
「特許123456」の特許公報においては、その特許公報中の明細書の符号の説明欄には、図面中に使用した符号である参照番号と、その説明としての名称とが次に記載するように互いに対応してテキストデータで表示されている。
【0071】
すなわち、同公報の符号の説明欄には、「2…回転軸、3…軸受、4…回転槽、6…固定槽、7…ライニング、12…外筒、14…ネジ、15…中心軸、20…環状の工作物、21…外周面、22…内周面、23…環状ベアリング、25…研磨材、29…環状摺動板、30…連結板。」との記載がある。
【0072】
この第1データ収集処理においては、前記した符号の説明欄の記載中で、参照番号と説明としての名称の単語とが対をなすデータとして収集される。すなわち、第1データ収集処理で収集され記憶されるデータは、「(2回転軸)(3軸受)(4回転槽)(6固定槽)(7ライニング)(12外筒)(14ネジ)(15中心軸)(20環状の工作物)(21外周面)(22内周面)(23環状ベアリング)(25研磨材)(29環状摺動板)(30連結板)」である。なお、前記中の()は対であることを示すものであり、データ内容ではない。
【0073】
第1データ収集処理で得られたこのようなデータは、前記請求の範囲中に表示された参照番号を検索キーとして順次検索されて、参照番号が一致した対の単語と、請求の範囲中の参照番号の直近前側に連なる文字列と比較が行われる。請求の範囲中の前記文字列が、前記の単語と一致していれば、請求の範囲中の文字列中の一致している文字数の範囲がその単語であるとの認識を行う。
【0074】
例えば、請求の範囲中の参照番号20についての「…内に、環状の工作物20を…」の部分の処理は、参照番号「20」により、前記の収集データから「(20環状の工作物)」が選択され、参照番号20の前方に連なって6文字の範囲の単語であるという条件が設定される。この条件下で、請求の範囲の前記の部分での比較対象は「環状の工作物」の範囲であるから、収集したデータと一致しており、この部分は、「環状の工作物」という単語認識とする。一般に、日本語のコンピュータ処理において、漢字かな混じりの単語の認識が難しいとされているが、このような処理を行うことにより比較的容易な処理でありながら正確な単語認識が確保されることになる。
【0075】
ところで、前記した符号の説明欄に基づく第1データ収集処理では、請求の範囲中に表示されている参照番号の全てについての単語データを収集できない場合がある。前記の例では、「研磨槽1」についてのデータが不足している。
【0076】
次に説明する第2データ収集処理は、前記特許公報中の明細書の実施の形態の欄の記載のデータを用いて、言語データの収集を行うもので、前記のように第1データ収集処理のみではデータが不足している場合や、念入りに単語認識の正確さを確認する場合などに行う。なお、特許公報等や出願書類の発行年度等によっては法規の改変等の理由から、実施の形態の欄の代わりに実施例の欄が設けられているものがあり、その記載内容の面でも類似の性質を有している。この明細書においては、このような実施例の欄をも包含する意味で実施の形態の欄の文言を用いている。
【0077】
第2データ収集処理は、前記特許公報の明細書の実施の形態の欄のテキストデータを、各参照番号を検索キーとして検索し、その参照番号の直前にどのような文字列が連なっているかのデータを複数個集めて、それらの文字列データの共通部分をもって当該参照番号に対応する単語として決定するものである。
【0078】
前記してきた本願の実施の形態の場合には、請求の範囲中の参照番号「1」については、第1データ収集処理で得られたデータでは単語認識が得られないので、実施の形態の部分に対応する読み込み特許データから参照番号1に対応するテキストデータを参照番号から前側に連なって文字数で10文字の範囲で収集する。
【0079】
その結果、たとえば、参照番号1に対応して次のような4つのテキストデータを得たものとする。すなわち、参照番号の前側に文字数で10文字の範囲で収集したテキストデータを列記すると、データ1「より構成された研磨槽1」、データ2「コンパウンドを研磨槽1」、データ3「が停止した後、研磨槽1」、データ4「が近接するまでナット1」の4つである。
【0080】
このように得られた4つのデータの照合は、次のように行う。すなわち、まず、参照番号1の直前の1文字目を比較すると、データ1から3は参照番号「1」の直前の文字が「槽」で一致しているが、データ4は「ト」であり不一致である。ここで、少数派のデータ4は不採用として、参照番号の前側2文字目についてデータ1から3を比較すると、いずれも「磨」で一致しており、同様に参照番号の前側3文字目も「研」で一致している。参照番号の前方4文字目においては、データ1は「た」、データ2は「を」、データ3は「、」と各データが不一致となるので、データ1から3が完全に一致して共通している3文字前までの部分の「研磨槽」を、参照番号1に対応する単語と判断してデータとして採用する。これによって、参照番号「1」の直前に連なる3文字の範囲で、前記請求の範囲での表示「…される研磨槽1内…」を比較すると、一致しており、「研磨槽」という単語認識が行われる。これによっても正確な単語認識が確保されることになる。
【0081】
前記してきた本願の実施の形態の場合は、これで第2データ収集処理を終了する。なお、これに限らず、順次、その他の参照番号についても、これと同様に処理して、実施の形態に表示されている全ての参照番号についてのデータ収集を行うようにしてもよい。その場合、実施の形態の欄に記載されている全ての参照番号についてこの一連の処理が終了すれば、第2データ収集処理による言語データの収集作業が終了する。
【0082】
この実施の形態では、参照番号とこれに対応する単語を収集するのに、参照番号の前側に文字数で10文字の範囲でテキストデータを収集したが、データ収集を行う文字数の範囲は適宜に設定してもよく、また、その参照番号を含む一文全体を収集するようにして、前記と同様の手法で単語を判断させるようにしてもよい。その場合には、実施の形態の記載全体からその参照番号を含む全ての記載が一文単位で収集されることになるので、その明細書におけるその単語に関する記載が網羅され、このデータをその明細書に関する技術的な記載内容についてのデータベースとして活用することが可能となる。
【0083】
以上のように、この実施の形態においては、第1データ収集処理と第2データ収集処理と行うものであるが、第1データ収集処理あるいは第2データ収集処理の一方のみを行って第3言語デーを得ることにしてもよい。
【0084】
このようにして、読み込み特許データから、第3言語データを作成して、記憶させた後、処理対象である請求の範囲に対応するテキストデータに対して、以下のような解析処理が行われる。
【0085】
すなわち、この原文取得処理S2においては、上記の如く取得した請求の範囲の原文(クレーム原文A)につき、文字単位の解析を行う。かかる解析は、原文を1文字単位に区分けし、それぞれを以下の如き記号化することにより行われる。例えば、ひらがなを記号「1」、カタカナを記号「2」、英字を記号「3」、数字を記号「4」、記号を記号「5」、漢字を記号「6」、句読点(括弧或いは2重括弧)を記号「7」、句読点(閉じ括弧或いは2重閉じ括弧)を記号「8」、その中の句読点を記号「9」の如きである。
【0086】
上記のような1文字単位毎に記号化しておけば、以降の解析を容易に行うことができる。尚、文字は、全角半角変換を利用して、どちらで入力してあっても解析を可能としておくのが好ましい。また、上記記号(記号「1」〜「9」)は、一例であって、1文字単位毎に所謂コード化することができれば他の記号を用いてもよい。
【0087】
上記文字単位の解析の後、初期処理S1でロードしておいた辞書(第1言語データと第2言語データ)および読み込み特許データに基づいて作成された前記の第3言語データに基づき、名詞部分を記号化(例えば記号「10」等)しておく。
【0088】
とくに、ロードした第2言語データには、一般的にコンピュータが名詞として判別し難い名詞が登録されているため、その後の解析時において名詞を判別する際に役立たせることができる。また、読み込み特許データに基づいて作成された第3言語データは、出願書類や特許公報等の性格上、処理対象とする請求の範囲と一定の関係のあるテキストデータから、結果的に主に名詞を中心とする単語が収集されるため、後の解析時の判別に役立てて名詞の判別が正確になる。
【0089】
その後、一定の条件下による各単語の成り立ち(品詞が何であるか等)について解析するとともに、それを記号化しておく。例えば、句読点より前の助詞、助詞より前の名詞、及び助詞より前の動詞を明確にして記号化するとともに、接続詞、副詞、連体詞、数詞、代名詞、指示語を明確にして記号化し、加えて、連体修飾部と連用修飾部とを明確にして記号化しておく。
【0090】
以上で、原文取得処理S2が終了するのであるが、最後に行った処理(各単語の成り立ちの解析を記号化)とその前処理で行った記号化とが重複した場合、当該最後に行った処理で付与された記号を使用する。これは、かかる処理で付与した記号は、先に解析した内容を含んでいるからである。上記のように、本実施形態によれば、読み込み特許データに基づいて作成された第3言語データを用いて請求の範囲の文における解析を行うので、主に名詞の単語認識がより正確な解析をすることが可能となる。
【0091】
次に、複合文分割S3について説明する。このS3は、上記の如き解析を行った文中に、句読点である「。」があるか否かを判別し、ある場合は、その位置で文を分割する。これは、「。」がある位置では、文章が区切れているのが明らかであり、当初から区切っておいた方が続く処理を容易とすることができるからである。一方、かかる文中に「。」がない場合は、複合文分割S3においては、なにも処理されない。
【0092】
次に、S4の「おいて」書き分割について説明する。このS4では、文中に「おいて、」なる文言があるか否かを判別し、該文言があると判断された場合は、当該文言の前と後に分割する。即ち、請求の範囲の記載中に「おいて、」なる文言がある場合、そのほとんどが、当該文言の前が発明又は考案の前提部分、後ろが発明又は考案の特徴部分であるからである。
【0093】
上記「おいて」書き分割S4の終了後、S5の文章分割にすすむ。この文章分割S5においては、句読点である「、」がある位置で文章を分割する。なお、以下のこの明細書において、文章分割S5の処理後の各文のことを、セグメントという。
【0094】
文章分割S5された各セグメントについては、次に指定文字削除S6が行われる。かかる指定文字削除S6においては、予め定められた条件に該当する文字を文中から削除する作業が行われ、例えば以下の如き処理が施される。
【0095】
各セグメントになされる指定文字削除S6の内容は、(1)セグメントの先頭が、副詞や代名詞であるとき、(2)セグメントの先頭が接続詞のとき、(3)セグメントの末端が「…とともに、」などのとき、それらを削除する。
【0096】
但し、上記(3)において、「とともに」の前が動詞であるときは削除しないこととする。
【0097】
また、「前記」「上記」「当該」などの文言がセグメント中にあれば、それらを削除するとともに、セグメント中に「該」があって、続く文言が助詞でなければ削除する。加えて、セグメント中にある空白文字、及び初期処理S1でロードされた辞書に登録されている削除対象文字を削除する。
【0098】
その後、セグメントの先頭が「英字」「数字」「記号」又は「括弧」の集合体であれば削除する処理を行う(英数字削除S7)。但し、その後に続く文言が助詞のときは削除しないこととする。
【0099】
そして、上記した一連の処理後、セグメントが10文字以内のときは、次に続くセグメントと併合する(文章併合S8)。即ち、あまりに短い文に区切ってしまうと、要約文とした際に却って読みづらくなる虞があるからである。尚、この文字数は10文字に限らず適宜に設定してもよい。
【0100】
次に、S9の修飾語の分離にすすむ。このステップでは、上記の如く調整された各セグメントにおいて、末尾に位置する被修飾部に対する連体修飾部の分離を行う。これによって、クレーム原文A中に表示された文から、修飾語句と、かかる修飾語句によって修飾された被修飾部である主要語とを見つけ出し、補助資料の実体的内容の作成処理が可能となる。
【0101】
具体的には、例えば以下の方法により、セグメント中の修飾部を見つけ出すことができる。
【0102】
(1)まず、セグメント中の動詞を見つける。但し、動詞が複数ある場合には、最初の動詞を採用する。
(2)その動詞の後がひらがなでなければ修飾部であると認識し、そこで分離する。
(3)また、セグメント中に助詞の「の」があれば、修飾部であると認識し、そこで分離する。
(4)更に、セグメント中の助詞或いは形容動詞を見つけ、連体修飾になるときは、そこで分離する。
(5)尚、かかる分離作業は、連体修飾部に対して最大3回程度行うのが好ましい。
【0103】
例えば、元のセグメントが(A)(…する)((B)と)であるとしたら、分離後の被修飾部は、((B)と)となり、分離後の連体修飾部は、(A)(…する)となる。更に分離処理を行うと、分離後の連体修飾部は、(A)((a)(…した)((b)を)(…する)となり、分離後の被修飾部分は、(a)(…した)となるとともに、分離後の連体修飾部は、((b)を)となる。
【0104】
この後、S10の要約文の作成にすすむ。このステップでは、セグメントから上記の如き修飾語の分離を行った後の主要語を含む部分、又はいくつかのこのような主要語を含む部分が連なったものが、以下のパターンに該当するものであるときは、その形式に従った要約文を作成する。
【0105】
(i)クレーム原文Aの文の中間に「おいて」なる文言がある場合、当該文言の前にある前提部分と、後ろにある特徴部分とに分けて別個の要約文を作成する。但し、分けた後のそれぞれのセグメントが以下のパターンに該当する際には、そのパターンに従って各要約文を作成する。
【0106】
(ii)要約文がいくつかのセグメントで構成され、各セグメントの末尾の助詞が、最後のセグメント以外は全て接続助詞になっているパターン(具体的には、「…と」「…と」…「とからなる〜」といった文章)のときは、最後のセグメントを除き、各セグメントにおける主要語としての名詞を選択抽出して1つの文章としての要約文を作成する。この名詞を選択抽出の際に、前記第3言語データの各単語の有無を、各セグメントに対して検索することによって、そのセグメント中での単語認識が正確なものとなり、適切な主要語の選択抽出が可能となるので適切な要約文を作成することができる。
【0107】
そのうえで、このように作成された要約文の各主要語との位置関係がそれぞれ対応するように、連体修飾語を説明として表示する。かかるパターンに該当するときは、例えば図1の要約文表示欄14中の「研磨槽」とその右側に位置する修飾語句表示欄15中の記載とのような対応関係となるように出力する。また、図2の第2の具体例の場合は、要約文表示欄21の下行に修飾語句表示欄24を配置するので、修飾語句表示欄24の文頭に主要語「研磨槽」を配置し、コロン「:」を介してその右側にその修飾語句を表示するように出力して対応を明確にしている。
【0108】
(iii)要約文がいくつかのセグメントで構成され、要件定義文(具体的には、「(a)に」「(b)し」「(A)を備え」といった文章)のときは、以下の如き階層構造とする。なお、この説明において、前記(a)、(b)、(A)はそれぞれ各セグメントから前記した末尾の助詞等の文言を除外した文字列を表示している。
【0109】
「(A1)は以下の要件を満たす。」を、要約文として表示し、各セグメントの主要語と修飾語句とは、次の(1)〜(3)のようにそれぞれ列記して表示する。なお、ここでいう(A1)、(a1)、(b1)は、各文字列(A)、(a)、(b)中における主要語を示すものである。
(1) (a1):(a)中の(a1)に対する連体修飾部分
(2) (b1):(b)中の(b1)に対する連体修飾部分
(3) (A1):(A)中の(A1)に対する連体修飾部分
【0110】
(iv)要約文がいくつかのセグメントで構成された一般文(例えば、「(a)と」「(b)が」「(c)を」「(d)し〜といった文章」のときは、次のように取り扱って要約文を作成する。なお、(a)、(b)、(c)、(d)は、各セグメントにおいて、前記した末尾の助詞等の文言を除外した文字列を表すものである。
(1)各セグメントが次のセグメントと関係がある(或いはつながる)か否かを判別する。
(2)前後のセグメントが関係がある(つながる)場合は、関係がある前後のセグメントを合体させて要約文を作成する。
(3)一方、前後のセグメントが関係がない(つながらない)場合は、そのセグメントは独立して取り扱って別個の要約文を作成する。
【0111】
最後に、上記の如くして作成した要約文を出力する(要約文の出力S11)のであるが、その出力時に以下の処理も行う。
【0112】
即ち、要約文が、「動詞」や「形容動詞」で終わるときは変格活用を終止形とする。また、要約文中の主要語が名詞の場合、その主要語の説明文となるときには、その文末を「…もの」或いは「…するもの」とする。これにより、動詞の「…し、」等のように文として中途半端な形で終わるのを回避し、おさまりのよい文章として、補助資料の理解しやすさを高めている。
【0113】
また、前記第1または第2の具体例で触れたように、補助資料に設けられた書誌的事項の表示欄2内の各表示欄4,5,6,7に表示すべきテキストデータが、順次前記読み込み特許データ中から検索されて、補助資料中の所要の表示欄4,5,6,7に表示されることになる。
【0114】
すなわち、例えば特許権者名の表示欄4に表示されるべきテキストデータは、前記読み込み特許データ中で「特許権者」の文字列を検索キーとしてこれに連なる文字列の「ABC株式会社」をコピーして、表示欄4に転記させるようにする。特許公報の番号の表示欄5の場合は、「特許番号」の文字列を検索キーとし、特許公報の発明の名称表示欄6の場合は「発明の名称」の文字列を検索キーとして、それぞれ前記読み込み特許データを検索、コピーして転記させる。
【0115】
なお、これらの項目については、国際的に統一されたINIDコード(Internationally agree Numbers for Identification of Data,データ確認のための国際合意番号)が付与されているので、前記読み込み特許データ中をこれを用いて検索して、コピーおよび転記を行うようにしてもよい。ちなみに、表示欄4に対応する特許権者名はINIDコード(73)、表示欄5に対応する特許番号はINIDコード(11)、表示欄6に対応する発明の名称はINIDコード(54)である。
【0116】
請求項番号の表示欄7の場合は、読み込み特許データ中から処理対象として指定した「請求項1」を読み取り、それを表示すればよい。あるいは、ユーザーによる処理指示の入力信号をそのまま転記することにしてもよい。
【0117】
これらの処理を行った後、あるいはこれらの処理を行いながら、前記した処理結果を補助資料の、例えば第1の具体例の表形式の書式としての表示枠1中の所要の欄に出力する。なお、第2の具体例にあっても、表示枠は用いられてはいないが、表示内容に応じて表示位置が調整され補助資料全体として表示内容相互の関係の見やすさが確保されているので、各項目は所定の表示欄に表示されたものとなる。
【0118】
以上の処理結果が、紙片Pに表示された結果は、図1に示す第1の具体例または図2に示す第2の具体例のようになるが、これらと同様のものを、CRTデイスプレイや液晶デイスプレイ等の電気的表示装置に表示するようにしてもよい。
【0119】
以上説明したように、請求の範囲の内容を要約文と修飾語句とに区分けして、別の欄に表示するようにしたので、この補助資料を参照することにより、請求の範囲の文理解釈が容易となる。とくに、請求の範囲の文言処理に、その特許公報等の請求の範囲以外の部分での単語データを用いることにしたので、単語認識が正確になるから、主要語と修飾語句との識別が正確となる。これによって、補助資料の作成に要する人手を軽減または解消しながら、補助資料において正確な要約文の作成と主要語に対する正確な修飾語句の提示とが可能となる。
【0120】
このような補助資料に発明または考案の名称を表示するようにしたので、補助資料の識別性が確保されるとともに、請求の範囲の文末に定型文として表示されている部分を資料内容として表示することを省略することができる。
【0121】
このような補助資料に公報番号を表示するようにしたので、補助資料を当該公報と照合することが容易となり、補助資料を参照しながら当該公報を検討することが容易となる。
【0122】
このような補助資料に当該公報にかかる権利者名を表示するので、同一権利者によりなされることの多い関連権利保有の状況下での補助資料整理が行いやすく、当該公報との照合も行いやすい。
【0123】
【発明の効果】
以上説明したように、請求項1記載の発明によれば、電気的データからなる出願書類等における請求の範囲の文であって、その文中に図面中に使用した符号を記載してあるものを処理対象とし、当該請求の範囲の文から、その文の骨組みを示す主要語を含ませた要約文をコンピュータ処理にて作成するとともに、前記要約文に含ませた主要語についての修飾語句をコンピュータ処理にて前記要約文とは別個に分離して作成するものとし、前記要約文を第1欄に表示するとともに、前記第1欄とは異なる第2欄に前記修飾語句を主要語との対応関係が明らかとなるように表示する請求の範囲についての補助資料作成方法において、前記符号を検索対象として、前記出願書類等における当該請求の範囲以外の部分を検索して、その符号に対応する単語データを収集し、その単語データと請求の範囲の文中の文字列とを照合させて請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行って当該請求の範囲のコンピュータ処理を行うので、請求の範囲の内容を要約文と修飾語句とに区分けして別の欄に表示した補助資料を参照することにより、請求の範囲の文理解釈が容易となる。
【0124】
とくに、請求の範囲の言語処理に、図面中に使用した符号を用いてデータ収集を行うこととし、その特許公報等の請求の範囲以外の部分での単語データを用いて処理することにしたので、単語認識が正確になり、主要語と修飾語句とを識別するためのコンピュータ処理が比較的容易で正確となる。そして、補助資料作成に要する人手への依存を軽減あるいは解消しつつ、補助資料において正確な要約文の作成と主要語に対する正確な修飾語句の提示とが可能となる。
【0125】
請求項2記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の符号の説明の記載であるので、わずかなテキストデータから当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく収集することができ、そのための処理も容易である。
【0126】
請求項3記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載であるので、当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく重点的に収集することができる。
【0127】
請求項4記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の要約書の要約の記載であるので、わずかなテキストデータから当該書類中で記載されている技術内容に関して使用されている用語についての単語データを効率よく収集することができる。
【0128】
請求項5記載の発明によれば、出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載と、当該書類中の明細書の符号の説明の記載と、当該書類の中の要約書の要約の記載とのうち、少なくとも2以上のものからなるので、当該出願書類等における技術内容の記載がほとんど網羅され、当該書類中で記載されている技術内容に関して使用されている用語について信頼性の高い単語認識を得ることができる。
【図面の簡単な説明】
【図1】補助資料の第1の具体例の説明図である。
【図2】補助資料の第2の具体例の説明図である。
【図3】実施例の処理手順概略を示すフローチャートである。
【符号の説明】
P 紙片
1 表示枠
2 書誌的事項の表示欄
3 補助資料内容の表示欄
4 表示欄
5 表示欄
6 表示欄
11 表示欄
12 表示欄
13 表示欄
14 要約文表示欄
15 修飾語句表示欄
21 要約文表示欄
22 要約文表示欄
23 表示欄
24 修飾語句表示欄
25 修飾語句表示欄
26 修飾語句表示欄
27 修飾語句表示欄
Claims (5)
- 電気的データからなる出願書類等における請求の範囲の文であって、その文中に図面中に使用した符号を記載してあるものを処理対象とし、当該請求の範囲の文から、その文の骨組みを示す主要語を含ませた要約文をコンピュータ処理にて作成するとともに、前記要約文に含ませた主要語についての修飾語句をコンピュータ処理にて前記要約文とは別個に分離して作成するものとし、前記要約文を第1欄に表示するとともに、前記第1欄とは異なる第2欄に前記修飾語句を主要語との対応関係が明らかとなるように表示する請求の範囲についての補助資料作成方法において、
前記符号を検索対象として、前記出願書類等における当該請求の範囲以外の部分を検索して、その符号に対応する単語データを収集し、その単語データと請求の範囲の文中の文字列とを照合させて請求の範囲の文中での単語認識を行わせ、この単語認識を参照しつつ主要語の認定を行って当該請求の範囲のコンピュータ処理を行うことを特徴とする請求の範囲についての補助資料作成方法。 - 出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の符号の説明の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法。
- 出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法。
- 出願書類等における当該請求の範囲以外の部分が、当該書類中の要約書の要約の記載であることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法。
- 出願書類等における当該請求の範囲以外の部分が、当該書類中の明細書の実施の形態または実施例の記載と、当該書類中の明細書の符号の説明の記載と、当該書類中の要約書の要約の記載とのうち、少なくとも2以上のものからなることを特徴とする請求項1記載の請求の範囲についての補助資料作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003034871A JP2004246559A (ja) | 2003-02-13 | 2003-02-13 | 請求の範囲についての補助資料作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003034871A JP2004246559A (ja) | 2003-02-13 | 2003-02-13 | 請求の範囲についての補助資料作成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004246559A true JP2004246559A (ja) | 2004-09-02 |
Family
ID=33020444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003034871A Pending JP2004246559A (ja) | 2003-02-13 | 2003-02-13 | 請求の範囲についての補助資料作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004246559A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118071A (ja) * | 2010-01-21 | 2010-05-27 | Ird:Kk | 情報処理装置、情報処理方法、およびプログラム |
JP7207675B1 (ja) | 2022-08-31 | 2023-01-18 | 一 榎 | 明細書入力支援方法、およびプログラム |
JP7333533B1 (ja) | 2022-03-31 | 2023-08-25 | 弁理士法人Ipx | 情報処理システム、情報処理方法及びプログラム |
-
2003
- 2003-02-13 JP JP2003034871A patent/JP2004246559A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118071A (ja) * | 2010-01-21 | 2010-05-27 | Ird:Kk | 情報処理装置、情報処理方法、およびプログラム |
JP7333533B1 (ja) | 2022-03-31 | 2023-08-25 | 弁理士法人Ipx | 情報処理システム、情報処理方法及びプログラム |
JP7207675B1 (ja) | 2022-08-31 | 2023-01-18 | 一 榎 | 明細書入力支援方法、およびプログラム |
JP2024033667A (ja) * | 2022-08-31 | 2024-03-13 | 一 榎 | 明細書入力支援方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Boudchiche et al. | AlKhalil Morpho Sys 2: A robust Arabic morpho-syntactic analyzer | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
Shaalan et al. | NERA: Named entity recognition for Arabic | |
Boudlal et al. | Alkhalil morpho sys1: A morphosyntactic analysis system for arabic texts | |
Rayson et al. | A comparison of the UCREL variant detector and modern spell checkers on English historical corpora | |
Vatri et al. | Lemmatization for ancient greek: An experimental assessment of the state of the art | |
Darwis et al. | Exhaustive affix stripping and a Malay word register to solve stemming errors and ambiguity problem in Malay stemmers | |
JP2004246559A (ja) | 請求の範囲についての補助資料作成方法 | |
JPH06259424A (ja) | 文書表示装置及び文書要約装置並びにディジタル複写装置 | |
Naemi et al. | Informal-to-formal word conversion for persian language using natural language processing techniques | |
JP2004246558A (ja) | 請求の範囲についての補助資料作成方法 | |
Rateb et al. | A critical survey on arabic named entity recognition and diacritization systems | |
Alghamdi et al. | Constructing a corpus-informed list of Arabic formulaic sequences (ArFSs) for language pedagogy and technology | |
Paikens et al. | Towards named entity annotation of Latvian National Library corpus | |
Wilson et al. | Innovative Methods for LSP-Teaching: How We Use Corpora to Teach Business Russian | |
Ahmad et al. | Terminology management: a corpus-based approach | |
Nyandag et al. | Improving Determine Lexical Meanings for Mongolian Cyrillic Script and Its Used to Keyword Extraction | |
Li et al. | A remarkable compilation shift: A genealogical study of Medhurst’s Chinese and English Dictionary (1842–1843) | |
Petrovčič et al. | The New Chinese Corpus of Literary Texts Litchi | |
Celano | Lemmatization and morphological analysis for the Latin Dependency Treebank | |
Somers | Translation technologies and minority languages | |
Paul Rayson et al. | Travelling through time with corpus annotation software | |
JP2003114900A (ja) | 公報に表示された請求の範囲についての補助資料 | |
Constable | Toward a Model for Language Identification | |
Haller et al. | CLAT: controlled language authoring technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060207 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090519 |