JP2005234868A - 類似特許明細書検索システム及びその方法並びにプログラム - Google Patents

類似特許明細書検索システム及びその方法並びにプログラム Download PDF

Info

Publication number
JP2005234868A
JP2005234868A JP2004042841A JP2004042841A JP2005234868A JP 2005234868 A JP2005234868 A JP 2005234868A JP 2004042841 A JP2004042841 A JP 2004042841A JP 2004042841 A JP2004042841 A JP 2004042841A JP 2005234868 A JP2005234868 A JP 2005234868A
Authority
JP
Japan
Prior art keywords
search
patent specification
word
concept
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004042841A
Other languages
English (en)
Other versions
JP4447345B2 (ja
Inventor
Kazuya Konishi
一也 小西
Hiroshi Kitauchi
啓 北内
Toru Takagi
徹 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2004042841A priority Critical patent/JP4447345B2/ja
Publication of JP2005234868A publication Critical patent/JP2005234868A/ja
Application granted granted Critical
Publication of JP4447345B2 publication Critical patent/JP4447345B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 検索語に対応し、発明理論の根拠となる関連語を、従来の手動構築情報源を用いずに展開し、関連語を発明の概念に対応させ、文書検索での検索漏れを防止し、発明理論の類似する特許明細書の検索を行う類似特許明細書検索システムを提供する。
【解決手段】 本発明の類似特許明細書検索システムは、調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索システムであり、調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出部と、調査特許明細書から、検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出部と、概念説明文に記載された語を抽出し、関連語として出力する関連語抽出部と、検索語及び関連語とにより、データベースから類似の特許明細書を検索する文書検索部とを有する。
【選択図】 図1

Description

本発明は、特許審査に及び特許明細書の作成において、請求範囲の類似する先行出願明細書の調査を支援するシステムであり、請求項に記載された情報に基づく、類似特許明細書検索システム及びその方法に関する。
文章を作成するには、通常、何らかの参考文献を参照することが多い。例えば、特許審査における先行特許の調査を行う場合や、特許の明細書などの特許に関連する文章を書く場合には、先行出願された特許明細書(公開特許公報)や、技術論文において、検索語による文書検索を行い、検索して得られた文献が参考とされている。
また、参考文献となる文献を検索するための検索システムが数多く開発されており、例えば、特許庁の「特許電子図書館」に代表されるシステムなどである。
ところで、文書検索は、検索のキーとなる検索語と、検索の被対象の文章に含まれている文書記載語との文字列照合により実行される。
しかし、文章における語の表記が多用であるため、同一の概念を表す語が異なる文字列により表記された場合、文書検索においては検索漏れが生じることがある。
したがって、文書検索においては、上記検索漏れを防止するために、検索語に対応した適切な関連語を展開し、この関連語を新たな検索語として拡張して、さらに文書検索の精度を高めることが重要課題となる。
従来、与えられた語の検索語に対して、適切な関連語を網羅的に展開できる手法として、
(A)シソーラスやオントロジー等の手動構築情報源に基づく関連語展開手法
(B)コーパスの共起語解析やパターン解析に基づく関連語展開手法
が発明されている。具体的な先行技術としては、
上記(A)の手法としては、シソーラス登録の同義語を検索語句として展開する手法(特許文献1,2参照)がある。
また、上記(B)の手法として、辞書記載の定義文中の語を検索語として展開する手法(特許文献3参照)、辞書記載の定義文の類似度を算出して類義語を抽出し、検索語として展開する手法(特許文献4参照)、コーパスから共起語に関する統計解析に基づき類義語を抽出し、検索語として展開する手法(特許文献5参照)、文書中の丸括弧内の表記を、その前後の語の定義文として抽出する手法(特許文献6参照)、文書中の「αはβである」文型を定義文として抽出する手法(特許文献7参照)、文書中の連休修飾節を被修飾語の定義文として抽出する手法(特許文献8参照)がある。
特開平09−198393号公報 特開平09−198396号公報 特開平10−149368号公報 特開平10−074207号公報 特開平11−045274号公報 特開平05−298371号公報 特開2000−259657号公報 特開2003−099429号公報
特許明細書においては、発明の実現性の保証、および請求範囲の拡大のために、特定の発明理論が様々な実現手段で記述されていることが考えられる。
一方、特許審査(または特許明細書の作成処理)においては、発明の新規性および進歩性の有無を判定するために、審査対象となる特許明細書に説明されている発明理論と、先願の特許明細書で説明されている発明理論について、記載内容の技術内容の類似性を判別する必要がある。
したがって、請求項に基づく類似特許明細書検索システムにより特許審査を支援する場合、文書検索の要件は、実現手段を説明するために請求項で使用されている各語について、一般的に用いられている概念ではなく、発明理論の根拠となる技術の概念の同一性に基づいて、検索語に対応させて関連語を展開することとなる。
以下に、上述した技術の具体例を示す。この具体例は、実際に拒絶理由通知を受けた特許明細書1と、その拒絶理由において引用文献とされた特許明細書2との類似性を判別するものである。
これら特許明細書1及び2には、廃材を解繊して得た繊維材を絡ませ合って接着し、板状に加熱加圧成形することにより、安価で高強度の繊維板を実現するという発明理論が記載されている。
しかしながら、特許明細書1及び2とでは実現手段が異なり、お互いの請求項において使用される語はほとんど共通していない。
「特許明細書1の請求項1」には、「多数本の繊維を接着剤で接着して得られる繊維板において、繊維として繊維長が6mm以上のリグノセルロース長繊維を用いて成ることを特徴とする繊維板。」が記載されており、
「特許明細書2の請求項1」には、「木質繊維材が層状に積層圧縮され、この木質繊維材の繊維が互いに絡まりかつその繊維の配列方向がほぼ等方になっていることを特徴とする木質板材。」が記載されている。
ここで、特許明細書1に記載された発明構成要素「リグノセルロース長繊維」と、特許明細書2に記載された発明構成要素「木質繊維材」とは、『廃材を解繊して得られる繊維材』という概念が同一である。
この概念により、『安価に製造できる』という発明効果が得られることとなる。
したがって、請求項に基づく類似特許明細書検索システムにより特許審査を支援する場合、審査対象明細書(特許明細書1)に記載された「リグノセルロース長繊維」から、発明理論の根拠と成る概念に基づく関連語として、「廃材」,「解維」,「安価」などの語を展開する必要がある。
逆に、一般的概念に基づくその他の関連語である「有機物」,「セルロース」,「リグニン」などは、この場合には展開すべきではない。
また、特許明細書1に記載されている「繊維長が6mm以上」という特徴は、『繊維同士の絡み合いを多くする』という概念を有し、『強度を高くできる』という発明効果が得られる。
この解析に基づき、特許明細書1に記載された、検索語である「繊維長」から、関連語として「絡み合い」,「強度」などの関連語を展開し、この関連語により、特許明細書2を検索する。
しかし、以下に示す理由により、従来の検索語句展開手法は、上記の要件を満たすことができない。
(a)手動構築情報源に基づく関連語展開手法を適用する場合、発明理論の根拠となる概念の体系を、特許明細書ごとに手動構築しなければならない。
しかし、情報源構築コストは非常に高いものであり、特許明細書ごとの構築が現実的に不可能である。
(b)コーパス解析においては、与えられた語の一般的概念に基づいて関連語が抽出されるため、特定の発明理論の根拠となる概念に基づく関連語と異なる語句が多く抽出されてしまう。
このことは、文書検索の検索精度の低下に繋がり、類似特許明細書検索の本来の目的ににそぐわないこととなる。
以上の理由により、従来手法においては、先に示した具体例の拒絶通知を受けた、審査対象明細書である特許明細書1の請求項の検索語に基づき、引用文献とされた特許明細書2の文書検索を行う場合に検索漏れを生じて、検索精度を向上させることができない。
したがって、上述した従来の類似特許明細書検索手法は、特許審査の支援には不十分なものであるといえる。
本発明は、このような事情に鑑みてなされたもので、検索語について、発明理論の根拠となる概念に基づく関連語を、従来の手動構築情報源を用いずに展開し、関連語を発明の概念に対応させることにより、文書検索における検索漏れを生じさせずに、発明理論の類似する特許明細書の検索が可能な、請求項に基づく類似特許明細書検索システムを実現することを目的とする。
本発明の類似特許明細書検索システムは、調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索システムであり、前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出部と、前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出部と、該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出部と、前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索部とを有することを特徴とする。
本発明の類似特許明細書検索システムは、調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から類似の特許明細書を検索する類似特許明細書検索システムであり、前記調査特許明細書の請求項に記載された語を抽出し、検索語として抽出する検索語抽出部と前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出部と、該概念説明に記載された語を抽出し、関連語として出力する関連語抽出部と、前記データベースに蓄積された明細書各々の請求項に記載された語を抽出し、索引用検索語として出力する索引用検索語出力部と、前記データベースに蓄積された明細書各々から前記索引用検索語の発明理論の根拠となる概念が記述された索引用概念説明文を抽出する索引用概念説明文抽出部と、該索引用概念説明文に記載された語を索引用関連語として出力する索引用関連語抽出部と、前記抽出された索引用検索語と前記索引用関連語を索引として蓄積する索引部と、前記検索語及び関連語とにより、前記索引部から類似の明細書を検索する文書検索部とを有することを特徴とする。
本発明の類似特許明細書検索システムは、前記概念説明文抽出部が、前記特許明細書において、前記検索語の含まれる文の構文解析を行い、該検索語が根拠を示す語句に係る部分を検索すると、この文を概念説明文として出力することを特徴とする。
本発明の類似特許明細書検索システムは、前記概念説明文抽出部が、前記特許明細書において、前記検索語の含まれる文の構文解析を行い、該文が検索語を定義する定義文であることを検出した場合、該定義文の語を抽出し、該語が根拠を示す語句に係るとき、この定義文を概念説明文として出力することを特徴とする。
本発明の類似特許明細書検索方法は、調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索方法であり、前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出過程と、前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出過程と、該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出過程と、前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索過程とを有することを特徴とする。
本発明のプログラムは、調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索プログラムであり、前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出処理と、前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出処理と、該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出処理と、前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索処理とを有する類似特許明細書検索処理を行うコンピュータが実行可能なプログラムである。
以上説明したように、本発明によれば、調査特許明細書の請求項から抽出した検索語に対応して、明細書の発明理論の根拠となる概念に基づいて、上記調査特許明細書から、手動構築情報源を用いずに適切な関連語を展開することにより、検索漏れを生じさせず、発明理論の類似する特許明細書を、複数の特許明細書が蓄積されているデータベースから検索することが可能になる。
例えば、本発明によれば、「発明が解決しようとする課題」に示した具体例において、拒絶通知を受けた特許明細書の請求項により、引用文献とされる特許明細書を検索することができる。
すなわち、本発明においては、特許審査における請求範囲に記載された請求項に対し、発明内容に忠実な先願の特許明細書の調査を強力に支援することができる。
本発明の類似特許明細書検索システムは、審査対象となる、または作成中の特許明細書に(以下、審査対象明細書とする)おける請求項に記載された語(あるいは単語)を、検索のキーである検索語として用い、この検索語を含む、先行出願された特許明細書を検索するシステムである。
上記類似特許明細書検索システムは、審査対象明細書から抽出される語の全てを検索語として検索する従来のシステムに比較すると、より請求範囲に対して忠実に、高い精度により先行出願されている特許明細書(先願の特許明細書)の調査を支援することができる。
以下、本発明の第1及び第2及び第3の実施形態による類似特許明細書検索システム装置を図面を参照して説明する。
<第1の実施形態>
図1は第1の同実施形態の一構成例を示すブロック図である。
この図において、類似特許明細書検索システムは、調査対象の調査特許明細書、すなわち審査対象の特許明細書11から検索語及び検索語に対応する関連語を抽出する検索語・関連語抽出部1と、先行出願された複数の特許明細書(例えば、公開特許公報)が記憶されている特許明細書蓄積部8から明細書記載語を索引として抽出する索引作成部16と、検索語・関連語抽出部1により抽出された検索語及び関連語により、特許明細書蓄積部8に蓄積された特許明細書の中から検索語・関連語群15における検索語及び関連語を含む特許明細書を類似特許明細書検索結果として出力する類似特許明細書検索実行部3とを有している。
ここで、類似特許明細書検索実行部3は、検索語・関連語群15と索引作成部16から作成された特許明細書蓄積部8に蓄積されている特許明細書に関する索引とを順次照合することで、検索語・関連語群15を構成する語句が、予め設定されている所定の割合で合致する特許明細書を、類似特許明細書として出力する。
また、索引作成部16は、特許明細書蓄積部8から、明細書に記載された単語を索引として抽出する明細書記載語抽出部17を有している。明細書記載語抽出部17では、特許明細書蓄積部8に蓄積された各特許明細書に記載されている単語を、明細書記載群18として抽出する。例えば、図5の特許明細書2を例にした場合、明細書に記載された語句すべてが明細書記載語群18として抽出され、索引となる。
また、検索語・関連語抽出部2は、特許明細書11の審査対象請求項10から、単数または複数の語(または単語)を抽出して請求項記載語12として出力する請求項記載語抽出部4と、特許明細書11から、この請求項記載語12に対応して発明理論の根拠となる概念が記述された文を概念説明文13として出力する概念説明文抽出部5と、この概念説明文13を形態素解析して、概念説明文13に含まれる語(単語)として概念説明文記載語14を抽出する概念説明文記載語抽出部6と、請求項記載語12を検索語とし、概念説明文記載語14を関連語とし、検索語・関連語群15を生成する検索語・関連語群生成部7を有している。
審査対象請求項10は、特許明細書11における「請求の範囲」に記載されている全てまたは審査の対象として選択したもののいずれも含むものとする。
ここで、上記各文とは、完結した内容を表す最小の単位であり、文字で表す場合、通常、図3の終了制約としての切れ目に記号「.(ピリオド)」または句点「。」などが打たれているものを示している。
請求項記載語抽出部4は、審査対象請求項10の形態素解析を行い、含まれる単語を抽出して、請求項記載語12(検索語)として出力する。
例えば、この図2の例において、請求項記載語抽出部4は、請求項記載語12として、「多数本」,「繊維」,「接着剤」,「接着」,「繊維板」,「繊維長」及び「リグノセルロース長繊維」を抽出する。
概念説明文抽出部5は、上記請求項記載語12を含む(発明の概念を説明する内容を含む)文、及びこの請求項記載語12を定義する語を含む(発明の概念を説明する内容を含む)文を、請求項記載語12に対応して発明理論の根拠となる概念が記述された概念説明文13として出力する発明理論説明文字列抽出部9を有している。
そして、発明理論説明文字列抽出部9は、入力される上記請求項記載語12により、同様に入力される特許明細書11から概念説明文13の抽出を行う。
ここで、発明理論説明文字列抽出部9は、特許明細書11を構成する各文を形態素解析、例えば、図2に示す文を形態素に分解して、各語句の構文解析を行う。
すなわち、発明理論説明文字列抽出部9は、図2に示す特許明細書11の文を、図3のように形態素に分解して、請求項記載語12が係る語句の構文解析を行う。
このとき、発明理論説明文字列抽出部9は、請求項記載語12が根拠を示す語句、例えば、根拠を示す「によって」,「により」などの予め設定された語句に係る場合、この請求項記載語12と根拠を示す語句との対応を有する文を概念説明文13として出力する。
また、発明理論説明文字列抽出部9は、上記概念説明文13を解析して、予め設定されている定義文の構文構成を示していることを検出した場合、この定義文に含まれる単語を抽出して、この単語または請求項記載語12が根拠を示す語句、例えば、根拠を示す「によって」,「により」などの予め設定された語句に係る場合、この単語または請求項記載語12と根拠を示す語句との上記対応(係り)を有する定義文を概念説明文13として出力するように構成しても良い。
ここで、発明理論説明文字列抽出部9は、例えば、形態素に分解して構文解析を行い、従来例に示した、「文書中の『αはβである』文型を定義文として抽出する」等の(B)の手法を用いて、定義文の判定を行う。
本発明においては、従来の説明に記してある、審査対象の「特許明細書1の請求項1」の記載語「リグノセルロース長繊維」から、発明理論における概念が同一である「木質繊維材」を直接展開するのではなく、特許明細書に記載されている「廃材を解維して得られる繊維材」という概念の説明を展開して、関連語を得る。
この説明は、検索対象の「特許明細書2」にも、「木質繊維材」の概念の説明として含まれているため、発明内容の対応において精度の高い検索が可能になる。
一方、特許明細書の文章における発明理論における概念の説明が含まれていない語は、特許明細書の「発明理論について読者に原理的誤解を与えない必要がある」という性質から、一般的概念で発明理論を理解できる語と言え、本発明において概念説明文13として抽出されない。
このような語については、一般的概念に基づく関連語展開(従来手法)を実行することにより、検索漏れ防止の効果が十分に得られるものと考えられる。
また、概念説明文抽出部5は、概念説明文13の抽出を容易とするため、予め一般的概念で発明理論を理解できる語を登録しておき、審査対象請求項から抽出される語から外した後、請求項記載語12として出力する様にしても良い。
<第2の実施形態>
図4は、第2の同実施形態の一構成例を示すブロック図である。この図4においては、図1に示す第1の実施形態による類似特許明細書システム10と同様の部分には同一の符号を付し、その説明を省略する。この図に 示す類似特許明細書検索システム20が第1の実施形態と異なる点は、索引作成部16が、請求項読取部161、請求項記載語抽出部162、概念説明文抽出部163、概念説明文記載語抽出部164、索引出力部165から構成されている点である。
上記請求項読取部161は、特許明細書蓄積部8に蓄積された特許明細書を読み出し、この特許明細書の特許請求の範囲より請求項(単数または複数)を順次読み出す。
次に、請求項記載語抽出部162は、読み出された請求項の形態索解析を行い、含まれる単語を請求項記載語として抽出する。これは、先に説明した請求項記載語抽出部4と同等の機能であるので詳細は省略する。
例えば、図6の特許明細書2を例にした場合、「木質繊維材」,「層状」,「積層圧縮」,「繊維」,「絡まり」,「配列方向」,「等方」及び「木質板材」が請求項記載語として抽出される。
次に、概念説明文抽出部163は、抽出された請求項記載語に対応して、発明理論の根拠となる概念が記載された文を概念説明文として出力する。これは、先に説明した概念説明文抽出部5と同等の機能であるので詳細は省略する。
例えば、図6の特許明細書2を例にした場合、「製材廃材などを解繊に適する大きさの木材小片にしたのち、この木材小片を解繊し、繊維状にした木質繊維材」が概念説明文として抽出される。
次に、概念説明文記載語抽出部164は、抽出された概念説明文に記載された単語を概念説明文記載語として抽出する。
例えば、図6の特許明細書2を例にした場合、「製材廃材」,「解繊」,「大きさ」,「木材小片」,「繊維状」及び「木質繊維材」が概念説明文記載語として抽出される。
次に、索引出力部165は、先に抽出された請求項記載語と概念説明文記載語を索引として出力し、これを索引として抽出する。
類似特許明細書検索実行部3では、検索語・関連語抽出部2で抽出された検索語・関連語群15と索引作成部16から作成された特許明細書蓄積部8に蓄積されている特許明細書に関する索引(請求項記載語及び概念説明文記載語)とを順次照合することで、類似する請求項の検索特許明細書を、類似特許明細書として出力する。
これにより、第2の実施形態による類似特許明細書システム20は、第1の実施形態の機能を拡張したものとなり、特許明細書蓄積部8に蓄積された各特許明細書の各請求項を対象とした類似請求項検索(請求項単位の検索)が実現される。
<第3の実施形態>
<第3の実施形態>
第3の実施形態は、第1の実施形態において抽出された類似特許明細書に対して、第2の実施形態における索引作成を行い、再度、検索語・関連語群15と索引作成部16から作成された索引(請求項記載語及び概念説明文記載語)とを順次照合することで、類似する請求項の検索特許明細書を、類似特許明細書として出力するものである。
これにより、第3の実施形態における類似特許明細書システム30は、第1の実施形態及び第2の実施形態の機能を拡張したものとなり、文書検索の精度が向上し、文書検索における検索漏れをより強力に防止できる。
なお、図1における類似特許明細書検索システム1、または図4における類似特許明細書検索システム20の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより類似特許明細書検索処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明の第1の実施形態による類似特許明細書検索システムの一構成例を示すブロック図である。 請求項記載語12及び概念説明文13の抽出処理を説明する概念図である。 形態素に分解して構造解析を行う、図1における概念説明文抽出部5の処理を示す概念図である。 本発明の第2の実施形態による類似特許明細書検索システムの一構成例を示すブロック図である。 図1の類似特許明細書検索システムによる索引語の抽出の対象の明細書の構成例(特許明細書2)を示す図である。 図4の類似特許明細書検索システムによる索引語の抽出の対象の明細書の構成例(特許明細書2)を示す図である。
符号の説明
1,20…類似特許明細書検索システム
2…検索語・関連語抽出部
3…類似特許明細書検索実行部
4…請求項記載語抽出部
5,163…概念説明文抽出部
6,164…概念説明文記載語抽出部
7…検索語・関連語群生成部
8…特許明細書蓄積部
9…発明理論説明文字列抽出部
16…索引作成部
17…明細書記載語抽出部
161…請求項読取部
165…索引出力部

Claims (6)

  1. 調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索システムであり、
    前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出部と、
    前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出部と、
    該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出部と、
    前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索部と
    を有することを特徴とする類似特許明細書検索システム。
  2. 調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から類似の特許明細書を検索する類似特許明細書検索システムであり、
    前記調査特許明細書の請求項に記載された語を抽出し、検索語として抽出する検索語抽出部と、
    前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出部と、
    該概念説明に記載された語を抽出し、関連語として出力する関連語抽出部と
    前記データベースに蓄積された明細書各々の請求項に記載された語を抽出し、索引用検索語として出力する索引用検索語出力部と、
    前記データベースに蓄積された明細書各々から前記索引用検索語の発明理論の根拠となる概念が記述された索引用概念説明文を抽出する索引用概念説明文抽出部と、
    該索引用概念説明文に記載された語を索引用関連語として出力する索引用関連語抽出部と、
    前記抽出された索引用検索語と前記索引用関連語を索引として蓄積する索引部と、
    前記検索語及び関連語とにより、前記索引部から類似の明細書を検索する文書検索部
    を有することを特徴とする類似特許明細書検索システム。
  3. 前記概念説明文抽出部が、前記特許明細書において、前記検索語の含まれる文の構文解析を行い、該検索語が根拠を示す語句に係る部分を検索すると、この文を概念説明文として出力することを特徴とする請求項1または請求項2に記載の類似特許明細書検索システム。
  4. 前記概念説明文抽出部が、前記特許明細書において、前記検索語の含まれる文の構文解析を行い、該文が検索語を定義する定義文であることを検出した場合、該定義文の語を抽出し、該語が根拠を示す語句に係るとき、この定義文を概念説明文として出力することを特徴とする請求項1または請求項2に記載の類似特許明細書検索システム。
  5. 調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索方法であり、
    前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出過程と、
    前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出過程と、
    該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出過程と、
    前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索過程と
    を有することを特徴とする類似特許明細書検索方法。
  6. 調査対象の調査特許明細書から抽出したキーにより、データベースに蓄積された複数の特許明細書から、類似の特許明細書を検索する類似特許明細書検索プログラムであり、
    前記調査特許明細書の請求項に記載された語を抽出し、検索語として出力する検索語抽出処理と、
    前記調査特許明細書から、前記検索語の発明理論の根拠となる概念が記述された概念説明文を抽出する概念説明文抽出処理と、
    該概念説明文に記載された語を抽出し、関連語として出力する関連語抽出処理と、
    前記検索語及び関連語とにより、前記データベースから類似の特許明細書を検索する文書検索処理と
    を有する類似特許明細書検索処理を行うコンピュータが実行可能なプログラム。
JP2004042841A 2004-02-19 2004-02-19 類似特許明細書検索システム及びその方法並びにプログラム Expired - Lifetime JP4447345B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004042841A JP4447345B2 (ja) 2004-02-19 2004-02-19 類似特許明細書検索システム及びその方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004042841A JP4447345B2 (ja) 2004-02-19 2004-02-19 類似特許明細書検索システム及びその方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2005234868A true JP2005234868A (ja) 2005-09-02
JP4447345B2 JP4447345B2 (ja) 2010-04-07

Family

ID=35017767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004042841A Expired - Lifetime JP4447345B2 (ja) 2004-02-19 2004-02-19 類似特許明細書検索システム及びその方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4447345B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265039A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 知財業務支援装置
JP2008117010A (ja) * 2006-10-31 2008-05-22 Toshiba Corp 文書作成支援装置、文書作成支援システム
JP2010224984A (ja) * 2009-03-24 2010-10-07 Fujitsu Ltd 特許明細書評価・作成作業支援装置、方法及びプログラム
JP2011096148A (ja) * 2009-10-30 2011-05-12 Fujitsu Ltd 特許文書中の単語または単語の組み合わせの例示装置、プログラム、及び方法
JP2016076020A (ja) * 2014-10-03 2016-05-12 富士通株式会社 グループ化方法、グループ化装置、およびグループ化プログラム
CN106372226A (zh) * 2016-09-07 2017-02-01 知识产权出版社有限责任公司 信息检索装置及方法
JP2018055604A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
WO2019239877A1 (ja) * 2018-06-12 2019-12-19 株式会社 AI Samurai 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
US20200133946A1 (en) * 2018-10-24 2020-04-30 Electronics And Telecommunications Research Institute Method and apparatus for searching for similar patent based on element alignment
WO2021033720A1 (ja) * 2019-08-20 2021-02-25 国立大学法人弘前大学 学術文献に記載された技術の新規性の判断を支援するための方法、プログラム、およびシステム
JP2022072383A (ja) * 2020-10-29 2022-05-17 株式会社Ipsign 侵害情報抽出システム、方法及びプログラム
US11899702B2 (en) 2019-11-28 2024-02-13 Ricoh Company, Ltd. System of visualizing validity level of searching, method of visualizing validity level of searching, and carrier means

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265039A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 知財業務支援装置
JP2008117010A (ja) * 2006-10-31 2008-05-22 Toshiba Corp 文書作成支援装置、文書作成支援システム
JP2010224984A (ja) * 2009-03-24 2010-10-07 Fujitsu Ltd 特許明細書評価・作成作業支援装置、方法及びプログラム
JP2011096148A (ja) * 2009-10-30 2011-05-12 Fujitsu Ltd 特許文書中の単語または単語の組み合わせの例示装置、プログラム、及び方法
JP2016076020A (ja) * 2014-10-03 2016-05-12 富士通株式会社 グループ化方法、グループ化装置、およびグループ化プログラム
CN106372226B (zh) * 2016-09-07 2020-08-25 知识产权出版社有限责任公司 信息检索装置及方法
CN106372226A (zh) * 2016-09-07 2017-02-01 知识产权出版社有限责任公司 信息检索装置及方法
JP2018055604A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
JP2019215684A (ja) * 2018-06-12 2019-12-19 国立大学法人大阪大学 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
WO2019239877A1 (ja) * 2018-06-12 2019-12-19 株式会社 AI Samurai 知的財産支援装置および知的財産支援方法並びに知的財産支援プログラム
US20200133946A1 (en) * 2018-10-24 2020-04-30 Electronics And Telecommunications Research Institute Method and apparatus for searching for similar patent based on element alignment
WO2021033720A1 (ja) * 2019-08-20 2021-02-25 国立大学法人弘前大学 学術文献に記載された技術の新規性の判断を支援するための方法、プログラム、およびシステム
US11899702B2 (en) 2019-11-28 2024-02-13 Ricoh Company, Ltd. System of visualizing validity level of searching, method of visualizing validity level of searching, and carrier means
JP2022072383A (ja) * 2020-10-29 2022-05-17 株式会社Ipsign 侵害情報抽出システム、方法及びプログラム

Also Published As

Publication number Publication date
JP4447345B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
Jarlbrink et al. Cultural heritage as digital noise: nineteenth century newspapers in the digital archive
JP6176017B2 (ja) 検索装置、検索方法、およびプログラム
JP5054210B2 (ja) 属性抽出装置および方法
JP4447345B2 (ja) 類似特許明細書検索システム及びその方法並びにプログラム
KR20050045822A (ko) 기계번역기법을 이용한 유사문장 식별 시스템
Jabbar et al. A survey on Urdu and Urdu like language stemmers and stemming techniques
US20090307183A1 (en) System and Method for Transmission of Communications by Unique Definition Identifiers
Scherrer et al. New developments in tagging pre-modern orthodox Slavic texts
US8041556B2 (en) Chinese to english translation tool
TWI818713B (zh) 用於自動地將用語指派至文本文件之電腦實施方法、電腦程式產品及電腦系統
JP5106042B2 (ja) 文書関連性分析装置、方法及びプログラム
JP2010250449A (ja) 情報処理装置、情報処理方法
JP5186165B2 (ja) 組織名抽出装置、方法及びプログラム
JP2009187048A (ja) 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム
JP2019121164A (ja) 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム
JP7122773B2 (ja) 辞書構築装置、辞書の生産方法、およびプログラム
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR20070008994A (ko) 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템및 그 방법
TW482962B (en) Method of automatic extracting for key features in digital document
Bingenheimer Digitization of Buddhism:(digital Humanities and Buddhist Studies)
Rundell et al. Technology and English Dictionaries
JP6635460B1 (ja) 情報生成装置、コーパスの生産方法、およびプログラム
Lertnattee et al. Using Multicultural Herbal Information to Create Multi-pattern Herb Name Retrieval System
Gurrutxaga et al. Automatic comparable web corpora collection and bilingual terminology extraction for specialized dictionary making

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100120

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4447345

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140129

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term