以下、検索式生成装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態)
本実施の形態においては、例えば、予めユーザ等により検索したい特許公報等と関連があると判断された特許公報等に対応付けられた特許分類コードを利用して、特許検索用の検索式を生成する検索式生成装置等について説明する。
図1は、本実施の形態における検索式生成装置1のブロック図である。
検索式生成装置1は、第一特許公報格納部110、第一特許公報対応情報生成部111、第一特許公報対応情報受付部112、第一特許分類コード取得部113、第一キーワード対応情報生成部121、第一キーワード対応情報受付部122、第一キーワード取得部123、第一出願人対応情報生成部131、第一出願人対応情報受付部132、第一出願人情報取得部133、第二特許公報格納部140、第二特許分類コード抽出部141、第二特許分類コード受付部142、第二特許分類コード取得部143、第二キーワード抽出部151、第二キーワード受付部152、第二キーワード取得部153、第二出願人情報抽出部161、第二出願人情報受付部162、第二出願人情報取得部163、検索式生成部170および出力部180を備える。
第一特許公報格納部110には、特許分類コード情報と第一特許公報情報とに対応付けられた第一特許公報が格納され得る。
特許公報とは、特許庁に出願された特許の出願書類等に関する情報であり、例えば、特許掲載公報や、公開特許公報や、公表特許公報等である。第一特許公報格納部110に格納されている特許公報は、特許公報の全体であっても良いし、その一部、例えば、フロントページであっても良い。ここで述べる特許公報は、例えば、特許公報のテキストデータや、あるいは特許公報のテキストデータの一部を抽出したテキストデータ等の、後述する第一特許公報対応情報生成部111等が文字列等を取得可能なデータにより構成される電子データである。また、ここでは、画像データの特許公報から光学式文字読み取り装置(OCR)等で抽出したテキストデータ等も特許公報と考えても良い。また、ここでは、実用新案公報等の実用新案に関する公報も、特許公報と考えても良い。特許公報の言語やデータ形式等は問わない。
第一特許公報とは、例えば、関連特許の特許公報である。関連特許とは、ユーザが特定の技術テーマや、特定の特許に関連すると認定した特許である。
特許公報情報とは、特許公報を示す情報である。特許公報情報は、特許公報を示すことが可能な情報であればどのような情報であっても良い。特許公報情報は、例えば、出願番号や、公開番号や、特許番号や、整理番号等の、特許公報を識別可能な識別情報と考えても良い。特許公報情報は、予め格納されている第一特許公報に割り当てられた識別情報であっても良い。第一特許公報情報は、第一特許公報の特許公報情報である。
特許分類コードとは具体的には、IPC(国際特許分類)やFターム、FIターム、テーマコード、ファセット、USクラス等である。特許分類コード情報とは、特許分類コードを示す文字列や記号等の情報である。なお、一の第一特許公報に対して、複数の特許分類コード情報が対応付けられていても良い。
また、第一特許公報格納部110には、特許分類コード情報と第一特許公報情報とに加えて、更に、出願人を示す情報である出願人情報に対応付けられた第一特許公報が格納されていても良い。出願人情報は、具体的には、特許公報に記載されている特許の、特許出願人を示す情報である。出願人情報は、具体的には、個人名や法人名等の特許出願人の氏名又は名称や、特許出願人の識別番号である。
第一特許公報と、特許分類コード情報と、第一特許公報情報とは、どのように対応付けられていても良い。例えば、第一特許公報内に、特許分類コード情報と第一特許公報情報とが配置されていても良い。例えば、特許庁等が提供する特許公報においては、通常、IPC等の特許分類コード情報と、公開番号等の特許公報情報とが埋め込まれて配置されているため、このような特許公報が、格納されていることで、特許分類コード情報と、第一特許公報情報とを対応付けた第一特許公報が格納されていると考えても良い。また、第一特許公報と、第一特許公報情報と、特許分類コード情報との対応付けが、図示しない記憶媒体等に蓄積されている管理情報により管理されていても良い。なお、特許出願人情報についても、第一特許公報や、特許分類コード情報や、第一特許公報情報と同様である。特許出願人情報は、通常、特許公報の特許出願人の欄の氏名又は名称の欄や、識別番号の欄に記載されている。
第一特許公報格納部110に第一特許公報が蓄積される過程は問わない。例えば、記録媒体を介して第一特許公報が第一特許公報格納部110で蓄積されてもよく、通信回線等を介して送信された第一特許公報が第一特許公報格納部110に蓄積されてもよく、あるいは、入力デバイスを介して入力された第一特許公報が第一特許公報格納部110に蓄積されてもよい。
第一特許公報格納部110は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
第一特許公報対応情報生成部111は、第一特許公報格納部110に格納されている一以上の第一特許公報のそれぞれに対応付けられた第一特許公報情報および特許分類コード情報を、第一特許公報格納部110から取得する。そして、各第一特許公報について取得した第一特許公報情報と、特許分類コード情報と、を対応付けて第一特許公報対応情報を生成する。第一特許公報対応情報は、第一特許公報情報と、特許分類コード情報とを対応付けた情報である。より具体的には、第一特許公報対応情報は、第一特許公報情報と、当該第一特許公報情報が示す第一特許公報の特許分類コード情報とを対応付けた情報である。第一特許公報対応情報は、例えば、対応付けられた第一特許公報情報と特許分類コード情報とを一のレコードの2つの項目として有する情報である。
第一特許公報対応情報生成部111は、通常、MPUやメモリ等から実現され得る。第一特許公報対応情報生成部111の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第一特許公報対応情報受付部112は、第一特許公報を示す情報である第一特許公報情報と、特許の分類を示すコードの情報である1以上の特許分類コード情報と、を対応付けた情報である1以上の第一特許公報対応情報を受け付ける。第一特許公報対応情報受付部112は、上述した第一特許公報対応情報生成部111が生成して出力する第一特許公報対応情報を受けつけても良いし、予め、ユーザ等により用意された第一特許公報対応情報を受けつけても良い。
ここで述べる受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、他の処理部から送信される情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。第一特許公報対応情報受付部112は、通信手段や、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。また、第一特許公報対応情報受付部112は、入力インターフェースであっても良い。
第一特許分類コード取得部113は、第一特許公報対応情報受付部112が受け付けた1以上の第一特許公報対応情報が対応付ける特許分類コード情報のうちの、1以上の特許分類コード情報の組合せであって、当該組合せを構成する特許分類コードに対応付けられた第一特許公報情報の組合せが、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致する特許分類コード情報の組合せを、第一特許公報対応情報を用いて取得する。取得する特許分類コード情報は、第一特許公報対応情報受付部112が受け付けた1以上の第一特許公報対応情報によって1以上の第一特許公報情報と対応付けられている1以上の特許分類コード情報のうちの一部であっても全体であっても良い。取得した特許分類コード情報の組合せは、例えば、図示しない記憶媒体等に蓄積される。
なお、「第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致する」とは、ここでは例えば、1以上の第一特許公報対応情報によって特許分類コード情報と対応付けられている全ての第一特許公報情報から重複を除いて得られる第一特許公報情報群の全てと、結果的に一致することと考えても良い。重複を除くとは、例えば、重複するものを一つだけ残して削除することである。また、対応付けられた第一特許公報情報の組合せが、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致する特許分類コード情報の組合せとは、対応付けられた第一特許公報情報が、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報を網羅する特許分類コード情報の群(即ち、特許分類コード情報群)と考えても良い。なお、本実施の形態においては、群とは、1以上の情報群を指す。あるいは、対応する第一特許公報情報の種類が、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報の種類と一致する、あるいは網羅する特許分類コード情報の組合せ(即ち、特許分類コード情報群)と考えても良い。
第一特許分類コード取得部113は、対応付けられた第一特許公報情報の組合せが、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致するような特許分類コード情報の組合せをどのように取得しても良い。
例えば、第一特許分類コード取得部113は、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての特許分類コード情報の組合せを取得しても良い。第一特許公報対応情報が対応付ける全ての特許分類コード情報は、第一特許公報対応情報によって、全ての第一特許公報対応情報のいずれかに対応付けられたものであったことから、全ての特許分類コード情報に対応する第一特許公報情報は、全ての第一特許公報情報を網羅することとなる。
なお、第一特許分類コード取得部113は、第一特許公報対応情報が対応付ける全ての特許分類コード情報の数よりも、特許分類コード情報の数が少なくなる特許分類コード情報の組合せを取得することが好ましい。複数の第一特許公報に対応する複数の特許分類コード情報の中には、一部の少数の第一特許公報にのみ関連が高く、他の第一特許公報に対しては、関連が低いものが存在する場合があるため、このように、特許分類コード情報の数が少なくなるように特許分類コード情報の組合せを取得することで、複数の第一特許公報全体に対して関連の低い特許分類コード情報を取得しないようにすることができる。
例えば、第一特許分類コード取得部113は、第一特許公報対応情報が対応付ける全ての特許分類コード情報の中から、対応する第一特許公報情報の数が多いものから順に,特許分類コード情報を取得していき、取得する毎に、既に取得した特許分類コード情報が対応する第一特許公報情報が、第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せ(但し重複を除く)と一致するか否かを判断し、一致した場合に、取得を終了しても良い。なお、複数の第一特許公報情報から重複を除く処理は、例えば、重複する第一特許公報情報から一の第一特許公報情報を除いて、他の第一特許公報情報を削除する処理である。このような処理は、いわゆるユニーク処理等として知られているので、ここでは説明を省略する。
また、第一特許公報対応情報が対応付ける一以上の特許分類コード情報について、一以上の特許分類コード情報の組合せを取得し、取得した組合せについて、当該組合せに対応する第一特許公報情報の組合せ(重複を除く)を取得して、取得した組合せが、第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せ(重複を除く)と一致するか否かを判断していき、一致する組合せのうちの、特許分類コード情報の数が最も少ないものを最終的に取得するようにしても良い。このような場合には、特許分類コード情報の数が最も少なくなる特許分類コード情報の組合せを取得することが可能となる。なお、この場合、組合せに用いる特許分類コード情報の数を1から順に増加させながら特許分類コード情報の組合せを取得して、上記のような組合せが一致するか否かの判断処理を行い、一致する組合せが得られた時点で、この特許分類コード情報の組合せを取得して処理を終了するようにすることで、処理時間を短縮することが可能である。
また、第一特許分類コード取得部113は、以下のような処理を行うようにしても良い。まず、第一特許分類コード取得部113は、対応する第一特許公報情報数が最も多い特許分類コード情報を第一特許公報対応情報が対応付ける特許分類コード情報の中から取得する。その後、第一特許公報対応情報が対応付ける特許分類コード情報の中から、第一特許公報対応情報が対応付ける第一特許公報情報のうちの、直前までに取得された特許分類コード情報に対応付けられていない第一特許公報情報と最も多く対応付けられている特許分類コード情報を、直前までに取得された特許分類コード情報のいずれにも対応付けられていない第一特許公報情報がなくなるまで繰り返して順次取得する。これにより、第一特許公報対応情報により対応付けられた第一特許公報情報が、第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致するとともに、特許分類コード情報の数が少なくなる特許分類コード情報の組合せを取得することができる。なお、本実施の形態の動作の説明や具体例等については、特に、このような特許分類コード情報の数が少なくなる特許分類コード情報の組合せを取得する処理を行う場合を例に挙げて説明するものとする。
第一特許分類コード取得部113は、通常、MPUやメモリ等から実現され得る。第一特許分類コード取得部113の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第一キーワード対応情報生成部121は、第一特許公報格納部110に格納されている第一特許公報内の予め指定された箇所から、1以上のキーワードを取得して、第一キーワード対応情報を生成する。具体的には、第一キーワード対応情報生成部121は、まず、第一特許公報格納部110に格納されている一以上の第一特許公報内の予め指定された箇所からキーワードを取得する。そして、第一特許公報格納部110に格納されている当該キーワードを取得した第一特許公報に対応付けられた第一特許公報情報を取得し、取得した第一特許公報情報と、取得したキーワードと、を用いて、第一キーワード対応情報を生成する。
キーワードとは、一以上の文字により構成される文字列の情報である。キーワード情報とは、例えば、「MPEG」や「ボルト」、「ナット」、「加熱コイル」などの技術タームなどである。キーワードは、例えば、所定の技術分野に関する技術文書情報等に特徴的に現れる、単語等の文字列であり、例えば専門用語である。キーワード情報は、例えば、検索に利用される検索用のキーワードである。
第一キーワード対応情報とは、第一特許公報情報と、第一特許公報情報が示す第一特許公報に含まれる1以上のキーワードと、を対応付けた情報である。具体的には、第一特許公報情報と、当該第一特許公報情報が示す第一特許公報に含まれる一以上のキーワードとを対応付けた情報である。第一キーワード対応情報は、例えば、対応付けられた第一特許公報情報とキーワードとを一のレコードの2つの項目として有する情報である。
予め指定された箇所とは、例えば、第一特許公報全体であっても良いし、その一部であっても良い。例えば、予め指定された箇所は、特許公報内の特許請求の範囲や、要約書、明細書の書類であってもよい。また、予め指定された箇所は、発明を実施するための最良の形態、符号の説明等の欄等の項目分けされた箇所のうちの一以上であってもよい。予め指定された箇所は、図示しない受付部等を介してユーザ等により指定された箇所や、デフォルト等で指定されている箇所である。
第一キーワード対応情報生成部121が、どのように、第一特許公報格納部110に格納されている第一特許公報内の予め指定された箇所から、キーワードを取得してもよい。
第一キーワード対応情報生成部121は、例えば、第一特許公報格納部110に格納されている第一特許公報内の予め指定された箇所に対して形態素解析を行って、形態素解析の結果、予め指定された品詞と判断された文字列、例えば、名詞句や、自立語と判断された文字列を取得しても良い。
また、第一キーワード対応情報生成部121は、例えば、図示しない格納部等に格納されている予め指定された手がかり句を用いてキーワードを抽出しても良い。例えば、第一特許公報格納部110に格納されている第一特許公報内の予め指定された箇所内において、予め指定された手がかり句を検索し、検索された文字列に対して、予め指定された位置関係にある文字列等を、キーワードとして抽出するようにしても良い。あるいは、予め指定された位置関係にある文字列であって、予め指定された品詞や文字のタイプ等の属性を有する文字列を取得するようにしても良い。予め指定された位置関係は、例えば、検索により検出された文字列の前後や、当該文字列を含む位置等である。なお、ここで述べる前後とは、必ずしも検索により検出された文字列に隣接している必要はない。例えば、「部」や「手段」、「装置」等の文字列を手がかり句として、当該文字列と一致する文字列の直前に配置された、文字のタイプが漢字である連続した文字列を、キーワードとして取得しても良い。この場合、第一特許公報内の予め指定された箇所内に「信号を変換する信号変換部がある」という文が含まれていた場合、「部」という文字列の直前の漢字の列である「信号変換」という文字列がキーワードとして取得される。
あるいは、このような手がかり句を用いて取得された文字列のうちの、手がかり句を取得した特許公報における出現頻度が高いものや、tf−idf等の値が高いもの等をキーワードとして取得しても良い。また、手がかり句として、手がかり句を正規化した情報、例えば、格助詞等の品詞を指定する情報を用いるようにしても良い。
また、第一キーワード対応情報生成部121は、例えば、当該第一特許公報内の予め指定された箇所における出現頻度が高いキーワードや、当該第一特許公報内の予め指定された箇所に対する関連性が、他の特許公報に対する関連性よりも高いキーワード等を抽出してもよい。
例えば、第一キーワード対応情報生成部121は、第一特許公報内の予め指定された箇所から、tf−idfやtf、smart等の値の高い用語をキーワードとして取得しても良い。
具体的には、第一キーワード対応情報生成部121は、まず、第一特許公報内の予め指定された箇所に対して形態素解析等を行い、単語等の文字列を取得する。あるいは、形態素解析の結果により得られた単語等の文字列のうちの、予め指定された所定の品詞の文字列や、予め指定された文字列を除く文字列等を取得する。例を挙げると、第一キーワード対応情報生成部121は、形態素解析の結果から、「する」「なる」「ある」等の所定の除外対象となる文字列を除いた文字列であって、「代名詞」「非自立語」「数」「接尾語」「接頭語」以外の「名詞」「動詞」「形容詞」「未知語」等を取得する。そして、これらの形態素解析の結果により得られた単語等の文字列から、tf−idfやtf、smart等の値の高い用語をキーワードとして取得する。例えば、形態素解析のシステムとしては、例えば、「Mecab(和布蕪)」(http://mecab.sourceforge.net/)や、「ChaSen(茶筌)」(http://chasen.naist.jp)等が利用可能である。また、tf−idfや、smart retrieval system等については、公知技術であるので、詳細な説明については省略する。
例えば、tf−idf等を用いる場合、第一キーワード対応情報生成部121は、例えば、tfとして第一特許公報内の予め指定された箇所において出現する一の単語等の文字列の出現頻度を算出し、dfとして、第一特許公報格納部110と後述する第二特許公報格納部140とに含まれる特許公報や、他の予め用意されたデータベース(図示せず)等に格納されている特許公報における、当該文字列を含む特許公報の出現頻度を算出するようにし、これらを用いてtf−idfの値を算出するようにしても良い。
ここで、tf−idf等の値の高い用語とは、例えば、tf−idf等の値の最も高い用語から所定の個数の用語や、tf−idf等の値が、最も値の高い値から所定番目までの用語であってもよい。また、tf−idf等の値が所定のしきい値より高い用語であってもよく、あるいは、これらの二以上の組合せであってもよい。その所定のしきい値は、例えば、図示しない記録媒体において記憶されていてもよい。このことは、他のしきい値についても同様であるとする。そして、第一キーワード対応情報生成部121は、その記録媒体から所定のしきい値読み出して、キーワードを抽出する処理を行ってもよい。
また、第一キーワード対応情報生成部121によるキーワードの取得は、例えば、次のようにして行われてもよい。まず、第一特許公報内の予め指定された箇所の全部または一部から、キーワードの候補を取得する。このキーワードの候補は、例えば、その第一特許公報内の予め指定された箇所の全部または一部に含まれる単名詞や複合名詞であってもよく、その第一特許公報内の予め指定された箇所の全部または一部に含まれる専門用語であってもよい。
ここで、専門用語を示す情報を取得する方法について説明する。まず第一特許公報内の予め指定された箇所の全部または一部から、単名詞や複合名詞を示す情報を抽出する。そして、各単名詞等について専門用語である可能性を示すスコア付けを行い、高いスコアを付与された単名詞等を示す情報を専門用語の候補として取得する。ここで、スコアを付与する方法して、複数の種類が知られている。
(造語能力に基づくスコア付け)
造語能力とは、単名詞の複合語の構成しやすさを示す尺度である。その造語能力の高い名詞を含む単名詞等を示す情報には、高いスコアが付与される。ここで、造語能力を示す指標として連接頻度を用いてもよい。連接頻度とは、ある語に連接する語の異なり数の多さのことであり、ある語の直前または直後に現れる語の種類の多さのことである。すなわち、連接頻度とは、その語がいかに多くの複合名詞に含まれやすいか、換言すれば、いかに複合名詞を構成しやすいかを示す尺度である。このようにして、造語能力に基づいて各単名詞等にスコアを与えることができる。なお、複合名詞においては、構成要素である単名詞のスコアの相乗平均を複合名詞のスコアとして与えてもよい。
(出現頻度に基づくスコア付け)
注目している単名詞等をtとする。また、そのtの構成語数をnとする。その場合に、tに対応するスコアを次のように算出する。
tのスコア=(tの出現頻度)/(語数をnとする単名詞等の平均出現頻度)
ここで、上記式中の「単名詞等」とは、専門用語の候補として抽出された単名詞等である。ここで、tの出現頻度、及び語数をnとする単名詞等の平均出現頻度は第一特許公報内の予め指定された箇所の全部または一部において算出される。なお、tのスコアとして、単に「tの出現頻度」を用いてもよい。
また、tf−idf等の上記説明以外の方法を用いて、スコア付けを行ってもよく、また、上記説明以外の方法を用いて、専門用語を示す情報をキーワードの候補として取得してもよい。専門用語を示す情報をキーワードの候補として取得する方法については、次の複数の文献において開示されており、従来から知られているため、その詳細な説明を省略する。
文献:白井清昭、他3名、「ポータルサイト自動作成の試み」、言語処理学会第10回年次大会、p.624−627、2004年
文献:Hiroshi Nakagawa、「Automatic Term Recognition based on Statistics of Compound Nouns」、Terminology、Vol.6、No.2、p.195−210、2000
文献:大畑博一、中川裕志、「連接異なり語数による専門用語抽出」、情報処理学会研究報告、2000−NL−136、p.119−126
文献:中川裕志、森辰則、湯本紘彰、「出現頻度と連接頻度に基づく専門用語抽出」、自然言語処理、Vol.10 No.1、p.27−45、2003年1月
なお、第一キーワード対応情報生成部121は、頻出する一般的な名詞等を示す情報を、関連用語の候補から除外してもよい。例えば、第一キーワード対応情報生成部121は、除外すべき名詞等を示す情報を1以上、図示しない記録媒体において保持しておき、第一キーワード対応情報生成部121は、キーワードの候補として取得した情報に、当該保持されている除外すべき名詞等を示す情報のいずれかが含まれる場合には、その情報をキーワードの候補から除外してもよい。除外すべき名詞等は、例えば、方法、記載、発行、文献等である。
次に、第一キーワード対応情報生成部121は、上記のようにして取得した各キーワードの候補について、第一特許公報、あるいは第一特許公報の予め指定された箇所との関連度を示す情報を取得する。例えば、第一キーワード対応情報生成部121は、キーワードの候補の関連度を示す情報として、そのキーワードの候補が、当該候補を取得した第一特許公報の全部または一部に出現する頻度を算出してもよい。また、第一キーワード対応情報生成部121は、各キーワードの候補について算出した、前述の専門用語である可能性を示すスコア、例えば、造語能力に基づくスコア、出現頻度に基づくスコア、あるいは連接頻度に基づくスコアを、そのスコアを関連度を示す情報として取得してもよい。また、各キーワードの候補について算出したtf−idfのスコアを、関連度を示す情報として取得しても良い。また、その他の方法によって関連度を算出してもよい。
最後に、第一キーワード対応情報生成部121は、高い関連度を有するキーワードの候補をキーワードに決定して、当該キーワードを取得する。
なお、高い関連度を有するキーワードの候補とは、例えば、関連度の値の最も高い候補から所定の個数の用語や、関連度の値が、最も値の高い値から所定番目までの用語であってもよい。また、関連度の値が所定のしきい値より高い用語であってもよく、あるいは、これらの二以上の組合せであってもよい。
なお、上述したように、第一キーワード対応情報生成部121は、特許公報が、上述したように項目分けされた情報である場合、特許公報のうちの、所定の一以上の項目分けされた領域からキーワードの取得を行うようにしてもよい。例えば、第一キーワード対応情報生成部121は、特許公報の「発明の名称」「発明の効果」「課題を解決するための手段」等の項目内のテキストに対して形態素解析を行い、形態素解析の結果により取得された単語等の文字列から、tf−idf等の値の高いものをキーワードとして抽出してもよい。なお、この場合、上述したようなtf−idfにおける単語等の文字列の出現頻度は、特許公報内の所定の一以上の項目分けされた領域内における文字列の出現頻度としても良い。
第一キーワード対応情報生成部121は、通常、MPUやメモリ等から実現され得る。第一キーワード対応情報生成部121の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第一キーワード対応情報受付部122は、第一特許公報情報と、第一特許公報情報が示す第一特許公報に含まれる1以上のキーワードと、を対応付けた情報である1以上の第一キーワード対応情報を受け付ける。第一キーワード対応情報受付部122は、上述した第一キーワード対応情報生成部121が生成して出力する第一キーワード対応情報を受けつけても良いし、予め、ユーザ等により用意された第一キーワード対応情報を受けつけても良い。
ここで述べる受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。第一キーワード対応情報受付部122は、通信手段や、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。また、第一キーワード対応情報受付部122は、入力インターフェースであっても良い。
第一キーワード取得部123は、第一キーワード対応情報受付部122が受け付けた1以上の第一キーワード対応情報が対応付けるキーワードのうちの、1以上のキーワードの組合せであって、当該組合せを構成するキーワードに対応付けられた第一特許公報情報の組合せが、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての特許公報情報の組合せと一致するキーワードの組合せを、第一キーワード対応情報を用いて取得する。取得するキーワードは、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報によって第一特許公報情報と対応付けられているキーワードのうちの一部であっても全体であっても良い。取得したキーワードの組合せは、例えば、図示しない記憶媒体等に蓄積される。
なお、「第一キーワード対応情報が対応付ける全ての第一特許公報情報の組合せと一致する」とは、ここでは例えば、1以上の第一キーワード対応情報によってキーワードと対応付けられている全ての第一特許公報情報から重複を除いて得られる第一特許公報情報群の全てと、結果的に一致することと考えても良い。重複を除くとは、例えば、重複するものを一つだけ残して削除することである。また、対応付けられた第一特許公報情報の組合せが、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての第一特許公報情報の組合せと一致するキーワードの組合せとは、対応付けられた第一特許公報情報が、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての第一特許公報情報を網羅するキーワードの群(即ち、キーワード群)と考えても良い。あるいは、対応付けられた第一特許公報情報の種類が、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての第一特許公報情報の種類と一致する、あるいは網羅するキーワードの組合せ(即ち、キーワード群)と考えても良い。
第一キーワード取得部123は、対応付けられた第一特許公報情報の組合せが、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての第一特許公報情報の組合せと一致するようなキーワードの組合せを、どのように取得しても良い。第一キーワード取得部123が、このようなキーワードの組合せを取得する処理については、上述した第一特許分類コード取得部113が、特許分類コード情報の組合せを取得する処理において、特許分類コード情報の代わりに、キーワードを取得するようにした場合と同様であるので、ここでは説明を省略する。
第一キーワード取得部123は、通常、MPUやメモリ等から実現され得る。第一キーワード取得部123の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第一出願人対応情報生成部131は、第一特許公報格納部110に格納されている一以上の第一特許公報のそれぞれに対応付けられた第一特許公報情報および出願人情報を、第一特許公報格納部110から取得する。そして、各第一特許公報について取得した第一特許公報情報と、出願人情報と、を対応付けて第一出願人対応情報を生成する。第一出願人対応情報は、第一特許公報情報と、特許分類コード情報とを対応付けた情報である。より具体的には、第一特許公報対応情報は、第一特許公報情報と、当該第一特許公報情報が示す第一特許公報の出願人情報とを対応付けた情報である。第一特許公報対応情報は、例えば、対応付けられた第一特許公報情報と特許分類コード情報とを一のレコードの2つの項目として有する情報である。
第一出願人対応情報生成部131は、通常、MPUやメモリ等から実現され得る。第一出願人対応情報生成部131の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第一出願人対応情報受付部132は、第一特許公報情報と、第一特許公報情報が示す第一特許公報の出願人を示す情報である1以上の出願人情報とを対応付けた情報である1以上の第一出願人対応情報を受け付ける。第一出願人対応情報受付部132は、上述した第一出願人対応情報生成部131が生成して出力する第一出願人対応情報を受け付けても良いし、予め、ユーザ等により用意された第一出願人対応情報を受けつけても良い。
ここで述べる受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。第一出願人対応情報受付部132は、通信手段や、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。また、第一出願人対応情報受付部132は、入力インターフェースであっても良い。
第一出願人情報取得部133は、第一出願人対応情報受付部132が受け付けた1以上の第一出願人対応情報が対応付ける出願人情報のうちの、1以上の出願人情報の組合せであって、当該組合せを構成する出願人情報に対応付けられた第一特許公報情報の組合せが、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける1以上の第一出願人情報の組合せと一致する出願人情報の組合せを、前記第一出願人対応情報を用いて取得する。
第一出願人情報取得部133が取得する出願人情報は、第一出願人対応情報受付部132が受け付けた第一出願人対応情報によって第一特許公報情報と対応付けられている出願人情報のうちの一部であっても全体であっても良い。取得した出願人情報の組合せは、例えば、図示しない記憶媒体等に蓄積される。
なお、「第一出願人対応情報が対応付ける全ての出願人情報の組合せと一致する」とは、ここでは例えば、1以上の第一出願人対応情報によって出願人と対応付けられている全ての第一特許公報情報から重複を除いて得られる第一特許公報情報群の全てと、結果的に一致することと考えても良い。重複を除くとは、例えば、重複するものを一つだけ残して削除することである。また、対応付けられた第一特許公報情報の組合せが、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける全ての第一特許公報情報の組合せと一致する出願人情報の組合せとは、対応付けられた第一特許公報情報が、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける全ての第一特許公報情報を網羅する出願人情報の群(即ち、出願人情報群)と考えても良い。あるいは、対応する第一特許公報情報の種類が、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける全ての第一特許公報情報の種類と一致する、あるいは網羅する出願人情報の群(即ち、出願人情報群)と考えても良い。
第一出願人情報取得部133は、対応付けられた第一特許公報情報の組合せが、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける全ての第一特許公報情報の組合せと一致するような出願人情報の組合せを、どのように取得しても良い。なお、第一出願人情報取得部133が行う出願人情報の組合せ等を取得する処理については、上述した第一特許分類コード取得部113が、特許分類コード情報の組合せを取得する処理において、特許分類コード情報の代わりに、出願人情報を取得するようにした場合と同様であるので、ここでは説明を省略する。
第一出願人情報取得部133は、通常、MPUやメモリ等から実現され得る。第一出願人情報取得部133の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第二特許公報格納部140には、特許分類コード情報と第二特許公報情報とに対応付けられた第二特許公報が格納され得る。第二特許公報とは、例えば、非関連特許の特許公報である。非関連特許とは、ユーザが特定の技術テーマや、特定の特許に関連しないと認定した特許である。
また、第二特許公報格納部140には、特許分類コード情報と第二特許公報情報とに加えて、更に、出願人を示す情報である出願人情報が対応付けられた第二特許公報が格納されていても良い。
第二特許公報格納部140に第二特許公報が蓄積される過程は、第一特許公報格納部110と同様、問わない。第二特許公報格納部140は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
第二特許分類コード抽出部141は、第二特許公報格納部140に格納されている一以上の第二特許公報のそれぞれに対応付けられた特許分類コード情報を、第二特許公報格納部140から取得する。取得した特許分類コード情報については、重複するものを削除するユニーク処理等を行うようにしても良い。第二特許分類コード抽出部141が、特許分類コード情報を取得する処理は、第一特許公報対応情報生成部111と同様である。
第二特許分類コード抽出部141は、通常、MPUやメモリ等から実現され得る。第二特許分類コード抽出部141の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第二特許分類コード受付部142は、第二特許公報に関する特許の分類を示すコードの情報である特許分類コード情報を受け付ける。第二特許公報とは、上述したように、例えばユーザ等により予め指定あるいは予め用意された、ユーザが検索から除外したいと考える特許に関連する一以上の特許公報である。第二特許公報に関する特許の分類とは、具体的には、第二特許公報に対応付けられた特許分類コード情報である。ここで述べる第二特許公報は、例えば、上述した第二特許公報格納部140に格納されている第二特許公報である。ただし、他の第二特許公報であっても良い。第二特許分類コード受付部142は、上述した第二特許分類コード抽出部141が取得して出力する第二特許分類コード情報を受けつけても良いし、予め、ユーザ等により用意された第二特許分類コード情報を受けつけても良い。
ここで述べる受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。第二特許分類コード受付部142は、通信手段や、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。また、第二特許分類コード受付部142は、入力インターフェースであっても良い。
第二特許分類コード取得部143は、第二特許分類コード受付部142が受け付けた特許分類コード情報のうちの、上述した第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報により第一特許公報情報と対応付けられている全ての特許分類コード情報の組合せに含まれない一以上の特許分類コード情報を、上述した第一特許公報対応情報を用いて取得する。
具体的には、第二特許分類コード受付部142が受け付けた特許分類コード情報を例えば、重複がないように取得する。但し、最終的な検索結果は変わらないため、重複があってもよい。また、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報により一以上の第一特許公報情報と対応付けられた特許分類コード情報を、例えば重複がないように取得する。そして、第二特許分類コード受付部142が受け付けた特許分類コード情報のうちの、第一特許公報対応情報を用いて取得した特許分類コード情報と一致しない特許分類コード情報を1以上取得する。第二特許分類コード取得部143は、一致しない特許分類コード情報の全てを取得しても良いし、一部だけを取得しても良い。第二特許分類コード取得部143は、一致しない特許分類コード情報の中から取り出す1以上の特許分類コード情報を、どのように決定してもよい。例えば、予めデフォルトやユーザ等により指定されているルールに従って、取得する1以上の特許分類コード情報を決定する。指定されているルールは、例えば、特許分類コード情報のうちの対応する第二特許公報情報が多いものから順に、予め指定された数だけ特許分類コード情報を取得するというルールである。また、一致しない特許分類コード情報のうちの、第一特許公報対応情報を用いて取得した特許分類コード情報のうちのいずれかと一致する特許分類コード情報と対応付けられた第二特許公報に対応付けられている特許分類コード情報を、取得対象の特許分類コード情報に決定するというルールであっても良い。あるいはランダムに所定数の特許分類コード情報を取得しても良い。取得した特許分類コード情報は、例えば、図示しない記憶媒体等に蓄積される。
第二特許分類コード取得部143は、通常、MPUやメモリ等から実現され得る。第二特許分類コード取得部143の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
第二キーワード抽出部151は、第二特許公報内の予め指定された箇所から、キーワードを取得する。第二特許公報格納部140に格納されているなお、第二キーワード抽出部がキーワードを取得する処理等については、上述した第一キーワード対応情報生成部121と同様であるので、ここでは詳細な説明は省略する。
第二キーワード受付部152は、第二特許公報に含まれるキーワードを受け付ける。具体的には、第二キーワード受付部152は、第二キーワード抽出部151が取得したキーワードを受け付ける。第二キーワード受付部152は、上述した第二キーワード抽出部151が取得して出力するキーワードを受けつけても良いし、予め、ユーザ等により用意されたキーワードを受けつけても良い。第二キーワード受付部152の構成や動作等については、上述した第二特許分類コード受付部142と同様であるのでここでは詳細な説明は省略する。
第二キーワード取得部153は、第二キーワード受付部152が受け付けたキーワードのうちの、上述した第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報により第一特許公報情報と対応付けられた全てのキーワードの組合せに含まれない一以上のキーワードを、上述した第一キーワード対応情報を用いて取得する。なお、第二キーワード取得部153の構成および動作等は、取得対象が、キーワードの組合せである点が異なること等を除けば、上述した第二特許分類コード取得部143と同様であるので、ここでは詳細な説明は省略する。
第二出願人情報抽出部161は、第二特許公報格納部140に格納されている一以上の第二特許公報のそれぞれに対応付けられた出願人情報を、第二特許公報格納部140から取得する。第二出願人情報抽出部161の出願人情報を取得する構成および動作等については、上述した第一出願人対応情報生成部131と同様であるので、ここでは詳細な説明は省略する。
第二出願人情報受付部162は、第二特許公報の出願人を示す情報である出願人情報とを対応付けた情報である第二出願人対応情報を受け付ける。第二出願人情報受付部162は、上述した第二出願人情報抽出部161が取得して出力する出願人情報を受けつけても良いし、予め、ユーザ等により用意された出願人情報を受けつけても良い。第二出願人情報受付部162の構成および動作等については、上述した第二特許分類コード受付部142と同様であるので、ここでは詳細な説明は省略する。
第二出願人情報取得部163は、第二出願人情報受付部が受け付けた出願人情報のうちの、第一出願人対応情報により第一特許公報情報と対応付けられた全ての出願人情報の組合せに含まれない一以上の出願人情報を、第一出願人対応情報を用いて取得する。第二出願人情報取得部163の構成および動作等については、上述した第二特許分類コード取得部143と同様であるので、ここでは詳細な説明は省略する。
検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード情報の論理和を含む検索式であって、特許公報を検索するための検索式である特許検索式を生成する。
また、検索式生成部170は、第一キーワード取得部123が取得した1以上のキーワードの論理和と、第一特許分類コード取得部113が取得した1以上の特許分類コード情報の論理和との、論理積を含む特許検索式を生成してもよい。
また、検索式生成部170は、第一出願人情報取得部133が取得した1以上の出願人情報の論理和と、第一特許分類コード取得部113が取得した特許分類コード情報の論理和との、論理積を含む特許検索式を生成してもよい。
また、検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード情報の論理和と、第二特許分類コード取得部143が取得した特許分類コード情報の論理和の否定との論理積を含む特許検索式を生成してもよい。
また、検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード情報の論理和と、第二キーワード取得部153が取得したキーワードの論理和の否定との論理積を含む特許検索式を生成する。
検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード情報の論理和と、第二出願人情報取得部163が取得した出願人情報の論理和の否定との論理積を含む特許検索式を生成する。
あるいは、検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード情報の論理和と、第一キーワード取得部123が取得した1以上のキーワードの論理和、第一出願人情報取得部133が取得した1以上の出願人情報の論理和、第二特許分類コード取得部143が取得した特許分類コード情報の論理和の否定、第二キーワード取得部153が取得したキーワードの論理和の否定、および第二出願人情報取得部163が取得した出願人情報の論理和の否定のうちの1以上との論理積を含む検索式を生成しても良い。また、用途等に応じて、第一特許分類コード取得部113が取得した特許分類コード情報と、それ以外の1以上の情報との上記以外の組み合わせによる特許検索式を生成しても良い。
なお、検索式生成部170は、必ずしも上述した第一特許分類コード取得部113、第一キーワード取得部123および第一出願人情報取得部133が取得した特許分類コード情報、キーワードおよび出願人情報、並びに第二特許分類コード取得部143、第二キーワード取得部153、および第二出願人情報取得部163が取得した特許分類コード情報、キーワードおよび出願人情報の全てを用いて特許検索式を生成する必要はない。例えば、上述した第一特許分類コード取得部113、第一キーワード取得部123および第一出願人情報取得部133が取得した特許分類コード情報、キーワードおよび出願人情報、並びに第二特許分類コード取得部143、第二キーワード取得部153、および第二出願人情報取得部163が取得した特許分類コード情報、キーワードおよび出願人情報のうちの、図示しない受付部等を介してユーザ等により指定されたものだけを用いて、あるいは、ユーザ等により除外されたものを除いたものだけを用いて、上述したように特許検索式を生成しても良い。
ここで述べる、論理和は複数の集合のうちのいずれか一方に含まれるものを指し、例えばOR等と呼ばれる。また、論理積は複数の集合のうちのいずれにも含まれるものを指し、例えばAND等と呼ばれる。否定は1以上の集合に含まれないものを指し、例えばNOT等と呼ばれる。
特許検索式とは、例えば、特許公報の検索時に利用される検索条件を指定するための式であり、1以上の検索キーの組合せにより構成される。本実施の形態においては、上述した特許分類コード、キーワード、および出願人情報が、この検索キーとなる。なお、本実施の形態においては、特許検索式は、結果的に特許公報の検索時に利用可能なものであれば良く、必ずしも式の態様を有している必要はない。例えば、特許分類コード、キーワード、および出願人情報を検索条件として、論理和や論理積等として用いることを指定するようにしたものも、結果的には特許公報の検索時には特許検索式と同様に利用されることとなるため、ここでは、特許検索式と考えても良い。
特許検索式においては、論理和や論理積や否定等は、例えば、記号等を用いて表現される。ただし、ここで述べる論理和や論理積や否定等は、結果的に検索時に論理和や論理積や否定等となるように利用されるものであれば、特許検索式内における表現等は問わない。
検索式生成部170は、通常、MPUやメモリ等から実現され得る。検索式生成部170の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部180は、検索式生成部170が生成した特許検索式を出力する。ここで述べる出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。例えば、出力部180は、特許検索式をいわゆる検索エンジン等に送るようにしても良い。ここで述べるプログラムとは、コンピュータの行う処理(演算・動作・通信など)の手順を指示したもののことである。
出力部180は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部180は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
次に、検索式生成装置1の動作について図2のフローチャートを用いて説明する。
(ステップS201)第一特許公報対応情報生成部111は、第一特許公報格納部110に格納されている第一特許公報を用いて、第一特許公報対応情報を生成し、出力する。この処理の詳細については後述する。
(ステップS202)第一特許公報対応情報受付部112は、ステップS201で生成されて出力された第一特許公報対応情報を受け付ける。
(ステップS203)第一特許分類コード取得部113は、ステップS202で受け付けた第一特許公報対応情報を用いて特許分類コード情報を取得する。ここで取得した特許分類コード情報をここでは第一の特許分類コード情報と呼ぶ。第一特許分類コード取得部113は、取得した第一の特許分類コード情報を、図示しない記憶媒体等に蓄積する。なお、第一の特許分類コード情報を取得する処理の詳細については後述する。
(ステップS204)第一キーワード対応情報生成部121は、第一特許公報格納部110に格納されている第一特許公報を用いて、第一キーワード対応情報を生成し、出力する。この処理の詳細については後述する。
(ステップS205)第一キーワード対応情報受付部122は、ステップS204で生成されて出力された第一キーワード対応情報を受け付ける。
(ステップS206)第一キーワード取得部123は、ステップS205で受け付けた第一キーワード対応情報を用いてキーワードを取得する。ここで取得したキーワードをここでは第一のキーワードと呼ぶ。第一キーワード取得部123は、取得した第一のキーワードを、図示しない記憶媒体等に蓄積する。なお、第一のキーワードを取得する処理の詳細については後述する。
(ステップS207)第一出願人対応情報生成部131は、第一特許公報格納部110に格納されている第一特許公報を用いて、出願人対応情報を生成し、出力する。この処理は、ステップS201の処理において、第一特許公報対応情報を第一出願人対応情報に、また、特許分類コード情報を出願人情報にそれぞれ置き換えたものと同様であるので、ここでは説明を省略する。
(ステップS208)第一出願人対応情報受付部132は、ステップS207で生成されて出力された第一出願人対応情報を受け付ける。
(ステップS209)第一出願人情報取得部133は、ステップS208で受け付けた第一出願人対応情報を用いて出願人情報を取得する。ここで取得した出願人情報を、ここでは第一の出願人情報と呼ぶ。第一出願人情報取得部133は、取得した第一の出願人情報を、図示しない記憶媒体等に蓄積する。なお、この処理は、ステップS203の処理において、第一特許公報対応情報を第一出願人対応情報に、また、特許分類コード情報を出願人情報にそれぞれ置き換えたものと同様であるので、ここでは説明を省略する。
(ステップS210)第二特許分類コード抽出部141は、第二特許公報格納部140に格納されている各第二特許公報から特許分類コード情報を取得する。また、取得した特許分類コード情報について、重複をなくすよういわゆるユニーク処理を行っても良い。この処理は、ステップS201の処理において、第一特許公報から特許分類コード情報を取得する処理と同様であるので、ここでは説明を省略する。ここでは、取得した特許分類コードを抽出特許分類コードと呼ぶ。
(ステップS211)第二特許分類コード受付部142は、ステップS210で生成されて出力された抽出特許分類コード情報を受け付ける。
(ステップS212)第二特許分類コード取得部143は、ステップS211で受け付けた抽出特許分類コード情報を用いて、特許分類コード情報を取得する。ここで取得した特許分類コード情報をここでは第二の特許分類コード情報と呼ぶ。第二特許分類コード取得部143は、取得した第二の特許分類コード情報を、図示しない記憶媒体等に蓄積する。なお、第二の特許分類コード情報を取得する処理の詳細については後述する。
(ステップS213)第二キーワード抽出部151は、第一特許公報格納部110に格納されている第一特許公報に含まれるキーワードを取得し、出力する。この処理は、ステップS204の処理において、第一特許公報からキーワードを取得する処理と同様であるので、ここでは説明を省略する。ここでは、取得したキーワードを抽出キーワードと呼ぶ。
(ステップS214)第二キーワード受付部152は、ステップS213で生成されて出力された抽出キーワードを受け付ける。
(ステップS215)第二キーワード取得部153は、ステップS214で受け付けた抽出キーワードを用いてキーワードを取得する。ここで取得したキーワードをここでは第二のキーワードと呼ぶ。第二キーワード取得部153は、取得した第二のキーワードを、図示しない記憶媒体等に蓄積する。なお、第二のキーワードを取得する処理は、上述したステップS212の処理において、特許分類コード情報を取得する処理と同様であるので、ここでは詳細な説明は省略する。
(ステップS216)第二出願人情報抽出部161は、第二特許公報格納部140に格納されている第二特許公報を用いて、出願人情報を取得し、出力する。この処理は、ステップS210の処理において、特許分類コード情報を取得する処理と同様であるので、ここでは説明を省略する。ここでは、取得した出願人情報を抽出出願人情報と呼ぶ。
(ステップS217)第二出願人情報受付部162は、ステップS216で出力された抽出出願人情報を受け付ける。
(ステップS218)第二出願人情報取得部163は、ステップS217で受け付けた抽出出願人情報を用いて出願人情報を取得する。ここで取得した出願人情報をここでは第二の出願人情報と呼ぶ。第二出願人情報取得部163は、取得した第二の出願人情報を、図示しない記憶媒体等に蓄積する。なお、第二の出願人情報を取得する処理は、上述したステップS212の処理において、特許分類コード情報を取得する処理と同様であるので、ここでは詳細な説明は省略する。
(ステップS219)検索式生成部170は、上述したステップS203,S206,S209,S212,S215,S218で蓄積された第一の特許分類コード情報、第一のキーワード、第一の出願人情報、第二の特許分類コード情報、第二のキーワード、および第二の出願人情報を用いて、特許検索式を生成する。具体的には、第一の特許分類コード情報、第一のキーワード、および第一の出願人情報の論理和と、第二の特許分類コード情報、第二のキーワード、および第二の出願人情報の論理和との論理積を含む特許検索式を生成する。
(ステップS220)出力部180は、ステップS219において生成された特許検索式を出力する。そして処理を終了する。
次に、図2のステップS201において説明した、検索式生成装置1の第一特許公報対応情報を生成する動作について、図3のフローチャートを用いて説明する。
(ステップS301)第一特許公報対応情報生成部111は、カウンターnに1を代入する。
(ステップS302)第一特許公報対応情報生成部111は、第一特許公報格納部110に格納されているn番目の第一特許公報に対応付けられた第一特許公報情報と、特許分類コード情報とを取得する。
(ステップS303)第一特許公報対応情報生成部111は、ステップS302で取得した第一特許公報情報と、特許分類コード情報とを対応付けて、図示しない記憶媒体等の格納部に蓄積する。既に、他の情報が蓄積されている場合、新たに情報を追記する。例えば、新たな第一特許公報情報と、特許分類コード情報とを対応付けたレコード等として追加する。
(ステップS304)第一特許公報対応情報生成部111は、カウンターnの値を1インクリメントする。
(ステップS305)第一特許公報対応情報生成部111は、第一特許公報格納部110に、n番目の第一特許公報があるか否かを判断する。ある場合、ステップS302に戻り、ない場合、ステップS306に進む。
(ステップS306)第一特許公報対応情報生成部111は、ステップS303で図示しない格納部に蓄積された第一特許公報情報と、特許分類コード情報とを対応付けた情報である第一特許公報対応情報を生成し、第一特許公報対応情報受付部112に出力する。そして、処理を終了する。
次に、図2のステップS203において説明した、検索式生成装置1の第一の特許分類コード情報を取得する動作について、図4のフローチャートを用いて説明する。
(ステップS401)第一特許分類コード取得部113は、ステップS202において受け付けた第一特許公報対応情報で、特許公報情報と対応付けられている全ての特許分類コード情報を取得する。
(ステップS402)第一特許分類コード取得部113は、ステップS401において取得した特許分類コード情報について、重複する特許分類コード情報を一つを除いて削除する。この処理はいわゆるユニーク処理等として公知であるので、ここでは詳細な説明は省略する。
(ステップS403)第一特許分類コード取得部113は、第一特許公報対応情報を用いて、ステップS402において重複を削除した全ての特許分類コード情報と、各第一特許公報情報との対応関係を示す情報を構成する。対応関係を示す情報は、例えば、各特許分類コード情報が、どの第一特許公報情報と対応付けられているかを表した情報である。対応関係を示す情報は、図示しない記憶媒体等の格納部に蓄積する。
(ステップS404)第一特許分類コード取得部113は、ステップS403において構成した対応関係を示す情報を用いて、対応する第一特許公報情報数の多い特許分類コード情報を取得する。例えば、各特許分類コード情報別に、対応する第一特許公報情報の数をカウントし、カウント数の多い特許分類コード情報を取得する。カウント数が多いものが2以上あった場合、どのように、いずれの特許分類コード情報を選択しても良く、例えば、ランダムに選択しても良い。あるいはいずれも取得するようにしても良い。
(ステップS405)第一特許分類コード取得部113は、ステップS404において取得した特許分類コード情報を、図示しない記憶媒体等の格納部に蓄積する。
(ステップS406)第一特許分類コード取得部113は、第一特許公報対応情報を用いて、ステップS403において図示しない格納部に蓄積されている特許分類コード情報のいずれにも対応付けられていない残りの第一特許公報情報があるか否かを判断する。例えば、図示しない格納部に格納されている特許分類コード情報に対応付けられている第一特許分類情報にフラグを立てていき、最終的にフラグの立っていない第一特許分類情報がある場合、対応付けられていない第一特許公報情報があると判断される。対応付けられていない第一特許公報情報がある場合、ステップS407に進み、ない場合、上位の処理にリターンする。この時点で、蓄積されている特許分類コード情報が、第一特許分類コード取得部113が取得した特許分類コード情報である。
(ステップS407)第一特許分類コード取得部113は、第一特許公報対応情報において特許分類コード情報と対応付けられている第一特許公報情報の中から、ステップS403において図示しない格納部に蓄積されている特許分類コード情報のいずれにも対応付けられていない残りの第一特許公報情報を取得する。例えば、ステップS406において例示したように、フラグの立っていない第一特許公報情報を取得する。
(ステップS408)第一特許分類コード取得部113は、ステップS403において蓄積されていない特許分類コード情報のそれぞれについて、ステップS407において取得した残りの第一特許公報情報と対応している数をカウントして取得する。
(ステップS409)第一特許分類コード取得部113は、ステップS408において取得した残りの第一特許公報情報と対応している数が多い特許分類コード情報を取得する。なお、対応している数が多いものが2以上ある場合、どのように、どちらの特許分類コード情報を選択しても良い。例えば、ステップS403において構成された対応関係を示す情報において、対応する第一特許公報情報数の多い方の特許分類コード情報を取得しても良い。また、ランダムに選択しても良い。あるいは対応しているものを全て取得しても良い。
(ステップS410)第一特許分類コード取得部113は、取得した特許分類コード情報をステップS405において説明した図示しない格納部に蓄積する。具体的には、既に蓄積されている特許分類コード情報に対して追記する。そして、ステップS406に戻る。
次に、図2のステップS204において説明した、検索式生成装置1の第一キーワード対応情報を生成する動作について、図5のフローチャートを用いて説明する。
(ステップS501)第一キーワード対応情報生成部121は、カウンターnに1を代入する。
(ステップS502)第一キーワード対応情報生成部121は、第一特許公報格納部110に格納されているn番目の第一特許公報に対応付けられた第一特許公報情報の予め指定された箇所から、キーワードを取得する。キーワードを取得する処理に付いては、ここでは詳細な説明は省略する。
(ステップS503)第一キーワード対応情報生成部121は、第一特許公報格納部110に格納されているn番目の第一特許公報に対応付けられた第一特許公報情報を取得する。
(ステップS504)第一キーワード対応情報生成部121は、ステップS502で取得したキーワードと、ステップS503で取得した第一特許公報情報と、を対応付けて、図示しない記憶媒体等の格納部に蓄積する。既に、他の情報が蓄積されている場合、新たに情報を追記する。例えば、新たなキーワードと、第一特許公報情報とを対応付けたレコード等として追加する。
(ステップS505)第一キーワード対応情報生成部121は、カウンターnの値を1インクリメントする。
(ステップS506)第一キーワード対応情報生成部121は、第一特許公報格納部110に、n番目の第一特許公報があるか否かを判断する。ある場合、ステップS502に戻り、ない場合、ステップS507に進む。
(ステップS507)第一キーワード対応情報生成部121は、ステップS504で図示しない格納部に蓄積されたキーワードと、第一特許公報情報とを対応付けた情報である第一キーワード対応情報を第一キーワード対応情報受付部122に生成し、第一キーワード対応情報受付部122に出力する。そして、処理を終了する。
次に、図2のステップS212において説明した、検索式生成装置1の第2の特許分類コード情報を取得する動作について、図6のフローチャートを用いて説明する。
(ステップS601)第二特許分類コード取得部143は、ステップS214で受け付けた1以上の特許分類コード情報である抽出特許分類コード情報について、重複を削除する処理を行う。例えば、重複する特許分類コード情報を検出して、一致する場合は、一つのみを残して、他を削除する。なお、ステップS214で受け付ける特許分類コード情報が既に重複が削除された特許分類コード情報である場合、この処理は省略しても良い。
(ステップS602)第二特許分類コード取得部143は、ステップS601で重複を削除した抽出特許分類コード情報を、第一特許公報対応情報で第一特許公報情報と対応付けられている特許分類コード情報とを比較して、ステップS601で重複を削除した特許分類コード情報のうちの、一致するものを削除する。
(ステップS603)第二特許分類コード取得部143は、ステップS602で削除されずに残った抽出特許分類コード情報のうちの一部、または全てを取得する。取得した特許分類コード情報が、第二の特許分類コード情報である。特許分類コード情報の一部を取得するか全てを取得するかについては、ユーザ等により、予め指定されているようにすればよい。また、どのような一部を取得するかの条件等も、予め指定されているようにすればよい。そして、取得した特許分類コード情報である第二の特許分類コード情報を、図示しない記憶媒体等の格納部に蓄積して、上位の処理に戻る。
以下、本実施の形態における検索式生成装置1の具体的な動作について説明する。
まず、ここでは例として、ユーザが、あらかじめ、「可視光通信」等の大まかなキーワードを用いて特許公報のデータベースの検索を行い、この検索結果内から、ランダムに12件の特許公報を取得していたとする。
ユーザは、この12件の特許公報の内容を検討することで、この12件と特許公報を、検索したいと考える技術テーマに関連する特許の特許公報である5つの第一特許公報と、検索対象から除外したい技術に関連する特許公報である7つの第二特許公報に分類する。そして、第一特許公報を、図示しないハードディスク等の記憶媒体の「関連公報」というフォルダに蓄積し、第二特許公報を、図示しないハードディスク等の記憶媒体の「非関連公報」というフォルダに蓄積したとする。ここで蓄積した特許公報は、特許請求の範囲、明細書及び要約書のテキストデータと、特許公報情報である出願公開番号、出願人情報である特許出願人の氏名又は名称、および特許分類コード情報であるIPCコード(国際特許分類コード)を有するフロントページのテキストデータとを有するものであるとする。また、ここでは、特許公報のテキストファイルのファイル名が、出願公開番号であるとする。
図7は、テキストデータにより構成される特許公報の一例を示す図である。
図8は、特許検索式の指定に用いる第一特許公報と、第二特許公報とを指定するメニュー画面の一例を示す図である。
次に、ユーザが、図8に示すようなメニュー画面を、検索式生成装置1のモニタ等に表示させ、第一特許公報が格納されているフォルダとして、上述した「関連公報」フォルダを指定し、第二特許公報が格納されているフォルダとして、「非関連公報」フォルダを指定したとする。具体的には、「関連特許明細書フォルダ」フィールド83に「関連公報」というフォルダのパスを入力し、「非関連特許明細書フォルダ」フィールド84に「非関連公報」というフォルダのパスを入力する。これにより、「関連公報」フォルダが第一特許公報格納部110に指定され、「非関連公報」フォルダが第二特許公報格納部140に指定されたこととなる。また、キーワードの取得対象部分を特許公報の明細書(墨付き括弧の書類名の後の文字列が「明細書」である位置から、墨付き括弧の書類名の後の文字列が「特許請求の範囲」である位置の直前までの範囲)に指定するために、「明細書」というチェックボックス82にチェックが入っているものとする。
図9は、第一特許公報格納部110および第二特許公報格納部140に格納されている第一特許公報および第二特許公報を模式的に示す概念図である。第一特許公報格納部110である「関連公報フォルダ」には5つの第一特許公報が、第二特許公報格納部140である「非関連公報フォルダ」には7つの第二特許公報がそれぞれ格納されている。
次に、ユーザが、図8に示したメニュー画面の「検索式生成」ボタン81をマウス等でクリックしたとすると、検索式生成装置1は、特許検索式の生成を開始する。
まず、第一特許公報対応情報生成部111は、第一特許公報格納部110である「関連特許」フォルダに格納されているに格納されている各第一特許公報から、第一特許公報情報である特許公開番号と、特許分類コード情報であるIPCコードを取得する。例えば、第一特許公報対応情報生成部111は、特許公報に、特許公開番号や、出願人情報等の情報を示すための墨付き括弧等で囲ったタグ等が含まれている場合、第一特許公報対応情報生成部111は、各第一特許公報内において、特許公開番号という墨付き括弧で囲まれたタグを検出し、このタグから、次の墨付き括弧が現れるまでの間の文字列を検出して切り出し、この文字列から、予め指定された不要な文字列、例えば括弧等で囲まれた数字等の文字列を除外して第一特許公報情報である特許公開番号を取得する。同様に、第一特許公報対応情報生成部111は、第一特許公報内において、国際特許分類という墨付き括弧で囲まれたタグから、次の墨付き括弧が現れるまでの間の文字列を検出して切り出し、この文字列から、予め指定された不要な文字列、例えば括弧等で囲まれた数字等の文字列を除外して特許分類コード情報であるIPCコードを取得する。なお、例えば、墨付き括弧で囲まれたタグから、次の墨付き括弧が現れるまでの間の文字列に改行コードが含まれている場合、各行の文字列をそれぞれIPCコードとして取得する。
第一特許公報対応情報生成部111は、「関連特許」フォルダに格納されている各第一特許公報から取得した第一特許公報情報である出願公開番号と、IPCコードとを対応付けて第一特許公報対応情報を生成する。
図10は、第一特許公報対応情報生成部111が生成した第一特許公報対応情報を示す模式図である。第一特許公報対応情報は、「第一特許公報情報」と、「国際特許分類」という項目を有している。「第一特許公報情報」は、第一特許公報情報であり、ここでは出願公開番号である。「国際特許分類」は、特許分類コード情報であり、ここでは、IPCコードである。ここでは、一の第一特許公報情報に対して、1以上の特許分類コード情報が対応付けられている。
つぎに、第一特許公報対応情報受付部112は、第一特許公報対応情報生成部111が生成した第一特許公報対応情報を受け付ける。第一特許公報対応情報受付部112は、受け付けた第一特許公報対応情報を、図示しないメモリ等の記憶媒体に一時記憶する。
次に、第一特許分類コード取得部113は、第一特許公報対応情報受付部112が受け付けた1以上の第一特許公報対応情報が対応付ける特許分類コード情報のうちの、1以上の特許分類コード情報の組合せであって、当該組合せを構成する特許分類コードに対応付けられた第一特許公報情報の組合せが、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致する特許分類コード情報の組合せを取得する処理を行う。
まず、第一特許分類コード取得部113は、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報に含まれる複数の第一特許公報対応情報であるIPCコードについて重複をなくす処理、いわゆるユニーク処理を行い、この処理により得られたIPCコードと第一特許公報対応情報に含まれる第一特許公報情報との対応関係を示す表を、第一特許公報対応情報受付部112が受け付けた第一特許公報対応情報を用いて作成する。そして、IPCコード別に対応する第一特許公報情報の数をカウントし、数が多い順に、IPCコードで表をソートする。
図11は、第一特許公報対応情報とIPCコードとの対応関係を示す表の一例を示す図である。ここでは、既に、対応する第一特許公報情報の数が多い順に、IPCコードを上から順にソートした表を示している。図において、各行は、IPCコードとの対応関係を示し、各列は、第一特許公報情報との対応関係を示す。行と列とが交わる部分に丸があるものについては、その列のIPCコードが、その行の第一特許情報と対応していることを示しており、黒丸がない場合は、対応していないことを示す。ここでの対応している、とは、第一特許公報に付与されたIPCコードであることを意味する。
次に、第一特許分類コード取得部113は、図11に示したような第一特許公報対応情報とIPCコードとの対応関係を示す表において、対応する第一特許公報数が多いIPCコードを取得する。図11に示す表においては、対応する第一特許公報情報の数が多い順にIPCコードをソートしているため、ソートされている順番が一番、即ち図11では上から一番目の行のIPCコードである「H04B 10/10」を取得する。取得したIPCコードは、図示しない記憶媒体等の格納部に蓄積する。
つぎに、第一特許分類コード取得部113は、既に取得したIPCコード、ここでは「H04B 10/10」に対応していない第一特許公報情報が第一特許公報対応情報内にあるか否かを判断する。ここでは、対応していない第一特許公報情報である出願公開番号「2008−799×××」および「2009−121×××」があると判断されるため、次のIPCコードを取得する処理を行う。
第一特許分類コード取得部113は、先に取得された特許分類コードであるIPCコード「H04B 10/10」に対応していない第一特許公報情報と、IPCコードとの対応関係を示す表を取得する。具体的には、図11に示した第一特許公報対応情報とIPCコードとの対応関係を示す表において、先に取得された「H04B 10/10」に対応していない第一特許公報情報である出願公開番号「2008−799×××」および「2009−121×××」と、上述したユニーク処理が行われたIPCコードとの対応関係を示す表を取り出す。なお、このIPCコードからは、既に取得されたIPCコード「H04B 10/10」は除外してもよい。そして、この表において、IPCコード別に対応する第一特許公報情報の数をカウントし、数が多い順にIPCコードで表をソートする。
図12は、先に取得されたIPCコードである「H04B 10/10」に対応していない第一特許公報情報とIPCコードとの対応関係を示す表の一例を示す図である。ここでは、既に、対応する第一特許公報情報の数が多い順に、IPCコードを上から順にソートした表を示している。
次に、第一特許分類コード取得部113は、図12に示したような第一特許公報対応情報とIPCコードとの対応関係を示す表において、対応する第一特許公報数が多いIPCコードを取得する。図12においては、対応する第一特許公報情報の数が多い順にIPCコードをソートしているため、ソートされている順番が一番、即ち図12では上から一番目の行のIPCコードである「H04B 10/02」を取得する。取得したIPCコードは、既に取得済のIPCコード「H04B 10/10」に追加して蓄積される。
なお、対応する第一特許公報情報の数の多いIPCコードが、複数存在する場合、図11に示した表において、対応する第一特許公報情報の数が多いIPCコードを選択的に取得するようにする。
つぎに、第一特許分類コード取得部113は、既に取得したIPCコード、ここでは「H04B 10/10」および「H04B 10/02」のいずれにも対応していない第一特許公報情報が第一特許公報対応情報内にあるか否かを判断する。ここでは、対応していない第一特許公報情報がないため、IPCコードを取得する処理を終了する。これにより、第一特許分類コード取得部113が取得したIPCコードは、「H04B 10/02」および「H04B 10/10」となる。
なお、更に、対応していない第一特許公報情報があると判断された場合、先に取得された特許分類コードであるIPCコード「H04B 10/10」および「H04B 10/02」に対応していない第一特許公報情報と、IPCコードとの対応関係を示す表を取得し、上記のように対応する第一特許公報情報の多いIPCコードを取得する処理を繰り返す。
つぎに、第一キーワード対応情報生成部121は、第一特許公報格納部110である「関連特許」フォルダに格納されている各第一特許公報から、第一特許公報情報である特許公開番号と、キーワードとを取得する。第一特許公報情報の取得処理は、第一特許公報対応情報生成部111と同様である。
第一キーワード対応情報生成部121は、1以上のキーワードを、各第一特許公報のうちの、図8のメニュー画面で指定された明細書の中から取得する。
まず、第一特許公報格納部110である「関連特許」フォルダに格納されている各第一特許公報から、墨付き括弧の書類名の後の文字列が「明細書」である位置から、墨付き括弧の書類名の後の文字列が「特許請求の範囲」である位置の直前までの範囲のテキストデータを取り出す。そして、取り出したテキストデータから、予め指定された自然言語処理等により、キーワードを取得する。
次に、第一キーワード対応情報生成部121は、このテキストデータに対して「Mecab」や「ChaSen」等を用いて形態素解析を行い、明細書を構成する文字列を、単語に分割する。また、各単語の品詞の情報も取得する。
次に、第一キーワード対応情報生成部121は、分割した単語のうちの、品詞が名詞である単語のそれぞれについて、tf−idfの値を算出する。ここで述べる名詞は、単名詞であっても複合名詞であっても良い。具体的には、分割した単語から、品詞が名詞である一の単語を取り出し、テキストデータ内における出現頻度を算出する。また、第一特許公報格納部110である「関連特許」フォルダ、および第二特許公報情報格納部140である「非関連特許」フォルダにそれぞれ記憶されている複数の特許公報における、当該一の単語と一致する単語が含まれる特許公報が出現する頻度を算出する。そして、一の第一特許公報の明細書内の一の単語の出現頻度をtf、当該一の単語を含む他の特許公報の出現頻度をdfとして、例えばtf−1/dfの式に代入することにより、tf−idfの値を算出する。そして、このtf−idfの値を算出する処理を、品詞が名詞である残りの単語についても繰り返す。
第一キーワード対応情報生成部121は、テキストデータ内の品詞が名詞である全ての単語についてtf−idfの値の算出が終了した時点で、この算出したtf−idfの値を用いて、キーワード情報を取得する。ここでは、例として、第一キーワード対応情報生成部121は、算出したtf−idfの値が予めユーザが設定したしきい値以上のものを、キーワード情報として取得する。
第一キーワード対応情報生成部121は、上記の処理を「関連特許」フォルダ内の全ての第一特許公報について行い、各第一特許公報から取得した第一特許公報情報である出願公開番号と、キーワードとを対応付けて第一キーワード対応情報を生成する。
第一キーワード対応情報受付部122は、第一キーワード対応情報生成部121が生成した第一キーワード対応情報を受け付ける。
次に、第一キーワード取得部123は、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報を用いて、第一キーワード対応情報受付部122が受け付けた1以上の第一キーワード対応情報が対応付けるキーワードのうちの、1以上のキーワードの組合せであって、当該組合せを構成するキーワードに対応付けられた第一特許公報情報の組合せが、第一キーワード対応情報受付部122が受け付けた第一キーワード対応情報が対応付ける全ての第一特許公報情報の組合せと一致するキーワードの組合せを取得する処理を行う。この第一キーワード取得部123が行うキーワードの組合せを取得する処理は、上述した第一特許分類コード取得部113が行う特許分類コード情報の組合せを取得する処理と同様であるので、ここでは説明を省略する。
なお、ここでは、第一キーワード取得部123により取得されたキーワードが「光送信モジュール」、「有機EL素子」、「可視光」であり、図示しない記憶媒体等の格納部に蓄積されたとする。
つぎに、第一出願人対応情報生成部131は、第一特許公報格納部110である「関連特許」フォルダに格納されている各第一特許公報から、第一特許公報情報である特許公開番号と、出願人情報とを取得する。第一特許公報情報の取得処理は、第一特許公報対応情報生成部111と同様である。
第一出願人対応情報生成部131は、各第一特許公報内において、出願人という墨付き括弧で囲まれたタグから、代理人という墨付き括弧が現れるまでの間の文字列を検出して切り出し、さらにこの文字列内において、氏名又は名称という墨付き括弧で囲まれたタグから、次の墨付き括弧が現れるまでの間の文字列を検出して切り出し、この文字列から、予め指定された不要な文字列、例えば括弧等で囲まれた数字等の文字列を除外して出願人情報を取得する。
第一出願人対応情報生成部131は、各第一特許公報から取得した第一特許公報情報である出願公開番号と、出願人情報とを対応付けて第一出願人対応情報を生成する。
第一出願人対応情報受付部132は、第一出願人対応情報生成部131が生成した第一出願人対応情報を受け付ける。
次に、第一出願人情報取得部133は、第一出願人対応情報受付部132が受け付けた第一出願人対応情報を用いて、第一出願人対応情報受付部が受け付けた1以上の第一出願人対応情報が対応付ける出願人情報のうちの、1以上の出願人情報の組合せであって、当該組合せを構成する出願人情報に対応付けられた第一特許公報情報の組合せが、第一出願人対応情報受付部132が受け付けた第一出願人対応情報が対応付ける全ての第一特許公報情報の組合せと一致する出願人情報の組合せを取得する処理を行う。この第一出願人情報取得部133が行う出願人出願人情報の組合せを取得する処理は、上述した第一特許分類コード取得部113が行う特許分類コード情報の組合せを取得する処理と同様であるので、ここでは説明を省略する。
なお、ここで第一出願人情報取得部133により取得され、図示しない記憶媒体等の格納部に蓄積された出願人情報が、「株式会社AAA」、「株式会社BBB」、「株式会社CCC」であったとする。
つぎに、第二特許分類コード抽出部141は、上述した第一特許公報情報生成部111と同様の処理により、第二特許公報格納部140である「非関連特許」フォルダに格納されている各第二特許公報から、特許分類コード情報であるIPCコードを取得する。そして取得した全てのIPCコードに対して重複をなくすユニーク処理を行う。なお、ユニーク処理は、後述する第二特許分類コード取得部143で行っても良い。
図13は、第二特許分類コード抽出部141が、「非関連特許」フォルダに格納されている各第二特許公報から取得した特許分類コード情報を示す図である。
第二特許分類コード受付部142は、第二特許分類コード抽出部141が取得した第二特許公報に関する特許分類コード情報であるIPCコードを受け付ける。
第二特許分類コード取得部143は、第二特許分類コード受付部142が受け付けたIPCコードから、図10に示したような上述した第一特許公報対応情報に含まれる特許分類コードであるIPCコードと一致するIPCコードを、検索等を行って削除する。そして、削除されずに残ったIPCコードの1以上を取得する。ここでは、削除されずに残った全てのIPCコードを取得する。取得したIPCコードは、例えば、「H05B 37/02」、「H05B 41/14」、「H04Q 9/00」であるとする。取得したIPCコードは、図示しない記憶媒体等の格納部に蓄積する。
つぎに、第二キーワード抽出部151は、上述した第一キーワード対応情報生成部121と同様の処理により、第二特許公報格納部140である「非関連特許」フォルダに格納されている各第二特許公報からキーワードを取得する。そして、取得したキーワードの全てに対して重複をなくすユニーク処理を行う。なお、ユニーク処理は、後述する第二キーワード取得部153で行っても良い。
第二キーワード受付部152は、第二キーワード抽出部151が取得した第二特許公報に関するキーワードを受け付ける。
第二キーワード取得部153は、第二キーワード受付部152が受け付けたキーワードから、第一キーワード対応情報生成部121が生成した第一キーワード対応情報に含まれるキーワードを、検索等を行って削除する。そして、取得されずに残ったキーワードの1以上を取得する。ここでは、取得されずに残った全てのキーワードを取得する。取得したキーワードは、例えば、「照明」、「ダイオード」であったとする。取得したキーワードは、図示しない記憶媒体等の格納部に蓄積する。
つぎに、第二出願人情報抽出部161は、上述した第一出願人情報生成部131と同様の処理により、第二特許公報格納部140である「非関連特許」フォルダに格納されている各第二特許公報から出願人情報を取得する。そして、取得した出願人情報の全てに対して重複をなくすユニーク処理を行う。なお、ユニーク処理は、後述する第二出願人情報取得部163で行っても良い。
第二出願人情報受付部162は、第二出願人情報抽出部161が取得した第二特許公報に関する出願人情報を受け付ける。
第二出願人情報取得部163は、第二出願人情報受付部162が受け付けた出願人情報から、第一出願人対応情報生成部131が生成した第一出願人情報対応情報に含まれる出願人情報を、検索等を行って削除する。そして、取得されずに残った出願人情報の1以上を取得する。ここでは、取得されずに残った全ての出願人情報を取得する。取得した出願人情報は、「株式会社GGG」、「株式会社HHH」であったとする。取得した出願人情報は、図示しない記憶媒体等の格納部に蓄積する。
検索式生成部170は、第一特許分類コード取得部113が取得した特許分類コード、第一キーワード取得部123が取得したキーワード、第一出願人情報取得部133が取得した出願人情報、第二特許分類コード取得部143が取得した特許分類コード、第二キーワード取得部153が取得したキーワード、および第二出願人情報取得部163が取得した出願人情報を用いて、特許検索式を作成する。
ここでは、例として、検索式生成部170は、第一特許分類コード取得部113が取得した1以上の特許分類コードの論理和、第一キーワード取得部123が取得した1以上のキーワードの論理和、第一出願人情報取得部133が取得した出願人情報の論理和、第二特許分類コード取得部143が取得した1以上の特許分類コードの論理和の否定、第二キーワード取得部153が取得したキーワードの論理和の否定、および第二出願人情報取得部163が取得した出願人情報の論理和の否定、の全ての論理積を含む特許検索式を作成する。
出力部180は、検索式生成部170が生成する特許検索式をモニタ等に出力する。
図14は、出力部180による検索式生成部170が生成した特許検索式の出力例を示す図である。なお、図において、「+」は論理和(OR)、「×」は論理積(AND)、「#」は否定(NOT)を示す。
なお、上記具体例においては、第一特許公報対応情報受付部112が、第一特許公報対応情報生成部111が生成した第一特許公報対応情報を受け付ける場合について説明したが、第一特許公報対応情報受付部112は、ユーザ等により作成された図10に示すような第一特許公報対応情報を受け付けるようにしても良い。また、例えば、ユーザ等により作成された図11に示すような第一特許公報対応情報と特許分類コードとの対応関係を示す表のデータ等を、第一特許公報対応情報として受け付けるようにしても良い。かかることは、第一キーワード対応情報受付部122や、第一出願人対応情報受付部132についても同様である。
また、上記具体例において、第二特許分類コード受付部142は、ユーザ等により作成された図13に示すような特許分類コード情報を受けつけるようにしても良い。係ることは、第二キーワード受付部152、および第二出願人情報受付部162においても同様である。
以上、本実施の形態によれば、検索したい特許公報に関連する技術を示す第一特許公報の第一特許公報情報と、当該第一特許公報の特許分類コードとを対応付けた情報を用いて、第一特許公報の全ての検索し得る特許検索式を生成することができ、容易に特許公報の検索に適した特許検索式を生成することができる。これにより、例えば、特許検索式の生成を普段行わない技術者等のように、特許検索式の生成に不慣れなユーザであっても、適切な特許検索式を作成して、適切な特許検索を行うことが可能となる。これにより、特許調査の質を向上させることができる。
例えば、本願においては、大規模な特許調査等を行う前に、予め予備的な検索を行うことで特許公報を取得し、この取得した特許公報をユーザが精査して関連特許と非関連特許とに分類し、これを本願の検索式生成装置1を用いて処理することで、最終的に行う特許調査に最適な特許検索式を取得することができる。
また、検索したい特許公報に関連する技術を示す第一特許公報の第一特許公報情報と、当該第一特許公報のキーワードとを対応付けた情報を用いて、更に条件を適切に絞り込んだ特許検索式を提供することができる。
また、検索したい特許公報に関連する技術を示す第一特許公報の第一特許公報情報と、当該第一特許公報の出願人情報とを対応付けた情報を用いて、更に条件を適切に絞り込んだ特許検索式を提供することができる。
また、検索したい特許公報に関連しない技術を示す第二特許公報の特許分類コードの中から、検索したい特許公報に関連する技術を示す特許分類コードを除外して得られた特許分類コードを用いて特許検索を行うことができ、不要な条件を除外した特許検索を行うことができる。
また、検索したい特許公報に関連しない技術を示す第二特許公報のキーワードの中から、検索したい特許公報に関連する技術を示すキーワードを除外して得られたキーワードを用いて特許検索を行うことができ、不要な条件を除外した特許検索を行うことができる。
また、検索したい特許公報に関連しない技術を示す第二特許公報の出願人情報の中から、検索したい特許公報に関連する出願人情報を除外して得られた出願人情報を用いて特許検索を行うことができ、不要な条件を除外した特許検索を行うことができる。
なお、本実施の形態においては、第一特許分類コード取得部113が取得した特許分類コードに加えて、第一キーワード取得部123が取得したキーワード、第一出願人情報取得部133が取得した出願人情報、第二特許分類コード取得部143が取得した特許分類コード、第二キーワード取得部153が取得したキーワード、および第二出願人情報取得部163が取得した出願人情報を用いて、特許検索式を作成する場合を例に挙げて説明したが、例えば、図8に示したようなメニュー画面等において、第一キーワード取得部123が取得したキーワード、第一出願人情報取得部133が取得した出願人情報、第二特許分類コード取得部143が取得した特許分類コード、第二キーワード取得部153が取得したキーワード、および第二出願人情報取得部163が取得した出願人情報のうちの1以上をユーザが適宜指定できるようにして、指定された情報と、第一特許分類コード取得部113が取得した特許分類コードとを用いて、検索式生成部170が特許検索式を生成するようにしても良い。この場合、指定されなかった情報を生成するための処理部等は、適宜動作させないようにして良い。
なお、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりする情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。
また、上記各実施の形態では、検索式生成装置がスタンドアロンである場合について説明したが、検索式生成装置は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部や受付部は、通信回線を介して入力を受け付けたり、画面を出力したりすることになる。
また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。
なお、上記各実施の形態における検索式生成装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、第一特許公報を示す情報である第一特許公報情報と、特許の分類を示すコードの情報である1以上の特許分類コード情報と、を対応付けた情報である1以上の第一特許公報対応情報を受け付ける第一特許公報対応情報受付部と、第一特許公報対応情報受付部が受け付けた1以上の第一特許公報対応情報が対応付ける特許分類コード情報のうちの、1以上の特許分類コード情報の組合せであって、当該組合せを構成する特許分類コードに対応付けられた第一特許公報情報の組合せが、第一特許公報対応情報が対応付ける全ての第一特許公報情報の組合せと一致する特許分類コード情報の組合せを、第一特許公報対応情報を用いて取得する第一特許分類コード取得部と、第一特許分類コード取得部が取得した特許分類コード情報の論理和を含む検索式であって、特許公報を検索するための検索式である特許検索式を生成する検索式生成部と、特許検索式を出力する出力部として機能させるためのプログラムである。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
図15は、上記プログラムを実行して、上記実施の形態による検索式生成装置を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
図15において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
図16は、コンピュータシステム900の内部構成を示す図である。図16において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム900に、上記実施の形態による検索式生成装置等の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ901に、上記実施の形態による検索式生成装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
なお、本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。