以下、検索式妥当性判断装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、特許検索式に含まれる特許分類の組み合わせの妥当性を判断し、その判断結果を出力する検索式妥当性判断装置1を含む特許検索装置2等について説明する。
図1は、本実施の形態における特許検索装置2を含むシステムの概念図である。図1において、特許検索装置2と1以上のユーザ端末3とは、ネットワーク100を介して接続されている。ネットワーク100は、有線、または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。また、ユーザ端末3は、ネットワーク100に接続可能な端末であれば何でも良い。例えば、ユーザ端末3は、デスクトップパソコン、ノートパソコン、スマートフォン、またはPDA等であっても良い。
図2は、本実施の形態における特許検索装置2のブロック図である。特許検索装置2は、検索式妥当性判断装置1、検索部110、特許書類格納部111、および特許書類出力部112を備える。検索式妥当性判断装置1は、ルール格納部101、受付部102、検索式格納部103、特許分類包含情報取得部104、共起頻度情報格納部105、判断部106、出力部107、高共起頻度特許分類取得部108、および特許分類出力部109を備える。
ルール格納部101には、1または2以上の特許分類関係ルールが格納され得る。特許分類関係ルールは、特許検索式に含まれ得る2以上の特許分類の関係に関するルールである。特許検索式は、用語や特許分類等である要素を含み、データベース等に記憶されている特許書類を特定するために用いられる情報である。特許検索式は、さらに要素を否定したり、2以上の要素を関係づけたりする論理演算子を含んでも良く、1または2以上の論理演算子と1または2以上の要素とを一つのブロックとして扱うための情報であるブロック区切り要素を含んでも良い。なお、本実施の形態では、特許検索式が2以上の特許分類を含む場合について主に説明する。
要素は、用語であっても良く、特許分類であっても良く、後述するブロック要素であっても良い。特許分類とは、特許書類を分類し、検索時に利用可能な情報であれば何でも良い。例えば、特許分類は、IPC、FI、Fターム、USクラス、ECLA等のコードのいずれかであっても良く、または、上記コードの一部分であっても良い。コードの一部分とは、例えば、IPCであればセクション、クラス、サブクラス、またはメイングループ等であっても良い。また、コードの一部分とは、例えば、Fタームであれば、テーマコード、またはテーマコードと観点等のことであっても良い。
論理演算子は、AND演算子であっても良く、OR演算子であっても良く、NOT演算子であっても良い。AND演算子は、2つの要素の積集合を求める演算子である。OR演算子は、2つの要素の和集合を求める演算子である。NOT演算子は、特定の要素の集合が含まない集合を求める演算子である。
ブロック区切り要素は、括弧であっても良く、グラフィカルユーザインタフェース上におけるテキストボックスであっても良い。ブロック区切り要素で区切られた領域をブロック要素とする。例えば、「(用語A OR 用語B) AND 用語C」の括弧で区切られた「(用語A OR 用語B)」は、ブロック要素であり、「(」と「)」とがブロック区切り要素である。
特許書類とは、特許庁に出願された特許等の出願書類等に関する情報であり、例えば、特許公報や、公開特許公報、公表特許公報、実用新案公報等である。なお、特許書類の言語やデータ形式等は問わない。各特許書類は、特許公報等の全体であっても良く、または、特許公報等の一部であっても良い。
特許分類の関係とは、2以上の特許分類が論理演算子で関係づけられた状態のことである。特許分類関係ルールは、2以上の特許分類の関係が適切な関係であるか否か、または適切でない関係であるか否かを示すルールであれば何でも良い。
例えば、特許分類関係ルールは、AND演算しない2以上の特許分類を示すルールであっても良く、AND演算するべき2以上の特許分類を示すルールであっても良い。なお、AND演算しない2以上の特許分類を示すルールとは、2以上の特定の特許分類をAND演算しないことを示すルールと同意義である。また、AND演算するべき2以上の特許分類を示すルールとは、2以上の特定の特許分類をAND演算するべきことを示すルールと同意義である。
特許分類関係ルールがAND演算しない2以上の特許分類を示すルールの場合に、当該ルールは、AND演算しない異なる種類の2以上の特許分類を示すルールであっても良く、AND演算しない同一の種類の2以上の特許分類を示すルールであっても良い。
また、特許分類関係ルールは、OR演算に関するルールであっても良く、OR演算とAND演算との両方に関するルールであっても良い。また、特許分類関係ルールは、2以上の特許分類の共起頻度が予め決められた条件を満たすほど大きい2以上の特許分類を取得するというルールであっても良い。共起とは、任意の文書や文章において、ある要素とある要素が共に出現することである。本実施の形態における特許分類の共起頻度とは、一の特許公報に、2以上の特許分類が付与されている頻度のこととする。ここで、頻度とは回数でも割合でも良い。また、予め決められた条件とは、例えば、特許分類の共起頻度を有する条件である。例えば、予め決められた条件は、特許分類の共起する回数が閾値より多いことであっても良く、特許分類の共起する割合が閾値より高いことであっても良い。
特許分類関係ルールの記述方法は問わない。つまり、特許分類関係ルールは、IF−THENルールであっても良く、ルールを表現する専用の言語(以下、ルール言語という)を用いて表現しても良く、公知の機械学習器(例えば、Support Vector Machineやベイズ推定等)を用いて学習させた結果であっても良い。IF−THENルールとは、AND、またはORで演算するべき、またはするべきでない2以上の特許分類を列挙したものである。IF−THENルールは、例えば、「Fターム:5B075PQ02 と Fターム:2F029AA02 をAND演算しない」ルール等のように、「Fターム:5B075PQ02」と「Fターム:2F029AA02」をANDで関連付けてはいけないことを表現するルールであっても良い。ルール言語とは、変数や関数等を用いて、特許分類の関係を表現できる言語である。例えば、ルール言語は、特許分類を変数に格納できる機能と、変数または定数の値に応じて処理を分岐できる機能と、文字列を操作する関数と、2以上の特許分類の共起頻度を取得する関数等とを備える言語であっても良い。ルール格納部101は、1種類のみの特許分類ルールが格納されても良く、2以上の種類の特許分類ルールが格納されても良い。
また、ルール格納部101には、判断結果メッセージが特許分類関係ルールと関連付けた状態で格納されていても良い。判断結果メッセージとは、判断した結果をユーザに提示するメッセージである。例えば、判断結果メッセージは、「テーマコードの異なるFタームどうしをAND演算することは推奨されません」である。また、ルール格納部101には、特許分類関係ルールの重要度が特許分類関係ルールと関連付けられた状態で格納されていても良い。特許分類関係ルールの重要度は、例えば、「警告(例えば、「1」)」や「誤り(例えば、「2」)」等の情報である、「警告」は、推奨されない特許分類の組み合わせのルールに用いても良く、「誤り」は、禁止される特許分類の組み合わせのルールに用いても良い。また、ルール格納部101には、特許分類関係ルールの種類が特許分類関係ルールと関連付けられた状態で格納されていても良い。特許分類関係ルールの種類は、例えば、「TRUE(例えば、「正しい特許分類の関係」)」や「FALSE(例えば、「誤った特許分類の関係」)」等の情報である。「TURE」は、推奨される特許分類の組み合わせのルールに用いても良く、「FALSE」は、推奨されない特許分類の組み合わせのルールに用いても良い。また、ルール格納部101には、特許検索式を改善する改善方法に関する改善方法情報が特許分類関係ルールと対応付けられて格納されていても良い。改善方法情報は、例えば、Fタームの前方5文字が異なる場合にAND演算しないことを示すルールに対して、「一方の特許分類を削除する方法」等である。改善方法情報は、関数名でも、メソッド名でも、改善を実施するプログラム自体等でも良い。改善方法情報は、特許分類関係ルールと同様に専用の言語を用いて表現しても良い。例えば、ルール格納部101には、特許分類関係ルールと特許分類関係ルールの重要度と判断結果メッセージとが格納される。
ここで、格納とは、不揮発性の記録媒体による長期的な格納や、揮発性の記録媒体による一時的な格納も含む概念である。ルール格納部101は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。後述する他の格納部についても同様とする。ルール格納部101に特許分類関係ルールが格納される過程は問わない。例えば、記録媒体を介して特許分類関係ルールがルール格納部101で格納されるようになっても良く、通信回線等を介して送信された特許分類関係ルールがルール格納部101で格納されるようになっても良く、あるいは、入力デバイスを介して入力された特許分類関係ルールがルール格納部101で格納されるようになっても良い。
受付部102は、2以上の特許分類を含む特許検索式を受け付ける。また、受付部102は、特許検索式の修正の指示や、特許検索式を修正しない旨の指示等を受け付けても良い。受け付けとは、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリ等の記録媒体から読み出された情報の受け付け等を含む概念である。なお、本実施の形態では、受付部102は、ネットワーク100を介してユーザ端末3から送信された、2以上の特許分類を含む特許検索式を受信することとする。受付部102は、受け付けた特許検索式を検索式格納部103に格納する。受付部102は、検索式格納部103に受け付けた特許検索式をそのまま格納しても良く、用語と特許分類とを分けて格納しても良く、特許検索式を木構造(Expression Tree等)に変換して格納しても良い。本実施の形態では、受付部102は、検索式格納部103に、受付部102が受け付けた特許検索式をそのまま格納する。また、受付部102は、判断結果に応じて変更された特許検索式をも受け付けても良い。判断結果に応じて変更された特許検索式とは、判断部106が特許分類包含情報を改善した特許検索式であっても良く、出力部105または特許分類出力部109が判断結果や特許分類を出力した後、ユーザが判断結果を基に改善した検索式であっても良い。
検索式格納部103には、受付部102で受け付けられた特許検索式が格納される。検索式格納部103は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
特許分類包含情報取得部104は、受付部102が受け付けた特許検索式から2以上の特許分類を含む情報である特許分類包含情報を取得する。特許分類包含情報は、2以上の特許分類と2以上の特許分類を関係づける論理演算子とを含む情報である。例えば、特許分類包含情報取得部104は、特許検索式から、1または2以上の用語に関する部分を削除して取得する。また、特許分類包含情報取得部104は、特許検索式から、用語に関する部分と、1または2以上の特許分類を削除した特許検索式の残った特許分類包含情報(削除した特許検索式に2以上の特許分類が含まれている必要がある)を取得しても良い。なお、特許分類包含情報取得部104は、特許分類包含情報を取得する際に論理演算子やブロック区切り要素が意味をなさなくなる場合は、通常、削除する。また、特許分類包含情報取得部104は、論理演算子が演算する対象を失う場合は、論理演算四を削除する。具体的には、「キーワードA AND (特許分類A OR 特許分類B)」から「キーワードA」を削除する場合、「AND (特許分類A OR 特許分類B)」が取得されるが、この場合のAND演算子は、関係づける対象がなくなったため削除し、AND演算子が削除されると、ブロック区切り要素が意味をなさなくなるので削除し、「特許分類A OR 特許分類B」を取得しても良い。
また、特許分類包含情報取得部104は、2以上の特許分類包含情報を取得しても良い。例えば、上記処理において3以上の特許分類を含む特許分類包含情報を取得した場合、2以上の特許分類を含む組み合わせの2以上の特許分類包含情報を取得しても良い。具体的には、特許分類包含情報取得部104は、特許分類包含情報「特許分類A OR 特許分類B OR 特許分類C」を取得した場合、次の3つの特許包含情報「特許分類A OR 特許分類B」、「特許分類A OR 特許分類C」、「特許分類B OR 特許分類C」のうちから1または2以上の特許包含情報を「特許分類A OR 特許分類B OR 特許分類C」と共に取得しても良い。特許分類包含情報取得部104は、通常、MPUやメモリ等から実現され得る。特許分類包含情報取得部104の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
共起頻度情報格納部105には、2以上の特許分類の共起頻度に関する情報である1または2以上の共起頻度情報を格納され得る。共起頻度情報は、2以上の特許分類とその特許分類の共起頻度とを含む情報である。特許分類の共起頻度とは、1以上の特許公報に特定の特許分類がそれ以外の特許分類と同時に付与されている頻度である。具体的には、「IPC:G06F17/30」が特許公報Aと特許公報Bに付与され、「G06F13/00」が特許公報Aに付与されているような場合、「IPC:G06F17/30」と「G06F13/00」の対は1回共起しているとする。頻度は、回数であっても良く、割合であっても良い。割合は、特許分類の対が付与されている特許公報の件数を特許公報すべての件数で割って算出しても良く、特許分類の対が付与されている特許公報の件数を特許分類のどちらか一方が付与された特許公報の件数から割って算出しても良い。
共起頻度情報格納部105は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。共起頻度情報格納部105に共起頻度情報が格納される過程は問わない。例えば、記録媒体を介して共起頻度情報が共起頻度情報格納部105で格納されるようになっても良く、通信回線等を介して送信された共起頻度情報が共起頻度情報格納部105で格納されるようになっても良い。
判断部106は、ルール格納部101に格納されている1以上の特許分類関係ルールに特許分類包含情報を適用し、いずれかの特許分類関係ルールに特許分類包含情報が合致するか否かを判断する。また、判断部106は、特許分類包含情報取得部104が取得した特許包含情報が2以上であった場合、取得したすべての特許包含情報が、いずれかの特許分類関係ルールに合致するか否かを判断しても良い。特許分類関係ルールに適用するとは、ルール格納部101からすべての特許分類関係ルールを取得して適用しても良く、一部の特許分類関係ルールを取得して適用しても良い。なお、判断部106は、共起頻度情報格納部105の共起情報を用いて、特許分類包含情報がルールに合致するか否かを判断しても良い。
また、判断部106は、改善方法情報が対応付いている特許分類関係ルールに特許分類包含情報が合致した場合、当該改善方法情報に従って特許分類包含情報を改善する処理を行っても良い。判断部106は、通常、MPUやメモリ等から実現され得る。判断部106の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部107は、判断部106の判断結果を出力する。判断結果とは、判断部106が判断した結果であり、合致した特許分類関係ルールであっても良く、合致した特許分類包含情報であっても良く、合致しなかった特許分類包含情報であっても良い。合致した特許分類包含情報であった場合、出力部107は、問題があると判断された特許分類包含情報を出力しても良く、問題がないと判断された特許分類包含情報を出力しても良い。また、出力部107は、問題があると判断された特許分類包含情報を出力する場合、特許分類関係ルールに対応付いた改善方法情報を適用して、改善された特許分類包含情報を出力しても良い。また、出力部107は、合致した特許分類ルールに対応付けられたルールの特許分類関係ルールの重要度を出力しても良く、合致した特許分類ルールに対応付けられたルールの判断結果メッセージを出力しても良く、これら両方の情報を出力しても良い。また、出力部107は、検索式格納部103に格納されている特許検索式を取得して出力しても良い。また、出力部107は、改善された特許分類包含情報を含む検索式を受付部110に出力しても良い。
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への格納、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。また、出力部107は、ネットワーク100を通じてユーザ端末3へ判断結果を送信することとしても良い。出力部107は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部107は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
高共起頻度特許分類取得部108は、特許分類包含情報に含まれる特許分類と共起頻度が予め決められた条件を満たすほど大きい1以上の特許分類を、共起頻度情報格納部105から取得する。なお、高共起頻度特許分類取得部108は、特許分類包含情報に含まれる特許分類と一致する特許分類を除いて特許分類を取得することは好適である。また、高共起頻度特許分類取得部108は、2以上の特許分類の組み合わせと共起する特許分類を取得しても良い。予め決められた条件とは、共起回数が閾値より多いことであっても良く、共起確率が閾値より高いことであっても良い。例えば、共起頻度情報格納部105に共起回数が格納されている場合、高共起頻度特許分類取得部108は、共起回数が閾値よりも多い特許分類を取得しても良く、共起回数が多い順に所定の個数の特許分類を取得しても良く、出現回数が多い順に所定の割合に含まれる特許分類を取得しても良い。なお、閾値は、例えば、予め決められた値であっても良く、出現回数の最大値に1より小さい数(例えば、0.9や0.8等)を掛けた値であっても良い。また、その所定の個数は、例えば、予め決められた個数であっても良く、高共起頻度特許分類取得部108が取得した用語の総数に1より小さい値(例えば、0.01や0.001等)を掛けた個数であっても良い。高共起頻度特許分類取得部108は、通常、MPUやメモリ等から実現され得る。高共起頻度特許分類取得部108の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
特許分類出力部109は、高共起頻度特許分類取得部108が取得した1以上の特許分類を出力する。なお、特許分類出力部109は、検索式格納部103に格納されている特許検索式を取得して出力しても良い。
検索部110は、受付部102が受け付けた特許検索式を用いて、1以上の特許書類を検索する。かかる検索の処理は、公知技術であるため説明を省略する。検索部110は、特許書類を、特許検索装置2内の特許書類格納部111に格納されている特許書類の中から、特許検索式を用いて特許書類を取得して、特許書類を特定しても良く、ネットワーク100を介して図示しない外部のサーバ装置に特許検索式を送信して検索結果を取得することで特定しても良い。また、特許書類を検索するとは、特許書類を取得することでも良く、特許書類を識別する特許書類ID(例えば、出願番号等)等の情報を図示しない格納部に格納することでも良く、特定したことを示すフラグを設定することでも良い。また、検索部110は、受付部102が受け付けた変更後の特許検索式を用いて検索を行うことは好適である。検索部110は、通常、MPUやメモリ等から実現され得る。検索部110の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
特許書類格納部111では、特許検索式によって検索可能な2以上の特許書類が格納されている。なお、特許書類格納部111では、すべての特許書類が網羅して格納されていても良く、または、その一部の特許書類が格納されていても良い。 特許書類格納部111に特許書類が格納される過程は問わない。例えば、記録媒体を介して特許書類格納部111に格納されても良く、ネットワーク100等を介して送信された特許書類が特許書類格納部111に格納されても良い。特許書類格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
特許書類出力部112は、検索部110が検索した1以上の特許書類を出力する。なお、特許書類出力部は、検索部110が特定した特許書類IDを出力しても良い。特許書類出力部112は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。特許書類出力部112は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
図3は、本実施の形態にかかる特許検索装置2の動作の一例を示すフローチャートである。以下、図3を用いて動作について説明する。
(ステップS201)受付部102は、ユーザ端末3から1以上の用語情報と1以上の特許分類を含む特許検索式を受け付けたかどうかを判断する。そして、特許検索式を受け付けた場合はステップS202へ進み、特許検索式を受け付けなかった場合はステップS201に戻る。
(ステップS202)受付部102は、受け付けた特許検索式を検索式格納部103に一時蓄積する。
(ステップS203)特許分類包含情報取得部104は、特許検索式からすべての用語の部分を削除し、2以上の特許分類等が含まれる特許分類包含情報を取得する。なお、特許分類包含情報取得部104は、この時取得した特許分類包含情報に3以上の特許分類が含まれていた場合、全ての2以上の組み合わせを取得して2以上の特許分類が含まれる特許分類包含情報を複数取得しても良い。
(ステップS204)判断部106は、ステップS203で取得された特許分類包含情報に対して、ルール格納部101に格納されているすべての特許分類関係ルールを適用し、合致するかどうかを判断する。判断部106の判断の詳細は、図4のフローチャートを用いて後述する。
(ステップS205)高共起頻度特許分類取得部108は、ステップS203で特許分類包含情報取得部104が取得した特許分類包含情報に含まれる特許分類に対して、多く共起する特許分類を取得する。例えば、高共起頻度特許分類取得部108は、N回以上共起する特許分類を取得しても良い。なお、Nは、1以上の任意の自然数である。
(ステップS206)出力部107は、ステップS204で判断した判断結果を出力する。
(ステップS207)特許分類出力部109は、ステップS205で取得した多く共起する特許分類を出力する。
(ステップS208)受付部102は、ユーザからの特許検索式の修正を受け付けたか否かを判断する。特許検索式の修正を受け付ければステップS209に行き、受け付けなければステップS208に戻る。なお、本ステップで、特許検索式を修正しない旨の指示を受け付けても良い。かかる場合、ステップS201で受け付けた特許検索式が最終的な特許検索式となる。
(ステップS209)検索部110は、最終的な特許検索式を取得する。なお、最終的な特許検索式とは、修正された特許検索式または、ステップS201で受け付けた特許検索式である。
(ステップS210)検索部110は、最終的な特許検索式を用いて特許書類格納部111に格納されている特許書類を検索し、特許書類IDを取得する。
(ステップS211)特許書類出力部112は、ステップS210で取得した特許書類を出力し、終了する。
図4は、特許検索装置2の判断部106において、図3の特許分類関係ルールの判断(ステップS204)の動作の一例を示すフローチャートである。以下、図4を用いて、特許分類関係ルールの判断処理について説明する。
(ステップS301)判断部106は、ルール格納部101から、格納されている特許分類関係ルールの全てを取得する。
(ステップS302)判断部106は、カウンタmに1を代入する
(ステップS303)判断部106は、ステップS301で取得した特許分類関係ルールのうち、m番目の特許分類関係ルールが存在するかどうかを判断する。m番目の特許分類関係ルールが存在する場合は、ステップS304へ進み、存在しない場合は、上位の処理に戻る。
(ステップS304)判断部106は、ステップS203で取得した特許分類包含情報にm番目の特許分類関係ルールと合致するかどうかを判断する。合致した場合は、図示しない格納部に合致した特許分類包含情報と特許分類関係ルールとを格納する。
(ステップS305)判断部106は、カウンタmをインクリメントし、ステップS303に戻る。
以下、本実施の形態における特許検索装置2の具体的な動作について説明する。
本具体例において、図5は、ルール格納部101に格納されている特許分類関係ルールを示す図である。図5のテーブルは、ルールID、特許関係ルール、ルールの種類、特許分類関係ルールの重要度、および判断結果メッセージを有するレコードを多数格納している。本実施例の特許関係ルールは、ルール言語を用いて表現した。本具体例におけるルール言語は、「=>」の左辺(以下、左辺という)で前処理を行い、「=>」の右辺(以下、右辺という)で判断を行うものとした。左辺での前処理は、特許分類の文字を変数に格納することであっても良く、共起頻度を求めた結果を変数に格納することであっても良い。右辺での判断は、左辺で格納した変数を用いて合致するかどうかを判断する。また、本具体例におけるルール言語は、特許分類を「:」の前後の要素で表現している。例えば、[Fターム:5B075PQ02]とした場合は、Fタームの特許分類かつ、5B075PQ02である特許分類に合致する。また、特許分類を表現する場合は、「*」を用いて全ての特許分類の種類を指定しても良く、「?」を用いて特許分類のコードの一部を表現しても良いとした。具体的には、ルール言語では、「*:G06F?」等と表現する。「*:G06F?」は、全てのコード種類における「G06F」から始まる特許分類を表現している。また、本具体例におけるルール言語は、角括弧(「[]と「]」)で1文字、または1つの数値を格納する変数を表現している。例えば、[A]とした場合は、変数にAという名前を付けた事を表している。具体的には、ルール言語では、「Fターム:[A][B][C][D][E]?」等と表現する。仮に判断する特許分類包含情報にFタームである5B075PQ02が含まれていた場合、[A]には「5」、[B]には「B」、[C]には「0」、[D]には「7」、[E]には「5」が格納される。また、本具体例におけるルール言語は、一般的な四則演算と比較演算と論理演算が可能であり、各々一般的に使用されている「+」や「=」や「<」等の記号で表現している。また、本具体例におけるルール言語は、「Coincidence()−>」で「()」に含まれる特許分類の共起回数を取得し、「−>」の右側の変数に格納する関数を表現している。例えば、「Coincidence(*:? OR *:?)−>[X]」とした場合は、任意の2つの特許分類がORで関連付けられたとき、その2つの特許分類の共起回数を取得し、[X]に格納する。また、本具体例におけるルール言語は、「IF()」で判断する機能を表現している。例えば、上記[A]に格納した変数を用いて「IF([A]=5)」とした場合は、Fタームの最初の1文字が「5」である特許分類が含まれる特許分類包含情報が特許分類関係ルールに合致したと判断される。なお、図5では記載していないが、左辺、または右辺が複数行であっても良く、複数文字が格納出来る変数が定義されていても良く、文字列処理出来るような関数が定義されていても良く、IF()の判断結果で分岐できるように表現されていても良く、繰り返し処理する機能が定義されていても良い。図6は、共起頻度情報格納部105に格納されている共起頻度情報を示す図である。図6のテーブルは、2つの特許分類と、当該2つの特許分類の共起回数とを有するレコードを多数格納している。なお、本具体例では、2つの特許分類の共起回数を格納しているが、共起頻度情報格納部105は、3以上の特許分類の共起回数を格納しても良い。図7は、特許書類格納部111に格納されている特許書類を示す図である。図7のテーブルは、特許書類IDと、発明の名称と、要約の文章と、特許請求の範囲の文章と、IPC等を有する。特許書類IDは、ここでは、例えば、公開番号である。なお、特許書類は、ここでは表のレコードで示しているが、そのデータ構造は問わないことは言うまでもない。
ユーザ端末3のユーザが、ポインティングデバイスやキーボード等を操作し、図8で示されるように特許検索式を入力した後、「実行」ボタンを押したとする。すると、特許検索式「データベース AND 検索 AND (5B075PQ02 AND 2F029AA02)」が、ユーザ端末3から特許検索装置2に送信される。その送信された特許検索式は、検索式妥当性判断装置1の受付部102で受信され、検索式格納部103に格納される(ステップS201、S202)。
特許分類包含情報取得部104は、検索式格納部103に新たな特許検索式が格納されたことを検知すると、その特許検索式のうち、特許分類のみで構成される特許分類包含情報「5B075PQ02 AND 2F029AA02」を取得し、判断部106と高共起頻度特許分類取得部108に渡す(ステップS203)。
判断部106は渡された特許分類包含情報に対してルール格納部101のルールが合致するかを判断する(ステップS204)。以下、かかる処理の詳細を説明する。
判断部106は、特許分類包含情報を渡されると、ルール格納部101から特許分類関係ルールをすべて取得する(ステップS301)。そして、判断部106は、受け取った特許分類包含情報が、取得した全ての特許分類関係ルールと合致するかを1件ずつ判断する(ステップS302からS305)。
1つ目のルールである「ルールID:1」について判断する。「ルールID:1」の特許関係ルールは、テーマコードの異なるFタームをAND演算する特許分類の関係が誤りであることを示すルールである。「Fターム:5B075PQ02 AND Fターム:2F029AA02」は、「ルールID:1」の上記特許関係ルールに合致している。判断部106は、図示しない格納部に「ルールID:1」と特許分類包含情報とを格納する。以下、特許関係ルールに合致した場合は、同様に格納する。2つめのルールである、「ルールID:2」について判断する。「ルールID:2」は、観点が異なるFタームをAND演算する特許分類の関係が正しいことを示すルールである。「Fターム:5B075PQ02 AND Fターム:2F029AA02」は、「ルールID:2」の上記特許関係ルールにも合致している。3つめのルールである、「ルールID:3」について判断する。「ルールID:3」は、2つの任意の特許分類がOR演算子で関連付けられた場合、その2つの特許分類の共起回数が100未満である特許分類の関係が誤りであることを示すルールである。なお、「Fターム:5B075PQ02」と「Fターム:2F029AA02」は100以上の共起回数があるものとする。よって、「Fターム:5B075PQ02 AND Fターム:2F029AA02」は、「ルールID:3」の上記特許関係ルールにも合致していない。以下同様に取得した全ての特許関係ルールを判断する。
高共起頻度特許分類取得部108は、特許分類包含情報を受け取ると、「Fターム:5B075PQ02」と「Fターム:2F029AA02」とに対応する共起頻度の高い特許分類を共起頻度情報格納部105から「IPC:G06F17/30」を含む共起頻度の高い特許分類を50個取得した、とする。高共起頻度特許分類取得部108は、取得した共起頻度の高い特許分類と共起回数とを特許分類出力部109に渡す(ステップS205)。
出力部107は、図示しない格納部に「ルールID」が格納されたことを検知すると、その「ルールID」をキーとして、例えば、ルール格納部101から「ルールID:1」に関する特許分類関係ルールの「重要度:誤り」と「判断結果メッセージ:テーマコードの異なるFIがAND演算子で関係づけられています。」を取得し、ネットワーク100を介して、ユーザ端末3に送信する(ステップS206)。そして、ユーザ端末3は、判断結果メッセージを受信し、出力する。
特許分類出力部109は、共起頻度の高い特許分類を受け取ると、ネットワーク100を介して、ユーザ端末3に送信する(ステップS207)。そして、ユーザ端末3は、共起頻度の高い特許分類を受信し、出力する。
次に、ユーザは、出力された判断結果メッセージと共起頻度の高い特許分類とをチェックし、改善した特許検索式を入力する。そして、ユーザ端末3は、改善された特許検索式を受け付け、特許検索装置2に送信する。
次に、特許検索装置2は、改善された特許検索式を受信する(ステップS208)。そして、検索部110は、改善された特許検索式を取得する(ステップS209)。次に、検索部110は、当該特許検索式用いて検索し、特許書類格納部111に格納されている特許書類の中から1以上の特許書類を取得する(ステップS210)。検索部110は取得した1以上の特許書類を特許書類出力部112に渡す。 次に、特許書類出力部112は、検索部110が取得した特許書類を受け取ると、ネットワーク100を介して、ユーザ端末3に送信する(ステップS211)。図9は、上記出力部107と特許分類出力部109と特許書類出力部112が出力した情報をユーザ端末3に表示する表示例を示す図である。
以上、本実施の形態の検索式妥当性判断装置1によれば、特許検索式を作成する際に、不適切な2以上の特許分類の組み合わせ等がチェックできるため、特許検索式の問題点を知ることができる。また、特許分類の共起頻度を用いてチェックされるため、適切な特許分類を用いた特許検索式を作成し易くなる。
また、本実施の形態において、特許検索装置2が特許書類格納部111を備える場合について説明したが、特許検索装置2は、特許書類格納部111を備えていなくても良い。特許検索装置2が特許書類格納部111を備えていない場合には、検索部110は、外部の装置やネットワークを通じた外部の特許書類検索サービスに対して、特許検索式を送信し、取得した結果から特許書類を特定しても良い。
また、本実施の形態において、検索式妥当性判断装置1が高共起頻度特許分類取得部108と特許分類出力部109とを備える場合について説明したが、検索式妥当性判断装置1は、高共起頻度特許分類取得部108と特許分類出力部109とを備えていなくても良い。検索式妥当性判断装置1が、高共起頻度特許分類取得部108と特許分類出力部109とを備えていない場合には、共起頻度の高い特許分類を出力しない検索式妥当性判断装置1であっても良い。
また、本実施の形態において、検索式妥当性判断装置1が共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備える場合について説明したが、検索式妥当性判断装置1は、共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備えていなくても良い。検索式妥当性判断装置1が、共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備えていない場合には、ルール格納部101が共起頻度に関する特許分類関係ルールを格納されない検索式妥当性判断装置1であっても良い。
本実施の形態における検索式妥当性判断装置1は、キーワードを受け付け、キーワードに応じた1以上の関連語を出力すると共に、キーワードに応じた特許検索式を提案する特許検索式生成装置を含み、その提案された特許検索式を受付部102が受け付けても良い。なお、特許検索式生成装置は、用語と、当該用語に関連する用語である関連用語とを有する関連用語情報が1以上格納される関連用語情報格納部と、1以上のキーワードを受け付けるキーワード受付部と、前記関連用語情報から、前記各キーワードと一致する用語と対応付けられた関連用語であって、当該キーワードと一致する文字列を含まない関連用語を、特許検索式に用いられるキーワードの候補となる候補キーワードとして取得する候補キーワード取得部と、前記候補キーワード取得部が取得した候補キーワードを表示する候補キーワード表示部と、前記候補キーワード取得部が取得した候補キーワードの1以上を、特許検索式に用いるキーワードである検索キーワードに指定する指示である指定指示を受け付ける指定指示受付部と、前記指定指示により指定された候補キーワードを含む特許検索式を生成する特許検索式生成部と、前記特許検索式を出力する特許検索式出力部と、技術的な文書を示す情報である技術文書情報に含まれる1以上の用語と、当該技術文書情報についての特許の分類を示すコードの情報である1以上の特許分類コード情報とが、前記技術文書情報ごとに対応付けて記憶される用語記憶部と、前記指定指示により指定された候補キーワードを検索キーとし、前記用語記憶部から当該検索キーと一致する用語に対応付けられた特許分類コード情報を検索する特許分類コード情報検索部と、前記特許分類コード情報検索部が検索した特許分類コード情報から、出現回数を用いて特許分類コード情報を選択する特許分類コード情報選択部と、を備え、前記特許検索式生成部は、前記特許分類コード情報選択部が選択した特許分類コード情報を更に含む特許検索式を生成する、ものであっても良い。また、特許検索式生成装置の詳細については、例えば、特開2012−53516号公報を参照されたい。また、特許検索式生成装置から特許検索式を受け付けた場合、高共起頻度特許分類取得部108は、取得した共起頻度の高い特許分類から特許検索式生成装置が取得した特許分類コード情報を削除して取得しても良い。つまり、高共起頻度特許分類取得部108は、既に検索式妥当性判断装置1が出力した特許分類コード情報を除いて、共起頻度の高い特許分類を取得することは好適である。
また、本実施の形態において、検索式妥当性判断装置1が高共起頻度特許分類取得部108と特許分類出力部109とを備える場合について説明したが、検索式妥当性判断装置1は、高共起頻度特許分類取得部108と特許分類出力部109とを備えていなくても良い。検索式妥当性判断装置1が、高共起頻度特許分類取得部108と特許分類出力部109とを備えていない場合には、共起頻度の高い特許分類を出力しない検索式妥当性判断装置1であっても良い。
また、本実施の形態において、検索式妥当性判断装置1が共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備える場合について説明したが、検索式妥当性判断装置1は、共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備えていなくても良い。検索式妥当性判断装置1が、共起頻度情報格納部105と高共起頻度特許分類取得部108と特許分類出力部109とを備えていない場合には、ルール格納部101が共起頻度に関する特許分類関係ルールを格納されない検索式妥当性判断装置1であっても良い。
なお、本実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されても良く、または、複数の装置によって分散処理されることによって実現されても良い。また、本実施の形態において、一の装置に存在する2以上の通信手段(受付部102等)は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、本プログラムは、発明に対して、特許検索式に含まれ得る2以上の特許分類の関係に関するルールである1以上の特許分類関係ルールを格納し得るルール格納部にアクセス可能なコンピュータを、2以上の特許分類を含む特許検索式を受け付ける受付部、特許検索式から2以上の特許分類を含む情報である特許分類包含情報を取得する特許分類包含情報取得部、特許分類包含情報をルール格納部の1以上の特許分類関係ルールに適用し、いずれか1以上の特許分類関係ルールに特許分類包含情報が合致するか否かを判断する判断部、判断部の判断結果を出力する出力部として機能させるためのプログラムである。
また、本実施の形態では、本発明がサーバ・クライアントシステムである場合について説明したが、本発明は、サーバ・クライアントシステムにおけるサーバ装置であっても良く、スタンドアロンの装置であっても良い。スタンドアロンの装置であった場合、受付部102は、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付けことであっても良い。出力部107と特許分類出力部109と特許書類出力部112は、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字等であっても良い。
また、本実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
図10は、上記プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。
図10において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。
図11は、コンピュータシステム1100の内部構成を示す図である。図19において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを記憶するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを記憶するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。
コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に記憶されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に記憶されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。