JP2013225207A - 特許調査支援装置、特許調査支援方法、およびプログラム - Google Patents

特許調査支援装置、特許調査支援方法、およびプログラム Download PDF

Info

Publication number
JP2013225207A
JP2013225207A JP2012096778A JP2012096778A JP2013225207A JP 2013225207 A JP2013225207 A JP 2013225207A JP 2012096778 A JP2012096778 A JP 2012096778A JP 2012096778 A JP2012096778 A JP 2012096778A JP 2013225207 A JP2013225207 A JP 2013225207A
Authority
JP
Japan
Prior art keywords
patent document
unrelated
related patent
feature vector
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012096778A
Other languages
English (en)
Other versions
JP5971794B2 (ja
Inventor
Toshiya Tsuruhara
稔也 鶴原
Akihiro Azuma
明洋 東
Yoshifumi Suzuki
芳文 鈴木
Yukiko Nakamura
由紀子 中村
Hidekazu Tanigawa
英和 谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Docomo Technology Inc
IRD KK
Original Assignee
Docomo Technology Inc
IRD KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Docomo Technology Inc, IRD KK filed Critical Docomo Technology Inc
Priority to JP2012096778A priority Critical patent/JP5971794B2/ja
Publication of JP2013225207A publication Critical patent/JP2013225207A/ja
Application granted granted Critical
Publication of JP5971794B2 publication Critical patent/JP5971794B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】従来、人手によってでしか関連特許と非関連特許をチェックすることができなかった。
【解決手段】1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得部105と、1以上の関連特許特徴ベクトル、および1以上の非関連特許特徴ベクトルを用いて、1以上の非関連特許書類から、関連特許書類を決定
する判断部106と、判断部106が決定した関連特許書類を特定する情報を出力する出力部107とを具備する特許調査支援装置1により、分類済みの特許の書類をチェックできる。
【選択図】図1

Description

本発明は、特許調査を支援する特許調査支援装置等に関するものである。
従来、特許調査の結果を管理する装置等が開発されている(例えば、特許文献1参照)。
特開2007−242004号公報
しかしながら、従来の特許調査においては、人手により関連特許と非関連特許とを分類することは、非常に時間のかかる作業で有り、一度非関連特許と分類された特許の書類に誤りがあれば、それが再考されることは希であり、誤った分類結果が残ってしまう、という問題があった。
本第一の発明の特許調査支援装置は、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得部と、1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断部と、判断部が決定した非関連特許書類を特定する情報を出力する出力部とを具備する特許調査支援装置である。
かかる構成により、非関連特許の特許書類の中から、関連特許を抽出できる。これにより、例えば、特許調査において、人手により調査対象の特許を関連特許または非関連特許のいずれかに分類した際に、誤って非関連特許と分類した特許書類の中から、関連特許である可能性が高い特許書類を特定する情報を取得することができる。
また、本第二の発明の特許調査支援装置は、第一の発明に対して、判断部は、関連特許のクラスに属するべきか否かの判断対象の非関連特許書類のベクトルである判断対象非関連特許特徴ベクトルに対応する非関連特許書類を、1以上の関連特許特徴ベクトルおよび判断対象非関連特許特徴ベクトルを除く1以上の非関連特許特徴ベクトルを用いて決定する、特許調査支援装置である。
かかる構成により、非関連特許の特許書類の中から、関連特許を抽出できる。これにより、例えば、特許調査において、人手により調査対象の特許を関連特許または非関連特許のいずれかに分類した際に、誤って非関連特許と分類した特許書類の中から、関連特許である可能性が高い特許書類を特定する情報を取得することができる。
また、本第三の発明の特許調査支援装置は、第一または第二の発明に対して、1以上の関連特許書類および1以上の非関連特許書類を除いた特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部をさらに具備し、特徴ベクトル取得部は、1以上の各新規特許書類から1以上の用語を取得し、1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得し、判断部は、1以上の関連特許特徴ベクトル、または1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき新規特許特徴ベクトルに対応する新規特許書類を決定し、出力部は、判断部が決定した関連特許のクラスに属するべき新規特許書類を特定する情報を出力する、特許調査支援装置である。
かかる構成により、未分類の特許書類が関連特許であるか非関連特許であるかを判断できる。これにより、例えば、ユーザは、何件かの特許書類を関連特許または非関連特許に分類すると、未分類の特許書類から関連特許である可能性が高い特許書類を特定する情報を取得できる。
また、本第四の発明の特許調査支援装置は、第一から第三いずれかの発明に対して、判断部は、1以上の関連特許特徴ベクトル、または1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属すべきではない関連特許特徴ベクトルに対応する関連特許書類を決定し、出力部は、判断部が決定した関連特許のクラスに属すべきではない関連特許書類を特定する情報を出力する、特許調査支援装置である。
かかる構成により、関連特許の特許書類の中から、非関連特許を抽出できる。これにより、例えば、特許調査において、人手により調査対象の特許を関連特許または非関連特許のいずれかに分類した際に、誤って関連特許と分類した特許書類の中から、非関連特許である可能性が高い特許書類を特定する情報を取得することができる。
また、本第五の発明の特許調査支援装置は、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、1以上の関連特許書類および1以上の非関連特許書類を除いた関連特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部と、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各新規特許書類から1以上の用語を取得し、1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得する特徴ベクトル取得部と、1以上の関連特許特徴ベクトルを用いて、新規特許書類の特許特徴ベクトルが関連特許のクラスに属するかを決定する判断部と、判断部が関連特許のクラスに属すると決定した新規特許書類を特定する情報を出力する出力部とを具備する特許調査支援装置である。
かかる構成により、未分類の特許書類が関連特許であるかを判断できる。これにより、例えば、何件かの特許書類を関連特許または非関連特許に分類すると、未分類の特許書類から関連特許の可能性が高い特許書類を特定する情報を取得できる。
また、本第六の発明の特許調査支援装置は、第五の発明に対して、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部をさらに具備し、特徴ベクトル取得部は、さらに、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得し、判断部は、1以上の関連特許特徴ベクトル、および1以上の非関連特許特徴ベクトルを用いて、新規特許書類の特許特徴ベクトルが関連特許のクラスに属するかを決定する、特許調査支援装置である。
かかる構成により、未分類の特許書類が関連特許であるか非関連特許であるかを判断できる。これにより、例えば、何件かの特許書類を関連特許または非関連特許に分類すると、未分類の特許書類から関連特許の可能性が高い、または非関連特許である可能性が高い特許書類を特定する情報を取得できる。
本発明による特許調査支援装置等によれば、特許書類が関連特許であるか、非関連特許であるかを判断できる。
実施の形態1における特許調査支援装置を含むシステムの概念図 同実施の形態における特許調査支援装置のブロック図 同実施の形態における特許調査支援装置の動作を示すフローチャート 同実施の形態における特徴ベクトル取得部の動作を示すフローチャート 同実施の形態における判断部の動作を示すフローチャート 同実施の形態における各特許書類格納部に格納されている特許の書類の例を示す図 同実施の形態における各特許書類の特徴ベクトルの例を示す図 同実施の形態における受付部が受け付ける情報を入力する画面の表示例を示す図 同実施の形態における出力部が出力した情報を表示した画面の表示例を示す図 実施の形態2における特許調査支援装置の動作を示すフローチャート 同実施の形態における出力部が出力した情報を表示した画面の表示例を示す図 上記実施の形態におけるコンピュータシステムの外観の一例を示す図 上記実施の形態におけるコンピュータシステムの構成の一例を示す図
以下、特許調査支援装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、特許書類を関連特許と非関連特許とに人手で分類された結果を用いて、非関連特許に分類された特許書類や、未分類の特許書類等から関連特許書類である可能性のある特許書類を判断し、その結果を出力する特許調査支援装置1について説明する。
図1は、本実施の形態における特許調査支援装置1を含むシステムの概念図である。図1において、特許調査支援装置1と1または2以上のユーザ端末3とは、ネットワーク100を介して接続されている。ネットワーク100は、有線、または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。また、ユーザ端末3は、ネットワーク100に接続可能な端末であれば何でも良い。例えば、ユーザ端末3は、デスクトップパソコン、ノートパソコン、スマートフォン、またはPDA等であっても良い。
図2は、本実施の形態における特許調査支援装置1のブロック図である。特許調査支援装置1は、受付部101、関連特許書類格納部102、非関連特許書類格納部103、新規特許書類格納部104、特徴ベクトル取得部105、判断部106、および出力部107を備える。
受付部101は、1または2以上の関連特許書類を特定する情報と1または2以上の非関連特許書類を特定する情報とを受け付ける。関連特許書類とは、関連特許に関する書類である。非関連特許書類とは、非関連特許の書類である。関連特許とは、調査したい技術や発明に関連する特許である。非関連特許とは、調査したい技術や調査したい発明等に関連しない特許である。
受付部101が受け付ける関連特許書類を特定する情報は、通常、人手で行った特許調査における選別作業の結果、関連すると判断された特許の書類を特定する情報である。また、受付部101が受け付ける非関連特許書類を特定する情報は、通常、人手で行った特許調査における選別作業の結果、関連しないと判断された特許の書類を特定する情報である。
また、特許調査とは、ある技術やある発明等に関連した文献を調査することである。例えば、特許調査は、先行技術調査、侵害予防調査や無効化資料調査等である。先行技術調査は、特許出願前に先行技術が存在するか否かを調査することをいう。侵害予防調査は、商品やサービスを市場に出す前に他者特許を侵害するか否かを調査することをいう。無効化資料調査は、他者の登録特許を無効にするために調査することをいう。特許の書類とは、特許庁に出願された特許等の出願書類等に関する情報である。特許の書類の種類は、公開特許公報、特許公報、実用新案公開公報、実用新案登録公報、公表特許公報、公表実用新案公報、再公表特許公報、再公表実用新案公報等である。また、特許の書類の発行国は、日本、米国、中国、欧州、韓国等、問わない。なお、特許の書類の言語やデータ形式等は問わない。特許書類を特定する情報とは、特許の書類を1つに特定できる情報であれば何でも良い。特許書類を特定する情報は、例えば、特許の書類そのものであっても良く、特許の書類を一意に特定する特許書類IDであっても良い。特許書類IDは、出願番号であっても良く、公開番号や登録番号等であっても良い。
また、受付部101は、関連特許書類を関連特許書類格納部102に格納する。また、受付部101は、非関連特許書類を非関連特許書類格納部103に格納する。また、受付部101は、新規特許書類を新規特許書類格納部104に格納する。新規特許書類とは、関連特許書類、および非関連特許書類を除いた未分類の特許の書類である。受付部101は、1または2以上の新規特許書類を受け付けても良く、図示しない特許書類格納部から、受け付けた関連特許書類と非関連特許書類とが含まれない特許の書類を取得して新規特許書類としても良い。なお、図示しない特許書類格納部は、外部の特許検索装置等であっても良い。
受付部101は、特許書類IDを受け付けた場合、図示しない特許書類格納部から、特許の書類を取得しても良い。その際、受付部101は、特許書類ID1件ごとに特許の書類を取得しても良く、一度に全ての特許の書類を取得しても良い。なお、図示しない特許書類格納部は、1以上の特許書類を格納している。
また、受付部101は、出力部107が出力した判断結果(なお、判断結果については後述する。)を受け付けても良く、判断結果に応じて分類し直された各特許の書類をも受け付けても良い。判断結果に応じて分類し直された各特許の書類とは、出力部107が判断結果を出力した後、ユーザが判断結果を参考に再度分類した1以上の特許の書類である。
受付部101は、通常、ネットワーク100を介してユーザ端末3から送信された、各特許書類を特定する情報を受け付けるが、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリ等の記録媒体から読み出された情報の受け付けであっても良い。
関連特許書類格納部102には、関連特許の書類である1以上の関連特許書類を格納し得る。ここでの関連特許は、通常、特許調査における人手による選別作業の結果、関連すると判断された特許であるが、自動的に関連すると判断された特許でも良い。ここで、格納とは、不揮発性の記録媒体による長期的な格納や、揮発性の記録媒体による一時的な格納も含む概念である。関連特許書類格納部102は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。後述する他の格納部についても同様とする。関連特許書類格納部102に関連特許書類が格納される過程は問わない。通常、関連特許書類格納部102には、受付部101が受け付けた関連特許書類が格納されるが、例えば、記録媒体を介して関連特許書類が関連特許書類格納部102で格納されるようになっても良く、通信回線等を介して送信された関連特許書類が関連特許書類格納部102で格納されるようになっても良い。格納部に情報が格納される過程は問わないことは、他の記録媒体でも同様である。
非関連特許書類格納部103には、非関連特許の書類である1以上の非関連特許書類を格納し得る。ここでの非関連特許は、通常、特許調査における人手による選別作業の結果、関連しないと判断された特許であるが、自動的に関連しないと判断された特許でも良い。
新規特許書類格納部104には、1以上の新規特許書類を格納し得る。新規特許書類は、1以上の関連特許書類および1以上の非関連特許書類を除いた特許の書類である。なお、新規特許書類は、関連特許書類格納部102と非関連特許書類格納部103とに格納されている特許書類と重複しない。
特徴ベクトル取得部105は、1または2以上の各関連特許書類から1または2以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得する。なお、特徴ベクトル取得部105は、通常、2以上の各関連特許書類から関連特許特徴ベクトルを取得する。さらに、特徴ベクトル取得部105は、1または2以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する。なお、特徴ベクトル取得部105は、通常、2以上の各非関連特許書類から非関連特許特徴ベクトルを取得する。また、特徴ベクトル取得部105は、1以上の各新規特許書類から1以上の用語を取得し、1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得しても良い。
特徴ベクトル取得部105が関連特許書類から取得する用語は、例えば、あらかじめ決められた品詞(例えば、名詞等)であっても良く、予め決められた品詞の連続であっても良く、専門用語であっても良く、あるいは、その他の用語であっても良い。用語が専門用語である場合には、例えば、図示しない記録媒体に専門用語が記憶されており、その専門用語が関連特許書類に含まれているかどうか判断することによって用語の取得が行われても良く、文書から専門用語を抽出するアルゴリズムを用いることによって用語の取得が行われても良い。後者の方法については、例えば、次の文献を参照されたい。大畑博一、中川裕志、「連接異なり語数による専門用語抽出」、情報処理学会研究報告、2000−NL−136、p.119−126。中川裕志、森辰則、湯本紘彰、「出現頻度と連接頻度に基づく専門用語抽出」、自然言語処理、Vol.10 No.1、p.27−45、2003年1月。なお、その用語の取得の際に、特徴ベクトル取得部105は、TF値やTF−IDF値を重要度として利用し、重要度の低い用語を除いて取得しても良い。また、IDF値を算出する際に対象となる文書は、関連特許書類格納部102と非関連特許書類格納部103と新規特許書類格納部104に格納されている全文書であっても良く、新規特許書類に対して処理を行わない場合は、関連特許書類格納部102と非関連特許書類格納部103とに格納されている全文書であっても良い。重要度の低い用語とは、重要度の値が閾値以下である用語であっても良く、重要度順に並べて上位から所定の個数の用語であっても良い。なお、閾値は、例えば、予め決められた値であっても良く、重要度の最大値に1より小さい数(例えば、0.9や0.8等)を掛けた値であっても良い。また、その所定の個数は、例えば、予め決められた個数であっても良く、特徴ベクトル取得部105が取得した用語の総数に1より小さい値(例えば、0.01や0.001等)を掛けた個数であっても良い。また、特徴ベクトル取得部105は、特許の書類の少なくとも一部を含む文字列から用語を取得する。特許の書類の少なくとも一部を含む文字列とは、例えば、特許の書類に記載された全文であっても良く、見出しによって識別される文字列であっても良く、複数の見出しの組み合わせによって識別される文字列であっても良い。見出しとは、例えば、発明の名称、特許請求の範囲、または要約等の特許の書類内の領域を識別するもので有れば何でも良い。なお、特徴ベクトル取得部105が、関連特許書類から用語を取得する方法について記載したが、非関連特許書類、および新規特許書類から用語を取得する場合についても同様である。
特徴ベクトル取得部105が取得する各関連特許特徴ベクトルは、通常、特徴ベクトル取得部105が取得したすべての用語数分の次元を持つベクトルである。関連特許特徴ベクトルの要素は、例えば、用語の出現回数であっても良く、用語のTF値であっても良く、用語のTF−IDF値であっても良く、用語が特許の書類内に存在するかどうかを示す数字、具体的には「1(存在する)」「−1(存在しない)」等であっても良い。なお、特徴ベクトル取得部105が、関連特許特徴ベクトルを取得する方法について記載したが、非関連特許特徴ベクトル、および新規特許特徴ベクトルを取得する場合についても同様である。
また、特徴ベクトル取得部105は、特許書類全体(全文)から特徴ベクトルを取得しても良いし、特許書類の一部分から特徴ベクトルを取得しても良い。特許書類の一部分とは、例えば、要約書のみ、特許請求の範囲のみ、要約書と特許請求の範囲、明細書のみ、または明細書の実施の形態のみ等である。
なお、特徴ベクトル取得部105は、図示しない関連用語辞書を保持しており、かかる関連用語辞書に格納されている関連用語は同一の用語であると判断して、特徴ベクトルを取得しても良い。ここで、関連用語辞書は、例えば、2以上の同義語や類義語等を有する関連用語群を1以上保持している。なお、例えば、関連用語群は「データベース、データーベース、DB、リポジトリ、辞書」である。そして、特徴ベクトル取得部105は、一の関連用語群に含まれる2以上の用語は同一の用語として処理を行う。特徴ベクトル取得部105は、通常、MPUやメモリ等から実現され得る。特徴ベクトル取得部105の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
判断部106は、1または2以上の関連特許特徴ベクトルと1または2以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定しても良い。なお、判断部106は、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する場合には、関連特許特徴ベクトルのクラスと判断対象の非関連特許特徴ベクトルとを用いて、判断対象の非関連特許特徴ベクトルが関連特許のクラスに属するか判断しても良く、関連特許特徴ベクトルのクラスと非関連特許特徴ベクトルのクラスと判断対象の非関連特許特徴ベクトルとを用いて、判断対象の非関連特許特徴ベクトルが関連特許のクラスに属するか判断しても良い。また、判断部106は、通常、2以上の関連特許特徴ベクトルを用いる。また、判断部106は、通常、2以上の非関連特許特徴ベクトルを用いる。かかることは、以下の他の場合でも同様である。また、判断部106は、関連特許のクラスに属するべきか否かの判断対象の非関連特許書類のベクトルである判断対象非関連特許特徴ベクトルに対応する非関連特許書類を、1以上の関連特許特徴ベクトルおよび判断対象非関連特許特徴ベクトルを除く1以上の非関連特許特徴ベクトルを用いて決定しても良い。なお、判断部106は、関連特許のクラスに属するべきか否かの判断対象の非関連特許書類のベクトルである判断対象非関連特許特徴ベクトルに対応する非関連特許書類を、1以上の関連特許特徴ベクトルおよび判断対象非関連特許特徴ベクトルを含む2以上の非関連特許特徴ベクトルを用いて決定しても良い。また、判断部106は、1または2以上の関連特許特徴ベクトル、または、1または2以上の関連特許特徴ベクトルと1または2以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき新規特許特徴ベクトルに対応する新規特許書類を決定しても良い。判断部106は、1以上の関連特許特徴ベクトル、または1以上の関連特許特徴ベクトルと1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属すべきではない関連特許特徴ベクトルに対応する関連特許書類を決定しても良い。
クラスとは、1または2以上の特徴ベクトルが算出されたものの集合である。クラスには、異なる種類の特徴ベクトルを含まない。異なる種類の特徴ベクトルを含まないとは、例えば、関連特許特徴ベクトルのクラスには、関連特許特徴ベクトルではない特徴ベクトルを含まないということである。なお、判断部106は、関連特許特徴ベクトルのクラスの補集合を非関連特許の集合と判断しても良く、非関連特許特徴ベクトルのクラスの補集合を関連特許の集合と判断しても良く、関連特許特徴ベクトルのクラスと非関連特許特徴ベクトルのクラスの和集合の補集合を、関連特許でも非関連特許でもない特許書類と判断しても良い。なお、クラスは、後述する機械学習を用いて、学習器が分類した結果である集合であっても良い。
ここで、特徴ベクトルを用いて、上記の判断する方法は問わない。例えば、判断部106は、ベクトルの類似度を用いて判断しても良く、機械学習を用いて判断しても良い。以下、判断部106がベクトルを用いて(1)1以上の非関連特許書類から、関連特許書類を決定する方法について、(A)ベクトルの類似度を用いて判断する方法、(B)機械学習を用いて判断する方法、の2つに分けて説明する。また、(2)関連特許のクラスに属する新規特許特徴ベクトルに対応する新規特許書類を決定する方法、(3)1以上の関連特許書類から、非関連特許書類を決定する方法についても、(1)と同様に2つに分けて説明する。なお、判断部106は、新規特許書類を3以上のクラスに分類しても良い。
(1)1以上の非関連特許書類から、関連特許書類を決定する方法
(A)特徴ベクトルの類似度を用いて判断
特徴ベクトルの類似度を用いて判断するとは、判断対象の非関連特許特徴ベクトルと、関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度(コサイン尺度)と、非関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度とを算出し、判断対象の非関連特許特徴ベクトルとのCOS尺度の大きい代表ベクトルの含まれるクラスに属すると判断することであっても良い。また、判断対象の非関連特許特徴ベクトルと、関連特許特徴ベクトルのクラスの1以上の各代表ベクトルとのCOS尺度を算出し、非関連特許特徴ベクトルといずれかの代表ベクトルとのCOS尺度が閾値より大きい場合に、判断部106は、当該非関連特許を関連特許であると判断しても良い。なお、COS尺度の算出方法は、公知技術であるため説明を省略する。なお、類似度の算出方法は、ピアソンの相関係数を用いても良く、偏差パターン類似度を用いても良い。ピアソンの相関係数、および偏差パターン類似度似ついては、公知技術であるため、説明を省略する。また、関連特許特徴ベクトルのクラスは1であっても良く、2以上で有っても良い。クラスを2以上作成する場合は、例えば、分割最適化クラスタリング(k−means法等)を用いて特徴ベクトルをクラスタリングしても良く、階層的クラスタリング(最短距離法等)を用いて特徴ベクトルをクラスタリングしても良く、その他の公知なクラスタリング手法を用いて特徴ベクトルをクラスタリングしても良い。なお、各クラスタリング法の詳細は公知技術であるため、説明を省略する。なお、非関連特許特徴ベクトルのクラスについても同様である。代表ベクトルとは、クラス内の最も頻出する特徴ベクトルであっても良く、クラスの平均ベクトルであっても良い。なお、平均ベクトルは、通常のベクトル平均であっても良く、すべてを単位ベクトルとして扱って算出する単位ベクトル平均であっても良い。非関連特許特徴ベクトルが関連特許特徴ベクトルとのクラスに属すると判断され場合に、その非関連特許特徴ベクトルの特許の書類を関連特許書類と決定する。
(B)機械学習を用いて判断
機械学習を用いて判断するとは、ニューラルネットワークやSVM(Support Vector Machine)やSVR(Support Vector Regression)等の学習器を用いて学習し、学習が完了した学習器に対して、判断対象の非関連特許特徴ベクトルを分類させて関連特許特徴ベクトルのクラスに属するか判断することである。ニューラルネットワークとは、脳機能におけるいくつかの特性を計算機上のシミュレーションによって表現することを目指した学習モデルである。ニューラルネットワークには、様々な種類のモデルや方法があるが、そのどれを採用しても良い。例えば、ニューラルネットワークの種類は、パーセプトロンを採用しても良く、バックプロパケーションを採用しても良く、ボルツマンマシン等を採用しても良い。ニューラルネットワークに関する各モデルの詳細は、公知技術であるため説明を省略する。SVMとは、教師データを用いて分類パターンを学習し、分類の境界線を設定し、分類を行う学習モデルである。SVMの詳細は、公知技術であるため説明を省略する。SVRとは、教師データを用いて分類パターンを学習し、3以上のクラスに分類する学習モデルである。SVRの詳細は、公知技術であるため説明を省略する。判断部106が機械学習を用いて判断する場合、関連特許書類格納部102と非関連特許書類格納部103に格納されている特許の書類の特徴ベクトルを教師データとして学習させる。判断部106が学習に使用する素性は、特徴ベクトル取得部105が取得した各用語に対応した値である。また、判断部106が学習に使用する素性には、特許分類が含まれていても良い。特許分類を素性に含める場合は、特許分類に対して、特許分類を一意に特定する数値情報を設定し、その値を用いて学習させる。学習が完了した後、例えば、非関連特許特徴ベクトルが関連特許特徴ベクトルと判断された場合に、判断部106は、その非関連特許特徴ベクトルの特許の書類を関連特許書類と決定する。
(2)関連特許のクラスに属する新規特許特徴ベクトルに対応する新規特許書類を決定する方法
(A)特徴ベクトルの類似度を用いて判断
特徴ベクトルの類似度を用いて判断するとは、判断対象の新規特許特徴ベクトルと、関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度と、非関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度とを算出し、判断対象の新規特許特徴ベクトルがCOS尺度の大きい代表ベクトルの含まれるクラスに属すると判断することである。
(B)機械学習を用いて判断
機械学習を用いて判断するとは、ニューラルネットワークやSVM等の学習器を用いて学習し、学習が完了した学習器に対して、判断対象の新規特許特徴ベクトルを分類させて、関連特許特徴ベクトル、もしくは非関連特許特徴ベクトルのどちらのクラスに属するかを判断することである。
(3)1以上の関連特許書類から、非関連特許書類を決定する方法
(A)特徴ベクトルの類似度を用いて判断
特徴ベクトルの類似度を用いて判断するとは、判断対象の関連特許特徴ベクトルと、関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度と、非関連特許特徴ベクトルのクラスの代表ベクトルとのCOS尺度とを算出し、判断対象の関連特許特徴ベクトルがCOS尺度の大きい代表ベクトルの含まれるクラスに属すると判断することである。
(B)機械学習を用いて判断
機械学習を用いて判断するとは、ニューラルネットワークやSVM等の学習器を用いて学習し、学習が完了した学習器に対して、判断対象の関連特許特徴ベクトルを分類させて非関連特許特徴ベクトルのクラスに属するか判断することである。
判断部106は、通常、MPUやメモリ等から実現され得る。判断部106の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部107は、判断部106が決定した関連特許書類を特定する情報を出力する。また、出力部107は、判断部106が決定した関連特許のクラスに属するべき新規特許書類を特定する情報を出力する。また、出力部107は、判断部106が決定した関連特許のクラスに属すべきではない関連特許書類を特定する情報を出力する。
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への格納、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。また、出力部107は、通常、ネットワーク100を通じてユーザ端末3へ判断結果を送信する。出力部107は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。これにより、本来関連特許であるが、誤って非関連特許と分類してしまった特許の書類を見つけることができ、また、未分類の特許書類から関連特許書類のみを取得することができる。
図3は、本実施の形態における特許調査支援装置1の動作の一例を示すフローチャートである。以下、図3を用いて動作について説明する。
(ステップS301)受付部101は、ユーザ端末3から1以上の関連特許書類が格納されたフォルダと、1以上の非関連特許書類が格納されたフォルダと、1以上の新規特許書類が格納されたフォルダとを受け付けたかどうかを判断する。そして、各フォルダを受け付けた場合は、ステップS302へ進み、受け付けなかった場合は、ステップS301を繰り返し実行する。
(ステップS302)受付部101は、受け付けた関連特許書類を関連特許書類格納部102に格納し、受け付けた非関連特許書類を非関連特許書類格納部103に格納し、受け付けた新規特許書類を新規特許書類格納部104に格納する。
(ステップS303)特徴ベクトル取得部105は、関連特許書類格納部102に格納されている関連特許書類から関連特許特徴ベクトルを取得する。特徴ベクトル取得部105の取得方法の詳細は、図4のフローチャートを用いて後述する。
(ステップS304)特徴ベクトル取得部105は、非関連特許書類格納部103に格納されている非関連特許書類から非関連特許特徴ベクトルを取得する。特徴ベクトル取得部105の取得方法の詳細は、図4のフローチャートを用いて後述する。
(ステップS305)特徴ベクトル取得部105は、新規特許書類格納部104に格納されている新規特許書類から新規特許特徴ベクトルを取得する。特徴ベクトル取得部105の取得方法の詳細は、図4のフローチャートを用いて後述する。
(ステップS306)判断部106は、すべての関連特許特徴ベクトルから平均ベクトルを算出する。なお、ベクトルの次元が異なる場合は、最も次元の多い関連特許特徴ベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS307)判断部106は、すべての非関連特許特徴ベクトルから平均ベクトルを算出する。なお、ベクトルの次元が異なる場合は、最も次元の多い非関連特許特徴ベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS308)判断部106は、カウンタmに1を代入する。
(ステップS309)判断部106は、m番目の非関連特許書類が非関連特許書類格納部103に格納されているかどうか判断する。m番目の非関連特許書類が非関連特許書類格納部103に格納されている場合は、ステップS310に進み、格納されていない場合は、ステップS312へ進む。
(ステップS310)判断部106は、m番目の非関連特許書類が関連特許であるかを判断する。判断部106の判断の詳細は、図5のフローチャートを用いて後述する。
(ステップS311)判断部106は、カウンタmを1だけインクリメントし、ステップS309に戻る。
(ステップS312)判断部106は、カウンタnに1を代入する。
(ステップS313)判断部106は、n番目の新規特許書類が新規特許書類格納部104に格納されているかどうか判断する。n番目の新規特許書類が新規特許書類格納部104に格納されている場合は、ステップS314に進み、格納されていない場合は、ステップS316へ進む。
(ステップS314)判断部106は、n番目の新規特許書類が関連特許であるかを判断する。判断部106の判断の詳細は、図5のフローチャートを用いて後述する。
(ステップS315)判断部106は、カウンタnを1だけインクリメントし、ステップS313に戻る。
(ステップS316)判断部106は、カウンタkに1を代入する。
(ステップS317)判断部106は、k番目の関連特許書類が関連特許書類格納部102に格納されているかどうか判断する。k番目の新規特許書類が関連特許書類格納部102に格納されている場合は、ステップS318に進み、格納されていない場合は、ステップS320へ進む。
(ステップS318)判断部106は、n番目の関連特許書類が非関連特許であるかを判断する。判断部106の判断の詳細は、図5のフローチャートを用いて後述する。
(ステップS319)判断部106は、カウンタkを1だけインクリメントし、ステップS317に戻る。
(ステップS320)出力部107は、判断部106が判断した結果を出力し、終了する。
なお、図3のフローチャートのステップS306において、判断部106は、すべての関連特許特徴ベクトルから平均ベクトルを算出した。しかし、判断部106は、すべての関連特許特徴ベクトルの距離の差が一定以内(COS尺度が閾値以上)の2以上のグループを構成し、グループごとに、関連特許特徴ベクトルの平均ベクトルを算出しても良い。
また、ステップS307において、判断部106は、すべての非関連特許特徴ベクトルから平均ベクトルを算出した。しかし、判断部106は、すべての非関連特許特徴ベクトルの距離の差が一定以内(COS尺度が閾値以上)の2以上のグループを構成し、グループごとに、非関連特許特徴ベクトルの平均ベクトルを算出しても良い。また、図3のフローチャートにおいて、非関連特許書類の特徴ベクトルは算出されなくても良い。
図4は、図3の特徴ベクトルの算出(ステップS302、S303、S304)の動作の一例を示すフローチャートである。以下、図4を用いて、特徴ベクトルの算出処理について説明する。なお、図4におけるXには、ステップS302から呼び出された場合は、関連特許書類が代入され、ステップS303から呼び出された場合は、非関連特許書類が代入され、ステップS304から呼び出された場合は、新規特許書類が代入されているものとする。以下は、Xに関連特許書類が代入されたステップS302から呼び出されたものとして説明する。ステップS303、およびステップS304については、それぞれ読み替えるものとする。
(ステップS401)特徴ベクトル取得部105は、カウンタpに1を代入する。
(ステップS402)特徴ベクトル取得部105は、p番目の関連特許書類が関連特許書類格納部102に格納されているかどうか判断する。p番目の関連特許書類が関連特許書類格納部102に格納されている場合は、ステップS403に進み、格納されていない場合は、上位の処理に戻る。
(ステップS403)特徴ベクトル取得部105は、p番目の関連特許書類から用語をすべて取得する。
(ステップS404)特徴ベクトル取得部105は、ステップS403で取得した用語を図示しない用語格納部に重複しないように追記する。なお、図示しない用語格納部は、処理が終了するまで用語を追記され続ける。
(ステップS405)特徴ベクトル取得部105は、ステップS403で取得した用語のTF−IDF値を算出する。なお、特徴ベクトル取得部105は、図示しない関連用語辞書を保持しており、かかる関連用語辞書に格納されている関連用語は同一の用語であると判断して、用語のTF−IDF値を算出しても良い。
(ステップS406)特徴ベクトル取得部105は、図示しない用語格納部に格納されている用語が格納されている順に用語のTF−IDF値を要素に持ったベクトルを作成する。なお、p番目の関連特許書類に記載されていない用語の要素は0とする。
(ステップS407)特徴ベクトル取得部105は、ステップS406で作成した特徴ベクトルを特許書類の種類と対応付けて図示しない特徴ベクトル格納部に格納する。特許書類の種類とは、関連特許であるか、非関連特許であるか、または新規特許であるかを示す情報である。
(ステップS408)特徴ベクトル取得部105は、カウンタpを1だけインクリメントし、ステップS402に戻る。
図5は、図3の判断(ステップS310、S314、S317)の動作の一例を示すフローチャートである。以下、図5を用いて、判断処理について説明する。なお、Yには、ステップS310から呼び出された場合は、m番目の非関連特許書類が代入され、ステップS314から呼び出された場合は、n番目の新規特許書類が代入され、ステップS317から呼び出された場合は、k番目の関連特許書類が代入されているものとする。また、Zには、ステップS310から呼び出された場合は、関連特許が代入され、ステップS314から呼び出された場合は、関連特許が代入され、ステップS317から呼び出された場合は、非関連特許が代入されているものとする。以下は、Yに非関連特許書類が代入され、Zに関連特許が代入されたステップS310から呼び出されたものとして説明する。ステップS314、およびステップS317については、それぞれ読み替えるものとする。
(ステップS501)判断部106は、関連特許の平均ベクトルとm番目の非関連特許書類の特徴ベクトルとのCOS尺度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS502)判断部106は、非関連特許の平均ベクトルとm番目の非関連特許書類の特徴ベクトルとのCOS尺度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS503)判断部106は、COS尺度が大きい平均ベクトルが、関連特許の平均ベクトルであるかどうか判断する。関連特許の平均ベクトルであった場合は、ステップS504へ進み、関連特許の平均ベクトルでなかった場合は、上位の処理に戻る。
(ステップS504)判断部106は、図示しない判断結果格納部にm番目の非関連特許書類は、関連特許の可能性があること特許書類IDと対応付けて格納する。
なお、判断部106が、すべての関連特許特徴ベクトルの距離の差が一定以内の2以上のグループを構成し、グループごとに、関連特許特徴ベクトルの平均ベクトルを算出している場合、図5のフローチャートにおいて、非関連特許の特許特徴ベクトルが、いずれかのグループの関連特許特徴ベクトルの平均ベクトルとのCOS尺度が閾値より大きければ、判断部106は、かかる非関連特許を関連特許と判断しても良い。また、かかる場合、図5のフローチャートにおいて、非関連特許の特許特徴ベクトルと、最もCOS尺度が大きい平均ベクトルが、いずれかのグループの関連特許特徴ベクトルの平均ベクトルである場合、判断部106は、かかる非関連特許を関連特許と判断しても良い。
また、判断部106が、すべての関連特許特徴ベクトルの距離の差が一定以内の2以上のグループを構成し、グループごとに、関連特許特徴ベクトルの平均ベクトルを算出している場合、図5のフローチャートにおいて、新規特許書類の特許特徴ベクトルと、いずれかのグループの関連特許特徴ベクトルの平均ベクトルとのCOS尺度が閾値より大きい場合、判断部106は、かかる新規特許書類を関連特許と判断しても良い。一方、新規特許書類の特許特徴ベクトルと、いずれのグループの関連特許特徴ベクトルの平均ベクトルとのCOS尺度が閾値より小さい場合、判断部106は、かかる新規特許書類を非関連特許と判断しても良い。
また、判断部106が、すべての関連特許特徴ベクトルの距離の差が一定以内の2以上のグループを構成し、グループごとに、関連特許特徴ベクトルの平均ベクトルを算出している場合、図5のフローチャートにおいて、関連特許の特許特徴ベクトルが、すべてのグループの関連特許特徴ベクトルの平均ベクトルとのCOS尺度が閾値より小さければ、判断部106は、かかる関連特許を非関連特許と判断しても良い。さらに、図5のフローチャートにおいて、非関連特許の特許特徴ベクトルを用いなくても良い。
以下、本実施の形態における特許調査支援装置1の具体的な動作について説明する。ユーザ端末3のユーザが、ポインティングデバイスやキーボード等を操作し、図6で示されるように、関連特許書類が格納されている関連特許フォルダと、非関連特許書類が格納されている非関連特許フォルダと、新規特許書類が格納されている新規特許書類フォルダとを選択した後、「実行」ボタンをクリックしたとする。すると、ネットワーク100を解して、受付部101が受け付ける。受付部101は、各フォルダのデータを受け付けると、関連特許フォルダ内の関連特許書類は、関連特許書類格納部102へ、非関連特許フォルダ内の非関連特許書類は、非関連特許書類格納部103へ、新規特許フォルダ内の新規特許書類は、新規特許書類格納部104へ格納する(ステップS301、S302)。本具体例において、各特許書類格納部に格納されている特許の書類は、図7で示されるものであるとする。図7(a)は、関連特許書類格納部102に格納されている関連特許書類を示し、図7(b)は、非関連特許書類格納部103に格納されている非関連特許書類を示し、図7(c)は、新規特許書類格納部104に格納されている新規特許書類を示す。図7の各テーブルは、特許書類IDと、発明の名称と、要約の文章と、特許請求の範囲の文章と、背景技術の文章等とを有するレコードを多数有している。なお、特許書類IDは、ここでは、公開番号である。また、特許書類は、ここではテーブルのレコードで示しているが、そのデータ構造は問わないことは言うまでもない。
特徴ベクトル取得部105は、関連特許書類格納部102に格納されている関連特許書類と、非関連特許書類格納部103に格納されている非関連特許書類と、新規特許書類格納部104に格納されている新規特許書類とから特徴ベクトルを作成する(ステップS303〜S305)。以下、かかる処理の詳細を説明する。
特徴ベクトル取得部105は、関連特許書類格納部102から1件目の関連特許書類である「特許書類ID:特開2011−AAAAAA」を取得する(ステップS401、S402)。特徴ベクトル取得部105は、取得した「特許書類ID:特開2011−AAAAAA」から、名詞の連続である「データ管理装置」、「表示部」、「検索キーワード」、「データ管理システム」、「電子機器」、「位置情報」、「現在位置」や「コンピュータ」等を用語として取得する。特徴ベクトル取得部105は、取得した用語を図示しない用語格納部に追記する(ステップS403、S404)。特徴ベクトル取得部105は、取得した用語ごとにTF−IDF値を「データ管理装置:0.0264」や「表示部:0.1628」等のように算出する(ステップS405)。そして、特徴ベクトル取得部105は、TF−IDF値を要素に持ったベクトルを作成し、図示しない特徴ベクトル格納部に格納する(ステップS406、S407)。そして、特徴ベクトル取得部105は、次の特許書類に処理を移す(ステップS408)。以下、特徴ベクトル取得部105は、同様に関連特許書類格納部102、非関連特許書類格納部103、および新規特許書類格納部104のすべての特許の書類に対して特徴ベクトルを作成する。特徴ベクトル取得部105が取得した各特許書類の特徴ベクトルは、図8で示されるものであるとする。図8のテーブルは、特許書類IDと、特許書類の種類と、図示しない用語格納部に格納された用語に対応するベクトルの要素とを有するレコードを多数有している。
判断部106は、関連特許の特徴ベクトルの平均ベクトルと非関連特許の特徴ベクトルの平均ベクトルを算出する(ステップS306、S307)。
判断部106は、1件目の非関連特許書類である「特許書類ID:特開2012−DDDDDD」の非関連特許特徴ベクトルを図示しない特徴ベクトル格納部から取得する(ステップS308、S309)。判断部106は、取得した非関連特許特徴ベクトルと関連特許特徴ベクトルの平均ベクトルとのCOS尺度、および非関連特許特徴ベクトルの平均ベクトルとのCOS尺度を算出する(ステップS501、S502)。「特許書類ID:特開2012−DDDDDD」の非関連特許特徴ベクトルは、関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかったとする。判断部106は、「特許書類ID:特開2012−DDDDDD」を図示しない判断結果格納部に関連特許の可能性があることを示す情報と対応付けて格納する(ステップS310、S503、S504)。なお、判断部106は、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、何も格納しない。そして、判断部106は、次の非関連特許特徴ベクトルに処理を移す(ステップS311)。以降、判断部106は、図示しない特徴ベクトル格納部に格納されている残りの非関連特許書類すべてに対しても同様に判断する。
判断部106は、1件目の新規特許書類である「特許書類ID:特開2012−GGGGGG」の新規特許特徴ベクトルを図示しない特徴ベクトル格納部から取得する(ステップS312、S313)。判断部106は、取得した新規特許特徴ベクトルと関連特許特徴ベクトルの平均ベクトルとのCOS尺度、および非関連特許特徴ベクトルの平均ベクトルとのCOS尺度を算出する。「特許書類ID:特開2012−GGGGGG」の新規特許特徴ベクトルは、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかったとする。判断部106は、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、何も格納せずに次の新規特許特徴ベクトルに処理を移す(ステップS315)。なお、判断部106は、関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、「特許書類ID」を図示しない判断結果格納部に関連特許の可能性があることを示す情報と対応付けて格納する(ステップS314)。以降、判断部106は、図示しない特徴ベクトル格納部に格納されている残りの新規特許書類すべてに対しても同様に判断する。
判断部106は、1件目の関連特許書類である「特許書類ID:特開2011−AAAAAA」の関連特許特徴ベクトルを図示しない特徴ベクトル格納部から取得する(ステップS316、S317)。判断部106は、取得した関連特許特徴ベクトルと関連特許特徴ベクトルの平均ベクトルとのCOS尺度、および非関連特許特徴ベクトルの平均ベクトルとのCOS尺度を算出する。「特許書類ID:特開2011−AAAAAA」の非関連特許特徴ベクトルは、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかったとする。判断部106は、「特許書類ID:特開2011−AAAAAA」を図示しない判断結果格納部に非関連特許の可能性があることを示す情報と対応付けて格納する(ステップS318)。なお、判断部106は、関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、何も格納しない。そして、判断部106は、次の関連特許特徴ベクトルに処理を移す(ステップS319)。以降、判断部106は、図示しない特徴ベクトル格納部に格納されている残りの非関連特許書類すべてに対しても同様に判断する。
出力部107は、図示しない判断結果格納部に「特許書類ID」が格納されたことを検知すると、「特許書類ID」と関連特許書類、または非関連特許書類の可能性があるかを示す情報とをネットワーク100を介してユーザ端末3に送信する(ステップS320)。ユーザ端末3では、「特開2012−DDDDDD」と「特開2005−FFFFFF」等とを非関連特許書類格納部103内にある関連特許の可能性がある特許書類として表示される。また、「特開2011−AAAAAA」等を関連特許書類格納部102内にある非関連特許の可能性がある特許書類として表示される。また、「特開2011−HHHHHH」等を新規特許書類格納部104内にある関連特許の可能性がある特許書類として表示される。ユーザ端末3では、図9で示されるように表示される。ユーザは、図9の表示を見ることにより、例えば、誤って非関連特許として分類してしまっていた特許書類を再度確認する。
以上、本実施の形態の特許調査支援装置1によれば、特許調査を行った際に誤って非関連特許書類として分類してしまった関連特許書類をチェックできるため、ヒューマンエラーによる調査漏れを回避することができる。また、特許調査を行った際に誤って関連特許書類と分類してしまった非関連特許書類をチェックできるため、作業時間を短縮できる。また、ある程度関連特許、非関連特許を分類していれば、未分類の新規特許書類が関連特許書類であるかを判断できるため、以降の特許調査にかかる作業時間を短縮できる。
なお、本実施の形態において、特許調査支援装置1が新規特許書類格納部104を備える場合について説明したが、特許調査支援装置1は、新規特許書類格納部104を備えていなくてもよい。新規特許書類格納部104を備えていない場合には、特許調査支援装置1は、新規特許書類に関する処理は、行わなくても良い。
また、本実施の形態において、特許調査支援装置1の判断部106は、関連特許書類格納部102に格納された特許の書類から非関連特許の可能性のある特許の書類であるかを判断する場合について説明したが、判断部106は、関連特許書類格納部102に格納された特許の書類から非関連特許の可能性のある特許の書類であるかを判断しなくても良い。関連特許書類格納部102に格納された特許の書類から非関連特許の可能性のある特許の書類であるかを判断しない場合は、非関連特許書類格納部103に格納された特許の書類から関連特許の可能性のある特許の書類であるかのみを判断しても良く、非関連特許書類格納部103に格納された特許の書類から関連特許の可能性のある特許の書類と、新規特許書類格納部104に格納された関連特許書類の可能性のある特許の書類であるかを判断しても良い。
また、本実施の形態において、特許調査支援装置1の判断部106が、非関連特許特徴ベクトルのクラスに判断対象の特徴ベクトルが属する場合に非関連特許であると判断したが、判断部106は、非関連特許特徴ベクトルのクラスを用いず、関連特許特徴ベクトルのクラスのみを用いて、非関連特許書類格納部103に格納された特許の書類から関連特許の可能性のある特許の書類であるかを判断しても良く、新規特許書類格納部104に格納された特許の書類から関連特許の可能性のある特許の書類であるかを判断しても良く、関連特許書類格納部102に格納された特許の書類から非関連特許の可能性のある特許の書類であるかを判断しても良い。非関連特許特徴ベクトルのクラスを用いない場合は、関連特許特徴ベクトルのクラスに属さない特徴ベクトルを非関連特許としても良い。なお、非関連特許特徴ベクトルのクラスを用いない場合には、機械学習を用いる方法は、使用できないため、関連特許特徴ベクトルの1または2以上のクラスの代表ベクトルとの類似度を用いて関連特許特徴ベクトルのクラスに属するか否かを判断する。クラスに属するか否かの判断は、例えば、代表ベクトルと判断対象の特徴ベクトルとの類似度が予め定めた閾値以上であるかどうかで判断しても良く、各クラスタリング手法を用いて、関連特許特徴ベクトルのクラスにクラスタリングされるか否かで判断しても良い。
また、本実施の形態における特許調査支援装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とにアクセス可能なコンピュータを、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得部、1以上の関連特許特徴ベクトル、および1以上の非関連特許特徴ベクトルを用いて、1以上の非関連特許書類から、関連特許書類を決定する判断部、判断部が決定した関連特許書類を特定する情報を出力する出力部として機能させるためのプログラムである。
(実施の形態2)
本実施の形態において、特許書類を関連特許と非関連特許とに人手で分類された結果を用いて、未分類の特許書類等から関連特許書類、または非関連特許書類である可能性のある特許の書類を判断し、その結果を出力する特許調査支援装置2について説明する。
図1は、本実施の形態における特許調査支援装置1を含むシステムの概念図であるが、特許調査支援装置1を特許調査支援装置2と読み替えることで、特許調査支援装置2を含むシステムの概念図とする。
図2は、本実施の形態における特許調査支援装置1のブロック図であるが、判断部106を判断部201、出力部107を出力部202と読み替えることで、特許調査支援装置2のブロック図とする。特許調査支援装置2は、受付部101、関連特許書類格納部102、非関連特許書類格納部103、新規特許書類格納部104、特徴ベクトル取得部105、判断部201、および出力部202を備える。受付部101、関連特許書類格納部102、非関連特許書類格納部103、新規特許書類格納部104、および特徴ベクトル取得部105は、実施の形態1と同様であるため、説明を省略する。
判断部201は、1または2以上の関連特許特徴ベクトルを用いて、新規特許書類の特許特徴ベクトルが関連特許のクラスに属するか否かを決定する。また、判断部201は、1または2以上の関連特許特徴ベクトル、および1または2以上の非関連特許特徴ベクトルを用いて、新規特許書類の特許特徴ベクトルが関連特許のクラスか、非関連特許のクラスかを決定する。特徴ベクトルを用いる方法、及びクラスの概念については、実施の形態1の判断部106と同様であるため、説明を省略する。判断部201は、新規特許書類が関連特許特徴ベクトルのクラス、または非関連特許特徴ベクトルのクラスに属するか否かを判断する。また、判断部201は、関連特許特徴ベクトルのクラスに属するか否かを判断しても良く、非関連特許特徴ベクトルのクラスに属するか否かを判断しても良い。なお、判断部201は、一方のクラスに属さない新規特許書類を他方のクラスに属すると判断し持てよい。判断部201の判断の方法は、判断部106と概ね同様であるが、判断部106では、判断結果の扱いが異なる。例えば、判断部106では、新規特許書類が、関連特許であるか否かを判断する場合に、関連特許ではないと判断すれば、その判断結果を利用しなかったが、ここでは、判断部201は、当該新規特許書類が示す特許を非関連特許であると判断する。判断部201は、通常、MPUやメモリ等から実現され得る。判断部201の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部202は、判断部201が決定したクラスを、新規特許書類ごとに出力する。出力部107は、通常、ネットワーク100を通じてユーザ端末3へ判断結果を送信する。出力部107は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。これにより、未分類の特許書類から関連特許書類、または非関連特許書類を分類して取得することができる。
図10は、本実施の形態における特許調査支援装置1の動作の一例を示すフローチャートである。以下、図10を用いて動作について説明する。なお、ステップS301〜S307については、実施の形態1と同様であるため、説明を省略する。
(ステップS601)判断部201は、カウンタnに1を代入する。
(ステップS602)判断部201は、n番目の新規特許書類が新規特許書類格納部104に格納されているかどうか判断する。n番目の新規特許書類が新規特許書類格納部104に格納されている場合は、ステップS603に進み、格納されていない場合は、ステップS607へ進む。
(ステップS603)判断部201は、関連特許の平均ベクトルとn番目の新規特許書類の特徴ベクトルとのCOS尺度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS604)判断部201は、非関連特許の平均ベクトルとn番目の新規特許書類の特徴ベクトルとのCOS尺度を算出する。なお、ベクトルの次元が異なる場合は、次元の多いベクトルに次元を統一する。統一の際に増えた次元の要素には、0を代入する。
(ステップS605)判断部201は、COS尺度が大きい方の平均ベクトルの特許書類の種類を、図示しない判断結果格納部にn番目の新規特許書類IDと対応付けて格納する。
(ステップS606)判断部201は、カウンタnを1だけインクリメントし、ステップS313に戻る。
(ステップS607)出力部202は、判断部201が判断した結果を出力し、終了する。
以下、本実施の形態における特許調査支援装置2の具体的な動作について説明する。なお、判断部201、および出力部202を除く動作については、実施の形態1と同様であるため、説明を省略し、図7の関連特許書類格納部102と非関連特許書類格納部103と新規特許書類格納部104とにデータが格納され、図8の各特許書類の特徴ベクトルが取得された状態とする。
判断部201は、1件目の新規特許書類である「特許書類ID:特開2012−GGGGGG」の新規特許特徴ベクトルを図示しない特徴ベクトル格納部から取得する(ステップS601、S602)。判断部106は、取得した新規特許特徴ベクトルと関連特許特徴ベクトルの平均ベクトルとのCOS尺度、および非関連特許特徴ベクトルの平均ベクトルとのCOS尺度を算出する(ステップS603、S604)。「特許書類ID:特開2012−GGGGGG」の新規特許特徴ベクトルは、非関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかったとする。判断部106は、「特許書類ID:特開2012−GGGGGG」を図示しない判断結果格納部に非関連特許の可能性があることを示す情報と対応付けて格納する。(ステップS605)。なお、判断部106は、関連特許特徴ベクトルの平均ベクトルとのCOS尺度の方が大きかった場合は、「特許書類ID:特開2012−GGGGGG」を図示しない判断結果格納部に関連特許の可能性があることを示す情報と対応付けて格納する。そして、判断部201は、次の新規特許特徴ベクトルに処理を移す(ステップS606)以降、判断部201は、図示しない特徴ベクトル格納部に格納されている残りの新規特許書類すべてに対しても同様に判断する。
出力部202は、図示しない判断結果格納部に「特許書類ID」が格納されたことを検知すると、「特許書類ID」と関連特許書類、または非関連特許書類であるかを示す情報とを出力する(ステップS607)。具体例では、「特開2011−HHHHHH」等を新規特許書類格納部104内にある関連特許の可能性がある特許書類とし、特開2012−GGGGGG」や「特開2005−IIIIII」等を新規特許書類格納部104内にある非関連特許書類として出力した。出力部202は、ネットワーク100を介して、ユーザ端末3に送信する。ユーザ端末3は、出力部202が送信した判断結果を受信すると、図11で示される表示を行う。ユーザは、図11の表示を見ることにより、特許書類を確認する。
以上、本実施の形態の特許調査支援装置2によれば、ある程度関連特許、非関連特許を分類していれば、未分類の新規特許書類が関連特許書類であるか、非関連特許書類であるかを判断できるため、特許調査を効率的に行うことができる。
また、本実施の形態における特許調査支援装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、1以上の関連特許書類および1以上の非関連特許書類を除いた関連特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部とにアクセス可能なコンピュータを、1以上の各関連特許書類から1以上の用語を取得し、1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、1以上の各非関連特許書類から1以上の用語を取得し、1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得し、かつ、1以上の各新規特許書類から1以上の用語を取得し、1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得する特徴ベクトル取得部、1以上の関連特許特徴ベクトル、および1以上の非関連特許特徴ベクトルを用いて、新規特許書類の特許特徴ベクトルが属するクラスが関連特許のクラスか、非関連特許のクラスかを決定する判断部、判断部が決定したクラスを、新規特許書類ごとに出力する出力部として機能させるためのプログラムである。
なお、上記各実施の形態において、特許調査支援装置1、2が受付部101を備える場合について説明したが、特許調査支援装置1、および2は、受付部101を備えていなくてもよい。受付部101を備えていない場合には、関連特許書類格納部102と非関連特許書類格納部103と新規特許書類格納部104とに予め特許書類が格納されている特許調査支援装置1、および2であっても良い。
また、上記各実施の形態において、特許調査支援装置1、2の受付部101が新規特許書類を受け付ける場合について説明したが、受付部101は、新規特許書類を受け付けなくても良い。受付部101が新規特許書類を受け付けない場合には、図示しない外部、または内部の3以上の特許書類を格納する特許書類格納部から、受付部101が受け付けた関連特許書類と、非関連特許書類を除いた特許書類を取得し、新規特許書類として新規特許書類格納部に格納しても良い。
また、上記各実施の形態では、サーバ・クライアントシステムである場合について説明したが、上記各装置はサーバ・クライアントシステムにおけるサーバ装置であっても良く、スタンドアロンの装置であっても良い。スタンドアロンの装置であった場合、受付部101は、キーボードやマウス、タッチパネル等の入力デバイスから入力された情報の受け付けても良い。出力部107、及び出力部202は、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字等のための出力を行っても良い。
また、上記各実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。
なお、上記各プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
図12は、上記各プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。
図12において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。
図13は、コンピュータシステム1100の内部構成を示す図である。図13において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを記憶するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを記憶するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。
コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に記憶されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に記憶されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
関連特許と非関連特許とを分類する時間を短縮し、一度非関連特許と分類された特許の書類に誤りがあれば、それが再考される機会を得ることができるため、例えば、特許調査支援装置等として有用である。
1、2 特許調査支援装置
101 受付部
102 関連特許書類格納部
103 非関連特許書類格納部
104 新規特許書類格納部
105 特徴ベクトル取得部
106、201 判断部
107、202 出力部

Claims (10)

  1. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、
    特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、
    前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得部と、
    前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断部と、
    前記判断部が決定した非関連特許書類を特定する情報を出力する出力部とを具備する特許調査支援装置。
  2. 前記判断部は、
    関連特許のクラスに属するべきか否かの判断対象の非関連特許書類のベクトルである判断対象非関連特許特徴ベクトルに対応する非関連特許書類を、前記1以上の関連特許特徴ベクトルおよび前記判断対象非関連特許特徴ベクトルを除く1以上の非関連特許特徴ベクトルを用いて決定する、請求項1記載の特許調査支援装置。
  3. 前記1以上の関連特許書類および前記1以上の非関連特許書類を除いた特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部をさらに具備し、
    前記特徴ベクトル取得部は、
    前記1以上の各新規特許書類から1以上の用語を取得し、当該1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得し、
    前記判断部は、
    前記1以上の関連特許特徴ベクトル、または前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき新規特許特徴ベクトルに対応する新規特許書類を決定し、
    前記出力部は、
    前記判断部が決定した関連特許のクラスに属するべき新規特許書類を特定する情報を出力する、請求項1または請求項2記載の特許調査支援装置。
  4. 前記判断部は、
    前記1以上の関連特許特徴ベクトル、または前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属すべきではない関連特許特徴ベクトルに対応する関連特許書類を決定し、
    前記出力部は、
    前記判断部が決定した関連特許のクラスに属すべきではない関連特許書類を特定する情報を出力する、請求項1から請求項3いずれか記載の特許調査支援装置。
  5. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、
    前記1以上の関連特許書類および前記1以上の非関連特許書類を除いた関連特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部と、
    前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各新規特許書類から1以上の用語を取得し、当該1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得する特徴ベクトル取得部と、
    前記1以上の関連特許特徴ベクトルを用いて、前記新規特許書類の特許特徴ベクトルが関連特許のクラスに属するかを決定する判断部と、
    前記判断部が関連特許のクラスに属すると決定した新規特許書類を特定する情報を出力する出力部とを具備する特許調査支援装置。
  6. 特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部をさらに具備し、
    前記特徴ベクトル取得部は、
    さらに、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得し、
    前記判断部は、
    前記1以上の関連特許特徴ベクトル、および前記1以上の非関連特許特徴ベクトルを用いて、前記新規特許書類の特許特徴ベクトルが関連特許のクラスに属するかを決定する、請求項5記載の特許調査支援装置。
  7. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、特徴ベクトル取得部と、判断部と、出力部とを用いて処理される特許調査支援方法であって、
    前記特徴ベクトル取得部が、前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得ステップと、
    前記判断部が、前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルとを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断部と、
    前記出力部が、前記判断ステップで決定した関連特許書類を特定する情報を出力する出力部とを具備する特許調査支援方法。
  8. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、前記1以上の関連特許書類および前記1以上の非関連特許書類を除いた関連特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部と、特徴ベクトル取得部と、判断部と、出力部とを用いて処理される特許調査支援方法であって、
    前記特徴ベクトル取得部が、前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各新規特許書類から1以上の用語を取得し、当該1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得する特徴ベクトル取得ステップと、
    前記判断部が、前記1以上の関連特許特徴ベクトルを用いて、前記新規特許書類の特許特徴ベクトルが関連特許のクラスに属するかを決定する判断ステップと、
    前記出力部が、前記判断ステップで関連特許のクラスに属すると決定した新規特許書類を特定する情報を出力する出力ステップとを具備する特許調査支援方法。
  9. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部とにアクセス可能なコンピュータを、
    前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各非関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各非関連特許書類のベクトルである非関連特許特徴ベクトルを、非関連特許書類ごとに取得する特徴ベクトル取得部、
    前記1以上の関連特許特徴ベクトルと前記1以上の非関連特許特徴ベクトルを用いて、関連特許のクラスに属するべき非関連特許特徴ベクトルに対応する非関連特許書類を決定する判断部、
    前記判断部が決定した非関連特許書類を特定する情報を出力する出力部として機能させるためのプログラム。
  10. 特許調査における選別作業の結果、関連すると判断された関連特許の書類である1以上の関連特許書類を格納し得る関連特許書類格納部と、特許調査における選別作業の結果、関連しないと判断された非関連特許の書類である1以上の非関連特許書類を格納し得る非関連特許書類格納部と、前記1以上の関連特許書類および前記1以上の非関連特許書類を除いた関連特許の書類である1以上の新規特許書類を格納し得る新規特許書類格納部とにアクセス可能なコンピュータを、
    前記1以上の各関連特許書類から1以上の用語を取得し、当該1以上の用語を用いて各関連特許書類のベクトルである関連特許特徴ベクトルを、関連特許書類ごとに取得し、かつ、前記1以上の各新規特許書類から1以上の用語を取得し、当該1以上の用語を用いて各新規特許書類のベクトルである新規特許特徴ベクトルを、新規特許書類ごとに取得する特徴ベクトル取得部、
    前記1以上の関連特許特徴ベクトルを用いて、前記新規特許書類の特許特徴ベクトルが属するべきクラスが関連特許のクラスに属するかを決定する判断部、
    前記判断部が関連特許のクラスに属すると決定した新規特許書類を特定する情報を出力する出力部として機能させるためのプログラム。
JP2012096778A 2012-04-20 2012-04-20 特許調査支援装置、特許調査支援方法、およびプログラム Expired - Fee Related JP5971794B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012096778A JP5971794B2 (ja) 2012-04-20 2012-04-20 特許調査支援装置、特許調査支援方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012096778A JP5971794B2 (ja) 2012-04-20 2012-04-20 特許調査支援装置、特許調査支援方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2013225207A true JP2013225207A (ja) 2013-10-31
JP5971794B2 JP5971794B2 (ja) 2016-08-17

Family

ID=49595225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012096778A Expired - Fee Related JP5971794B2 (ja) 2012-04-20 2012-04-20 特許調査支援装置、特許調査支援方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5971794B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844478A (zh) * 2017-11-20 2018-03-27 山东浪潮云服务信息科技有限公司 一种专利文件的处理方法及装置
WO2019102533A1 (ja) * 2017-11-22 2019-05-31 花王株式会社 文献分類装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087854A1 (ja) * 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム
JP2008084064A (ja) * 2006-09-28 2008-04-10 National Institute Of Advanced Industrial & Technology テキスト分類処理方法、テキスト分類処理装置ならびにテキスト分類処理プログラム
JP2009163303A (ja) * 2007-12-28 2009-07-23 Mitsubishi Electric Corp 検索フィルタリング装置及び検索フィルタリングプログラム
JP2010118050A (ja) * 2008-10-17 2010-05-27 Toyohashi Univ Of Technology 特許文献自動検索システムおよび特許文献自動検索方法
JP2010128530A (ja) * 2008-11-25 2010-06-10 Asahi Kasei Corp 文書分類評価装置、文書分類評価方法およびプログラム
US20120143801A1 (en) * 2009-08-11 2012-06-07 Nec Corporation Information classification device, information classification method, and computer readable recording medium

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087854A1 (ja) * 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム
JP2008084064A (ja) * 2006-09-28 2008-04-10 National Institute Of Advanced Industrial & Technology テキスト分類処理方法、テキスト分類処理装置ならびにテキスト分類処理プログラム
JP2009163303A (ja) * 2007-12-28 2009-07-23 Mitsubishi Electric Corp 検索フィルタリング装置及び検索フィルタリングプログラム
JP2010118050A (ja) * 2008-10-17 2010-05-27 Toyohashi Univ Of Technology 特許文献自動検索システムおよび特許文献自動検索方法
JP2010128530A (ja) * 2008-11-25 2010-06-10 Asahi Kasei Corp 文書分類評価装置、文書分類評価方法およびプログラム
US20120143801A1 (en) * 2009-08-11 2012-06-07 Nec Corporation Information classification device, information classification method, and computer readable recording medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844478A (zh) * 2017-11-20 2018-03-27 山东浪潮云服务信息科技有限公司 一种专利文件的处理方法及装置
CN107844478B (zh) * 2017-11-20 2020-12-04 浪潮卓数大数据产业发展有限公司 一种专利文件的处理方法及装置
WO2019102533A1 (ja) * 2017-11-22 2019-05-31 花王株式会社 文献分類装置
JPWO2019102533A1 (ja) * 2017-11-22 2020-02-27 花王株式会社 文献分類装置
CN111373392A (zh) * 2017-11-22 2020-07-03 花王株式会社 文献分类装置
US10984344B2 (en) 2017-11-22 2021-04-20 Kao Corporation Document classifying device

Also Published As

Publication number Publication date
JP5971794B2 (ja) 2016-08-17

Similar Documents

Publication Publication Date Title
US11288444B2 (en) Optimization techniques for artificial intelligence
JP6053131B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US10558754B2 (en) Method and system for automating training of named entity recognition in natural language processing
KR102589649B1 (ko) 모니터링 시스템에서 발생하는 경보에 대한 기계 학습식 결정 안내 기법
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
JP2015225669A (ja) 注釈表示支援装置及び注釈表示支援方法
CN112384909A (zh) 利用无监督学习来改进文本到内容建议的方法和系统
KR101638535B1 (ko) 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN110737689A (zh) 数据标准符合性检测方法、装置、系统及存储介质
CN111435406A (zh) 一种纠正数据库语句拼写错误的方法和装置
CN113326363B (zh) 搜索方法及装置、预测模型训练方法及装置、电子设备
WO2022245469A1 (en) Rule-based machine learning classifier creation and tracking platform for feedback text analysis
JP5971794B2 (ja) 特許調査支援装置、特許調査支援方法、およびプログラム
US10698971B2 (en) Method and apparatus for storing access log based on keyword
WO2021154429A1 (en) Siamese neural networks for flagging training data in text-based machine learning
CN111460257A (zh) 专题生成方法、装置、电子设备和存储介质
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
JP5912813B2 (ja) 特許調査結果評価装置、特許調査結果評価方法、およびプログラム
WO2020193391A1 (en) An apparatus and method for performing image-based dish recognition
JP2010198498A (ja) 情報処理装置及び情報処理方法及びプログラム
CN109597873A (zh) 语料数据的处理方法、装置、计算机可读介质及电子设备
EP3432154A1 (en) Method and apparatus for providing search recommendation information
CN112400165B (zh) 利用无监督学习来改进文本到内容建议的方法和系统
US11790014B2 (en) System and method of determining content similarity by comparing semantic entity attributes

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160708

R150 Certificate of patent or registration of utility model

Ref document number: 5971794

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees