JP2007148630A - Patent analyzing device, patent analyzing system, patent analyzing method and program - Google Patents
Patent analyzing device, patent analyzing system, patent analyzing method and program Download PDFInfo
- Publication number
- JP2007148630A JP2007148630A JP2005340266A JP2005340266A JP2007148630A JP 2007148630 A JP2007148630 A JP 2007148630A JP 2005340266 A JP2005340266 A JP 2005340266A JP 2005340266 A JP2005340266 A JP 2005340266A JP 2007148630 A JP2007148630 A JP 2007148630A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- word
- classification
- phrase
- patent document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、特許分析装置、特許分析システム、特許分析方法およびプログラムに関し、特には、特許文献の要旨を表す語句を決定する特許分析装置、特許分析システム、特許分析方法およびプログラムに関する。 The present invention relates to a patent analysis device, a patent analysis system, a patent analysis method, and a program, and more particularly, to a patent analysis device, a patent analysis system, a patent analysis method, and a program for determining a phrase that represents the gist of a patent document.
従来の特許分析プログラムおよび装置の一例が、特許文献1(特開2004−152243号公報)に記載されている。 An example of a conventional patent analysis program and apparatus is described in Patent Document 1 (Japanese Patent Laid-Open No. 2004-152243).
特許文献1に記載の特許分析プログラムおよび装置は、特許明細書等の特許情報を分析して特許情報からキーワードを抽出し、そのキーワードに基づいて特許マップを作成する。具体的には、この装置は、ユーザにて指定されたキーワードを含む特許情報の件数を示す特許マップを作成する。 The patent analysis program and apparatus described in Patent Document 1 analyze patent information such as a patent specification, extract keywords from the patent information, and create a patent map based on the keywords. Specifically, this device creates a patent map indicating the number of patent information including a keyword designated by the user.
また、特許文献2(特開2002−175331号公報)には、特許文献に付与された特許分類を抽出し、その特許分類のタイトルを表示する特許分類表示装置が記載されている。
特許文献1に記載の装置は、キーワードを含む特許情報の件数を示す特許マップを作成するため、特殊なキーワードが明細書に記載された場合、その特許情報を抽出できない可能性を有する。つまり、特許文献1に記載の装置では、他の特許情報との比較を容易にする語句、すなわち、特許情報の要旨を表す語句を高精度で抽出できない。そのため、その作成された特許マップの信頼性が乏しくなる。 Since the apparatus described in Patent Document 1 creates a patent map indicating the number of patent information including a keyword, there is a possibility that the patent information cannot be extracted when a special keyword is described in the specification. In other words, the device described in Patent Document 1 cannot extract a word or phrase that facilitates comparison with other patent information, that is, a word or phrase representing the gist of the patent information, with high accuracy. Therefore, the reliability of the created patent map becomes poor.
また、従来、この種の特許分析プログラムおよび装置は、言語処理技術を用いて、公開特許公報の要旨を示す語句を抽出している。しかしながら、公開特許公報などの特許文献では、文書が独特であるため、通常の言語処理技術では、必ずしも利用者が期待するような語句が抽出されなかった。 Conventionally, this kind of patent analysis program and apparatus extract a word indicating the gist of the published patent gazette using language processing technology. However, in patent documents such as published patent gazettes, since documents are unique, words and phrases expected by the user are not necessarily extracted by a normal language processing technique.
また、特許文献2に記載の特許分類表示装置では、特許文献に付与された特許分類のタイトルが表示されるが、公開特許公報の要旨を表す語句を高精度で抽出できない。
In addition, in the patent classification display device described in
本発明の目的は、特許文献の要旨をより正確に表す語句をユーザに提供することが可能な特許分析装置、特許分析システム、特許分析方法およびプログラムを提供することである。 An object of the present invention is to provide a patent analysis device, a patent analysis system, a patent analysis method, and a program capable of providing a user with a phrase that more accurately expresses the gist of the patent document.
上記目的を達成するために、本発明の特許分析装置は、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置であって、分析用特許文献を特定するための入力情報を受け付ける入力部と、前記入力部が受け付けた入力情報にて特定される分析用特許文献を前記公報データベース装置から取得し、該分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手し、該分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する制御部と、前記制御部が決定した語句を表示する表示部とを含む。 In order to achieve the above object, a patent analysis apparatus of the present invention includes a gazette database apparatus that stores patent documents including documents and patent classifications, and a classification database apparatus that stores explanatory text of the patent classification for each patent classification. , A patent analysis device that analyzes the patent document acquired from the publication database device using the classification database device, and an input unit that receives input information for specifying the patent document for analysis; The patent document for analysis specified by the input information received by the input unit is acquired from the publication database device, the explanation of the patent classification included in the patent document for analysis is acquired from the classification database device, and the analysis A control unit for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document and a description of the patent classification; And a display unit for displaying a phrase control unit has determined.
また、本発明の特許分析方法は、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置が行う特許分析方法であって、分析用特許文献を特定するための入力情報を受け付ける入力ステップと、前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得ステップと、前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手ステップと、前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定ステップと、前記決定された語句を表示する表示ステップとを含む。 The patent analysis method of the present invention is connected to a publication database device that stores patent documents including documents and patent classifications, and a classification database device that stores a description of the patent classification for each patent classification, A patent analysis method performed by a patent analysis device that analyzes patent documents acquired from a gazette database device using the classification database device, an input step for receiving input information for specifying a patent document for analysis, and the input An acquisition step for acquiring an analysis patent document specified by information from the publication database device, an acquisition step for acquiring an explanation of a patent classification included in the analysis patent document from the classification database device, and the analysis A word representing the gist of the patent document for analysis based on the document included in the patent document and the explanation of the patent classification Comprising a determining step of determining, and a display step of displaying the determined words.
また、本発明の特許分析システムは、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、上記特許分析装置とを含む。 The patent analysis system of the present invention includes a publication database device that stores patent documents including documents and patent classifications, a classification database device that stores a description of the patent classification for each patent classification, and the patent analysis device described above. including.
上記発明によれば、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書と、分析用特許文献に含まれる特許分類の説明文と、に基づいて決定される。特許分類は、特許文献の特徴を示し、その説明文は、一般的な語句で作成されている。 According to the above invention, the phrase representing the gist of the analysis patent document is determined based on the document included in the analysis patent document and the description of the patent classification included in the analysis patent document. The patent classification indicates the characteristics of the patent document, and the explanation is made up of common words and phrases.
このため、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書のみに基づいて決定される場合に比べて、その決定された語句が、分析用特許文献の要旨をより正確に表すようにすることが可能になる。 For this reason, compared with the case where the word or phrase representing the gist of the analytical patent document is determined based only on the document included in the analytical patent document, the decided word or phrase is more accurate than the gist of the analytical patent document. Can be expressed as
また、例えば、その特許文献の要旨が、特許マップを作成するためのデータとして用いられれば、精度の高い特許マップを作成することが可能になる。 For example, if the gist of the patent document is used as data for creating a patent map, a highly accurate patent map can be created.
なお、前記制御部は、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定することが望ましい。 The control unit extracts a word / phrase related to a problem and a word / phrase related to a problem solving method from a document included in the patent document for analysis, extracts a word / phrase from the explanatory text of the patent classification, and relates to the problem It is desirable to determine a phrase representing the gist of the patent document for analysis based on the phrase, the phrase related to the problem solving technique, and the phrase extracted from the explanatory text of the patent classification.
上記発明によれば、課題に関する語句と、課題の解決手法に関する語句が、分析用特許文献の要旨を示しているか否かを、特許分類の説明文を利用して精査することが可能になる。よって、分析用特許文献の要旨を示す語句を高精度で決定することが可能になる。 According to the above-described invention, it is possible to examine carefully whether or not the phrase related to the problem and the phrase related to the technique for solving the problem indicate the gist of the patent document for analysis, using the explanatory text of the patent classification. Therefore, it is possible to determine with high accuracy a word indicating the gist of the patent document for analysis.
また、前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなることが望ましい。 Further, the phrase related to the problem is composed of a problem word indicating the problem and a problem category indicating the category of the problem, and the word / phrase regarding the problem solving technique is a solution word indicating the solution technique, and It is desirable to consist of a solution category indicating a category.
また、前記制御部は、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定することが望ましい。 In addition, when the phrase extracted from the document included in the analysis patent document matches the phrase extracted from the explanatory text of the patent classification, the control unit extracts the gist of the analysis patent document. It is desirable to determine that it is an important word to represent.
上記発明によれば、特許文献から抽出された語句の中で、特許文献の特徴を示す可能性の高い語句を、重要語句にすることが可能となる。 According to the above invention, it is possible to make a word / phrase having a high possibility of showing the characteristics of the patent document among the words / phrases extracted from the patent document as an important word / phrase.
また、前記制御部は、語句ごとに類義語を記憶してある類義語辞書を有し、前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定することが望ましい。 In addition, the control unit has a synonym dictionary storing synonyms for each phrase, and synonyms of phrases extracted from documents included in the patent document for analysis are extracted from the explanatory text of the patent classification It is desirable to determine that the synonym is an important word representing the gist of the analytical patent document when it matches the word.
特許分類の説明文は、一般的な語句で作成されている。このため、上記発明によれば、特許文献の特徴を示す可能性の高い語句が、一般的な語句に置き換えられ、その一般的な語句を重要語句にすることが可能になる。よって、特許文献の要旨を表す語句を、特殊な語でなく、一般的な語句にすることが可能になる。 The description of the patent classification is made up of common words and phrases. For this reason, according to the said invention, the phrase with high possibility of showing the characteristic of a patent document is substituted by a general word, and it becomes possible to make the general word a key word. Therefore, it is possible to make a word representing the gist of the patent document not a special word but a general word.
また、前記入力部は、前記表示部に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を、さらに受け付け、前記制御部は、前記入力部が受け付けた修正指示に基づいて、前記表示部に表示された前記語句を修正することが望ましい。 Further, the input unit further receives a correction instruction for correcting a word representing the gist of the analytical patent document displayed on the display unit, and the control unit is based on the correction instruction received by the input unit. It is desirable to correct the word displayed on the display unit.
上記発明によれば、表示部に表示された特許文献の要旨を表す語句が、ほとんど一般的な語句になるため、分析者は、その語句が妥当か否かを容易に理解でき、分析者は、その語句を修正する作業を効率的に行える。 According to the above invention, since the word representing the gist of the patent document displayed on the display unit is almost a general word, the analyst can easily understand whether or not the word is valid. , You can efficiently correct the phrase.
また、本発明のプログラムは、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続されたコンピュータに、特許分析処理を実行させるプログラムであって、分析用特許文献を特定するための入力情報を受け付ける入力処理と、前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得処理と、前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手処理と、前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定処理と、を含む特許分析処理を、前記コンピュータに実行させる。 Further, the program of the present invention is a computer connected to a publication database device that stores patent documents including documents and patent classifications, and a classification database device that stores a description of the patent classification for each patent classification. A program for executing a patent analysis process, an input process for receiving input information for specifying a patent document for analysis, and an acquisition process for acquiring the patent document for analysis specified by the input information from the publication database device Based on the acquisition process for obtaining the description of the patent classification included in the patent document for analysis from the classification database device, the document included in the patent document for analysis, and the description of the patent classification, The computer is caused to execute a patent analysis process including a determination process for determining a word representing the gist of the patent document for analysis.
上記発明によれば、上記特許分析方法をコンピュータに実行させることが可能になる。 According to the said invention, it becomes possible to make a computer perform the said patent-analysis method.
本発明によれば、特許文献の要旨をより正確に表す語句をユーザに提供することが可能になる。 ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to provide a user with the phrase which represents the summary of a patent document more correctly.
以下、本発明の実施例を、図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明の一実施例の特許分析システムを示したブロック図である。 FIG. 1 is a block diagram showing a patent analysis system according to an embodiment of the present invention.
図1において、本特許分析システムは、特許公開公報データベース装置(以下「公報DB装置」と称する。)1と、特許分類コードデータベース装置(以下「分類DB装置」と称する。)2と、特許分析装置3とを含む。特許分析装置3は、少なくとも、入力装置(入力部)31と、データ処理のための主装置(制御部)32と、表示装置(表示部)33と、記憶装置34とを含む。
1, the patent analysis system includes a patent publication gazette database device (hereinafter referred to as “gazette DB device”) 1, a patent classification code database device (hereinafter referred to as “classification DB device”) 2, and a patent analysis.
公報DB装置1と、分類DB装置2と、特許分析装置3とは、LAN等のネットワーク4を介して相互に接続されている。
The publication DB device 1, the
公報DB装置1は、電子化された公開特許公報を格納する。公報DB装置1は、特許検索システムなどによって絞り込まれた公開特許公報も格納している。なお、公開特許公報は、特許文献の一例である。 The publication DB device 1 stores an electronic published patent publication. The publication DB device 1 also stores a published patent publication narrowed down by a patent search system or the like. An open patent gazette is an example of a patent document.
公開特許公報は、書誌事項、特許請求の範囲、明細書、図面および要約書を含む。書誌事項は、少なくとも、IPC、FIおよびFターム等の特許分類を含む。特許請求の範囲、明細書および要約書は、文書である。 The published patent publication includes bibliographic items, claims, specifications, drawings and abstracts. Bibliographic items include at least patent classifications such as IPC, FI and F-term. The claims, the description and the abstract are documents.
分類DB装置2は、IPC、FIおよびFターム等の特許分類ごとに、特許分類の説明文を格納する。なお、この説明文は、技術分類名称を含む。
The
特許分析装置3は、パーソナルコンピュータ(PC)または他の情報処理装置であり、分析者によって使用される。特許分析装置3は、プログラムを実行することによって種々の動作を実行する。
The
入力装置31は、キーボードまたはマウスであり、分析者から、分析用公開特許公報を特定するための入力情報(例えば、公開番号)を受け付ける。
The
主装置32は、例えば、CPU等のコンピュータであり、メモリ(不図示)に格納されたプログラムを実行して以下のような動作を行う。
The
主装置32は、入力装置31が受け付けた入力情報にしたがって、分析用公開特許公報を公報DB装置1から取得し、その後、分析用公開特許公報に含まれる特許分類の説明文を、分類DB装置2から入手する。主装置32は、分析用公開特許公報に含まれる文書と、特許分類の説明文と、に基づいて、分析用公開特許公報の要旨を表す語句を決定する。
The
具体的には、主装置32は、分析用公開特許公報を取得すると、その分析用公開特許公報に含まれる文書を言語分析処理して、公開特許公報ごとに、課題に関する語句(仮の課題語と、仮の課題カテゴリ)と、課題の解決手法に関する語句(仮の解決語と、仮の解決カテゴリ)を抽出する。
Specifically, when the
さらに、主装置32は、公開特許公報ごとに、その公報の特許分類の説明文を、分類DB装置2から入手し、公開特許公報ごとに、課題に関する語句と課題の解決手法に関する語句との妥当性を、特許分類の説明文を用いて検証し、精査して、分析用公開特許公報の要旨を表す語句(課題語、課題カテゴリ、解決語および解決カテゴリ)を決定する。
Further, the
なお、主装置32は、語句ごとに類義語を記憶してある類義語辞書を有する。
The
表示装置33は、主装置32が決定した語句(課題語、課題カテゴリ、解決語および解決カテゴリ)を表示する。
The
次に、動作を説明する。 Next, the operation will be described.
図2は、本特許分析システムの動作を説明するためのフローチャートである。以下、図2を参照して本特許分析システムの動作を説明する。 FIG. 2 is a flowchart for explaining the operation of the patent analysis system. The operation of this patent analysis system will be described below with reference to FIG.
分析者が、分析用特許公報を特定するための入力情報を、入力装置31に入力すると、主装置32は、ステップA1を実行する。
When the analyst inputs input information for specifying an analysis patent gazette to the
ステップA1では、主装置32は、公報DB装置1にアクセスし、その入力情報にしたがって、分析用公開特許公報を抽出する。公報DB装置1は、分析用公開特許公報が抽出されると、ステップA2を実行する。
In step A1, the
ステップA2では、公報DB装置1は、分析用公開特許公報を、特許分析装置3に送信する。特許分析装置3の主装置32は、分析用公開特許公報を受け付けると、ステップA3を実行する。
In step A <b> 2, the publication DB device 1 transmits the analysis open patent publication to the
ステップA3では、主装置32は、分析用公開特許公報の文書から、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを抽出する。なお、主装置32は、複数の分析用公開特許公報を受け付けたときには、分析用公開特許公報ごとに、それらを抽出する。
In step A3, the
主装置32は、形態素解析等を用いた構文解析処理と、抽出ルールに基づいた抽出処理と、後処理との3ステップにより、仮の課題語と、仮の解決語を抽出する。
The
構文解析処理では、主装置32は、分析用公開特許公報に含まれる要約書の文書を、主語、述語、目的語および修飾語に分解する。
In the parsing process, the
その後、主装置32は、仮の課題語候補として、要約書の課題の欄から「(目的語)の(修飾語)」(例えば「処理速度の高速化」)を抜き出す。
After that, the
また、主装置32は、仮の解決語として、要約書の解決手段の欄から「(主語)or(目的語)+(述語)」(例えば「端子が接続されている」)を抜き出す。
In addition, the
抽出処理では、主装置32は、課題語抽出ルールに基づいて、仮の課題語候補の中から仮の課題語を抽出する。なお、課題語抽出ルールは、例えば、仮の課題語候補の後ろに「を目的とした」または「のために」が付いていれば、仮の課題語候補を仮の課題語として抽出する、というルールである。
In the extraction process, the
後処理では、主装置32は、抜き出された仮の課題語および仮の解決語が長すぎる場合、その仮の語から、自動的に200バイト以内かつ区切りの良いところ(句読点)を切り出す。
In the post-processing, if the extracted temporary task word and temporary solution word are too long, the
また、主装置32は、形態素解析等を用いた構文解析処理と、カテゴリ抽出ルールに基づいた抽出処理により、仮の課題カテゴリと、仮の解決カテゴリを抽出する。
Further, the
構文解析処理では、主装置32は、分析用公開特許公報に含まれる要約書の文書を、単語に分解する。
In the parsing process, the
抽出処理では、主装置32は、要約書の課題の欄に含まれる各単語について、その出現数をカウントし、そのカウント数が上位のもの(例えば上位3つ)を、仮の課題カテゴリとして抽出する。また、主装置32は、要約書の解決手段の欄に含まれる各単語について、その出現数をカウントし、そのカウント数が上位のもの(例えば上位3つ)を、仮の解決カテゴリとして抽出する。
In the extraction process, the
主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを抽出すると、ステップA4を実行する。
When the
ステップA4では、主装置32は、分析用公開特許公報ごとに、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを、一時的に記憶装置34に格納し、その後、ステップA5を実行する。
In step A4, the
ステップA5では、主装置32は、分析用公開特許公報ごとに、IPC、FIおよびFタームなどの特許分類を抽出し、その抽出された特許分類に基づいて分類DB装置2にアクセスする。分類DB装置2は、特許分類を受け付けると、ステップA6を実行する。
In step A5, the
ステップA6では、分類DB装置2は、その特許分類に対応する説明文を、特許分析装置3に送信する。特許分析装置3の主装置32は、特許分類の説明文を受け付けると、ステップA7を実行する。
In step A <b> 6, the
ステップA7では、主装置32は、分類DB装置2から取得した特許分類の説明文から語句を抽出する。例えば、主装置32は、特許分類の説明文を形態素解析して語句を抽出する。なお、複数の分析用公開特許公報が存在するときには、主装置32は、分析用公開特許公報ごとに、特許分類の説明文から語句を抽出する。
In step A <b> 7, the
主装置32は、特許分類の説明文から語句を抽出すると、ステップA8を実行する。
When the
ステップA8では、主装置32は、分析用の公開特許公報ごとに、特許分類の説明文から抽出された語を利用して、記憶装置34に格納されている仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを精査し、分析用公開特許公報の要旨を表す語句(課題語、解決語、課題カテゴリおよび解決カテゴリ)を決定する。
In step A8, the
具体的には、主装置32は、以下のように、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを精査する。
Specifically, the
(1)主装置32は、言語処理技術にて公開特許公報から抽出された語句(仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリ)の中で、その語句が、その公開特許公報に含まれる特許分類の説明文から抽出された語句と一致すると、その語句を重要語(課題語、解決語、課題カテゴリまたは解決カテゴリ)とみなす。
(1) The
また、主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの中で、その語句の類義語が、その語句が抽出された公開特許公報に含まれる特許分類の説明文から抽出された語句と一致すると、その仮の語句にかえて、その類義語を、重要語(課題語、解決語、課題カテゴリまたは解決カテゴリ)とみなす。
In addition, the
なお、主装置32は、類義語辞書(シソーラス辞書)を用いて、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの類義語を選ぶ。
The
(2)主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの中で、それらの語句が抽出された公開特許公報に含まれる特許分類の説明文に含まれている語句と一致しない、または、類似しないものを削除する。
(2) The
(3)主装置32は、仮の課題語の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「課題または目的」(例えば、5B035AA)に含まれる語句と一致または類似するものがあれば、その語句を、課題語として重要と重みづけする。
(3) The
(4)主装置32は、構成に関する語句を、各公報の請求項1および独立項から言語処理技術を用いて抽出している場合、その構成に関する語句の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「構成」(例えば、5B035BA)に含まれる語句と一致または類似するものがあれば、その語句を、構成に関する語句として重要と重みづけする。
(4) When the
(5)主装置32は、仮の解決語の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「〜手段(なお、方法、〜方法という観点があれば「手段」とみなす。)」(例えば、4B021MP)に含まれる語句と一致または類似するものがあれば、その語句を、解決語として重要と重みづけする。
(5) The
なお、重み付けに関しては、主装置32は、語句の出現回数を考慮してもよい。例えば、主装置32は、出現回数が多い語句ほど重要であるとみなす。
In addition, regarding the weighting, the
また、主装置32は、公報から抽出された語句またはその類似語が、特許分類の上位(上位概念)の説明文に存在するか否かに基づいて、その語句の重みづけを行ってもよい。例えば、主装置32は、公報から抽出された語句が、特許分類の上位(上位概念)の説明文に存在すると、その語句を重要語とみなす。
Further, the
主装置32は、課題語、解決語、課題カテゴリおよび解決カテゴリを決定すると、ステップA9を実行する。
When determining the task word, the solution word, the task category, and the solution category, the
ステップA9では、主装置32は、精査された課題語、解決語、課題カテゴリおよび解決カテゴリを表示装置33に表示する。その後、分析者が、入力装置11を操作して、精査された課題語、解決語、課題カテゴリ、解決カテゴリを修正すると、主装置32は、ステップA10を実行する。ステップA10では、主装置32は、その修正された課題語、解決語、課題カテゴリおよび解決カテゴリを最終結果として表示装置33に表示する。
In step A <b> 9, the
このように、抽出された語句が、意味的に近いか遠いかを分析者が簡単に判断できるように、いきなり最終結果のみを表示するのではなく、公報から抽出した語句が、特許分類を活用して代表語に置き換えられ、利用者が理解しやすい「課題語、解決語、課題カテゴリおよび解決カテゴリ」が最終結果前に表示される。 In this way, the words extracted from the gazette use the patent classification instead of displaying only the final result suddenly so that the analyst can easily determine whether the extracted words are semantically close or far. Thus, the “problem word, solution word, problem category, and solution category” that are easy to understand for the user are displayed before the final result.
本実施例によれば、以下の効果を奏する。 According to the present embodiment, the following effects can be obtained.
第1の効果は、自動的に抽出される課題語、解決語、カテゴリが、より利用者の期待する語に近づくことにある。 The first effect is that the automatically extracted task words, solution words, and categories are closer to the words expected by the user.
その理由は、特許分析装置3が、言語処理技術によって自動的に公開特許公報から抽出された語句を、特許分類の説明文を利用して精査するからである。
The reason is that the
第2の効果は、分析者が語句を修正する作業を効率化できることにある。 The second effect is that it is possible for the analyst to improve the work of correcting the phrase.
その理由は、特許分析装置3が、言語処理技術によって自動的に抽出された語句を、より一般的かつ代表的な語句に置き換えるからである。
The reason is that the
本実施例では、主装置32は、分析用特許文献の要旨を表す語句を、分析用特許文献に含まれる文書と、分析用特許文献に含まれる特許分類の説明文と、に基づいて決定する。特許分類は、特許文献の特徴を示し、その説明文は、一般的な語句で作成されている。
In the present embodiment, the
このため、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書のみに基づいて決定される場合に比べて、その決定された語句が、分析用特許文献の要旨をより正確に表すようにすることが可能になる。 For this reason, compared with the case where the word or phrase representing the gist of the analytical patent document is determined based only on the document included in the analytical patent document, the decided word or phrase is more accurate than the gist of the analytical patent document. Can be expressed as
よって、技術者または特許サーチャー等の分析者が、効率的に特許公報を読み込むことが可能になる。 Therefore, an engineer or an analyst such as a patent searcher can efficiently read a patent gazette.
また、例えば、その語句が、特許マップを作成するためのデータとして用いられれば、精度の高い特許マップを作成することが可能になる。 Further, for example, if the word / phrase is used as data for creating a patent map, a highly accurate patent map can be created.
また、本実施例では、主装置32は、分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、特許分類の説明文から語句を抽出し、課題に関する語句と、課題の解決手法に関する語句と、特許分類の説明文から抽出された語句と、に基づいて、分析用特許文献の要旨を表す語句を決定する。
Further, in the present embodiment, the
この場合、課題に関する語句と、課題の解決手法に関する語句が、分析用特許文献の要旨を示しているか否かを、特許分類の説明文を利用して精査することが可能になる。よって、分析用特許文献の要旨を示す語句を高精度で決定することが可能になる。 In this case, it is possible to examine carefully whether or not the phrase related to the problem and the phrase related to the problem solving technique indicate the gist of the patent document for analysis, using the explanatory text of the patent classification. Therefore, it is possible to determine with high accuracy a word indicating the gist of the patent document for analysis.
また、本実施例では、主装置32は、分析用特許文献に含まれる文書から抽出された語句が、特許分類の説明文から抽出された語句と一致すると、その語句は、分析用特許文献の要旨を表す重要語句であると決定する。
Further, in this embodiment, when the word / phrase extracted from the document included in the analysis patent document matches the word / phrase extracted from the explanatory text of the patent classification, the
この場合、特許文献から抽出された語句の中で、特許文献の特徴を示す可能性の高い語句を、重要語句にすることが可能となる。 In this case, among the phrases extracted from the patent document, it is possible to make a phrase having a high possibility of showing the characteristics of the patent document as an important phrase.
また、本実施例では、主装置32は、語句ごとに類義語を記憶してある類義語辞書を有し、分析用特許文献に含まれる文書から抽出された語句の類義語が、特許分類の説明文から抽出された語句と一致すると、その類義語は、分析用特許文献の要旨を表す重要語句であると決定する。
Further, in the present embodiment, the
特許分類の説明文は、一般的な語句で作成されている。このため、特許文献の特徴を示す可能性の高い語句が、一般的な語句に置き換えられ、その一般的な語句を重要語句にすることが可能になる。よって、特許文献の要旨を表す語句を、特殊な語でなく、一般的な語句にすることが可能になる。 The description of the patent classification is made up of common words and phrases. For this reason, a word / phrase with a high possibility of showing the characteristic of patent documents is replaced with a common word / phrase, and the common word / phrase can be made an important word / phrase. Therefore, it is possible to make a word representing the gist of the patent document not a special word but a general word.
また、本実施例では、入力装置31は、表示装置33に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を受け付け、主装置32は、入力装置31が受け付けた修正指示に基づいて、表示装置33に表示された語句を修正する。
Further, in this embodiment, the
この場合、表示装置33に表示された特許文献の要旨を表す語句が、ほとんど一般的な語句になるため、分析者は、その語句が妥当か否かを容易に理解でき、分析者は、その語句を修正する作業を効率的に行える。
In this case, since the word representing the gist of the patent document displayed on the
以上説明した実施例において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。 In the embodiment described above, the illustrated configuration is merely an example, and the present invention is not limited to the configuration.
1 特許公開公報データベース装置
2 特許分類コードデータベース装置
3 特許分析装置
31 入力装置
32 主装置
33 表示装置
34 記憶装置
4 ネットワーク
DESCRIPTION OF SYMBOLS 1 Patent publication
Claims (14)
分析用特許文献を特定するための入力情報を受け付ける入力部と、
前記入力部が受け付けた入力情報にて特定される分析用特許文献を前記公報データベース装置から取得し、該分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手し、該分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する制御部と、
前記制御部が決定した語句を表示する表示部と、を含む特許分析装置。 Patent documents obtained from the publication database device connected to the publication database device for storing patent documents including documents and patent classifications, and the classification database device for storing explanations of the patent classification for each patent classification, A patent analysis device that analyzes using the classification database device,
An input unit for receiving input information for specifying the patent document for analysis;
The analysis patent document specified by the input information received by the input unit is acquired from the publication database device, the explanation of the patent classification included in the analysis patent document is acquired from the classification database device, and the analysis A control unit for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanation of the patent classification;
And a display unit that displays the words determined by the control unit.
前記制御部は、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定する、特許分析装置。 The patent analysis apparatus according to claim 1,
The control unit extracts a word related to a problem and a word related to a problem solving method from a document included in the analysis patent document, extracts a word from a description of the patent classification, and a word related to the problem A patent analysis device that determines a phrase representing the gist of the patent document for analysis based on a phrase related to the solution to the problem and a phrase extracted from the explanatory text of the patent classification.
前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、
前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなる、特許分析装置。 The patent analysis apparatus according to claim 2,
The phrase related to the task consists of a task word indicating the task and a task category indicating the category of the task,
The patent analysis apparatus, wherein the phrase related to the solution technique of the problem includes a solution word indicating the solution technique and a solution category indicating a category of the solution technique.
前記制御部は、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析装置。 In the patent analysis device according to claim 2 or 3,
When the phrase extracted from the document included in the analytical patent document matches the phrase extracted from the explanatory text of the patent classification, the control unit represents the gist of the analytical patent document. Patent analysis device that determines a word or phrase.
前記制御部は、語句ごとに類義語を記憶してある類義語辞書を有し、
前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析装置。 In the patent analysis device according to any one of claims 2 to 4,
The control unit has a synonym dictionary storing synonyms for each word,
When a synonym of a word extracted from a document included in the analysis patent document matches a word extracted from the explanatory text of the patent classification, the synonym is an important word representing the gist of the analysis patent document Patent analysis device that decides.
前記入力部は、前記表示部に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を、さらに受け付け、
前記制御部は、前記入力部が受け付けた修正指示に基づいて、前記表示部に表示された前記語句を修正する、特許分析装置。 The patent analysis device according to claim 5,
The input unit further accepts a correction instruction for correcting a word representing the gist of the patent document for analysis displayed on the display unit,
The said analysis part is a patent analysis apparatus which corrects the said phrase displayed on the said display part based on the correction instruction | indication which the said input part received.
分析用特許文献を特定するための入力情報を受け付ける入力ステップと、
前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得ステップと、
前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手ステップと、
前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定ステップと、
前記決定された語句を表示する表示ステップと、を含む特許分析方法。 Patent documents obtained from the publication database device connected to the publication database device for storing patent documents including documents and patent classifications, and the classification database device for storing explanations of the patent classification for each patent classification, A patent analysis method performed by a patent analysis device that analyzes using the classification database device,
An input step for receiving input information for specifying the patent document for analysis;
An acquisition step of acquiring the patent document for analysis specified by the input information from the publication database device;
Obtaining a description of patent classification included in the patent document for analysis from the classification database device;
A determination step for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanatory note of the patent classification;
And a display step of displaying the determined word / phrase.
前記決定ステップでは、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定する、特許分析方法。 The patent analysis method according to claim 8,
In the determining step, from a document included in the analysis patent document, a word related to a problem and a word related to a problem solving method are extracted, a word is extracted from an explanatory text of the patent classification, and a word related to the problem A patent analysis method for determining a phrase representing a gist of the patent document for analysis based on a phrase related to the solution to the problem and a phrase extracted from an explanatory note of the patent classification.
前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、
前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなる、特許分析方法。 The patent analysis method according to claim 9,
The phrase related to the task consists of a task word indicating the task and a task category indicating the category of the task,
The patent analysis method, wherein the phrase related to the solution method of the problem includes a solution word indicating the solution method and a solution category indicating a category of the solution method.
前記決定ステップでは、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析方法。 The patent analysis method according to claim 9 or 10,
In the determination step, when a phrase extracted from a document included in the analysis patent document matches a phrase extracted from the explanatory text of the patent classification, the phrase represents an important point of the analysis patent document. Patent analysis method that determines a phrase.
前記特許分析装置は、語句ごとに類義語を記憶してある類義語辞書を有し、
前記決定ステップでは、前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析方法。 The patent analysis method according to any one of claims 9 to 11,
The patent analyzer has a synonym dictionary storing synonyms for each word,
In the determining step, when a synonym of a phrase extracted from a document included in the analysis patent document matches a phrase extracted from the explanatory text of the patent classification, the synonym Patent analysis method that determines that it is an important word to represent.
前記表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を受け付ける受付ステップと、
前記修正指示に基づいて、前記表示された語句を修正する修正ステップと、をさらに含む、特許分析方法。 The patent analysis method according to claim 12,
An accepting step of accepting a correction instruction for correcting a word representing the gist of the displayed analytical patent document;
A patent analysis method, further comprising: a correction step of correcting the displayed phrase based on the correction instruction.
分析用特許文献を特定するための入力情報を受け付ける入力処理と、
前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得処理と、
前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手処理と、
前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定処理と、を含む特許分析処理を、前記コンピュータに実行させるプログラム。 A program for causing a computer connected to a publication database device for storing patent documents including documents and patent classifications and a classification database device for storing explanations of the patent classification for each patent classification to execute a patent analysis process. There,
An input process for receiving input information for specifying the patent document for analysis;
An acquisition process for acquiring the patent document for analysis specified by the input information from the publication database device;
An acquisition process for obtaining a description of a patent classification included in the patent document for analysis from the classification database device;
A patent analysis process including: a determination process for determining a word representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanatory text of the patent classification; The program to be executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005340266A JP2007148630A (en) | 2005-11-25 | 2005-11-25 | Patent analyzing device, patent analyzing system, patent analyzing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005340266A JP2007148630A (en) | 2005-11-25 | 2005-11-25 | Patent analyzing device, patent analyzing system, patent analyzing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007148630A true JP2007148630A (en) | 2007-06-14 |
Family
ID=38209997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005340266A Pending JP2007148630A (en) | 2005-11-25 | 2005-11-25 | Patent analyzing device, patent analyzing system, patent analyzing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007148630A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009001696A1 (en) * | 2007-06-22 | 2008-12-31 | Patent Result Co., Ltd. | Information processing device, program and information processing method |
WO2009150758A1 (en) * | 2008-06-13 | 2009-12-17 | 株式会社パテント・リザルト | Information processing device, program and information processing method |
KR20140059999A (en) * | 2012-11-09 | 2014-05-19 | (주)윕스 | Apparatus for manufacturing search report and method for displaying the same |
-
2005
- 2005-11-25 JP JP2005340266A patent/JP2007148630A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009001696A1 (en) * | 2007-06-22 | 2008-12-31 | Patent Result Co., Ltd. | Information processing device, program and information processing method |
WO2009150758A1 (en) * | 2008-06-13 | 2009-12-17 | 株式会社パテント・リザルト | Information processing device, program and information processing method |
KR20140059999A (en) * | 2012-11-09 | 2014-05-19 | (주)윕스 | Apparatus for manufacturing search report and method for displaying the same |
KR102043434B1 (en) | 2012-11-09 | 2019-11-11 | (주)윕스 | Apparatus for manufacturing search report and method for displaying the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8090724B1 (en) | Document analysis and multi-word term detector | |
JP4654745B2 (en) | Question answering system, data retrieval method, and computer program | |
US7526474B2 (en) | Question answering system, data search method, and computer program | |
US8635061B2 (en) | Language identification in multilingual text | |
JP5403696B2 (en) | Language model generation apparatus, method and program thereof | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
US20080077397A1 (en) | Dictionary creation support system, method and program | |
KR101508070B1 (en) | Method for word sense diambiguration of polysemy predicates using UWordMap | |
KR101507637B1 (en) | Device and method for supporting detection of mistranslation | |
US9690797B2 (en) | Digital information analysis system, digital information analysis method, and digital information analysis program | |
US20100125448A1 (en) | Automated identification of documents as not belonging to any language | |
CN112691379A (en) | Game resource text auditing method and device, storage medium and computer equipment | |
KR20170008357A (en) | System for Translating Using Crowd Sourcing, Server and Method for Web toon Language Automatic Translating | |
JP4143085B2 (en) | Synonym acquisition method and apparatus, program, and computer-readable recording medium | |
JP2007148630A (en) | Patent analyzing device, patent analyzing system, patent analyzing method and program | |
JP4361299B2 (en) | Evaluation expression extraction apparatus, program, and storage medium | |
US20110106849A1 (en) | New case generation device, new case generation method, and new case generation program | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
JP5285491B2 (en) | Information retrieval system, method and program, index creation system, method and program, | |
JP5025603B2 (en) | Machine translation apparatus, machine translation program, and machine translation method | |
JP5673265B2 (en) | Calibration support apparatus and calibration support program | |
CN114444491A (en) | New word recognition method and device | |
KR101614551B1 (en) | System and method for extracting keyword using category matching | |
JP4592556B2 (en) | Document search apparatus, document search method, and document search program | |
JP3952964B2 (en) | Reading information determination method, apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091014 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100224 |