JP2007148630A - Patent analyzing device, patent analyzing system, patent analyzing method and program - Google Patents

Patent analyzing device, patent analyzing system, patent analyzing method and program Download PDF

Info

Publication number
JP2007148630A
JP2007148630A JP2005340266A JP2005340266A JP2007148630A JP 2007148630 A JP2007148630 A JP 2007148630A JP 2005340266 A JP2005340266 A JP 2005340266A JP 2005340266 A JP2005340266 A JP 2005340266A JP 2007148630 A JP2007148630 A JP 2007148630A
Authority
JP
Japan
Prior art keywords
analysis
word
classification
phrase
patent document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005340266A
Other languages
Japanese (ja)
Inventor
Shinichi Emoto
真一 江本
Masahiko Arai
匡彦 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005340266A priority Critical patent/JP2007148630A/en
Publication of JP2007148630A publication Critical patent/JP2007148630A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a patent analyzing device, a patent analyzing system and a patent analyzing method for providing words and phrases much more accurately expressing the summary of a published unexamined patent application. <P>SOLUTION: When acquiring a published unexamined patent application for analysis from a official gazette DB device 1 according to input information accepted by an input device 31, a main device 32 executes the language analysis processing of a document included in the published unexamined patent application for analysis, and extracts words and phrases(temporary subject word, temporary subject category) concerning a subject and words and phrases(temporary solution word, temporary solution category) concerning the solution method of the subject for every published unexamined patent application. Furthermore, the main device 32 acquires the explanatory sentence of the patent classification of the official gazette from a classification DB device 2 for every published unexamined patent application, and verifies and examines the validity of the words and phrases concerning the subject and words and phrases concerning the solution method of the subject by using the explanatory sentence of patent classification for every published unexamined patent application, and determines the words and phrases(subject word, subject category, solution word and solution category) expressing the summary of the published unexamined patent application for analysis. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、特許分析装置、特許分析システム、特許分析方法およびプログラムに関し、特には、特許文献の要旨を表す語句を決定する特許分析装置、特許分析システム、特許分析方法およびプログラムに関する。   The present invention relates to a patent analysis device, a patent analysis system, a patent analysis method, and a program, and more particularly, to a patent analysis device, a patent analysis system, a patent analysis method, and a program for determining a phrase that represents the gist of a patent document.

従来の特許分析プログラムおよび装置の一例が、特許文献1(特開2004−152243号公報)に記載されている。   An example of a conventional patent analysis program and apparatus is described in Patent Document 1 (Japanese Patent Laid-Open No. 2004-152243).

特許文献1に記載の特許分析プログラムおよび装置は、特許明細書等の特許情報を分析して特許情報からキーワードを抽出し、そのキーワードに基づいて特許マップを作成する。具体的には、この装置は、ユーザにて指定されたキーワードを含む特許情報の件数を示す特許マップを作成する。   The patent analysis program and apparatus described in Patent Document 1 analyze patent information such as a patent specification, extract keywords from the patent information, and create a patent map based on the keywords. Specifically, this device creates a patent map indicating the number of patent information including a keyword designated by the user.

また、特許文献2(特開2002−175331号公報)には、特許文献に付与された特許分類を抽出し、その特許分類のタイトルを表示する特許分類表示装置が記載されている。
特開2004−152243号公報 特開2002−175331号公報
Patent Document 2 (Japanese Patent Application Laid-Open No. 2002-175331) describes a patent classification display device that extracts a patent classification assigned to a patent document and displays a title of the patent classification.
JP 2004-152243 A JP 2002-175331 A

特許文献1に記載の装置は、キーワードを含む特許情報の件数を示す特許マップを作成するため、特殊なキーワードが明細書に記載された場合、その特許情報を抽出できない可能性を有する。つまり、特許文献1に記載の装置では、他の特許情報との比較を容易にする語句、すなわち、特許情報の要旨を表す語句を高精度で抽出できない。そのため、その作成された特許マップの信頼性が乏しくなる。   Since the apparatus described in Patent Document 1 creates a patent map indicating the number of patent information including a keyword, there is a possibility that the patent information cannot be extracted when a special keyword is described in the specification. In other words, the device described in Patent Document 1 cannot extract a word or phrase that facilitates comparison with other patent information, that is, a word or phrase representing the gist of the patent information, with high accuracy. Therefore, the reliability of the created patent map becomes poor.

また、従来、この種の特許分析プログラムおよび装置は、言語処理技術を用いて、公開特許公報の要旨を示す語句を抽出している。しかしながら、公開特許公報などの特許文献では、文書が独特であるため、通常の言語処理技術では、必ずしも利用者が期待するような語句が抽出されなかった。   Conventionally, this kind of patent analysis program and apparatus extract a word indicating the gist of the published patent gazette using language processing technology. However, in patent documents such as published patent gazettes, since documents are unique, words and phrases expected by the user are not necessarily extracted by a normal language processing technique.

また、特許文献2に記載の特許分類表示装置では、特許文献に付与された特許分類のタイトルが表示されるが、公開特許公報の要旨を表す語句を高精度で抽出できない。   In addition, in the patent classification display device described in Patent Document 2, the title of the patent classification assigned to the patent document is displayed, but a phrase representing the gist of the published patent publication cannot be extracted with high accuracy.

本発明の目的は、特許文献の要旨をより正確に表す語句をユーザに提供することが可能な特許分析装置、特許分析システム、特許分析方法およびプログラムを提供することである。   An object of the present invention is to provide a patent analysis device, a patent analysis system, a patent analysis method, and a program capable of providing a user with a phrase that more accurately expresses the gist of the patent document.

上記目的を達成するために、本発明の特許分析装置は、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置であって、分析用特許文献を特定するための入力情報を受け付ける入力部と、前記入力部が受け付けた入力情報にて特定される分析用特許文献を前記公報データベース装置から取得し、該分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手し、該分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する制御部と、前記制御部が決定した語句を表示する表示部とを含む。   In order to achieve the above object, a patent analysis apparatus of the present invention includes a gazette database apparatus that stores patent documents including documents and patent classifications, and a classification database apparatus that stores explanatory text of the patent classification for each patent classification. , A patent analysis device that analyzes the patent document acquired from the publication database device using the classification database device, and an input unit that receives input information for specifying the patent document for analysis; The patent document for analysis specified by the input information received by the input unit is acquired from the publication database device, the explanation of the patent classification included in the patent document for analysis is acquired from the classification database device, and the analysis A control unit for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document and a description of the patent classification; And a display unit for displaying a phrase control unit has determined.

また、本発明の特許分析方法は、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置が行う特許分析方法であって、分析用特許文献を特定するための入力情報を受け付ける入力ステップと、前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得ステップと、前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手ステップと、前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定ステップと、前記決定された語句を表示する表示ステップとを含む。   The patent analysis method of the present invention is connected to a publication database device that stores patent documents including documents and patent classifications, and a classification database device that stores a description of the patent classification for each patent classification, A patent analysis method performed by a patent analysis device that analyzes patent documents acquired from a gazette database device using the classification database device, an input step for receiving input information for specifying a patent document for analysis, and the input An acquisition step for acquiring an analysis patent document specified by information from the publication database device, an acquisition step for acquiring an explanation of a patent classification included in the analysis patent document from the classification database device, and the analysis A word representing the gist of the patent document for analysis based on the document included in the patent document and the explanation of the patent classification Comprising a determining step of determining, and a display step of displaying the determined words.

また、本発明の特許分析システムは、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、上記特許分析装置とを含む。   The patent analysis system of the present invention includes a publication database device that stores patent documents including documents and patent classifications, a classification database device that stores a description of the patent classification for each patent classification, and the patent analysis device described above. including.

上記発明によれば、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書と、分析用特許文献に含まれる特許分類の説明文と、に基づいて決定される。特許分類は、特許文献の特徴を示し、その説明文は、一般的な語句で作成されている。   According to the above invention, the phrase representing the gist of the analysis patent document is determined based on the document included in the analysis patent document and the description of the patent classification included in the analysis patent document. The patent classification indicates the characteristics of the patent document, and the explanation is made up of common words and phrases.

このため、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書のみに基づいて決定される場合に比べて、その決定された語句が、分析用特許文献の要旨をより正確に表すようにすることが可能になる。   For this reason, compared with the case where the word or phrase representing the gist of the analytical patent document is determined based only on the document included in the analytical patent document, the decided word or phrase is more accurate than the gist of the analytical patent document. Can be expressed as

また、例えば、その特許文献の要旨が、特許マップを作成するためのデータとして用いられれば、精度の高い特許マップを作成することが可能になる。   For example, if the gist of the patent document is used as data for creating a patent map, a highly accurate patent map can be created.

なお、前記制御部は、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定することが望ましい。   The control unit extracts a word / phrase related to a problem and a word / phrase related to a problem solving method from a document included in the patent document for analysis, extracts a word / phrase from the explanatory text of the patent classification, and relates to the problem It is desirable to determine a phrase representing the gist of the patent document for analysis based on the phrase, the phrase related to the problem solving technique, and the phrase extracted from the explanatory text of the patent classification.

上記発明によれば、課題に関する語句と、課題の解決手法に関する語句が、分析用特許文献の要旨を示しているか否かを、特許分類の説明文を利用して精査することが可能になる。よって、分析用特許文献の要旨を示す語句を高精度で決定することが可能になる。   According to the above-described invention, it is possible to examine carefully whether or not the phrase related to the problem and the phrase related to the technique for solving the problem indicate the gist of the patent document for analysis, using the explanatory text of the patent classification. Therefore, it is possible to determine with high accuracy a word indicating the gist of the patent document for analysis.

また、前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなることが望ましい。   Further, the phrase related to the problem is composed of a problem word indicating the problem and a problem category indicating the category of the problem, and the word / phrase regarding the problem solving technique is a solution word indicating the solution technique, and It is desirable to consist of a solution category indicating a category.

また、前記制御部は、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定することが望ましい。   In addition, when the phrase extracted from the document included in the analysis patent document matches the phrase extracted from the explanatory text of the patent classification, the control unit extracts the gist of the analysis patent document. It is desirable to determine that it is an important word to represent.

上記発明によれば、特許文献から抽出された語句の中で、特許文献の特徴を示す可能性の高い語句を、重要語句にすることが可能となる。   According to the above invention, it is possible to make a word / phrase having a high possibility of showing the characteristics of the patent document among the words / phrases extracted from the patent document as an important word / phrase.

また、前記制御部は、語句ごとに類義語を記憶してある類義語辞書を有し、前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定することが望ましい。   In addition, the control unit has a synonym dictionary storing synonyms for each phrase, and synonyms of phrases extracted from documents included in the patent document for analysis are extracted from the explanatory text of the patent classification It is desirable to determine that the synonym is an important word representing the gist of the analytical patent document when it matches the word.

特許分類の説明文は、一般的な語句で作成されている。このため、上記発明によれば、特許文献の特徴を示す可能性の高い語句が、一般的な語句に置き換えられ、その一般的な語句を重要語句にすることが可能になる。よって、特許文献の要旨を表す語句を、特殊な語でなく、一般的な語句にすることが可能になる。   The description of the patent classification is made up of common words and phrases. For this reason, according to the said invention, the phrase with high possibility of showing the characteristic of a patent document is substituted by a general word, and it becomes possible to make the general word a key word. Therefore, it is possible to make a word representing the gist of the patent document not a special word but a general word.

また、前記入力部は、前記表示部に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を、さらに受け付け、前記制御部は、前記入力部が受け付けた修正指示に基づいて、前記表示部に表示された前記語句を修正することが望ましい。   Further, the input unit further receives a correction instruction for correcting a word representing the gist of the analytical patent document displayed on the display unit, and the control unit is based on the correction instruction received by the input unit. It is desirable to correct the word displayed on the display unit.

上記発明によれば、表示部に表示された特許文献の要旨を表す語句が、ほとんど一般的な語句になるため、分析者は、その語句が妥当か否かを容易に理解でき、分析者は、その語句を修正する作業を効率的に行える。   According to the above invention, since the word representing the gist of the patent document displayed on the display unit is almost a general word, the analyst can easily understand whether or not the word is valid. , You can efficiently correct the phrase.

また、本発明のプログラムは、文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続されたコンピュータに、特許分析処理を実行させるプログラムであって、分析用特許文献を特定するための入力情報を受け付ける入力処理と、前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得処理と、前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手処理と、前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定処理と、を含む特許分析処理を、前記コンピュータに実行させる。   Further, the program of the present invention is a computer connected to a publication database device that stores patent documents including documents and patent classifications, and a classification database device that stores a description of the patent classification for each patent classification. A program for executing a patent analysis process, an input process for receiving input information for specifying a patent document for analysis, and an acquisition process for acquiring the patent document for analysis specified by the input information from the publication database device Based on the acquisition process for obtaining the description of the patent classification included in the patent document for analysis from the classification database device, the document included in the patent document for analysis, and the description of the patent classification, The computer is caused to execute a patent analysis process including a determination process for determining a word representing the gist of the patent document for analysis.

上記発明によれば、上記特許分析方法をコンピュータに実行させることが可能になる。   According to the said invention, it becomes possible to make a computer perform the said patent-analysis method.

本発明によれば、特許文献の要旨をより正確に表す語句をユーザに提供することが可能になる。   ADVANTAGE OF THE INVENTION According to this invention, it becomes possible to provide a user with the phrase which represents the summary of a patent document more correctly.

以下、本発明の実施例を、図面を参照して説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の一実施例の特許分析システムを示したブロック図である。   FIG. 1 is a block diagram showing a patent analysis system according to an embodiment of the present invention.

図1において、本特許分析システムは、特許公開公報データベース装置(以下「公報DB装置」と称する。)1と、特許分類コードデータベース装置(以下「分類DB装置」と称する。)2と、特許分析装置3とを含む。特許分析装置3は、少なくとも、入力装置(入力部)31と、データ処理のための主装置(制御部)32と、表示装置(表示部)33と、記憶装置34とを含む。   1, the patent analysis system includes a patent publication gazette database device (hereinafter referred to as “gazette DB device”) 1, a patent classification code database device (hereinafter referred to as “classification DB device”) 2, and a patent analysis. Device 3. The patent analysis apparatus 3 includes at least an input device (input unit) 31, a main device (control unit) 32 for data processing, a display device (display unit) 33, and a storage device 34.

公報DB装置1と、分類DB装置2と、特許分析装置3とは、LAN等のネットワーク4を介して相互に接続されている。   The publication DB device 1, the classification DB device 2, and the patent analysis device 3 are connected to each other via a network 4 such as a LAN.

公報DB装置1は、電子化された公開特許公報を格納する。公報DB装置1は、特許検索システムなどによって絞り込まれた公開特許公報も格納している。なお、公開特許公報は、特許文献の一例である。   The publication DB device 1 stores an electronic published patent publication. The publication DB device 1 also stores a published patent publication narrowed down by a patent search system or the like. An open patent gazette is an example of a patent document.

公開特許公報は、書誌事項、特許請求の範囲、明細書、図面および要約書を含む。書誌事項は、少なくとも、IPC、FIおよびFターム等の特許分類を含む。特許請求の範囲、明細書および要約書は、文書である。   The published patent publication includes bibliographic items, claims, specifications, drawings and abstracts. Bibliographic items include at least patent classifications such as IPC, FI and F-term. The claims, the description and the abstract are documents.

分類DB装置2は、IPC、FIおよびFターム等の特許分類ごとに、特許分類の説明文を格納する。なお、この説明文は、技術分類名称を含む。   The classification DB device 2 stores a description of patent classification for each patent classification such as IPC, FI, and F-term. This descriptive text includes the technical classification name.

特許分析装置3は、パーソナルコンピュータ(PC)または他の情報処理装置であり、分析者によって使用される。特許分析装置3は、プログラムを実行することによって種々の動作を実行する。   The patent analysis apparatus 3 is a personal computer (PC) or other information processing apparatus and is used by an analyst. The patent analysis apparatus 3 executes various operations by executing a program.

入力装置31は、キーボードまたはマウスであり、分析者から、分析用公開特許公報を特定するための入力情報(例えば、公開番号)を受け付ける。   The input device 31 is a keyboard or a mouse, and receives input information (for example, a publication number) for specifying an analysis published patent publication from an analyst.

主装置32は、例えば、CPU等のコンピュータであり、メモリ(不図示)に格納されたプログラムを実行して以下のような動作を行う。   The main device 32 is a computer such as a CPU, for example, and performs the following operation by executing a program stored in a memory (not shown).

主装置32は、入力装置31が受け付けた入力情報にしたがって、分析用公開特許公報を公報DB装置1から取得し、その後、分析用公開特許公報に含まれる特許分類の説明文を、分類DB装置2から入手する。主装置32は、分析用公開特許公報に含まれる文書と、特許分類の説明文と、に基づいて、分析用公開特許公報の要旨を表す語句を決定する。   The main device 32 acquires the analysis public patent gazette from the gazette DB device 1 in accordance with the input information received by the input device 31, and then transmits the description of the patent classification included in the analysis public patent gazette to the classification DB device. Obtain from 2. The main device 32 determines a word representing the gist of the analytical open patent gazette based on the document included in the open patent gazette for analysis and the explanatory text of the patent classification.

具体的には、主装置32は、分析用公開特許公報を取得すると、その分析用公開特許公報に含まれる文書を言語分析処理して、公開特許公報ごとに、課題に関する語句(仮の課題語と、仮の課題カテゴリ)と、課題の解決手法に関する語句(仮の解決語と、仮の解決カテゴリ)を抽出する。   Specifically, when the main device 32 obtains the analytical published patent gazette, the main device 32 performs language analysis processing on the document included in the analyzed published patent gazette, and for each published patent gazette, the word (provisional subject word) And provisional problem category) and phrases (provisional solution word and provisional solution category) related to the problem solving technique.

さらに、主装置32は、公開特許公報ごとに、その公報の特許分類の説明文を、分類DB装置2から入手し、公開特許公報ごとに、課題に関する語句と課題の解決手法に関する語句との妥当性を、特許分類の説明文を用いて検証し、精査して、分析用公開特許公報の要旨を表す語句(課題語、課題カテゴリ、解決語および解決カテゴリ)を決定する。   Further, the main device 32 obtains an explanation of the patent classification of the publication from the classification DB device 2 for each published patent publication, and for each published patent publication, the validity of the words related to the problem and the words related to the problem solving method. The characteristics are verified by using an explanation of the patent classification and examined carefully, and words (problem words, problem categories, solution words, and solution categories) that represent the gist of the open patent gazette for analysis are determined.

なお、主装置32は、語句ごとに類義語を記憶してある類義語辞書を有する。   The main device 32 has a synonym dictionary storing synonyms for each phrase.

表示装置33は、主装置32が決定した語句(課題語、課題カテゴリ、解決語および解決カテゴリ)を表示する。   The display device 33 displays the words (task words, task categories, solution words, and solution categories) determined by the main device 32.

次に、動作を説明する。   Next, the operation will be described.

図2は、本特許分析システムの動作を説明するためのフローチャートである。以下、図2を参照して本特許分析システムの動作を説明する。   FIG. 2 is a flowchart for explaining the operation of the patent analysis system. The operation of this patent analysis system will be described below with reference to FIG.

分析者が、分析用特許公報を特定するための入力情報を、入力装置31に入力すると、主装置32は、ステップA1を実行する。   When the analyst inputs input information for specifying an analysis patent gazette to the input device 31, the main device 32 executes Step A1.

ステップA1では、主装置32は、公報DB装置1にアクセスし、その入力情報にしたがって、分析用公開特許公報を抽出する。公報DB装置1は、分析用公開特許公報が抽出されると、ステップA2を実行する。   In step A1, the main device 32 accesses the publication DB device 1 and extracts an analysis published patent publication according to the input information. The gazette DB device 1 executes step A2 when the analytical open patent gazette is extracted.

ステップA2では、公報DB装置1は、分析用公開特許公報を、特許分析装置3に送信する。特許分析装置3の主装置32は、分析用公開特許公報を受け付けると、ステップA3を実行する。   In step A <b> 2, the publication DB device 1 transmits the analysis open patent publication to the patent analysis device 3. When the main device 32 of the patent analyzer 3 receives the published patent application for analysis, the main device 32 executes Step A3.

ステップA3では、主装置32は、分析用公開特許公報の文書から、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを抽出する。なお、主装置32は、複数の分析用公開特許公報を受け付けたときには、分析用公開特許公報ごとに、それらを抽出する。   In step A3, the main apparatus 32 extracts a temporary problem word, a temporary solution word, a temporary problem category, and a temporary solution category from the document of the analysis open patent publication. When the main device 32 accepts a plurality of analytical open patent publications, it extracts them for each analytical open patent publication.

主装置32は、形態素解析等を用いた構文解析処理と、抽出ルールに基づいた抽出処理と、後処理との3ステップにより、仮の課題語と、仮の解決語を抽出する。   The main device 32 extracts a temporary task word and a temporary solution word through three steps of a syntax analysis process using morphological analysis and the like, an extraction process based on the extraction rule, and a post-process.

構文解析処理では、主装置32は、分析用公開特許公報に含まれる要約書の文書を、主語、述語、目的語および修飾語に分解する。   In the parsing process, the main device 32 decomposes the abstract document included in the analysis published patent publication into a subject, a predicate, an object, and a modifier.

その後、主装置32は、仮の課題語候補として、要約書の課題の欄から「(目的語)の(修飾語)」(例えば「処理速度の高速化」)を抜き出す。   After that, the main device 32 extracts “(target word) (modifier)” (for example, “acceleration of processing speed”) from the problem column of the summary as a temporary problem word candidate.

また、主装置32は、仮の解決語として、要約書の解決手段の欄から「(主語)or(目的語)+(述語)」(例えば「端子が接続されている」)を抜き出す。   In addition, the main device 32 extracts “(subject) or (object) + (predicate)” (for example, “terminal is connected”) from the solution section of the summary as a temporary solution.

抽出処理では、主装置32は、課題語抽出ルールに基づいて、仮の課題語候補の中から仮の課題語を抽出する。なお、課題語抽出ルールは、例えば、仮の課題語候補の後ろに「を目的とした」または「のために」が付いていれば、仮の課題語候補を仮の課題語として抽出する、というルールである。   In the extraction process, the main device 32 extracts a temporary task word from the temporary task word candidates based on the task word extraction rule. The task word extraction rule is, for example, to extract a temporary task word candidate as a temporary task word if “for the purpose” or “for” is appended to the temporary task word candidate. This is the rule.

後処理では、主装置32は、抜き出された仮の課題語および仮の解決語が長すぎる場合、その仮の語から、自動的に200バイト以内かつ区切りの良いところ(句読点)を切り出す。   In the post-processing, if the extracted temporary task word and temporary solution word are too long, the main device 32 automatically cuts out a place (punctuation mark) within 200 bytes and having a good delimiter from the temporary word.

また、主装置32は、形態素解析等を用いた構文解析処理と、カテゴリ抽出ルールに基づいた抽出処理により、仮の課題カテゴリと、仮の解決カテゴリを抽出する。   Further, the main device 32 extracts a temporary task category and a temporary solution category by a syntax analysis process using morphological analysis and the like and an extraction process based on the category extraction rule.

構文解析処理では、主装置32は、分析用公開特許公報に含まれる要約書の文書を、単語に分解する。   In the parsing process, the main device 32 breaks down the abstract document included in the analytical open patent publication into words.

抽出処理では、主装置32は、要約書の課題の欄に含まれる各単語について、その出現数をカウントし、そのカウント数が上位のもの(例えば上位3つ)を、仮の課題カテゴリとして抽出する。また、主装置32は、要約書の解決手段の欄に含まれる各単語について、その出現数をカウントし、そのカウント数が上位のもの(例えば上位3つ)を、仮の解決カテゴリとして抽出する。   In the extraction process, the main device 32 counts the number of occurrences of each word included in the problem column of the summary, and extracts the word having the highest count (for example, the top three) as a temporary problem category. To do. The main device 32 counts the number of appearances of each word included in the solution section of the summary, and extracts the word having the highest count (for example, the top three) as a temporary solution category. .

主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを抽出すると、ステップA4を実行する。   When the main device 32 extracts the temporary task word, the temporary solution word, the temporary task category, and the temporary solution category, it executes Step A4.

ステップA4では、主装置32は、分析用公開特許公報ごとに、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを、一時的に記憶装置34に格納し、その後、ステップA5を実行する。   In step A4, the main device 32 temporarily stores the temporary problem word, the temporary solution word, the temporary problem category, and the temporary solution category in the storage device 34 for each analysis published patent publication. Step A5 is executed.

ステップA5では、主装置32は、分析用公開特許公報ごとに、IPC、FIおよびFタームなどの特許分類を抽出し、その抽出された特許分類に基づいて分類DB装置2にアクセスする。分類DB装置2は、特許分類を受け付けると、ステップA6を実行する。   In step A5, the main device 32 extracts a patent classification such as IPC, FI, and F-term for each open patent publication for analysis, and accesses the classification DB device 2 based on the extracted patent classification. Upon receiving the patent classification, the classification DB device 2 executes Step A6.

ステップA6では、分類DB装置2は、その特許分類に対応する説明文を、特許分析装置3に送信する。特許分析装置3の主装置32は、特許分類の説明文を受け付けると、ステップA7を実行する。   In step A <b> 6, the classification DB device 2 transmits an explanatory text corresponding to the patent classification to the patent analysis device 3. When the main device 32 of the patent analysis apparatus 3 receives the explanation of the patent classification, it executes Step A7.

ステップA7では、主装置32は、分類DB装置2から取得した特許分類の説明文から語句を抽出する。例えば、主装置32は、特許分類の説明文を形態素解析して語句を抽出する。なお、複数の分析用公開特許公報が存在するときには、主装置32は、分析用公開特許公報ごとに、特許分類の説明文から語句を抽出する。   In step A <b> 7, the main device 32 extracts words / phrases from the description text of the patent classification acquired from the classification DB device 2. For example, the main device 32 extracts words by performing morphological analysis on the explanation text of the patent classification. When there are a plurality of analytical open patent publications, the main device 32 extracts words and phrases from the description of the patent classification for each analytical open patent publication.

主装置32は、特許分類の説明文から語句を抽出すると、ステップA8を実行する。   When the main device 32 extracts a phrase from the explanation of the patent classification, it executes Step A8.

ステップA8では、主装置32は、分析用の公開特許公報ごとに、特許分類の説明文から抽出された語を利用して、記憶装置34に格納されている仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを精査し、分析用公開特許公報の要旨を表す語句(課題語、解決語、課題カテゴリおよび解決カテゴリ)を決定する。   In step A8, the main device 32 uses the words extracted from the explanation text of the patent classification for each of the published patent gazettes for analysis, and uses the temporary task words and temporary solution words stored in the storage device 34. The tentative task category and the tentative solution category are scrutinized, and words (problem word, solution word, task category, and solution category) representing the gist of the published patent publication for analysis are determined.

具体的には、主装置32は、以下のように、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリを精査する。   Specifically, the main apparatus 32 examines the temporary task word, the temporary solution word, the temporary task category, and the temporary solution category as follows.

(1)主装置32は、言語処理技術にて公開特許公報から抽出された語句(仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリ)の中で、その語句が、その公開特許公報に含まれる特許分類の説明文から抽出された語句と一致すると、その語句を重要語(課題語、解決語、課題カテゴリまたは解決カテゴリ)とみなす。   (1) The main device 32 has a word / phrase (provisional problem word, temporary solution word, temporary problem category, and temporary solution category) extracted from the published patent gazette by language processing technology. When the phrase extracted from the description of the patent classification included in the published patent publication matches, the phrase is regarded as an important word (problem word, solution word, problem category or solution category).

また、主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの中で、その語句の類義語が、その語句が抽出された公開特許公報に含まれる特許分類の説明文から抽出された語句と一致すると、その仮の語句にかえて、その類義語を、重要語(課題語、解決語、課題カテゴリまたは解決カテゴリ)とみなす。   In addition, the main device 32 determines whether the synonym of the phrase among the provisional problem word, the provisional solution word, the provisional problem category, and the provisional solution category is included in the published patent publication in which the word is extracted. If it matches the phrase extracted from the explanatory note, the synonym is regarded as an important word (problem word, solution word, problem category or solution category) instead of the temporary word.

なお、主装置32は、類義語辞書(シソーラス辞書)を用いて、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの類義語を選ぶ。   The main device 32 uses the synonym dictionary (thesaurus dictionary) to select the synonyms of the temporary task word, the temporary solution word, the temporary task category, and the temporary solution category.

(2)主装置32は、仮の課題語、仮の解決語、仮の課題カテゴリおよび仮の解決カテゴリの中で、それらの語句が抽出された公開特許公報に含まれる特許分類の説明文に含まれている語句と一致しない、または、類似しないものを削除する。   (2) The main device 32 uses the provisional problem word, the provisional solution word, the provisional problem category, and the provisional solution category to describe the patent classification included in the published patent publication in which those words and phrases are extracted. Delete words that do not match or do not resemble the included words.

(3)主装置32は、仮の課題語の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「課題または目的」(例えば、5B035AA)に含まれる語句と一致または類似するものがあれば、その語句を、課題語として重要と重みづけする。   (3) The main device 32 matches the phrase included in the “problem or purpose” (for example, 5B035AA) from the viewpoint of the F term included in the published patent publication from which the phrase is extracted, If there is something similar, the word is weighted as important as the task word.

(4)主装置32は、構成に関する語句を、各公報の請求項1および独立項から言語処理技術を用いて抽出している場合、その構成に関する語句の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「構成」(例えば、5B035BA)に含まれる語句と一致または類似するものがあれば、その語句を、構成に関する語句として重要と重みづけする。   (4) When the main device 32 has extracted a word related to the configuration from claim 1 and the independent claim of each gazette using a language processing technique, the main device 32 discloses the word / phrase extracted from the word related to the configuration. If there is a word that matches or resembles a word included in the “configuration” (for example, 5B035BA) from the viewpoint of the F term included in the patent publication, the word is weighted as important as a word related to the structure.

(5)主装置32は、仮の解決語の中で、その語句が抽出された公開特許公報に含まれるFタームの観点で「〜手段(なお、方法、〜方法という観点があれば「手段」とみなす。)」(例えば、4B021MP)に含まれる語句と一致または類似するものがあれば、その語句を、解決語として重要と重みづけする。   (5) The main device 32 has “˜means” (in terms of the method, “method” if there is a viewpoint of “method” in terms of the F term included in the published patent gazette from which the word is extracted in the temporary solution word. ”” (For example, if there is a word that matches or is similar to a word included in 4B021MP), the word is weighted as important as a solution word.

なお、重み付けに関しては、主装置32は、語句の出現回数を考慮してもよい。例えば、主装置32は、出現回数が多い語句ほど重要であるとみなす。   In addition, regarding the weighting, the main apparatus 32 may consider the frequency | count of appearance of a phrase. For example, the main device 32 considers that words with a larger number of appearances are more important.

また、主装置32は、公報から抽出された語句またはその類似語が、特許分類の上位(上位概念)の説明文に存在するか否かに基づいて、その語句の重みづけを行ってもよい。例えば、主装置32は、公報から抽出された語句が、特許分類の上位(上位概念)の説明文に存在すると、その語句を重要語とみなす。   Further, the main device 32 may weight the word based on whether or not the word extracted from the gazette or the similar word is present in the explanatory text of the higher rank (higher level concept) of the patent classification. . For example, if the word / phrase extracted from the official gazette exists in the explanatory text of the higher rank (higher level concept) of the patent classification, the main device 32 regards the word / phrase as an important word.

主装置32は、課題語、解決語、課題カテゴリおよび解決カテゴリを決定すると、ステップA9を実行する。   When determining the task word, the solution word, the task category, and the solution category, the main device 32 executes Step A9.

ステップA9では、主装置32は、精査された課題語、解決語、課題カテゴリおよび解決カテゴリを表示装置33に表示する。その後、分析者が、入力装置11を操作して、精査された課題語、解決語、課題カテゴリ、解決カテゴリを修正すると、主装置32は、ステップA10を実行する。ステップA10では、主装置32は、その修正された課題語、解決語、課題カテゴリおよび解決カテゴリを最終結果として表示装置33に表示する。   In step A <b> 9, the main device 32 displays the examined task word, solution word, task category, and solution category on the display device 33. Thereafter, when the analyst operates the input device 11 to correct the examined task word, solution word, task category, and solution category, the main device 32 executes Step A10. In step A10, the main device 32 displays the corrected task word, solution word, task category, and solution category on the display device 33 as the final result.

このように、抽出された語句が、意味的に近いか遠いかを分析者が簡単に判断できるように、いきなり最終結果のみを表示するのではなく、公報から抽出した語句が、特許分類を活用して代表語に置き換えられ、利用者が理解しやすい「課題語、解決語、課題カテゴリおよび解決カテゴリ」が最終結果前に表示される。   In this way, the words extracted from the gazette use the patent classification instead of displaying only the final result suddenly so that the analyst can easily determine whether the extracted words are semantically close or far. Thus, the “problem word, solution word, problem category, and solution category” that are easy to understand for the user are displayed before the final result.

本実施例によれば、以下の効果を奏する。   According to the present embodiment, the following effects can be obtained.

第1の効果は、自動的に抽出される課題語、解決語、カテゴリが、より利用者の期待する語に近づくことにある。   The first effect is that the automatically extracted task words, solution words, and categories are closer to the words expected by the user.

その理由は、特許分析装置3が、言語処理技術によって自動的に公開特許公報から抽出された語句を、特許分類の説明文を利用して精査するからである。   The reason is that the patent analysis device 3 examines the words automatically extracted from the published patent gazette by the language processing technique using the explanation text of the patent classification.

第2の効果は、分析者が語句を修正する作業を効率化できることにある。   The second effect is that it is possible for the analyst to improve the work of correcting the phrase.

その理由は、特許分析装置3が、言語処理技術によって自動的に抽出された語句を、より一般的かつ代表的な語句に置き換えるからである。   The reason is that the patent analysis apparatus 3 replaces the phrase automatically extracted by the language processing technique with a more general and representative phrase.

本実施例では、主装置32は、分析用特許文献の要旨を表す語句を、分析用特許文献に含まれる文書と、分析用特許文献に含まれる特許分類の説明文と、に基づいて決定する。特許分類は、特許文献の特徴を示し、その説明文は、一般的な語句で作成されている。   In the present embodiment, the main device 32 determines a phrase representing the gist of the analysis patent document based on the document included in the analysis patent document and the description of the patent classification included in the analysis patent document. . The patent classification indicates the characteristics of the patent document, and the explanation is made up of common words and phrases.

このため、分析用特許文献の要旨を表す語句が、分析用特許文献に含まれる文書のみに基づいて決定される場合に比べて、その決定された語句が、分析用特許文献の要旨をより正確に表すようにすることが可能になる。   For this reason, compared with the case where the word or phrase representing the gist of the analytical patent document is determined based only on the document included in the analytical patent document, the decided word or phrase is more accurate than the gist of the analytical patent document. Can be expressed as

よって、技術者または特許サーチャー等の分析者が、効率的に特許公報を読み込むことが可能になる。   Therefore, an engineer or an analyst such as a patent searcher can efficiently read a patent gazette.

また、例えば、その語句が、特許マップを作成するためのデータとして用いられれば、精度の高い特許マップを作成することが可能になる。   Further, for example, if the word / phrase is used as data for creating a patent map, a highly accurate patent map can be created.

また、本実施例では、主装置32は、分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、特許分類の説明文から語句を抽出し、課題に関する語句と、課題の解決手法に関する語句と、特許分類の説明文から抽出された語句と、に基づいて、分析用特許文献の要旨を表す語句を決定する。   Further, in the present embodiment, the main device 32 extracts the word / phrase related to the problem and the word / phrase related to the problem solving method from the document included in the patent document for analysis, and extracts the word / phrase from the explanatory text of the patent classification, Based on the word / phrase related to the problem, the word / phrase related to the problem solving technique, and the word / phrase extracted from the explanatory text of the patent classification, the word / phrase representing the gist of the patent document for analysis is determined.

この場合、課題に関する語句と、課題の解決手法に関する語句が、分析用特許文献の要旨を示しているか否かを、特許分類の説明文を利用して精査することが可能になる。よって、分析用特許文献の要旨を示す語句を高精度で決定することが可能になる。   In this case, it is possible to examine carefully whether or not the phrase related to the problem and the phrase related to the problem solving technique indicate the gist of the patent document for analysis, using the explanatory text of the patent classification. Therefore, it is possible to determine with high accuracy a word indicating the gist of the patent document for analysis.

また、本実施例では、主装置32は、分析用特許文献に含まれる文書から抽出された語句が、特許分類の説明文から抽出された語句と一致すると、その語句は、分析用特許文献の要旨を表す重要語句であると決定する。   Further, in this embodiment, when the word / phrase extracted from the document included in the analysis patent document matches the word / phrase extracted from the explanatory text of the patent classification, the main device 32 determines that the word / phrase is that of the analysis patent document. It is determined that this is an important phrase that represents the abstract.

この場合、特許文献から抽出された語句の中で、特許文献の特徴を示す可能性の高い語句を、重要語句にすることが可能となる。   In this case, among the phrases extracted from the patent document, it is possible to make a phrase having a high possibility of showing the characteristics of the patent document as an important phrase.

また、本実施例では、主装置32は、語句ごとに類義語を記憶してある類義語辞書を有し、分析用特許文献に含まれる文書から抽出された語句の類義語が、特許分類の説明文から抽出された語句と一致すると、その類義語は、分析用特許文献の要旨を表す重要語句であると決定する。   Further, in the present embodiment, the main device 32 has a synonym dictionary storing synonyms for each word and phrase synonyms extracted from a document included in the patent document for analysis are extracted from the explanation text of the patent classification. If it matches the extracted word, the synonym is determined to be an important word representing the gist of the patent document for analysis.

特許分類の説明文は、一般的な語句で作成されている。このため、特許文献の特徴を示す可能性の高い語句が、一般的な語句に置き換えられ、その一般的な語句を重要語句にすることが可能になる。よって、特許文献の要旨を表す語句を、特殊な語でなく、一般的な語句にすることが可能になる。   The description of the patent classification is made up of common words and phrases. For this reason, a word / phrase with a high possibility of showing the characteristic of patent documents is replaced with a common word / phrase, and the common word / phrase can be made an important word / phrase. Therefore, it is possible to make a word representing the gist of the patent document not a special word but a general word.

また、本実施例では、入力装置31は、表示装置33に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を受け付け、主装置32は、入力装置31が受け付けた修正指示に基づいて、表示装置33に表示された語句を修正する。   Further, in this embodiment, the input device 31 receives a correction instruction for correcting a word representing the gist of the analytical patent document displayed on the display device 33, and the main device 32 receives the correction received by the input device 31. Based on the instruction, the phrase displayed on the display device 33 is corrected.

この場合、表示装置33に表示された特許文献の要旨を表す語句が、ほとんど一般的な語句になるため、分析者は、その語句が妥当か否かを容易に理解でき、分析者は、その語句を修正する作業を効率的に行える。   In this case, since the word representing the gist of the patent document displayed on the display device 33 is almost a common word, the analyst can easily understand whether or not the word is valid. Work on correcting words efficiently.

以上説明した実施例において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。   In the embodiment described above, the illustrated configuration is merely an example, and the present invention is not limited to the configuration.

本発明の一実施例の特許分析システムを示したブロック図である。It is the block diagram which showed the patent analysis system of one Example of this invention. 本特許分析システムの動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of this patent analysis system.

符号の説明Explanation of symbols

1 特許公開公報データベース装置
2 特許分類コードデータベース装置
3 特許分析装置
31 入力装置
32 主装置
33 表示装置
34 記憶装置
4 ネットワーク
DESCRIPTION OF SYMBOLS 1 Patent publication gazette database apparatus 2 Patent classification code database apparatus 3 Patent analysis apparatus 31 Input apparatus 32 Main apparatus 33 Display apparatus 34 Storage apparatus 4 Network

Claims (14)

文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置であって、
分析用特許文献を特定するための入力情報を受け付ける入力部と、
前記入力部が受け付けた入力情報にて特定される分析用特許文献を前記公報データベース装置から取得し、該分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手し、該分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する制御部と、
前記制御部が決定した語句を表示する表示部と、を含む特許分析装置。
Patent documents obtained from the publication database device connected to the publication database device for storing patent documents including documents and patent classifications, and the classification database device for storing explanations of the patent classification for each patent classification, A patent analysis device that analyzes using the classification database device,
An input unit for receiving input information for specifying the patent document for analysis;
The analysis patent document specified by the input information received by the input unit is acquired from the publication database device, the explanation of the patent classification included in the analysis patent document is acquired from the classification database device, and the analysis A control unit for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanation of the patent classification;
And a display unit that displays the words determined by the control unit.
請求項1に記載の特許分析装置において、
前記制御部は、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定する、特許分析装置。
The patent analysis apparatus according to claim 1,
The control unit extracts a word related to a problem and a word related to a problem solving method from a document included in the analysis patent document, extracts a word from a description of the patent classification, and a word related to the problem A patent analysis device that determines a phrase representing the gist of the patent document for analysis based on a phrase related to the solution to the problem and a phrase extracted from the explanatory text of the patent classification.
請求項2に記載の特許分析装置において、
前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、
前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなる、特許分析装置。
The patent analysis apparatus according to claim 2,
The phrase related to the task consists of a task word indicating the task and a task category indicating the category of the task,
The patent analysis apparatus, wherein the phrase related to the solution technique of the problem includes a solution word indicating the solution technique and a solution category indicating a category of the solution technique.
請求項2または3に記載の特許分析装置において、
前記制御部は、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析装置。
In the patent analysis device according to claim 2 or 3,
When the phrase extracted from the document included in the analytical patent document matches the phrase extracted from the explanatory text of the patent classification, the control unit represents the gist of the analytical patent document. Patent analysis device that determines a word or phrase.
請求項2ないし4のいずれか1項に記載の特許分析装置において、
前記制御部は、語句ごとに類義語を記憶してある類義語辞書を有し、
前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析装置。
In the patent analysis device according to any one of claims 2 to 4,
The control unit has a synonym dictionary storing synonyms for each word,
When a synonym of a word extracted from a document included in the analysis patent document matches a word extracted from the explanatory text of the patent classification, the synonym is an important word representing the gist of the analysis patent document Patent analysis device that decides.
請求項5に記載の特許分析装置において、
前記入力部は、前記表示部に表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を、さらに受け付け、
前記制御部は、前記入力部が受け付けた修正指示に基づいて、前記表示部に表示された前記語句を修正する、特許分析装置。
The patent analysis device according to claim 5,
The input unit further accepts a correction instruction for correcting a word representing the gist of the patent document for analysis displayed on the display unit,
The said analysis part is a patent analysis apparatus which corrects the said phrase displayed on the said display part based on the correction instruction | indication which the said input part received.
文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、請求項1ないし6のいずれか1項に記載の特許分析装置と、を含む特許分析システム。   A patent document database storing patent documents including documents and patent classifications, a classification database apparatus storing a description of the patent classification for each patent classification, and a patent analysis according to any one of claims 1 to 6. And a patent analysis system including the device. 文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続され、前記公報データベース装置から取得した特許文献を、前記分類データベース装置を用いて分析する特許分析装置が行う特許分析方法であって、
分析用特許文献を特定するための入力情報を受け付ける入力ステップと、
前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得ステップと、
前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手ステップと、
前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定ステップと、
前記決定された語句を表示する表示ステップと、を含む特許分析方法。
Patent documents obtained from the publication database device connected to the publication database device for storing patent documents including documents and patent classifications, and the classification database device for storing explanations of the patent classification for each patent classification, A patent analysis method performed by a patent analysis device that analyzes using the classification database device,
An input step for receiving input information for specifying the patent document for analysis;
An acquisition step of acquiring the patent document for analysis specified by the input information from the publication database device;
Obtaining a description of patent classification included in the patent document for analysis from the classification database device;
A determination step for determining a word or phrase representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanatory note of the patent classification;
And a display step of displaying the determined word / phrase.
請求項8に記載の特許分析方法において、
前記決定ステップでは、前記分析用特許文献に含まれる文書から、課題に関する語句と、課題の解決手法に関する語句と、を抽出し、前記特許分類の説明文から語句を抽出し、前記課題に関する語句と、前記課題の解決手法に関する語句と、前記特許分類の説明文から抽出された語句と、に基づいて、前記分析用特許文献の要旨を表す語句を決定する、特許分析方法。
The patent analysis method according to claim 8,
In the determining step, from a document included in the analysis patent document, a word related to a problem and a word related to a problem solving method are extracted, a word is extracted from an explanatory text of the patent classification, and a word related to the problem A patent analysis method for determining a phrase representing a gist of the patent document for analysis based on a phrase related to the solution to the problem and a phrase extracted from an explanatory note of the patent classification.
請求項9に記載の特許分析方法において、
前記課題に関する語句は、前記課題を示す課題語と、前記課題のカテゴリを示す課題カテゴリとからなり、
前記課題の解決手法に関する語句は、前記解決手法を示す解決語と、前記解決手法のカテゴリを示す解決カテゴリとからなる、特許分析方法。
The patent analysis method according to claim 9,
The phrase related to the task consists of a task word indicating the task and a task category indicating the category of the task,
The patent analysis method, wherein the phrase related to the solution method of the problem includes a solution word indicating the solution method and a solution category indicating a category of the solution method.
請求項9または10に記載の特許分析方法において、
前記決定ステップでは、前記分析用特許文献に含まれる文書から抽出された語句が、前記特許分類の説明文から抽出された語句と一致すると、該語句は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析方法。
The patent analysis method according to claim 9 or 10,
In the determination step, when a phrase extracted from a document included in the analysis patent document matches a phrase extracted from the explanatory text of the patent classification, the phrase represents an important point of the analysis patent document. Patent analysis method that determines a phrase.
請求項9ないし11のいずれか1項に記載の特許分析方法において、
前記特許分析装置は、語句ごとに類義語を記憶してある類義語辞書を有し、
前記決定ステップでは、前記分析用特許文献に含まれる文書から抽出された語句の類義語が、前記特許分類の説明文から抽出された語句と一致すると、該類義語は、前記分析用特許文献の要旨を表す重要語句であると決定する、特許分析方法。
The patent analysis method according to any one of claims 9 to 11,
The patent analyzer has a synonym dictionary storing synonyms for each word,
In the determining step, when a synonym of a phrase extracted from a document included in the analysis patent document matches a phrase extracted from the explanatory text of the patent classification, the synonym Patent analysis method that determines that it is an important word to represent.
請求項12に記載の特許分析方法において、
前記表示された分析用特許文献の要旨を表す語句を修正する旨の修正指示を受け付ける受付ステップと、
前記修正指示に基づいて、前記表示された語句を修正する修正ステップと、をさらに含む、特許分析方法。
The patent analysis method according to claim 12,
An accepting step of accepting a correction instruction for correcting a word representing the gist of the displayed analytical patent document;
A patent analysis method, further comprising: a correction step of correcting the displayed phrase based on the correction instruction.
文書および特許分類を含む特許文献を格納する公報データベース装置と、前記特許分類ごとに該特許分類の説明文を格納する分類データベース装置と、に接続されたコンピュータに、特許分析処理を実行させるプログラムであって、
分析用特許文献を特定するための入力情報を受け付ける入力処理と、
前記入力情報にて特定される分析用特許文献を前記公報データベース装置から取得する取得処理と、
前記分析用特許文献に含まれる特許分類の説明文を前記分類データベース装置から入手する入手処理と、
前記分析用特許文献に含まれる文書と、該特許分類の説明文と、に基づいて、該分析用特許文献の要旨を表す語句を決定する決定処理と、を含む特許分析処理を、前記コンピュータに実行させるプログラム。
A program for causing a computer connected to a publication database device for storing patent documents including documents and patent classifications and a classification database device for storing explanations of the patent classification for each patent classification to execute a patent analysis process. There,
An input process for receiving input information for specifying the patent document for analysis;
An acquisition process for acquiring the patent document for analysis specified by the input information from the publication database device;
An acquisition process for obtaining a description of a patent classification included in the patent document for analysis from the classification database device;
A patent analysis process including: a determination process for determining a word representing the gist of the patent document for analysis based on a document included in the patent document for analysis and an explanatory text of the patent classification; The program to be executed.
JP2005340266A 2005-11-25 2005-11-25 Patent analyzing device, patent analyzing system, patent analyzing method and program Pending JP2007148630A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005340266A JP2007148630A (en) 2005-11-25 2005-11-25 Patent analyzing device, patent analyzing system, patent analyzing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005340266A JP2007148630A (en) 2005-11-25 2005-11-25 Patent analyzing device, patent analyzing system, patent analyzing method and program

Publications (1)

Publication Number Publication Date
JP2007148630A true JP2007148630A (en) 2007-06-14

Family

ID=38209997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005340266A Pending JP2007148630A (en) 2005-11-25 2005-11-25 Patent analyzing device, patent analyzing system, patent analyzing method and program

Country Status (1)

Country Link
JP (1) JP2007148630A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009001696A1 (en) * 2007-06-22 2008-12-31 Patent Result Co., Ltd. Information processing device, program and information processing method
WO2009150758A1 (en) * 2008-06-13 2009-12-17 株式会社パテント・リザルト Information processing device, program and information processing method
KR20140059999A (en) * 2012-11-09 2014-05-19 (주)윕스 Apparatus for manufacturing search report and method for displaying the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009001696A1 (en) * 2007-06-22 2008-12-31 Patent Result Co., Ltd. Information processing device, program and information processing method
WO2009150758A1 (en) * 2008-06-13 2009-12-17 株式会社パテント・リザルト Information processing device, program and information processing method
KR20140059999A (en) * 2012-11-09 2014-05-19 (주)윕스 Apparatus for manufacturing search report and method for displaying the same
KR102043434B1 (en) 2012-11-09 2019-11-11 (주)윕스 Apparatus for manufacturing search report and method for displaying the same

Similar Documents

Publication Publication Date Title
US8090724B1 (en) Document analysis and multi-word term detector
JP4654745B2 (en) Question answering system, data retrieval method, and computer program
US7526474B2 (en) Question answering system, data search method, and computer program
US8635061B2 (en) Language identification in multilingual text
JP5403696B2 (en) Language model generation apparatus, method and program thereof
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US20080077397A1 (en) Dictionary creation support system, method and program
KR101508070B1 (en) Method for word sense diambiguration of polysemy predicates using UWordMap
KR101507637B1 (en) Device and method for supporting detection of mistranslation
US9690797B2 (en) Digital information analysis system, digital information analysis method, and digital information analysis program
US20100125448A1 (en) Automated identification of documents as not belonging to any language
CN112691379A (en) Game resource text auditing method and device, storage medium and computer equipment
KR20170008357A (en) System for Translating Using Crowd Sourcing, Server and Method for Web toon Language Automatic Translating
JP4143085B2 (en) Synonym acquisition method and apparatus, program, and computer-readable recording medium
JP2007148630A (en) Patent analyzing device, patent analyzing system, patent analyzing method and program
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
US20110106849A1 (en) New case generation device, new case generation method, and new case generation program
US8977538B2 (en) Constructing and analyzing a word graph
JP5285491B2 (en) Information retrieval system, method and program, index creation system, method and program,
JP5025603B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JP5673265B2 (en) Calibration support apparatus and calibration support program
CN114444491A (en) New word recognition method and device
KR101614551B1 (en) System and method for extracting keyword using category matching
JP4592556B2 (en) Document search apparatus, document search method, and document search program
JP3952964B2 (en) Reading information determination method, apparatus and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091014

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100224