WO2011149178A2 - 니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템 - Google Patents

니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템 Download PDF

Info

Publication number
WO2011149178A2
WO2011149178A2 PCT/KR2011/001312 KR2011001312W WO2011149178A2 WO 2011149178 A2 WO2011149178 A2 WO 2011149178A2 KR 2011001312 W KR2011001312 W KR 2011001312W WO 2011149178 A2 WO2011149178 A2 WO 2011149178A2
Authority
WO
WIPO (PCT)
Prior art keywords
classification
information
niche
node
fusion
Prior art date
Application number
PCT/KR2011/001312
Other languages
English (en)
French (fr)
Other versions
WO2011149178A3 (ko
Inventor
구자철
김철영
강병엽
강민수
Original Assignee
(주)광개토연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020100050279A external-priority patent/KR101610938B1/ko
Priority claimed from KR1020100113561A external-priority patent/KR101201218B1/ko
Application filed by (주)광개토연구소 filed Critical (주)광개토연구소
Publication of WO2011149178A2 publication Critical patent/WO2011149178A2/ko
Publication of WO2011149178A3 publication Critical patent/WO2011149178A3/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Definitions

  • the present invention relates to a method and system for processing information for searching, analyzing, and evaluating niche technology, and more particularly, by using other classification systems such as international common, US, Japan, and European proprietary patent classification systems and index classifications. It supports the exploration of the area effectively, supports the multi-level analysis of the niche description area with the evaluation element values of multiple niche evaluation elements, and generates and generates a niche evaluation model with the niche evaluation criteria and the niche evaluation element values. It relates to an information processing method and an information processing system for evaluating a niche description area with a niche evaluation model.
  • Patent information has the characteristics of technical information, rights information and management information, and its importance is increasing in the global international competition.
  • technical information it is possible to know the trend of technology development and technical ideas applied to individual patents, and as the right information, it is possible to grasp the scope of rights of individual patents and the degree of nationalization of domestic and foreign rights.
  • patent information system There are many ways to obtain patent information, but there are largely 1) the use of patent information system provided by each country's patent office, 2) the use of patent information system developed by private companies, and 3) the individual company's purpose. It can be classified into using a patent information system that is properly constructed.
  • a representative example of the method of 1) is a patent information system provided by the Korean Intellectual Property Office (www.kipo.go.kr) and the Korean Patent Information Service (www.kipris.or.kr), and 2) a representative example of the US www.delphion .com, www.patolis.co.jp in Japan, www.wips.co.kr in Korea and www.wisdomain.com.
  • AUREKA extracts keywords through text mining and co-occurrences to provide contour maps.
  • the AUREKA service shows frequent keyword groups with attractive contour maps, but the ocean (area filled with blue) or keywords
  • There is no technical meaning for non-dense areas AUREKA has no grid (latitude / longitude, coordinate axes)) and there is a problem that it cannot provide high value-added services such as structural discovery of niche technology.
  • Patent information is a collection of technical collective intelligence, a valuable human asset that has the characteristics that most of the world's technical knowledge is first disclosed as a patent. By exploring this patent information effectively, you will find patterns in technology convergence.
  • Prior patents include Korean Patent Application Nos. 10-2007-0061273, 10-2007-0002555, 10-2007-0129437, 10-2007-0129270, 10-2007-0129387, 10-2007-00129367, 10-2008-0126562, 10-2009-0082997 and the like.
  • This prior patent describes in detail a method of finding a fusion pattern through association analysis of patent classification information and keywords. These patents focus on exploring fusion in terms of the existence of associations.
  • the generated fusion information may be informative in itself, but in the patent sense, it is legally preempted by at least one subject in at least one country. Or at least published.
  • the generated fusion information may be informative in itself, but in the patent sense, it is legally preempted by at least one subject in at least one country. Or at least published.
  • this blank fusion area can be a new niche technology area, the discovery of this blank fusion area is actively used for making R & D decisions, making new business entry areas, and exploring or exploring future new business. As an important field, systematic discovery of these niche technologies that others have not tried is urgently needed in the industry.
  • the first technical problem to be solved by the present invention is to propose an information processing method of a patent information system that provides a niche technology area search service.
  • the second technical problem to be solved by the present invention is to propose a patent information system that provides a niche technology area search service.
  • a third technical problem to be solved by the present invention is to propose an information processing method of a patent information system for generating a niche technology evaluation model that supports niche technology area evaluation.
  • the fourth technical problem to be solved by the present invention is to present a patent information system for generating a niche technology evaluation model that supports niche technology area evaluation.
  • An object of the present invention is to disclose a method of generating blank fusion candidate information and important blank fusion candidate information and providing the user with the patent information. Through such a blank fusion candidate, a method of supporting the effective search of the niche description region may be disclosed.
  • Another object of the present invention is to disclose a system for generating and providing blank fusion candidate information and critical blank fusion candidate information to a user.
  • an information processing method of a patent information system that provides a niche technology area search service to a user computer through a wired or wireless network, wherein the patent information system is (a) from the user computer; Receiving selection information about the first patent classification set using the patent classification and the second classification set using the at least one second classification; (b) constructing an intersection region set having at least two intersection regions using the first patent classification set and the second classification set; And (c) generating at least one niche analysis information as at least one cross region value of at least one cross region constituting the cross region set based on a cross region document set (cross region set) corresponding to the cross region.
  • the first patent classification is any one or more of IPC, F-term, FI, UPSC, and ECLA, and provides an information processing method of a patent information system providing a nich technology area search service. .
  • intersection area value and the intersection area value processing result of processing the intersection area value and the intersection area value on a predetermined basis in the intersection area in the intersection area.
  • the cross region set is preferably a cross region frame in the form of a matrix or a cube using the first patent classification set and the second classification set.
  • the cross-domain document set is a partial document set of at least one target document set, and the target document set is a document set specified or created by the user, or a document set specified or generated by the system, and optional
  • the target document set may be limited to documents that satisfy a predetermined limit condition, and the limit condition may be a time limit, an applicant or an owner limit, an inventor limit, a patent evaluation score or a patent evaluation level limit, an applicant, an owner, or It is preferable that it is any one or more of limitation of the attribute of an inventor, limitation of the satisfaction degree of a patent evaluation index, limitation of whether a specific bibliographic attribute is included, or limitation of the measured value about a patent.
  • the second classification is a patent classification or a semi-patent classification having a corresponding relationship with the patent classification
  • the semi-patent classification is any one or more of IndextoUSPC and CatchWord
  • the semi-patent classification is at least one patent classification per one semi-patent classification. It is preferable that is corresponded.
  • step (a) it is preferable to process the lower patent classification for the selected upper patent classification as the first patent classification set by selecting at least one or more upper patent classifications having at least one lower patent classification. Do.
  • the cross-domain document set is composed of documents that simultaneously satisfy the attributes of the first patent classification constituting the first patent classification set and the second classification constituting the second classification set among the target document sets. Satisfies all or part of the first patent classification and the second classification simultaneously in the cross-domain document, or all or at least one higher patent classification on the patent classification system of the patent classification in the cross-domain document Preferably, a portion appears simultaneously in the first patent classification and the second classification.
  • the first patent classification set includes a lower patent classification selected by the user among all lower patent classifications of the upper patent classification with respect to any one upper patent classification in the patent classification system.
  • the niche analysis information may be selected by the user, and the niche analysis information may use at least one niche analysis index or a niche analysis model, and the intersection area value may be used to select the niche analysis index or the niche analysis model. It is preferable to vary according to.
  • a patent classification constituting the first patent classification set and a second classification constituting the second classification set appear.
  • the cross region frame indicates a patent classification constituting the first patent classification set.
  • a first frame axis, a second frame axis in which a second classification constituting the second classification set appears, and a method of arranging the intersection areas includes an order in which the first patent classification set is arranged on a patent classification system;
  • the patent for which there is a cross-section set except for the patent classification or the second classification without the cross-section set is not the patent classification of the second classification without the cross-section set.
  • Any one of the third arrangement methods to be disposed close to one frame axis is applied, and the first arrangement method, the second arrangement method, and the third arrangement method are selected by the user or set up of the system. It is preferred that it can be selected according to.
  • a patent information system for providing a niche technology area search service to a user computer through a wired or wireless network, the first patent classification set using a first patent classification from the user computer and A cross region frame selection unit receiving selection information about a second set of classifications using at least one second classification; An intersection region generation generator configured to form an intersection region set having at least two intersection regions using the first patent classification set and the second classification set; And generating niche analysis information for at least one intersecting region constituting the intersecting region set, by generating one or more niche analysis information as an intersecting region value based on a cross region document set (intersecting region set) corresponding to the intersecting region set.
  • a first patent classification is any one or more of IPC, F-term, FI, UPSC, and ECLA.
  • the patent information system provides a niche technology area search service.
  • the niche analysis information display unit may further include a niche analysis information display unit configured to display at least one of the intersection area value and the intersection area value processing result of processing the intersection area value on a predetermined basis in the intersection area.
  • the apparatus further includes a selection frame management unit configured to manage selection history and current selection of the first patent classification set and the second classification set.
  • the niche analysis information generation unit may include a niche viewpoint analysis information generation unit configured to generate niche analysis information for each niche viewpoint; And a niche model analysis information generator configured to generate niche analysis information for each niche model. It is preferable to further include any one or more of.
  • the cross region set arrangement unit for arranging the cross region set further comprises, wherein the cross region set arrangement unit the cross region set arrangement unit arranges the cross region
  • a first arrangement method for arranging the first patent classification set on the patent classification system and the second classification set on the second classification system on the basis of the first classification method and the patent classification of the first patent set If there is no cross region set or there is no cross region set corresponding to the second classification of the second classification set, the patent classification or the second classification with the cross region set except for the patent classification or the second classification without the cross region set
  • the patent information system is (M1) N sample documents For the set, each of the N sample document sets is divided into two or more parts by applying at least one or more partitioning criteria to form a first partial sample document set and at least one second partial sample document set (partial sample document set).
  • the present invention proposes an information processing method of a patent information system, which is a natural number and the documents constituting the document set are patent documents.
  • the division criterion may be at least one predetermined time point or at least one time point at which a predetermined type of variation occurs in the sample document set.
  • the variation of the preset type may be any one of a variation over a preset range of document amount, a variation over a preset range of subject amount, and a variation over a preset range of preset variable value that can be calculated for the sample document set. It is preferable.
  • the division criteria applied to the N sample document sets may be different for each of the N sample document sets.
  • the number of first partial sample document sets generated in the step (M1) may be different from the number of first partial sample document sets used in the step (M2), and the second partial generated in the step (M1)
  • the number of sample document sets and the number of second partial sample document sets used in the step (M2) may be different, and the first partial sample document set and the second partial sample document set may be empty sets.
  • any one of the first partial sample document set and the second partial sample document set is an empty set, it is preferable that the divided sample document set due to the sample document set in which the empty set occurs does not perform step (M2). .
  • the niche reference element is either a single niche reference element or a composite niche reference element generated using at least one niche evaluation element, and if the niche reference element uses a niche evaluation element, step (M3) is performed. In this case, the niche evaluation element used above is preferably removed.
  • the niche evaluation element is to be grouped into at least two or more groups, and the group is a group generated by a niche evaluation element in terms of total amount, a group generated by a niche evaluation element in terms of variation, and a niche evaluation element in terms of quality. It is preferred to include any one of the group to be generated, and the group generated by the niche evaluation element of the novel aspect.
  • the statistical algorithm is a nonlinear algorithm of the machine learning sequence.
  • the nonlinear algorithm is preferably a boosting algorithm.
  • Steps (M3) to (M4) are performed for each group, and the niche evaluation model is generated for each group.
  • the niche evaluation model may further include a niche evaluation value generation model, and the niche evaluation value generation model may be configured in response to at least two or more niche evaluation elements of the acquisition document set for a specified or input acquisition document set.
  • the niche evaluation element value information is generated, and the niche score is generated using the generated niche evaluation element value information.
  • Generating the niche evaluation model preferably includes at least one of generating statistical analysis information for each niche evaluation element, generating niche evaluation model verification information, and adjusting an overfit prevention parameter.
  • the method may further include generating the niche evaluation value for each of the divided acquisition document sets by performing step (M7).
  • the method may further include selecting the divided acquisition document set information that is equal to or greater than a predetermined evaluation value or a predetermined ranking from the niche evaluation values generated for each of the plurality of divided acquisition document sets.
  • At least one preset patent analysis is performed on the divided acquisition document sets having the niche evaluation value equal to or greater than a predetermined evaluation value or a predetermined ranking or more, and the preset niches as a result of the divided acquisition document sets and the performed patent analysis. It is desirable to generate discovery reporting information.
  • a patent information system for generating a niche technology area discovery model with a user computer through a wired or wireless network
  • the patent information system includes a niche evaluation model generation unit, the niche evaluation model The generation unit divides each of the N sample document sets into two or more parts by applying at least one partitioning criterion to N sample document sets to form a first partial sample document set and at least one second partial document document set.
  • a document set split module configured to generate niche reference element value information for the niche reference element for the first partial sample document set and the second partial sample document set;
  • a niche evaluation value generation module configured to generate niche evaluation element value information for at least two niche evaluation elements for the first partial sample document set;
  • a niche evaluation algorithm generation module configured to generate a niche evaluation model by applying a predetermined statistical algorithm using the niche reference element value as a dependent variable value and the niche evaluation element value as an independent variable value. It is a natural number, and the document constituting the document set proposes a patent information system characterized in that the patent document.
  • a niche analysis document set acquisition unit for obtaining a designated or input set of acquisition documents that are subject to niche evaluation; And a niche evaluation value generation module for generating a niche evaluation value with the niche evaluation model using the niche evaluation element value information.
  • the obtained document sets are divided to generate a plurality of divided document sets, the niche evaluation value is generated for each of the generated set of partitioned document sets, and each of the divided document sets
  • the niche discovery simulation module may further include a niche discovery simulation module configured to select the divided acquisition document set that is greater than or equal to a predetermined evaluation value from the generated niche evaluation value.
  • At least one preset patent analysis is performed on the divided acquisition document sets having the niche evaluation value equal to or greater than a predetermined evaluation value or a predetermined ranking or more, and the preset niches as a result of the divided acquisition document sets and the performed patent analysis. It is preferable to include a; niche discovery reporting information generation unit for generating discovery reporting information.
  • a network diagram utilizing the unit fusion element generated using (A) at least one patent set consisting of at least one patent document (A) Generating a; (B) acquiring a discovery node for the selected branch node when there is selection information on at least one or more center nodes and at least one or more branch nodes connected to the center node among the nodes constituting the network diagram; And (C) selecting unused search nodes from the search nodes and processing the unused search nodes as blank fusion candidate information.
  • the branch node is selected from a user computer of the patent information system.
  • the center node is selected by a predetermined selection criterion of the user computer or the patent information system, and in step (B), the search node of the branch node on the classification scheme to which the branch node belongs to the branch node belongs. It may be a sibling node or a child node of the branch node, and the unused search node in the step (C) may be based on a combination generated by the center node and the unused search node.
  • the unit fusion element is at least one selected from a patent classification combination consisting of two or more patent classifications, a keyword combination consisting of two or more keywords, and an index combination corresponding to a patent classification, and the patent classification combination and the index combination are
  • the keyword is generated based on two or more patent classifications included in the patent document, wherein the keyword is any one or more of a keyword extracted from the patent document, a keyword processed from the keyword extracted from the patent document, the unit
  • the generation of the fusion element is performed when the unit fusion element is a patent classification combination or an index combination, which is performed on a patent document including two or more patent classifications based on at least one or more types of patent classifications of the patent documents. Blank fusion candidate information using patent information It discloses a method of generating.
  • the unit fusion element generated in the step (A) is based on the pre-set fusion processing criteria among the unit fusion elements generated for each of the first patent set consisting of at least one patent document and at least one second patent set consisting of patent documents
  • the unused search node in step (C) is a first set of patents and at least one in the step (A) based on a combination generated by the center node and the unused search node. It is preferable that the combination is not generated in the unit fusion element generated for each second patent set.
  • the method of generating the first patent set and the second patent set of step (A) may be performed by dividing the generated or received at least one patent set by applying at least one division processing criterion to the first patent set divided into any one patent set.
  • the patent set is generated by any one of a third method of generating the second patent set.
  • the fusion processing criteria is that the unit fusion element is present only in one patent set for each of the first patent set and the second patent set, or 2) for each unit of the unit fusion element.
  • the frequency is greater than or equal to a predetermined difference, or 3) the frequency of the unit fusion element for each patent set is greater than or equal to a preset increase rate, or 4) the frequency of the unit fusion element for each patent set is more than or equal to a preset increase acceleration, or 5 )
  • the frequency of the unit fusion element for each patent set is preferably to establish a predetermined function relationship or a predetermined condition relationship.
  • the generating of the unused search node in the step (C) may include a combination overlapping the unit fusion element generated in the step (A) among the combinations constituting the combination set generated by the center node and the search node.
  • the manner in which the unused search node is displayed in the network diagram is that the unused search node is disposed around the branch node, and optionally, any one of the center node, the branch node, and the unused search node.
  • a connection line of a predetermined type is displayed between two or more, and optionally, at least one analysis information of a patent document set consisting of patent documents corresponding to two nodes connected by the connection line is displayed on the connection line.
  • the analysis information includes a frequency, and optionally, the shape of the connection line may vary according to the analysis information, and optionally, the shape of the node may include the center node, the branch node, and the unused search node.
  • the information appearing in the node may be 1) the method of displaying only the patent classification, 2) only the title corresponding to the patent classification. And 3) either the patent classification or the method of displaying the title.
  • the unused search node further includes a sub-classification extension indication. In the classification scheme to which the search node belongs, a lower node of the unused search node is disposed around the unused search node, and optionally, when the search node is a lower node of the branch node, the unused search node.
  • the center node When is displayed, among the sibling nodes of the unused search node, the center node is preset with the center node. It is preferable that sibling nodes constituting the unit fusion element satisfying the fusion processing criteria are also displayed while being distinguished from the unused search node.
  • a criterion met by the usage search node and the branch node is that the number of patent documents in which the non-use search node and the branch node come together is greater than or equal to a predetermined criterion, or greater than or equal to a preset growth rate, or greater than or equal to a predetermined growth rate. It is preferable that any one or more of the cases establish a functional relationship.
  • the first patent set and the second patent set are divided based on the first divided patent set and the at least one second divided patent set by dividing the generated or received at least one patent set by applying at least one split processing criterion.
  • the divisional processing criteria may be generated by any one or any combination of two or more of an issuer country, a time range, an applicant or an owner or assignee, an inventor, a patent classification, a patent subject classification, and a predetermined classification attribute included in the patent document.
  • the time that is the basis of the time range is to use any one or a combination of two or more of the priority date, application date, publication date and registration date of the patent document, the patent classification is IPC, USPC, FT , FI and ECLA, or any combination of two or more, wherein the patent topic classification is a Or a subject classification generated using at least one of the index of the USPC or the IPC, USPC, FT, FI, and ECLA, and the preset classification attribute is applied to the applicant or the owner or the assignee. It is preferably one or more of a classification attribute, a classification attribute for each patent classification constituting the patent classification, a classification attribute for the inventor, or a classification attribute for the patent subject classification.
  • the patent information system is a unit fusion element generating unit for generating a unit fusion element using at least one or more patent set consisting of at least one patent document;
  • a fusion pattern analyzer configured to generate a network diagram using the generated unit fusion elements; And when there is selection information on at least one or more center nodes and at least one or more branch nodes connected to the center node among the nodes constituting the network diagram, the search node for the selected branch node is obtained, and among the search nodes.
  • a blank fusion candidate discovery unit that selects unused search nodes and processes them into blank fusion candidate information, wherein the branch node is selected from a user computer of the patent information system, and the center node is the user computer or the patent. Selected by a predetermined selection criterion of the information system, wherein the search node is a sibling node of the branch node or a subordinate node of the branch node in a classification scheme to which the branch node belongs to the branch node.
  • Unused search node is the center Node associated with a combination that does not exist in the unit fusion element generated using the patent set based on the combination generated by the node and the unused search node, wherein the unit fusion element is a patent consisting of two or more patent classifications At least one selected from among a classification combination, a keyword combination consisting of two or more keywords, and an index combination corresponding to a patent classification, wherein the patent classification combination and the index combination include two or more patent classifications included in the patent document.
  • the keyword is generated on the basis of, wherein the keyword is any one or more of the keyword extracted from the patent document, the keyword processed from the patent document, the generation of the unit fusion element is the unit fusion element is the patent classification
  • the keyword is any one or more of the keyword extracted from the patent document
  • the keyword processed from the patent document the generation of the unit fusion element is the unit fusion element is the patent classification
  • Patent discloses an information system for generating a blank fusion candidate information, characterized in that one or more, based on the patent classification to be conducted in the patent document that includes at least two patent classification.
  • the patent set is a first patent set composed of at least one patent document and at least one second patent set composed of patent documents, and the unit fusion element is generated for each of the first patent set and the second patent set.
  • the unit fusion element is a unit fusion element that satisfies a predetermined fusion processing criterion, wherein the unused search node is the first patent set and the second patent based on a combination generated by the center node and the unused search node. It is preferable that the node is related to a combination that is not generated in the unit fusion element generated for each set.
  • a search included in the remaining combination after excluding a combination overlapping with the unit fusion element among combinations constituting a combination set generated by the center node and the search node
  • Any one of a first method of processing a node and a second method of excluding a node used in a unit fusion element including a center node among the unit fusion elements among the search nodes and processing the remaining search node It is preferable.
  • the fusion pattern analyzer performs a function of displaying the unused search node on the network diagram, and the method of displaying the unused search node in the network diagram may include disposing the unused search node around the branch node.
  • a connection line of a predetermined type is displayed between any two or more of the center node, the branch node, and the unused search node, and optionally the fusion pattern.
  • the analysis unit processes information, at least one analysis information of a patent document set consisting of patent documents corresponding to two nodes connected by the connection line is displayed on the connection line, and the analysis information includes a frequency.
  • the fusion pattern analyzer When performing the beam processing, the shape of the connection line may be changed according to the analysis information.
  • the shape of the node is the center node, the branch node, and the ratio.
  • the fusion pattern analyzer processes the information
  • the center node, the branch node, and the unused search node are related to patent classification.
  • the information displayed in the node may be any one of 1) a method of displaying only the patent classification, 2) a method of displaying only a title corresponding to the patent classification, and 3) a method of displaying both the patent classification and the title.
  • the unused search node further includes a lower classification extension indication.
  • a lower node of the unused search node is disposed around the unused search node on a classification scheme to which the unused search node belongs, and optionally, the fusion pattern analyzer A unit that satisfies a predetermined convergence processing criterion with the center node among sibling nodes of the unused search node when the search node is a lower node of the branch node when processing the information. It is preferable that sibling nodes constituting a fusion element are also displayed together while being distinguished from the unused search node.
  • the blank fusion candidate discovery unit may further include a significant blank fusion candidate discovery unit that generates important unused search node information.
  • the method of generating the significant unused search node information by the significant blank fusion candidate discovery unit may include the unused search.
  • the generated unused search nodes are collected, they are generated as unused search nodes with a high frequency sequence.
  • the criterion that the unused search node and the branch node meet is equal to the number of patent documents in which the unused search node and the branch node come together. It is preferably one or more of a predetermined criterion, a predetermined growth rate or more, a predetermined growth rate or more, or a case of establishing a predetermined function relationship.
  • the niche technology area can be explored very easily, thus enjoying the opportunity for discovery and propagation of the niche technology area.
  • the document set can be analyzed from various angles, and the niche area under various frames can be easily explored.
  • the niche technology area becomes clearly visible visually, and the efficiency of the search is maximized.
  • a legend such as a color to the evaluation value for the niche description region, visual clarity can be enjoyed, and the priority of search can be easily determined.
  • a convergence pattern can be easily processed through various information processing, such as a set operation using unit fusion elements, for a divided patent set that is divided by various division criteria for a patent set for which convergence information is desired. I can find it.
  • fusion information can be generated in advance for various objects such as each patent classification, each applicant, and each inventor, so that users can quickly and conveniently provide fusion information. .
  • blank fusion candidate information can be easily generated, and the generated blank fusion candidate information can be intuitively delivered to a user through a network diagram.
  • a blank fusion candidate that may be related to the technology of interest may be generated at an equal or advanced technology level, and the generated blank fusion candidate may be generated. It can be presented intuitively to users, and it can be widely used in activities such as technology search and analysis, or discovery of technology elements or product elements that are applicable to the expansion, application, addition, and application of one's own or others' core technologies. Can be.
  • the proposed blank fusion candidates it is possible to easily find an area that can be preoccupied, developed, improved, extended, or applied.
  • important blank fusion candidate information can be easily generated, and can be presented with emphasis in a preferential or special manner among the blank fusion candidates found.
  • users are more likely to be primarily used in activities such as technology exploration or analysis, or in discovering technical or product elements that are intended to expand, apply, add, or apply core technologies of themselves or others.
  • Candidate information may be provided.
  • FIG. 1 is a diagram illustrating an exemplary network configuration of a patent information system of the present invention.
  • FIG. 2 is a diagram illustrating an exemplary embodiment of a patent information system of the present invention.
  • FIG. 3 is an exemplary diagram of a data processing unit of the present invention.
  • FIG. 4 is an exemplary diagram of a data processing unit of the present invention.
  • FIG. 5 is an exemplary view of a patent information service support unit of the present invention.
  • FIG. 6 is an exemplary view of a patent analysis information generation unit of the present invention.
  • FIG. 7 is an exemplary view of a patent analysis information generation unit of the present invention.
  • FIG. 8 is an exemplary view of the configuration of the niche description region discovery system of the present invention.
  • FIG. 9 is an exemplary diagram for a method of generating a niche evaluation model of the present invention.
  • FIG. 10 is an exemplary diagram for a method for generating a niche evaluation value with the niche evaluation model of the present invention.
  • FIG. 11 is an exemplary diagram for a simulation method of discovering a niche description region using the niche evaluation model of the present invention.
  • FIG. 12 is an exemplary diagram of a method for generating a crossing zero value as a niche evaluation element value in an intersection region by the niche description region discovery system of the present invention.
  • FIG. 13 is an exemplary diagram of a method for generating niche analysis information using a niche description area discovery system of the present invention.
  • FIG. 14 is an exemplary diagram illustrating a method for changing a patent classification set or a classification set to form a new cross region set and generating a cross zero value by the niche description region discovery system of the present invention.
  • FIG. 15 is an exemplary diagram illustrating a method of generating a cross-zero value by defining a target document set using a niche option by the niche description region discovery system of the present invention.
  • Figure 16 is one embodiment implementation of a niche description region discovery system of the present invention.
  • the niche description region navigation UI of the present invention is shown.
  • FIG. 17 is a diagram illustrating an embodiment of a method of selecting a first patent classification set using the first patent classification. 17 shows that the entire 5D107AA is being selected.
  • FIG. 18 is a diagram illustrating an example in which the niche analysis information generation unit selects a niche viewpoint in order to generate niche analysis information for another niche evaluation element (another niche viewpoint).
  • 19 is a conceptual diagram illustrating a process of selecting a patent classification or classification desired from a root among a first patent classification set and a second classification set by using the cross region frame selection unit.
  • FIG. 20 is a diagram illustrating an example in which at least one of a horizontal frame and a vertical frame is changed and niche analysis information according to a niche perspective is generated based on the changed frame.
  • 21 is an example of the graph which shows the temporal change of the patent application number with respect to the technical area A with respect to the patent of a specific country.
  • FIG. 22 is an example of the graph which shows the temporal change of the patent application number with respect to the technical areas A, B, and C.
  • FIG. 23 is a diagram illustrating a summary of the Gradient Boost algorithm algorithm.
  • 24 is an auxiliary diagram for explaining the case of overfitting.
  • FIG. 25 is a diagram illustrating a summary of an algorithm proposed by Friedman (2002) to newly propose a stochastic gradient boosting algorithm.
  • FIG. 26 is a view for explaining an exemplary concept related to a niche evaluation model generation process.
  • FIG. 27 is a diagram illustrating an Aureka analysis result screen according to the related art.
  • FIG. In this screen it can be seen that there is no technical name of the title, legend, zone, and cell of the coordinate axis.
  • thermograph effect is applied to each axis and zone / cell.
  • FIG. 29 is a diagram of a portion of a patent classification system showing sibling nodes of H01B 1/06 at the bottom of H01B 1/00 and lower patent classification nodes of H01B 1/06.
  • 30 is an exemplary diagram of information on the catchwords for the IPCs provided by the WIPO.
  • FIG. 31 is an exemplary diagram of an index for a USPC provided by the USPTO.
  • FIG. 31 is an exemplary diagram of an index for a USPC provided by the USPTO.
  • FIG. 32 is a diagram of one embodiment of a fusion information processing system of the present invention.
  • 33 is a diagram for one embodiment of a simple two-division fusion information model of the present invention.
  • 34 is a diagram illustrating an embodiment of a composite partition fusion information model of the present invention.
  • 35 is a diagram for one embodiment of a simple two-division forward citation fusion information model of the present invention.
  • 36 is a diagram for one embodiment of a composite split forward citation fusion information model of the present invention.
  • FIG. 37 is a diagram showing an embodiment of the key keyword DB of the present invention.
  • 38 is a diagram illustrating a method for generating fusion information in a simple two-division fusion information model of the present invention.
  • FIG. 39 is a diagram for describing a method of generating fusion information in a simple two-division forward citation fusion information model of the present invention.
  • FIG. 40 is an exemplary diagram of another method of generating fusion information in the simple two-division forward citation fusion information model of the present invention.
  • FIG. 41 is an exemplary diagram of another method of generating fusion information in the simple two-division forward citation fusion information model of the present invention.
  • FIG. 42 is a diagram illustrating one embodiment of a network diagram generated by using a keyword combination extracted from a patent document constituting a patent set generated by the fusion information processing system of the present invention as a unit fusion element.
  • FIG. 43 is a diagram illustrating one embodiment of a network diagram newly created by limiting preset conditions with respect to FIG. 42.
  • FIG. 44 is an exemplary diagram of a network diagram generated using a patent classification as a unit fusion element.
  • 45 is a diagram for one embodiment of a method in which the fusion information processing system 9000 generates blank fusion candidate information.
  • 46 is an exemplary diagram of another method in which the fusion information processing system 9000 generates blank fusion candidate information.
  • FIG. 47 illustrates one embodiment of the relationship of A, H01B 1/06 and G05B 9/00 when there are unit fusion elements (A, H01B 1/06) (A, G05B 9/00) that meet the fusion treatment criteria.
  • FIG. 48 illustrates an embodiment in which the fusion information processing system displays first type blank fusion candidate nodes with A having a sibling node relationship with H01B 1/06 when the user selects H01B 1/06; A diagram of an example network diagram.
  • FIG. 49 is a diagram illustrating an exemplary network diagram in which blank fusion candidate nodes with A and a connection line with A are additionally displayed in FIG. 48.
  • 50 is a diagram of an exemplary network diagram in which a blank fusion candidate node is not directly connected to a branch node, but is directly connected to A and displayed.
  • FIG. 51 illustrates that H01B 1/10 and H01B 1/12 are candidates for a blank fusion among the lower patent classifications of H01B 1/06, and an example of each node shows that a patent classification + title is shown together.
  • the patent information system 10000 of the present invention provides an information service to a user computer 100 through a wired / wireless network 200.
  • the patent information system 10000 may be connected to at least one link system 300 and a wired / wireless network 200.
  • An example of the link system 300 is a patent office or a raw data provider of each country that provides patent raw data.
  • An example may be a system, a system of an enterprise information provider, or the like, and at least one or more systems that provide services by linking the services of the patent information system 10000 of the present invention may be examples.
  • the patent information system 10000 includes a data unit 1000, a data processing unit 2000, a search processing unit 3100, an analysis information generating unit 4000, and the like.
  • the data unit 100 includes a patent data unit 1100 and a non-patent data unit 1200.
  • the patent data unit 1100 includes a patent specification file unit 1110, a patent DB 1120, and a patent classification DB. 1130 and other classification DB units 1140.
  • the patent DB 1120 manages bibliographic matters of all patents, the specification body, and drawings for each field, and various fields (title, summary, prior art, claims, detailed description, etc.) constituting the specification body. Contains key keywords extracted from. Meanwhile, the patents may further include citation information as prior art documents for the patents. For example, in the US patent data, the citation information is information included in the reference, and includes US patent document numbers, foreign patent document numbers, and indicators for non-patent documents. Meanwhile, information on prior art research by examiners and related parties of patent offices, and information on verification when submitting opinions of examiners are also widely cited information.
  • the specific document becomes a backward citation document from the perspective of the document included in the forward citation information.
  • the document included in the forward citation information based on a specific document becomes a parent document, and based on the parent document, the specific document becomes a child document. It is obvious to those skilled in the art to process the information in the child-parent relationship with a DB, and a detailed description thereof will be omitted.
  • Patent documents include country information, various date information, various number information, at least one owner information, at least one inventor information, at least one patent classification information, at least one priority information, and the like.
  • Dates include application date, publication date, registration date, and other dates.
  • Various number information includes application number, publication number, registration number, original application number, priority claim number, and the like.
  • the owner information includes the applicant, the assignee, the patent owner, and the like, and if there is a change in the owner, and the change is managed, there may be information on the assignor and the assignee and information on the last owner.
  • Priority information includes information such as priority claim number, claim date, and country.
  • processed bibliographic information includes domestic family information (partitioned application, change application or partial application, patent application that has a continuous application), or foreign family information (applications that may be related to treaty priority relationship, international application, etc.). This can be.
  • the patent classification information may have a unique patent classification for each country such as USPC, FT, FI, ECLA, etc.
  • FIG. 29 is a diagram of a portion of a patent classification system showing sibling nodes of H01B 1/06 at the bottom of H01B 1/00 and lower patent classification nodes of H01B 1/06.
  • the patent classification has a hierarchical structure.
  • Patent classification of the present invention the patent classification includes IPC, USPC, FT, FI, ECLA.
  • An index also called a catchword, refers to a system in which at least one patent classification is associated with a word, phrase, or clause.
  • a catchword that processes the IPC
  • USPC issued by the US Patent and Trademark Office.
  • the index also has a hierarchical structure like a patent classification.
  • keywords corresponding to product names / part names / element descriptions are often embedded. The index makes the classification of patents easy to find and examples are shown in FIGS. 13 and 14.
  • G06C 1/00 corresponds to ABACUSES.
  • ABACUSES is called an index corresponding to G06C 1/00. Accordingly, G06C 1/00 can be reverse mapped to Abacuses.
  • the catchword system has at least one hierarchical structure. ABARADING shows that it is a two-tier hierarchy.
  • the data processor 2000 includes a core keyword generator, a classification metadata generator, and a purpose-specific data generator.
  • a classification metadata generation unit is required, and in order to analyze the found niche description area, a core keyword generation unit and a purpose-specific data generation unit are required.
  • the niche description region discovery system 5000 may include a niche description region discovery engine that supports niche description region discovery, a niche evaluation model generator 5200 for generating a niche evaluation model, and a niche discovery information generation unit for generating niche discovery information ( 5300).
  • the niche description region discovery engine includes an n-dimensional frame processing unit 5110 to process frame information to facilitate discovery of the niche description region, a niche analysis information generation unit 5120 to generate analysis information about the niche region, and various kinds of niche related information.
  • a niche option processor 5130 for processing the option is included.
  • the n-dimensional frame processing unit 5110 may include an intersection region frame selection unit 5111 and an intersection region frame selection unit that support frame selection when an intersection region is generated with a plurality of selected frames with respect to an n-dimensional frame.
  • a cross region set generation unit 5112 generating a cross region set using the determined frame, and a niche at a cross region constituting the generated cross region set with respect to the obtained target document set.
  • a niche analysis information display unit 5113 for displaying analysis information and a selection frame management unit 5114 for managing frame information selected by the user are included.
  • the niche analysis information generation unit 5120 is a niche perspective analysis information generation unit for generating analysis information for each niche perspective selected for each intersection area, and a niche model analysis information generation unit 5122 for generating analysis information for each niche model selected for each intersection area. It includes. On the other hand, the niche analysis information generation unit 5120 may suggest a niche analysis type to assist the user in selecting the niche viewpoint, which is in charge of the niche analysis type presenting unit 5123 of the present invention. In addition, the niche model type presenting unit 5124 of the present invention is responsible for assisting the selection of the niche model type.
  • the niche option processor 5130 includes a limited series of functional units and a legend processor 5135 to perform a limited process.
  • the functional part of the limited series includes a time limiting part for limiting a period, subject limiting part 5152 for managing limitations of applicants, inventors, agents, etc., technical field limiting part 5133 for managing limitations in the technical field, and individual patents.
  • the period may be managed by the type of period (application date, publication date, registration date, best date, etc.).
  • Applicant's limitation may be based on the applicant's name or the applicant's type (company, university, public institution, individual) or nationality of the applicant (can be treated as address information or national information at the time of priority claim) or preset applicant attribute (patent monster) Multi-dispute applicants, such as large companies, applicants for citations, etc.) will be limited to.
  • the inventor may be limited by the inventor, by the nationality of the inventor, or by the type or attribute of the organization to which the inventor belongs.
  • the limitation of the technical field may include a patent classification, a limitation using a quasi patent classification (Catchword, Index, etc.), a limitation using a keyword, and the like.
  • Restrictions on individual patents may include the amount of bibliographic matters (such as the number of claims), the amount of bibliographic matters processed (such as citations), or the pre-set attributes (automatic patent ratings, evaluation scores, disputed patents, and standard patents). It may be limited to the amount or whether) (including a patent including a pool).
  • the niche evaluation model generator 5200 may include a document set dividing module 5210 for dividing a plurality of sample document sets into preset dividing criteria in order to generate a niche evaluation model, and a niche reference element value generating module for generating niche reference element values. (5220), a niche evaluation element value generation module 5230 for generating niche evaluation element values for a given set of documents for each niche evaluation element, a niche evaluation algorithm generation module 5240 for generating a niche evaluation algorithm, and a generated niche evaluation algorithm A niche evaluation algorithm verification module 5250 for verifying the data, and a niche evaluation value generation module 5260 for generating a niche evaluation value for a given set of documents.
  • Various data related to the niche evaluation model are stored in the niche evaluation model DB 5280. Meanwhile, the niche evaluation element value generated for a specific document set (including a cross-sectional document set) may be stored in the niche evaluation element value DB 5270.
  • the niche discovery information generation unit 5300 includes a niche analysis document set acquisition unit 5310 to obtain a niche analysis patent document set.
  • the niche analysis document set acquisition unit 5310 may obtain a document set from the user computer 100, and obtain a document set from the patent information system 10000.
  • the received document set may be a set of documents searched or selected by the user computer 100 or the patent information system 10000 using a search engine unit or a DB query processing unit, or the like. It may be any one or more of the above.
  • the niche discovery information generation unit 5300 may further include a niche discovery simulation module 5320 that performs at least one preset simulation for niche discovery.
  • the information about the found or analyzed niche description region is generated through the niche discovery reporting information generation unit 5330, and the reporting information is generated in a file such as a web or a pdf.
  • the user can communicate with the patent information system 10000 through the niche technology discovery UI unit 5340 of the present invention.
  • 16 is one embodiment implementation of a niche description region discovery system 5000 of the present invention.
  • 16 illustrates a UI unit constituting the niche technology discovery UI unit 5340 of the present invention.
  • the UI unit may include a frame selection UI unit UI110 supporting selection of a horizontal axis and a vertical axis, a niche perspective selection UI unit UI120 supporting selection of a niche perspective, and a niche model selection UI supporting selection of a niche model (not shown) ),
  • the niche option UI unit UI130, and the niche analysis result UI UI140 and the legend viewing UI UI150 providing the niche analysis result are illustrated.
  • the frame selection UI unit includes a vertical selection unit and a horizontal selection unit.
  • the niche perspective selection UI unit may select the niche perspective while providing the niche perspectives into major, middle, and small categories.
  • the above-mentioned niche viewpoints correspond to niche evaluation elements.
  • at least one small classification niche viewpoint may be gathered into one mid-class niche viewpoint, which is called grouping of niche viewpoints (niche evaluation elements), and one niche evaluation element group includes at least one niche evaluation element.
  • grouping of niche viewpoints niche evaluation elements
  • one niche evaluation element group includes at least one niche evaluation element.
  • a date basis and a date range or year can be selected.
  • the niche analysis result shows that the UI unit has n * m (n and m are natural numbers) intersection regions.
  • FTs below FT 5D107AA are listed on the vertical axis (vertical frame) UI160
  • FTs below FT 5D107BB are listed on the horizontal axis (horizontal frame) UI170. It can be seen that these FTs form the outermost of the vertical axis and the horizontal axis, respectively.
  • the niche analysis information appears in the intersection area where the plurality of horizontal axes and the plurality of vertical axes intersect. In FIG.
  • the niche analysis result is processed for a target document set obtained or selected.
  • the information processing method of the niche description region discovery system 5000 is well illustrated in FIG.
  • the cross region frame selection unit 5111 of the niche description region discovery system 5000 may include a first patent classification set using a first patent classification and a second classification using at least one second classification from the user computer 100. Obtain selection information for the classification set (Sa11).
  • FIG. 17 illustrates an embodiment of a method of selecting a first set of patent classifications using the first patent classification.
  • the cross-area frame selection unit 5111 may start from 5D107AA01 below 5D107AA. A list of patent classifications up to 5D107AA20 is provided. In this case, when the user selects the upper patent classification 5D107AA, the cross-region frame selection unit 5111 may process information in such a manner that the patent classifications of 5D107AA01 to 5D107AA20, which are all patent classifications under 5D107AA, are selected on the vertical axis. .
  • the user may select at least one or more patent classifications he wants from 5D107AA01 to 5D107AA20 listed, and the cross region frame selection unit 5111 may configure a vertical axis frame only by the selected patent classification. You can select the horizontal axis in the same way. On the other hand, if a third axis is required as a new dimension, the third frame corresponding to the third axis may be configured in an equivalent manner.
  • the patent classification is taken as an example in the present paragraph, the inventive idea of the present paragraph may be applied to any information structure having a tree structure such as Catchword or IndextoUSPC.
  • the user may process the lower patent classification of the selected upper patent classification as the first patent classification set or the second classification set by selecting at least one or more upper patent classifications having at least one lower patent classification.
  • the first patent classifications it is not necessary for the first patent classifications to be the same sibling or to have a common parent in the patent classification scheme or other classification schemes. That is, any one or more of the patent classification constituting the vertical axis may be selected from 5D107AA or less, and any other one or more may be selected from 5H001 or less.
  • 5D107AA01 or less may further include lower patent classifications such as 5D107AA02, 5D107AA02, 5D107AA03.
  • lower patent classifications such as 5D107AA02, 5D107AA02, 5D107AA03.
  • all patent information of 5D107AA01 or less is stored in 5D107AA01 according to the idea of automatically including sub-patent classification-related information of the present invention.
  • the data processing unit 2000 of the present invention generates a data system having a structure as shown in Table 1 below with reference to the patent classification system.
  • the generated upper patent classification may be generated up to the highest patent classification, but may be generated only up to a predetermined level (for example, a level capable of searching for the extension utilization. Only up to.)
  • a predetermined level for example, a level capable of searching for the extension utilization. Only up to.
  • the hierarchical structure as shown in Table 1 may be generated similarly for other patent classifications such as IPC or USPC.
  • the information as shown in Table 2 may be generated by using the following IPC classification system information.
  • Main group magnets or magnetic bodies characterized by H01F 1/00 magnetic material
  • the niche description region discovery engine configures (Sa12) an intersection region set having at least two or more intersection regions using the first patent classification set and the second classification set.
  • a cross-sectional set consists of a patent classification under 5D107AA and a patent classification under 5D107BB.
  • the title information of the patent classification is preferably displayed on the frame as shown in FIG. 16.
  • the patent classification title and the entire patent classification code are shown as shown in the output characteristic 5D107AA01, or as shown in the output characteristic AA01. It may be processed in such a way that title information and a short form of patent classification code are shown.
  • the intersection area is specified as (PCi, Cj), and the intersection area set is a set of (PCi, Cj).
  • the first arrangement method is based on the order in which the first set of patent classifications are arranged on the patent classification system and the order in which the second classification set is arranged on the second classification system. In this case, there may be blank cells without values in the intersection area, and there may be blank columns and blank rows in which all columns are blank or all rows are blank.
  • the second method of placement may include a patent classification or a second classification having no cross-region set when there is no cross-region set corresponding to the patent classification of the first patent set or no cross-region set corresponding to the second classification of the second classification set. Except for a patent classification or a second classification in which a cross-sectional set exists, based on the order in which the first patent classification set is listed on the patent classification system and the order in which the second classification set is listed on the second classification system. To be deployed. In this case, the possibility of having at least both empty columns or empty rows is significantly reduced.
  • a third arrangement method the higher the sum of the intersection area values for all the intersection areas in the first frame axis direction is, the closer the second frame axis is, and the intersection area values for all the intersection areas in the second frame axis direction are obtained. The higher the sum, the closer the first frame axis is. In this case, intersection regions having a higher or lower niche evaluation factor value or a niche evaluation value are collected toward the edge.
  • the first placement method, the second placement method and the third placement method may be selected according to the user's selection or the setting of the system.
  • the niche analysis information generation unit 5120 converts one or more niche analysis information into at least one intersection region constituting the intersection region set based on the intersection region document set corresponding to the intersection region as the intersection region value. Create (Sa13).
  • One of the niche analysis information is a niche evaluation element value, and the niche evaluation element may be a niche viewpoint.
  • the niche analysis information generation unit 5120 of the niche description region discovery system 5000 targets the obtained target document set, and sets a partial target document set corresponding to the intersection area of the (PCi, Cj) among the target document sets.
  • a niche evaluation element value corresponding to a preset niche evaluation element is generated.
  • the niche evaluation information is generated by the niche perspective analysis information generator of the niche analysis information generator 5120.
  • the niche analysis information display unit 5113 of the n-dimensional frame processing unit 5110 crosses any one or more of the intersection area value processing result of processing the intersection area value and the intersection area value on a predetermined basis in the intersection area.
  • the area is displayed (Sa14). That is, the niche analysis information display unit 5113 performs a function of displaying the generated niche analysis information. 16 illustrates that the number of niche evaluation elements is generated for each (PCi, Cj) of the niche evaluation elements corresponding to the niche viewpoints, and the generated niche evaluation element values are displayed.
  • the niche analysis document set acquisition unit 5310 of the niche description region discovery system 5000 utilizes a search or query condition setting or selection from a document set group to manage, a target including at least one document Obtain a set of documents.
  • the niche analysis information for the number of applications which is the simplest niche viewpoint and the niche evaluation element, is generated, but the niche analysis information is not limited to the number of applications. The same may be generated for various niche evaluation elements. Tables 4 to 7 below show these niche evaluation elements.
  • Table 4 shows examples of niche evaluation factors related to quantitative attributes.
  • Table 5 shows examples of niche evaluation factors related to quantitative attributes.
  • Table 6 shows examples of niche evaluation factors related to the increase and decrease attributes.
  • Table 7 shows examples of niche evaluation factors related to new (introduction / participation) attributes.
  • C3 is a subclass for IPC, FI, and ECLA, a theme for FT, and a class for USPC
  • C4 is a main gropup for IPC, FI, and ECLA, and a theme under the theme for FT. In case of USPC, it becomes subclass without dot.
  • FIG. 18 is a diagram showing that the niche analysis information generation unit 5120 selects a niche viewpoint for different niche evaluation elements (different niche viewpoints) to generate niche analysis information. Once the niche perspective has been selected, a new analysis result will appear. As illustrated in FIG. 18, the niche description area discovery system 5000 may support selecting a niche evaluation element for a plurality of niche evaluation elements, and generate and display the generated niche evaluation element values to the user.
  • the niche description region discovery system 5000 may define a target document set through a niche option, which is illustrated in FIG. 13.
  • the niche description region discovery system 5000 obtains a target document set Sa41 and uses a first patent classification set and at least one or more agents using a first patent classification from the user computer 100.
  • At least one niche analysis information as an intersection area value based on the intersection area document set corresponding to the intersection area with respect to at least one intersection area constituting the intersection area set (Sa44).
  • the niche option information is obtained from the user computer 100 through the niche option processing unit 5130 for niche option information for any one or more of a period limitation, a subject limitation, a technical field limitation, and an individual patent limitation (Sa46).
  • the set of intersection region documents is defined by reflecting the intersection, and at least one intersection region constituting the intersection region set crosses one or more niche analysis information based on the limited intersection region document set corresponding to the intersection region.
  • An area value is generated (Sa48), and at least one of the intersection area value processing result obtained by processing the intersection area value and the intersection area value on a predetermined basis is displayed on the intersection area (Sa49).
  • the niche description region discovery system 5000 supports a function of changing the vertical axis to another patent classification while fixing the horizontal axis selected through the crossing area frame selection unit 5111 or changing the vertical axis while fixing the vertical axis. .
  • This information processing method is well illustrated in FIG.
  • the niche description region discovery system 5000 obtains a target document set Sa31 and uses a first patent classification set using a first patent classification from the user computer 100 and a second using at least one or more second classifications. Obtaining selection information about a classification set (Sa32), and constructing an intersection region set having at least two or more intersection regions by using the first patent classification set and the second classification set (Sa33), and setting the intersection region set.
  • one or more niche analysis information is generated as an intersection region value based on a set of intersection region documents corresponding to the intersection region (Sa34), and the intersection region value and the intersection region value are generated in the intersection region.
  • Any one or more of the intersection area value processing result of processing the intersection area value based on a preset reference is displayed on the intersection area (Sa35).
  • One form of Sa35 may be FIG. 16.
  • the cross region frame selection unit 5111 may be used to obtain change information (Sa36) for any one or more of the first patent classification set and the second patent classification set. When selecting the first patent classification set and the like, it may be selected while searching in multiple stages, and FIG. 19 illustrates this well.
  • the cross region frame selection unit 5111 manages the history of the selected patent classification or the selected classification, and when a user attempts to change the patent classification or classification, the selected patent classification or classification is prioritized first. You can also show In this case, FIG. 19 may first show a window in which a use is selected at the top right. In this case, you can save yourself the trouble of choosing FT-> Electric Motor Control-> 5D107-> 5D107BB.
  • the intersection area frame selection unit 5111 configures an intersection area set having at least two or more intersection areas using the first patent classification set or the second classification set in which the change has occurred (Sa37).
  • the niche analysis information generator 5120 may generate at least one niche analysis information as a cross region value for at least one cross region constituting the cross region set based on a cross region document set corresponding to the cross region.
  • the niche analysis information display unit 5113 displays one or more of the intersection area value and the intersection area value processing result of processing the intersection area value and the intersection area value on a predetermined basis in the intersection area in the intersection area (Sa39). )do.
  • 20 illustrates an example in which at least one of a horizontal frame and a vertical frame is changed and niche analysis information according to a niche perspective is generated based on the changed frame.
  • 20 shows that a frame is formed with a patent classification of 5D107AA or less on the vertical axis and a patent classification of 5D107CC or less on the horizontal axis.
  • (PCi, Cj) may be (PCz, Cw), and the cross region set generation unit 5112 generates the cross region set with respect to (PCz, Cw).
  • PCi, Cj may be (PCz, Cw)
  • the cross region set generation unit 5112 generates the cross region set with respect to (PCz, Cw).
  • FIG. 16 and FIG. 20 since all the intersection area
  • Table 8 below is reference data in which a patent classification title and a patent classification code shown in FIGS. 16 to 20 are corresponded.
  • the niche analysis type presenting unit 5123 may present a niche analysis type according to the major, middle, and small classification niche viewpoints as shown in Tables 4 to 7.
  • the niche model type presenting unit 5124 of the present invention is responsible for assisting in selecting the niche model type.
  • the niche evaluation model refers to a model that generates niche scores or niche grades for evaluating how niche the particular set of documents specified by a specific intersection area (PCi, Cj) or a specific condition is.
  • two conditions must be preceded: independent and independent variable values and dependent and dependent variable values.
  • the niche evaluation element may be an independent variable for generating a niche evaluation model, and an independent variable value of the niche evaluation element value may be generated as the niche evaluation element for the specific document set.
  • a problem for establishing a niche evaluation model is the setting of dependent variables.
  • the dependent variable must be a variable that reflects niche attributes as a whole. When there is an input variable value called a niche evaluation element value, the dependent variable is a well-represented attribute of nichi as a value in response to the input variable value.
  • FIG. 21 is an example of a graph showing a temporal change in the number of patent applications for the technology region A with respect to a patent of a specific country
  • FIG. 22 is a graph showing a temporal change in the number of patent applications for the technology regions A, B and C.
  • FIG. . the technical region having the niche attribute has a characteristic in which the number of patent applications and the like rises steeply based on a specific time point, but it will not be a niche after the steep rise.
  • it may be an empty niche technology, but it may be a technology that is discarded due to its uselessness.
  • the basic assumption for the technical region having a high niche is that the technical region having a high niche is filling the technical region at a specific point in the past, present, or at least a certain point in the future as time passes.
  • the niche description region fills in any other form over time, such as an increase in the number of patent applications, an increase in the number of applicants, an increase in the number of inventors, or the like.
  • the dependent variable may be a numerical value resulting from the object of filling or a result of filling, or a numerical value generated by combining these numerical values.
  • the niche analysis information may be of interest to the user, not how much the specific technology region has the niche attribute at the current time using the niche description region discovery system 5000, not the specific past viewpoint. Therefore, the niche evaluation model should be able to evaluate niche based on a specific time point. Therefore, in the dependent variable or the independent variable, the selection of the viewpoint becomes important when calculating the variable value. That is, due to the nature of model establishment, the data up to a certain past point in time are predicted after the specific past point in time, and thus the selection of the point of view also has a great influence on the variable value.
  • a sample document set is obtained, and the obtained sample document set is divided into N large technical areas.
  • the first is a common view splitting scheme that applies a common view splitting criterion to a set of N sample documents. This is a method of forcibly dividing a set of N sample documents based on at least one specific time point. For example, N sample documents can be divided into two parts before 2005 and after 2006, or n times by five years, based on the publication date or the best date (priority date when claiming priority).
  • the second is a common attribute splitting scheme that applies common attribute splitting criteria to N sample document sets. This method divides based on a time point when the attribute splitting criteria are satisfied according to a set of N sample documents.
  • the three-year application growth rate is more than 25% for the first time, it is divided into two years based on the first year of 25% or the year minus one or two years.
  • the reference year to be split may also be different, and in some cases, the split may not be performed. Accordingly, the size of the N sample document set may be reduced when the common attribute splitting criteria are applied (to smaller N).
  • the attribute reference value is taken differently, such as application growth rate of 50%, the size of the N sample document sets may be much smaller when applying the common attribute splitting criteria (much smaller N).
  • the former case could be used for the first type of niche discovery model, while the latter case could be used for the discovery of the second type (radical niche region).
  • the generation of the sample will be used a reduced set of N sample documents. That is, various kinds of niche evaluation models can be generated to the degree of satisfaction of the type of common attribute or the common attribute reference value.
  • the number of sample document sets used to generate the niche evaluation model is denoted by N.
  • the common attribute splitting scheme may be more appropriate than the common view splitting scheme.
  • the nicheability can be sufficiently reflected for the technology A, but the nicheity may not be sufficiently reflected for the technology C.
  • FIG. Segmentation based on the year 05 for technology A, year 04 for technology B, and year 01 for technology C may be more reasonable, minimizing waste of sample data.
  • one sample document set includes a first partial sample document set (a set of documents corresponding to a split point) and at least one second partial sample document set (a split time). After that, a corresponding document set) is formed.
  • the first partial sample document set has an attribute, finding out whether filling occurs in the description region after the splitting time point constitutes the core of the niche evaluation model generation.
  • the second partial sample document set may also be used to generate the niche evaluation model
  • the present invention is characterized by generating the niche evaluation model using the first partial sample document set. Based on the first partial sample document set, the second partial sample document set is a result of filling.
  • the key to generating the niche evaluation model is to find the niche evaluation factors that contributed to the second set of rapidly filled sample documents, and the niche evaluation element values of these niche evaluation elements are generated based on the first partial sample document set. .
  • At least one niche reference element value having a dependent variable value is generated for each sample document set, and a niche for at least two niche evaluation elements of the first partial sample document set of each sample document set as an independent variable value.
  • the evaluation element value is generated, data values for generating a niche model shown in Table 9 are determined.
  • Table 10 below is a specific example of Table 9.
  • Table 10 generates a sample document set in FT units. Variable names are those used in Tables 4 to 7.
  • the niche description region discovery system 5000 may generate a niche evaluation model based on the data shown in Table 10.
  • Table 10 although a sample document set is configured for each FT whose end or title is 1 dot, the sample document set may be configured based on the 00 level of the FT.
  • a sample document set is generated at a predetermined level (the last patent classification or the n dot subgroup (IPC) and the n dot subclass (USPC) patent classification) of other patent classifications such as IPC or USPC. You can do it.
  • the sample document set since the sample document set is a patent document set, the sample document set may be a patent document set including a keyword i as a key keyword for a plurality of rising keywords i.
  • the niche description region discovery system 5000 divides each of the N sample document sets into two or more parts by applying at least one partitioning criterion to N sample document sets, and sets the first partial sample document set and at least one or more. Construct a second partial sample document set (SM11), generate niche reference element value information for the niche reference element for the first partial sample document set and the second partial sample document set (SM12), and generate the first partial sample document Generate niche evaluation element value information for at least two niche evaluation elements for the document set (SM13),
  • the niche evaluation model is generated by applying a predetermined statistical algorithm using the niche reference element value as the dependent variable value and the niche evaluation element value as the independent variable value (SM14).
  • the niche evaluation model generator 5200 of the niche description region detection system 5000 applies at least one preset statistical model.
  • the statistical model may use a linear regression model
  • the linear regression model has a problem of low robustness and low predictive power. Therefore, among the nonlinear regression algorithms, the use of machine learning algorithms can generate a good evaluation model in many respects.
  • the following describes using a boosting algorithm among machine learning algorithms. In the following description, those skilled in the art will be able to use not only the boosting algorithm but also other machine learning algorithms, such as a random forest, in the following description.
  • the problem of exploring the niche domain and finding the main variables affecting it is the regression problem that is commonly studied in the field of machine learning, which is a branch of statistics. There are many ways to solve this regression problem, including the most basic least squares method.
  • the regression problem can be generally expressed as the following equation, which is a problem of estimating a function that minimizes the expected value when a certain loss function ⁇ is given.
  • the goal is to find a function that minimizes the objective function defined as above.
  • the value of the objective function decreases the most if the object moves in the opposite direction of the gradient. Can be.
  • the Gradient Boost algorithm algorithm is well summarized in FIG. In other words, it is an algorithm that creates a vast machine by continuously combining new functions g at each step.
  • the algorithm shown in FIG. 25 was implemented and analyzed for the niche data.
  • one of the important things to implement is the number of trees to match and the choice of shrinkage parameters to prevent overfitting.
  • the shrinkage parameter decreases, whereas as the number of trees increases, the number of trees tends to decrease. So when fitting a boosting model, fix the shrinkage parameter to a small value and change the number of trees to find the optimal model. In the actual analysis process, 0.01 is used as the shrinkage parameter.
  • FIG. 26 is a view for explaining an exemplary concept related to a niche evaluation model generation process.
  • boosting models are created. Among these numerous models, it is necessary to choose the best one. This is a matter of model selection, and numerous studies have been conducted on this and many methods are known. Among them, the optimal model was selected by using the cross validation method, which is suitable for the boosting model. The optimal model was selected by applying 5-fold cross validation method on patent data. 26 illustrates a cross validation method well. After dividing the data with conflict patent and non-dispute patent into 5 sets, each model is constructed with 4 sets and the test set is calculated with the other set to select the model with the smallest error.
  • the niche evaluation model is generated as described above.
  • the niche evaluation model generates a niche reference element value as a dependent variable when the niche evaluation element value is provided as an independent variable. If the niche reference element value is an increase in the number of applications for five years, and the niche evaluation element value is provided for the set of acquisition documents in the last five years, the niche evaluation model shows the increase in the number of applications for five years, and therefore the application for the next five years. The number can be presented.
  • the niche description area discovery system 5000 obtains a designated or input set of acquisition documents that are subject to niche evaluation (SM21), and evaluates the niche for at least two or more of the niche evaluation elements with respect to the set of acquisition documents.
  • the element value information is generated (SM22), and the niche evaluation value is generated by the niche evaluation model (SM23) using the generated niche evaluation element value information.
  • the niche evaluation value generation module 5260 of the present invention It is possible to generate a niche evaluation value for each intersection area by considering a set of documents corresponding to the intersection area of the n-dimensional frame as an acquisition document set.
  • Generation of the niche evaluation value is carried out by the niche evaluation value generation module 5260 of the present invention.
  • the generated niche evaluation value becomes a kind of niche analysis information, and is displayed in the n-dimensional frame through the niche analysis information display unit 5113.
  • the target document set is limited through the niche option processing unit 5130, the document set corresponding to the intersection area is limited, and the niche evaluation element value corresponding to the document set is changed. Will also fluctuate.
  • the niche discovery simulation module 5320 of the present invention will be described. If there is a single target document set, it is possible to generate various kinds of cross-region sets for each target document set.
  • the top patent classification or the top patent classification of the last patent classification included in the target document set is n
  • at least nC2 cross region sets may be generated even if the two-dimensional cross region set is only.
  • the niche option processor 5130 a more diverse set of cross regions can be generated, and in the case of a patent document corresponding to two or more types of patent classification, a more diverse set of cross regions can be generated, and CatchWord If more than one Index can be matched, a more diverse set of intersections can be created. Given a set of target documents, it will be appreciated that the generation of these various cross-section sets can be organized systematically.
  • the niche description region discovery system 5000 divides the acquired document set (target document set) obtained using the document set dividing module 5210 to generate a plurality of divided acquisition document sets (SM31), and generates the divided
  • the niche evaluation element value information is generated for at least two or more niche evaluation elements of the acquisition document set for each acquisition document set (SM32), and the niche evaluation model is generated using the generated niche evaluation element value information.
  • the divided acquisition document set information that is equal to or greater than a predetermined evaluation value or a predetermined ranking is generated from the niche evaluation values generated for each of the plurality of divisional acquisition document sets. Screening (SM34). This simulation is led by the niche discovery simulation module 5320 of the present invention.
  • the niche analysis document set acquisition unit 5310 includes a patent set acquisition unit for obtaining a patent set and an acquisition patent set limiting unit for limiting the acquired patent set.
  • the acquisition target patent set generation unit includes a target patent set acquisition unit for acquiring the target patent set and a target patent set limitation unit for defining the target patent set.
  • the target patent set obtaining unit queries at least one patent document or patent document ID managed by a user who uses the patent information system 10000 to query a search engine, a query expression to a DBMS, or a DBMS.
  • a set of documents or at least one or more patent search or query expressions can be called, created or selected.
  • the niche analysis document set acquisition unit 5310 may include 1) inputting a search word to a search engine or 2) input of a query utilizing a field constituting the patent DB 112, 3) a patent corresponding to the search word or the query. It may be generated by input or selection of information extraction conditions.
  • the patent information extraction condition may be any one of the issuing country, time range, applicant, owner or assignee, inventor, patent classification, (if there is a patent subject classification and a predetermined classification attribute, etc.) included in the patent document.
  • the time that is the basis of the time range is any one or any combination of two or more of the priority date, application date, publication date, and registration date of the patent document
  • the patent classification Is any one or combination of two or more of IPC, USPC, FT, FI, and ECLA
  • the patent subject classification is one or more of the catchword of the IPC, the catchword of the USPC, or the IPC, USPC, FT, FI, and ECLA.
  • Is one or more of the subject classifications generated using, and the predetermined classification attribute is the applicant or the owner or the assignee
  • the classification properties can be, or any one or more of the patent subject by Category classification properties of the classified-patent classification properties, the inventors constituting the category attribute, the patent classification.
  • the applicant may be limited to only applicants having university attributes, and applicants having a specific number of applied / registered patents for a specific period of time. Applicant) may be limited only.
  • the niche analysis document set obtaining unit 5310 calls or selects a forward cited patent set, a back cited patent set, a forward self cited patent set, a back self cited patent set, a citation generation obtained patent set, and the like of a specific patent set. Or can be obtained.
  • the acquisition target patent set generation unit applies specific conditions to define the target patent set
  • the target patent is obtained from the data unit by reflecting the above conditions.
  • the patent information patent information system 10000 may generate and manage a patent set for at least one or more categories, and the management of the patent set is performed by the patent information manager 100 of the present invention.
  • an applicant-specific patent set management unit managing a patent set specific to each applicant a patent set management unit by patent classification managing a patent set specified by patent classification, and other classifications or categories.
  • a patent set management unit by patent classification managing a patent set specified by patent classification and other classifications or categories.
  • the patent set generated by the user is performed by the member patent set management unit.
  • a matrix consisting of mXn cells consisting of m horizontally n vertically n cells is conceptually generated.
  • the (mi, nj) intersection region corresponds to a subset of patent documents. For example, if mi and nj are patent classifications, (mi, nj) will receive all patents of the selected patent document set that includes patent classifications mi and nj simultaneously, and these patents will be assigned to the patent document set. Part of the patent document. At this time, when there is a patent classification among mi or nj, not only the kind of patent classification but also a problem of main patent classification and sub patent classification occurs.
  • the patent document includes at least one main patent classification, and in some cases, one or more sub patent classifications may be included, so the scope of the patent classification to be used is problematic. This may be provided as an option, and the user may select which patent classification to use. Where possible, it would be more reasonable to use both main and sub patent classifications.
  • the patent analysis information generation unit 4000 generates preset evaluation information on the patent document subset.
  • the patent analysis information generating unit 4000 includes the number of claims, the original (independent) claim length, the number of pages, and the drawings for each patent unit belonging to the patent document subset and / or patent set units belonging to the patent document subset.
  • FIG. 28 is a diagram illustrating another embodiment of a niche region discovery analysis result according to the present invention.
  • FIG. 28 is a diagram illustrating niche description region evaluation information generated by using a niche description region evaluation element value different from FIG. It can be seen that the thermograph effect is applied to the / cell.
  • predetermined analysis information may be provided for patents belonging to the patent document subset. If a patent document corresponds to the patent document subset, quantitative analysis information may be provided for the patents included in the patent document subset (the axis of analysis is time, applicant, inventor, patent classification, country, registration). And bibliography and full text of individual patents.
  • the inventive concept as described above can be extended to three or more n-dimensional matrices, in which case the intersection area value will be in the form of an n-dimensional cube.
  • the user can only visually confirm up to two dimensions of information, the user can select two of the desired dimensions among the n dimensions, and can view the niche technology evaluation information on the selected dimension.
  • the patent information system 10000 provides the user computer 100 with an interface for processing slice and dice information to select a desired matrix or to change an axis or the like with respect to the selected matrix.
  • the hierarchical structure exemplified in the inventive concept may be applied not only to the patent classification but also to the IPC corresponding catchwords illustrated in FIGS. 13 to 14 or the USPC corresponding index.
  • the fusion information processing system 9000 may be configured to obtain a fusion processing population collection unit 910 for obtaining a patent set for fusion information processing, and the fusion processing population collection obtained by the fusion processing population collection unit 910.
  • 950 at least one of the fusion pattern information batch generation unit 960 continuously generating the fusion pattern information two or more times according to a predetermined fusion processing criterion. It may contain more.
  • any one or more of a keyword, a patent classification, and an index may be used as the unit fusion element generated by the unit fusion element generator 970.
  • the keyword may be a keyword series that meets a predetermined criterion such as a technology keyword, a product keyword, and the like.
  • the keyword may include one word element, one phrase element, and one clause element. It is used to include a keyword pair including a keyword pair including at least two keyword pairs selected from a narrow meaning keyword or the narrow meaning keyword. (In the present invention, unless otherwise stated, the term keyword is used.
  • the keyword pair includes a co-occurrence keyword pair (or simply referred to as an air pair).
  • Patent classifications include IPC, USPC, FT, FI, ECLA.
  • An index also called a catchword, refers to a system in which at least one patent classification is associated with a word, phrase, or clause.
  • a catchword that processes the IPC
  • USPC issued by the US Patent and Trademark Office.
  • the index also has a hierarchical structure like a patent classification.
  • keywords corresponding to product names / part names / element descriptions are often embedded. The index makes the classification of patents easy to find and there are examples in FIGS. 30 and 31.
  • FIG. 30 and 31 The index makes the classification of patents easy to find and there are examples in FIGS. 30 and 31.
  • G06C 1/00 corresponds to ABACUSES.
  • ABACUSES is called an index corresponding to G06C 1/00. Accordingly, G06C 1/00 can be reverse mapped to Abacuses.
  • the catchword system has at least one hierarchical structure. ABARADING shows that it is a two-tier hierarchy.
  • the keyword may be generated by processing the text included in the patent specification, which is in charge of the core keyword generator 2100 of the data processor 2000 of the present invention.
  • the key keyword generator 2100 extracts a keyword from a phrase or sentence corresponding to each field of the patent specification.
  • the extraction of the air pair is extracted through the combination between the terms in the proximity distance (the distance satisfying the distance standard between the registered terms in one sentence).
  • the field may be any one or more of various fields constituting the patent specification, such as the name of the invention, the claims, the summary, the detailed description of the invention, industrial applicability, effects, and the prior art (background art).
  • the key keyword generator 2100 generates a key keyword set for the n keywords extracted from the field.
  • the key keyword generator 2100 When generating the key keyword, the key keyword generator 2100 performs synonym processing, thesaurus processing, and the like to select the key keywords by grouping the terms having substantially the same, equivalent, or equivalent meaning as a representative term. It is preferable. Meanwhile, when processing with the representative term, it may be desirable to perform synonyms and thesaurus processing for two or more languages in one patent document by using a dictionary or a machine translator. On the other hand, it is more preferable that the representative term or the extracted key keywords are translated into at least one language through the dictionary or machine translator. Extracting a keyword (commonly referred to in this technical field as a term) or an air pair through natural language processing belongs to techniques known in the field of natural language processing technology.
  • a core keyword set (a core air pair set is selectively included to represent the patent specification by applying a predetermined key keyword selection algorithm) Will be selected).
  • the most frequently used algorithms use term frequency (TF) and inverse document frequency (IDF).
  • TF term frequency
  • IDF inverse document frequency
  • various functional expressions using TF and IDF as variables are disclosed, and it is natural that other complex equations such as weights for each field can be applied in a policy manner.
  • the core keyword set composed of only the narrow meaning keywords and the core keyword set composed only of the air pairs are generated separately or the keywords having the narrow meaning and the air pair are equally processed by the algorithm.
  • the core keyword selection algorithm may generate a set of key keyword pairs for n keyword pairs when the key keyword selection algorithm processes the air pairs as keywords.
  • the core keyword generator 2100 extracts a new term consisting of two or more words / vocabulary / words, it is often difficult to determine whether the new term is a term having technical meaning. have. In this case, there may be a method of determining whether a new term has a technical meaning by using an external search engine such as google.com.
  • the core keyword generator 2100 performs at least one or more predetermined processing such as quotation processing (queries processing method of google.com processing an exact match) and the like, and then extracts the new term.
  • the extracted new term is processed as a normal term.
  • the analysis of the search results measures the number of search results (the number of hits, which teaches how many search results match the query), and examples of the preset criteria are 1,000 or more in English and other languages. It could be more than 100 and so on.
  • search results measures the number of search results (the number of hits, which teaches how many search results match the query), and examples of the preset criteria are 1,000 or more in English and other languages. It could be more than 100 and so on.
  • querying google.com for patent informatics and patent informatics services respectively, yields 67,300 and 279 results, in which case patent informatics is treated as a term and patent informatics services as a new term. Will not be able to handle.
  • the key keyword set KS (Pi) ⁇ K1 (Pi), K2 (Pi), ..., Ki (Pi), Kj (Pi), ..., Kn (Pi) corresponding to the i th patent document Pi ) ⁇ .
  • i, j, n are integers
  • Kn (Pi) refers to the nth key keyword selected from the i th patent document Pi.
  • a set of key keywords can be mapped to a single patent document, because: 1) specific fields (for example, claims or summaries), 2) different weights for each field, 3) selection of two or more key keywords There may be various reasons, such as the use of an algorithm, 4) reference range of IDF calculation, 5) term extraction method, etc.)
  • Core keyword set KS (Pi) ⁇ K1 (Pi), K2 corresponding to the i th patent document Pi. (Pi), ..., Ki (Pi), Kj (Pi), ..., Kn (Pi) ⁇ are stored in the key keyword DB (1300) based on Pi or the key value corresponding to Pi. Can be.
  • the Pi is described as a key value specifying the patent document for convenience of explanation.
  • the Pi may be an application number, publication number, registration number or any patent document identification number to which a country or patent kind or other element is combined. It will be appreciated that the Pi may be associated with various surges or processed surges or other processed information corresponding to the patent document. Typically, relational DBs correlate various information with the key value.
  • the unit fusion element generator 970 performs a combination process according to a preset combination process criterion for the core keyword set.
  • Combination processing generates nCr (n is an integer, r is an integer, r is 2 or more and less than or equal to n) key keyword combinations (Keyword Combination, KC, (Ki, Kj)) for n key keywords.
  • Keyword Combination, KC, (Ki, Kj) key keyword combinations for n key keywords.
  • key keyword combination is processed as a processing unit.
  • PiKCS (Pi) ⁇ KC1 (Pi), KC2 (Pi), ..., KCi (Pi), KCj (Pi ), ..., KCn (Pi), ..., KCnCr (Pi) ⁇ . It will be apparent that the constituent elements and the number vary according to the frequency maintenance key keyword combination set (KCS) r. Of course, different frequency maintenance key keyword combination sets are generated according to r.
  • the unit fusion element generator 970 may generate a patent classification combination set (CCS) such as the frequency maintenance key keyword combination set for patent classification.
  • the patent classification combination set may not be generated for all patent documents, and may be generated only when two or more patent classifications correspond to at least one or more types of patent classifications in one patent document. For example, if there is more than two IPCs in one patent document or two or more USPCs even if only one IPC is used, two or more IPCs and two or more USPCs, respectively, may be classified into a classification classification combination (CC) (Ci , Cj)) may be generated. Included in the patent document, the original patent classification is called the original patent classification.
  • CC classification classification combination
  • I, j, n are integers, and Cn (Pi) refers to the nth patent classification selected from the i th patent document Pi.
  • the original patent classification combination set OCCS (Pi) ⁇ OCC1 (Pi), OCC2 (Pi), ..., OCCi (Pi), OCCj (Pi), ..., OCCn (Pi), ..., OCCnCr (Pi) ⁇ .
  • the original patent classification combination set may be generated for each type of patent classification. In this case, Japanese patent documents may be generated for each IPC, FT, and FI. In this way, the generation of the patent classification combination set for the original patent classification can be handled equivalently to the generation of the frequency maintenance key keyword combination set.
  • the original patent classification combination set becomes a negotiated patent classification combination set.
  • an implicit patent classification combination set can be generated.
  • the applicants / applicants' patent applications 10-2007-0061273, 10-2007-0002555, 10-2007-0129437, 10-2007-0129270, 10-2007-0129387 , 10-2007-00129367, 10-2008-0126562, 10-2009-0082997 and the like.
  • the following are the contents of the published patent.
  • the nested patent classification combination set is called an ICCS (Implicit Classification Combination Set).
  • Korean Patent Application No. 10-2005-0111868 is issued January 04, 2006 H04B 7/26 and H04B 7/15. This will be described by way of example.
  • the parents of H04B 7/26 become H04B 7/24, H04B 7/00, H04B, H04, H in turn.
  • the parents of H04B 7/15 are, in turn, H04B 7/14 and H04B 7/00.
  • the lowest common patent classification code is H04B 7/00. Therefore, the table is shown in the following table.
  • the cell associated with H04B 7/00 has no cell value as described above.
  • Table 11 shows the original patent classification combinations (H04B 7/15, H04B 7/26), (H04B 7/14, H04B 7/26), (H04B 715 /, H04B 7/24), and (H04B 7/14). , H04B 7/24).
  • the common parent is H04B 7/00, and depth confinement was handled in the subgroups.
  • the nested patent classification combinations as shown in Table 11 may be generated for each patent classification combination, and the nested patent classification combinations considering the main patent classification and the sub patent classification are considered. May be possible.
  • the patents of H04B 7/04, H04B 7/155, and H04Q 7/30 which are assigned to the Korean Patent Application No. 10-2006-0012606 in the patents of the applicant / inventor as of January 2006, will be described as an example. I'm laying.
  • processing patent classification combination sets can be introduced. Since the original patent classification shown in the patent document has a different depth (depth, the number of dots included in the title information) for each patent classification, the depth can be kept constant for each original patent classification with reference to the patent classification system. You can introduce a patent classification that has been processed to make it work. An example of the processing to be maintained at a constant depth is, in the case of IPC, a process of adjusting the original patent classification to the subgroup or 1 dot subgroup level with reference to the patent classification system.
  • PCCS Processed Classification Combination Set
  • the patent classification combination set of the present invention is a patent classification combination set including at least one of the original patent classification combination set, the nested patent classification combination set, and the processed patent classification combination set.
  • the user can of course select the processing range of the patent classification combination set.
  • the unit fusion element generation unit 970 may generate an index combination set (ICS, Index Combination Set) such as the frequency-maintenance key keyword combination set even for an index corresponding to the patent classification.
  • the index combination set is not generated for all patent documents, and two or more patent classifications correspond to at least one or more types of patent classifications in one patent document, and the two or more patent classifications correspond to different indices. It can only be created when it is used (except in the case of the use of a higher patent classification described below).
  • one patent document has two or more IPCs, and each IPC corresponds to a different index, or Is at least two USPCs, and if the USPCs correspond to different indices, index combinations (Index Combination, IC, (Ii, Ij)) are applied to two or more IPCs and two or more USPCs, respectively.
  • Index Combination, IC, (Ii, Ij) index combinations
  • the original patent classification is included in the patent document and is called the original patent classification
  • the index corresponding to the original patent classification is called cause index.
  • the original index combination set (OICS) corresponding to the i-th patent document Pi (OICS) OICS (Pi) ⁇ OIC1 (Pi), OIC2 (Pi), .. , OICi (Pi), OICj (Pi), ..., OICn (Pi), ..., OICnCr (Pi) ⁇ .
  • the cause index combination set may be generated according to the type of patent classification to which the index is associated. In this case, US patent documents may be generated for each IPC and USPC. In this way, the generation of the cause dex combination set for the original patent classification can be handled equivalently to the generation of the frequency maintenance key keyword combination set.
  • the cause index combination set becomes a narrow index combination set.
  • a nested index combination corresponding to the nested patent classification combination may be possible.
  • a method of generating a table in abbreviated form by removing the upper patent classification corresponding to the same index may be used.
  • a processing index combination set can be introduced. Since the original patent classification shown in the patent document has a different depth (depth, the number of dots included in the title information) for each patent classification, the depth can be kept constant for each original patent classification with reference to the patent classification system.
  • the processing may be performed so that an index corresponding to the processed patent classification may be introduced.
  • the set of index combinations created using processed patent classifications is called a Processed Index Combination Set (PICS).
  • the index combination set of the present invention is an index combination set including at least one of the cause index combination set, the nested index combination set, and the processing index combination set.
  • the following describes the index combination set.
  • the user can of course select the processing range of the index combination set.
  • the unit fusion element generation unit 970 is a hybrid combination by combining two or more patent classifications revealed, upper patent classifications up to a predetermined hierarchy of the two or more patent classifications revealed, and / or the key keywords and / or indexes. Create a hybrid combination set. That is, n key keywords extracted from a patent document, m patent classifications (separately processed according to types of patent classifications, or preset upper patent classifications for each m patent classifications) included in bibliographic matters of a patent document, and an index A hybrid combination set can be generated as an element of the combination set generation.
  • the frequency maintaining key keyword combination set KCS (Pi) ⁇ KC1 (Pi), KC2 (Pi), ..., KIi (Pi), KIj (Pi), ..., KCn (Pi) for the patent document Pi ), ..., KCnCr (Pi) ⁇ is 1) stored in correspondence with the Pi, and how the stored KCS (Pi) is used, 2) when Pi is called, in real time from the key keyword KS (Pi)
  • the method used to create and use can be used.
  • the 1) pre-generated storage method and the 2) real-time generation method for the frequency maintenance key keyword combination set will be the same for the patent classification and the index.
  • the patent classification combination set CCS (Pi) ⁇ CC1 (Pi), CC2 (Pi), ..., CCi (Pi), CCj (Pi), ..., CCn (Pi) for the patent document Pi. ), ..., CCnCr (Pi) ⁇ is stored corresponding to the Pi, the stored CCS (Pi) may be used, and when Pi is called, generated in real time from the patent classification set CS (Pi) could be used.
  • the index combination set ICS (Pi) ⁇ IC1 (Pi), IC2 (Pi), ..., ICi (Pi), ICj (Pi), ..., ICn (Pi) for the patent document Pi. , ..., ICnCr (Pi) ⁇ is stored corresponding to the Pi, the stored ICS (Pi) may be used, and when Pi is called, may be generated and used in real time from the index set IS (Pi) There will be.
  • the fusion process population refers to a set of targets for which a user of the patent information system 10000 wants to know fusion information.
  • the convergence processing population may include 1) input of a search term to a search engine or 2) input of a query utilizing a field constituting the patent DB 112, 3) input of a patent information extraction condition corresponding to the search term or the query, and the like.
  • the patent information extraction condition may be any one of the issuing country, time range, applicant, owner or assignee, inventor, patent classification, (if there is a patent subject classification and a predetermined classification attribute, etc.) included in the patent document.
  • the time that is the basis of the time range is any one or any combination of two or more of the priority date, application date, publication date, and registration date of the patent document
  • the patent classification Is any one or combination of two or more of IPC, USPC, FT, FI, and ECLA
  • the patent subject classification is one or more of the catchword of the IPC, the catchword of the USPC, or the IPC, USPC, FT, FI, and ECLA.
  • Is one or more of the subject classifications generated using, and the predetermined classification attribute is the applicant or the owner or the assignee On may be limited to the classification of the property, classified-patent classification properties constituting the patent classification, the classification properties of the inventor, or any one or more of the patent subject by Category classification properties.
  • the generation of the fusion process population is in charge of the fusion process population acquisition unit 910 of the present invention.
  • the convergence processing collection acquisition unit 910 obtains a specified input through a user's input or a predetermined setting through a predetermined setting value or a batch setting for at least one predetermined object (for example, all IPCs). Extract a patent set.
  • the patent set to be extracted primarily may be sufficient as the key value of the patent document. This is because processing information such as bibliographic information, frequency maintenance key keyword combination set, patent classification combination set, etc. of the patent document corresponding to the key value can be easily obtained as the key value of the patent document.
  • Obtaining a patent set including the IPC from the patent DB 112, etc.) will be a common daily routine for those skilled in the art of performing a patent search or analysis.
  • the set dividing unit 921 of the fusion processing target set generation unit 920 of the present invention divides the set into at least two with respect to the obtained fusion processing population.
  • the aggregation dividing unit 921 provides at least one division processing criterion to the user through the division processing reference providing unit 921-1.
  • the division processing reference acquisition unit 921-2 of the present invention obtains selection information on the division processing criteria or input information on the division processing criteria from the user computer 100.
  • the split processing criteria may be at least one combination, selection or input of any criteria such as 1) time, 2) conditions (registered, published, split or not, ...), 3) applicant, 4) ... etc. have. For example, it can be divided into three years and three years before the current filing date.
  • FIG. 33 shows an example of the two-split model.
  • 34 is an exemplary view of a complex partition model.
  • T When the fusion process population is referred to as T, when the T is divided into two, two divided patent sets are generated.
  • One of the divided patent sets is A, and the other is B.
  • A is a set of patents within three years of the filing date
  • B is a set of patents three years before the filing date.
  • the line between A and B (DC) is the dividing dividing line, which is a conceptual line for the visualization of the dividing conditions. If n + 1 splitting is performed as shown in FIG. 34, n + 1 split patent sets such as A, B1, ..., Bn are generated.
  • n division lines exist, and each division line corresponds to a division condition.
  • the n partitioning conditions may be the same series (for example, when the file is divided by one year based on the filing date, the attribute of the splitting condition is the same series as the time attribute) but may be another series or another attribute.
  • a and B1 may be time attributes, and B1 and Bn may independently specify partitioning conditions on an applicant basis.
  • the division condition is stored in the division processing reference DB 921-3.
  • the partitioning condition may be set by a user, but at least one criterion may be designated as a default value in the system. On the other hand, the division will naturally include subdividing A again into several.
  • the cited patent set obtaining unit 922 of the present invention may obtain any one or more of a front cited patent and a back cited patent of a patent document included in the patent set on a patent set basis.
  • the forward cited patents may be obtained for each individual patent document which is an element of A, and the union operation may be performed to generate the forward cited patent set PA of A.
  • PB parent set of B
  • PBn parent set of Bn
  • the patent documents constituting the PA are listed in the bibliography of the patent documents constituting A, so it is relatively easy to create a set.
  • the generation of PA or CA in DB information processing is extremely easy for those skilled in the art.
  • the cited patent set obtaining unit 922 of the present invention may obtain the forward cited set in the divided patent set unit.
  • the designated set obtaining unit 923 obtains the designated information on the patent set designated by the user from the user computer 100, and serves to obtain the designated patent set.
  • a patent set managed by a user may be an example.
  • the patent set obtained by the designated set obtaining unit 923 it is possible to obtain a set division and a forward cited patent set for each divided set.
  • a and B sets are divided and generated by dividing the T into two parts for the fusion processing population T, PA as the forward cited patent set for A, and PB as the forward cited patent set for B.
  • T the forward cited patent set for A
  • PB the forward cited patent set for B.
  • PAB a patent document common to PA and PB.
  • PAB a patent document belonging to PAB naturally belongs to PA or PB.
  • the A, B, PA, PB, PAB is a set of patents, and may include at least one or more patent documents. (Of course, it may be an empty set, in which case it is obvious that there are no patent documents.)
  • Let Pi be the Pith patent document it belongs to.
  • patent documents belonging to B, PA, PB, and PAB will be Pi (B), Pi (PA), Pi (PB), and Pi (PAB), respectively.
  • KCS (Pi) ⁇ KC1 (Pi), KC2 (Pi), ..., KCi (Pi), KCj (Pi), ..., KCn (Pi) , ..., KCnCr (Pi) ⁇
  • Patent Classification Combination Set CCS (Pi) ⁇ CC1 (Pi), CC2 (Pi), ..., CCi (Pi), CCj (Pi), ..., CCn (Pi),, ..., CCnCr (Pi) ⁇
  • index combination set ICS (Pi) ⁇ IC1 (Pi), IC2 (Pi), ..., ICi (Pi), ICj (Pi), .. , ICn (Pi), ..., ICnCr (Pi) ⁇
  • a combination set as described above can be generated for a patent document set having at least one patent document as an element.
  • the unit fusion element generation unit of the present invention has two methods for generating a frequency maintenance core keyword combination set, patent classification combination set, and index combination set in the patent document set unit.
  • the first is a method of constructing a frequency-ignoring combination set, which performs a simple union operation on the key keyword combination set, the patent classification combination set, and the index combination set.
  • duplicate key keyword combinations are treated as one, even if they are duplicated several times. In this case, even if the same key keyword combinations (Ki, Kj) appear six times in ten patent documents, they are treated like one.
  • the second method is to construct a frequency maintenance combination set, which is a union operation for the frequency maintenance core keyword combination set, the patent classification combination set, and the index combination set for each Pi, but internally stores the frequency for each combination. For example, when a particular KCi is n times from the KC (keyword combinations) of the patent documents constituting a specific patent document set, the number of recovery n is mapped to a unique number (management ID) that specifies the KCi. . In this case, if the same key keyword combination (Ki, Kj) appears six times in ten patent documents, frequency information is maintained as (Ki, Kj): 6.
  • the fusion pattern processor 940 of the present invention processes the fusion pattern according to the fusion process reference information of the fusion process reference information unit 930.
  • the fusion process reference information may be a standard set by the patent information system 10000 by default, but may be obtained from the user.
  • the fusion processing reference information unit 930 of the present invention provides the fusion processing standard to the user computer 100 through the fusion processing reference providing unit 931, and is selected or input by the user through the fusion processing standard obtaining unit 932. One fusion treatment criterion is obtained. Subsequently, the fusion processing criteria for each user is generated through the fusion processing criteria generation unit 933, and the generated fusion processing criteria are stored in the fusion processing criteria policy DB 934.
  • the information processing of the fusion pattern processing unit 940 will be described, taking as an example one of the fusion processing criteria designated by the patent information system 10000 as a default.
  • the default fusion processing criteria may include the following series, and a user may select various fusion processing criteria described below.
  • the patent information system 10000 may be configured to apply the selected fusion processing criteria. Process the information. The following description will be made based on the application of the above-described frequency ignore combination set configuration method, which will be described later.
  • the first is the set of differences between the sets of divisions.
  • the fusion pattern processing unit 940 obtains the frequency maintaining key keyword combination set KCS (Pi (A)) and KCS (Pi (B)) for A and B for T, and obtains KCS (Pi (A))- Perform a difference set operation called KCS (Pi (B)).
  • the key keyword combinations belonging to the KCS (Pi (A))-KCS (Pi (B)) are combinations that are not present in the KCS (Pi (B)) but only in the KCS (Pi (A)).
  • the key keyword combinations belonging to KCS (Pi (A))-KCS (Pi (B)) are related only to the A set and become newly imported key keyword combinations.
  • the fusion pattern processing unit 940 obtains the patent classification combination set CCS (Pi (A)) and CCS (Pi (B)) for A and B for the T, and CCS (Pi (A))- A difference set operation called CCS (Pi (B)) is performed.
  • the patent classification combinations belonging to the CCS (Pi (A))-CCS (Pi (B)) are combinations not present in the CCS (Pi (B)) but only in the CCS (Pi (A)).
  • the patent classification combinations belonging to CCS (Pi (A))-CCS (Pi (B)) are related only to the A set and are newly imported patent classification combinations to the A set.
  • a combination set (key keyword, patent classification, index, or hybrid) generated as a result of a set operation such as a newly imported patent classification combination into the A set may be analyzed by the fusion pattern analyzer 950 of the present invention. (Hereafter, it is the same)
  • the process of the fusion pattern processing unit 940 is described for a patent set divided into two for T.
  • the difference set operation may be similarly applied to the patent set divided into n + 1.
  • T is divided into A, B1, B2, ... Bn, the following set operation may be exemplarily possible.
  • the key keyword combination set and / or the patent classification combination set may be a unit of operation for the difference set operation.
  • the second is the family of difference sets between forward cited patent sets.
  • the fusion pattern processing unit 940 obtains a frequency and key keyword combination set KCS (Pi (PA)) and KCS (Pi (PB)) for maintaining the frequency of PA and PB for A and B, and KCS (Pi (PA)). Perform a difference set operation called KCS (Pi (PB)).
  • KCS KCS
  • the key keyword combinations belonging to the KCS (Pi (PA))-KCS (Pi (PB)) are combinations not present in the KCS (Pi (PB)) but only in the KCS (Pi (PA)).
  • the key keyword combinations belonging to KCS (Pi (PA))-KCS (Pi (PB)) are related to the PA set only and become key keyword combinations newly imported to the PA set.
  • the fusion pattern processing unit 940 obtains the patent classification combination set CCS (Pi (PA)) and CCS (Pi (PB)) of PA and PB for A and B, thereby obtaining CCS (Pi (PA)).
  • the patent classification combinations belonging to CCS (Pi (PA))-CCS (Pi (PB)) are combinations not present in CCS (Pi (PB)) but only in CCS (Pi (PA)).
  • the patent classification combinations belonging to CCS (Pi (PA))-CCS (Pi (PB)) are related only to the PA set and are newly imported patent classification combinations to the PA set.
  • the process of the fusion pattern processing unit 940 has been described with respect to a forward cited patent set for a patent set divided into two with respect to T.
  • the difference set operation can be similarly applied to a patent set divided into n + 1. have. If T is divided into A, B1, B2, ... Bn, the forward cited patent set for each of them would be PA, PB1, PB2, ... PBn, and the following set operations would be exemplarily possible: will be. Meanwhile, the forward cited patent set of T becomes PT.
  • the key keyword combination set and / or the patent classification combination set may be a unit of operation for the difference set operation.
  • the third is a set of difference operations that utilizes both a split set (in some cases a population) and a forward cited patent set.
  • the fusion pattern processing unit 940 is KCS (Pi (A)), KCS (Pi (T)), KCS (Pi (PA)), KCS (Pi (PT)), KCS (Pi (PAB)) and KCS ( Pi (PB)), KCS (Pi (A))-KCS (Pi (PA)), KCS (Pi (A))-KCS (Pi (PT)), KCS (Pi (A))-KCS (Pi (B))-KCS (Pi (PT)), KCS (Pi (PA))-KCS (Pi (A)), KCS (Pi (PA))-KCS (Pi (T)), KCS (Pi (A))-KCS (Pi (PT)), KCS (Pi (PAB))-KCS (Pi (A)) performs one or more difference set operations.
  • the fusion pattern processing unit 940 is the fusion pattern processing unit 940 CCS (Pi (A)), CCS (Pi (T)), CCS (Pi (PA)), CCS (Pi (PT)), Obtain CCS (Pi (PAB)) and CCS (Pi (PB)), CCS (Pi (A))-CCS (Pi (PA)), CCS (Pi (A))-CCS (Pi (PT)) , CCS (Pi (A))-CCS (Pi (B))-CCS (Pi (PT)), CCS (Pi (PA))-CCS (Pi (A)), CCS (Pi (PA))-CCS Difference operations of one or more of (Pi (T)), CCS (Pi (A))-CCS (Pi (PT)), CCS (Pi (PAB))-CCS (Pi (A)) are performed.
  • CCS CCS (Pi (PA))-CCS (Pi (A1)) ... ... CCS (Pi (Ai))-CCS (Pi (A (i + 1))), CCS (Pi (Ai)
  • the key keyword combination set and / or the patent classification combination set may be a unit of operation for the difference set operation.
  • the core keyword combination, the patent classification combination, and the index combination satisfying that the difference calculation operation generated by the fusion pattern processing unit of the present invention is newly imported into the patent document set of interest with respect to the patent document set to be compared which is one example of the predetermined fusion processing criteria May be the result of screening treatment.
  • the frequency maintenance difference operation between two divided sets will be described first.
  • the invention idea of frequency maintenance difference operation is described by taking key keyword combination difference operation as an example.
  • the frequency information n of the specific key keyword combination (Ki, Kj) in a specific patent document set (for example, A) is maintained as (Ki, Kj): n.
  • the difference operation is specified as AB
  • the result of the frequency maintenance key keyword difference operation for the (Ki, Kj) is (Ki, Kj). ): (nm).
  • (Ki, Kj) is a key keyword combination of both A and B, and thus, (Ki, Kj) is not included in the result of the difference operation.
  • (Ki, Kj) is included in the key keyword difference operation result according to the relationship between n and m.
  • the relationship between n and m is managed by the fusion processing reference information unit 930 of the present invention.
  • Examples of the relationship between n and m include 1) when nm is greater than or equal to a predetermined numerical value, 2) when nm is greater than or equal to a predetermined numerical value, and m is less than or equal to a predetermined numerical value. 4) the function f (n, m) satisfies a predetermined condition, and n or m also meets a predetermined condition. have. Referring to the specific numerical value as an example, 1) has an advantage that is well applied when the difference between n and m is simply large, such as 100 and 3. However, in the above 1), when comparing the case where n and m are 100 and 30 and the case of 50 and 1, the difference value is larger in the former even though the latter meets the fusion treatment criteria.
  • the method of 2) is valid.
  • An example of the method of 2) may be a difference in frequency of 10 or more, m cannot exceed 2, and the like.
  • the size of A the number of patent documents belonging to A
  • n has a relatively small value, such as when the size of B is large
  • n is applied to n, m, such as square treatment.
  • T has been described based on two divisions of A and B, the idea of the present invention can be similarly applied to the case where T is divided into A, B1, B2, ... Bn. It will be apparent to those skilled in the art based on what is described in the difference set operation at the time of construction.
  • the processing reference information unit 930 manages this.
  • the present invention can be applied to a frequency maintenance difference operation between forward cited patent sets for a key keyword combination, and a frequency maintenance difference operation using both a split set (in some cases, a collective) and a forward cited patent set. It will be apparent to those skilled in the art that the present invention can be applied to.
  • the frequency maintenance difference calculation method has been described with respect to key keyword combinations, it will be apparent to those skilled in the art that the present invention can be similarly applied to patent classification combinations and index combinations.
  • the invention idea of the frequency maintenance difference set operation method described above is equally applicable to 1) n + 1 division set processing, 2) processing for forward citation patent set, and the like for patent classification combinations and index combinations. May be applied.
  • the result of the difference operation generated by the fusion pattern processor of the present invention is 1) a key keyword combination difference set, 2) a patent classification combination difference set, and 3) an index combination set difference set.
  • KCSS Keyword Combination Subtraction Set
  • CCSS Classification Combination Subtraction Set
  • ICSS Index Combination Subtraction Set
  • a key keyword combination set belonging to the KCS (Pi (PA))-KCS (Pi (PB)) is represented as KCSS (PA-PB) (KCSS of Patent Document Set A and Patent Document Set B).
  • the KCSS, CCSS, and ICSS may include at least one selected from a case in which a frequency disregarding method is applied and a case in which a frequency maintenance method is applied.
  • the fusion pattern analyzer 950 of the present invention analyzes various sets of calculation results including various sets of difference calculation results of the present invention generated by the fusion pattern processor 940.
  • the fusion pattern analyzer 950 generates predetermined analysis information about the difference set operation result set.
  • the fusion pattern analyzer 950 may perform a predetermined analysis on all combination subset sets (CSSs) constituting the KCSS, CCSS, and ICSS.
  • SCSs combination subset sets
  • An example of the preset analysis will be as follows. Discusses key keywords, patent classifications, and / or indexes.
  • the fusion pattern analyzer 950 may generate analysis information such as 1) to 6) when there is a specific KCSS, and this method may be applied to CCSS and ICSS as well.
  • the fusion pattern analysis unit 950 analyzes the network relationship between individual key keywords constituting a key keyword combination that is an element of the KCSS.
  • the network relationship is applied to any network analysis known to those skilled in the network analysis technology field for the key keyword combinations (Ki, Kj) that make up all KCSS.
  • the network analysis may find hub key keywords in the key keyword network.
  • the hub key keyword refers to a key keyword Ki having the largest number of network branches, a predetermined number, or more than a percentile.
  • the fusion pattern analyzer 950 may be visualized by drawing a connecting line between Ki and Kj of the key keyword combinations (Ki, Kj) of KCSS.
  • the line may be drawn only for key keywords having more than a predetermined branch, which is obvious among those skilled in the network analysis visualization technology.
  • a hub key keyword as an example of the network analysis visualization, 1) a key keyword network diagram associated with the Ki in the KCSS for the hub keyword Ki, and 2) the difference Based on the comparison target set (for example, B in the case of AB), the key keyword network diagram associated with the Ki may be displayed in contrast.
  • the change / change / difference of the key keyword well associated with the key keyword Ki for each partitioned set can be shown.
  • the fusion pattern analysis unit 950 is the extraction of the most frequent key keyword combination
  • the fusion pattern analysis unit 950 is the (Ki, Kj) of the elements of the KCSS
  • the most frequent frequency can be extracted in order of frequency.
  • the frequency of the (Ki, Kj) constituting the KCSS is 1.
  • the above 1) to 4) of the frequency ignoring method can be applied to the frequency maintaining method as it is, of course.
  • the fusion pattern analysis unit 950 performs the time series analysis for each (Ki, Kj), the applicant analysis, the inventor analysis, the patent classification analysis for each of the least key keyword combinations.
  • the fusion pattern analysis unit 950 obtains a set of patent documents related to the least common key keyword combination (for example, the method of querying / searching a set of patent documents simultaneously including the Ki and the Kj as key keywords). And analysis information based on at least one selected from various bibliographic matters (applicant, inventor, time, patent classification, etc.) of the patent document set.
  • the fusion pattern analysis unit 950 treats the patent classification combinations Ci and Cj, which are elements of the CCSS, as the key keyword combinations Ki and Kj, and sets the same as the patent classification combinations 1) to 6). You will be able to perform the analysis. Subsequently, the information processing of the fusion pattern analyzer 950 will be described based on a specific part of the CCSS that is different from the KCSS.
  • the fusion pattern analysis unit 950 extracts the most frequent frequency order among the elements (Ci, Cj) of the CCSS.
  • the (Ci, Cj) may extract the CC for each depth of the patent classification (for example, 1 dot subgroup).
  • the Ci is referred to a patent classification system
  • the depth of the patent classification may be obtained by selection from the user or set by default by the patent information system 10000.
  • the depth of the patent classification described in this paragraph is set, if the specific patent classification is a lower patent classification less than or equal to the depth of the set patent classification, the lower patent classification is converted into an upper patent classification of the preset depth, and the converted higher patent.
  • the fusion pattern analysis unit 950 performs time series analysis for each of the least frequent patent classification combinations, an applicant analysis for the least frequent patent classification combinations, an inventor analysis, and a patent classification analysis.
  • the fusion pattern analysis unit 950 obtains a set of patent documents related to the most frequent patent classification combination, and based on any one or more selected from various bibliographic matters (applicant, inventor, time, patent classification, etc.) of the set of patent documents. Generate statistical information. In this case, when the depth of patent classification is set, the fusion pattern analyzer 950 performs the processing described in the above paragraph.
  • the fusion pattern analysis unit 950 analyzes the network relationship between the individual patent classifications constituting the patent classification combination that is an element of the CCSS.
  • the network relationship is applied to any network analysis in the network analysis technology field for patent classification combinations (Ci, Cj) of all CCSSs related to SS.
  • the fusion pattern analyzer 950 performs the processing described above. In other words, if it is set as a 1 dot subgroup, the lower patent classification of less than 2 dot subgroup among all Ci and Cj is converted into the upper patent classification of the 1 dot subgroup by referring to the patent classification system, and converted into the converted higher patent classification. Perform network analysis for (Ci, Cj).
  • the fusion pattern analysis unit 950 may be visualized by drawing a connection line between Ci and Cj of patent classification combinations (Ci, Cj) of all CCSSs related to SS.
  • the visualization or network analysis will find the Ci with the most branches.
  • the fusion pattern analyzer 950 performs the processing described above. In other words, if it is set as a 1 dot subgroup, the lower patent classification of less than 2 dot subgroup among all Ci and Cj is converted into the upper patent classification of the 1 dot subgroup by referring to the patent classification system, and converted into the converted higher patent classification. Perform visualization of network analysis for (Ci, Cj).
  • the visualization of the fusion pattern is performed in the fusion pattern visualization unit 951 of the present invention.
  • the fusion pattern analyzer 950 may further include a fusion pattern UI unit 952 (user interface unit).
  • the fusion pattern UI unit 952 may further include the following functions.
  • the above limitations include: 1) inputting a search word to the search engine, 2) input of a query utilizing a field constituting the patent DB 112, 3) input or selection of a patent information extraction condition corresponding to the search word, or the query, and the like.
  • Can be generated as The patent information extraction condition may be any one of the issuing country, time range, applicant, owner or assignee, inventor, patent classification, (if there is a patent subject classification and a predetermined classification attribute, etc.) included in the patent document.
  • the time that is the basis of the time range is any one or any combination of two or more of the priority date, application date, publication date, and registration date of the patent document
  • the patent classification Is any one or combination of two or more of IPC, USPC, FT, FI, and ECLA
  • the patent subject classification is one or more of the catchword of the IPC, the catchword of the USPC, or the IPC, USPC, FT, FI, and ECLA.
  • the predetermined classification attribute is the applicant or the owner or the assignee
  • the classification properties can be, or any one or more of the patent subject by Category classification properties of the classified-patent classification properties, the inventors constituting the category attribute, the patent classification.
  • the fusion pattern analysis unit 950 performs a predetermined fusion information processing for the limited set of partition set.
  • the second is quantity information processing.
  • Frequency information of Ki may be displayed on each of the key keyword Ki nodes, or a frequency of (Ki, Kj) may be displayed on a line connecting Ki and Kj.
  • information (patent document list, bibliographic information, professional information, etc.) about the patent document set having the key keywords Ki and Kj is provided to the user computer 100, or the user When clicking on the frequency of (Ki, Kj), it is possible to provide the user computer 100 with information about a patent document set including both Ki and Kj as key keywords.
  • the processing in this paragraph for the keyword applies equally to the processing for patent classification.
  • the labeling display process refers to processing by displaying different marks (for example, colors, patterns, lines, etc.) for each labeling object such as the applicant, inventor, time display, and the like.
  • the filtering comparison process refers to a process of comparing the patent documents of Samsung Electronics and LG Electronics among the divided sets or the (Ki, Kj), (Ci, Cj), and (Ii, Ij).
  • the filtering comparison process is combined with the labeling display process, blue for (Ki, Kj) related to Samsung Electronics, red for (Ki, Kj) related to LG Electronics, and purple for common (Ki, Kj) You will be able to compare and display. The same applies to patent classification.
  • the conversion display function of the patent classification display into the index display corresponds to the index in a 1: 1 or 1: n correspondence. Therefore, where the patent classification is displayed, at least one index corresponding to the patent classification may be displayed according to the index display selection of the user.
  • the patent classification is in a code system, and what a particular code means is unknown unless the title information of the code is stored. Therefore, each time a patent classification appears visually, title information for that patent classification will need to be provided.
  • the way in which the title information appears is 1) when a user request or interaction (for example, placing a pointer of a pointing device such as a mouse in a patent classification), or 2) providing a patent classification and title information together. And 3) title information is given priority.
  • a specific patent classification Ci the title information is provided only when 1) only the title information of Ci is provided.
  • Ci In addition to the title information of Ci, a predetermined upper category of the Ci (for example, the main group of IPC) is provided. Etc.) and / or title information up to the upper classification, 3) in addition to the Ci title information, a predetermined upper classification of Ci (for example, a superior patent classification) and / or a title of the patent classification. Information) and Ci's predetermined lower patent classification (for example, the subordinate patent classification and / or up to the titles of the subordinate patent classification).
  • the fusion pattern report generator 953 may be configured according to a user's selection or default selection value of the patent information system 10000 from among the information generated by the fusion pattern visualization unit 951 or the fusion pattern UI unit 952. Create a fusion pattern report in the set report format.
  • the reporting tool can also utilize various reporting tools such as crystal report and oz report. Since the generation of the report is an easy technique for those skilled in the art, detailed description thereof will be omitted.
  • the fusion pattern report is based on the user's selection or the command of the patent information system 10000, under the control of the fusion pattern information batch generation unit 960, by the preset patent classification, by the preset applicant, and by the preset inventor. It can also be created as a task.
  • Batch generation of fusion pattern information refers to performing preset fusion information processing as a batch job.
  • 1) selection of a separate population subject to batch work 2) conditions for processing convergence information (set of division criteria, fusion processing criteria, fusion patterns (core keyword fusion, patent classification fusion, Hybrid fusion), and fusion pattern analysis (including visualization).
  • An example of the divided population may include a patent document set composed of patent documents corresponding to all patent classifications below a predetermined depth (for example, a subclass) on the patent classification system.
  • the patent classification includes any one or more of IPC, USPC, FT, FI, and ECLA.
  • FIG. 38 is an information processing method of the patent information system 10000 associated with the simple two-split model of FIG. 33 or the complex division model of FIG.
  • the patent information system 10000 (A) divides at least one or more patent sets generated or received by applying at least one division processing criterion to generate a first divided patent set and at least one agent.
  • a two-part patent set is generated (SF11).
  • the created or received patent set is the fusion processing set described above.
  • the generation of the patent information system 10000 may be generated by a predetermined setting rule through the fusion processing target set generation unit 920 of the present invention, or may be input by a user's search expression or query, or in the patent DB 112. It may be generated by input of patent information extraction conditions. Meanwhile, a method of receiving an external file upload or a patent document set managed by the user or obtaining the patent information extraction condition from the user of the patent information system 10000 through the designated set acquisition unit of the present invention. Patent sets can be obtained by clicking on objects (links, etc.) in which the set extraction conditions are embedded.
  • the patent information system 10000 includes: (B) setting the first unit patent fusion element corresponding to the patent document in the patent documents included in the first divided patent set and the second divided patent set; And generate each of the second divided patent sets (SF12).
  • the unit fusion element is preferably composed of one or more selected from patent classification combinations, index combinations and key keyword combinations.
  • the generated unit fusion elements may be a set, and the set may be a patent classification combination set, an index combination set, a key keyword combination set, and the like.
  • the patent information system 10000 selects a unit fusion element that satisfies a predetermined fusion processing criterion among the unit fusion elements generated for each of the first and second divided patent sets (SF13). do.
  • a preset fusion processing criterion may be a difference operation between unit fusion elements corresponding to the first divided patent set and unit fusion elements corresponding to the second divided patent set.
  • Another example of the preset fusion processing criterion may be a difference operation between unit fusion elements corresponding to the i th divided patent set and unit fusion elements corresponding to the i + 1 th divided patent set.
  • FIG. 39 is an information processing method of the patent information system 10000 related to the forward citation model or the compound citation splitting model of FIGS. 35 to 36.
  • the patent information system 10000 (D) divides at least one or more patent sets generated or received by applying at least one split processing criterion to generate a first split patent set and at least one second split patent set (SF21). )do.
  • the patent information system 10000 includes (E) at least one step of a patent document included in the first and second divided patent sets for each of the first and second divided patent sets.
  • a first cited split patent set and at least one second cited split patent set composed of cited patent documents are generated (SF22). When generating the cited split patent set, two things may be considered.
  • the citation depth means that the c cited patent documents have a citation depth of 1 when the self patent includes information on n parent patents. For every patent document ni, the grand parent patents included in the ni patent document have a citation depth of 2. The larger the citation depth, the larger the size of the relevant citation patent set, but the more likely it is to include a number of weakly related patents.
  • the citation depth is processed by the fusion processing reference information unit 930 and is determined by a user's selection or a default value of the patent information system 10000. The default value is preferably 1 to 2, more preferably 1.
  • a latent citation is a patent that is not cited in a self-patent document, but which consists of patent documents whose filing date is earlier than the self-patent document among the patent documents cited by a post-patent document than a self-patent document citing a patent document cited by the self-patent document. Say a set of documents.
  • the latent cited patent includes 1) obtaining a cited patent document of a self-patent document, 2) obtaining a cited patent document based on the self-patent document based on the cited patent document, and 3) applying for the self-patent document based on the cited patent document Acquisition of cited patent documents, and 4) removal of patent documents included in 1) of patent documents obtained in 3).
  • it is required to go through the process of 1) to 4) for each individual patent document in the divided patent set. That is, 1) to 4) is processed in units of individual patent documents, and 1) to 4) should not be processed in units of sets.
  • the inclusion of the latent cited patent is processed by the fusion processing reference information unit 930 and is determined by a user's selection or a default value of the patent information system 10000. The default value can be non-inclusive.
  • the patent information system 10000 (F) citations the first unit fusion element corresponding to the patent document in the patent documents included in the first and second cited divided patent sets and the first cited divided patent set. Generated based on the divided patent set and the second cited divided patent set (SF23), and (G) a predetermined fusion processing criterion among the unit fusion elements generated by the first cited divided patent set and the second cited divided patent set Selecting unit fusion elements are screened (SF24). The information processing for each of the divided sets is used as it is for the information processing for each of the cited divided patent sets.
  • An example of the preset fusion processing criteria may be a difference operation between unit fusion elements corresponding to the first citation split patent set and unit fusion elements corresponding to the second citation split patent set.
  • Another example of the preset fusion processing criteria may be a difference operation between unit fusion elements corresponding to the i th cited split patent set and unit fusion elements corresponding to the i + 1 th cited split patent set.
  • the patent information system 10000 (H) generates a first divided patent set and at least one second divided patent set by dividing at least one or more patent sets generated or obtained by applying at least one split processing criterion (SF31).
  • the patent information system 10000 (K) selects (SF34) a unit fusion element that meets a predetermined fusion processing criterion among the unit fusion elements.
  • a preset fusion processing criterion may be a difference operation between unit fusion elements corresponding to the first cited split patent set and unit fusion elements corresponding to the first split patent set.
  • Another example of a preset fusion processing criterion may be a difference operation between unit fusion elements corresponding to the first divided patent set and unit fusion elements corresponding to the first cited divided patent set.
  • step (J) and step (K) has been processed for the first divided patent set and the first cited divided patent set, but the i-divided patent set and the i-th cited divided patent Of course, it can be processed to the set, the i-divided patent set, the j-th cited split patent set may be processed as a matter of course.
  • the patent information system 10000 (L) generates a first divided patent set and at least one second divided patent set by dividing the generated or received at least one patent set by applying at least one divided processing criterion (SF) )and,
  • Examples of the preset convergence processing criteria may include unit fusion elements corresponding to the first divided patent set, unit fusion elements corresponding to the second divided patent set, and unit fusion elements corresponding to the first cited divided patent set. And a set operation of a preset order of two or more selected from unit fusion elements corresponding to the second cited divided patent set.
  • the unit fusion elements corresponding to the set form a set, and the set may be a unit fusion element set, and the operation of the set unit may be processed.
  • the following may be selected as a unit fusion element that meets the predetermined fusion process criteria of the patent information system 10000.
  • the first is to accept the unit fusion element set as a result of the difference operation.
  • a first cited unit fusion element set composed of unit fusion elements corresponding to the first cited divided patent set, and a second cited unit composed of unit fusion elements corresponding to the at least one second cited divided patent set are selected.
  • Generating the blank fusion candidate information is performed by the blank fusion candidate discovery unit 980 of the fusion information processing system 9000 of the present invention.
  • the first is a first type blank fusion candidate related to the parallel element description, and finding this type of blank fusion candidate is to find a blank fusion candidate of the blank fusion candidate discovery unit 980 of the fusion information processing system 9000 of the present invention.
  • Section 981 performs.
  • the other is a second type blank fusion candidate related to the deepening element description, and the discovery of this type of blank fusion candidate is a deep blank fusion candidate of the blank fusion candidate discovery unit 980 of the fusion information processing system 9000 of the present invention.
  • the discovery unit 982 performs it.
  • the parallel element description refers to keywords that are at the hierarchical level equivalent to Ki or Kj in the core keyword hierarchy when (Ki, Kj), (Ci, Cj), (Ii, Ij) are present, and Ci or Cj in the patent classification hierarchy.
  • a patent classification at a level equal to and refers to an index at a level equivalent to Ii or Ij in the index hierarchy.
  • the deep element description refers to the keyword at the lower hierarchical level of Ki or Kj in the core keyword hierarchy when (Ki, Kj), (Ci, Cj), (Ii, Ij), and in the patent classification hierarchy of Ci or Cj.
  • a patent classification at a lower level and refers to Ii or Ij and an index at a lower level in the index hierarchy.
  • a unit fusion element that satisfies a fusion processing criterion is generated for a patent set composed of patent documents selected by a user or a system or satisfying specific conditions specified by a user or a system.
  • the set of unit fusion elements satisfying the fusion processing criteria is at least one of a patent classification combination set, a keyword combination set, and an index combination set.
  • FIG. 29 is a diagram of a portion of a patent classification system showing sibling nodes of H01B 1/06 at the bottom of H01B 1/00 and lower patent classification nodes of H01B 1/06.
  • A, H01B 1/06 and G05B 9/00 become nodes.
  • A is a center node CN1 as a patent technology classification of interest to a user.
  • the branch node BN1a becomes H01B 1/06 and G05B 9/00.
  • the fusion generating node is a method for computing three fusion discovery methods described in the present invention using patent classification (a method for computing a set of (Ci, Cj) using an n-division patent set, and a cited patent set using a divided patent set (Ci , Cj) are nodes that satisfy the fusion condition found by using any one or more of a set calculation method of Cj), a set calculation method of (Ci, Cj), etc. using a cited patent set and a split patent set.
  • sibling nodes refer to nodes whose parents are the same in the taxonomy. Due to the characteristics of the patent classification system, the technical elements in sibling nodes are often equal in themselves.
  • sibling nodes of the branch node (BN1a) H01B 1/06 include H01B 1/02, H01B 1/04, H01B 1/14, H01B 1/20, and the like, all of which are common to H01B 1/00. Have a parent
  • sibling nodes can be divided into two groups in relation to the center node CN1 A.
  • the first group is a fusion dropping sibling node, wherein the fusion dropping nodes are included in the patent classification combination set in relation to the center node CN1 A among the sibling nodes, but fall out because they do not meet the fusion processing criteria.
  • H01B 1/14 has a patent document in which its own or subordinate H01B 1/16 is co-occurrent with A, such that (A, H01B 1/14) or (A, H01B 1/16)
  • this patent classification combination is a unit fusion element that does not meet the fusion processing criteria, and is a node that is not selected in the process of performing the fusion discovery method.
  • the second group is an unused sibling node, such as H01B 1/02, H01B 1/04, H01B 1/20, which does not form a set of patent classification combinations in relation to the center node (CN1) A among sibling nodes. Nodes not used in the implementation of the.
  • the unused sibling node is a first type blank fusion candidate node of the present invention
  • the first type blank fusion candidate node is a kind of blank fusion candidate node. Since the branch node BN1a which is a sibling node of the first empty fusion candidate node satisfies a fusion processing condition with the center node CN1, the first empty fusion candidate nodes EN1a, EN1b, and EN1c are the centers. There is no explicit or exposed association with node CN1 A, but the center node CN1 A and the first empty fusion candidate nodes may have an implicit or latent association. Therefore, the first type blank fusion candidate node may be an element technology that is highly worth trying to use / use / apply / apply / expand / modify with respect to the center node CN1 A.
  • the converged information processing system 9000 generates the unused sibling node information for the at least one branch node BN1a that is selected by the user or selected by the system, and generates the generated unused sibling node. Information is displayed on the user's computer in the list or around the branch node BN1a on the network diagram. There may be various ways in which the converged information processing system 9000 generates the unused sibling node information. For example, the fusion information processing system 9000 extracts sibling node Sj information of specific branch nodes BN1a and Bi using the patent classification DB 113, and the center node CN1.
  • the non-use method is used to select the remaining Sj except for those common to Sj among Ci constituting (A, Ci) included in the patent classification combination set consisting of patent classification combinations (A, Ci) related to A.
  • Sibling node information can be generated.
  • Sj common to Ci is most often either the fusion dropping sibling node or any one of the fusion originating nodes that meet the fusion processing criteria with the center node CN1 A. That is, the fusion information processing system 9000 selects nodes that are not used in applying the fusion processing criteria among sibling nodes of the branch node BN1a to generate first blank fusion candidate node information.
  • B stands for Branch
  • Sj stands for Sibling.
  • a and H01B 1/06 meet fusion treatment criteria. At this time, there are three ways in which A and H01B 1/06 satisfy the fusion treatment criteria.
  • the second method is H01B 1/08, H01B 1/10 because any one or more of the sub-patent categories of H01B 1/06, H01B 1/08, H01B 1/10, H01B 1/12, meet the criteria for fusion with A.
  • H01B 1/06 which is the upper patent classification of H01B 1/12, meets the A and fusion treatment criteria.
  • the third method is a process in which A and H01B 1/06 meet the fusion treatment criteria, since at least one of the sub-patent classifications of H01B 1/06 and H01B 1/06 meets the fusion treatment criteria. .
  • the second and third methods are because the occurrence of convergence at a lower level in the patent classification system can be treated as the occurrence of convergence at a higher level.
  • the second type blank fusion candidate of the present invention relates to the first method above.
  • the second type blank fusion candidate refers to an unused lower node that is not used when applying the fusion processing criteria among the lower nodes of the nodes that satisfy the fusion processing criteria.
  • H01B 1/06 is a fusion originating node in relation to A
  • all of H01B 1/08, H01B 1/10, and H01B 1/12 which are subordinate nodes of H01B 1/06 are fused in relation to A H01B 1/08, H01B 1/10, and H01B 1/12 are all candidates of type 2 blank fusion if they are not used to generate fusion information when applying the criteria
  • H01B 1/08, H01B 1/10, H01B 1 If any one or more of / 12 satisfies the fusion processing criterion, or is used to generate the fusion information, the node excluding the node becomes the second type blank fusion candidate.
  • H01B 1/10 (DN1a) and H01B 1/12 ( DN1b) in relation to A is 1) a first type blank fusion candidate based on H01B 1/08, and 2) a second type blank fusion candidate based on H01B 1/06.
  • the fusion information processing system 9000 generates second type blank fusion candidate node information, which is the unused sub-node, for the at least one branch node selected by the user or selected by the system, and generates the generated information.
  • Second type blank fusion candidate node information is displayed on the user's computer around the branch node on a list or network diagram.
  • the fusion information processing system 9000 extracts lower node Lj information of a specific branch node Bi using the patent classification DB 113, and performs a patent classification combination A related to the center node A.
  • Ci constituting (A, Ci) included in the patent classification combination set consisting of Ci there is a method of selecting the remaining Lj except those common to Lj.
  • Lj common to Ci is most often either the fusion dropping sub-node or a fusion originating node that satisfies the fusion processing criteria with the center node A. That is, the fusion information processing system 9000 selects nodes that are not used at the time of applying the fusion processing criteria among the lower nodes of the branch node to generate second blank fusion candidate node information.
  • the specific technology of fusion with A is exposed as a patent only to the high level technology in the technology system, and the specific low level technology is not yet exposed, so the low level technology needs to be further searched in relation to A.
  • the relationship between H01B 1/08 oxide, H01B 1/10 sulfide, H01B 1/12 and organic matters is patented. Because it is not exposed, it is highly likely to be the object of priority research / search / preemption.
  • any one of the lower levels of H01B 1/06, a non-metallic substance, H01B 1/08, a sulfide, H01B 1/10, and an organic substance, H01B 1/12, has a relationship with A. This is because it may be an important invention in relation to A when a special technical effect is made through search and the like.
  • the significant blank fusion candidate is performed by the significant blank fusion candidate discovery unit 983 of the blank fusion candidate discovery unit 980 of the fusion information processing system 9000 of the present invention.
  • the first important blank fusion candidate condition is a document frequency in which the branch node and the blank fusion candidate node meet a fusion processing criterion, or where the branch node and the blank fusion candidate node come together / co-occurrent. ) Is more (more than the preset criteria), more recently (more than the preset criteria), more rapidly than the preset criteria, or more than the preset criteria, Larger (than preset criteria).
  • the blank fusion candidate node that satisfies the first important blank fusion candidate condition is closely related to the branch node, and the branch node satisfies a fusion processing criterion with the center node A, and thus, the center node A and the first node. 1
  • a blank fusion candidate node that meets the critical blank fusion candidate condition is likely to have a high potential association.
  • the second critical blank fusion candidate condition is a document frequency that the branch node and the center node satisfy a fusion processing criterion or are co-occurrent with the branch node and the center node A.
  • the branch nodes satisfying the second critical blank fusion candidate condition have a special strong association and are associated with the branch node having the special strong association.
  • the blank fusion candidate node to be used is likely to be a significant blank fusion candidate node of greater importance than the blank fusion candidate node associated with another branch node in the relationship with the center node A.
  • both the first significant blank fusion candidate condition and the second significant blank fusion candidate condition are satisfied, and satisfying the first significant blank fusion candidate condition is more than satisfying the second significant blank fusion candidate condition.
  • the first type blank fusion candidate may satisfy both the first significant blank fusion candidate condition and the second significant blank fusion candidate condition.
  • the second type blank fusion candidate is substantially independent of the first significant blank fusion candidate condition, and may be an important blank fusion candidate only when the second important blank fusion candidate condition is satisfied.
  • the convergence information processing system 9000 receives a user's selection for the specific one or more branch nodes, or, when selection information by the system occurs for the specific one or more branch nodes, 1 for the selected branch node, 1 2) generate the blank fusion candidate node information, and 2) provide one or more of the blank fusion candidate nodes together with the selected branch node to provide to the user.
  • the system 9000 may indicate first type empty fusion candidate nodes with the A having a sibling node relationship with the H01B 1/06 around the H01B 1/06.
  • H01B 1/02, H01B 1/04, H01B 1/20, and the like are blank fusion candidate nodes with A, and the H01B 1/06 around H01B 1/06. You can also show the connecting line. In this case, as shown in FIG. 48, as shown in FIG.
  • blank fusion candidate nodes with A and a connection line 30-5 with A may be additionally displayed.
  • the blank fusion candidates and the center node CN1 A are preferably represented by a line having a different shape or shape, such as a dotted line.
  • the convergence information processing system 9000 may further display information on the number of documents in which patent classifications specifying both nodes simultaneously appear on individual connection lines connecting both nodes as shown in FIG. 48.
  • the fusion information processing system 9000 calls a corresponding patent document and outputs a list, abstract or full text.
  • the method of calling the corresponding patent document is called through the patent classification corresponding to the connecting line.
  • a patent document corresponding to the number of documents 10 between H01B 1/06 and H01B 1/20 may be searched through a search expression / query for calling up a patent document including H01B 1/06 and H01B 1/20 simultaneously. You can get it.
  • a search expression / query will be created by combining the specific conditions with the two patent classifications. Will be taken for granted.
  • the fusion information processing system 9000 may also display an indication of a significant blank fusion candidate.
  • a node is indicated by a thick oval as H01B 1/20 is a significant blank fusion candidate.
  • the connection line of H01B 1/06 and H01B 1/20 of Figure 48 can be seen to be a special shape / shape, unlike the other connecting line, such as the arrow is thickened in size. As such, when the two patent classifications related to the connection line satisfy predetermined conditions, the fusion information processing system 9000 may display a predetermined special shape / shape.
  • the predetermined condition includes the number of documents, the rate of increase or increase in the number of documents, or a special document (eg, a specific applicant or a specific inventor (e.g., patent troll), a particular inventor, or a predetermined importance that meets a predetermined condition).
  • Patent classification that satisfies the conditions, or the like).
  • the fusion information processing system 9000 may be directly connected to A, not the branch fusion candidate node BN1a, as shown in FIG.
  • a + symbol is displayed on the lower patent classification extension display unit 35-1, and this symbol indicates that a patent classification is further added below the H01B 1/20.
  • the fusion information processing system 9000 receives H01B 1 / under the H01B 1/20 when the user receives selection information about the click, etc., of the lower patent classification extension display unit 35-1 from the user. 22 and H01B 1/24 Patent classification is connected to H01B 1/20 to process the information to be displayed expanded.
  • the fusion information processing system 9000 when the user selects H01B 1/06, for example, as shown in FIG. 51, the fusion information processing system 9000 has a lower node relationship of the H01B 1/06 around the H01B 1/06, It may be able to indicate the second type blank fusion candidate nodes with A.
  • FIG. 51 exemplifies that H01B 1/10 and H01B 1/12 become blank fusion candidates among the lower patent classifications of H01B 1/06.
  • a connection line between the center node CN1 A and the second type blank fusion candidate may also be indicated for the second type blank fusion candidate.
  • the fusion information processing system 9000 does not correspond to the second type blank fusion candidate as shown in H01B 1/08 as shown in FIG.
  • H01B 1/08 may be displayed differently from H01B 1/10 or H01B 1/12 which are the second type blank fusion candidates.
  • H01B 1/08 is in a fusion occurrence relationship or a fusion processing criteria meeting relationship with the center node CN1 A, and because it is technically equivalent to the second type blank fusion candidate (brother node), H01B 1/08 as shown in FIG. 51.
  • the second type blank fusion candidate may be further helped to infer the association with A than otherwise.
  • each node shows that the patent classification + title is displayed together.
  • Each node may include a case where only a patent classification appears, a case where a patent classification and a title appear together, a case where only a title appears, and the like. It is more desirable to have titles together than only patent classifications, because patent classifications alone can make it difficult to grasp the technical meaning of the patent classifications.
  • keywords and indexes are meaningful strings (they act as titles), so they can be displayed only with keywords or indexes. Of course, in the case of an index, it would be desirable to also display the patent classification corresponding to the index.
  • 48 to 51 show the patent classification display type selection unit 30-2.
  • each node shows both a patent classification and title information on the patent classification as shown in FIG. 48 to 51
  • the patent classification attribute selection unit 30-3 is provided.
  • FIG. 46-3 including the lower patent classification is selected by the patent classification attribute selection unit 30-3.
  • the user may select a depth representation for each node in the patent classification attribute selection unit 30-3.
  • the convergence portion is a patent classification notation of the 1 dot subgroup that is the parent of the 2 dot subgroup, even though each node is actually a patent classification corresponding to the 2 dot subgroup.
  • Information is processed so that it is expressed as a title.
  • each node is selected as a main group, it is natural that the patent classification corresponding to the main group is displayed together with the title information.
  • a patent classification corresponding to the branch node BN1a and the selected patent classification simultaneously appear in the specific patent document set to be analyzed or searched or processed on the connection line.
  • Predetermined analysis information such as increase / decrease rate or increase / decrease rate may be additionally displayed.
  • the predetermined analysis information may include key applicants, applicants having predetermined attributes, key inventors, distribution status by country, and various analysis indicators that are easily utilized by those skilled in the patent analysis industry.
  • the number of documents displayed on the connection line between the blank fusion candidate node and the center node CN1 will usually be zero.
  • the center node (CN1) A 1) a node with a very small air frequency, 2) a node where the rate of increase in the air frequency is smaller than a predetermined criterion, 3) a node whose air frequency increase rate is smaller than a predetermined criterion, or 4)
  • the number of documents may be non-zero if a node which is only aired in the past and recently has little air and the like is treated as a blank fusion candidate node.
  • Main group conductors or conductors characterized by H01B 1/00 conductive material; Selection of materials as conductor
  • the center node associated with the branch node H01B 1/06 is assumed to be one A for the convenience of explanation and schematic. However, in the network diagram there are typically at least one or more nodes that are connected to H01B 1/06. At this time, all nodes connected to H01B 1/06 may be the center node of the present invention. In this case, the discovery of the blank fusion candidate may be performed by 1) selecting one center node and selecting one branch node, 2) selecting n center nodes and selecting one branch node, and the like. Will be there.
  • the center node is connected to the predetermined criteria (for example, the node that is connected to the most nodes and becomes the hub, the document frequency If the default is set by the highest node, etc.) then that node will be the center node. If one center node or one center node is set as a default, the selection of the center node will not be necessary.
  • the predetermined criteria for example, the node that is connected to the most nodes and becomes the hub, the document frequency If the default is set by the highest node, etc.
  • the node that wants to find a blank fusion candidate is the branch node, and the branch node is connected to the branch node. It would be enough to be a center node. Therefore, for the processing of blank fusion candidate information, unless one center node or a center node is defined as a default, first select a branch node that wants to find a blank fusion candidate, and become a reference among a plurality of center nodes. It may be desirable to process the information in a way that specifies one or more, or to configure the interface.
  • the selection may be any one or more of the user's selection of the center node candidate or the selection according to the selection of the system for the center node candidate satisfying a predetermined criterion.
  • the predetermined criterion includes a center node candidate having a document frequency of a predetermined number or more, or a center node candidate having a predetermined percentage or more on a percentile basis for all documents related to the branch node and the center node candidate, based on a document frequency ranking. It may be a center node candidate or the like within the ranking.
  • the first method is to find a blank fusion candidate (or a significant blank fusion candidate) for each Ai, and display all found blank fusion candidates around the branch nodes.
  • the more frequent blank fusion candidates found among the found blank fusion candidates for example, frequency 3 in the case of a blank fusion candidate commonly generated for three center nodes, such as A1, A2, and A3. Since the high-space blank fusion candidate will be a high-space blank fusion candidate, it is important to make the high-frequency blank fusion candidate a significant blank fusion candidate, and to process information to distinguish it from the low-signal blank fusion candidates by adding a special mark. would be preferred.
  • the second method generates a set of patent classification combinations consisting of (Ai, Sj) for Sj, the sibling node of the selection center node Ai and the branch node Bj, and is not used when applying the fusion processing criteria among the above (Ai, Sj).
  • specific Sj among the selected Sj may come out two or more times. For example, when (A1, S2), (A2, S2), (A5, S2), and (A5, S3) remain, the remaining Sj is S2 and S3, and S2 is three times. Such high frequency Sj becomes Sj of high importance.
  • the method for finding a blank fusion candidate of the present invention with respect to the plurality of center nodes Ai may be applied to any one or more of a first type blank fusion candidate, a second type blank fusion candidate, and a significant blank fusion candidate discovery. Of course it will.
  • the fusion information processing system 9000 processes the blank fusion candidate discovery in the case where a plurality of branch nodes are selected.
  • a plurality of branch nodes in which one center node is selected and connected to the selected center node.
  • An information processing method in which the fusion information processing system 9000 finds a blank fusion candidate when the plurality of selected branch nodes have B1, B2, ... Bi will be described.
  • the first method is to find a blank fusion candidate (or a significant blank fusion candidate) for each Bi, and display all found blank fusion candidates around the Bi node.
  • the more frequent blank fusion candidates found among the found blank fusion candidates for example, frequency 3 in the case of blank fusion candidates commonly generated for three branch nodes, such as B1, B2, and B3.
  • the high-space blank fusion candidate will be a high-space blank fusion candidate, it is important to make the high-frequency blank fusion candidate a significant blank fusion candidate, and to process information to distinguish it from the low-signal blank fusion candidates by adding a special mark.
  • a blank fusion candidate with a frequency of 3 may be connected to the B1, B2, and B3.
  • the second method generates a set of patent classification combinations consisting of (A, Sj) for Sj, which is a sibling node of the center node A and the optional branch node Bi, and is not used when applying the fusion processing criteria among the above (A, Sj).
  • Sj is selected from the remaining (A, Sj). At this time, specific Sj among the selected Sj may come out two or more times. Such high frequency Sj becomes Sj of high importance.
  • the method in which the fusion information processing system 9000 discovers the blank fusion candidate of the present invention with respect to the plurality of branch nodes Bi is, of course, finding a first type blank fusion candidate, a second type blank fusion candidate, and a significant blank fusion candidate. Of course, it can be applied to any one or more.
  • the tree structure of the patent classification is used.
  • the index has a corresponding relationship with the patent classification and has a hierarchical structure like the patent classification system. Accordingly, an index combination set corresponding to a patent classification combination set may be generated, and a unit fusion element satisfying a fusion processing criterion may be generated through the index combination set, and a network diagram may be generated from the generated unit fusion element. do.
  • Each node in the generated network diagram will be an index.
  • the index constituting each node has a sibling node and a lower node in the index scheme as shown in FIG. Therefore, it will be appreciated that the method and system for finding a blank fusion candidate of the present invention utilizing the patent classification of the present invention can be used in the index as it is at the level of those skilled in the art.
  • keywords may have a hierarchical structure. That is, in the semantic or ontology field, there are those that have created a hierarchical structure for the technology keyword.
  • the keyword that is a node of the keyword network diagram (it will not necessarily be for all keywords). If there is a sibling node or a child node of the keyword, the present invention idea of finding a blank fusion candidate for the keyword is applied. You can do it.
  • the blank fusion candidate information is preferably generated by the user selecting at least one or more center nodes and / or at least one or more branch nodes on a network diagram generated by using a unit fusion element.
  • the network diagram is generated as a unit fusion element that satisfies a predetermined fusion processing criteria among the unit fusion elements generated from the first patent set and at least one or more second patent sets used when generating the fusion information in the present invention. It is not necessary.
  • the generation of the blank fusion candidate information of the present invention is independent of whether or not the fusion processing criteria are satisfied, and equivalent information processing can be performed using a network diagram generated by a unit fusion element generated from an arbitrary patent set. .
  • the criterion of the unused reference is whether the combination of the center node and the unused search node is used in the patent set. May be enough.
  • the unit fusion elements generated from the set of any of the patents that are the subject of the difference may satisfy the fusion process criteria, and may not meet the fusion process criteria, but overlap with any one of these (center)
  • a sibling node or center node included in a node, sibling node) or (center node, subordinate node) may not be an unused discovery node of the present invention.
  • FIG. 42 is a diagram illustrating an example of a network diagram generated by using a keyword combination extracted from a patent document constituting a patent set generated by the fusion information processing system 9000 of the present invention as a unit fusion element.
  • the numerical value above the connecting line is the number of patent documents containing both nodes connected by the connecting line.
  • FIG. 43 is a diagram illustrating one embodiment of a network diagram newly created by limiting a preset condition with respect to FIG. 42. In FIG. 43, the applicant is limited to Apple, the patent grade is B, the patent set is limited to only patent documents that have received four or more citations, and a network diagram is newly generated with unit fusion elements related to the limited patent set. One embodiment is.
  • FIG. 44 is an exemplary diagram of a network diagram generated using a patent classification as a unit fusion element.
  • FIG. 45 through 46 are exemplary embodiments of a method in which the fusion information processing system 9000 generates blank fusion candidate information.
  • the fusion information processing system 9000 generates a network diagram using the unit fusion element generated using at least one patent set composed of at least one patent document (SF111).
  • the patent set may be a patent set generated under an arbitrary condition, and the condition may be a keyword, an issuer, a time range included in a patent document, an applicant or an owner or assignee, an inventor, a patent classification, a patent subject classification, and a predetermined classification attribute. Any one or any combination of two or more.
  • the convergence information processing system 9000 may include selection information on at least one or more center nodes CN1 and at least one or more branch nodes BN1a connected to the center node CN1 among the nodes constituting the network diagram.
  • the search node for the selected branch node BN1a is obtained (SF112).
  • the branch node BN1a or the center node CN1 may be one or more than two.
  • the fusion information processing system 9000 selects unused search nodes from the search nodes and processes them as blank fusion candidate information (SF113).
  • the blank fusion candidate may be provided in a list form including analysis information, but it may be more preferable that the blank fusion candidate is displayed in a visual form such as a network diagram or other forms of diagrams, tables, and graphs.
  • the converged information processing system 9000 optionally allows the selected unused search node to be displayed SF114 on the network diagram.
  • the fusion information processing system 9000 may additionally generate SF115 information of important unused search nodes in the fusion information processing system 9000, and display the generated important unused search nodes on the network diagram according to importance. Can be displayed.
  • FIG. 46 is a view illustrating a unit fusion element satisfying a predetermined fusion processing criterion among the unit fusion elements generated for each of a first patent set and at least one or more second patent sets, and using the selected unit fusion elements. It relates to applying the present invention while generating a network diagram.
  • the fusion information processing system 9000 may include a unit fusion element that meets a predetermined fusion processing criterion among unit fusion elements generated for each of a first patent set composed of patent documents and at least one second patent set composed of patent documents.
  • a network diagram is generated using the generated unit fusion element (SF121).
  • the convergence information processing system 9000 may include selection information on at least one or more center nodes CN1 and at least one or more branch nodes BN1a connected to the center node CN1 among the nodes constituting the network diagram.
  • the search node for the selected branch node BN1a is obtained (SF122)
  • unused search nodes are selected from the search nodes and processed as blank fusion candidate information (SF123).
  • the converged information processing system 9000 displays the selected unused search node on the network diagram (SF124), generates important unused search node information (SF125), and displays the generated important unused search node information on the network. Make it visible on the diagram.
  • the present invention can be used in various ways, such as patent information industry, R & D support business, new business area discovery.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 국제 공통, 미국, 일본, 유럽의 고유 특허 분류 체계와 인덱스 분류 등과 같은 다른 분류 체계를 활용하여 니치 기술 영역을 효과적으로 탐색할 수 있도록 지원하고, 다수의 니치 평가 요소의 평가 요소값으로 니치 기술 영역을 다면적으로 분석할 수 있도록 지원하며, 니치 평가 기준값 및 니치 평가 요소값으로 니치 평가 모델을 생성하고, 생성된 니치 평가 모델로 니치 기술 영역을 평가하는 정보 처리 방법 및 정보 처리 시스템에 관한 것이다. 본 발명을 실시하면 니치 기술 영역을 탐색, 분석 및 평가할 수 있어, 니치 기술 영역을 효과적으로 발견할 수 있는 장점이 있다.

Description

니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템
본 발명은 니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템에 관한 것으로 더욱 자세하게는 국제 공통, 미국, 일본, 유럽의 고유 특허 분류 체계와 인덱스 분류 등과 같은 다른 분류 체계를 활용하여 니치 기술 영역을 효과적으로 탐색할 수 있도록 지원하고, 다수의 니치 평가 요소의 평가 요소값으로 니치 기술 영역을 다면적으로 분석할 수 있도록 지원하며, 니치 평가 기준값 및 니치 평가 요소값으로 니치 평가 모델을 생성하고, 생성된 니치 평가 모델로 니치 기술 영역을 평가하는 정보 처리 방법 및 정보 처리 시스템에 관한 것이다.
특허 정보는 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가 되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.
특허 정보를 입수할 수 있는 방법은 다양하나, 크게 1) 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것과 2) 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 및 3) 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 1)의 방법의 대표적인 예가 대한민국 특허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템이 있으며, 2)의 대표적인 예로 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr, www.wisdomain.com 등 있다.
www.delphion.com 의 운영회사인 톰슨사이언티픽과 같은 각 국가의 민간 기업들은 특허 정보 데이터베이스를 구축해 놓고, 특허 검색 엔진을 통하여 입력된 검색식에 대해 다양한 방식으로 검색 결과를 제공해 주고 있다. 또한, 이들 특허 정보를 기반으로 한 다양한 종류의 분석 소프트웨어가 개발되어 있으며, www.micropatent.com의 운영사(톰슨사이언티픽에 인수 합병되었음)가 개발한 상표명 AUREKA로 보급되는 소프트웨어가 유명하다. 그리고, 세계 각국의 기술 선진 대기업들은 내부에 특허 검색 및 특허 관리 시스템을 구축하여 운영하고 있는 것으로 알려져 있으나, 외부에서 그 기업들의 특허 검색 및 특허 관리 시스템에 대해 접근하기가 어렵다.
이러한 특허 검색 및 특허 관리 시스템을 구축하기 위해서는 수십억원 이상의 비용이 지출되는 것이 통상이어서, 국내외 대부분의 중견 및 중소 벤처 기업들은 자체 특허 검색 및 특허 관리 시스템을 구축하고 있지 못하고 있다. 이들 중견 및 중소 벤처 기업들은 특허 전담 조직을 두고 있는 경우도 다수 있으며, 이들이 자사의 특허에 대한 관리 및 자사를 위한 특허 정보를 수집하고 있다. 하지만, 기업 규모가 작거나, 특허에 대한 의식이 크지 않은 기업들은 이러한 특허 전담 조직을 갖추고 있지 못하는 경우가 많다. 이들 기업들은 특허법률사무소나 로펌 등에 의뢰하여 자신의 특허를 관리하고 있는 수준에 거치고 있다.
이들 특허 전담 조직은 www.delphion.com 등과 같은 외부에서 접근 가능한 유무료 온라인 특허 정보 서비스 업체들을 이용하여, 이들이 제공해 주는 플랫폼으로 특허 정보를 수집, 관리하고 있다. 그리고, 기업 명의로 된 특허 출원의 대부분은 그 기업 소속 발명자들에 의해서 이루어 지며, 그 발명자는 자신의 발명과 관련된 국내외의 특허 정보를 수집하는 것이 전세계적인 추세가 된다. 그 이유가 특허 공개 기간의 존재에도 불구하고 전세계의 신기술 정보는 70% 이상이 특허 정보의 형태로 공개되며, 특허 정보가 논문 정보 등에 비해서 상업적으로 이용가능한 아이디어가 많기 때문으로 풀이된다. 하지만, 이들 발명자들의 상당 부분은 특허 검색에 익숙해 있지 않거나, 검색에 익숙한 자라 하더라도 www.delphion.com 등과 같은 외부 특허 정보 서비스 제공업체에 접속하여 특허 정보를 입수 받고 있다.
통상적으로 발명자들은 특정 기술 분야에 대하여 수년 내지 십수년간 지속적으로 연구하는 것이 일반적이므로, 자신 발명한 기술 분야가 크게 변동되지 않는 것이 일반적이다. 그러므로, 자신이 발명한 기술 분야와 직접 또는 간접적으로 관련되는 분야에 관한 국내 또는 해외 각국의 특허 기술 정보는 발명자에게 유익한 정보가 될 것이다. 그러므로, 개별 기업 단위 뿐만 아니라, 그 기업 소속의 발명자 단위로 운영되며, 발명자 단위까지 최적화되어 특정 발명자 만을 위한 차별화된 특허 정보 서비스 시스템의 공급이 요청되어 왔으며, 이와 같은 특허 정보 서비스 시스템은 자체적으로 개발하고 유지할 수 없는 중견 및 중소벤처 기업들에게는 특허 정보에 대한 접근성을 크게 향상시킬 것이며, 자체적으로 개발 유지할 수 있는 기업들에게는 사내 특허 정보 유통의 새로운 플랫폼이 될 것이다.
AUREKA는 텍스트마이닝 처리를 통해 키워드를 추출하고, 이를 co-occurrence 처리하여 등고선 맵으로 제공해 주는 AUREKA 서비스는 매력적인 등고선 맵으로 빈발 키워드군을 보여주고 있으나, 바다(푸른색으로 채워져 있는 영역) 또는 키워드가 밀집하지 않은 영역에 대한 기술적 의미가 없어(AUREKA에는 그리드(위도/경도, 좌표축)이 없다.) 틈새 기술의 구조적 발견 등과 같은 고부가가치 서비스를 제공해 주지 못하는 문제가 있다.
이에 따라, 니치 기술을 조기에 발견하고 선점하기 위해서는 체계적으로 니치 기술 영역이나 틈새 기술 영역의 발견을 지원해 탐색을 지원해 주는 서비스나 시스템의 개발이 절실히 요구되어 왔다.
기술 교체 주기가 짧아지고, 마켓의 변동성이 커짐에 따라, R&D의 ROI(return of investment)가 지속적으로 악화되고 있다. 이러한 상황에 대응하여 오픈 이노베이션(Open Innovation)과 융합 기술의 중요성을 강조하는 목소리가 커지고 있다.
기존의 융합은 1) IT-BT 융합 등과 같은 선언적 융합, 2) 오감 체험 디스플레이 기기 및 서비스 등과 같은 상위 레벨에서의 예시적 융합, 3) 바이오칩 등과 같은 개별적 융합 등이 주종을 이루었다. 이러한 상황 하에서 융합의 중요성에 대한 명목적인 강조에도 불구하고, 실제로 활용 가능한 구체적인 지침이나 방향은 전무한 실정이다.
특허 정보는 기술 집단 지성의 결집체로서, 전세계의 기술적 지식의 대부분이 특허로 최초 공개되는 특성을 가지고 있는 소중한 인류의 자산이다. 이러한 특허 정보를 효과적으로 탐색하면, 기술 융합의 패턴을 찾을 수 있을 것이다.
2007년과 2009년에 본 특허의 출원인 ㈜광개토연구소는 특허 분류 정보 및 키워드를 활용한 특허 정보 융합 분석 기술에 대해서 개시한 바가 있다. 선행 특허들은 대한민국 특허 출원번호 제 10-2007-0061273, 10-2007-0002555, 10-2007-0129437, 10-2007-0129270, 10-2007-0129387, 10-2007-00129367, 10-2008-0126562, 10-2009-0082997 등이다. 본 선행 특허에서는 특허 분류 정보 및 키워드에 대한 연관 분석(association analysis)를 통해서 융합 패턴을 찾는 방법에 대해서 상세히 기술하고 있다. 이 특허들은 융합을 연관성의 존재의 관점에서 탐색하는데 초점을 맞추고 있다.
하지만, 융합을 관심 영역에 새롭게 들어온 그 무엇으로 보는 경우에는 융합의 발견을 위해 다른 접근 방법이 필요하게 된다. 기존의 연관 분석으로는 종래에도 빈번하게 연관된 것과 최근에 연관된 것과의 차이를 구분하기 어려운 문제가 있다. 이에 따라, 연관 분석을 적용하면서도 융합의 새로운 관점을 반영할 수 있는 기술 개발이 요구되어 왔다.
한편, 공개된 정보를 통하여 융합 정보를 생성하는 경우, 그 생성되는 융합 정보는 그 자체로 정보적 가치가 있겠지만, 특허적 의미에서는 적어도 하나 이상의 국가에서 적어도 하나 이상의 주체에 의해서 법률적으로 선점된 것이거나, 적어도 공개된 것이다. 따라서, 타인에 의해 선점되지 않았거나, 타인에 의해 집중적으로 탐색되지 않은 새로운 공백 영역을 발견하는 방법 및 시스템에 대한 요구가 있어 왔다.
이러한 공백 융합 영역은 새로운 니치 기술 영역이 될 수 있으므로, 이러한 공백 융합 영역의 발견은 R&D에 대한 의사 결정, 신규 사업 진출 영역에 대한 의사 결정, 미래 신수종 사업의 발견을 위한 탐색이나 탐구 등에 활발하게 활용되는 중요한 분야로, 타인이 시도하지 않은 이러한 틈새 기술의 체계적인 발견은 산업계에서 절실히 요구되어 왔다.
본 발명이 해결하려는 첫번째 기술적 과제는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법을 제시하는 것이다.
본 발명이 해결하려는 두번째 기술적 과제는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템을 제시하는 것이다.
본 발명이 해결하려는 세번째 기술적 과제는 니치 기술 영역 평가를 지원하는 니치 기술 평가 모델의 생성을 위한 특허 정보 시스템의 정보 처리 방법을 제시하는 것이다.
본 발명이 해결하려는 네번째 기술적 과제는 니치 기술 영역 평가를 지원하는 니치 기술 평가 모델의 생성을 위한 특허 정보 시스템을 제시하는 것이다.
본 발명이 해결하려는 과제는 특허 정보를 활용하여 공백 융합 후보 정보 및 중요 공백 융합 후보 정보를 생성하고 사용자에게 제공하는 방법을 개시하는 것이다. 이러한 공백 융합 후보를 통해 니치 기술 영역을 효과적으로 탐색하도록 지원하는 방법을 개시할 수 있다.
본 발명이 해결하려는 다른 과제는 공백 융합 후보 정보 및 중요 공백 융합 후보 정보를 생성하고 사용자에게 제공하는 시스템을 개시하는 것이다.
본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법에 있어서, 상기 특허 정보 시스템이 (a) 상기 사용자 컴퓨터로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수 받는 단계; (b) 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성하는 단계; 및 (c) 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합(교차 영역 집합)을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성하는 단계;를 포함하며, 상기 제1 특허 분류는 IPC, F-term, FI, UPSC, ECLA 중 어느 하나 이상인 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법을 제시한다.
(d) 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시하도록 하는 단계;를 더 포함하는 것이 바람직하다.
상기 교차 영역 집합은 상기 제1 특허 분류 집합과 상기 제2 분류 집합을 사용하는 매트릭스나 큐브 형태의 교차 영역 프레임인 것이 바람직하다.
상기 교차 영역 문건 집합은 적어도 하나 이상의 타겟 문건 집합의 부분 문건 집합인 것이며, 상기 타겟 문건 집합은 상기 사용자가 지정하거나 생성한 문건 집합이거나, 상기 시스템이 지정하거나 생성한 문건 집합인 것인 것이며, 선택적으로 상기 타겟 문건 집합은 기 설정된 한정 조건을 충족하는 문건들로만 한정될 수 있는 것이며, 상기 한정 조건은 시간 한정, 출원인이나 권리자 한정, 발명자 한정, 특허 평가 점수나 특허 평가 등급의 한정, 출원인, 권리자 또는 발명자의 속성 한정, 특허 평가 지표의 충족 정도의 한정, 특정 서지 사항 속성 포함 여부의 한정, 특허에 대한 측정값의 한정 중 어느 하나 이상인 것이 바람직하다.
상기 제2 분류는 특허 분류 또는 특허 분류와 대응 관계를 가지는 준 특허 분류인 것이며, 상기 준 특허 분류는 IndextoUSPC, CatchWord 중 어느 하나 이상인 것이며, 상기 준 특허 분류는 준 특허 분류 1개당 적어도 하나 이상의 특허 분류가 대응되는 것인 것이 바람직하다.
상기 (a) 단계에서, 적어도 하나 이상의 하위 특허 분류를 가지는 적어도 하나 이상의 상위 특허 분류를 선택함으로써, 상기 선택된 상위 특허 분류에 대한 상기 하위 특허 분류를 상기 제1 특허 분류 집합으로 처리하는 것인 것이 바람직하다.
상기 교차 영역 문건 집합은 타겟 문건 집합 중 상기 제1 특허 분류 집합을 구성하는 제1 특허 분류와 상기 제2 분류 집합을 구성하는 제 2분류의 속성을 동시에 충족하는 문건들로 구성되는 것이며, 상기 속성의 충족은 상기 교차 영역 문건에 상기 제1 특허 분류와 상기 제2 분류의 전부 또는 일부분이 동시에 나타나 있거나, 상기 교차 영역 문건에 나와 있는 특허 분류의 특허 분류 체계 상의 적어도 하나 이상의 상위 특허 분류의 전부 또는 일부분이 상기 제1 특허 분류와 상기 제2 분류에 동시에 나타나는 것인 것이 바람직하다.
상기 제1 특허 분류 집합은 특허 분류 체계 상에서 어느 하나의 상위 특허 분류에 대하여, 상기 상위 특허 분류의 전체 하위 특허 분류 중 상기 사용자가 선택하는 하위 특허 분류를 포함하여 구성되는 것인 것이 바람직하다.
상기 니치 분석 정보는 상기 사용자가 선택할 수 있는 것이며, 상기 니치 분석 정보는 적어도 하나 이상의 니치 분석 지표나 니치 분석 모델을 사용하는 것이며, 상기 교차 영역값은 상기 니치 분석 지표나 상기 니치 분석 모델의 선택에 따라 변동되는 것인 것이 바람직하다.
상기 교차 영역 프레임에는 상기 제1 특허 분류 집합을 구성하는 특허 분류와 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 것이며, 상기 교차 영역 프레임은 상기 제1 특허 분류 집합을 구성하는 특허 분류가 나타나는 제1 프레임축, 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 제2 프레임축으로 구성되며, 상기 교차 영역이 배치되는 방법은 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제1 배치 방법, 제1 특허 집합의 특허 분류에 대응되는 교차 영역 집합이 없는 없거나 제2 분류 집합의 제2 분류에 대응되는 교차 영역 집합이 없는 경우, 교차 영역 집합이 없는 특허 분류나 제2 분류를 제외하고 교차 영역 집합이 존재하는 특허 분류나 제2 분류에 대하여, 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제2 배치 방법, 및 상기 제1 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제2 프레임축에 가까이 배치하고, 상기 제2 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제1 프레임축에 가까이 배치하는 제3 배치 방법 중 어느 하나의 방법이 적용되는 것인 것이며, 상기 제1 배치 방법, 상기 제2 배치 방법 및 상기 제3 배치 방법은 상기 사용자의 선택이나 상기 시스템의 설정에 따라 선택될 수 있는 것인 것이 바람직하다.
본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템에 있어서, 상기 사용자 컴퓨터로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수 받는 교차 영역 프레임 선택부; 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성하는 교차 영역 집합 생성부; 및 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합(교차 영역 집합)을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성하는 니치 분석 정보 생성부;를 포함하며, 상기 제1 특허 분류는 IPC, F-term, FI, UPSC, ECLA 중 어느 하나 이상인 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템을 제시한다.
상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시하도록 하는 니치 분석 정보 표시부;를 더 포함하는 것이 바람직하다.
제1 특허 분류 집합 및 제2 분류 집합의 선택 이력 및 현재 선택 사항을 관리하는 선택 프레임 관리부;를 더 포함하는 것이 바람직하다.
상기 니치 분석 정보 생성부는 니치 관점별로 니치 분석 정보를 생성하는 니치 관점 분석 정보 생성부; 및 니치 모델별로 니치 분석 정보를 생성하는 니치 모델 분석 정보 생성부; 중 어느 하나 이상을 더 포함하는 것인 것이 바람직하다.
상기 교차 영역 집합을 배치하는 교차 영역 집합 배치부;를 더 포함하며, 상기 교차 영역 집합 배치부가 상기 교차 영역 집합 배치부가 상기 교차 영역을 배치하는 방법은
상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제1 배치 방법, 제1 특허 집합의 특허 분류에 대응되는 교차 영역 집합이 없는 없거나 제2 분류 집합의 제2 분류에 대응되는 교차 영역 집합이 없는 경우, 교차 영역 집합이 없는 특허 분류나 제2 분류를 제외하고 교차 영역 집합이 존재하는 특허 분류나 제2 분류에 대하여, 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제2 배치 방법, 및 제1 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 제2 프레임축에 가까이 배치하고, 제2 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 제1 프레임축에 가까이 배치하는 제3 배치 방법 중 어느 하나의 방법 중 어느 하나를 실시하는 것이며, 교차 영역 프레임에는 상기 제1 특허 분류 집합을 구성하는 특허 분류와 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 것이며, 상기 교차 영역 프레임은 상기 제1 특허 분류 집합을 구성하는 특허 분류가 나타나는 제1 프레임축, 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 제2 프레임축으로 구성되며, 상기 제1 배치 방법, 상기 제2 배치 방법 및 상기 제3 배치 방법은 상기 사용자의 선택이나 상기 시스템의 설정에 따라 선택될 수 있는 것인 것이 바람직하다.
본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 발견 모델을 생성하는 특허 정보 시스템의 정보 처리 방법에 있어서, 상기 특허 정보 시스템이, (M1) N 개의 표본 문건 집합에 대하여, 상기 N개 각각의 표본 문건 집합을 적어도 하나 이상의 분할 기준을 적용하여 2 이상의 부분으로 분할하여 제1 부분 표본 문건 집합과 적어도 하나 이상의 제2 부분 표본 문건 집합(부분 표본 문건 집합)을 구성하는 단계; (M2) 상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합을 대상으로 니치 기준 요소에 대한 니치 기준 요소값 정보를 생성하는 단계; (M3) 상기 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대하여 니치 평가 요소값 정보를 생성하는 단계; 및 (M4) 상기 니치 기준 요소값을 종속 변수값으로 하고, 상기 니치 평가 요소값을 독립 변수값으로 하여 기 설정된 통계 알고리즘을 적용하여 니치 평가 모델을 생성하는 단계;를 포함하는 것이며, 상기 N은 자연수인 것이며, 상기 문건 집합을 구성하는 문건은 특허 문건인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법을 제시한다.
상기 분할 기준은 적어도 하나 이상의 기 설정되는 시점이거나, 상기 표본 문건 집합에서의 기 설정된 유형의 변동이 발생하는 적어도 하나 이상의 시점인 것이 바람직하다.
상기 기 설정된 유형의 변동은 문건 총량의 기 설정된 범위 이상의 변동, 주체 총량의 기 설정된 범위 이상의 변동, 상기 표본 문건 집합을 대상으로 계산될 수 있는 기 설정된 변수값의 기 설정된 범위 이상의 변동 중 어느 하나인 것이 바람직하다.
상기 N개의 표본 문건 집합에 대하여 적용되는 분할 기준은 상기 N개의 표본 문건 집합별로 다를 수 있는 것인 것이 바람직하다.
상기 (M1) 단계에서 생성된 제1 부분 표본 문건 집합의 개수와 상기 (M2) 단계에서 사용하는 제1 부분 표본 문건 집합의 개수는 다를 수 있는 것이며, 상기 (M1) 단계에서 생성된 제2 부분 표본 문건 집합의 개수와 상기 (M2) 단계에서 사용하는 제2 부분 표본 문건 집합의 개수는 다를 수 있는 것이며, 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합은 공집합일 수 있는 것이며, 상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합 중 어느 하나의 집합이 공집합인 경우, 공집합이 발생한 표본 문건 집합에 기인한 분할 표본 문건 집합은 상기 (M2) 단계를 실시하지 않는 것인 것이 바람직하다.
상기 니치 기준 요소는 적어도 하나 이상의 니치 평가 요소를 사용하여 생성되는 단일 니치 기준 요소 또는 복합 니치 기준 요소 중 어느 하나이며, 상기 니치 기준 요소가 니치 평가 요소를 사용하는 경우, 상기 (M3) 단계를 실시할 때, 상기 사용된 니치 평가 요소는 제외하고 실시하는 것인 것이 바람직하다.
상기 니치 평가 요소는 적어도 2개 이상의 그룹으로 그룹핑 되는 것인 것이며, 상기 그룹은 총량 관점의 니치 평가 요소로 생성되는 그룹, 변동 관점의 니치 평가 요소로 생성되는 그룹, 질적 관점의 니치 평가 요소로 생성되는 그룹, 및 신규 관점의 니치 평가 요소로 생성되는 그룹 중 어느 하나의 그룹을 포함하는 것인 것이 바람직하다.
상기 통계 알고리즘은 기계 학습 계열의 비선형 알고리즘인 것인 것이 바람직하다.
상기 비선형 알고리즘은 부스팅 알고리즘인 것인 것이 바람직하다.
(M5) 니치 평가의 대상이 되는 지정되거나 입력된 입수 문건 집합을 입수하는 단계; (M6) 상기 입수 문건 집합에 대하여 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성하는 단계; 및 (M7) 생성된 상기 니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 니치 평가값을 생성하는 단계;를 더 포함하는 것인 것이 바람직하다.
상기 (M3) 내지 (M4) 단계는 상기 그룹별로 수행되는 것이며, 상기 니치 평가 모델은 상기 그룹별로 생성되는 것인 것이 바람직하다.
상기 니치 평가 모델은 니치 평가값 생성 모델을 더 포함하는 것이며, 상기 니치 평가값 생성 모델은 지정되거나 입력된 입수 문건 집합에 대하여, 상기 입수 문건 집합을 대상으로 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성하고, 생성된 상기 니치 평가 요소값 정보를 사용하여 니치 스코어를 생성하는 것인 것이 바람직하다.
상기 니치 평가 모델을 생성하는 것은 니치 평가 요소별 통계 분석 정보의 생성, 니치 평가 모델 검증 정보의 생성 및 과적합 방지 파라미터의 조절 중 어느 하나 이상을 포함하는 것이 바람직하다.
(M8) 적어도 1개 이상의 니치 옵션을 사용하여 상기 (M5) 단계에서 입수한 입수 문건 집합을 분할하여 복수 개의 분할 입수 문건 집합을 생성하고, 상기 생성된 분할 입수 문건 집합별로 상기 (M6) 단계 내지는 (M7) 단계를 수행하여 상기 분할 입수 문건 집합별로 상기 니치 평가값을 생성하는 단계;를 더 포함하는 것이 바람직하다.
(M9) 상기 복수 개의 분할 입수 문건 집합별로 생성되는 상기 니치 평가값에서 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합 정보를 선별하는 단계;를 더 포함하는 것이 바람직하다.
상기 니치 평가값이 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합에 대하여 기 설정된 적어도 하나 이상의 특허 분석을 수행하여, 상기 분할 입수 문건 집합 및 수행된 특허 분석의 결과로 기 설정된 니치 발견 리포팅 정보를 생성하는 것인 것이 바람직하다.
본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 발견 모델을 생성하는 특허 정보 시스템에 있어서, 상기 특허 정보 시스템은 니치 평가 모델 생성부를 포함하며, 상기 니치 평가 모델 생성부는 N 개의 표본 문건 집합에 대하여, 상기 N개 각각의 표본 문건 집합을 적어도 하나 이상의 분할 기준을 적용하여 2 이상의 부분으로 분할하여 제1 부분 표본 문건 집합과 적어도 하나 이상의 제2 부분 표본 문건 집합을 구성하는 문건 집합 분할 모듈; 상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합을 대상으로 니치 기준 요소에 대한 니치 기준 요소값 정보를 생성하는 니치 기준 요소값 생성 모듈; 상기 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대하여 니치 평가 요소값 정보를 생성하는 니치 평가값 생성 모듈; 및 상기 니치 기준 요소값을 종속 변수값으로 하고, 상기 니치 평가 요소값을 독립 변수값으로 하여 기 설정된 통계 알고리즘을 적용하여 니치 평가 모델을 생성하는 니치 평가 알고리즘 생성 모듈;를 포함하며, 상기 N은 자연수인 것이며, 상기 문건 집합을 구성하는 문건은 특허 문건인 것을 특징으로 하는 특허 정보 시스템을 제시한다.
니치 평가의 대상이 되는 지정되거나 입력된 입수 문건 집합을 입수하는 니치 분석용 문건 집합 입수부; 및 니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 니치 평가값을 생성하는 니치 평가값 생성 모듈;를 더 포함하는 것인 것이 바람직하다.
적어도 1개 이상의 니치 옵션을 사용하여, 입수한 입수 문건 집합을 분할하여 복수 개의 분할 입수 문건 집합을 생성하고, 상기 생성된 분할 입수 문건 집합별로 상기 니치 평가값을 생성하고, 상기 분할 입수 문건 집합별로 생성되는 상기 니치 평가값에서 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합을 선별하는 니치 발견 시뮬레이션 모듈;를 더 포함하는 것이 바람직하다.
상기 니치 평가값이 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합에 대하여 기 설정된 적어도 하나 이상의 특허 분석을 수행하여, 상기 분할 입수 문건 집합 및 수행된 특허 분석의 결과로 기 설정된 니치 발견 리포팅 정보를 생성하는 니치 발견 리포팅 정보 생성부;를 포함하는 것이 바람직하다.
본 발명이 이루고자 하는 과제를 달성하기 위하여, 특허 정보 시스템에서, 상기 특허 정보 시스템이 (A) 적어도 하나 이상의 특허 문건으로 구성되는 적어도 하나 이상의 특허 집합을 사용하여 생성되는 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성하는 단계; (B) 상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드, 상기 센터 노드와 연결되는 적어도 하나 이상의 가지 노드에 대한 선택 정보가 있을 때, 선택된 상기 가지 노드에 대한 탐색 노드를 입수하는 단계; 및 (C) 상기 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리하는 단계;를 포함하며, 상기 (B) 단계에서 상기 가지 노드는 상기 특허 정보 시스템의 사용자 컴퓨터로부터 선택받는 것이며, 상기 센터 노드는 상기 사용자 컴퓨터 또는 상기 특허 정보 시스템의 기설정된 선택 기준에 의해 선택받는 것이며, 상기 (B) 단계에서 상기 탐색 노드는 상기 가지 노드에 대한 상기 가지 노드가 속하는 분류 체계 상에서 상기 가지 노드의 형제 노드인 것이거나, 상기 가지 노드의 하위 노드인 것이며, 상기 (C) 단계에서의 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 (A) 단계의 상기 특허 집합을 사용하여 생성되는 단위 융합 요소에 존재하는 않은 조합에 관련되는 노드인 것이며, 상기 단위 융합 요소는 2 이상의 특허 분류로 구성되는 특허 분류 조합, 2개 이상의 키워드로 구성되는 키워드 조합, 및 특허 분류에 대응되는 인덱스 조합 중에서 선택되는 어느 하나 이상인 것이며, 상기 특허 분류 조합 및 상기 인덱스 조합은 상기 특허 문건에 포함된 2개 이상의 특허 분류를 기초로 생성되는 것인 것이며, 상기 키워드는 상기 특허 문건에서 추출된 키워드, 상기 특허 문건에서 추출된 키워드를 가공한 키워드 중 어느 하나 이상인 것이며, 상기 단위 융합 요소의 생성은 상기 단위 융합 요소가 특허 분류 조합 또는 인덱스 조합인 경우에는 상기 특허 문건 중 적어도 한 종류 이상의 특허 분류를 기준으로 2개 이상의 특허 분류를 포함하는 특허 문건을 대상으로 실시되는 것인 것을 특징으로 하는 특허 정보를 활용하여 공백 융합 후보 정보를 생성하는 방법을 개시한다.
상기 (A) 단계에서 생성되는 단위 융합 요소는 적어도 하나 이상의 특허 문건으로 구성되는 제1 특허 집합 및 특허 문건으로 구성되는 적어도 하나 이상의 제2 특허 집합별로 생성되는 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소인 것이며, 상기 (C) 단계에서의 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 (A) 단계에서 제1 특허 집합 및 적어도 하나 이상의 제2 특허 집합별로 생성되는 단위 융합 요소에서 생성되지 않은 조합인 것인 것이 바람직하다.
상기 (A) 단계의 제1 특허 집합과 제2 특허 집합이 생성되는 방법은 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 분할된 어느 한 특허 집합으로 상기 제1 특허 집합을 생성하고, 분할된 다른 특허 집합으로 상기 제2 특허 집합을 생성하는 제 1 방법, 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성하고, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합으로 상기 제1 특허 집합을 생성하고,적어도 하나 이상의 제2 인용 분할 특허 집합으로 상기 제2 특허 집합을 생성하는 제2 방법, 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성하고, 상기 제1 분할 특허 집합으로 상기 제1 특허 집합을 생성하고, 상기 제1 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합으로 상기 제2 특허 집합을 생성하는 제3 방법 중 어느 하나의 방법으로 생성되는 것인 것이 바람직하다.
상기 (A) 단계에서 상기 융합 처리 기준은 상기 단위 융합 요소가 상기 제1 특허 집합 및 상기 제2 특허 집합별로 1) 어느 한 특허 집합에만 존재하는 것이거나, 2) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 차이 이상인 것이거나, 3) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 증가 속도 이상인 것이거나, 4) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 증가 가속도 이상인 것이거나, 5) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 함수 관계나 기 설정된 조건 관계를 성립시키는 것인 것이 바람직하다.
상기 (C) 단계에서 상기 비사용 탐색 노드를 생성하는 단계는, 상기 센터 노드와 상기 탐색 노드로 생성되는 조합 집합을 구성하는 조합 중에서 상기 (A) 단계에서 생성되는 단위 융합 요소와 중복되는 조합을 배제하고 남은 조합에 포함되는 탐색 노드로 처리하는 제1 방법, 및 상기 탐색 노드 중에서 상기 (A) 단계에서 생성되는 단위 융합 요소 중 센터 노드가 포함된 단위 융합 요소에 사용된 노드를 배제하고 남은 탐색 노드로 처리하는 제2 방법 중 어느 하나의 방법을 사용하는 것이 바람직하다.
(D) 상기 비사용 탐색 노드가 상기 네트워크 다이어그램 상에 표시되는 단계;를 포함하는 것이 바람직하다.
상기 네트워크 다이어그램에서 상기 비사용 탐색 노드가 표시되는 방법은 상기 비사용 탐색 노드가 상기 가지 노드 주위에 배치되는 것인 것이며, 선택적으로, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 2 이상 간에는 기설정된 형태의 연결선이 표시되는 것이며, 선택적으로 상기 연결선 상에는 상기 연결선이 연결하는 2개의 노드에 대응되는 특허 문건으로 구성되는 특허 문건 집합에 대한 적어도 하나 이상의 분석 정보가 표시되는 것이며, 상기 분석 정보에는 빈도가 포함되어 있는 것이며, 선택적으로 상기 연결선의 형태는 상기 분석 정보에 따라 변동될 수 있는 것인 것이며, 선택적으로 상기 노드의 형태는 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 하나 이상이 다른 형태를 가지는 것인 것이며, 선택적으로 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드가 특허 분류와 관련된 것인 경우에는 상기 노드에 나타나는 정보는 1) 상기 특허 분류만 나타나는 방법, 2) 상기 특허 분류에 대응되는 타이틀만 나타나는 방법 및 3) 상기 특허 분류와 상기 타이틀이 모두 나타나는 방법 중 어느 하나인 것이며, 선택적으로 상기 비사용 탐색 노드에는 하위 분류 확장 표시가 더 포함되어 있으며, 상기 확장 표시가 선택되는 경우, 상기 비사용 탐색 노드가 속하는 분류 체계 상에서 상기 비사용 탐색 노드의 하위 노드가 상기 비사용 탐색 노드의 주위에 배치되는 것인 것이며, 선택적으로 상기 탐색 노드가 상기 가지 노드의 하위 노드인 경우, 상기 비사용 탐색 노드가 표시될 때, 상기 비사용 탐색 노드의 형제 노드 중에서 상기 센터 노드와 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 구성하는 형제 노드도 상기 비사용 탐색 노드와 구분되면서 함께 표시되는 것인 것이 바람직하다.
(E) 중요 비사용 탐색 노드 정보를 생성하는 단계;를 더 포함하며, 상기 중요 비사용 탐색 노드 정보를 생성하는 방법은 상기 비사용 탐색 노드 중에서 상기 가지 노드와 기설정된 기준을 충족하는 비사용 탐색 노드를 선별하는 것으로 생성하는 제1 방법, 상기 가지 노드가 복수 개가 있을 때, 적어도 하나 이상의 센터 노드와 상기 복수 개의 가지 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제2 방법 및 상기 센터 노드가 복수 개가 있을 때, 적어도 하나 이상의 가지 노드와 상기 복수 개의 센터 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제3 방법 중 어느 하나 이상의 방법을 사용하는 것이며, 상기 제1 방법에서 상기 비사용 탐색 노드와 상기 가지 노드가 충족하는 기준은 상기 비사용 탐색 노드와 상기 가지 노드가 함께 나오는 특허 문건의 개수가 기설정된 기준 이상이거나, 기설정된 증가율 이상이거나, 기설정된 증가 속도 이상이거나, 기설정된 함수 관계를 성립하는 경우 중 어느 하나 이상인 것인 것이 바람직하다.
상기 제1 특허 집합 및 상기 제2 특허 집합은 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 기초로 생성되는 것인 것이며, 상기 분할 처리 기준은 상기 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, 특허 주제 분류 및 기 설정된 분류 속성 중 어느 하나 또는 어느 2 이상의 조합으로 생성되는 것인 것이며, 상기 시간 범위의 기준이 되는 시간은 상기 특허 문건의 우선일, 출원일, 공개일 및 등록일 중 어느 하나 또는 어느 2 이상의 조합을 사용하는 것이며, 상기 특허 분류는 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 또는 어느 2 이상의 조합인 것이며, 상기 특허 주제 분류는 상기 IPC의 인덱스, 상기 USPC의 인덱스 또는 상기 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 이상을 사용하여 생성되는 주제 분류 중 어느 하나 이상인 것이며, 상기 기 설정된 분류 속성은 상기 출원인이나 상기 권리자나 상기 양수인에 대한 분류 속성, 상기 특허 분류를 구성하는 특허 분류별 분류 속성, 상기 발명자에 대한 분류 속성, 또는 상기 특허 주제 분류별 분류 속성 중 어느 하나 이상인 것인 것이 바람직하다.
본 발명이 이루고자 하는 과제를 달성하기 위하여, 특허 정보 시스템에서, 상기 특허 정보 시스템은 적어도 하나 이상의 특허 문건으로 구성되는 적어도 하나 이상의 특허 집합을 사용하여 단위 융합 요소를 생성하는 단위 융합 요소 생성부; 상기 생성된 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성하는 융합 패턴 분석부; 및 상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드, 상기 센터 노드와 연결되는 적어도 하나 이상의 가지 노드에 대한 선택 정보가 있을 때, 선택된 상기 가지 노드에 대한 탐색 노드를 입수하고, 상기 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리하는 공백 융합 후보 발견부;을 포함하며, 상기 가지 노드는 상기 특허 정보 시스템의 사용자 컴퓨터로부터 선택받는 것이며, 상기 센터 노드는 상기 사용자 컴퓨터 또는 상기 특허 정보 시스템의 기설정된 선택 기준에 의해 선택받는 것이며, 상기 탐색 노드는 상기 가지 노드에 대한 상기 가지 노드가 속하는 분류 체계 상에서 상기 가지 노드의 형제 노드인 것이거나, 상기 가지 노드의 하위 노드인 것이며, 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 특허 집합을 사용하여 생성되는 단위 융합 요소에 존재하는 않은 조합에 관련되는 노드인 것이며, 상기 단위 융합 요소는 2 이상의 특허 분류로 구성되는 특허 분류 조합, 2개 이상의 키워드로 구성되는 키워드 조합, 및 특허 분류에 대응되는 인덱스 조합 중에서 선택되는 어느 하나 이상인 것이며, 상기 특허 분류 조합 및 상기 인덱스 조합은 상기 특허 문건에 포함된 2개 이상의 특허 분류를 기초로 생성되는 것인 것이며, 상기 키워드는 상기 특허 문건에서 추출된 키워드, 상기 특허 문건에서 추출된 키워드를 가공한 키워드 중 어느 하나 이상인 것이며, 상기 단위 융합 요소의 생성은 상기 단위 융합 요소가 특허 분류 조합 또는 인덱스 조합인 경우에는 상기 특허 문건 중 적어도 한 종류 이상의 특허 분류를 기준으로 2개 이상의 특허 분류를 포함하는 특허 문건을 대상으로 실시되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템을 개시한다.
상기 특허 집합은 적어도 하나 이상의 특허 문건으로 구성되는 제1 특허 집합 및 특허 문건으로 구성되는 적어도 하나 이상의 제2 특허 집합이며, 상기 단위 융합 요소는 상기 제1 특허 집합 및 상기 제2 특허 집합별로 생성되는 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소인 것이며, 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 제1 특허 집합 및 상기 제2 특허 집합별로 생성되는 단위 융합 요소에서 생성되지 않은 조합에 관련된 노드인 것이 바람직하다.
상기 공백 융합 후보 발견부가 상기 비사용 탐색 노드를 생성하는 방법은 상기 센터 노드와 상기 탐색 노드로 생성되는 조합 집합을 구성하는 조합 중에서 상기 단위 융합 요소와 중복되는 조합을 배제하고 남은 조합에 포함되는 탐색 노드로 처리하는 제1 방법, 및 상기 탐색 노드 중에서 상기 단위 융합 요소 중 센터 노드가 포함된 단위 융합 요소에 사용된 노드를 배제하고 남은 탐색 노드로 처리하는 제2 방법 중 어느 하나의 방법을 사용하는 것이 바람직하다.
상기 융합 패턴 분석부는 상기 비사용 탐색 노드를 상기 네트워크 다이어그램 상에 표시하는 기능을 수행하며, 상기 네트워크 다이어그램에서 상기 비사용 탐색 노드가 표시되는 방법은 상기 비사용 탐색 노드가 상기 가지 노드 주위에 배치되는 것인 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 2 이상 간에는 기설정된 형태의 연결선이 표시되는 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 연결선 상에는 상기 연결선이 연결하는 2개의 노드에 대응되는 특허 문건으로 구성되는 특허 문건 집합에 대한 적어도 하나 이상의 분석 정보가 표시되는 것이며, 상기 분석 정보에는 빈도가 포함되어 있는 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 연결선의 형태는 상기 분석 정보에 따라 변동될 수 있는 것인 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 노드의 형태는 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 하나 이상이 다른 형태를 가지는 것인 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드가 특허 분류와 관련된 것인 경우에는 상기 노드에 나타나는 정보는 1) 상기 특허 분류만 나타나는 방법, 2) 상기 특허 분류에 대응되는 타이틀만 나타나는 방법 및 3) 상기 특허 분류와 상기 타이틀이 모두 나타나는 방법 중 어느 하나인 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 비사용 탐색 노드에는 하위 분류 확장 표시가 더 포함되어 있으며, 상기 확장 표시가 선택되는 경우, 상기 비사용 탐색 노드가 속하는 분류 체계 상에서 상기 비사용 탐색 노드의 하위 노드가 상기 비사용 탐색 노드의 주위에 배치되는 것인 것이며, 선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 탐색 노드가 상기 가지 노드의 하위 노드인 경우, 상기 비사용 탐색 노드가 표시될 때, 상기 비사용 탐색 노드의 형제 노드 중에서 상기 센터 노드와 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 구성하는 형제 노드도 상기 비사용 탐색 노드와 구분되면서 함께 표시되는 것인 것이 바람직하다.
상기 공백 융합 후보 발견부는 중요 비사용 탐색 노드 정보를 생성하는 중요 공백 융합 후보 발견부;를 더 포함하며, 상기 중요 공백 융합 후보 발견부가 상기 중요 비사용 탐색 노드 정보를 생성하는 방법은 상기 비사용 탐색 노드 중에서 상기 가지 노드와 기설정된 기준을 충족하는 비사용 탐색 노드를 선별하는 것으로 생성하는 제1 방법, 상기 가지 노드가 복수 개가 있을 때, 적어도 하나 이상의 센터 노드와 상기 복수 개의 가지 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제2 방법 및 상기 센터 노드가 복수 개가 있을 때, 적어도 하나 이상의 가지 노드와 상기 복수 개의 센터 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제3 방법 중 어느 하나 이상의 방법을 사용하는 것이며, 상기 제1 방법에서 상기 비사용 탐색 노드와 상기 가지 노드가 충족하는 기준은 상기 비사용 탐색 노드와 상기 가지 노드가 함께 나오는 특허 문건의 개수가 기설정된 기준 이상이거나, 기설정된 증가율 이상이거나, 기설정된 증가 속도 이상이거나, 기설정된 함수 관계를 성립하는 경우 중 어느 하나 이상인 것인 것이 바람직하다.
본 발명을 실시하면 다음과 같은 효과가 있다.
첫째 니치 기술 영역을 극히 용이하게 탐색할 수 있어 니치 기술 영역의 발견 및 선전의 기회를 향유할 수 있게 된다. 특히, 특정한 문건 집합을 대상으로 다양하게 프레임 축을 변경해 가면서 그 문건 집합을 다각도로 분석해 볼 수 있으며, 다양한 프레임 하에서의 니치 영역을 용이하게 탐색해 갈 수 있다.
둘째, 다양한 니치 관점별로 니치 평가 요소가 대응되므로, 니치 기술 영역에 대한 체계적인 분석이 가능하다.
셋째, 니치 기술 영역에 대한 평가 정보의 생성이 가능하다. 니치 평가 모델을 통한 니치 기술 영역의 평가는 특허 문건 집합 단위로 평가 정보가 생성되므로, 임의의 특허 문건 집합에 대해서까지 확장될 수 있다.
넷째, 니치 영역 발견 시뮬레이션이 수행될 수 있어, 니치 기술 영역 후보의 발견이 아주 쉬워진다.
다섯째, 니치 옵션 처리부를 통하여 니치 옵션을 활용하여 다양한 한정을 할 수 있고, 니치 영역을 정밀하게 탐색해 갈 수 있게 된다.
여섯째, 니치 기술 영역이 시각적으로 분명하게 드러나게 되며, 탐색의 효율성이 극대화된다. 한편, 니치 기술 영역에 대한 평가값에 칼라 등의 범례를 적용함으로써 시각적인 명쾌함을 누릴 수 있어, 탐색의 우선 순위를 용이하게 정할 수 있다.
일곱째, 본 발명을 활용하면, 특허 분류간의 융합 정보, 기술 키워드 간의 융합 정보, 기술/부품/요소기술/제품간의 융합 정보를 효과적으로 생성할 수 있다.
여덟째, 본 발명을 활용하면, 융합 정보를 알고 싶은 특허 집합을 대상으로 다양한 분할 기준으로 분할한 분할 특허 집합을 대상으로 단위 융합 요소를 활용한 집합 연산 등의 각종 정보 처리를 통해 융합 패텬을 용이하게 발견해 낼 수 있다.
아홉째, 본 발명을 활용하면, 융합 정보를 알고 싶은 특허 집합을 대상으로 다양한 분할 기준으로 분할한 분할 특허 집합 및 분할 집합별로의 분할 인용 특허 집합을 대상으로 단위 융합 요소를 활용한 집합 연산 등의 정보 처리를 통해 융합 패텬을 용이하게 발견해 낼 수 있다.
열번째, 본 발명을 활용하면, 각 특허 분류별, 각 출원인별, 각 발명자별 등의 각종 대상에 대하여 융합 정보를 사전에 생성해 놓을 수 있어, 사용자들에게 빠르고 편리하게 융합 정보를 제공해 줄 수 있다.
열한번째, 본 발명을 활용하면, 공백 융합 후보 정보를 용이하게 생성할 수 있으며, 생성된 공백 융합 후보 정보를 네트워크 다이어그램을 통해 직관적으로 사용자에게 전달할 수 있다. 특히, 관심 기술에 대응되는 특허 분류, 키워드, 인덱스에 대하여, 그 관심 기술과 관련될 수 있는 공백 융합 후보를 대등한 기술 레벨 또는 심화된 기술 레벨에서 생성해 줄 수 있으며, 생성된 공백 융합 후보를 사용자들에게 직관적으로 제시해 줄 수 있어, 사용자들이 기술 탐색이나 분석 등의 활동이나, 자신이나 타인의 핵심 기술의 확장, 응용, 부가, 적용 대상이 되는 기술 요소나 제품 요소의 발견에 광범위하게 활용될 수 있다. 특히, 제시되는 공백 융합 후보 중에서 자신이 선점하거나, 개발하거나, 개량, 확장, 응용할 수 있는 영역을 용이하게 발견할 수 있게 된다.
열두번째, 본 발명을 활용하면, 중요 공백 융합 후보 정보를 용이하게 생성할 수 있으며, 발견되는 공백 융합 후보 중에서도 우선적 또는 특별한 방법으로 강조하면서 제시될 수 있다. 이에 따라 사용자들은 기술 탐색이나 분석 등의 활동이나, 자신이나 타인의 핵심 기술의 확장, 응용, 부가, 적용 대상이 되는 기술 요소나 제품 요소의 발견에 우선적으로 활용될 가능성이 상대적으로 더 높은 공백 융합 후보 정보를 제공받을 수 있다. 특히, 제시되는 중요 공백 융합 후보 중에서 다른 공백 융합 후보보다 자신이 선점하거나, 개발하거나, 개량, 확장, 응용할 수 있는 우선 순위가 높은 영역을 용이하게 발견할 수 있게 된다. 이를 통해 타인이 시도해 보지 않은 니치 기술 영역을 효과적으로 탐색해 볼 수 있게 된다.
도 1은 본 발명의 특허 정보 시스템의 네트워크적 구성에 관한 일실시예적 도면이다.
도 2는 본 발명의 특허 정보 시스템의 구성에 관한 일실시예적 도면이다.
도 3은 본 발명의 데이터 가공부에 관한 일실시예적 도면이다.
도 4는 본 발명의 데이터 가공부에 관한 일실시예적 도면이다.
도 5는 본 발명의 특허 정보 서비스 지원부에 관한 일실시예적 도면이다.
도 6은 본 발명의 특허 분석 정보 생성부에 관한 일실시예적 도면이다.
도 7은 본 발명의 특허 분석 정보 생성부에 관한 일실시예적 도면이다.
도 8은 본 발명의 니치 기술 영역 발견 시스템의 구성에 관한 일 실시예적 도면이다.
도 9는 본 발명의 니치 평가 모델을 생성하는 방법에 대한 일 실시예적 도면이다.
도 10은 본 발명의 니치 평가 모델로 니치 평가값을 생성하는 방법에 대한 일 실시예적 도면이다.
도 11은 본 발명의 니치 평가 모델을 활용하여 니치 기술 영역을 발견하는 시뮬레이션 방법에 대한 일 실시예적 도면이다.
도 12는 본 발명의 니치 기술 영역 발견 시스템이 교차 영역에 니치 평가 요소값으로 교차 영영값을 생성하는 방법에 관한 일 실시예적 도면이다.
도 13은 본 발명의 니치 기술 영역 발견 시스템이 니치 옵션을 사용하여 니치 분석 정보를 생성하는 방법에 관한 일 실시예적 도면이다.
도 14는 본 발명의 니치 기술 영역 발견 시스템이 특허 분류 집합이나 분류 집합을 변경하여 새로운 교차 영역 집합을 구성하고 교차 영영값을 생성하는 방법에 관한 일 실시예적 도면이다.
도 15는 본 발명의 니치 기술 영역 발견 시스템이 니치 옵션을 사용하여 타겟 문건 집합을 한정하여 새롭게 교차 영영값을 생성하는 방법에 관한 일 실시예적 도면이다.
도 16 본 발명의 니치 기술 영역 발견 시스템의 일 실시예적 구현예이다. 본 발명의 니치 기술 영역 탐색 UI가 나타나 있다.
도 17는 제1 특허 분류를 사용하는 제1 특허 분류 집합의 선택 방법에 대한 일 구현예를 보여 주는 도면이다. 도 17에서는 5D107AA 전체가 선택되고 있음을 보여 준다.
도 18은 다른 니치 평가 요소(다른 니치 관점)에 대하여 상기 니치 분석 정보 생성부가 니치 분석 정보를 생성하기 위하여, 니치 관점을 선택하고 있는 모습을 보여 주는 일 실시예적 도면이다.
도 19는 같이 상기 교차 영역 프레임 선택부를 이용하여, 제1 특허 분류 집합 및 제2 분류 집합 중 사용자가 원하는 특허 분류나 분류를 루트(root)로부터 선택해 가능 과정을 보여 주는 개념도이다.
도 20은 가로 프레임이나 세로 프레임 중 어느 하나 이상이 변경되고, 변경된 프레임을 기준으로 니치 관점에 따른 니치 분석 정보가 생성되는 예를 보여 주는 도면이다.
도 21은 특정 국가의 특허에 대하여, 기술 영역 A에 대한 특허 출원수의 시기적 변화를 나타내는 그래프의 일례이다.
도 22는 기술 영역 A, B, C에 대한 특허 출원수의 시기적 변화를 나타내는 그래프의 일례이다.
도 23은 Gradient Boost algorithm 알고리즘에 대한 요약을 설명하는 도면이다.
도 24는 과적합의 경우를 설명하기 위한 보조 도면이다.
도 25는 Friedman(2002)이 새로이 stochastic gradient boosting algorithm을 제안한 알고리즘에 대한 요약을 설명하는 도면이다.
도 26는 니치 평가 모델 생성 과정에 관한 일 실시예적 개념을 설명하는 도면이다.
도 27은 종래 기술의 Aureka 분석 결과 화면에 관한 일실시예적 도면이다. 본 화면에서는 좌표축의 제목, 범례, 구역, 셀(cell)의 기술적 명칭이 없음을 알 수 있다.
도 28은 본 발명의 틈새 영역 발견 분석 결과에 관한 다른 일실시예적 도면이다. 본 화면에서는 각 축, 구역/셀(cell)에 대하여 thermograph 효과가 적용되어 있음을 볼 수 있다.
도 29는 H01B 1/00의 하부에 있는 H01B 1/06의 형제 노드와 H01B 1/06의 하위 특허 분류 노드를 보여 주는 특허 분류 체계의 일 부분에 대한 도면이다.
도 30은 WIPO가 제공하는 IPC에 대한 캐치워드로 이들에 대한 정보에 관한 일실시예적 도면이다.
도 31는 USPTO가 제공하는 USPC에 대한 인덱스에 대한 일실시예적 도면이다.
도 32는 본 발명의 융합 정보 처리 시스템에 관한 일 실시예적 도면이다.
도 33는 본 발명의 단순 2분할 융합 정보 모델에 관한 일 실시예적 도면이다.
도 34는 본 발명의 복합 분할 융합 정보 모델에 관한 일 실시예적 도면이다.
도 35는 본 발명의 단순 2분할 전방 인용 융합 정보 모델에 관한 일 실시예적 도면이다.
도 36는 본 발명의 복합 분할 전방 인용 융합 정보 모델에 관한 일 실시예적 도면이다.
도 37는 본 발명의 핵심 키워드 DB의 일실시예적 구성에 관한 도면이다.
도 38은 본 발명의 단순 2분할 융합 정보 모델에서 융합 정보를 생성하는 방법에 관한 일 실시예적 도면이다.
도 39은 본 발명의 단순 2분할 전방 인용 융합 정보 모델에서 융합 정보를 생성하는 방법에 관한 일 실시예적 도면이다.
도 40는 본 발명의 단순 2분할 전방 인용 융합 정보 모델에서 융합 정보를 생성하는 다른 방법에 관한 일 실시예적 도면이다.
도 41은 본 발명의 단순 2분할 전방 인용 융합 정보 모델에서 융합 정보를 생성하는 다른 방법에 관한 일 실시예적 도면이다.
도 42은 본 발명의 상기 융합 정보 처리 시스템이 생성하는 특허 집합을 구성하는 특허 문건에서추출되는 키워드 조합을 단위 융합 요소로 하여 생성되는 네트워크 다이어그램의 일 구현예적 도면이다.
도 43은 상기 도 42에 대하여 기설정된 조건의 한정을 통해서 새롭게 생성되는 네트워크 다이어그램에 대한 일 구현예적 도면이다.
도 44은 특허 분류를 단위 융합 요소로 하여 생성되는 네트워크 다이어그램의 일 구현예적 도면이다.
도 45는 상기 융합 정보 처리 시스템(9000)가 공백 융합 후보 정보를 생성하는 방법에 대한 일 실시예적 도면이다.
도 46은 상기 융합 정보 처리 시스템(9000)가 공백 융합 후보 정보를 생성하는 다른 방법에 대한 일 실시예적 도면이다.
도 47는 융합 처리 기준을 충족하는 단위 융합 요소들이 (A, H01B 1/06) (A, G05B 9/00)가 있을 때 A, H01B 1/06 및 G05B 9/00의 관계에 대한 일 실시예적 네트워크 다이어그램에 관한 도면이다.
도 48은 사용자가 H01B 1/06을 선택한 경우, 융합 정보 처리 시스템이 상기 H01B 1/06의 주변에 H01B 1/06과 형제 노드 관계를 가지는 A와의 제1 유형 공백 융합 후보 노드들을 표시해 주는 일 실시예적 네트워크 다이어그램에 관한 도면이다.
도 49는 도 48에서 A와의 공백 융합 후보 노드들과 A와의 연결선이 추가적으로 표시되는 일 실시예적 네트워크 다이어그램에 관한 도면이다.
도 50는 공백 융합 후보 노드가 가지 노드와는 연결되지 않고, A와 직접 연결시켜 표시되는 일 실시예적 네트워크 다이어그램에 관한 도면이다.
도 51은 H01B 1/06의 하위 특허 분류 중에서 H01B 1/10과 H01B 1/12가 공백 융합 후보가 되는 것을 예시하고 있으며, 각 노드의 보기가 특허 분류 + 타이틀이 함께 나타나고 있음을 보여주는 일 실시예적 네트워크 다이어그램에 관한 도면이다.
이하, 도면을 참조하면서 더욱 상세하게 설명한다.
본 발명의 특허 정보 시스템(10000)은 도 1에서 예시되어 있는 바와 같이, 유무선 네트워크(200)를 통하여 사용자 컴퓨터(100)에게 정보 서비스를 제공한다. 상기 특허 정보 시스템(10000)은 적어도 하나 이상의 연계 시스템(300)과 유무선 네트워크(200)로 연결되어 있을 수 있는데, 상기 연계 시스템(300)의 예는 특허 raw data를 제공하는 각국 특허청 또는 raw data 공급자의 시스템, 기업 정보 제공자의 시스템 등이 그 예가 될 수 있으며, 본 발명의 특허 정보 시스템(10000)의 서비스를 연계하여 제공하는 적어도 하나 이상의 시스템이 그 예가 될 수 있으며, 본 설명에 한정하지 않는다.
상기 특허 정보 시스템(10000)은 도 2에서 예시되어 있는 바와 같이, 크게 데이터부(1000) 및 데이터 가공부(2000), 검색 처리부(3100), 분석 정보 생성부(4000), 등을 포함하고 있다. 상기 데이터부(100)는 특허 데이터부(1100), 비특허 데이터부(1200)로 구성되며, 상기 특허 데이터부(1100)는 특허 명세서 파일부(1110)와 특허 DB(1120), 특허 분류 DB(1130) 및 기타 분류 DB부(1140)를 포함하고 있다.
특허 DB(1120)는 모든 특허에 대한 서지 사항과 명세서 본문, 도면 등을 필드별로 관리하며, 상기 명세서 본문을 구성하는 각종 필드(제목, 요약, 선행 기술, 특허 청구 범위, 발명의 상세한 설명 등)에서 추출한 핵심 키워드를 포함하고 있다. 한편, 상기 특허들은 상기 특허들에 대한 선행 기술 문건으로 인용 정보를 더 포함하고 있을 수 있다. 미국 특허 data를 예로 들면, 상기 인용 정보는 Reference에 포함된 정보들로, 미국 특허 문건 번호, 외국 특허 문건 번호, 비특허 문건에 대한 표시자 등이 포함되어 있다. 한편, 특허청 심사관이나 관련자에 의한 선행 기술 조사 정보, 심사관 의견 제출 시 참증 정보 등도 광의의 인용 정보가 된다. 특정 문건에 전방 인용 정보가 있는 경우, 상기 전방 인용 정보에 포함된 문건의 입장에서 보면 상기 특정 문건은 후방 인용 문건이 된다. 특정 문건을 기준으로 전방 인용 정보에 포함된 문건은 부모(parent) 문건이 되며, 상기 부모 문건을 기준으로 보면 상기 특정 문건은 자식(child) 문건이 된다. 이러한 child-parent 관계에 있는 정보를 DB로 처리하는 것은 당업자에게는 자명한 것으로 상세한 설명은 생략한다.
특허 문건의 서지 사항에는 발행 국가 정보, 각종 일자 정보, 각종 번호 정보, 적어도 하나 이상의 권리자 정보, 적어도 하나 이상의 발명자 정보, 적어도 하나 이상의 특허 분류 정보, 적어도 하나 이상의 우선권 정보 등이 포함되어 있다. 일자에는 출원일, 공개일, 등록일 및 기타 일자들이 있다. 각종 번호 정보에는 출원번호, 공개번호, 등록번호, 원출원 번호, 우선권 주장 번호 등이 있다. 권리자 정보는 출원인, 양수인, 특허권자 등이 있으며, 권리자의 변동이 있고, 변동이 관리되는 경우, 양도인과 양수인에 대한 정보 및 최종 권리자 정보가 있을 수 있다. 우선권 정보에는 우선권 주장 번호, 주장일자, 국가 등의 정보가 포함되어 있다. 한편, 분할출원이나 일부 계속 출원, 계속 출원 등이 있는 경우, 원출원 번호, 원출원일자 등의 정보가 부가되어 있다. 또한, 대표도, 제목, 요약, 색인어 등도 서지 사항에 포함되기도 한다. 한편, 가공된 서지 사항으로는 국내 패밀리 정보(분할출원, 변경출원이나 일부계속출원, 계속출원 관계에 있는 특허 출원)이나, 해외 패밀리 정보(조약 우선권 관계로 연관될 수 있는 출원, 국제출원 등)이 있을 수 있다. 한편, 자연어 처리 등을 통해서 특허 명세서 본문의 텍스트를 본문을 구성하는 각 필드별 또는 필드 통합별로 기 설정된 키워드 추출 방식으로 추출한 핵심 키워드 정보가 더 있을 수 있다. 특허 분류 정보는 공통적인 IPC 이외에도 USPC, FT, FI, ECLA 등과 같이 각 국가별로 자국만의 특별한 특허 분류가 있을 수 있다.
도 29는 H01B 1/00의 하부에 있는 H01B 1/06의 형제 노드와 H01B 1/06의 하위 특허 분류 노드를 보여 주는 특허 분류 체계의 일 부분에 대한 도면이다. 이와 같이 특허 분류는 계층 구조를 가진다. 본 발명의 특허 분류는 특허 분류는 IPC, USPC, FT, FI, ECLA를 포함한다.
인덱스(index)란, 캐치워드(catchword)라고 불리기도 하는 것으로, 단어, 구 또는 절에 적어도 하나 이상의 특허 분류를 대응해 놓은 체계를 말한다. 상기 인덱스 중 대표적인 것으로 IPC를 처리해 놓은 catchword가 있으며, 미국 특허청이 발행하는 index to USPC가 있다. 상기 인덱스도 특허 분류처럼 계층 구조를 가지는 경우가 많다. 상기 인덱스에는 제품명/부품명/요소기술 등에 해당하는 키워드가 내재되어 있는 경우가 많다. 상기 인덱스는 특허 분류를 용이하게 찾아 보기 쉽게 해 놓은 것으로 도 13 및 도 14에 그 예시가 있다. 도 13는 WIPO가 제공하는 IPC에 대한 캐치워드로 이들에 대한 정보는 2010년 3월 현재 http://www.wipo.int/ipc/itos4ipc/ITSupport_and_download_area/20100101/MasterFiles/에 있는 ipcr_catchwordindex_20100101.zip 파일로 입수 가능하다. 도 13에서 ABACUSES에 대하여 G06C 1/00이 대응되어 있음을 볼 수 있다. 이때, ABACUSES를 대하여 G06C 1/00에 대응되는 인덱스라 명명한다. 이에 따라, G06C 1/00은 Abacuses로 역맵핑 할 수 있다. 한편, 도 13의 내용 중 인덱스 ABARADING에서 알 수 있듯이, 상기 캐치워드 체계는 적어도 1단계 이상의 계층 구조를 가지고 있음을 알 수 있다. ABARADING은 2단계 계층임을 보여 준다.
도 14는 USPTO가 USPC에 대한 인덱스로 이들에 대한 정보는 2010년 3월 현재 http://www.uspto.gov/web/patents/classification/uspcindex/indextouspc.htm에서 확인할 수 있다. 도 14의 내용 중에서 인덱스 Abrading은 3단계의 계층으로 분류되어 있음을 알 수 있다. 인덱스 Abrading은 USPC 451/38에 대응되고 있음을 알 수 있으며, Abrading의 하위 인덱스에 Class 451 이외의 다른 Class의 특허 분류도 존재함을 알 수 있다.
상기 데이터 가공부(2000)는 도 3에서 예시되어 있는 바와 같이, 핵심 키워드 생성부와 분류 메타 데이터 생성부 및 목적 특화 데이터 생성부를 포함하고 있다. 니치 발견 서비스를 위해서는 분류 메타 데이터 생성부가 필요하며, 발견된 니치 기술 영역을 분석하기 위해서는 핵심 키워드 생성부 및 목적 특화 데이터 생성부가 필요하게 된다.
이하, 도면을 참조하면서 더욱 더 상세하게 설명한다. 도 8은 본 발명의 니치 기술 영역 발견 시스템(5000)의 구성에 관한 일 실시예적 도면이다. 상기 니치 기술 영역 발견 시스템(5000)은 니치 기술 영역 발견을 지원하는 니치 기술 영역 발견 엔진, 니치 평가 모델을 생성하는 니치 평가 모델 생성부(5200) 및 니치 발견 정보를 생성하는 니치 발견 정보 생성부(5300)를 포함하고 있다. 상기 니치 기술 영역 발견 엔진은 니치 기술 영역의 발견을 용이하게 돕는 프레임 정보를 처리하는 n차원 프레임 처리부(5110), 니치 영역에 대한 분석 정보를 생성하는 니치 분석 정보 생성부(5120), 니치 관련된 각종 옵션을 처리하는 니치 옵션 처리부(5130)를 포함하고 있다.
상기 n차원 프레임 처리부(5110)는 n차원의 프레임에 대하여, 선택된 복수 개의 프레임으로 교차 영역이 생성될 때, 프레임의 선택을 지원하는 교차 영역 프레임 선택부(5111), 상기 교차 영역 프레임 선택부(5111)를 통하여 프레임이 결정되는 경우, 상기 결정되는 프레임으로 교차 영역 집합을 생성하는 교차 영역 집합 생성부(5112), 입수된 타겟 문건 집합에 대하여, 생성되는 교차 영역 집합을 구성하는 교차 영역에 니치 분석 정보를 표시하는 니치 분석 정보 표시부(5113), 사용자에게 선택된 프레임 정보를 관리하는 선택 프레임 관리부(5114)를 포함하고 있다.
상기 니치 분석 정보 생성부(5120)는 교차 영역별로 선택된 니치 관점별 분석 정보를 생성하는 니치 관점 분석 정보 생성부, 교차 영역별로 선택된 니치 모델별로 분석 정보를 생성하는 니치 모델 분석 정보 생성부(5122)를 포함하고 있다. 한편, 상기 니치 분석 정보 생성부(5120)는 상기 사용자의 니치 관점의 선택을 돕기 위해, 니치 분석 종류를 제시할 수 있으며, 이는 본 발명의 니치 분석 종류 제시부(5123)가 담당한다. 그리고, 상기 니치 모델 종류의 선택을 돕는 것은 본 발명의 니치 모델 종류 제시부(5124)가 담당한다.
상기 니치 옵션 처리부(5130)는 한정 처리를 수행하는 한정 계열의 기능부와 범례 처리부(5135)를 포함한다. 상기 한정 계열의 기능부는 기간을 한정하는 기간 한정부가 있으며, 출원인, 발명자, 대리인 등의 한정을 관리하는 주체 한정부(5132), 기술 분야의 한정을 관리하는 기술 분야 한정부(5133), 개별 특허의 한정을 관리하는 개별 특허 한정부(5134)가 있다. 상기 기간에는 기간의 종류(출원일, 공개일, 등록일, 최선일 등)별로 기간이 관리 될 수 있을 것이다. 출원인의 한정은 출원인명 또는 출원인의 종류별(기업, 대학, 공공기관, 개인) 또는 출원인의 국적별(주소 정보나 우선권 주장 시의 국가 정보로 처리할 수 있다.) 또는 기 설정된 출원인 속성(특허 괴물 등과 같은 다분쟁 발생 출원인, 대기업, 고피인용 출원인 등)별로 한정될 수 있을 것이다. 발명자의 한정은 발명자별, 발명자 국적별, 또는 발명자의 소속 기관의 종류나 속성별로 한정될 수 있을 것이다. 한편, 기술 분야의 한정은 특허 분류나 준 특허분류(Catchword, Index 등)를 사용하는 한정, 키워드를 사용하는 한정 등이 있을 수 있다. 개별 특허에 대한 한정은 서지 사항의 양(청구항 수 등), 서지 사항을 처리한 양(피인용수 등)의 정도나, 기 설정된 속성(특허 자동 평가 등급이나 평가 점수, 분쟁 발생 특허, 표준 특허풀 포함 특허 등)의 양이나 여부 등으로 한정될 수 있을 것이다.
니치 평가 모델 생성부(5200)는 니치 평가 모델을 생성하기 위하여 복수개의 샘플 문건 집합을 기 설정된 분할 기준으로 분할하는 문건 집합 분할 모듈(5210), 니치 기준 요소값을 생성하는 니치 기준 요소값 생성 모듈(5220), 니치 평가 요소별로 주어진 문건 집합에 대하여 니치 평가 요소값을 생성하는 니치 평가 요소값 생성 모듈(5230), 니치 평가 알고리즘을 생성하는 니치 평가 알고리즘 생성 모듈(5240), 생성된 니치 평가 알고리즘을 검증하는 니치 평가 알고리즘 검증 모듈(5250), 주어진 문건 집합에 대하여 니치 평가값을 생성하는 니치 평가값 생성 모듈(5260)을 포함하고 있다. 니치 평가 모델과 관련된 각종 data는 니치 평가 모델 DB(5280)에 저장된다. 한편, 특정 문건 집합(교차 영역별 문건 집합을 포함한다.)에 대하여 생성되는 상기 니치 평가 요소값은 니치 평가 요소값 DB(5270)에 저장될 수 있다.
상기 니치 발견 정보 생성부(5300)는 니치 분석용 특허 문건 집합을 입수하는 니치 분석용 문건 집합 입수부(5310)를 포함하고 있다. 상기 니치 분석용 문건 집합 입수부(5310)는 사용자 컴퓨터(100)로부터 문건 집합을 입수 받을 수도 있으며, 상기 특허 정보 시스템(10000)으로부터 문건 집합을 입수 받을 수 있다. 입수 받는 문건 집합은 사용자 컴퓨터(100) 또는 특허 정보 시스템(10000)이 검색 엔진부나 DB 쿼리 처리부 등을 이용하여 검색하거나 호출(select)하는 문건 집합일 수도 있으며, 상기 사용자나 시스템이 저장해 놓은 문건 집합 중에서 지정되는 어느 하나 이상이 될 수도 있다. 한편, 상기 니치 발견 정보 생성부(5300)는 니치 발견을 위한 기 설정된 적어도 하나 이상의 시뮬레이션을 수행하는 니치 발견 시뮬레이션 모듈(5320)을 더 포함하고 있을 수 있다. 발견되거나 분석된 니치 기술 영역에 관한 정보는 니치 발견 리포팅 정보 생성부(5330)를 통해서 웹이나, pdf 등의 파일로 리포팅 정보가 생성된다. 한편, 상기 사용자는 본 발명의 니치 기술 발견 UI부(5340)를 통하여 상기 특허 정보 시스템(10000)과 커뮤니케이션 할 수 있다.
도 16은 본 발명의 니치 기술 영역 발견 시스템(5000)의 일 실시예적 구현예이다. 상기 도 16에는 본 발명의 니치 기술 발견 UI부(5340)를 구성하는 UI부가 도시되어 있다. 상기 UI부에는 가로축과 세로축의 선택을 지원하는 프레임 선택 UI부(UI110), 니치 관점의 선택을 지원하는 니치 관점 선택 UI부(UI120), 니치 모델의 선택을 지원하는 니치 모델 선택 UI(미도시), 니치 옵션 UI부(UI130) 및 니치 분석 결과를 제공하는 니치 분석 결과 UI(UI140) 및 범례 보기 UI(UI150)가 예시되어 있음을 알 수 있다. 상기 프레임 선택 UI부는 세로 선택부와 가로 선택부를 포함하고 있음을 알 수 있다. 상기 니치 관점 선택 UI부에는 니치 관점을 대분류, 중분류 및 소분류로 구분하여 제공하면서 니치 관점을 선택할 수 있다. 상기 소분류의 니치 관점은 니치 평가 요소에 대응된다. 한편, 적어도 하나 이상의 소분류 니치 관점이 모여 1개의 중분류 니치 관점이 될 수 있는데, 이러한 것을 니치 관점(니치 평가 요소)의 그룹핑이라 하고, 하나의 니치 평가 요소 그룹은 적어도 하나 이상의 니치 평가 요소를 포함한다. 상기 니치 옵션 UI부에는 날짜 기준과 날짜 범위나 연도를 선택할 수 있음을 볼 수 있다.
상기 니치 분석 결과 UI부는 n*m(n, m은 자연수)개의 교차 영역을 가지고 있음을 보여 준다. 도 16에서는 세로축(세로 프레임)(UI160)에는 FT 5D107AA이하에 있는 FT들이 나열되어 있으며, 가로축(가로 프레임)(UI170)에는 FT 5D107BB이하에 있는 FT들이 나열되어 있음을 알 수 있다. 이러한 FT들은 각각 세로축과 가로축의 최외곽을 형성하고 있음을 알 수 있다. 한편, 복수 개의 가로축과 복수 개의 세로축이 교차하는 교차 영역에는 니치 분석 정보가 나타나 있음을 볼 수 있다. 도 16에서는 상기 니치 분석 정보로, 각 교차 영역에는 니치 관점이자 니치 평가 요소인 총량 중에서도 권리량 중에서도 출원량에 대한 정보가 표시되어 있음을 알 수 있다. 상기 출원량에 대하여 기 설정된 범례 기준에 따라 색깔 등과 같은 범례 표시가 적용되어 있음도 볼 수 있다. FT 체계에서 테마+영문자2자리(예를 들면5D107AA)를 표기할 때, 5D107AA00과 같이 테마+명문자 2자리+00으로 표기하기도 한다.01부터는 이 코드의 하위가 된다.
상기 니치 분석 결과는 입수되거나 선택된 타겟 문건 집합을 대상으로 하여 처리된다. 상기 니치 기술 영역 발견 시스템(5000)의 정보 처리 방법은 도 플1에 잘 나타나 있다. 상기 니치 기술 영역 발견 시스템(5000)의 교차 영역 프레임 선택부(5111)는 상기 사용자 컴퓨터(100)로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수(Sa11)한다. 도 17는 제1 특허 분류를 사용하는 제1 특허 분류 집합의 선택 방법에 대한 일 구현예를 보여 주고 있다. 상기 사용자는 세로축에 5D107AA01부터 5D107AA20까지의 모든 특허 분류를 선택하고자 하는 경우라면, 상기 사용자는 5D107AA01부터 5D107AA20이 속하는 5D107AA를 선택하면, 상기 교차 영역 프레임 선택부(5111)는 5D107AA의 하위에 있는 5D107AA01부터 5D107AA20까지의 특허 분류 목록을 제공한다. 이때, 상기 사용자가 상위 특허 분류인 5D107AA을 선택하면, 상기 교차 영역 프레임 선택부(5111)는 5D107AA 하에 있는 모든 특허 분류인 5D107AA01부터 5D107AA20까지의 특허 분류가 세로축으로 선택되는 방식으로 정보 처리할 수 있다.
한편, 상기 사용자는 나열된 5D107AA01부터 5D107AA20 중에서 자신이 원하는 적어도 하나 이상의 특허 분류를 선택할 수 있고, 상기 교차 영역 프레임 선택부(5111)는 선택된 특허 분류만으로, 세로축 프레임을 구성할 수 있을 것이다. 동일한 방식으로 가로축을 선택할 수 있을 것이다. 한편, 제3의 축이 새로운 차원으로 필요한 경우, 상기 제3의 축에 해당되는 제3의 프레임도 동등한 방식으로 구성할 수 있을 것이다. 한편, 본 문단에서는 특허 분류를 예시로 들었지만, Catchword나 IndextoUSPC 등과 같은 계층(tree) 구조를 가지는 임의의 정보 구조에서도 본 문단의 발명 사상은 적용될 수 있을 것이다. 즉, 상기 사용자는 적어도 하나 이상의 하위 특허 분류를 가지는 적어도 하나 이상의 상위 특허 분류를 선택함으로써, 상기 선택된 상위 특허 분류에 대한 상기 하위 특허 분류를 상기 제1 특허 분류 집합 또는 제2 분류 집합으로 처리할 수 있을 것이다. 5D107AA01부터 5D107AA20의 특허 분류들이나, 이들 중에서 선택된 적어도 하나 이상의 특허 분류들은 제1 특허 분류 집합을 구성한다. 물론, 제1 특허 분류들이 특허 분류 체계나 기타 분류 체계 상 모두 동일한 형제 관계(sibling)이거나, 공통되는 부모(parent)를 가질 필요는 없을 것이다. 즉, 세로축을 구성하는 특허 분류 중에서 어느 하나 이상은 5D107AA 이하에서 선택되고, 다른 어느 하나 이상은 5H001이하에서 선택될 수 있을 것이다. 상기 특허 분류의 선택은 일본 특허 분류의 FT을 예시로 설명하였지만, 이는 계층 구조를 가지는 다른 특허 분류인 IPC나 USPC, ELCA나 FI에 대해서도 동등하게 적용될 수 있음은 당업자에게 자명할 것이다.
한편, 도 17에서 알 수 있듯이, 5D107AA01 이하에는 5D107AA02, 5D107AA02, 5D107AA03과 같은 하위 특허 분류가 더 포함되어 있을 수 있다. 이때, 상기 세로축에 나타날 때, 5D107AA01만 나타나게 할지, 5D107AA01의 하위 특허 분류도 모두 나타나게 할 지는 사용자의 선택에 따라 달라 질 수 있다. 하지만, 정보 처리는 본 발명의 하위 특허 분류 기초 관련 정보 자동 포함 사상에 따라 5D107AA01 이하의 모든 특허 정보는 5D107AA01에 계상되게 된다. 즉, 특정한 특허 문건에 5D107AA02의 표기 있는 경우, 이 표기의 기술 내용은 5D107AA01에도 당연히 포함되므로, 5D107AA01에 대한 특허 정보 분석은 5D107AA01뿐만 아니라 5D107AA02, 5D107AA03, 및 5D107AA04도 함께 포괄하여 수행되어야 한다. 물론, 5D107AA02는 하위 특허 분류가 없으므로, 5D107AA02에 대한 특허 분석 정보에는 5D107AA02만으로 처리함은 당연할 것이다.
한편, 특허 분류의 표기만으로는 5D107AA01 이하에 5D107AA02, 5D107AA03, 5D107AA04가 있고, 5D107AA05는 5D107AA01와 동등한 레벨에 있다는 것 알 수 없어, 상기 특허 분석 정보의 처리에서 like나 %와 같은 확장자를 활용하는 정보 처리는 특허 분류 타이틀 정보에 도트(dot)가 포함되어 있는 경우에는 불가능하다. 따라서, 본 발명의 데이터 가공부(2000)는 특허 분류 체계를 참조하여 하기 표 1과 같은 구조의 데이터 체계를 생성해 놓는다.
[표 1]
Figure PCTKR2011001312-appb-I000001
표 1에서 알 수 있듯이, 자기 자신의 특허 분류가 있을 때, 특허 분류 체계를 참조하여 자신의 상위 특허 분류를 각 계층마다 생성해 놓을 수 있다. 이때, 생성해 놓는 상위 특허 분류는 최상위 특허분류까지 생성해 놓을 수도 있지만, 기 설정된 부분(예를 들면, 확장자 활용 검색이 가능한 수준까지만 생성해 놓을 수도 있다. 위 표 1의 경우에는 C5 계층이 된다.)까지만, 생성해 놓을 수도 있을 것이다. 한편, C3(FT의 경우 테마)와 C1 사이에 임의의 분류 단계를 1개 더 둘 수도 있을 것이며, 이 경우, C1은 반드시 5D가 될 필요는 없을 것이며, 다른 표기가 될 수도 있을 것이다. 즉, n개의 다른 테마가 계층적으로 묶어 하나의 기술군 표기가 될 수 있고, 5D로 시작하는 테마코드를 가지는 기술이 포함되어 있다고 하여 그 기술군 표기가 반드시 5D일 필요는 없을 것이다. 예를 들면, 5D107과 5H001 등이 묶여 Electric Motor Control이라는 기술군명을 가지는 기술군을 형성할 수도 있을 것이다.
상기 표 1과 같은 계층 구조는 IPC나 USPC 등과 같은 다른 특허 분류에 대해서도 동일하게 생성할 수 있을 것이다. 예를 들어 H01F 1/032가 있는 경우, 하기와 같은 IPC 분류 체계 정보를 활용하여 하기 표 2와 같은 정보를 생성할 수 있을 것이다.
(1) 섹션 : H 전기
(2) 클래스 : H01 기본적 전기소자
(3) 서브클래스 : H01F 자석
(4) 메인그룹 : H01F 1/00 자성재료를 특징으로 하는 자석 또는 자성체
(5) 1-도트 서브그룹 : H01F 1/01 ● 무기재료로 된 것
(6) 2-도트 서브그룹 : H01F 1/03 ● ● 보자력에 의해 특징 되는 것
(7) 3-도트 서브그룹 : H01F 1/032 ● ● ● 경질 자성재료의 것
[표 2]
Figure PCTKR2011001312-appb-I000002
이에 따라, 표 3을 참조하면서, 특허 정보 분석에서 하위 특허 분류 기호 정보 자동 포함 사상에 대해서 더욱 더 상세하게 설명한다.
[표 3]
Figure PCTKR2011001312-appb-I000003
표 3에서 알 수 있듯이, 5D107AA02, 5D107AA03, 5D107AA04의 값이 자신들의 상위인 5D107AA01에 합산됨을 알 수 있다. 본 발명의 특허 정보의 분석에서는 특정 특허 분류를 기준으로 분석 정보를 생성할 때, 그 특정 특허 분류의 하위 특허 분류가 표기되어 있는 특허 문건의 정보도 포함시켜 특허 정보를 생성한다.
이어, 상기 니치 기술 영역 발견 엔진은 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성(Sa12)한다. 상기 예는 5D107AA의 하위에 있는 특허 분류와 과 5D107BB의 하위에 있는 특허 분류로 교차 영역 집합이 구성됨을 보여 주고 있다. 상기 교차 영역은 도 16에서와 같이 특허 분류의 타이틀 정보가 프레임에 표기되는 것이 바람직하나, 출력 특성(5D107AA01)와 같이 특허 분류 타이틀과 전체 특허 분류 코드가 다 보이게 하거나, 출력특성(AA01)과 같이 타이틀 정보와 간략한 형태의 특허 분류 코드가 보이는 방식으로 처리할 수도 있을 것이다.
제1 특허 분류를 PCi라 하고, 제2 분류를 Cj하고 할 때, 교차 영역은 (PCi, Cj)로 특정되며, 교차 영역 집합은 (PCi, Cj)의 집합이 된다. 이때, 상기 (PCi, Cj)가 표시되는(나타나거나 배치되는) 방식은 크게 3가지가 있다. 첫째 배치 방법은 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치되는 것이다. 이 경우, 교차 영역에 값이 없는 공백 셀이 존재할 수 있게 되며, 열 모두가 공백이거나, 행 모두가 공백인 공백열과 공백행이 존재하게 된다. 특히, 입수되는 타겟 문건 집합이 작은 경우에는 프레임을 적절하게 선택하더라도 다수의 공백 셀과 공백 열, 공백 행이 나타나게 된다. 둘째 배치 방법은 제1 특허 집합의 특허 분류에 대응되는 교차 영역 집합이 없는 없거나 제2 분류 집합의 제2 분류에 대응되는 교차 영역 집합이 없는 경우, 교차 영역 집합이 없는 특허 분류나 제2 분류를 제외하고 교차 영역 집합이 존재하는 특허 분류나 제2 분류에 대하여, 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치되는 것이다. 이 경우, 적어도 공백 열이나 공백 행이 모두 존재할 가능성은 현저하게 떨어지게 된다. 셋째 배치 방법은 상기 제1 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제2 프레임축에 가까이 배치하고, 상기 제2 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제1 프레임축에 가까이 배치되는 것이다. 이 경우, 모서리 쪽으로 갈수록 니치 평가 요소값이나 니치 평가값 등이 높거나 낮은 교차 영역들이 모이게 된다. 상기 제1 배치 방법, 상기 제2 배치 방법 및 상기 제3 배치 방법은 상기 사용자의 선택이나 상기 시스템의 설정에 따라 선택될 수 있을 것이다.
이어, 상기 니치 분석 정보 생성부(5120)는 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성(Sa13)한다. 상기 니치 분석 정보 중의 하나는 니치 평가 요소값이며, 니치 평가 요소는 니치 관점이 될 수 있다. 상기 니치 기술 영역 발견 시스템(5000)의 니치 분석 정보 생성부(5120)는 입수된 타겟 문건 집합을 대상으로 하여, 상기 타겟 문건 집합 중 상기 (PCi, Cj)라는 교차 영역에 대응되는 부분 타겟 문건 집합을 대상으로 기 설정된 기 설정된 니치 평가 요소에 대응되는 니치 평가 요소값을 생성한다. 상기 니치 평가 정보의 생성은 상기 니치 분석 정보 생성부(5120)의 니치 관점 분석 정보 생성부가 수행한다. 상기 n차원 프레임 처리부(5110)의 상기 니치 분석 정보 표시부(5113)는 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시(Sa14)한다. 즉, 상기 니치 분석 정보 표시부(5113)는 생성된 니치 분석 정보를 표시하는 기능을 수행한다. 상기 니 도 16은 출원수란 니치 관점에 대응되는 니치 평가 요소에 대하여 각 (PCi, Cj)별로 니치 평가 요소값이 생성되고, 생성된 니치 평가 요소값이 표시되고 있음을 보여 줄 수 있다. 한편, 상기 니치 기술 영역 발견 시스템(5000)의 니치 분석용 문건 집합 입수부(5310)는 검색이나 쿼리 조건 설정 또는 관리하는 문건 집합군에서의 선택 등을 활용하여, 적어도 하나 이상의 문건을 포함하는 타겟 문건 집합을 입수한다.
도 16에서는 (PCi, Cj)에 대하여, 가장 간단한 니치 관점이자 니치 평가 요소인 출원수에 대한 니치 분석 정보가 생성되었지만, 상기 니치 분석 정보는 출원수에 한하지 않고, 하기 표 4내지 표7과 같은 다양한 니치 평가 요소에 대해서도 생성될 수 있을 것이다. 하기, 표 4 내지 표7은 이러한 니치 평가 요소를 보여 주고 있다.
[표 4]
Figure PCTKR2011001312-appb-I000004
표 4는 양적 속성에 관련된 니치 평가 요소의 예를 보여 주고 있다.
[표 5]
Figure PCTKR2011001312-appb-I000005
표 5는 양적 속성에 관련된 니치 평가 요소의 예를 보여 주고 있다.
[표 6]
Figure PCTKR2011001312-appb-I000006
표 6은 증감 속성에 관련된 니치 평가 요소의 예를 보여 주고 있다.
[표 7]
Figure PCTKR2011001312-appb-I000007
표 7은 신규(도입/참여) 속성에 관련된 니치 평가 요소의 예를 보여 주고 있다.
상기 표 4 내지 표 7에 있어서, C3는 IPC, FI, ECLA의 경우 subclass, FT의 경우 테마, USPC의 경우 class가 되며, C4는 IPC, FI, ECLA의 경우 main gropup, FT의 경우 테마 직하위, USPC의 경우 도트가 없는 subclass가 된다.
도 18은 다른 니치 평가 요소(다른 니치 관점)에 대하여 상기 니치 분석 정보 생성부(5120)가 니치 분석 정보를 생성하기 위하여, 니치 관점을 선택하고 있는 모습을 보여 주는 도면이다. 상기 니치 관점이 선택되고 나면 새로운 분석 결과가 나타나게 된다. 상기 도 18과 같이 상기 니치 기술 영역 발견 시스템(5000)은 다수의 니치 평가 요소에 대하여 니치 평가 요소를 선택할 수 있도록 지원하고, 생성된 니치 평가 요소값을 생성해 상기 사용자에게 보여 줄 수 있다.
한편, 상기 니치 기술 영역 발견 시스템(5000)은 니치 옵션을 통하여 타겟 문건 집합을 한정할 수 있으며, 이는 도 13에 잘 나와 있다. 도 13에서 알 수 있듯이, 상기 니치 기술 영역 발견 시스템(5000)은 타겟 문건 집합 입수(Sa41)하고, 상기 사용자 컴퓨터(100)로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수(Sa42)하며, 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성(Sa43)하고, 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성(Sa44)하며, 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시(Sa45)한다. 이어, 상기 사용자 컴퓨터(100)로부터 상기 니치 옵션 처리부(5130)를 통하여 기간 한정, 주체 한정, 기술 분야 한정, 개별 특허 한정 중 어느 하나 이상에 대한 니치 옵션 정보를 입수(Sa46)하고, 상기 니치 옵션을 반영하여 교차 영역 문건 집합을 한정(Sa47)하며, 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 한정된 교차 영역 문건 집합을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성(Sa48)하고, 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시(Sa49)한다.
한편, 상기 니치 기술 영역 발견 시스템(5000)은 상기 교차 영역 프레임 선택부(5111)를 통하여 선택된 가로축은 고정한 채 세로축을 다른 특허 분류로 변경하거나, 세로축은 고정한 채, 세로축을 변경하는 기능을 지원한다. 이러한 정보 처리 방법은 도 14에 잘 나와 있다. 상기 니치 기술 영역 발견 시스템(5000)은 타겟 문건 집합 입수(Sa31)하고, 상기 사용자 컴퓨터(100)로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수(Sa32)하며, 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성(Sa33)하여, 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성(Sa34)하고, 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시(Sa35)한다. Sa35의 한 형태는 도 16이 될 수 있다. 이때, 도 19에서와 같이 상기 교차 영역 프레임 선택부(5111)를 이용하여, 제1 특허 분류 집합 및 제2 특허 분류 집합 중 어느 하나 이상에 대한 변경 정보 입수(Sa36)할 수 있다. 제1 특허 분류 집합 등을 선택할 때는 다단계로 탐색해 가면서 선택될 수 있으며, 도 19는 이를 잘 보여 준다. 즉, 5D107BB를 선택하기 위해서는 최상위인 FT->Electric Motor Control->5D107->5D107BB를 선택하는 과정을 거처야 한다. 통상적으로 탐색 과정은 주변부를 탐색해 가는 것이 보통이므로, 탐색의 대상이 되는 차원축(프레임)을 변경하려 할 때, 위와 같이 루트(root)로부터 차례로 선택해 가는 것은 불편함을 초래할 수 있을 것이다. 이에, 상기 교차 영역 프레임 선택부(5111)은 선택된 특허 분류나 선택된 분류의 이력(history)을 관리해 주어, 사용자가 특허 분류나 분류를 변경하려 할 때, 직전에 선택된 특허 분류나 분류를 최우선적으로 보여 줄 수도 있다. 이 경우 도 19에서는 맨 위에 맨 우측에 용도가 선택되는 창을 최우선적으로 보여 줄 수도 있을 것이다. 이 경우, 최상위인 FT->Electric Motor Control->5D107->5D107BB로 선택해 가는 수고를 덜 수 있게 된다. 상기 교차 영역 프레임 선택부(5111)는 변경이 발생한 상기 제1 특허 분류 집합 또는 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성(Sa37)한다. 상기 니치 분석 정보 생성부(5120)는 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성(Sa38)하고, 상기 니치 분석 정보 표시부(5113)는 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시(Sa39)한다. 도 20은 가로 프레임이나 세로 프레임 중 어느 하나 이상이 변경되고, 변경된 프레임을 기준으로 니치 관점에 따른 니치 분석 정보가 생성되는 예를 보여 주고 있다. 도 20에서는 세로축에 5D107AA이하의 특허 분류와 가로축에 5D107CC 이하의 특허 분류로 프레임이 형성되고 있음을 보여 주고 있다. 프레임이 변경 됨에 따라, (PCi,Cj)가 (PCz,Cw)가 될 수 있으며, 상기 교차 영역 집합 생성부(5112)는 (PCz,Cw)에 대하여 교차 영역 집합을 생성한다. 이 경우 도 16과 도 20를 비교하는 경우, 모든 교차 영역이 바뀌었기 때문에 바뀐 교차 영역에 대하여 니치 관점인 출원수에 대한 니치 평가 요소값을 보여 주고 있음을 알 수 있다.
하기 표 8은 도 16 내지 도 20에 나타나는 특허 분류 타이틀과 특허 분류 코드를 대응시켜 놓은 참고용 자료이다.
[표 8]
Figure PCTKR2011001312-appb-I000008
상기 니치 분석 종류 제시부(5123)는 표 4 내지 표7과 같은 니치 관점을 대분류, 중분류 및 소분류 니치 관점별로 니치 분석 종류를 제시할 수 있다. 복수 개의 니치 관점을 포함하여 생성되는 니치 모델이 있는 경우, 상기 니치 모델 종류의 선택을 돕는 것은 본 발명의 니치 모델 종류 제시부(5124)가 담당한다.
이어, 도면을 참조하면서 본 발명의 니치 평가 모델 생성 방법에 대해서 설명한다.
니치 평가 모델이란 특정한 교차 영역 (PCi,Cj) 또는 특정한 조건으로 특정되는 특정 문건 집합이 니치성을 얼마나 가지는 지를 평가하는 니치 점수 내지는 니치 등급을 생성하는 모델을 말한다. 니치 평가 모델이 생성되기 위해서는 독립 변수 및 독립 변수값과 종속 변수 및 종속 변수값이라는 2가지 조건이 선행되어야 한다. 니치 평가 요소는 니치 평가 모델을 생성하기 위한 독립 변수가 될 수 있으며, 상기 특정 문건 집합에 대해서 니치 평가 요소로 니치 평가 요소값이라는 독립 변수값을 생성할 수 있음은 전술한 바와 같다. 니치 평가 모델 수립을 위해서 문제시 되는 것은 종속 변수의 설정이다. 종속 변수는 전체적으로 니치 속성을 반영하는 변수이어야 한다. 니치 평가 요소값이라는 입력 변수값이 있을 때, 이러한 입력 변수값에 반응하는 값으로 니치라는 속성을 전체적으로 잘 표상하는 것이 종속 변수가 된다.
도 21은 특정 국가의 특허에 대하여, 기술 영역 A에 대한 특허 출원수의 시기적 변화를 나타내는 그래프의 일례이며, 도 22는 기술 영역 A, B, C에 대한 특허 출원수의 시기적 변화를 나타내는 그래프이다. 니치 속성을 가지는 기술 영역이란 도 21 내지 도 22에서 알 수 있듯이, 특정 시점을 기준으로 특허 출원수 등이 가파르게 상승하고 있는 특징이 있으되, 가파른 상승 이후에는 니치가 아닐 것이다. 한편, 특정 기술 영역에 특허 출원수 등이 거의 없는 경우에는 비어 있는 틈새(niche) 기술일 수도 있지만, 쓸모가 적어나 없어 버려진(deserted) 기술일 수도 있다. 본 발명에서 니치성이 큰 기술 영역에 대한 기본적인 가정은 니치성이 큰 기술 영역은 시간의 경과에 따라, 과거의 특정 시점, 현재, 또는 적어도 미래의 특정 시점에 그 기술 영역에 대한 채움(filling)의 속성이 있다는 것이다. 즉, 니치 기술 영역은 시간의 경과에 따라, 그 영역에 대한 특허 출원수가 증가하거나, 출원인 수가 증가하거나, 피 인용수가 증가하거나, 발명자 수가 증가하거나 하는 등 기타 어떠한 형태로든 채움이 발생한다. 따라서, 채움의 대상 또는 채움의 결과로 나타나는 수치값 또는 이러한 수치값을 복합하여 생성하는 수치값이 종속 변수가 될 수 있다. 예를 들면, 5년 기준 출원수 증가량, 5년 기준 출원수 증가율, 5년 기준 출원인수 증가량, 5년 기준 출원인수 증가율 또는 (5년 기준 출원수 증가율)*(5년 기준 출원인수 증가율) 등이 종속 변수의 한 예가 될 수 있다. 더욱 구체적으로는 분할 시점 기준으로 과거 5년 기준의 출원수와 분할 시점 기준 이후의 5년 동안의 출원수가 비교되는 경우, 5년 기준 출원수 증가량 및 5년 기준 출원수 증가율을 구할 수 있게 된다. 이러한 종속 변수가 본 발명의 니치 기준 요소가 되며, 종속 변수값은 니치 기준 요소값이 된다.
한편, 사용자에게 니치 분석 정보는 특정 과거 시점이 아니라, 상기 니치 기술 영역 발견 시스템(5000)을 사용하는 현재 시점에서 특정 기술 영역이 니치 속성을 얼마나 가지는 지가 관심사일 것이다. 따라서, 니치 평가 모델도 특정 시점을 기준으로 니치성을 평가해 줄 수 있어야 한다. 따라서, 종속 변수나 독립 변수에 있어서, 변수값을 계산할 때, 시점의 선택이 중요하게 된다. 즉, 모델 수립의 특성 상 특정 과거 시점까지의 데이터로 그 특정 과거 시점 이후를 예측하는 속성 상, 모델 수립에서도 시점의 선택은 변수값에 큰 영향을 미치게 된다.
본 발명에서는 상당히 큰 N개의 기술 영역에 대하여, 샘플 문건 집합을 입수하고, 입수된 샘플 문건 집합을 분할한다. 분할하는 방법은 크게 2가지가 있다. 첫째는 N개의 샘플 문건 집합에 공통된 시점 분할 기준을 적용하는 공통 시점 분할 방식이다. 이는, 적어도 하나 이상의 특정 시점을 기준으로 N개의 샘플 문건 집합을 강제 분할하는 방식이다. 예를 들면, N개의 샘플 문건 집합을 공개일이나 최선일(우선권 주장 시 우선일)을 기준으로 2005년 이전과 2006년 이후로 2분할하거나, 5년 단위로 n분할 하는 방법이다. 둘째는 N개의 샘플 문건 집합에 공통된 속성 분할 기준을 적용하는 공통 속성 분할 방식이다. 이 방식은 N개의 샘플 문건 집합에 따라 그 속성 분할 기준을 충족하는 시점을 기준으로 분할하는 방법이다. 예를 들면, 3년 단위 출원 증가율이 최초로 25% 이상인 경우, 최초로 25%가 되는 연도나 그 연도에서 1년 또는 2년을 뺀 연도를 기준으로 2분할 하는 방식이다. 이 경우, 샘플 문건 집합마다 이 속성을 만족하는 시점이 다르므로, 분할되는 기준 연도도 다를 수 있으며, 경우에 따라서는 분할이 되지 않을 수도 있을 것이다. 이에 따라 상기 N개의 표본 문건 집합의 크기는 공통 속성 분할 기준의 적용 시 줄어들 수 있을 것이다(to smaller N). 한편, 출원 증가율을 50%로 하는 등과 같이 속성 기준값을 다르게 가져 가면 N개의 표본 문건 집합의 크기는 공통 속성 분할 기준의 적용 시 훨씬 더 줄어들 수 있을 것이다(much smaller N). 전자의 경우는 제1 유형의 니치 발견 모델에 사용될 수 있다면, 후자의 경우는 제2 유형(급진적 니치 영역)의 발견에 사용될 수 있을 것이다. 물론 이때, 상기 표본의 생성은 줄어든 N개의 표본 문건 집합이 사용될 것이다. 즉, 공통 속성의 종류나 공통 속성 기준값의 만족 정도로 다양한 니치 평가 모델이 생성될 수 있게 된다. 설명의 편의상 니치 평가 모델의 생성에 사용되는 표본 문건 집합의 개수는 N으로 표기한다.
상기 도 22에서 예시 되듯이, 공통 시점 분할 방식보다 공통 속성 분할 방식이 상대적으로 더 타당할 수 있다. 예를 들어, 도 22에서 보듯이, 05년을 기준으로 강제 분할하면, 기술 A에 대해서는 니치성이 충분히 반영될 수 있지만, 기술 C에 대해서는 니치성이 충분히 반영되지 못할 수도 있기 때문이다. 기술 A에 대해서는 05년, 기술 B에 대해서는 04년, 기술 C에 대해서는 01년을 기준으로 분할하는 것이 상대적으로 더 타당할 수 있으며, 샘플 데이터의 낭비를 최소화시킬 수 있을 것이다.
상기와 같이 N개의 표본 문건 집합에 대하여 분할이 있게 되면, 하나의 표본 문건 집합은 제1 부분 표본 문건 집합(분할 시점 이전에 대응되는 문건 집합)과 적어도 하나 이상의 제2 부분 표본 문건 집합(분할 시점 이후에 대응되는 문건 집합)을 구성하게 된다. 이때, 제1 부분 표본 문건 집합이 어떠한 속성을 가질 때, 상기 분할 시점 이후에 그 기술 영역에서 채움(filling)이 일어나는가를 찾아 내는 것이 니치 평가 모델 생성의 핵심을 이룬다. 이때, 니치 평가 모델의 생성에 제2 부분 표본 문건 집합도 사용될 수 있지만, 본 발명에서는 제1 부분 표본 문건 집합을 사용하여, 니치 평가 모델을 생성하는 것이 특징이다. 제1 부분 표본 문건 집합을 기준으로 할 때, 상기 제2 부분 표본 문건 집합은 채움(filling)이 일어난 결과가 된다. 즉, 상기 니치 평가 모델 생성의 핵심은 빠르게 채워진 제2 부분 표본 문건 집합에 기여하는데 기여한 니치 평가 요소를 찾아내는 것이며, 이러한 니치 평가 요소의 니치 평가 요소값은 제1 부분 표본 문건 집합을 기준으로 생성된다.
상기와 같이 각 표본 문건 집합마다 종속 변수값이 적어도 하나 이상의 니치 기준 요소값이 생성되고, 독립 변수값으로 각 표본 문건 집합의 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대한 니치 평가 요소값이 생성되면, 하기 표 9와 같은 니치 모델 생성을 위한 데이터 값이 결정 나게 된다.
[표 9]
Figure PCTKR2011001312-appb-I000009
하기 표 10은 상기 표 9의 구체적인 예이다. 표 10은 표본 문건 집합을 FT 단위로 생성했다. 변수명은 상기 표 4 내지 표 7에서 사용된 것들이다.
[표 10]
Figure PCTKR2011001312-appb-I000010
상기 표 10과 같은 데이터로 상기 니치 기술 영역 발견 시스템(5000)은 니치 평가 모델을 생성할 수 있다. 상기 표 10에서는 최말단 또는 타이틀이 1 dot인 FT별로 표본 문건 집합을 구성했지만, FT의 00 레벨을 기준으로 표본 문건 집합을 구성할 수도 있을 것이다. 한편, FT 이외에도, IPC나 USPC 등과 같은 다른 특허 분류의 기 설정된 레벨(최말단 특허 분류 또는 n dot subgroup(IPC의 경우), n dot subclass(USPC의 경우)별 특허 분류)로도 표본 문건 집합을 생성할 수 있을 것이다. 한편, 상기 표본 문건 집합은 특허 문건 집합이므로, 복수 개의 rising 키워드i에 대하여, 키워드 i를 핵심 키워드로 포함하는 특허 문건 집합을 상기 표본 문건 집합이 될 수도 있을 것이다.
이하, 도 9를 참조하면서 본 발명 사상을 더욱 더 상세하게 설명한다. 상기 니치 기술 영역 발견 시스템(5000)은 N 개의 표본 문건 집합에 대하여, 상기 N개 각각의 표본 문건 집합을 적어도 하나 이상의 분할 기준을 적용하여 2 이상의 부분으로 분할하여 제1 부분 표본 문건 집합과 적어도 하나 이상의 제2 부분 표본 문건 집합을 구성(SM11)하고, 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합을 대상으로 니치 기준 요소에 대한 니치 기준 요소값 정보를 생성(SM12)하고, 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대하여 니치 평가 요소값 정보를 생성(SM13)하며,
상기 니치 기준 요소값을 종속 변수값으로 하고, 상기 니치 평가 요소값을 독립 변수값으로 하여 기 설정된 통계 알고리즘을 적용하여 니치 평가 모델을 생성(SM14)한다.
이어, 상기 표 10과 같은 종속 변수값과 독립 변수값이 샘플별로 준비되어 있을 때, 상기 니치 기술 영역 발견 시스템(5000)의 니치 평가 모델 생성부(5200)는 기 설정된 적어도 하나 이상의 통계 모델을 적용하여 니치 평가 모델을 생성한다. 상기 통계 모델은 선형 회귀 모델을 사용할 수도 있지만, 선형 회귀 모델은 강건함(robust)이 떨어지고, 예측력이 낮은 문제가 있다. 이에, 비선형 회귀 알고리즘 중에서도 기계 학습 알고리즘을 사용하는 것이 여러 면에서 좋은 니치 평가 모델을 생성할 수 있다. 하기에서는 기계 학습 알고리즘 중에서도 부스팅 알고리즘을 사용하는 것에 대해서 설명한다. 하기 설명에서 당업자는 하기 설명으로 부스팅 알고리즘뿐만 아니라 랜덤 포리스트 등과 같은 다른 기계 학습 알고리즘을 사용할 수도 있을 것이다.
니치 영역을 탐색하고 이에 영향을 미치는 주요한 변수들을 찾는 문제는 통계학의 한 분야인 기계 학습(Machine Learning)분야에서 보편적으로 연구되는 회귀(Regression)문제이다. 이러한 회귀 문제를 푸는 방법에는 가장 기본적인 최소제곱법을 비롯한 수많은 방법들이 있다. 회귀 문제는 아래의 식과 같이 일반적으로 표현할 수 있는데, 이는 어떤 loss function, ψ이 주어져 있을 때 기대값을 최소화하는 함수를 추정하는 문제로 볼 수 있다.
[수학식 1]
[규칙 제26조에 의한 보정 19.05.2011] 
Figure WO-DOC-MATHS-226
전통적으로 추정함수 f에 대하여 모수적인 가정을 하거나 선형 가정을 하고 많은 방법들이 연구되어 왔다. 하지만 현실에는 몇 개의 모수를 가지고 설명하기에는 훨씬 복잡한 현상들이 많고 선형 모형은 극히 제한적으로 적용될 수 밖에 없는 한계점을 가지고 있다.  따라서 복잡한 현상을 설명하기 위해서는 추정함수 f에 대해서 비모수적이고 비선형적인 가정하에서 분석이 이루어져야 한다. 하지만 이러한 조건하에서의 분석은 모수적, 선형적 분석방법보다 많은 어려움이 따른다. 본 과제에서 분석하는 특허자료 또한 굉장히 방대하고 복잡하기 때문에 이러한 자료를 잘 설명하려면 비모수적이고 비선형적인 모형이 수반되어야 한다. 그래서 그러한 방법들 중 대표적이고 우수한 방법이라고 할 수 있는 부스팅 모형을 적용하여 니치 영역 탐색 작업을 수행하였다.
부스팅(Boosting) 알고리즘은 Freund와 Schapire(1997)에 의해서 처음으로 분류(Classification) 문제를 다루기 위한 방법으로 제안되었다. 그 후 많은 학자들에 의해 활발한 연구가 진행되어 많은 발전이 이루어졌고 현재는 Friedman이 제안한 Gradient Boost algorithm이 보편적으로 널리 쓰이고 있다.
[수학식 2]
[규칙 제26조에 의한 보정 19.05.2011] 
Figure WO-DOC-MATHS-230
위와 같이 정의되는 목적함수롤 최소로 하는 함수를 찾는 것이 목표인데 이 때 국지적으로 gradient의 반대방향으로 움직이면 목적함수의 값이 가장 크게 감소한다고 할 수 이다 그래서 추정함수, f을 아래와 같은 식으로 업데이트 할 수 있다.
[수학식 3]
[규칙 제26조에 의한 보정 19.05.2011] 
Figure WO-DOC-MATHS-233
Gradient Boost algorithm 알고리즘은 도 23에 잘 요약되어 있다. 즉 이 알고리즘은 각 단계마다 새로운 함수 g을 계속 규합해서 광대한 머신을 만드는 알고리즘이라고 할 수 있다.
초기에 부스팅 알고리즘에는 과적합의 문제가 거의 없는지 알았지만 실제로는 과적합 문제가 존재한다. 과적합은 현재 주어진 자료에 대한 적응력이 너무 높아져서 정작 새로운 자료에 대해서는 적응력이 떨어지는 현상을 말한다. 도 24는 과적합의 경우를 그림으로 잘 표현해 주고 있다. 녹색으로 표시된 분류규칙은 현재 주어진 자료에 아주 잘 적응을 해서 잘못 분류한 경우가 하나도 없다 모든 주어진 자료를 완벽하게 분류하였다. 하지만 이러한 분류 규칙이 새로운 자료에 대해서도 잘 작동하리라는 보장은 없는 것이다. 반면 검정선으로 표시된 분류 규칙은 몇 개의 자료를 잘못 분류하고는 있지만 대부분의 자료를 적절히 잘 분류하고 있음을 볼 수 있다. 검정색으로 표시된 분류 규칙이 훨씬 더 자연스러운 분류 규칙이라고 할 수 있다.
따라서 현재 주어진 자료에서 구축하는 모형이 주어진 자료를 너무 따라가지 않도록 제약을 주어 과적합 문제를 해결해야 한다. 그래서 Gradient Boost algorithm에도 shrinkage parameter을 도입하여 이러한 과적합 문제를 해결하게 된다. 그리고 Friedman(2002)이 새로이 stochastic gradient boosting algorithm을 제안하는데 이는 함수 g을 추정할 때 자료 전체를 쓰지 말고 일부만을 사용하여 추정하면 성능이 더 좋아진다는 것이다. 특허 자료의 경우도 자료가 상당히 방대하기 때문에 이 방법을 적용하면 시간도 절약할 수 있을 뿐만 아니라 성능 향상도 도모할 수 있다. 이를 정리하면 도 25과 같이 요약할 수 있다. 함수 g을 적합하는 과정에서 Tree을 쓰는 것이 보통이다. 일반적으로는 한번 분기하는 stump을 사용하지만 변수들 간에 교호작용이 있다고 판단이 되면 분기를 여러 번 하는 Tree을 사용할 수도 있다.
도 25 에 있는 알고리즘을 구현하여 니치 자료에 적합하여 분석을 수행하였다. 알고리즘을 보면 알겠지만 구현할 때 중요한 것 중의 하나가 규합하는 tree의 개수와 과적합을 방지하는 shrinkage parameter의 선택이다. 보통 tree개수가 증가하면 shrinkage parameter는 작아지고 반대로 shrinkage parameter가 커지면 tree개수는 작아지는 경향이 있다. 그래서 보통 부스팅 모형을 적합할 때는 shrinkage parameter을 작은 값으로 고정시키고 tree의 개수를 변화시켜 가면서 최적의 모형을 찾는다. 실제 분석 과정에서는 shrinkage parameter로 0.01을 사용한다.
도 26는 니치 평가 모델 생성 과정에 관한 일 실시예적 개념을 설명하는 도면이다.
규합하는 tree의 개수에 따라서 수많은 부스팅 모형이 생기기 마련이다. 이런 수많은 모형들 중에서 최적의 모형을 선택할 필요가 있다. 이는 모형 선택의 문제이고 이에 관해서도 수많은 연구들이 수행되고 있고 여러 방법들이 알려져 있다. 그 중 부스팅 모형에 적합하다고 할 수 있는 cross validation 방법을 이용하여 최적의 모형을 선별하였다. 특허 자료에 대해서 5-fold cross validation 방법을 적용하여 최적 모형을 선택하였다. 도 26는 cross validation 방법을 도식적으로 잘 보여주고 있다. 분쟁특허와 비분쟁 특허가 섞여 있는 자료를 5개의 집합으로 나눈 다음 각각의 경우마다 4개의 집합으로 모형을 구축하고 나머지 하나의 집합으로 test error을 구해서 이 오류가 가장 작은 모형을 선택하는 방법이다.
상기와 같은 방법으로 니치 평가 모델을 생성한다. 상기 니치 평가 모델은 독립 변수로서 니치 평가 요소값이 제공되면, 종속 변수로서 니치 기준 요소값을 생성해 낸다. 니치 기준 요소값이 5년 기준 출원수의 증가량이고, 최근 5년간의 입수 문건 집합에 대한 니치 평가 요소값이 제공되면, 니치 평가 모델은 5년 기준 출원수 증가량을 제시하므로, 앞으로 5년간의 출원수가 제시될 수 있게 된다.
이와 같이 상기 니치 기술 영역 발견 시스템(5000)은 니치 평가의 대상이 되는 지정되거나 입력된 입수 문건 집합을 입수(SM21)하고, 상기 입수 문건 집합에 대하여 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성(SM22)하고, 생성된 상기 니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 니치 평가값을 생성(SM23)하게 된다.
상기 n차원 프레임이 구성하는 교차 영역에 대응되는 문건 집합을 입수 문건 집합으로 간주하여, 교차 영역별로 니치 평가값을 생성할 수 있게 된다. 니치 평가값의 생성은 본 발명의 니치 평가값 생성 모듈(5260)이 담당한다. 상기 생성된 니치 평가값은 니치 분석 정보의 일종이 되며, 상기 니치 분석 정보 표시부(5113)를 통하여 상기 n차원 프레임에 나타나게 된다. 이때, 상기 타겟 문건 집합에 상기 니치 옵션 처리부(5130)를 통하여 한정이 되게 되면, 교차 영역에 대응되는 문건 집합이 한정되고 되고, 문건 집합에 대응되는 니치 평가 요소값이 변경되기 때문에, 니치 평가값도 변동되게 된다.
이어, 본 발명의 니치 발견 시뮬레이션 모듈(5320)에 대해 설명한다. 하나의 타겟 문건 집합이 있을 경우, 그 타겟 문건 집합별로 다양한 종류의 교차 영역 집합을 생성할 수 있을 것이다. 타겟 문건 집합에 포함된 최말단 특허 분류의 직상위 특허 분류 또는 상위 특허 분류가 n개일 경우, 2차원 교차 영역 집합만 하더라도 적어도 nC2 개의 교차 영역 집합이 생성될 수 있게 된다. 한편, 니치 옵션 처리부(5130)를 통하는 경우, 더욱 더 다양한 교차 영역 집합이 생성될 수 있으며, 2 종류 이상의 특허 분류가 대응되는 특허 문건일 경우에는 더욱 더 다양한 교차 영역 집합이 생성될 수 있고, CatchWord나 Index가 대응될 수 있는 경우, 더욱 더 다양한 교차 영역 집합이 생성될 수 있다. 타겟 문건 집합이 주어졌을 때, 이러한 다양한 교차 영역 집합의 생성은 시스템적으로 구성될 수 있음도 당연할 것이다.
상기 니치 기술 영역 발견 시스템(5000)은 문건 집합 분할 모듈(5210)을 사용하여 입수한 입수 문건 집합(타겟 문건 집합)을 분할하여 복수 개의 분할 입수 문건 집합을 생성(SM31)하고, 상기 생성된 분할 입수 문건 집합별로 상기 입수 문건 집합에 대하여 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성(SM32)하고, 생성된 상기 니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 상기 생성된 분할 입수 문건 집합별로 니치 평가값을 생성(SM33)한 다음, 상기 복수 개의 분할 입수 문건 집합별로 생성되는 상기 니치 평가값에서 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합 정보를 선별(SM34)한다. 이러한 시뮬레이션은 본 발명의 니치 발견 시뮬레이션 모듈(5320)이 주도적으로 담당한다.
이어, 본 발명의 니치 기술 영역 발견 시스템(5000)를 중심으로 하여, 본 발명의 기술 사상을 더욱 더 상세하게 설명한다. 상기 니치 분석용 문건 집합 입수부(5310)은 특허 집합을 입수하는 특허 집합 입수부과 입수한 특허 집합을 한정하는 입수 특허 집합 한정부을 포함하고 있다. 상기 입수 대상 특허 집합 생성부은 대상 특허 집합을 입수하는 대상 특허 집합 입수부과 대상 특허 집합을 한정하는 대상 특허 집합 한정부을 포함하고 있다. 대상 특허 집합 입수부는 검색 엔진에 검색식을 질의하거나, DBMS에 질의식을 질의하거나, 상기 특허 정보 시스템(10000)을 사용하고 있는 사용자가 관리하는 적어도 하나 이상의 특허 문건 또는 특허 문건 ID를 포함하는 특허 문건 집합 또는 적어도 하나 이상의 특허 검색식이나 질의식으로 특허 문건 집합을 호출 또는 생성 또는 선택할 수 있게 된다.
상기 니치 분석용 문건 집합 입수부(5310)은 1) 검색 엔진으로의 검색어 입력 또는 2) 특허 DB(112)를 구성하는 필드를 활용하는 쿼리의 입력, 3) 상기 검색어 또는 상기 쿼리에 대응되는 특허 정보 추출 조건의 입력이나 선택 등으로 생성될 수 있다. 상기 특허 정보 추출 조건은 상기 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, (특허 주제 분류 및 기 설정된 분류 속성 등이 있다면, 이들 중 어느 하나 이상) 중 어느 하나 또는 어느 2 이상의 조합으로 생성되는 것인 것이며, 상기 시간 범위의 기준이 되는 시간은 상기 특허 문건의 우선일, 출원일, 공개일 및 등록일 중 어느 하나 또는 어느 2 이상의 조합을 사용하는 것이며, 상기 특허 분류는 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 또는 어느 2 이상의 조합인 것이며, 상기 특허 주제 분류는 상기 IPC의 catchword, 상기 USPC의 catchword 또는 상기 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 이상을 사용하여 생성되는 주제 분류 중 어느 하나 이상인 것이며, 상기 기 설정된 분류 속성은 상기 출원인이나 상기 권리자나 상기 양수인에 대한 분류 속성, 상기 특허 분류를 구성하는 특허 분류별 분류 속성, 상기 발명자에 대한 분류 속성, 또는 상기 특허 주제 분류별 분류 속성 중 어느 하나 이상이 될 수 있다. 예를 들어, 출원인에 대하여 기업, 대학, 연구 기관, 개인 등의 구분이 있을 때, 대학 속성을 가지는 출원인만으로 한정 지을 수 있을 것이며, 특정 기간 동안 특정 개수 이상의 출원/등록된 특허를 가지는 출원인(다출원인)만으로 한정 지을 수도 있을 것이다.
한편, 상기 니치 분석용 문건 집합 입수부(5310)은 특정한 특허 집합의 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 인용 발생 입수 특허 집합 등을 호출 또는 선택 또는 입수할 수 있다. 입수 대상 특허 집합 생성부이 특정한 조건을 가하여 대상 특허 집합을 한정하는 경우, 상기 조건을 반영하여, 데이터부로부터 대상 특허를 입수해 온다. 상기 특허정보특허 정보 시스템(10000)은 적어도 하나 이상의 카데고리별로 특허 집합을 생성하고 관리할 수 있으며, 상기 특허 집합의 관리는 본 발명의 특허 정보 시스템(10000) 특허 집합 관리부가 수행한다. 상기 특허 정보 시스템(10000) 특허 집합 관리부의 하부에는 출원인별로 특정되는 특허 집합을 관리하는 출원인별 특허 집합 관리부와, 특허 분류별로 특정되는 특허 집합을 관리하는 특허분류별 특허 집합 관리부와 기타 분류나 카테고리별로 특정되는 특허 집합을 관리하는 기타 분류별 특허 집합 관리부등 이 있다. 한편, 사용자들이 생성하는 특허 집합은 회원별 특허 집합 관리부가 수행한다.
상기와 같은 특허 문건 집합 및 축이 결정나게 되면, 개념적으로 가로m개 세로 n개로 구성되는 mXn 개의 셀로 구성되는 매트릭스가 생성되게 된다. 상기 (mi,nj) 교차 영역에는 특허 문건 부분 집합이 대응되게 된다. 예를 들면, mi와 nj가 특허 분류인 경우, 상기 (mi,nj)에는 특허 분류 mi와 nj를 동시에 포함하는 상기 선택된 특허 문건 집합의 모든 특허들이 입수되게 되며, 이러한 특허들은 상기 특허 문건 집합의 일부이므로, 상기 특허 문건 부분 집합이 되게 된다. 이때, mi나 nj 중 특허 분류가 있을 때에는 특허 분류의 종류뿐만 아니라, main 특허 분류와 sub 특허 분류의 문제가 발생하게 된다. 특허 문건에는 적어도 하나 이상의 main 특허 분류가 포함되어 있으며, 경우에 따라서는 1개 이상의 sub 특허 분류가 포함되어 있을 수 있게 되므로, 사용될 특허 분류의 범위가 문제시 되게 된다. 이는 옵션으로 제공될 수 있으며, 사용자는 어느 특허 분류까지를 사용할 것인지를 선택할 수 있게 된다. 가급적, main 특허 분류와 sub 특허 분류 모두를 사용하는 것이 더 타당할 것이다.
이어, 상기 (mi,nj)교차 영역에 대응되는 특허 문건 부분 집합에 대한 분석이 개시되며, 이는 본 발명의 특허 분석 정보 생성부(4000)가 처리한다. 상기 특허 분석 정보 생성부(4000)는 상기 특허 문건 부분 집합에 대하여 기설정된 평가 정보를 생성한다. 우선적으로 상기 특허 분석 정보 생성부(4000)는 상기 특허 문건 부분 집합에 속하는 개별 특허 단위 및/또는 상기 특허 문건 부분 집합에 속하는 특허 집합 단위별로 청구항수, 최초 (독립)청구항 길이, 페이지수, 도면수, 국내 패밀리수(분할+ US계속/일부계속), 해외 출원 패밀리수, 해외 등록 패밀리수, 국내 우선권 주장수, Large company 여부, 해외 출원인 여부, 권리자의 분쟁 제기 회수, 권리자의 분쟁 피소 회수, 전체 분쟁수, 최근 3년간 분쟁수, 전체 피고수, 최근 3년간 평균 피고수, 연차등록기간, 표준특허풀 포함여부, 양도 발생 여부, 피인용수, Reference수, IPC수, Subclass가 다른 IPC수, USPC수, Class가 다른 USPC수, FT수, Theme가 다른 FT수, (공동)출원인 수, (공동)발명자 수, 발명자 국적수, 권리의 경제적 잔여수명, IPC main group 기준 최근 3년간 US 출원수, IPC main group 기준 최근 3년간 non US 출원수, USPC no dot subgroup 기준 최근 3년간 US, IPC main group 기준 최근 3년간 US 출원수/최근10년간 US출원수, IPC main group 기준 최근 3년간 non US 출원수/ 최근10년간 non US출원수, USPC no dot subgroup 기준 최근 3년간 US출원수/ 최근10년간 US출원수, IPC main group 기준 최근 3년간 기업 비율, IPC main group 기준 최근 3년간 대기업 비율, IPC main group 기준 최근 3년간 대학/연구기관 비율, IPC main group 기준 최근 3년간 개인(not assigned) 비율, IPC main group 기준 최근 3년간 US권리자(권리자 주소 정보 참조) 비율, 출원일 백분위수, 전체 유사 모집단에서의 자사 특허 비율, 후방 인용에서의 자사 특허 비율, 전방 인용에서의 자사 특허 비율, 후방 인용에서의 자사 특허 개수, 전방 인용에서의 자사 특허 개수, 전방 인용 특허군에서의 기업 비율, 전방 인용 특허군에서의 대기업 비율, 전방 인용 특허군에서의 대학/연구기관 비율, 전방 인용 특허군에서의 개인 비율, 전방 인용 특허군에서의 US 권리자 비율, 전방 인용에서의 논문 비율, 전방 인용에서의 non US 특허 비율, 후방 인용 특허군에서의 기업 비율, 후방 인용 특허군에서의 대기업 비율, 후방 인용 특허군에서의 대학/연구기관 비율, 후방 인용 특허군에서의 개인 비율, 후방 인용 특허군에서의 US 권리자 비율, 후방 인용에서의 non US 특허 비율, 전체 유사 모집단에서의 자사 특허 비율, 5년 집중 영역 정도(AI), 5년 평균 특허 품질 지수, 5년 지수 평점, 5년 공동출원인 수, 5년 집중 영역 정도(AI), 5년 평균 특허 품질 지수, 5년 지수 평점, 5년 공동 발명자수, 실시권 설정 개수, 출원인 재무, 5년 국가별 상대 출원량, 5년 국가별 상대 등록량, 5년 국가별 상대 출원인수, 5년 국가별 상대 발명자수, 5년 국가별 특정 출원인 상대 출원량, 5년 출원인 중 기업 비율, 5년 출원인 중 대학 비율, 5년 국가별 특정 출원인 상대 등록량, 5년 국가별 특정 출원인 포함 출원량, 5년 국가별 특정 출원인 포함 등록량, 기술 분야별 rising 키워드 필드별(특허청구범위) 포함수, 5년 국가별 frequency rising 속도, 5년 국가별 network size rising 속도, 핵심 키워드의 특허 청구 범위 포함 개수, 5년 국가별 출원 증감율, 5년 국가별 등록 증감율, 5년 국가별 출원인수 증감율, 5년 국가별 발명자수 증감율, 5년 출원인 중 기업 비율, 5년 출원인 중 대학 비율, 5년 특정 출원인 포함 비율, 특허조회수, 수명 주기상의 위치, 연차등록납부액 등과 같은 니치 기술 영역 평가 요소 중 어느 하나 이상을 계산하거나 입수한다. 상기 니치 기술 영역 평가 요소에는 본 문단에서 예시한 평가 요소들의 변동값(증감율, 증가 속도 등)도 평가 요소가 됨은 물론이다 할 것이다.
한편, 도 28은 본 발명의 틈새 영역 발견 분석 결과에 관한 다른 일실시예적 도면으로, 도 10과는 다른 니치 기술 영역 평가 요소값을 사용하여 생성되는 니치 기술 영역 평가 정보에 대하여 각 축, 교차 영역/셀(cell)에 대하여 thermograph 효과가 적용되어 있음을 볼 수 있다.
한편, 상기 교차 영역값에 대한 특허 문건 부분 집합이 정해지는 경우, 상기 특허 문건 부분 집합에 속하는 특허들에 대해 기설정된 분석 정보를 제공해 줄 수 있다. 상기 특허 문건 부분 집합에 특허 문건이 대응되는 경우, 상기 특허 문건 부분 집합에 포함된 특허들에 대해서 정량 분석 정보가 제공될 수 있을 것이며(분석의 축은 시간, 출원인, 발명자, 특허 분류, 국가, 등록 여부 등이 될 수 있을 것이다.), 개별 특허들에 대한 서지 사항 및 전문 정보가 링크 될 수도 있을 것이다.
상기와 같은 본 발명 사상은 3 이상의 n차원 매트릭스로 확장할 수 있음은 당업자에게 당연할 것이며, 이 경우, 상기 교차 영역값은 n차원의 큐브 형태가 될 것이다. 한편, 사용자는 2차원까지의 정보만 시각적으로 확인할 수 있으므로, n개의 차원 중 자신이 원하는 차원 2개를 선택하여, 선택된 차원에 대한 상기 니치 기술 평가 정보를 볼 수 있게 된다. 생성된 큐브 data에 있어서, slice and dice 정보 처리를 하여, 원하는 매트릭스를 선택하거나, 선택된 매트릭스에 대하여 축 등을 변동해 보는 인터페이스를 상기 특허 정보 시스템(10000)은 상기 사용자 컴퓨터(100)에 제공할 수 있을 것이다.
본 발명 사상에서 예시로 든 계층 구조는 특허 분류뿐만 아니라, 도 13 내지 도14에 예시된 IPC 대응 캐치워드나, USPC 대응 Index에 대해서도 적용될 수 있음은 당연할 것이다.
이하, 도면을 참조하면서 더욱 상세하게 설명한다.
도 32는 본 발명의 융합 정보 처리 시스템(9000)에 대한 일 실시예적 구성에 관한 도면이다. 상기 융합 정보 처리 시스템(9000)는 융합 정보 처리를 위한 특허 집합을 입수하는 융합 처리 모집합 입수부(910), 상기 융합 처리 모집합 입수부(910)가 입수한 상기 융합 처리 모집합을 기 설정된 적어도 2 이상의 특허 집합으로 분할하여 융합 처리 대상 집합을 생성하는 융합 처리 대상 집합 생성부(920), 융합 처리를 위해 특허 정보에서 단위 융합 요소를 생성하는 단위 융합 요소 생성부(970), 상기 융합 처리의 기준을 제공하는 융합 처리 기준 정보부(930), 상기 융합 처리의 정의 또는 지정하는 융합 처리 기준에 따라 융합 패턴을 처리하는 융합 패턴 처리부(940), 융합 패턴에 대한 분석을 수행하는 융합 패턴 분석부(950), 기 설정된 융합 처리 기준에 따라 융합 패턴 정보를 2회 이상 지속적으로 생성하는 융합 패턴 정보 배치 생성부(960) 중 어느 하나 이상을 더 포함하고 있을 수 있다.
본 발명에서 상기 단위 융합 요소 생성부(970)가 생성하는 단위 융합 요소에는 키워드, 특허 분류, 및 인덱스 중 어느 하나 이상이 사용될 수 있다. 상기 키워드는 기술 키워드, 제품 키워드 등 기 설정된 기준을 충족하는 키워드 계열이 있을 수 있으며, 본 발명에서는 상기 키워드는 1개의 단어 요소, 1개의 구(phrase) 요소, 1개의 절(clause) 요소로 된 좁은 의미의 키워드 또는 상기 좁은 의미의 키워드 중에서 선택되는 적어도 2개 이상으로 짝을 이룬 키워드 쌍을 포함하는 키워드 쌍을 포함하는 말로 사용된다.(본 발명에서는 별도의 언급이 없는 한 상기 키워드라는 용어는 상기 좁은 의미의 키워드 및 공기쌍 중 어느 하나 이상을 의미한다.) 상기 키워드 쌍에는 키워드 공기쌍(co-occurrence keyword pair)(간단히 공기쌍이라 칭한다) 을 포함한다. 특허 분류는 IPC, USPC, FT, FI, ECLA를 포함한다. 인덱스(index)란, 캐치워드(catchword)라고 불리기도 하는 것으로, 단어, 구 또는 절에 적어도 하나 이상의 특허 분류를 대응해 놓은 체계를 말한다. 상기 인덱스 중 대표적인 것으로 IPC를 처리해 놓은 catchword가 있으며, 미국 특허청이 발행하는 index to USPC가 있다. 상기 인덱스도 특허 분류처럼 계층 구조를 가지는 경우가 많다. 상기 인덱스에는 제품명/부품명/요소기술 등에 해당하는 키워드가 내재되어 있는 경우가 많다. 상기 인덱스는 특허 분류를 용이하게 찾아 보기 쉽게 해 놓은 것으로 도 30 및 도 31에 그 예시가 있다. 도 30는 WIPO가 제공하는 IPC에 대한 캐치워드로 이들에 대한 정보는 2010년 3월 현재 http://www.wipo.int/ipc/itos4ipc/ITSupport_and_download_area/20100101/MasterFiles/에 있는 ipcr_catchwordindex_20100101.zip 파일로 입수 가능하다. 도 30에서 ABACUSES에 대하여 G06C 1/00이 대응되어 있음을 볼 수 있다. 이때, ABACUSES를 대하여 G06C 1/00에 대응되는 인덱스라 명명한다. 이에 따라, G06C 1/00은 Abacuses로 역맵핑 할 수 있다. 한편, 도 30의 내용 중 인덱스 ABARADING에서 알 수 있듯이, 상기 캐치워드 체계는 적어도 1단계 이상의 계층 구조를 가지고 있음을 알 수 있다. ABARADING은 2단계 계층임을 보여 준다.
도 31는 USPTO가 USPC에 대한 인덱스로 이들에 대한 정보는 2010년 3월 현재 http://www.uspto.gov/web/patents/classification/uspcindex/indextouspc.htm에서 확인할 수 있다. 도 31의 내용 중에서 인덱스 Abrading은 3단계의 계층으로 분류되어 있음을 알 수 있다. 인덱스 Abrading은 USPC 451/38에 대응되고 있음을 알 수 있으며, Abrading의 하위 인덱스에 Class 451 이외의 다른 Class의 특허 분류도 존재함을 알 수 있다.
상기 키워드는 특허 명세서에 포함된 텍스트를 처리하여 생성할 수 있으며, 이는 본 발명의 상기 데이터 가공부(2000)의 핵심 키워드 생성부(2100)이 담당한다. 상기 핵심 키워드 생성부(2100)는 특허 명세서를 구성하는 각종 필드별에 대응된 구나 문장에서 키워드를 추출한다. 공기쌍의 추출은 근접 거리(1개의 문장 내 등 기 설정된 텀 간의 거리 기준을 충족하는 거리)에 있는 텀간의 조합을 통하여 추출한다. 상기 필드는 발명의 명칭, 특허 청구 범위, 요약, 발명의 상세한 설명, 산업상 이용 가능성, 효과, 종래의 기술(배경 기술) 등 특허 명세서를 구성하는 각종 필드 중 어느 하나 이상일 수 있다. 상기 핵심 키워드 생성부(2100)는 상기 필드에서 추출한 n개의 키워드에 대하여 핵심 키워드 집합을 생성한다. 상기 핵심 키워드 생성 시, 상기 핵심 키워드 생성부(2100)는 동의어 처리, 시소러스 처리 등을 수행하여 실질적으로 같거나, 동등하거나, 대등한 의미를 지니는 텀들은 묶어서 대표 텀으로 처리하여 핵심 키워드를 선정하는 것이 바람직하다. 한편, 상기 대표 텀으로 처리할 때, 사전 내지는 기계 번역기를 활용하여 1개 특허 문건에 나오는 2 이상의 언어에 대한 동의어, 시소러스 처리를 수행하는 것이 바람직할 것이다. 한편, 상기 대표 텀 내지는 상기 추출된 핵심 키워드는 상기 사전 내지는 기계 번역기를 통하여 적어도 하나 이상의 언어로 번역해 놓는 것이 더욱 바람직할 것이다. 자연어 처리를 통하여 키워드(통상적으로 이 기술 분야에서는 키워드를 텀(term)이라 부른다.) 또는 공기쌍을 추출하는 것은 자연어 처리 기술 분야에서 공지의 기술에 속한다. 추출된 n 개의 키워드(공기쌍 포함함은 당연할 것이다.)에 대하여, 기 설정된 핵심 키워드 선정 알고리즘을 적용하여 상기 특허 명세서를 대표할 수 있는 핵심 키워드 집합(핵심 공기쌍 집합이 선택적으로 포함됨은 당연할 것이다.)을 선정한다. 가장 빈번하게 사용되는 알고리즘은 TF(Term Frequency)와 IDF(Inverse Document Frequency)를 사용하는 것이다. 자연어 처리 기술 분야에서는 상기 TF와 IDF를 변수로 한 다양한 함수식이 공개되어 있으며, 필드별 가중치 등 기타의 복잡한 산식을 정책적으로 적용할 수 있음은 당연하다 할 것이다. 이때, 상기 좁은 의미의 키워드만으로 구성되는 핵심 키워드 집합, 상기 공기쌍만으로 구성되는 핵심 키워드 집합을 분리하여 생성하거나, 상기 좁은 의미의 키워드 및 상기 공기쌍을 동등하게 상기 알고리즘으로 처리하여 상기 좁은 의미의 핵심 키워드와 핵심 공기쌍상기 핵심 키워드 선정 알고리즘이 상기 공기쌍을 대상으로 키워드와 같이 처리하면, n개의 키워드 쌍에 대하여, 핵심 키워드 쌍 집합을 생성할 수 있다. 한편, 상기 핵심 키워드 생성부(2100)가 2개 이상의 단어/어휘/어절로 구성되는 새로운 텀(term)을 추출할 때, 상기 새로운 텀이 기술적으로 의미를 가지는 텀인지를 판단하기 어려운 경우가 다수 있다. 이때, google.com과 같은 외부 검색 엔진을 활용하여 새로운 텀이 기술적 의미를 가지는 것인지를 결정하는 방법이 있을 수 있다. 상기 핵심 키워드 생성부(2100)는 상기 추출된 새로운 텀을 따옴표 처리(exact match를 처리하는 google.com의 검색어 처리 방식) 등과 같은 기 설정된 적어도 하나 이상의 처리를 수행한 다음, 상기 google.com과 같은 외부 검색 서비스 시스템에 전송하고, 상기 외부 검색 서비스 시스템으로부터 검색 결과를 전송 받고, 상기 검색 결과를 분석하여 기 설정된 기준이 충족되는 경우, 상기 추출된 새로운 텀을 정상적인 텀으로 처리한다. 상기 검색 결과의 분석은 검색 결과 수(hit 수, 그 질의어에 매칭되는 검색 결과가 몇 개인지를 가르쳐 줌)를 측정하는 것이며, 기 설정된 기준의 예로 영어의 경우, 1,000개 이상, 다른 언어의 경우에는 100개 이상 등이 될 수 있을 것이다. 예를 들어, 2010년 3월 현재 google.com에 patent informatics와 patent informatics services를 각각 질의하면, 67,300과 279개의 Results가 나오는데, 이 경우에는 patent informatics는 텀으로 취급하고, patent informatics services는 새로운 텀으로 취급하지 않을 수 있을 것이다. 한편, google.com등과 같은 검색 엔진이 아니라, wikipedia.org와 같은 용어에 대한 설명을 제공하는 시스템에 질의하여 그 term에 대한 설명이 존재하면, 새로운 텀으로 취급할 수 있다.
상기와 같은 핵심 키워드 선정 알고리즘을 통하면, 1개의 특허 문건에 대응되는 1개 이상의 핵심 키워드 집합(Keyword Set, 1개 이상의 핵심 빈도 유지 핵심 키워드 조합 집합이 선택적으로 포함될 수 있음은 당연할 것이다.) 즉, i번째 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)={K1(Pi), K2(Pi), ..., Ki(Pi), Kj(Pi), ..., Kn(Pi)}을 얻게 된다. 상기에서 i, j, n은 정수이며, Kn(Pi)란 i번째 특허 문건 Pi에서 선정된 n번째 핵심 키워드를 말한다. 1개의 특허 문건에 복수개의 핵심 키워드 집합이 대응될 수 있는데, 그 이유는 1) 특정 필드(예를 들면 특허 청구 범위 또는 요약), 2) 필드별로 다른 가중치를 부여, 3) 2 이상의 핵심 키워드 선정 알고리즘 사용, 4) IDF 계산의 기준 범위, 5) 텀 추출 방식 등의 다양한 이유가 있을 수 있다.) 상기 i번째 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)={K1(Pi), K2(Pi), ..., Ki(Pi), Kj(Pi), ..., Kn(Pi)}은 Pi 또는 Pi에 대응되는 키(key)값을 기준으로 핵심 키워드 DB(1300)에 저장될 수 있다. 본 발명에서는 설명의 편의상 상기 Pi는 상기 특허 문건을 특정하는 키값으로 하여 설명한다. 예를 들면 상기 Pi는 출원번호, 공개번호, 등록번호 또는 국가나 특허 상태(kind)나 기타 요소가 결합되어 있는 임의의 특허 문건 식별 번호일 수 있다. 상기 Pi에는 상기 특허 문건에 대응되는 다양한 서지 사항 또는 가공 서지 사항 또는 기타 가공 정보가 연관될 수 있음은 당연하다 할 것이다. 통상적으로 관계형 DB에서는 상기 키값으로 다양한 정보를 상호 연관시킨다.
이때, 상기 단위 융합 요소 생성부(970)는 상기 핵심 키워드 집합에 대하여 기 설정된 조합 처리 기준에 따라 조합(combination) 처리를 수행한다. 조합 처리란 n개의 핵심 키워드에 대하여 nCr(n은 정수, r은 정수, r은 2이상이며, n보다 작거나 같다)개의 핵심 키워드 조합(Keyword Combination, KC, (Ki, Kj))을 생성하는 것을 말한다. 예를 들어, 핵심 키워드가 10개이고, r이 2인 경우에는 10C2 = 45개의 2개의 핵심 키워드 조합으로 구성되는 빈도 유지 핵심 키워드 조합 집합이 생성되게 된다. 상기 r은 2 내지 4가 바람직하며, 더욱 바람직하게는 2 내지 3이 바람직하다. 본 발명의 융합 처리에서는 상기 핵심 키워드 조합이 처리 단위가 되어 처리된다. i번째 특허 문건 Pi에 대응되는 nCr개의 핵심 키워드 조합으로 구성되는 빈도 유지 핵심 키워드 조합 집합 KCS(Pi)={KC1(Pi), KC2(Pi), ..., KCi(Pi), KCj(Pi), ..., KCn(Pi), ..., KCnCr(Pi)}을 얻게 된다. 상기 빈도 유지 핵심 키워드 조합 집합(KCS, keyword Combination Set) r에 따라서 그 구성 원소 및 개수가 달라짐은 당연할 것이며, r에 따라서 다른 빈도 유지 핵심 키워드 조합 집합이 생성되게 됨은 물론일 것이다.
한편, 상기 단위 융합 요소 생성부(970)는 특허 분류에 대해서도 상기 빈도 유지 핵심 키워드 조합 집합과 같은 특허 분류 조합 집합(CCS, classification Combination Set)이 생성될 수 있다. 상기 특허 분류 조합 집합은 모든 특허 문건에 대해서 생성되는 것은 아니며, 하나의 특허 문건에서 적어도 한 종류 이상의 특허 분류에 대하여 2개 이상의 특허 분류가 대응될 때만, 생성될 수 있다. 예를 들어 1개의 특허 문건에 IPC가 2개 이상이든가, IPC는 1개이더라도 USPC가 2개 이상인 경우에는 각각 2개 이상의 IPC, 2개 이상의 USPC에 대하여 특허 분류 조합(Classification Combination, CC, (Ci,Cj))이 생성될 수 있다. 특허 문건에 포함되어 있어 원래의 특허 분류를 원(original)특허 분류라고 명명한다.
i번째 특허 문건 Pi에 특허 분류의 종류별로 n개의 원특허 분류가 있을 때, 상기 Pi에 대응되는 원특허 분류 집합(Original Classification Set)은 OCS(Pi)={C1(Pi), C2(Pi), ..., Ci(Pi), Cj(Pi), ..., Cn(Pi)}를 얻게 된다. 상기에서 i, j, n은 정수이며, Cn(Pi)란 i번째 특허 문건 Pi에서 선정된 n번째 특허 분류를 말한다. 상기 빈도 유지 핵심 키워드 조합 집합의 생성과 마찬가지로, i번째 특허 문건 Pi에 대응되는 원특허 분류 조합 집합 OCCS(Pi)={OCC1(Pi), OCC2(Pi), ..., OCCi(Pi), OCCj(Pi), ..., OCCn(Pi), , ..., OCCnCr(Pi)}을 얻게 된다. 상기 원특허 분류 조합 집합은 특허 분류의 종류별로 생성될 수 있음은 물론일 것이다. 이 경우, 일본 특허 문건의 경우에는 IPC, FT, FI별로 생성될 수 있을 것이다. 이와 같이 원특허 분류를 대상으로 하는 특허 분류 조합 집합의 생성은 빈도 유지 핵심 키워드 조합 집합의 생성과 동등하게 처리할 수 있다. 상기 원특허 분류 조합 집합은 협의의 특허 분류 조합 집합이 된다.
한편, 특허 분류는 계층 구조를 가지므로, 드러난 특허 분류의 조합 이외에, 내포(implicit) 특허 분류 조합 집합이 생성될 수 있다. 상기 내포 특허 분류의 조합 집합을 생성하는 방법에 대해서는 본 출원인/본 발명자의 특허 출원 10-2007-0061273, 10-2007-0002555, 10-2007-0129437, 10-2007-0129270, 10-2007-0129387, 10-2007-00129367, 10-2008-0126562, 10-2009-0082997 등에 잘 나와 있다. 이하는 상기 공개 특허에 나와 있는 내용이다. 상기 내포 특허 분류 조합 집합은 ICCS(Implicit Classification Combination Set)라고 한다.
대한민국 특허출원 제10-2005-0111868호에는 2006년 01월 자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 예시적으로 설명한다. H04B 7/26의 부모는 차례로 H04B 7/24, H04B 7/00, H04B, H04, H가 된다. H04B 7/15의 부모는 차례로, H04B 7/14, H04B 7/00이 된다. 이 경우, 최하위 공통 특허 분류 기호는 H04B 7/00이 된다. 그러므로, 이를 표로 만들면 하기 표와 같다. H04B 7/00과 관련된 셀이 그 셀 값이 아무 값도 없음은 위에서 설명한 바와 같다. 각 특허 분류의 공통 부모 직전까지의 내포 특허 분류 조합 집합을 생성하되, 서브 그룹 등과 같이 내포 특허 분류 조합 집합을 생성하는 깊이를 한정할 필요가 있다. 한정이 없는 경우, IPC를 예로 들면, 섹션이 다를 경우, 너무 많은 특허 분류 조합 집합이 과도한 상위 특허 분류에서 생성되게 되는 문제가 있다.
표 11
H04B 7/26 H04B 7/24 H04B 7/00
H04B 7/15 1 1
H04B 7/14 1 1
H04B 7/00
상기 표 11에서는 (H04B 7/15, H04B 7/26)이라는 원특허 분류 조합과, (H04B 7/14, H04B 7/26),(H04B 715/, H04B 7/24),(H04B 7/14, H04B 7/24)의 내포 특허 분류 조합이 생성되게 된다. 상기 표 11에서는 공통 부모는 H04B 7/00이며, 깊이 한정은 서브 그룹에서 처리되었다.
한편, 특허 분류가 3개 이상 되는 경우에는 각 특허 분류 조합별로 상기 표 11과 같은 내포 특허 분류 조합을 생성할 수 있으며, 주(main)특허 분류와 부(sub)특허 분류를 고려한 내포 특허 분류 조합의 생성도 가능할 것이다. 이에 대해서는 상기 본 출원인/발명자의 특허들에서 대한민국 특허출원 제10-2006-0012606호에는 2006년 01월 자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호를 예시로 설명해 놓고 있다.
한편, 가공 특허 분류 조합 집합을 도입할 수 있다. 특허 문건에 나타난 원특허 분류는 특허 분류마다 깊이(depth, 타이틀 정보에 포함된 dot 수로 깊이를 알 수 있다.)가 다르므로, 특허 분류 체계를 참조하여 원특허 분류 마다 깊이를 일정하게 유지될 수 있도록 가공 처리해 놓은 특허 분류를 도입할 수 있다. 일정 깊이로 유지하는 가공 처리의 일례는 IPC의 경우, 특허 분류 체계를 참조하여, 원특허 분류를 모두 서브 그룹 또는 1 dot 서브 그룹 수준으로 상향 조정하는 처리 등을 들 수 있다. 가공 특허 분류로 생성하는 특허 분류 조합 집합을 가공 특허 분류 조합 집합(Processed Classification Combination Set, PCCS라고 한다.)
본 발명의 특허 분류 조합 집합은 상기 원특허 분류 조합 집합, 내포 특허 분류 조합 집합, 가공 특허 분류 조합 집합 중 적어도 하나 이상을 포함하는 특허 분류 조합 집합이다. 이하, 특허 분류 조합 집합으로 설명한다. 본 발명의 융합 정보 처리에서 상기 사용자는 상기 특허 분류 조합 집합의 처리 범위에 대해 선택할 수 있음은 물론이다 할 것이다.
한편, 상기 단위 융합 요소 생성부(970)는 특허 분류가 있는 경우, 상기 특허 분류에 대응되는 인덱스에 대해서도 상기 빈도 유지 핵심 키워드 조합 집합과 같은 인덱스 조합 집합(ICS, Index Combination Set)이 생성될 수 있다. 상기 인덱스 조합 집합은 모든 특허 문건에 대해서 생성되는 것은 아니며, 하나의 특허 문건에서 적어도 한 종류 이상의 특허 분류에 대하여 2개 이상의 특허 분류가 대응되고, 상기 2개 이상의 특허 분류가 각기 다른 인덱스에 대응될 때만 생성될 수 있다.(후술하는 상위 특허 분류 활용의 경우에는 예외적으로 가능할 수도 있다.) 예를 들어 1개의 특허 문건에 IPC가 2개 이상이고, 각 IPC가 각각 다른 인덱스에 대응되어 있거나, IPC는 1개이더라도 USPC가 2개 이상이며, 상기 USPC가 각각 다른 인덱스에 대응되어 있는 경우에는 각각 2개 이상의 IPC, 2개 이상의 USPC에 대하여 인덱스 조합(Index Combination, IC, (Ii,Ij))이 생성될 수 있다. 특허 문건에 포함되어 있어 원래의 특허 분류를 원(original)특허 분류라고 명명하고, 원 특허 분류에 대응되는 인덱스를 원인덱스라 한다.
i번째 특허 문건 Pi에 특허 분류의 종류별로 n개의 원특허 분류가 있을 때, 상기 Pi에 대응되는 원특허 분류 집합(Original Classification Set)이 있고, 상기 원특허 분류 집합에 대응되는 원인덱스 집합(Original Index Set, OIS)은 OIS(Pi)={I1(Pi), I2(Pi), ..., Ii(Pi), Ij(Pi), ..., In(Pi)}를 얻게 된다. 상기에서 i, j, n은 정수이며, In(Pi)란 i번째 특허 문건 Pi에서 선정된 n번째 인덱스를 말한다. 상기 빈도 유지 핵심 키워드 조합 집합의 생성과 마찬가지로, i번째 특허 문건 Pi에 대응되는 원인덱스 조합 집합(Original Index Combination Set, OICS) OICS(Pi)={OIC1(Pi), OIC2(Pi), ..., OICi(Pi), OICj(Pi), ..., OICn(Pi), , ..., OICnCr(Pi)}을 얻게 된다. 상기 원인덱스 조합 집합은 인덱스가 대응된 특허 분류의 종류별로 생성될 수 있음은 물론일 것이다. 이 경우, 미국 특허 문건의 경우에는 IPC 및 USPC 별로 생성될 수 있을 것이다. 이와 같이 원특허 분류를 대상으로 하는 원인덱스 조합 집합의 생성은 빈도 유지 핵심 키워드 조합 집합의 생성과 동등하게 처리할 수 있다. 상기 원인덱스 조합 집합은 협의의 인덱스 조합 집합이 된다.
한편, 상기 내포 특허 분류 조합에 대응되는 내포 인덱스 조합이 가능할 수 있다. 상기 내포 인덱스 조합을 생성할 때는 1) 상기 표 11과 같은 내포 특허 분류 조합을 구성하고, 상기 특허 분류 조합 중 동일한 인덱스 조합에 대응되는 조합을 제거하는 방법, 2) 상기 표 11과 같은 내포 특허 분류 조합의 생성을 위하여 가로축 및 세로축에 배치될 원특허 분류의 상위 특허 분류들을 추출할 때, 동일한 인덱스에 대응되는 상위 특허 분류를 제거하여 축약된 형태의 표를 생성하는 방법 등이 사용될 수 있다.
한편, 가공 인덱스 조합 집합을 도입할 수 있다. 특허 문건에 나타난 원특허 분류는 특허 분류마다 깊이(depth, 타이틀 정보에 포함된 dot 수로 깊이를 알 수 있다.)가 다르므로, 특허 분류 체계를 참조하여 원특허 분류 마다 깊이를 일정하게 유지될 수 있도록 가공 처리해 놓고, 상기 가공 처리된 특허 분류에 대응되는 인덱스를 도입할 수 있다. 가공 특허 분류가 사용되어 생성되는 인덱스 조합 집합을 가공 인덱스 조합 집합(Processed Index Combination Set, PICS라고 한다.)
본 발명의 인덱스 조합 집합은 상기 원인덱스 조합 집합, 내포 인덱스 조합 집합, 가공 인덱스 조합 집합 중 적어도 하나 이상을 포함하는 인덱스 조합 집합이다. 이하, 인덱스 조합 집합으로 설명한다. 본 발명의 융합 정보 처리에서 상기 사용자는 상기 인덱스 조합 집합의 처리 범위에 대해 선택할 수 있음은 물론이다 할 것이다.
상기 단위 융합 요소 생성부(970)는 드러나 있는 2종 이상의 특허 분류, 상기 드러나 있는 2종 이상의 특허 분류의 기 설정된 계층까지의 상위 특허 분류, 및/또는 상기 핵심 키워드 및 또는 인덱스를 조합하여 하이브리드 조합 집합(Hybrid Combination Set)를 생성한다. 즉, 특허 문건에서 추출한 n개의 핵심 키워드, 특허 문건의 서지 사항에 포함된 m개의 특허 분류(특허 분류의 종류별로도 별도 처리하거나, 상기 m개의 특허 분류마다의 기 설정된 상위 특허 분류), 인덱스를 조합 집합 생성의 요소로 하여 하이브리드 조합 집합을 생성할 수 있다.
상기 특허 문건 Pi에 대한 상기 빈도 유지 핵심 키워드 조합 집합 KCS(Pi)={KC1(Pi), KC2(Pi), ..., KIi(Pi), KIj(Pi), ..., KCn(Pi), ..., KCnCr(Pi)}은 1) 상기 Pi에 대응하여 저장되어 있고, 저장된 KCS(Pi)가 사용되는 방법, 2) Pi가 호출될 때, 상기 핵심 키워드 KS(Pi)로부터 실시간으로 생성하여 사용되는 방법이 사용될 수 있을 것이다. 상기 빈도 유지 핵심 키워드 조합 집합에 관한 1) 사전 생성 저장 방법, 2) 실시간 생성 방법은 특허 분류나 인덱스에 대해서도 마찬가지일 것이다. 즉, 상기 특허 문건 Pi에 대한 상기 특허 분류 조합 집합 CCS(Pi)={CC1(Pi), CC2(Pi), ..., CCi(Pi), CCj(Pi), ..., CCn(Pi), ..., CCnCr(Pi)}은 상기 Pi에 대응하여 저장되어 있고, 저장된 CCS(Pi)가 사용될 수도 있으며, Pi가 호출될 때, 상기 특허 분류 집합 CS(Pi)로부터 실시간으로 생성하여 사용될 수도 있을 것이다. 그리고, 상기 특허 문건 Pi에 대한 상기 인덱스 조합 집합 ICS(Pi)={IC1(Pi), IC2(Pi), ..., ICi(Pi), ICj(Pi), ..., ICn(Pi), ..., ICnCr(Pi)}은 상기 Pi에 대응하여 저장되어 있고, 저장된 ICS(Pi)가 사용될 수도 있으며, Pi가 호출될 때, 상기 인덱스 집합 IS(Pi)로부터 실시간으로 생성하여 사용될 수도 있을 것이다.
이어, 융합 처리 모집합별로 융합 처리하는 방법을 더욱 상세하게 설명한다. 상기 융합 처리 모집합이란 특허 정보 시스템(10000)의 사용자가 융합 정보를 알고 싶어하는 대상 집합을 말한다. 상기 융합 처리 모집합은 1) 검색 엔진으로의 검색어 입력 또는 2) 특허 DB(112)를 구성하는 필드를 활용하는 쿼리의 입력, 3) 상기 검색어 또는 상기 쿼리에 대응되는 특허 정보 추출 조건의 입력 등으로 생성될 수 있다. 상기 특허 정보 추출 조건은 상기 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, (특허 주제 분류 및 기 설정된 분류 속성 등이 있다면, 이들 중 어느 하나 이상) 중 어느 하나 또는 어느 2 이상의 조합으로 생성되는 것인 것이며, 상기 시간 범위의 기준이 되는 시간은 상기 특허 문건의 우선일, 출원일, 공개일 및 등록일 중 어느 하나 또는 어느 2 이상의 조합을 사용하는 것이며, 상기 특허 분류는 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 또는 어느 2 이상의 조합인 것이며, 상기 특허 주제 분류는 상기 IPC의 catchword, 상기 USPC의 catchword 또는 상기 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 이상을 사용하여 생성되는 주제 분류 중 어느 하나 이상인 것이며, 상기 기 설정된 분류 속성은 상기 출원인이나 상기 권리자나 상기 양수인에 대한 분류 속성, 상기 특허 분류를 구성하는 특허 분류별 분류 속성, 상기 발명자에 대한 분류 속성, 또는 상기 특허 주제 분류별 분류 속성 중 어느 하나 이상에 대한 한정인 것이 될 수 있다.
상기 융합 처리 모집합의 생성은 본 발명의 융합 처리 모집합 입수부(910)가 담당한다. 상기 융합 처리 모집합 입수부(910)는 사용자의 입력 또는 기 설정된 설정값 또는 기 설정된 적어도 하나 이상의 대상(예를 들어, 모든 IPC를 대상)에 대한 배치 설정 등을 통하여 지정된 입력을 입수하여 해당되는 특허 집합을 추출한다. 이때, 1차적으로 추출하는 특허 집합은 특허 문건의 키값으로도 충분할 수 있을 것이다. 상기 특허 문건의 키값으로 상기 키값에 대응되는 특허 문건의 서지사항이나 빈도 유지 핵심 키워드 조합 집합 이나 특허 분류 조합 집합 등 가공 정보는 용이하게 입수할 수 있기 때문이다. 상기 특허 DB(112)로부터 IPC를 포함하는 특허 집합을 입수하는 등)특허 검색 또는 분석을 수행하는 당업자에게는 상식적인 일상사에 속할 것이다.
이어, 입수된 상기 융합 처리 모집합에 대하여 본 발명의 융합 처리 대상 집합 생성부(920)의 집합 분할부(921)는 상기 모집합을 적어도 2 이상으로 분할한다. 상기 집합 분할부(921)는 상기 사용자에게 분할 처리 기준 제공부(921-1)를 통하여 적어도 하나 이상의 분할 처리 기준을 제공한다. 본 발명의 분할 처리 기준 입수부(921-2)는, 상기 사용자 컴퓨터(100)로부터 상기 분할 처리 기준에 대한 선택 정보 내지는 상기 분할 처리 기준에 대한 입력 정보를 입수한다. 분할 처리 기준은 1) 시간, 2) 조건(등록, 공개, 분할 여부,....), 3) 출원인, 4)... 등과 같은 임의의 기준의 적어도 하나 이상의 조합, 선택 또는 입력값일 수 있다. 예를 들면, 출원일 기준 현재로부터 3년 이내와 3년 이전으로 양분할 수 있다. 도 33는 상기 2분할 모델에 대한 예시도이다. 도 34은 복합 분할 모델에 대한 예시도이다. 상기 융합 처리 모집합을 T라 했을 때, 상기 T를 2분할 하는 경우, 2개의 분할 특허 집합이 생긴다. 분할 특허 집합의 하나는 A, 다른 하나는 B가 된다. 예를 들면, A는 출원일 기준 현재로부터 3년 이내인 특허 집합이 되며, B는 출원일 기준 현재로부터 3년 이전 특허 집합이 된다. A와 B를 가르는 선(DC)는 분할 구분선이며, 이는 분할 조건의 시각화를 위한 개념적인 선이다. 만약 도 34과 같이 n+1 분할을 하는 경우, A, B1, ..., Bn과 같은 n+1개의 분할 특허 집합이 생성된다. 이 경우, n개의 분할 구분선이 존재하며, 각각의 분할 구분선은 분할 조건에 대응된다. 이때, n개의 분할 조건은 같은 계열(예를 들어, 출원일 기준 1년 단위의 분할일 경우, 분할 조건의 속성이 시간 속성으로 동일 계열임)일 수도 있지만 다른 계열이나 다른 속성일 수도 있다. 예를 들면, A와 B1은 시간 속성으로, B1과 Bn은 출원인 기준으로 분할 조건을 독립적으로 지정할 수 있을 것이다. 상기 분할 조건은 분할 처리 기준 DB(921-3)에 저장된다. 상기 분할 조건은 사용자가 설정할 수도 있지만, 시스템에서 디폴트 값으로 적어도 하나 이상의 기준을 지정해 놓을 수도 있다. 한편, 상기 분할에는 A를 다시 여러 개로 재분할하는 것이 당연히 포함될 것이다.
본 발명의 인용 특허 집합 입수부(922)는 특허 집합 단위로 상기 특허 집합에 포함된 특허 문건의 전방 인용 특허와 후방 인용 특허 중 어느 하나 이상을 입수해 올 수 있다. 예를 들면, 상기 A에 대하여, A의 원소인 개별 특허 문건마다 전방 인용 특허를 입수하여 합집합 연산을 수행하여 A의 전방 인용 특허 집합 PA(Parent Set of A)를 생성할 수 있다. 마찬가지로 PB(Parent Set of B) 또는 PBn(Parent Set of Bn)을 생성할 수 있을 것이다. 한편, A의 원소인 개별 특허 문건을 인용하는 후방 특허 문건들로 이루어진 후방 인용 특허 집합 CA(Children Set of A)을 생성할 수 있을 것이다. PA를 구성하는 특허 문건들은 A를 구성하는 특허 문건의 서지 사항에 나와 있으므로, 집합 생성이 상대적으로 용이하나, CA를 생성하기 위해서는 parent field A의 원소인 개별 특허 문건을 가지고 있는 child 특허 문건을 찾아야 하므로, 상대적으로 덜 용이하다. 하지만, DB 정보 처리에서 PA나 CA의 생성은 정도는 당업자에게 극히 용이한 사항이다. 본 발명의 인용 특허 집합 입수부(922)는 분할 특허 집합 단위로 전방 인용 집합을 입수할 수 있다. 한편, 상기 인용 특허 집합을 생성할 때, 다양한 기준(예를 들면 인용 깊이, 잠재 인용 포함 여부)이나, 다양한 제한(출원인 제한, 기간 제한, 국가 제한, 특허 분류 제한 등 특허 서지 사항이나 핵심 키워드 제한 등)을 적용하여, 인용 특허 집합을 다양하게 생성할 수도 있을 것이다. 즉, A나 Bi에 대하여 PA나 PBi는 A를 구성하는 특허 문건이나 Bi를 구성하는 모든 특허 문건의 모든 인용 특허 중에서 일부만으로 구성될 수도 있을 것이다.
한편 본 발명은 지정 집합 입수부(923)는 사용자 컴퓨터(100)로부터 사용자가 지정한 특허 집합에 대한 지정 정보를 입수하고, 상기 지정된 특허 집합을 입수하는 역할을 수행한다. 상기 지정된 특허 집합의 예로, 사용자가 관리하고 있는 특허 집합이 예가 될 수 있을 것이다. 상기 지정 집합 입수부(923)가 입수한 특허 집합에 대하여 집합 분할과, 분할된 집합별로 전방 인용 특허 집합을 입수할 수 있을 것이다.
이어, 본 발명의 융합 정보 처리의 실시예를 더욱 더 상세히 설명한다. 설명의 편의를 위하여, 상기 융합 처리 모집합 T에 대하여 상기 T를 2분할하여 A와 B 집합이 분할 생성되고, 상기 A에 대한 전방 인용 특허 집합으로 PA, 상기 B에 대한 전방 인용 특허 집합으로 PB가 있다고 하자. 상기 A와 B에 공통적으로 속하는 특허 문건은 없지만(아주 특별한 경우에는 있을 수는 있지만, 대부분의 경우에는 없다), PA와 PB에는 공통적으로 속하는 특허 문건은 존재할 수 있을 것이다. PA와 PB에 공통적으로 속하는 특허 문건을 PAB라고 하자. 즉, PAB에 속하는 특허 문건은 PA나 PB에 당연히 속하게 된다.
상기 A, B, PA, PB, PAB는 특허 집합이며, 적어도 하나 이상의 특허 문건을 포함하고 있을 수 있다.(물론, 공집합일 수도 있으며, 이 경우에는 특허 문건이 없음은 당연할 것이다.) A에 속하는 i번째 특허 문건을 Pi(A)라 표기하자. 이 경우, B, PA, PB, PAB에 속하는 특허 문건은 각각 Pi(B), Pi(PA), Pi(PB), Pi(PAB)가 될 것이다.
Pi 특허 문건에 대응되는 빈도 유지 핵심 키워드 조합 집합 KCS(Pi)={KC1(Pi), KC2(Pi), ..., KCi(Pi), KCj(Pi), ..., KCn(Pi), ..., KCnCr(Pi)}, 특허 분류 조합 집합 CCS(Pi)={CC1(Pi), CC2(Pi), ..., CCi(Pi), CCj(Pi), ..., CCn(Pi), , ..., CCnCr(Pi)}, 인덱스 조합 집합 ICS(Pi)={IC1(Pi), IC2(Pi), ..., ICi(Pi), ICj(Pi), ..., ICn(Pi), , ..., ICnCr(Pi)}이 있는 경우, 적어도 하나 이상의 특허 문건을 원소로 하는 특허 문건 집합에 대하여도 상기와 같은 조합 집합을 생성할 수 있다.
본 발명의 상기 단위 융합 요소 생성부가 상기 특허 문건 집합 단위로 빈도 유지 핵심 키워드 조합 집합, 특허 분류 조합 집합, 인덱스 조합 집합을 생성하는 방법은 2가지가 있다. 첫째는 빈도 무시 조합 집합 구성 방법으로 Pi별 빈도 유지 핵심 키워드 조합 집합, 특허 분류 조합 집합, 인덱스 조합 집합을 단순 합집합 연산을 하는 방식이다. 예를 들어 설명하면, 특허 문건 집합을 구성하는 모든 특허 문건 Pi와 Pj에 대하여, Pi의 빈도 유지 핵심 키워드 조합 집합 KCS(Pi)={KC1(Pi), KC2(Pi), ..., KCi(Pi), KCj(Pi), ..., KCn(Pi), ..., KCnCr(Pi)}와 Pj의 빈도 유지 핵심 키워드 조합 집합 KCS(Pi)={KC1(Pi), KC2(Pi), ..., KCi(Pi), KCj(Pi), ..., KCn(Pi), ..., KCnCr(Pi)}를 합집합 연산을 수행하는 것이다. 집합 단위의 합집합 연산이므로, 중복되는 핵심 키워드 조합은 몇회가 중복되더라도 1회로 취급된다. 이 경우, 10개의 특허 문건에서 동일한 핵심 키워드 조합 (Ki, Kj)가 6회 나왔을 경우에도, 1개처럼 취급된다.
두번째는 빈도 유지 조합 집합 구성 방법으로, Pi별 빈도 유지 핵심 키워드 조합 집합, 특허 분류 조합 집합, 인덱스 조합 집합을 합집합 연산하지만, 내부적으로 조합별 빈도를 저장해 놓는 방식이다. 예를 들어 설명하면, 특정한 KCi가 특정한 특허 문건 집합을 구성하는 특허 문건의 KC(keyword combination)들에서 n회 나온 경우, KCi를 특정짓는 고유 번호(관리 ID)에 회수 n를 대응시켜 놓는 방법이다. 이 경우, 10개의 특허 문건에서 동일한 핵심 키워드 조합 (Ki, Kj)가 6회 나왔을 경우에는 (Ki, Kj):6과 같이 빈도 정보가 유지된다.
A에 속하는 모든 특허 문건을 P(A)(Patent Documents of Set A의 약어 표시로 이해할 수 있을 것이다.)라 하고, A의 i번째 특허 문건을 Pi(A)라 표기하자. 이 경우, Pi(A)에 대응되는 빈도 유지 핵심 키워드 조합 집합 KCS(Pi(A))={KC1(Pi(A)), KC2(Pi(A)), ..., KCi(Pi(A)), KCj(Pi(A)), ..., KCn(Pi(A)), ..., KCnCr(Pi(A))}라 표기될 수 있고, 특허 분류 조합 집합 CCS(Pi(A))={(CC1(Pi(A)), CC2(Pi(A)), ..., CCi(Pi(A)), CCj(Pi(A)), ..., CCn(Pi(A)), , ..., CCnCr(Pi(A))}로 표기될 수 있고, 인덱스 조합 집합 ICS(Pi(A))={(IC1(Pi(A)), IC2(Pi(A)), ..., ICi(Pi(A)), ICj(Pi(A)), ..., ICn(Pi(A)), , ..., ICnCr(Pi(A))}로 표기될 수 있을 것이다. 이러한 표기는 Pi(B), Pi(PA), Pi(PB), Pi(PAB)에서도 마찬가지일 것이다. 괄호 안은 대상이 되는 특정한 특허 문건 집합을 말함을 알 수 있다.
본 발명의 융합 패턴 처리부(940)는 융합 처리 기준 정보부(930)의 융합 처리 기준 정보에 따라, 융합 패턴을 처리한다. 상기 융합 처리 기준 정보는 상기 특허 정보 시스템(10000)이 디폴트로 지정해 놓은 기준일 수도 있지만, 상기 사용자로부터 입수할 수도 있을 것이다. 본 발명의 융합 처리 기준 정보부(930)는 융합 처리 기준 제공부(931)를 통하여 상기 사용자 컴퓨터(100)에 융합 처리 기준을 제공하고, 융합 처리 기준 입수부(932)를 통하여 사용자가 선택하거나 입력한 융합 처리 기준을 입수한다. 이어, 융합 처리 기준 생성부(933)를 통하여 사용자 별로의 융합 처리 기준을 생성하고, 생성된 융합 처리 기준은 융합 처리 기준 정책 DB(934)에 저장된다.
상기 특허 정보 시스템(10000)이 디폴트로 지정해 놓은 융합 처리 기준 중의 일례를 예시적으로 들면서, 상기 융합 패턴 처리부(940)의 정보 처리를 설명한다.
상기 디폴트 융합 처리 기준은 다음과 같은 계열이 있을 수 있으며, 사용자는 하기에서 설명하는 각종 융합 처리 기준을 선택할 수 있음은 물론이며, 상기 특허 정보 시스템(10000)은 상기 선택된 융합 처리 기준을 적용하여 융합 정보를 처리한다. 하기는 상기에서 설명한 빈도 무시 조합 집합 구성 방법이 적용되는 것을 기준으로 설명하며, 빈도 유지 조합 집합 구성 방법이 적용되는 것에 대해서는 후술한다.
첫째는 분할 집합간의 차집합 연산 계열이다. 상기 융합 패턴 처리부(940)는 상기 T에 대한 A와 B에 대한 빈도 유지 핵심 키워드 조합 집합 KCS(Pi(A))와 KCS(Pi(B))를 입수하여, KCS(Pi(A))-KCS(Pi(B))라는 차집합 연산을 수행한다. 상기 KCS(Pi(A))-KCS(Pi(B))에 속하는 핵심 키워드 조합은 KCS(Pi(B))에는 없고, KCS(Pi(A))에만 있는 조합이다. KCS(Pi(A))-KCS(Pi(B))에 속하는 핵심 키워드 조합은 A 집합에만 관련되어 있으며, A 집합에 새롭게 들어온(newly imported)된 핵심 키워드 조합이 된다. 한편, 상기 융합 패턴 처리부(940)는 상기 T에 대한 A와 B에 대한 특허 분류 조합 집합 CCS(Pi(A))와 CCS(Pi(B))를 입수하여, CCS(Pi(A))-CCS(Pi(B))라는 차집합 연산을 수행한다. 상기 CCS(Pi(A))-CCS(Pi(B))에 속하는 특허 분류 조합은 CCS(Pi(B))에는 없고, CCS(Pi(A))에만 있는 조합이다. CCS(Pi(A))-CCS(Pi(B))에 속하는 특허 분류 조합은 A 집합에만 관련되어 있으며, A 집합에 새롭게 들어온(newly imported)된 특허 분류 조합이 된다. 상기 A 집합에 새롭게 들어온(newly imported)된 특허 분류 조합과 같은 집합 연산 결과로 생성되는 (핵심 키워드, 특허 분류, 인덱스 또는 하이브리드)조합 집합이 본 발명의 융합 패턴 분석부(950)의 분석 대상이 된다.(이하, 같다)
상기에서는 T에 대하여 2분할된 특허 집합에 대하여 상기 융합 패턴 처리부(940)의 처리를 설명했는데, 이러한 차집합 연산은 n+1개로 분할된 특허 집합에 대하여도 마찬가지로 적용될 수 있다. T가 A, B1, B2, ...Bn으로 분할 된 경우, 다음과 같은 집합 연산이 예시적으로 가능할 것이다.
1) KCS(Pi(A))-KCS(Pi(B1))... ... KCS(Pi(Bi))-KCS(Pi(B(i+1))), KCS(Pi(Bi))-KCS(Pi(Bj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 빈도 유지 핵심 키워드 조합 집합간의 집합 연산이나,
2) CCS(Pi(A))-CCS(Pi(B1))... ... CCS(Pi(Bi))-CCS(Pi(B(i+1))), CCS(Pi(Bi))-CCS(Pi(Bj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 특허 분류 조합 집합간의 집합 연산이나,
3) 사용자의 선택을 입수 받은 2개 이상의 분할 특허 집합을 합집합 처리한 특허 집합의 빈도 유지 핵심 키워드 조합 집합, 및/또는 특허 분류 조합 집합을 차집합 연산의 연산 단위로 하는 방법이 가능할 것이다.
둘째는 전방 인용 특허 집합간의 차집합 연산 계열이다. 상기 융합 패턴 처리부(940)는 상기 A와 B에 대한 PA와 PB의 빈도 유지 핵심 키워드 조합 집합 KCS(Pi(PA))와 KCS(Pi(PB))를 입수하여, KCS(Pi(PA))-KCS(Pi(PB))라는 차집합 연산을 수행한다. 상기 KCS(Pi(PA))-KCS(Pi(PB))에 속하는 핵심 키워드 조합은 KCS(Pi(PB))에는 없고, KCS(Pi(PA))에만 있는 조합이다. KCS(Pi(PA))-KCS(Pi(PB))에 속하는 핵심 키워드 조합은 PA 집합에만 관련되어 있으며, PA 집합에 새롭게 들어온(newly imported)된 핵심 키워드 조합이 된다. 한편, 상기 융합 패턴 처리부(940)는 상기 A와 B에 대한 PA와 PB의 특허 분류 조합 집합 CCS(Pi(PA))와 CCS(Pi(PB))를 입수하여, CCS(Pi(PA))-CCS(Pi(PB))라는 차집합 연산을 수행한다. 상기 CCS(Pi(PA))-CCS(Pi(PB))에 속하는 특허 분류 조합은 CCS(Pi(PB))에는 없고, CCS(Pi(PA))에만 있는 조합이다. CCS(Pi(PA))-CCS(Pi(PB))에 속하는 특허 분류 조합은 PA 집합에만 관련되어 있으며, PA 집합에 새롭게 들어온(newly imported)된 특허 분류 조합이 된다.
상기에서는 T에 대하여 2분할된 특허 집합에 대한 전방 인용 특허 집합에 대하여 상기 융합 패턴 처리부(940)의 처리를 설명했는데, 이러한 차집합 연산은 n+1개로 분할된 특허 집합에 대하여도 마찬가지로 적용될 수 있다. T가 A, B1, B2, ...Bn으로 분할 된 경우, 이들 각각에 대한 전방 인용 특허 집합은 PA, PB1, PB2, ...PBn가 될 것이며, 다음과 같은 집합 연산이 예시적으로 가능할 것이다. 한편, T의 전방 인용 특허 집합은 PT가 된다.
1) KCS(Pi(PA))-KCS(Pi(PB1))... ... KCS(Pi(PBi))-KCS(Pi(PB(i+1))), KCS(Pi(PBi))-KCS(Pi(PBj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 빈도 유지 핵심 키워드 조합 집합간의 집합 연산이나,
2) CCS(Pi(PA))-CCS(Pi(PB1))... ... CCS(Pi(PBi))-CCS(Pi(PB(i+1))), CCS(Pi(PBi))-CCS(Pi(PBj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 특허 분류 조합 집합간의 집합 연산이나,
3) 사용자의 선택을 입수 받은 2개 이상의 분할 특허 집합을 합집합 처리한 특허 집합의 빈도 유지 핵심 키워드 조합 집합, 및/또는 특허 분류 조합 집합을 차집합 연산의 연산 단위로 하는 방법이 가능할 것이다.
셋째는 분할 집합(경우에 따라서는 모집합)과 전방 인용 특허 집합을 모두 활용한 차집합 연산 계열이다. 상기 융합 패턴 처리부(940)는 KCS(Pi(A)), KCS(Pi(T)), KCS(Pi(PA)), KCS(Pi(PT)), KCS(Pi(PAB)) 와 KCS(Pi(PB))를 입수하여, KCS(Pi(A))-KCS(Pi(PA)), KCS(Pi(A))-KCS(Pi(PT)), KCS(Pi(A))-KCS(Pi(B))-KCS(Pi(PT)), KCS(Pi(PA))-KCS(Pi(A)), KCS(Pi(PA))-KCS(Pi(T)), KCS(Pi(A))-KCS(Pi(PT)), KCS(Pi(PAB))-KCS(Pi(A)) 중 어느 하나 이상의 차집합 연산을 수행한다. 한편, 상기 융합 패턴 처리부(940)는 상기 융합 패턴 처리부(940)는 CCS(Pi(A)), CCS(Pi(T)), CCS(Pi(PA)), CCS(Pi(PT)), CCS(Pi(PAB))와 CCS(Pi(PB))를 입수하여, CCS(Pi(A))-CCS(Pi(PA)), CCS(Pi(A))-CCS(Pi(PT)), CCS(Pi(A))-CCS(Pi(B))-CCS(Pi(PT)), CCS(Pi(PA))-CCS(Pi(A)), CCS(Pi(PA))-CCS(Pi(T)), CCS(Pi(A))-CCS(Pi(PT)), CCS(Pi(PAB))-CCS(Pi(A)) 중 어느 하나 이상의 차집합 연산을 수행한다.
상기에서는 T에 대하여 2분할된 특허 집합에 대한 전방 인용 특허 집합에 대하여 상기 융합 패턴 처리부(940)의 처리를 설명했는데, 이러한 차집합 연산은 n+1개로 분할된 특허 집합에 대하여도 마찬가지로 적용될 수 있다. T가 A, B1, B2, ...Bn으로 분할 된 경우, 이들 각각에 대한 전방 인용 특허 집합은 A, PA1, PA2, ...PAn가 될 것이며, 다음과 같은 집합 연산이 예시적으로 가능할 것이다.
1) KCS(Pi(A))-KCS(Pi(PA1))... ... KCS(Pi(PAi))-KCS(Pi(PA(i+1))), KCS(Pi(PAi))-KCS(Pi(PAj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 빈도 유지 핵심 키워드 조합 집합간의 집합 연산이나,
2) CCS(Pi(A))-CCS(Pi(PA1))... ... CCS(Pi(PAi))-CCS(Pi(PA(i+1))), CCS(Pi(PAi))-CCS(Pi(PAj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 특허 분류 조합 집합간의 집합 연산이나,
3) KCS(Pi(PA))-KCS(Pi(A1))... ... KCS(Pi(Ai))-KCS(Pi(A(i+1))), KCS(Pi(Ai))-KCS(Pi(Aj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 빈도 유지 핵심 키워드 조합 집합간의 집합 연산이나,
4) CCS(Pi(PA))-CCS(Pi(A1))... ... CCS(Pi(Ai))-CCS(Pi(A(i+1))), CCS(Pi(Ai))-CCS(Pi(Aj)), , 등과 같이 인접하거나, 분할 처리 기준별로 나뉘어진 분할 특허 집합간의 특허 분류 조합 집합간의 집합 연산이나,
5) 사용자의 선택을 입수 받은 2개 이상의 분할 특허 집합을 합집합 처리한 특허 집합의 빈도 유지 핵심 키워드 조합 집합, 및/또는 특허 분류 조합 집합을 차집합 연산의 연산 단위로 하는 방법이 가능할 것이다.
상기 본 발명의 융합 패턴 처리부가 생성하는 차집합 연산 결과는 기설정된 융합 처리 기준의 일례인 비교 대상인 특허 문건 집합에 대하여 관심 특허 문건 집합에 newly imported되었음을 충족하는 핵심 키워드 조합, 특허 분류 조합, 인덱스 조합의 선별 처리 결과일 수 있다.
이어, 상기 빈도 유지 조합 집합 구성 방법에 대한 상기 융합 패턴 처리부(940)의 정보 처리 방법에 대해 설명한다.
우선 2 분할 집합간의 빈도 유지 차집합 연산에 대해 먼저 설명한다. 빈도 유지 차집합 연산이라는 발명 사상을 핵심 키워드 조합 차집합 연산을 예로 들어 설명한다. 본 방식은 특정한 특허 문건 집합(예를 들면 상기 A)에서 특정한 핵심 키워드 조합 상기 (Ki,Kj)의 빈도 정보 n이 상기 (Ki,Kj):n으로 유지되고 있다. 이 경우, 상기 B 집합에서도 상기 (Ki,Kj)가 있을 경우, 차집합 연산이 A-B로 특정되는 경우, 상기 (Ki,Kj)에 대한 상기 빈도 유지 핵심 키워드 차집합 연산 결과는 상기 (Ki,Kj):(n-m)이 된다. 빈도 무시 핵심 키워드 차집합 연산의 경우, 상기 (Ki,Kj)는 A와 B 모두에 나온 핵심 키워드 조합이 되므로, 상기 (Ki,Kj)는 상기 차집합 연산 결과에 포함되지 않는다. 반면, 상기 빈도 유지 핵심 키워드 연산의 경우라면, 상기 n와 m의 관계에 따라서, 핵심 키워드 차집합 연산 결과에 상기 (Ki,Kj)의 포함 여부가 결정된다. 상기 n과 m의 관계는 본 발명의 융합 처리 기준 정보부(930)가 관리한다.
상기 n과 m의 관계의 예시는 1) n-m이 기설정된 수치값 이상인 경우, 2)n-m이 기설정된 수치값 이상이고, m이 기설정된 수치값 이하일 때, 3) 상기 n과 m을 변수로 하는 함수 f(n,m)이 기설정된 조건을 충족하는 경우, 4) 상기 함수 f(n,m)이 기설정된 조건을 충족하고, 상기 n 또는 m도 기설정된 조건을 충족하는 경우 등이 있을 수 있다. 구체적인 수치를 예로 들어 설명하면, 상기 1)은 상기 n과 m이 100과 3과 같이 차이가 단순히 클 경우에는 잘 적용되는 장점이 있다. 하지만, 상기 1)은 상기 n과 m이 100과 30인 경우와 50과 1인 경우를 비교할 때, 후자가 융합 처리 기준에 더 부합함에도, 차이값은 전자가 더 크게 되는 문제가 있다.(A와 B 양자에 모두 많은 것은 newly imported 속성을 가지지 못한다.) 따라서 이 경우에는 2)의 방법이 타당하다. 2)의 방법의 예시는 빈도의 차이가 10 이상 나되, m은 2를 초과할 수 없다는 등이 될 수 있다. 한편, 상기에서 A의 크기(A에 속하는 특허 문건의 개수)가 작고, B의 크기가 큰 경우와 같이 n이 상대적으로 작은 값을 가지는 경우 등에서는 n에는 제곱 처리를 하는 등과 같이 n,m에 함수 처리를 하여, 빈도 유지 차집합 연산을 수행할 수 있을 것이다.
상기에서는 T를 A와 B의 2분할을 기준으로 설명했지만, 상기 본 발명의 사상은 상기 T가 A, B1, B2, ...Bn으로 분할 된 경우에서도 마찬가지로 적용될 수 있음은 상기 빈도 무시 조합 집합 구성 시의 차집합 연산에서 설명한 바를 토대로 당업자에게 자명할 것이다.
한편, 상기 집합이 2분할이 아닌 n+1 분할이 되는 경우, 상기 각 분할 특허 문건 집합별 상기 (Ki,Kj)의 빈도 f1,...f(n+1)이 있는 경우, 상기 f1 ~ f(n+1)에 대하여 증감/변화, 증감/변화의 증감/변화를 계산한다. 상기 (Ki,Kj)의 상기 증감/변화가 기설정된 조건을 충족하는 경우에는 상기 빈도 유지 핵심 키워드 차집합 연산 결과에 상기 (Ki,Kj)를 포함시킬 수 있을 것이며, 상기 기설정된 조건은 상기 융합 처리 기준 정보부(930)가 관리한다.
한편, 본 발명 사상은 핵심 키워드 조합에 관한 전방 인용 특허 집합간의 빈도 유지 차집합 연산에서도 적용될 수 있으며, 분할 집합(경우에 따라서는 모집합)과 전방 인용 특허 집합을 모두 활용한 빈도 유지 차집합 연산에서도 적용할 수 있음은 당업자에게 자명할 것이다. 그리고, 상기 빈도 유지 차집합 연산 방식은 핵심 키워드 조합에 대해서 설명했지만, 본 발명 사상은 특허 분류 조합, 인덱스 조합에서도 마찬가지로 적용될 수 있음은 당업자게에 자명할 것이다. 즉, 특허 분류 조합, 인덱스 조합에 대해서도 1) n+1개의 분할 집합 대상 처리, 2) 전방 인용 특허 집합을 처리 대상으로 한 처리 등에도 상기에서 설명한 빈도 유지 차집합 연산 방식이라는 본 발명 사상이 대등하게 적용될 수 있을 것이다.
상기 본 발명의 융합 패턴 처리부가 생성하는 차집합 연산 결과는 1) 핵심 키워드 조합 차집합, 2) 특허 분류 조합 차집합, 3) 인덱스 조합 집합 차집합이 되며, 이들 각 차집합(Subtraction Set)은 KCSS(Keyword Combination Subtraction Set), CCSS(Classification Combination Subtraction Set), ICSS(Index Combination Subtraction Set)가 된다. 표기상 상기 KCS(Pi(PA))-KCS(Pi(PB))에 속하는 핵심 키워드 조합 차집합은 KCSS(PA-PB)(KCSS of Patent Document Set A and Patent Document Set B)라 표기한다. 상기 KCSS, CCSS, ICSS에는 빈도 무시 방식이 적용된 경우와 빈도 유지 방식이 적용된 경우 중에서 선택되는 어느 하나 이상으로 구성될 수 있다.
이어, 본 발명의 융합 패턴 분석부(950)는 상기 융합 패턴 처리부(940)가 생성한 본 발명의 각종 차집합 연산 결과를 포함하는 각종 집합 연산 결과를 분석한다. 상기 융합 패턴 분석부(950)는 상기 차집합 연산 결과 집합에 대한 기설정된 분석 정보를 생성해 낸다.
상기 융합 패턴 분석부(950)는 상기 KCSS, CCSS, ICSS를 구성하는 모든 조합 차집합 CSS(Combination Subtraction Set)를 대상으로, 기설정된 분석을 수행할 수 있을 것이다. 상기 기 설정된 분석에 대한 예시는 다음과 같을 것이다. 핵심 키워드, 특허 분류 및/또는 인덱스에 대하여 분설한다.
상기 융합 패턴 분석부(950)는 특정한 KCSS가 있을 때 하기 1) 내지 6)과 같은 분석 정보를 생성할 수 있으며, 이러한 방식은 CCSS, ICSS에 대해서도 마찬가지로 적용될 수 있음은 물론이다 할 것이다.
1) 상기 KCSS 대한 네트워크 분석으로, 상기 융합 패턴 분석부(950)는 상기 KCSS의 원소인 핵심 키워드 조합을 구성하는 개별 핵심 키워드간의 네트워크 관계를 분석한다. 상기 네트워크 관계는 모든 KCSS를 구성하는 핵심 키워드 조합 (Ki, Kj)에 대한 네트워크 분석 기술 분야에서 당업자간에 알려진 임의의 네트워크 분석이 적용된다. 상기 네트워크 분석으로 핵심 키워드 네트워크에서 허브 핵심 키워드를 발견할 수 있을 것이다. 상기 허브 핵심 키워드는 네트워크 가지(branch)가 가장 많거나, 기설정된 개수, 백분위수 이상되는 핵심 키워드 Ki를 말한다.
2) 네트워크 분석의 시각화로, 상기 융합 패턴 분석부(950)는 KCSS의 핵심 키워드 조합 (Ki, Kj))의 Ki와 Kj 사이에서 연결선을 그려 주는 방식으로 시각화될 수 있다. 상기 선은 기설정된 가지 이상을 가지는 핵심 키워드들에 대해서만 한정하여 그려 줄 수도 있을 것이며, 이는 네트워크 분석 시각화 기술 분야의 당업자들 사이에서 자명한 기술이다.
3) 상기에서 허브 핵심 키워드가 있을 경우, 상기 네트워브 분석 시각화의 일례로, 상기 허브 키워드 Ki를 대상으로 1)상기 KCSS에서의 상기 Ki와 연관되는 핵심 키워드 네트워크 다이어그램과, 2) 상기 차집합의 대상이 되는 비교 대상 집합(예를 들어, A-B인 경우, B)을 기준으로 상기 Ki와 연관되는 핵심 키워드 네트워크 다이어그램을 대비하여 보여 줄 수 있다. 이 경우, 상기 분할 집합별로 상기 핵심 키워드 Ki와 잘 연관되는 핵심 키워드의 변천/변화/차이를 대비시켜 보여 줄 수 있는 장점이 있다.
4) 상기 KCSS를 구성하는 핵심 키워드 조합 (Ki, Kj)에 대하여, 상기 Ki와 상기 Kj를 하나의 특허 문건 Pi에서 공통적으로 포함하고 있는 특허 문건을 질의하는 등의 방식으로 상기 (Ki, Kj)에 상기 (Ki, Kj)를 핵심 키워드 조합으로 하고 있는 특허 문건 집합을 대응시킬 수 있다. 상기 대응은 상기 사용자가 상기 상기 (Ki, Kj)에 클릭하는 등의 행위를 한 경우, 검색/질의 결과로 대응되는 특허 문건 집합의 특허 문건 리스트, 서지 사항, 전문 등을 제공해 줄 수 있을 것이다. 한편, 상기 상기 (Ki, Kj)의 연관 관계가 네트워크 다이어그램 상에서 표시되어 있는 경우(예를 들어 선으로 연관 관계가 표시되는 경우 등), 상기 연관 관계의 표시 주위에 상기 (Ki, Kj)를 핵심 키워드 조합으로 포함하는 특허 문건의 수치를 표시해 줄 수 있을 것이다. 이 경우, 상기 사용자가 상기 수치에 클릭하는 경우, 관련되는 특허 문건 리스트, 서지 사항, 전문 등을 제공해 줄 수 있을 것이다.
한편, 상기 빈도 유지 조합 집합 구성 방법이 사용되는 경우, 상기 융합 패턴 분석부(950)는 최빈 핵심 키워드 조합의 추출로 상기 융합 패턴 분석부(950)는 KCSS의 원소인 상기 (Ki,Kj) 중에서 빈도순이 가장 큰 것을 빈도순으로 추출할 수 있을 것이다. 빈도 무시의 경우에는 KCSS를 구성하는 상기 (Ki,Kj)의 빈도는 1이 된다. 한편, 상기 전술한 빈도 무시 방식의 상기 1) 내지 4)는 빈도 유지 방식에도 그대로 적용될 수 있음은 물론이다 할 것이다.
한편, 상기 융합 패턴 분석부(950)는 6) 상기 (Ki,Kj)별에 대한 시계열 분석, 최빈 핵심 키워드 조합별에 대한 출원인 분석, 발명자 분석, 특허 분류 분석을 수행한다. 상기 융합 패턴 분석부(950)는 상기 최빈 핵심 키워드 조합과 관련된 특허 문건 집합을 입수하고(입수 방식은 예시적으로 상기 Ki와 상기 Kj를 핵심 키워드로 동시에 포함하고 있는 특허 문건 집합을 질의/검색하는 것으로 입수할 수 있다.), 상기 특허 문건 집합의 각종 서지 사항(출원인, 발명자, 시간, 특허 분류 등) 중 선택되는 어느 하나 이상을 기준으로 한 분석 정보를 생성한다.
상기 융합 패턴 분석부(950)는 상기 CCSS의 원소인 특허 분류 조합(Ci,Cj)들을 핵심 키워드 조합 (Ki,Kj)처럼 취급하여 특허 분류 조합을 중심으로 상기 1) ~ 6)과 같은 기 설정된 분석을 수행할 수 있을 것이다. 이어, 상기 CCSS에 대해 상기 KCSS와 차이가 나는 특이한 부분을 중심으로 상기 융합 패턴 분석부(950)의 정보 처리를 설명한다.
1) 최빈 특허 분류 조합의 추출로 상기 융합 패턴 분석부(950)는 CCSS의 원소인 (Ci,Cj) 중에서 빈도순이 가장 큰 것을 빈도순으로 추출한다. 이때, 상기 (Ci,Cj)는 특허 분류의 여러 깊이(예를 들면 1 dot 서브그룹)별로 CC를 추출할 수 있다. 만약, 1 dot 서브그룹별로 CC를 추출할 때, 특정 Ci가 3 dot 서브그룹일 경우, 상기 Ci를 특허 분류 체계를 참조하여, 상기 3 dot 서브그룹의 Parent의 Parent(=Grandparent)인 1 dot 서브그룹을 입수하여 1 dot 서브그룹으로 모든 CC를 변환한 다음에 최빈 특허 분류 조합을 추출할 수 있다. 상기 특허 분류의 깊이는 상기 사용자로부터 선택으로 입수받거나, 상기 특허 정보 시스템(10000)에 의해 디폴트로 설정될 수 있다. 본 문단에서 설명한 특허 분류의 깊이가 설정될 때, 특정 특허 분류가 설정된 특허 분류의 깊이 이하의 하위 특허 분류인 경우, 상기 하위 특허 분류를 기 설정된 깊이의 상위 특허 분류로 변환하고, 변환된 상위 특허 분류로 통계 처리 내지 정보 처리하는 방법은 본 발명에서 공통적으로 적용된다.
2) 최빈 특허 분류 조합에 대한 분석으로 상기 융합 패턴 분석부(950)는 최빈 특허 분류 조합별에 대한 시계열 분석, 최빈 특허 분류 조합별에 대한 출원인 분석, 발명자 분석, 특허 분류 분석을 수행한다. 상기 융합 패턴 분석부(950)는 상기 최빈 특허 분류 조합과 관련된 특허 문건 집합을 입수하고, 상기 특허 문건 집합의 각종 서지 사항(출원인, 발명자, 시간, 특허 분류 등) 중 선택되는 어느 하나 이상을 기준으로 한 통계 정보를 생성한다. 이때, 상기 융합 패턴 분석부(950)는 특허 분류의 깊이가 설정된 경우에는 위 문단에서 설명한 바의 처리를 수행한다.
3) 상기 CCSS 대한 네트워크 분석으로, 상기 융합 패턴 분석부(950)는 상기 CCSS의 원소인 특허 분류 조합을 구성하는 개별 특허 분류간의 네트워크 관계를 분석한다. 상기 네트워크 관계는 SS에 관계되는 모든 CCSS의 특허 분류 조합 (Ci, Cj)에 대한 네트워크 분석 기술 분야의 임의의 네트워크 분석이 적용된다. 이때, 상기 융합 패턴 분석부(950)는 특허 분류의 깊이가 설정된 경우에는 상기에서 설명한 바의 처리를 수행한다. 즉, 1 dot 서브 그룹으로 설정된 경우라면, 모든 Ci, Cj 중 2 dot 서브 그룹 이하의 하위 특허 분류는 특허 분류 체계를 참조하여 1 dot 서브 그룹의 상위 특허 분류로 변환하고, 변환된 상위 특허 분류로 (Ci, Cj)에 대한 네트워크 분석을 수행한다.
4) 네트워크 분석의 시각화로, 상기 융합 패턴 분석부(950)는 SS에 관계되는 모든 CCSS의 특허 분류 조합 (Ci, Cj)의 Ci와 Cj 사이에서 연결선을 그려 주는 방식으로 시각화될 수 있다. 상기 시각화 또는 네트워크 분석으로 가장 많은 가지(branch)를 갖는 Ci를 찾을 수 있게 된다. 이때, 상기 융합 패턴 분석부(950)는 특허 분류의 깊이가 설정된 경우에는 상기에서 설명한 바의 처리를 수행한다. 즉, 1 dot 서브 그룹으로 설정된 경우라면, 모든 Ci, Cj 중 2 dot 서브 그룹 이하의 하위 특허 분류는 특허 분류 체계를 참조하여 1 dot 서브 그룹의 상위 특허 분류로 변환하고, 변환된 상위 특허 분류로 (Ci, Cj)에 대한 네트워크 분석의 시각화를 수행한다.
상기 융합 패턴의 시각화는 본 발명의 융합 패턴 시각화부(951)에서 수행한다. 상기 융합 패턴 분석부(950)는 융합 패턴 UI부(952)(User Interface부)를 더 포함하고 있을 수 있다. 상기 융합 패턴 UI부(952)에는 다음과 같은 기능을 더 포함되어 있을 수 있다.
첫째, 상기 분할 집합에 대한 한정 기능이다. 상기 한정은 상기 1) 검색 엔진으로의 검색어 입력 또는 2) 특허 DB(112)를 구성하는 필드를 활용하는 쿼리의 입력, 3) 상기 검색어 또는 상기 쿼리에 대응되는 특허 정보 추출 조건의 입력이나 선택 등으로 생성될 수 있다. 상기 특허 정보 추출 조건은 상기 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, (특허 주제 분류 및 기 설정된 분류 속성 등이 있다면, 이들 중 어느 하나 이상) 중 어느 하나 또는 어느 2 이상의 조합으로 생성되는 것인 것이며, 상기 시간 범위의 기준이 되는 시간은 상기 특허 문건의 우선일, 출원일, 공개일 및 등록일 중 어느 하나 또는 어느 2 이상의 조합을 사용하는 것이며, 상기 특허 분류는 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 또는 어느 2 이상의 조합인 것이며, 상기 특허 주제 분류는 상기 IPC의 catchword, 상기 USPC의 catchword 또는 상기 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 이상을 사용하여 생성되는 주제 분류 중 어느 하나 이상인 것이며, 상기 기 설정된 분류 속성은 상기 출원인이나 상기 권리자나 상기 양수인에 대한 분류 속성, 상기 특허 분류를 구성하는 특허 분류별 분류 속성, 상기 발명자에 대한 분류 속성, 또는 상기 특허 주제 분류별 분류 속성 중 어느 하나 이상이 될 수 있다. 예를 들어, 출원인에 대하여 기업, 대학, 연구 기관, 개인 등의 구분이 있을 때, 대학 속성을 가지는 출원인만으로 한정 지을 수 있을 것이며, 특정 기간 동안 특정 개수 이상의 출원/등록된 특허를 가지는 출원인(다출원인)만으로 한정 지을 수도 있을 것이다. 이때, 상기 융합 패턴 분석부(950)는 상기 한정이 이루어진 분할 집합 집합을 대상으로 기 설정된 융합 정보 처리를 수행한다. 한편, 상기 (Ki,Kj), (Ci,Cj), (Ii,Ij) 등에는 특허 문건 집합을 대응(검색/질의 등의 방법으로 상기에서 설명하였다)시킬 수 있으므로, 분할 집합에 대한 한정을 수행하는 것과 같은 한정을 상기 KCSS, CCSS, ICSS에 대해서도 수행할 수 있다. 상기 한정이 수행되면 1) 한정과 관련된 특허 집합에만 관련되는 상기 (Ki,Kj), (Ci,Cj), (Ii,Ij)만 남거나 또는 제거 될 수 있거나(특히, 빈도 무시 방식의 경우), 2) 상기 한정과 관련된 특허 집합에 관련되는 (Ki,Kj), (Ci,Cj), (Ii,Ij)의 빈도값을 차감하여 분석 정보가 생성되거나(특히, 빈도 유지 방식의 경우), 3) 상기 한정과 관련된 특허 집합에 관련되는 상기 (Ki,Kj), (Ci,Cj), (Ii,Ij)만드로 분석 정보가 생성(특히, 빈도 유지 방식의 경우)될 수 있을 것이다.
둘째는 수량 정보 처리 기능이다. 상기 핵심 키워드 Ki 노드 각각에 Ki의 빈도수 정보가 표시되거나, Ki와 Kj를 연결하는 선에 (Ki,Kj)의 빈도수가 표시될 수 있다. 상기 빈도수에 사용자가 클릭하는 경우에는 상기 Ki와 Kj를 핵심 키워드로 하는 특허 문건 집합에 대한 정보(특허 문건 리스트, 서지 사항, 전문 정보 등)이 상기 사용자 컴퓨터(100)에 제공되거나, 상기 사용자가 상기 (Ki,Kj)의 빈도수에 클릭하는 경우, 상기 사용자 컴퓨터(100)에, 핵심 키워드로 Ki와 Kj를 모두 포함하고 있는 특허 문건 집합에 대한 정보를 제공해 줄 수 있다. 상기 키워드에 대한 본 문단의 처리는 특허 분류에 대한 처리에도 동등하게 적용된다. 한편, 상기 사용자의 선택에 따라, Ci 또는 (Ci,Cj)에 관한 특허 문건 집합에 대한 정보를 제공할 때, 상기 Ci, Cj의 특허 분류 체계상의 기 설정된 깊이의 상위 특허 분류에 관련된 특허 문건 집합을 선택적으로 제공해 줄 수 있다.
셋째, 라벨링 표시 처리 기능이다. 라벨링 표시 처리는 출원인, 발명자, 시간 표시 등 기타 라벨링 처리 대상별로 다른 표시(예를 들면, 칼라, 무늬, 선모양 등)를 하여 처리하는 것을 말한다.
넷째, 필터링 비교 처리 기능이다. 상기 필터링 비교 처리는 상기 분할 집합 또는 상기 (Ki,Kj), (Ci,Cj), (Ii,Ij) 중 삼성전자와 LG전자의 특허 문건만을 대상으로 비교하여 볼 수 있도록 처리하는 것을 말한다. 상기 필터링 비교 처리가 상기 라벨링 표시 처리와 결합하면, 삼성전자와 관련된 (Ki,Kj)들에는 청색, LG전자와 관련된 (Ki,Kj)들은 붉은색으로, 공통된 (Ki,Kj)들에는 보라색으로 비교 표시할 수 있을 것이다. 이는 특허 분류에 대해서도 마찬가지이다.
다섯째, 특허 분류 표시의 인덱스 표시로의 변환 표시 기능이다. 특허 분류는 인덱스와 1:1로 대응되어 있거나, 1:n으로 대응되어 있다. 따라서, 특허 분류가 표시되는 곳에, 상기 사용자의 인덱스 표시 선택에 따라, 상기 특허 분류에 대응되는 적어도 하나 이상의 인덱스를 표시할 수 있다.
여섯째, 특허 분류 표시의 타이틀 정보 표시로의 변환 표시 기능이다. 특허 분류는 코드 체계로 되어 있어, 특정 코드가 무엇을 의미하는 지는 그 코드의 타이틀 정보를 기억하고 있지 않는 한 알 수 없게 된다. 그러므로, 특허 분류가 시각적으로 나타날 때마다 상기 특허 분류에 대한 타이틀 정보가 제공될 필요가 있을 것이다. 타이틀 정보가 나타나는 방식은 1)사용자의 요청이나 인터액션(interaction, 예를 들면 특허 분류에 마우스 등의 포인팅 디바이스의 포인터를 위치시키는 등)이 있을 경우, 2) 특허 분류와 타이틀 정보를 함께 제공하는 경우, 3) 타이틀 정보를 우선하여 제공하는 경우 등이 있다. 한편, 특정 특허 분류 Ci가 있을 때, 상기 타이틀 정보의 제공은 1) Ci의 타이틀 정보만을 제공하는 경우, 2) Ci의 타이틀 정보 외에, 상기 Ci의 기 설정된 상위 분류(예를 들면 IPC의 메인그룹 등) 및/또는 상기 상위 분류까지의 타이틀 정보를 함께 제공하는 경우, 3) 상기 Ci의 타이틀 정보 외에, Ci의 기 설정된 상위 분류(예를 들면 직상위 특허 분류) 및/또는 그 특허 분류의 타이틀 정보)와 Ci의 기 설정된 하위 특허 분류(예를 들면 직하위 특허 분류 및/또는 상기 직하위 특허 분류의 타이틀들까지만)를 제공하는 경우 등이 있을 수 있다.
이어, 본 발명의 융합 패턴 리포트 생성부(953)에 대해 설명한다. 상기 융합 패턴 리포트 생성부(953)는 상기 융합 패턴 시각화부(951) 또는 상기 융합 패턴 UI부(952)가 생성하는 정보 중에서 사용자의 선택 또는 상기 특허 정보 시스템(10000)의 디폴트 선택값에 따라 기설정된 리포트 형식의 융합 패턴 리포트를 생성한다. 리포팅 도구는 crystal report, oz report 등 다양한 리포팅 도구를 선택적으로 활용할 수도 있음은 물론일 것이다. 리포트의 생성은 당업자에게 용이한 기술이므로, 상세한 설명은 생략한다. 상기 융합 패턴 리포트는 사용자의 선택 또는 상기 특허 정보 시스템(10000)의 명령을 기준으로 융합 패턴 정보 배치 생성부(960)의 제어 하에, 기설정된 특허 분류별, 기설정된 출원인별, 기설정된 발명자별 등배치 작업으로도 생성될 수 있다.
이어, 본 발명의 융합 패턴 정보 배치 생성부(960)에 대해서 설명한다. 융합 패턴 정보의 배치 생성은 기 설정된 융합 정보 처리를 배치 작업으로 수행한다는 것을 말한다. 배치 작업으로 수행하기 위해서는 사전에 1) 배치 작업 대상이 되는 구분된 모집합의 선정, 2) 융합 정보 처리를 위한 조건(집합 분할 처리 기준, 융합 처리 기준, 융합 패턴(핵심 키워드 융합, 특허 분류 융합, 하이브리드 융합 등), 융합 패턴 분석(시각화 포함 등))에 대한 설정값이 필요할 것이다. 상기 구분된 모집합의 일례는 특허 분류 체계 상의 기 설정된 깊이(예를 들면 서브 클래스 등) 이하의 모든 특허 분류에 대응되는 특허 문건으로 구성되는 특허 문건 집합을 들 수 있을 것이다. 특허 분류에는 IPC, USPC, FT, FI, ECLA 중 어느 하나 이상을 포함함은 당연할 것이다. 이때, 특허 문건 집합을 구성할 때, 하위 특허 분류 기호 자동 포함 사상이 적용될 수 있을 것이다. 예를 들어, 특정 특허 분류의 특허 문건을 특허 DB(112)로부터 추출해 올 때, 상기 특허 분류가 포함된 특허 분류 체계 상의 모든 하위 특허 분류를 포함하고 있는 특허 문건을 추출해 오는 것을 말한다. 이는 특허 분류의 표기의 문제로, IPC의 경우 1 dot 서브 그룹 이하에서는 확장자 검색 등의 방법을 통하여 1 dot 서브 그룹의 하위에 있는 2 dot 서브 그룹에 대응되는 특허를 추출해 오지 못하는 문제가 있다.
이어, 본 발명의 도 38 내지 도 41을 참조하면서 본 발명의 상기 특허 정보 시스템(10000)의 정보 처리 방법에 대해서 더욱 더 상세하게 설명한다. 도 38은 도 33의 단순 2분할 모델이나 도 34의 복합 분할 모델과 관련이 있는 특허 정보 시스템(10000)의 정보 처리 방법이다. 특허 정보 시스템(10000)에서, 상기 특허 정보 시스템(10000)은 (A) 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성(SF11)한다. 상기 생성되거나 입수 받은 특허 집합은 상기에서 설명한 융합 처리 모집합이 된다. 상기 생성은 본 발명의 융합 처리 대상 집합 생성부(920)를 통해서, 상기 특허 정보 시스템(10000)이 기 설정된 설정 규칙에 의해 생성되거나, 사용자의 검색식이나 쿼리의 입력, 특허 DB(112)에서 특허 정보 추출 조건의 입력 등으로 생성될 수 있을 것이다. 한편, 본 발명의 지정 집합 입수부를 통하여, 상기 특허 정보 시스템(10000)의 상기 사용자로부터 외부 파일 업로드나 상기 사용자가 관리하고 있는 특허 문건 집합을 입수 받거나, 상기 특허 정보 추출 조건을 입수 받는 방식(기 설정된 추출 조건이 내장되어 있는 객체(링크 등)에 대한 클릭 등도 포함된다.)으로 특허 집합을 입수 받을 수 있다.
이어, 상기 특허 정보 시스템(10000)은 (B) 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함되는 특허 문건에서 상기 특허 문건에 대응되는 기 설정된 단위 융합 요소를 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로 생성(SF12)한다. 상기 단위 융합 요소는 특허 분류 조합, 인덱스 조합 및 핵심 키워드 조합 중에서 선택되는 어느 하나 이상으로 구성되는 것이 바람직하다. 상기 생성되는 단위 융합 요소는 집합을 이룸은 당연할 것이며, 이들 집합은 특허 분류 조합 집합, 인덱스 조합 집합, 핵심 키워드 조합 집합 등이 그 일례가 된다.
이어, 상기 특허 정보 시스템(10000)은 (C) 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로 생성된 상기 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별(SF13)한다. 기 설정된 융합 처리 기준의 일례는 상기 제1 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제2 분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다. 기 설정된 융합 처리 기준의 다른 일례는 상기 제i 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제i+1 분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다.
도 39은 도 35 내지 도 36의 전방 인용 모델 내지는 복합 인용 분할 모델과 관련이 있는 상기 특허 정보 시스템(10000)의 정보 처리 방법이다. 상기 특허 정보 시스템(10000)은 (D) 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성(SF21)한다.
이어, 상기 특허 정보 시스템(10000)은 (E) 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합 및 적어도 하나 이상의 제2 인용 분할 특허 집합을 생성(SF22)한다. 상기 인용 분할 특허 집합을 생성할 때, 다음과 같은 2가지가 고려될 수 있을 것이다.
첫째는 인용의 깊이(depth) 내지는 인용 단계의 문제이다. 인용 깊이(=인용 단계)란 자기 특허 문건(self patent)에 n개의 인용 특허 문건(parent patents)에 대한 정보가 포함되어 있을 때 상기 n개의 인용 특허 문건들은 인용 깊이 1이 되고, 상기 n개의 인용 특허 문건 ni마다에 상기 ni 특허 문건에 포함된 인용 특허 문건(grand parent patents)들은 인용 깊이 2가 된다. 인용 깊이가 클수록 관련성이 인용 특허 집합의 크기는 커지나, 관련성이 약한 특허가 다수 포함될 가능성이 더 높아진다. 상기 인용 깊이는 상기 융합 처리 기준 정보부(930)에서 처리하며, 사용자의 선택 또는 상기 특허 정보 시스템(10000)의 디폴트값으로 결정된다. 디폴트 값은 1내지 2가 바람직하며, 1이 더욱 바람직하다.
둘째는 잠재(latent) 인용 특허의 포함 여부이다. 잠재 인용이란 자기 특허 문건에는 인용되어 있지 않지만, 자기 특허 문건이 인용하는 특허 문건을 인용하는 자기 특허 문건보다 후출원 특허 문건이 인용하는 특허 문건 중 자기 특허 문건보다 출원일이 빠른 특허 문건들로 이루어진 특허 문건 집합을 말한다. 상기 잠재 인용 특허는 1) 자기 특허 문건의 인용 특허 문건 입수, 2) 상기 인용 특허 문건의 상기 자기 특허 문건 기준 후출원 피인용 특허 문건 입수, 3) 상기 피인용 특허 문건의 상기 자기 특허 문건 기준 선출원 인용 특허 문건 입수, 4) 3)에서 입수한 특허 문건 중 1)에 포함된 특허 문건 제거를 통해서 특정된다. 이때, 상기 분할 특허 집합의 상기 잠재 인용 특허를 구할 때, 상기 분할 특허 집합에 있는 개별 특허 문건별로 상기 1) 내지 4)의 과정을 거쳐야 한다. 즉, 개별 특허 문건 단위로 상기 1) 내지 4)를 처리하며, 집합 단위로 상기 1) 내지 4)를 처리하면 안 된다. 상기 잠재 인용 특허 포함 여부는 상기 융합 처리 기준 정보부(930)에서 처리하며, 사용자의 선택 또는 상기 특허 정보 시스템(10000)의 디폴트값으로 결정된다. 디폴트 값은 비포함인 것으로 할 수 있다.
이어, 상기 특허 정보 시스템(10000)은 (F) 상기 제1 인용 분할 특허 집합 및 상기 제2 인용 분할 특허 집합에 포함되는 특허 문건에서 상기 특허 문건에 대응되는 기 설정된 단위 융합 요소를 상기 제1 인용 분할 특허 집합 및 상기 제2 인용 분할 특허 집합별로 생성(SF23)하며, (G) 상기 제1 인용 분할 특허 집합 및 상기 제2 인용 분할 특허 집합별로 생성된 상기 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별(SF24)한다. 상기 분할 집합별로의 정보 처리는 상기 인용 분할 특허 집합별 정보 처리에도 그대로 활용된다.
상기 기 설정된 융합 처리 기준의 일례는 상기 제1 인용 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제2 인용 분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다. 기 설정된 융합 처리 기준의 다른 일례는 상기 제i 인용 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제i+1 인용 분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다.
이어, 도 40를 참조하면서 상기 특허 정보 시스템(10000)의 정보 처리 방법을 설명한다. 상기 특허 정보 시스템(10000)은 (H) 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성(SF31)하고, (I) 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합 및 적어도 하나 이상의 제2 인용 분할 특허 집합을 생성(SF32)하며, (J) 상기 제1 분할 특허 집합 및 상기 제1 인용 분할 특허 집합에 포함되는 특허 문건에서 상기 특허 문건에 대응되는 기 설정된 단위 융합 요소를 상기 제1 분할 특허 집합 및 상기 제1 인용 분할 특허 집합별로 생성(SF33)한다.
이어, 상기 특허 정보 시스템(10000)은 (K) 상기 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별(SF34)한다. 기 설정된 융합 처리 기준의 일례는 상기 제1 인용 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제1분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다. 기 설정된 융합 처리 기준의 다른 일례는 상기 제1 분할 특허 집합에 대응되는 단위 융합 요소들과 상기 제1 인용 분할 특허 집합에 대응되는 단위 융합 요소들간의 차집합 연산이 될 수 있다.
한편, 상기 (J) 단계 및 상기 (K) 단계의 정보 처리는 상기 제1 분할 특허 집합, 상기 제1 인용 분할 특허 집합을 대상으로 처리되었으나, 상기 제i 분할 특허 집합, 상기 제i 인용 분할 특허 집합을 대상으로 처리되거나, 제i 분할 특허 집합, 상기 제j 인용 분할 특허 집합을 대상으로 처리될 수 있음은 물론이다 할 것이다.
이어, 도 41을 참조하면서 상기 특허 정보 시스템(10000)의 정보 처리 방법을 설명한다.
상기 특허 정보 시스템(10000)은 (L) 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성(SF)하고,
(M) 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합 및 적어도 하나 이상의 제2 인용 분할 특허 집합을 생성(SF)하며, (N) 상기 제1 분할 특허 집합, 상기 제2 분할 특허 집합, 상기 제1 인용 분할 특허 집합 및 상기 제2 인용 분할 특허 집합에 포함되는 특허 문건에서 상기 특허 문건에 대응되는 기 설정된 단위 융합 요소를 상기 제1 분할 특허 집합, 상기 제2 분할 특허 집합, 상기 제1 인용 분할 특허 집합 및 상기 제2 인용 분할 특허 집합별로 생성(SF)하고, (O) 상기 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별하는 단계;를 포함한다. 상기 기 설정된 융합 처리 기준의 일례는 상기 제1 분할 특허 집합에 대응되는 단위 융합 요소들, 상기 제2 분할 특허 집합에 대응되는 단위 융합 요소들, 상기 제1 인용 분할 특허 집합에 대응되는 단위 융합 요소들 및 상기 제2 인용 분할 특허 집합에 대응되는 단위 융합 요소들 중에서 선택되는 2 이상에 대한 기 설정된 순서의 차집합 연산일 수 있다. 상기 집합에 대응되는 단위 융합 요소들은 집합을 이루며, 이 집합을 단위 융합 요소 집합이 될 수 있으며, 집합 단위의 연산 처리가 가능함은 물론이다 할 것이다.
상기 특허 정보 시스템(10000)의 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별하는 것은 다음과 같은 것들일 수 있다.
첫째는 상기 차집합 연산 결과로서의 단위 융합 요소 집합을 그대로 수용하는 것이다.
둘째는 상기 제1 분할 특허 집합에 대응되는 단위 융합 요소들로 구성되는 제1 단위 융합 요소 집합, 상기 적어도 하나 이상의 제2 분할 특허 집합에 대응되는 단위 융합 요소들로 구성되는 제2 단위 융합 요소 집합, 상기 제1 인용 분할 특허 집합에 대응되는 단위 융합 요소들로 구성되는 제1 인용 단위 융합 요소 집합 및 상기 적어도 하나 이상의 제2 인용 분할 특허 집합에 대응되는 단위 융합 요소들로 구성되는 제2 인용 단위 융합 요소 집합을 구성하는 단위 융합 요소들에 대하여, 빈도(frequency), 빈도의 증가율 등 빈도를 독립변수로 하는 기 설정된 함수값이 기 설정된 차이 이상이 나는 단위 융합 요소들만을 선별한다.
이어, 상기 융합 정보 처리 시스템(9000)가 생성하는 정보로 공백 융합 후보 정보를 생성하는 방법에 대해서 설명한다. 공백 융합 후보 정보를 생성하는 것은 본 발명의 융합 정보 처리 시스템(9000)의 공백 융합 후보 발견부(980)가 수행한다.
공백 융합 후보는 크게 2가지가 있다. 첫째는 대등 요소 기술과 관련된 제1 유형 공백 융합 후보며, 이러한 유형의 공백 융합 후보를 발견하는 것은 본 발명의 융합 정보 처리 시스템(9000)의 공백 융합 후보 발견부(980)의 대등 공백 융합 후보 발견부(981)가 수행한다. 다른 하나는 심화 요소 기술과 관련된 제2 유형 공백 융합 후보로, 이러한 유형의 공백 융합 후보를 발견하는 것은 본 발명의 융합 정보 처리 시스템(9000)의 공백 융합 후보 발견부(980)의 심화 공백 융합 후보 발견부(982)가 수행한다.
이하, 대등 요소 기술부터 상술한다. 대등 요소 기술은 (Ki,Kj), (Ci,Cj), (Ii,Ij)가 있을 때, 핵심 키워드 계층 구조상 Ki나 Kj와 대등한 계층 레벨에 있는 키워드를 말하며, 특허 분류 계층 구조상 Ci나 Cj와 동등한 레벨에 있는 특허 분류를 말하며, 인덱스 계층 구조상 Ii나 Ij와 동등한 레벨에 있는 인덱스를 말한다. 심화 요소 기술은 (Ki,Kj), (Ci,Cj), (Ii,Ij)가 있을 때, 핵심 키워드 계층 구조상 Ki나 Kj의 하위 계층 레벨에 있는 키워드를 말하며, 특허 분류 계층 구조상 Ci나 Cj의 하위 레벨에 있는 특허 분류를 말하며, 인덱스 계층 구조상 Ii나 Ij와 하위 레벨에 있는 인덱스를 말한다.
사용자 또는 시스템에 의해 선택되거나, 사용자 또는 시스템이 지정하는 특정한 조건을 만족하는 특허 문건들로 이루어진 특허 집합을 대상으로 본 발명의 융합 발견 방법에 따라, 융합 처리 기준을 충족하는 단위 융합 요소를 생성할 수 있음은 설명한 바와 같다. 상기 융합 처리 기준을 충족하는 단위 융합 요소들의 집합은 특허 분류 조합 집합, 키워드 조합 집합, 인덱스 조합 집합 중 어느 하나 이상이 된다.
이하, 도면을 참조하면서 더욱 상세히 설명한다. 도 29 내지 도 51을 참조하면서 특허 분류를 예로 들어 설명하면 다음과 같다. 도 29은 H01B 1/00의 하부에 있는 H01B 1/06의 형제 노드와 H01B 1/06의 하위 특허 분류 노드를 보여 주는 특허 분류 체계의 일 부분에 대한 도면이다.
상기 융합 처리 기준을 충족하는 단위 융합 요소들이 (A, H01B 1/06) (A, G05B 9/00)라고 하자. 이때, 상기 A, H01B 1/06 및 G05B 9/00의 관계는 도 47와 같은 네트워크 다이어그램으로 표현될 수 있다. 이때, 상기 네트워크 다이어그램에서 A, H01B 1/06 및 G05B 9/00등은 노드가 된다. 편의상 A가 사용자가 관심을 가지는 특허 기술 분류로 센터 노드(center node)(CN1)라고 하자. 상기 센터 노드(CN1) A와 연관되는 적어도 하나 이상의 가지 노드(branch node)(BN1a) 가 있을 수 있다. 도 47에서 상기 가지 노드(BN1a)는 H01B 1/06 및 G05B 9/00이 된다. 이때, 상기 가지 노드(BN1a) H01B 1/06 및 G05B 9/00는 상기 센터 노드(CN1) A와 융합 발생 노드가 된다. 상기 융합 발생 노드는 특허 분류를 활용하는 본 발명에서 설명하는 3가지 융합 발견 방법(n분할 특허 집합을 활용한 (Ci, Cj)의 집합 연산 방법, 분할 특허 집합의 인용 특허 집합을 활용한 (Ci, Cj)의 집합 연산 방법, 인용 특허 집합과 분할 특허 집합을 활용한 (Ci, Cj)의 집합 연산 방법 등) 중 어느 하나 이상의 방법을 사용하여 발견된 융합 조건을 충족하는 노드들이다.
이때, 상기 센터 노드(CN1) A와 융합 처리 기준을 충족하는 가지 노드(BN1a)마다 특허 분류 체계상의 상기 가지 노드(BN1a)의 형제 노드(sibling)가 있을 수 있다. 형제 노드는 분류 체계 상 부모가 같은 노드들을 말한다. 특허 분류 체계의 특징상 형제 노드에 있는 기술 요소들은 그 자체로서 대등성을 가지는 경우가 대부분이다. 도 29에서 알 수 있듯이 가지 노드(BN1a) H01B 1/06의 형제 노드에는 H01B 1/02, H01B 1/04, H01B 1/14, H01B 1/20등이 있으며, 이들은 모두 H01B 1/00이라는 공통된 부모를 가진다.
이들 형제 노드들은 센터 노드(CN1) A와의 관계에서 2가지 그룹으로 나뉠 수 있다. 첫째 그룹은 융합 탈락 형제 노드로서, 융합 탈락 노드는 상기 형제 노드 중에서 상기 센터 노드(CN1) A와의 관계에서 특허 분류 조합 집합에는 포함되었지만, 융합 처리 기준을 충족하지 못하여 탈락한 노드들이다. 예를 들면, H01B 1/14는 자신 또는 하위인 H01B 1/16가 A와 공기(co-occurrent)되는 특허 문서가 있어, (A, H01B 1/14) 또는 (A, H01B 1/16)라는 특허 분류 조합 집합이 존재했으나, 이 특허 분류 조합은 융합 처리 기준을 충족하지 못한 단위 융합 요소로서, 융합 발견 방법을 실시하는 과정에서 선별되지 못한 노드이다. 둘째 그룹은 비사용 형제 노드로서, H01B 1/02, H01B 1/04, H01B 1/20과 같이 형제 노드 중 상기 센터 노드(CN1) A와의 관계에서 특허 분류 조합 집합을 형성하지 못하는 등 융합 발견 방법의 실시 과정에서 사용되지 않은 노드들이다. 상기 비사용 형제 노드는 본 발명의 제1 유형 공백 융합 후보 노드가 되며, 제1 유형 공백 융합 후보 노드는 공백 융합 후보 노드의 한 종류가 된다. 상기 제1 공백 융합 후보 노드의 형제 노드인 상기 가지 노드(BN1a)가 상기 센터 노드(CN1)와 융합 처리 조건을 충족하고 있으므로, 상기 제1 공백 융합 후보 노드(EN1a, EN1b, EN1c)는 상기 센터 노드(CN1) A와는 명시적인(explicit or exposed) 연관 관계는 보이고 있지 않지만, 상기 센터 노드(CN1) A와 상기 제1 공백 융합 후보 노드들은 잠재적인(implicit or latent) 연관 관계가 있을 수 있다. 따라서, 상기 제1 유형 공백 융합 후보 노드는 상기 센터 노드(CN1) A와 관련하여 활용/이용/응용/적용/확장/변형/변용을 시도해 볼 가치가 큰 요소 기술이 될 수 있다.
상기 융합 정보 처리 시스템(9000)는 상기 사용자의 선택을 받거나, 상기 시스템이 선택하는 적어도 하나 이상의 상기 가지 노드(BN1a)에 대하여, 상기 비사용 형제 노드 정보를 생성하고, 상기 생성된 비사용 형제 노드 정보를 상기 사용자의 컴퓨터에 목록 또는 상기 네트워크 다이어그램 상에서 상기 가지 노드(BN1a)의 주변에 표시해 준다. 상기 융합 정보 처리 시스템(9000)가 상기 비사용 형제 노드 정보를 생성하는 방법 여러 가지가 있을 수 있다. 예를 들면 상기 융합 정보 처리 시스템(9000)는 특정한 가지 노드(BN1a)(Bi)의 형제 노드(sibling node)(Sj) 정보를 특허 분류 DB(113)를 이용하여 추출하고, 상기 센터 노드(CN1) A와의 관계하는 특허 분류 조합(A, Ci)로 구성되는 특허 분류 조합 집합에 포함되는 (A, Ci)를 구성하는 Ci 중에서 Sj와 공통되는 것들을 제외하고 남은 Sj를 선별하는 방법으로 상기 비사용 형제 노드 정보를 생성할 수 있다. Ci와 공통되는 Sj는 상기 융합 탈락 형제 노드이거나, 상기 센터 노드(CN1) A와 융합 처리 기준을 충족하는 융합 발생 노드 중 어느 하나일 경우가 대부분이다. 즉, 상기 융합 정보 처리 시스템(9000)는 상기 가지 노드(BN1a)의 형제 노드 중에서 융합 처리 기준의 적용 시에 사용되지 않은 노드를 선별하여 제1 공백 융합 후보 노드 정보를 생성한다. Bi에서 B는 Branch에서, Sj에서 S는 Sibling을 나타낸다.
이어, 심화 요소 기술과 관련된 제2 유형 공백 융합 후보에 대해서 설명한다. 상기 A와 H01B 1/06은 융합 처리 기준을 충족하고 있다. 이때, A와 H01B 1/06이 융합 처리 기준을 충족하는 방법은 크게 3가지가 있다.
첫째 방법은 특허 문서 조합 집합에 A와 H01B 1/06만이 나타나고, H01B 1/06의 하위 특허 분류는 A와의 특허 분류 조합을 형성하지 않은 상태에서 A와 H01B 1/06이 융합 처리 기준을 충족하는 방법이다. 둘째 방법은 H01B 1/06의 하위 특허 분류인 H01B 1/08, H01B 1/10, H01B 1/12중 어느 하나 이상이 A와 융합 처리 기준을 충족하기 때문에, H01B 1/08, H01B 1/10, H01B 1/12의 상위 특허 분류인 H01B 1/06이 A와 융합 처리 기준을 충족하는 것으로 처리하는 방법이다. 셋째 방법은 3) H01B 1/06 및 H01B 1/06의 하위 특허 분류 중 어느 하나 이상이 모두 융합 처리 기준을 충족하기 때문에, A와 H01B 1/06이 융합 처리 기준을 충족하는 것으로 처리하는 방법이다. 상기 둘째 방법과 셋째 방법은 상기 특허 분류 체계 상 하위 레벨에서의 융합 발생은 상위 레벨에서의 융합 발생으로 처리할 수 있기 때문이다. 본 발명의 제2 유형 공백 융합 후보는 상기 첫째 방법과 관련된다.
상기 제2 유형 공백 융합 후보는 융합 처리 기준을 충족한 노드의 하위 노드 중에서 융합 처리 기준 적용 시에 사용하지 않은 비사용 하위 노드를 말한다. 예를 들어, A와의 관계에서 H01B 1/06이 융합 발생 노드인 경우에, H01B 1/06의 하위 노드인 H01B 1/08, H01B 1/10, H01B 1/12 모두가 A와의 관계에서 융합 처리 기준 적용 시에 융합 정보 생성에 사용되지 않은 경우에는 H01B 1/08, H01B 1/10, H01B 1/12가 모두 제2 유형 공백 융합 후보가 되며, H01B 1/08, H01B 1/10, H01B 1/12중 어느 하나 이상이 융합 처리 기준을 충족하는 노드가 있거나, 융합 정보 생성에 사용된 경우에는 그 노드를 제외한 노드가 제2 유형 공백 융합 후보가 된다. 만약, 도 51에서와 같이 H01B 1/06의 하위 특허 분류 중에서 H01B 1/08만이 융합 처리 기준을 충족하거나, 융합 정보 생성에 사용된 경우에는, H01B 1/10(DN1a) 및 H01B 1/12(DN1b)는 A와의 관계에서 1) H01B 1/08을 기준으로 할 때에는 제1 유형 공백 융합 후보가 되며, 2) H01B 1/06을 기준으로 할 때에는 제2 유형 공백 융합 후보가 된다.
상기 융합 정보 처리 시스템(9000)는 상기 사용자의 선택을 받거나, 상기 시스템이 선택하는 적어도 하나 이상의 상기 가지 노드에 대하여, 상기 비사용 하위 노드인 제2 유형 공백 융합 후보 노드 정보를 생성하고, 상기 생성된 제2 유형 공백 융합 후보 노드 정보를 상기 사용자의 컴퓨터에 목록 또는 상기 네트워크 다이어그램 상에서 상기 가지 노드의 주변에 표시해 준다. 상기 융합 정보 처리 시스템(9000)가 상기 비사용 하위 노드 정보를 생성하는 방법 여러 가지가 있을 수 있다. 예를 들면 상기 융합 정보 처리 시스템(9000)는 특정한 가지 노드(Bi)의 하위 노드(Lj) 정보를 특허 분류 DB(113)를 이용하여 추출하고, 상기 센터 노드 A와의 관계하는 특허 분류 조합(A, Ci)로 구성되는 특허 분류 조합 집합에 포함되는 (A, Ci)를 구성하는 Ci 중에서 Lj와 공통되는 것들을 제외하고 남은 Lj를 선별하는 방법이 있다. Ci와 공통되는 Lj는 상기 융합 탈락 하위 노드거나, 상기 센터 노드 A와 융합 처리 기준을 충족하는 융합 발생 노드 중 어느 하나일 경우가 대부분이다. 즉, 상기 융합 정보 처리 시스템(9000)는 상기 가지 노드의 하위 노드 중에서 융합 처리 기준의 적용 시에 사용되지 않은 노드를 선별하여 제2 공백 융합 후보 노드 정보를 생성한다.
제 2 유형 공백 융합 후보는 A와 융합하는 특정 기술이 기술 체계 상 상위 레벨 기술까지만 특허로 노출되어 있고, 구체적인 하위 레벨 기술까지는 아직 노출되어 있지 않아, A와의 관계에서 하위 레벨 기술은 추가적으로 탐색의 필요성이 강할 수 있게 된다. 예를 들어, A와 H01B 1/06인 비금속 물질의 융합까지만 특허로 노출된 경우에는, 산화물인 H01B 1/08, 황화물인 H01B 1/10, 유기물질인 H01B 1/12 등과 A와의 관계는 특허로 노출되어 있지 않기 때문에, 우선적인 연구/탐색/선점의 대상이 될 가능성이 높게 된다. 특히, A와의 관계에서 비금속 물질인 H01B 1/06의 하위 레벨 기술인 산화물인 H01B 1/08, 황화물인 H01B 1/10, 유기물질인 H01B 1/12중에서 특정한 어느 하나가 A와의 관계에서 연구/실험/탐색 등을 통해 특별한 기술적 효과를 내는 경우, 그것은 A와의 관계에서 중요한 발명이 될 수도 있기 때문이다.
이어, 중요 공백 융합 후보를 발견하는 방법에 대해서 설명한다. 중요 공백 융합 후보는 본 발명의 융합 정보 처리 시스템(9000)의 공백 융합 후보 발견부(980)의 중요 공백 융합 후보 발견부(983)가 수행한다.
센터 노드, 가지 노드 및 공백 융합 후보 노드 3자의 사이에서 공백 융합 후보 노드가 중요 공백 융합 후보 조건 중 어느 하나 이상을 충족하는 경우에는 상기 공백 융합 후보 노드를 중요 공백 융합 후보라 한다. 제1 중요 공백 융합 후보 조건은 상기 가지 노드와 상기 공백 융합 후보 노드가 융합 처리 기준을 충족하거나, 상기 가지 노드와 상기 공백 융합 후보 노드가 함께 나오는/공기하는(co-occurrent) 문서 개수(document frequency)가 특정한 속성을 충족하는 특허 문건 집합 또는 전체 특허 문건 집합에서 많거나(기설정된 기준보다), 최근에 많거나(기설정된 기준보다), 증가 속도가 크거나(기설정된 기준보다), 증가율이 큰(기설정된 기준보다) 경우이다. 상기 제1 중요 공백 융합 후보 조건을 만족하는 공백 융합 후보 노드는 상기 가지 노드와 밀접한 관계를 가진다는 것이며, 상기 가지 노드는 상기 센터 노드 A와 융합 처리 기준을 충족하므로, 상기 센터 노드 A와 상기 제1 중요 공백 융합 후보 조건을 만족하는 공백 융합 후보 노드는 잠재적인 연관성이 클 가능성이 높게 된다. 제2 중요 공백 융합 후보 조건은 상기 가지 노드와 상기 센터 노드가 융합 처리 기준을 충족하는 정도가 크거나, 상기 가지 노드와 상기 센터 노드 A 함께 나오는/공기하는(co-occurrent) 문서 개수(document frequency)가 특정한 속성을 충족하는 특허 문건 집합 또는 전체 특허 문건 집합에서 많거나(기설정된 기준보다), 최근에 많거나(기설정된 기준보다), 증가 속도가 크거나(기설정된 기준보다), 증가율이 큰(기설정된 기준보다) 경우이다. 이 경우, 상기 센터 노드 A와 융합 처리 기준을 충족하는 여러 가지 노드 중에서, 상기 제2 중요 공백 융합 후보 조건을 충족하는 가지 노드는 특별한 강한 연관성을 가지게 되고, 상기 특별한 강한 연관성을 가지는 가지 노드와 관련되는 공백 융합 후보 노드는 상기 센터 노드 A와의 관계에서 다른 가지 노드와 관련되는 공백 융합 후보 노드에 비하여 중요성이 큰 중요 공백 융합 후보 노드가 될 가능성이 높다. 상기 제1 중요 공백 융합 후보 조건과 상기 제2 중요 공백 융합 후보 조건을 모두 충족하는 경우가 가장 바람직하며, 제1 중요 공백 융합 후보 조건을 충족하는 것이 제2 중요 공백 융합 후보 조건을 충족하는 것보다 상대적으로 더 바람직할 것이다. 한편, 제1 유형 공백 융합 후보는 상기 제1 중요 공백 융합 후보 조건과 상기 제2 중요 공백 융합 후보 조건을 모두 충족할 수 있다. 그리고, 제2 유형 공백 융합 후보는 상기 제1 중요 공백 융합 후보 조건과는 사실상 무관하고, 상기 제2 중요 공백 융합 후보 조건을 충족하는 경우에 한하여 중요 공백 융합 후보가 될 수 있다.
이어, 상기 융합 정보 처리 시스템(9000)의 생성되는 공백 융합 후보 정보를 표시하는 방법 및 사용자 인터페이스에 대해서 상세하게 설명한다. 공백 융합 후보 정보의 표시와 관련해서는 1) 연결선, 2) 문서 개수, 3) 노드의 표시 방법, 4) 옵션 선택 시의 재계산이 중요하다. 상기 연결선, 문서 개수, 노드의 표시 및 옵션 선택 시의 재계산은 공백 융합 후보 정보의 표시뿐만 아니라 융합 정보의 표시에도 동일하게 적용됨은 당연하다 할 것이다.
상기 융합 정보 처리 시스템(9000)는 상기 특정한 하나 이상의 가지 노드에 대한 사용자의 선택을 받거나, 또는 상기 특정한 하나 이상의 가지 노드에 대하여 시스템에 의한 선택 정보가 발생하는 경우, 상기 선택된 가지 노드에 대하여, 1) 상기 공백 융합 후보 노드 정보를 생성하고, 2) 상기 공백 융합 후보 노드 중 어느 하나 이상을 상기 선택된 가지 노드와 함께 배치하여 상기 사용자에게 제공할 수 있다.
예를 들면 도 48과 같이, 사용자가 H01B 1/06을 선택하고, 상기 사용자가 공백 융합 후보 유형 선택부(30-1)에서 공백 융합 후보 유형으로 대등 융합 후보를 선택하는 경우, 상기 융합 정보 처리 시스템(9000)는 상기 H01B 1/06의 주변에 상기 H01B 1/06과 형제 노드 관계를 가지는 상기 A와의 제1 유형 공백 융합 후보 노드들을 표시해 줄 수 있다. 상기 융합 정보 처리 시스템(9000)는 도 48과 같이 H01B 1/02, H01B 1/04, H01B 1/20등이 상기 A와의 공백 융합 후보 노드들로서 상기 H01B 1/06의 주변에서 H01B 1/06와의 연결선을 보여 줄 수도 있다. 이때, 도 49와 같이 상기 A와의 공백 융합 후보 노드들과 상기 A와의 연결선(30-5)이 추가적으로 표시될 수도 있을 것이다. 도 49에서는 상기 공백 융합 후보들과 상기 센터 노드(CN1) A와는 점선 등과 같이 형태나 모양이 다른 선으로 표시하는 것이 바람직하다. 그리고, 상기 융합 정보 처리 시스템(9000)는 도 48과 같이 상기 양 노드를 연결하는 개별 연결선 위에, 상기 양 노드를 특정하는 특허 분류가 동시에 나타나는 문서의 개수에 대한 정보가 더 표시될 수 있을 것이다. 도 48에서는 상기 H01B 1/06과 H01B 1/02 사이에는 3이, H01B 1/04 사이에는 2가, 상기 H01B 1/20 사이에는 10이라는 문서 개수에 대한 표시 정보(30-7)가 있다. 상기 융합 정보 처리 시스템(9000)는 상기 문서 개수를 클릭하면 대응되는 특허 문서를 호출하여 목록이나 초록 또는 전문 등을 출력해 준다. 대응되는 특허 문서를 호출하는 방법은 연결선에 대응되는 특허 분류를 통하여 호출한다. 예를 들면 상기 H01B 1/06과 상기 H01B 1/20 사이의 문서 개수 10에 대응되는 특허 문건은 H01B 1/06과 상기 H01B 1/20을 동시에 포함하는 특허 문건을 호출하는 검색식/쿼리를 통하여 입수할 수 있다. 물론, 상기 융합 정보 처리 시스템(9000)가 특정한 조건을 충족하는 특허 문건 집합만을 대상으로 분석을 수행하는 경우에는 상기 2개의 특허 분류에 상기 특정한 조건을 결합하여 검색식/쿼리가 작성될 것임은 당업자에게 당연할 것이다. 또한, 상기 융합 정보 처리 시스템(9000)는 중요 공백 융합 후보에 대한 표시를 함께 나타낼 수 있는데, 도 48에서는 H01B 1/20이 중요 공백 융합 후보로서 굵은 타원형으로 그 노드가 표시되어 있다. 한편, 도 48의 H01B 1/06과 상기 H01B 1/20의 연결선은 크기가 굵어지는 화살표와 같이 다른 연결선과는 달리 특별한 형태/모양으로 되어 있음을 볼 수 있다. 이와 같이 상기 융합 정보 처리 시스템(9000)는 상기 연결선과 관련된 2개의 특허 분류가 기설정된 조건을 충족하는 경우에는 기설정된 특별한 형태/모양의 표시를 할 수 있다. 상기 기설정된 조건에는 문서 개수, 문서 개수의 증가율이나 증가 속도 또는 기설정된 조건을 충족하는 특별한 문서(예를 들면, 특정한 출원인 또는 특정한 속성(예를 들면 Patent Troll)의 출원인, 특정한 발명자 또는 기설정된 중요도 조건을 만족하는 특허 분류 등) 등이 될 수 있다.
한편, 상기 융합 정보 처리 시스템(9000)는 도 48과는 달리 도 50와 같이 상기 공백 융합 후보 노드가 상기 가지 노드(BN1a)와는 연결되지 않고, A와 직접 연결시켜 놓을 수도 있을 것이다. 도 50의 H01B 1/20에는 하위 특허 분류 확장 표시부(35-1)로 +기호가 표시되어 있는데, 이 기호는 H01B 1/20의 하위에 특허 분류가 추가적으로 더 있다는 표시이다. 도시되지는 않았지만, 상기 융합 정보 처리 시스템(9000)는 사용자로부터 상기 하위 특허 분류 확장 표시부(35-1)인 +를 클릭 등에 대한 선택 정보를 입수 받으면, H01B 1/20의 하위에 있는 H01B 1/22와 H01B 1/24 특허 분류를 H01B 1/20에 연결되면서 확장되어 표시되도록 정보 처리한다.
한편, 상기 융합 정보 처리 시스템(9000)는 예를 들면 도 51과 같이, 사용자가 H01B 1/06을 선택한 경우, 상기 H01B 1/06의 주변에 상기 H01B 1/06의 하위 노드 관계를 가지면서, 상기 A와의 제2 유형 공백 융합 후보 노드들을 표시해 줄 수 있을 것이다. 도 51에서는 H01B 1/06의 하위 특허 분류 중에서 H01B 1/10과 H01B 1/12가 공백 융합 후보가 되는 것을 예시하고 있다. 상기 제2 유형 공백 융합 후보에 대해서도 상기 센터 노드(CN1) A와 상기 제2 유형 공백 융합 후보와의 연결선을 표시해 줄 수 있을 것이다. 한편, 상기 융합 정보 처리 시스템(9000)는 도 51과 같이 상기 H01B 1/08과 같이 제2 유형 공백 융합 후보에는 해당하지 않지만, 상기 융합 처리 기준을 충족하거나, 융합 정보 생성에 사용된 노드들에 대해서도 부가적으로 표시해 줄 수 있다. 이때, 도 51과 같이 H01B 1/08의 표시는 제2 유형 공백 융합 후보인 H01B 1/10이나 H01B 1/12와는 다르게 표시되는 것이 바람직할 것이다. H01B 1/08은 센터 노드(CN1) A와 융합 발생 관계 내지는 융합 처리 기준 충족 관계에 있고, 제2 유형 공백 융합 후보와 기술적으로 대등한 의미(형제 노드)이므로, 도 51과 같이 H01B 1/08을 표시해 주는 경우, 그렇지 않은 경우보다 상기 제2 유형 공백 융합 후보를 A와 연관성이 유추하는데 더 도움이 될 수 있다. H01B 1/10인 황화물의 A와의 연관성/활용성/적용가능성을 H01B 1/06인 다른 비금속 물질을 통해서 고려하는 것보다 H01B 1/08인 산화물을 통해서 A와의 연관성/활용성/적용가능성을 고려하는 것이 사용자에게 더욱더 직관적일 것이다. 왜냐하면 황화물과 산화물은 기술적으로 대응한 형제 관계이기 때문이다.
그리고, 도 51에서는 각 노드의 보기가 특허 분류 + 타이틀이 함께 나타나고 있음을 볼 수 있다. 각 노드는 특허 분류만 나타나는 경우, 특허 분류와 타이틀이 함께 나타나는 경우, 타이틀만 나타나는 경우 등이 있을 수 있다. 특허 분류만이 나오는 것보다 타이틀이 함께 나오는 것이 더 바람직한데, 그 이유는 특허 분류만으로는 그 특허 분류가 나타내는 기술적 의미 뜻을 파악하기 어려울 수 있기 때문이다. 한편, 키워드나 인덱스의 경우에는 의미가 있는 문자열로 되어 있으므로(이들이 타이틀 역할을 하므로) 키워드나 인덱스만으로 표시해 줄 수도 있다. 물론, 인덱스일 경우에는 그 인덱스에 대응되는 특허 분류도 함께 표시해 주는 것도 바람직할 것이다. 상기 도 48 내지 도 51에서는 특허 분류 표시 유형 선택부(30-2)를 보여주고 있다. 상기 사용자가 상기 특허 분류 표시 유형 선택부(30-2)에서 특허 분류 + 타이틀을 선택하는 경우, 도 51에서와 같이 각 노드는 특허 분류와 특허 분류에 대한 타이틀 정보가 함께 나타난다. 한편, 도 48 내지 도 51에서는 특허 분류 속성 선택부(30-3)가 있다. 도 46-3에서는 상기 특허 분류 속성 선택부(30-3)에서 하위 특허 분류 포함이 선택되어 있는데, 이 경우, 하위 특허 분류에서 융합이 발생한 경우, 그 융합은 상위 특허 분류에 대해서도 미치게 된다. 한편, 상기 사용자는 상기 특허 분류 속성 선택부(30-3)에서는 각 노드에 대하여 depth 표기를 선택할 수도 있을 것이다. 예를 들어, 상기 융패분은 1 dot 서브 그룹이 선택되는 경우, 각 노드가 실제로는 2 dot 서브 그룹에 대응되는 특허 분류일지라도, 그 2 dot 서브 그룹의 부모인 1 dot 서브 그룹의 특허 분류 표기 및 타이틀로 표기되도록 정보 처리한다. 물론, 각 노드가 메인 그룹이라면 1 dot 서브 그룹으로 선택되었을 지라도 메인 그룹에 대응되는 특허 분류가 그 타이틀 정보와 함께 표기되는 것은 당연할 것이다.
한편, 도시하지는 않았지만, 이때, 상기 연결선 위에는 분석 대상 또는 탐색 대상 또는 처리 대상이 되는 특정한 특허 문건 집합 내에서 상기 가지 노드(BN1a)에 대응되는 특허 분류와 상기 선별된 특허 분류가 동시에 나오는 특허 문건의 증감율이나 증감 속도 등과 같은 기설정된 분석 정보가 추가적으로 표시될 수 있다. 상기 기설정된 분석 정보에는 핵심 출원인이나 기설정된 속성을 가지는 출원인, 핵심 발명자, 국가별 분포 현황, 기타 특허 분석 업계에서 당업자에게 용이하게 활용되는 각종 분석 지표 등이 있을 수 있다.
한편, 상기 공백 융합 후보 노드와 상기 센터 노드(CN1)와의 상기 연결선 위에 표시되는 상기 문서의 개수는 통상 0인 경우가 많을 것이다. 하지만, 센터 노드(CN1) A와의 관계에서 1) 공기 빈도가 아주 작은 노드, 2) 공기 빈도의 증가율이 기설정된 기준보다 작은 노드, 3) 공기 빈도 증가 속도가 기설정된 기준보다 작은 노드 또는 4) 과거에만 공기하고 최근에는 공기가 거의 없는 노드 등이 공백 융합 후보 노드로 취급되는 경우에는 상기 문서의 개수는 0이 아닐 수도 있을 것이다.
한편, H01B 1/02의 타이틀인 주로 금속 또는 합금으로 된 것과 같은 타이틀 정보가 있어도 그 타이틀이 어느 기술 계통에서 나오는 지를 용이하게 파악할 수 없는 경우가 대부분이다. 따라서, 특허 분류 또는 타이틀 정보의 가독성을 증대시키기 위해서 도 50의 특허 분류 설명 표시부(35-2)로 ?와 같은 아이콘을 도입되어, 이를 클릭했을 때 그 특허 분류 또는 타이틀의 특허 분류 체계상의 상위 특허 분류를 보여 주는 것이 바람직할 것이다. 도시하지는 않았지만, H01B 1/02 노드에 있는 특허 분류 설명 표시부(35-2)인 ?을 클릭했을 때에는 아래와 같은 정보가 추가적으로 제공되는 것이 바람직할 것이다.
(1) 섹션 : H 전기
(2) 클래스 : H01 기본적 전기소자
(3) 서브클래스 : H01B 케이블; 도체; 절연체; 도전성, 절연성 또는 유전성 특성에 대한 재료의 선택
(4) 메인그룹 : H01B 1/00 도전재료를 특징으로 하는 도체 또는 도전물체; 도체로서의 재료의 선택
(5) 1-도트 서브그룹 : 1/01 . 주로 금속 또는 합금으로 된 것
한편, 상기에서는 설명과 도식화의 편의상 H01B 1/06이라는 가지 노드와 관련되는 센터 노드를 A 하나로 가정했다. 하지만, 네트워크 다이어그램에서는 통상 H01B 1/06과 연결되는 적어도 하나 이상의 노드들이 있다. 이때, H01B 1/06과 연결되는 모든 노드들은 본 발명의 센터 노드가 될 수 있다. 이 경우, 상기 공백 융합 후보의 발견은 1) 1개의 센터 노드의 선택과 1개의 가지 노드의 선택이 함께 있는 방법, 2) n개의 센터 노드의 선택과 1개의 가지 노드의 선택이 함께 있는 방법 등이 있을 것이다. 물론, 상기 H01B 1/06이라는 가지 노드에 대하여 연결된 것이 1개밖에 없다면 그것이 센터 노드가 될 것이며, 센터 노드가 기설정된 기준(예를 들면 가장 많은 노드와 연결되어 있어 허브가 되는 노드, 문서 빈도가 가장 높은 노드 등)에 의해 디폴트로 정해져 있다면 그 노드가 센터 노드가 될 것이다. 센터 노드가 1개 또는 센터 노드가 디폴트로 정해져 있는 경우에는 센터 노드의 선택은 불필요할 것이다.
한편, 네트워크 다이어그램에서 2개의 노드가 연결되어 있을 때, 어느 것을 센터 노드로, 어느 것을 가지 노드로 지정하는 것은 공백 융합 후보를 발견하고 싶은 노드가 가지 노드가 되며, 이 가지 노드와 연결되어 있는 것이 센터 노드가 되는 방식이면 충분할 것이다. 따라서, 공백 융합 후보 정보의 처리를 위해서는 센터 노드가 1개 또는 센터 노드가 디폴트로 정해져 있는 경우가 아니라면, 공백 융합 후보를 발견하기를 원하는 가지 노드를 먼저 선택하고, 복수개의 센터 노드 중 기준이 되는 어느 하나 또는 그 이상을 지정하는 방식으로 정보 처리하거나, 인터페이스를 구성하는 것이 바람직할 것이다.
이어, 복수개의 센터 노드가 선택되는 경우에 대해서 공백 융합 후보 발견을 처리하는 방법에 대해서 설명한다. 1개의 가지 노드가 선택되고 상기 선택된 가지 노드에 연결되는 복수개의 센터 노드 후보가 있다고 가정하자. 선택은 상기 센터 노드 후보에 대해서 사용자의 선택 또는 기설정된 기준을 충족시키는 센터 노드 후보에 대하여 시스템의 선택에 따른 선택 중 어느 하나 이상일 수 있다. 상기 기설정된 기준에는 문서 빈도 일정 수 이상 되는 센터 노드 후보, 또는 상기 가지 노드와 상기 센터 노드 후보들과 관련된 모든 문서에 대하여 백분위수 기준으로 일정 %이상 되는 센터 노드 후보, 문서 빈도 랭킹을 기준으로 기설정된 순위 내에 드는 센터 노드 후보 등이 될 수 있다.
상기 융합 정보 처리 시스템(9000)가 상기 복수개의 선택 센터 노드가 A1, A2, ... Ai가 있을 때, 공백 융합 후보를 발견하는 정보 처리 방법에 대해서 설명한다.
첫째 방법은 상기 각 Ai에 대하여 공백 융합 후보(또는 중요 공백 융합 후보)를 발견하고, 발견된 공백 융합 후보를 모두 상기 가지 노드 주위에 표시하는 방법이다. 이때, 발견된 공백 융합 후보 중 빈도가 높은 공백 융합 후보일수록(예를 들면, A1, A2, A3 등과 같이 3개의 센터 노드에 대해서 공통으로 생성되는 공백 융합 후보의 경우에는 빈도 3이 된다.) 중요성이 높은 공백 융합 후보일 것이므로, 상기 고빈도 공백 융합 후보를 중요 공백 융합 후보가 되며, 중요도가 높은 공백 융합 후보에 대해서는 특별한 표시를 추가적으로 더 하여 중요도가 낮은 공백 융합 후보들과 구별 짓도록 정보 처리하는 것이 바람직할 것이다.
둘째 방법은 선택 센터 노드 Ai와 가지 노드(Bj)의 형제 노드인 Sj에 대하여 (Ai, Sj)로 이루어진 특허 분류 조합 집합을 생성하고, 상기 (Ai, Sj) 중에서, 융합 처리 기준 적용시 사용하지 않은 특허 분류 조합을 추출하고, 상기 추출된 특허 분류 조합 중에서 Sj를 상기 가지 노드(Bj)에 표시하는 방법이다. 예를 들면, 선택 센터 노드가 5개, 형제 노드가 3개 있는 경우, 생성되는 특허 분류 조합 (Ai, Sj)의 개수는 53 = 15개가 된다. 15개의 (Ai, Sj)에 대하여, 복수개의 특허 집합별로 생성된 상기 단위 융합 요소와 중복되는 특허 분류 조합은 제거된다 제거되고 남은 (Ai, Sj) 중에서 Sj를 선별한다. 이때, 선별된 Sj 중에서 특정한 Sj들은 2회 이상 나올 수 있다. 예를 들면, (A1, S2), (A2, S2), (A5, S2), (A5, S3)이 남은 것일 경우, 남은 Sj는 S2와 S3이며, S2는 3회가 나왔다. 이와 같이 빈도가 높은 Sj들은 중요도가 높은 Sj가 된다.
상기 복수개의 센터 노드 Ai에 대하여 본 발명의 공백 융합 후보를 발견하는 방법은 당연히, 제1 유형 공백 융합 후보, 제2 유형 공백 융합 후보 및 중요 공백 융합 후보 발견 중 어느 하나 이상에 적용할 수 있음은 물론이다 할 것이다.
이어, 상기 융합 정보 처리 시스템(9000)가 복수개의 가지 노드가 선택되는 경우에 대해서 공백 융합 후보 발견을 처리하는 방법에 대해서 설명한다. 1개의 센터 노드가 선택되고 상기 선택된 센터 노드에 연결되는 복수개의 가지 노드가 있다고 가정하자. 상기 융합 정보 처리 시스템(9000)가 상기 복수개의 선택 가지 노드가 B1, B2, ... Bi가 있을 때, 공백 융합 후보를 발견하는 정보 처리 방법에 대해서 설명한다.
첫째 방법은 상기 각 Bi에 대하여 공백 융합 후보(또는 중요 공백 융합 후보)를 발견하고, 발견된 공백 융합 후보를 모두 상기 Bi노드 주위에 표시하는 방법이다. 이때, 발견된 공백 융합 후보 중 빈도가 높은 공백 융합 후보일수록(예를 들면, B1, B2, B3 등과 같이 3개의 가지 노드에 대해서 공통으로 생성되는 공백 융합 후보의 경우에는 빈도 3이 된다.) 중요성이 높은 공백 융합 후보일 것이므로, 상기 고빈도 공백 융합 후보를 중요 공백 융합 후보가 되며, 중요도가 높은 공백 융합 후보에 대해서는 특별한 표시를 추가적으로 더 하여 중요도가 낮은 공백 융합 후보들과 구별 짓도록 정보 처리하는 것이 바람직할 것이다. 예를 들어 빈도 3인 공백 융합 후보는 상기 B1, B2, B3와 연결선이 이어져 있을 것이다.
둘째 방법은 센터 노드(A)와 선택 가지 노드 Bi의 형제 노드인 Sj에 대하여 (A, Sj)로 이루어진 특허 분류 조합 집합을 생성하고, 상기 (A, Sj) 중에서, 융합 처리 기준 적용시 사용하지 않은 특허 분류 조합을 추출하고, 상기 추출된 특허 분류 조합 중에서 Sj를 상기 센터 노드(A)에 표시하거나, Sj마다 그 Sj에 대응되는 Bi 주위에 표시하는 방법이다. 예를 들면, 선택 가지 노드가 5개, 각 가지 노드마다 형제 노드가 3개 있는 경우, 생성되는 특허 분류 조합 (A, Sj)의 개수는 53 = 15개가 된다. 15개의 (A, Sj)에 대하여, 복수개의 특허 집합별로 생성된 상기 단위 융합 요소와 중복되는 특허 분류 조합은 제거된다 제거되고 남은 (A, Sj) 중에서 Sj를 선별한다. 이때, 선별된 Sj 중에서 특정한 Sj들은 2회 이상 나올 수 있다. 이와 같이 빈도가 높은 Sj들은 중요도가 높은 Sj가 된다.
상기 융합 정보 처리 시스템(9000)가 상기 복수개의 가지 노드 Bi에 대하여 본 발명의 공백 융합 후보를 발견하는 방법은 당연히, 제1 유형 공백 융합 후보, 제2 유형 공백 융합 후보 및 중요 공백 융합 후보 발견 중 어느 하나 이상에 적용할 수 있음은 물론이다 할 것이다.
이상에서는 특허 분류를 통하여 본 발명의 공백 융합 후보를 발견하는 방법 및 그 시스템을 설명하였다. 특허 분류와 인덱스는 대응 관계를 가지므로, 특허 분류가 표시되는 노드 중 대응되는 인덱스가 있는 경우, 타이틀 정보 대신에 인덱스로 표시할 수도 있을 것이다.
한편, 상기 공백 융합 후보의 발견에서는 상기 특허 분류가 가지는 계층(tree) 구조성을 활용하였다. 인덱스는 특허 분류와 대응 관계를 가지고, 특허 분류 체계와 마찬가지로 계층 구조성을 가진다. 따라서, 특허 분류 조합 집합에 대응되는 인덱스 조합 집합이 생성될 수 있고, 상기 인덱스 조합 집합을 통해서 융합 처리 기준을 충족하는 단위 융합 요소를 생성하고, 생성된 단위 융합 요소로 네트워크 다이어그램을 생성할 수 있게 된다. 생성된 네트워크 다이어그램의 각 노드는 인덱스가 될 것이다. 한편, 각 노드를 구성하는 인덱스에는 도 31에 나와 있는 것과 같은 인덱스 체계 상 형제 노드와 하위 노드가 존재하게 된다. 따라서, 본 발명의 특허 분류를 활용한 본 발명의 공백 융합 후보를 발견하는 방법 및 그 시스템을 당업자 수준에서 인덱스에 그대로 원용할 수 있음은 당연할 것이다.
그리고, 키워드들도 계층 구조 체계가 있을 수 있다. 즉, 시멘틱 또는 온톨리지 분야에서는 기술 키워드에 대한 계층 구조를 생성해 놓은 것들이 있다. 본원 발명에서는 키워드 네트워크 다이어그램의 노드인 키워드에 대해서(모든 키워드에 대해서일 필요는 당연히 없을 것이다.) 그 키워드의 형제 노드나 하위 노드가 있는 경우 키워드에 대해서 공백 융합 후보를 발견하는 본원 발명 사상을 적용할 수 있을 것이다.
이상에서, 상기 융합 정보 처리 시스템(9000)가 생성하는 정보로 공백 융합 후보 정보를 생성하는 방법에 대해서 설명하였다. 공백 융합 후보 정보는 단위 융합 요소를 활용하여 생성되는 네트워크 다이어그램 상에서 사용자가 적어도 하나 이상의 센터 노드 및/또는 적어도 하나 이상의 가지 노드를 선택하고, 선택된 노드를 중심으로 생성되는 것이 바람직하다. 이때, 상기 네트워크 다이어그램은 본 발명에서 융합 정보를 생성할 때 활용되는 제1 특허 집합과 적어도 하나 이상의 제2 특허 집합에서 생성되는 단위 융합 요소 중 기설정된 융합 처리 기준을 충족하는 단위 융합 요소로 생성되는 것이 반드시 필요한 것은 아니다. 즉, 본 발명의 공백 융합 후보 정보를 생성하는 것은 융합 처리 기준의 충족 여부와는 독립적인 것으로, 임의의 특허 집합에서 생성되는 단위 융합 요소로 생성되는 네트워크 다이어그램을 활용해서도 동등한 정보 처리가 가능하다. 상기 가지 노드의 형제 노드, 상기 가지 노드의 하위 노드 중에서 비사용 탐색 노드를 선별할 때, 비사용의 기준이 되는 것은 상기 특허 집합에서 상기 센터 노드와 상기 비사용 탐색 노드의 조합이 사용되었는지의 여부로 충분할 수 있다. 즉, 상기 센터 노드와 가지 노드의 형제 노드, 센터 노드와 가지 노드의 하위 노드로 생성되는 조합 집합과 상기 임의의 특허 집합에서 생성되는 단위 융합 요소 집합 중에서 차집합 연산으로 생성되는 조합 집합에 포함되는 형제 노드나 가지 노드는 비사용 탐색 노드가 되기에 충분하기 때문이다. 이때, 차집합의 대상이 되는 상기 임의의 특허 집합에서 생성되는 단위 융합 요소들은 융합 처리 기준을 충족하는 것도 있고, 융합 처리 기준을 충족하지 않은 것도 있지만, 이들 양자 중 어느 하나와도 중복되는 (센터 노드, 형제 노드) 또는 (센터 노드, 하위 노드)에 포함되는 형제 노드나 센터 노드는 본 발명의 비사용 탐색 노드가 될 수는 없을 것이다.
이하, 도면을 참조하면서 더욱더 상세하게 설명한다.
도 42은 본 발명의 상기 융합 정보 처리 시스템(9000)가 생성하는 특허 집합을 구성하는 특허 문건에서 추출되는 키워드 조합을 단위 융합 요소로 하여 생성되는 네트워크 다이어그램의 일 구현예적 도면이다. 연결선 위의 수치값은 연결선이 연결하는 양 노드를 모두 포함하는 특허 문건의 개수이다. 한편, 도 43은 상기 도 42에 대하여 기설정된 조건의 한정을 통해서 새롭게 생성되는 네트워크 다이어그램에 대한 일 구현예적 도면이다. 상기 도 43에서 출원인을 Apple사로 한정하고, 특허 등급을 B 등급으로 하고, 인용을 4회 이상 받은 특허 문건들 만으로 특허 집합을 한정하고, 한정된 특허 집합에 관련되는 단위 융합 요소로 새롭게 네트워크 다이어그램이 생성되는 일 구현예이다. 도 44은 특허 분류를 단위 융합 요소로 하여 생성되는 네트워크 다이어그램의 일 구현예적 도면이다. 도 45 내지 도 46은 상기 융합 정보 처리 시스템(9000)가 공백 융합 후보 정보를 생성하는 방법에 대한 일 실시예적 도면이다.
도 45는 임의의 특허 집합을 대상으로 생성된 상기 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성하면서 본 발명 사상을 적용시키는 것에 관한 것이다. 상기 융합 정보 처리 시스템(9000)는 적어도 하나 이상의 특허 문건으로 구성되는 적어도 하나 이상의 특허 집합을 사용하여 생성되는 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성(SF111)한다. 상기 특허 집합은 임의의 조건으로 생성되는 특허 집합일 수 있으며, 상기 조건은 키워드, 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, 특허 주제 분류 및 기 설정된 분류 속성 중 어느 하나 또는 어느 2 이상의 조합일 수 있다. 이어, 상기 융합 정보 처리 시스템(9000)는 상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드(CN1), 센터 노드(CN1)와 연결되는 적어도 하나 이상의 가지 노드(BN1a)에 대한 선택 정보가 있을 때, 선택된 가지 노드(BN1a)에 대한 탐색 노드를 입수(SF112)한다. 상기 가지 노드(BN1a)나 상기 센터 노드(CN1)는 하나 또는 2 이상의 복수개일 수도 있다. 상기 융합 정보 처리 시스템(9000)는 상기 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리(SF113)한다. 상기 공백 융합 후보는 분석 정보가 포함된 목록(list) 형식으로 제공될 수 있으나, 네트워크 다이어그램 또는 기타 형식의 다이어그램이나 표, 그래프 등의 시각화된 형태로 표시되는 것이 더욱 바람직할 것이다. 상기 융합 정보 처리 시스템(9000)는 선택적으로 선별된 비사용 탐색 노드가 네트워크 다이어그램 상에 표시(SF114)되도록 한다. 상기 융합 정보 처리 시스템(9000)는 추가적으로 상기 융합 정보 처리 시스템(9000)는 중요 비사용 탐색 노드 정보를 생성(SF115)할 수 있고, 생성된 중요 비사용 탐색 노드를 중요도에 따라 상기 네트워크 다이어그램 상에 표시되도록 할 수 있다.
도 46은 제1 특허 집합 및 적어도 하나 이상의 상기 제2 특허 집합별로 생성된 상기 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 선별하는 단계를 거치고, 선별된 단위 융합 요소들을 활용하여 네트워크 다이어그램을 생성하면서 본 발명 사상을 적용시키는 것에 관한 것이다. 상기 융합 정보 처리 시스템(9000)는 특허 문건으로 구성되는 제1 특허 집합 및 특허 문건으로 구성되는 적어도 하나 이상의 제2 특허 집합별로 생성되는 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 생성하고, 생성된 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성(SF121)한다. 이어, 상기 융합 정보 처리 시스템(9000)는 상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드(CN1), 센터 노드(CN1)와 연결되는 적어도 하나 이상의 가지 노드(BN1a)에 대한 선택 정보가 있을 때, 선택된 가지 노드(BN1a)에 대한 탐색 노드를 입수(SF122)하고, 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리(SF123)한다. 상기 융합 정보 처리 시스템(9000)는 선별된 비사용 탐색 노드가 네트워크 다이어그램 상에 표시(SF124)하고, 중요 비사용 탐색 노드 정보를 생성(SF125)하고, 생성된 중요 비사용 탐색 노드 정보를 상기 네트워크 다이어그램 상에 표시되도록 한다.
본 발명은 특허 정보 산업, R&D 지원 사업, 신사업 영역 발굴 등에 다양하게 활용될 수 있다.

Claims (49)

  1. 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법에 있어서,
    상기 특허 정보 시스템이
    (a) 상기 사용자 컴퓨터로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수 받는 단계;
    (b) 상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성하는 단계; 및
    (c) 상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합(교차 영역 집합)을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성하는 단계;를 포함하며,
    상기 제1 특허 분류는 IPC, F-term, FI, UPSC, ECLA 중 어느 하나 이상인 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  2. 제 1항에 있어서,
    (d) 상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시하도록 하는 단계;를 더 포함하는 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  3. 제 1항에 있어서,
    상기 교차 영역 집합은 상기 제1 특허 분류 집합과 상기 제2 분류 집합을 사용하는 매트릭스나 큐브 형태의 교차 영역 프레임인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  4. 제 1항에 있어서,
    상기 교차 영역 문건 집합은 적어도 하나 이상의 타겟 문건 집합의 부분 문건 집합인 것이며,
    상기 타겟 문건 집합은 상기 사용자가 지정하거나 생성한 문건 집합이거나, 상기 시스템이 지정하거나 생성한 문건 집합인 것인 것이며,
    선택적으로 상기 타겟 문건 집합은 기 설정된 한정 조건을 충족하는 문건들로만 한정될 수 있는 것이며,
    상기 한정 조건은 시간 한정, 출원인이나 권리자 한정, 발명자 한정, 특허 평가 점수나 특허 평가 등급의 한정, 출원인, 권리자 또는 발명자의 속성 한정, 특허 평가 지표의 충족 정도의 한정, 특정 서지 사항 속성 포함 여부의 한정, 특허에 대한 측정값의 한정 중 어느 하나 이상인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  5. 제 1항에 있어서,
    상기 제2 분류는 특허 분류 또는 특허 분류와 대응 관계를 가지는 준 특허 분류인 것이며,
    상기 준 특허 분류는 IndextoUSPC, CatchWord 중 어느 하나 이상인 것이며,
    상기 준 특허 분류는 준 특허 분류 1개당 적어도 하나 이상의 특허 분류가 대응되는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  6. 제 1항에 있어서,
    상기 (a) 단계에서, 적어도 하나 이상의 하위 특허 분류를 가지는 적어도 하나 이상의 상위 특허 분류를 선택함으로써, 상기 선택된 상위 특허 분류에 대한 상기 하위 특허 분류를 상기 제1 특허 분류 집합으로 처리하는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  7. 제 6항에 있어서,
    상기 교차 영역 문건 집합은 타겟 문건 집합 중 상기 제1 특허 분류 집합을 구성하는 제1 특허 분류와 상기 제2 분류 집합을 구성하는 제 2분류의 속성을 동시에 충족하는 문건들로 구성되는 것이며,
    상기 속성의 충족은 상기 교차 영역 문건에 상기 제1 특허 분류와 상기 제2 분류의 전부 또는 일부분이 동시에 나타나 있거나, 상기 교차 영역 문건에 나와 있는 특허 분류의 특허 분류 체계 상의 적어도 하나 이상의 상위 특허 분류의 전부 또는 일부분이 상기 제1 특허 분류와 상기 제2 분류에 동시에 나타나는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  8. 제 1항에 있어서,
    상기 제1 특허 분류 집합은 특허 분류 체계 상에서 어느 하나의 상위 특허 분류에 대하여, 상기 상위 특허 분류의 전체 하위 특허 분류 중 상기 사용자가 선택하는 하위 특허 분류를 포함하여 구성되는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  9. 제 1항에 있어서,
    상기 니치 분석 정보는 상기 사용자가 선택할 수 있는 것이며,
    상기 니치 분석 정보는 적어도 하나 이상의 니치 분석 지표나 니치 분석 모델을 사용하는 것이며,
    상기 교차 영역값은 상기 니치 분석 지표나 상기 니치 분석 모델의 선택에 따라 변동되는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  10. 제 3항에 있어서,
    상기 교차 영역 프레임에는 상기 제1 특허 분류 집합을 구성하는 특허 분류와 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 것이며,
    상기 교차 영역 프레임은 상기 제1 특허 분류 집합을 구성하는 특허 분류가 나타나는 제1 프레임축, 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 제2 프레임축으로 구성되며,
    상기 교차 영역이 배치되는 방법은
    상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제1 배치 방법,
    제1 특허 집합의 특허 분류에 대응되는 교차 영역 집합이 없는 없거나 제2 분류 집합의 제2 분류에 대응되는 교차 영역 집합이 없는 경우, 교차 영역 집합이 없는 특허 분류나 제2 분류를 제외하고 교차 영역 집합이 존재하는 특허 분류나 제2 분류에 대하여, 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제2 배치 방법, 및
    상기 제1 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제2 프레임축에 가까이 배치하고, 상기 제2 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 상기 제1 프레임축에 가까이 배치하는 제3 배치 방법 중 어느 하나의 방법이 적용되는 것인 것이며,
    상기 제1 배치 방법, 상기 제2 배치 방법 및 상기 제3 배치 방법은 상기 사용자의 선택이나 상기 시스템의 설정에 따라 선택될 수 있는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템의 정보 처리 방법.
  11. 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템에 있어서,
    상기 사용자 컴퓨터로부터 제1 특허 분류를 사용하는 제1 특허 분류 집합 및 적어도 하나 이상의 제2 분류를 사용하는 제2 분류 집합에 대한 선택 정보를 입수 받는 교차 영역 프레임 선택부;
    상기 제1 특허 분류 집합 및 상기 제2 분류 집합을 사용하여 적어도 2개 이상의 교차 영역을 가지는 교차 영역 집합을 구성하는 교차 영역 집합 생성부; 및
    상기 교차 영역 집합을 구성하는 적어도 하나 이상의 교차 영역에 대하여, 상기 교차 영역에 대응되는 교차 영역 문건 집합(교차 영역 집합)을 기준으로 하나 이상의 니치 분석 정보를 교차 영역값으로 생성하는 니치 분석 정보 생성부;를 포함하며,
    상기 제1 특허 분류는 IPC, F-term, FI, UPSC, ECLA 중 어느 하나 이상인 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템.
  12. 제 11항에 있어서,
    상기 교차 영역에 상기 교차 영역값 및 상기 교차 영역값을 기 설정된 기준으로 처리한 교차 영역값 처리 결과 중 어느 하나 이상을 상기 교차 영역에 표시하도록 하는 니치 분석 정보 표시부;를 더 포함하는 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템.
  13. 제 12항에 있어서,
    제1 특허 분류 집합 및 제2 분류 집합의 선택 이력 및 현재 선택 사항을 관리하는 선택 프레임 관리부;를 더 포함하는 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템.
  14. 제 1항에 있어서,
    상기 니치 분석 정보 생성부는
    니치 관점별로 니치 분석 정보를 생성하는 니치 관점 분석 정보 생성부; 및
    니치 모델별로 니치 분석 정보를 생성하는 니치 모델 분석 정보 생성부; 중 어느 하나 이상을 더 포함하는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템.
  15. 제 1항에 있어서,
    상기 교차 영역 집합을 배치하는 교차 영역 집합 배치부;를 더 포함하며,
    상기 교차 영역 집합 배치부가 상기 교차 영역 집합 배치부가 상기 교차 영역을 배치하는 방법은
    상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제1 배치 방법,
    제1 특허 집합의 특허 분류에 대응되는 교차 영역 집합이 없는 없거나 제2 분류 집합의 제2 분류에 대응되는 교차 영역 집합이 없는 경우, 교차 영역 집합이 없는 특허 분류나 제2 분류를 제외하고 교차 영역 집합이 존재하는 특허 분류나 제2 분류에 대하여, 상기 제1 특허 분류 집합이 특허 분류 체계 상에서 나열되는 순서 및 상기 제2 분류 집합이 상기 제2 분류 체계 상에서 나열되는 순서를 기준으로 배치하는 제2 배치 방법, 및
    제1 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 제2 프레임축에 가까이 배치하고, 제2 프레임축 방향의 모든 교차 영역에 대한 교차 영역값의 합계가 높을수록 제1 프레임축에 가까이 배치하는 제3 배치 방법 중 어느 하나의 방법 중 어느 하나를 실시하는 것이며,
    교차 영역 프레임에는 상기 제1 특허 분류 집합을 구성하는 특허 분류와 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 것이며,
    상기 교차 영역 프레임은 상기 제1 특허 분류 집합을 구성하는 특허 분류가 나타나는 제1 프레임축, 상기 제2 분류 집합을 구성하는 제2 분류가 나타나는 제2 프레임축으로 구성되며,
    상기 제1 배치 방법, 상기 제2 배치 방법 및 상기 제3 배치 방법은 상기 사용자의 선택이나 상기 시스템의 설정에 따라 선택될 수 있는 것인 것을 특징으로 하는 니치 기술 영역 탐색 서비스를 제공해 주는 특허 정보 시스템.
  16. 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 발견 모델을 생성하는 특허 정보 시스템의 정보 처리 방법에 있어서, 상기 특허 정보 시스템이,
    (M1) N 개의 표본 문건 집합에 대하여, 상기 N개 각각의 표본 문건 집합을 적어도 하나 이상의 분할 기준을 적용하여 2 이상의 부분으로 분할하여 제1 부분 표본 문건 집합과 적어도 하나 이상의 제2 부분 표본 문건 집합(부분 표본 문건 집합)을 구성하는 단계;
    (M2) 상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합을 대상으로 니치 기준 요소에 대한 니치 기준 요소값 정보를 생성하는 단계;
    (M3) 상기 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대하여 니치 평가 요소값 정보를 생성하는 단계; 및
    (M4) 상기 니치 기준 요소값을 종속 변수값으로 하고, 상기 니치 평가 요소값을 독립 변수값으로 하여 기 설정된 통계 알고리즘을 적용하여 니치 평가 모델을 생성하는 단계;를 포함하는 것이며,
    상기 N은 자연수인 것이며, 상기 문건 집합을 구성하는 문건은 특허 문건인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  17. 제 16항에 있어서,
    상기 분할 기준은 적어도 하나 이상의 기 설정되는 시점이거나, 상기 표본 문건 집합에서의 기 설정된 유형의 변동이 발생하는 적어도 하나 이상의 시점인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  18. 제 17항에 있어서,
    상기 기 설정된 유형의 변동은 문건 총량의 기 설정된 범위 이상의 변동, 주체 총량의 기 설정된 범위 이상의 변동, 상기 표본 문건 집합을 대상으로 계산될 수 있는 기 설정된 변수값의 기 설정된 범위 이상의 변동 중 어느 하나인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  19. 제 16항에 있어서,
    상기 N개의 표본 문건 집합에 대하여 적용되는 분할 기준은 상기 N개의 표본 문건 집합별로 다를 수 있는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  20. 제 16항에 있어서,
    상기 (M1) 단계에서 생성된 제1 부분 표본 문건 집합의 개수와 상기 (M2) 단계에서 사용하는 제1 부분 표본 문건 집합의 개수는 다를 수 있는 것이며, 상기 (M1) 단계에서 생성된 제2 부분 표본 문건 집합의 개수와 상기 (M2) 단계에서 사용하는 제2 부분 표본 문건 집합의 개수는 다를 수 있는 것이며,
    제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합은 공집합일 수 있는 것이며, 상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합 중 어느 하나의 집합이 공집합인 경우, 공집합이 발생한 표본 문건 집합에 기인한 분할 표본 문건 집합은 상기 (M2) 단계를 실시하지 않는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  21. 제 16항에 있어서,
    상기 니치 기준 요소는 적어도 하나 이상의 니치 평가 요소를 사용하여 생성되는 단일 니치 기준 요소 또는 복합 니치 기준 요소 중 어느 하나이며,
    상기 니치 기준 요소가 니치 평가 요소를 사용하는 경우, 상기 (M3) 단계를 실시할 때, 상기 사용된 니치 평가 요소는 제외하고 실시하는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  22. 제 16항에 있어서,
    상기 니치 평가 요소는 적어도 2개 이상의 그룹으로 그룹핑 되는 것인 것이며,
    상기 그룹은 총량 관점의 니치 평가 요소로 생성되는 그룹, 변동 관점의 니치 평가 요소로 생성되는 그룹, 질적 관점의 니치 평가 요소로 생성되는 그룹, 및 신규 관점의 니치 평가 요소로 생성되는 그룹 중 어느 하나의 그룹을 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  23. 제 16항에 있어서,
    상기 통계 알고리즘은 기계 학습 계열의 비선형 알고리즘인 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  24. 제 23항에 있어서,
    상기 비선형 알고리즘은 부스팅 알고리즘인 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  25. 제 16항에 있어서,
    (M5) 니치 평가의 대상이 되는 지정되거나 입력된 입수 문건 집합을 입수하는 단계;
    (M6) 상기 입수 문건 집합에 대하여 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성하는 단계; 및
    (M7) 생성된 상기 니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 니치 평가값을 생성하는 단계;를 더 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  26. 제 22항에 있어서,
    상기 (M3) 내지 (M4) 단계는 상기 그룹별로 수행되는 것이며,
    상기 니치 평가 모델은 상기 그룹별로 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  27. 제 16항에 있어서,
    상기 니치 평가 모델은 니치 평가값 생성 모델을 더 포함하는 것이며,
    상기 니치 평가값 생성 모델은 지정되거나 입력된 입수 문건 집합에 대하여, 상기 입수 문건 집합을 대상으로 적어도 2 이상의 상기 니치 평가 요소에 대하여 상기 니치 평가 요소값 정보를 생성하고, 생성된 상기 니치 평가 요소값 정보를 사용하여 니치 스코어를 생성하는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  28. 제 16항에 있어서,
    상기 니치 평가 모델을 생성하는 것은 니치 평가 요소별 통계 분석 정보의 생성, 니치 평가 모델 검증 정보의 생성 및 과적합 방지 파라미터의 조절 중 어느 하나 이상을 포함하는 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  29. 제 25항에 있어서,
    (M8) 적어도 1개 이상의 니치 옵션을 사용하여 상기 (M5) 단계에서 입수한 입수 문건 집합을 분할하여 복수 개의 분할 입수 문건 집합을 생성하고, 상기 생성된 분할 입수 문건 집합별로 상기 (M6) 단계 내지는 (M7) 단계를 수행하여 상기 분할 입수 문건 집합별로 상기 니치 평가값을 생성하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  30. 제 29항에 있어서,
    (M9) 상기 복수 개의 분할 입수 문건 집합별로 생성되는 상기 니치 평가값에서 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합 정보를 선별하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  31. 제 30항에 있어서,
    상기 니치 평가값이 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합에 대하여 기 설정된 적어도 하나 이상의 특허 분석을 수행하여, 상기 분할 입수 문건 집합 및 수행된 특허 분석의 결과로 기 설정된 니치 발견 리포팅 정보를 생성하는 것인 것을 특징으로 하는 특허 정보 시스템의 정보 처리 방법.
  32. 유무선 네트워크를 통하여 사용자 컴퓨터로 니치 기술 영역 발견 모델을 생성하는 특허 정보 시스템에 있어서,
    상기 특허 정보 시스템은 니치 평가 모델 생성부를 포함하며, 상기 니치 평가 모델 생성부는
    N 개의 표본 문건 집합에 대하여, 상기 N개 각각의 표본 문건 집합을 적어도 하나 이상의 분할 기준을 적용하여 2 이상의 부분으로 분할하여 제1 부분 표본 문건 집합과 적어도 하나 이상의 제2 부분 표본 문건 집합을 구성하는 문건 집합 분할 모듈;
    상기 제1 부분 표본 문건 집합과 상기 제2 부분 표본 문건 집합을 대상으로 니치 기준 요소에 대한 니치 기준 요소값 정보를 생성하는 니치 기준 요소값 생성 모듈;
    상기 제1 부분 표본 문건 집합을 대상으로 적어도 2 이상의 니치 평가 요소에 대하여 니치 평가 요소값 정보를 생성하는 니치 평가값 생성 모듈; 및
    상기 니치 기준 요소값을 종속 변수값으로 하고, 상기 니치 평가 요소값을 독립 변수값으로 하여 기 설정된 통계 알고리즘을 적용하여 니치 평가 모델을 생성하는 니치 평가 알고리즘 생성 모듈;를 포함하며,
    상기 N은 자연수인 것이며, 상기 문건 집합을 구성하는 문건은 특허 문건인 것을 특징으로 하는 특허 정보 시스템.
  33. 제 32항에 있어서,
    니치 평가의 대상이 되는 지정되거나 입력된 입수 문건 집합을 입수하는 니치 분석용 문건 집합 입수부; 및
    니치 평가 요소값 정보를 사용하여 상기 니치 평가 모델로 니치 평가값을 생성하는 니치 평가값 생성 모듈;를 더 포함하는 것인 것을 특징으로 하는 특허 정보 시스템.
  34. 제 33항에 있어서,
    적어도 1개 이상의 니치 옵션을 사용하여, 입수한 입수 문건 집합을 분할하여 복수 개의 분할 입수 문건 집합을 생성하고, 상기 생성된 분할 입수 문건 집합별로 상기 니치 평가값을 생성하고, 상기 분할 입수 문건 집합별로 생성되는 상기 니치 평가값에서 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합을 선별하는 니치 발견 시뮬레이션 모듈;를 더 포함하는 것을 특징으로 하는 특허 정보 시스템.
  35. 제 34항에 있어서,
    상기 니치 평가값이 기 설정된 평가값 이상이거나, 기 설정된 랭킹 이상인 상기 분할 입수 문건 집합에 대하여 기 설정된 적어도 하나 이상의 특허 분석을 수행하여, 상기 분할 입수 문건 집합 및 수행된 특허 분석의 결과로 기 설정된 니치 발견 리포팅 정보를 생성하는 니치 발견 리포팅 정보 생성부;를 포함하는 것을 특징으로 하는 특허 정보 시스템.
  36. 특허 정보를 활용하여 공백 융합 후보 정보를 생성하는 특허 정보 시스템에서, 상기 특허 정보 시스템이
    (A) 적어도 하나 이상의 특허 문건으로 구성되는 적어도 하나 이상의 특허 집합을 사용하여 생성되는 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성하는 단계;
    (B) 상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드, 상기 센터 노드와 연결되는 적어도 하나 이상의 가지 노드에 대한 선택 정보가 있을 때, 선택된 상기 가지 노드에 대한 탐색 노드를 입수하는 단계; 및
    (C) 상기 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리하는 단계;를 포함하며,
    상기 (B) 단계에서 상기 가지 노드는 상기 특허 정보 시스템의 사용자 컴퓨터로부터 선택받는 것이며, 상기 센터 노드는 상기 사용자 컴퓨터 또는 상기 특허 정보 시스템의 기설정된 선택 기준에 의해 선택받는 것이며,
    상기 (B) 단계에서 상기 탐색 노드는 상기 가지 노드에 대한 상기 가지 노드가 속하는 분류 체계상에서 상기 가지 노드의 형제 노드인 것이거나, 상기 가지 노드의 하위 노드인 것이며,
    상기 (C) 단계에서의 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 (A) 단계의 상기 특허 집합을 사용하여 생성되는 단위 융합 요소에 존재하는 않은 조합에 관련되는 노드인 것이며,
    상기 단위 융합 요소는 2 이상의 특허 분류로 구성되는 특허 분류 조합, 2개 이상의 키워드로 구성되는 키워드 조합, 및 특허 분류에 대응되는 인덱스 조합 중에서 선택되는 어느 하나 이상인 것이며,
    상기 특허 분류 조합 및 상기 인덱스 조합은 상기 특허 문건에 포함된 2개 이상의 특허 분류를 기초로 생성되는 것인 것이며, 상기 키워드는 상기 특허 문건에서 추출된 키워드, 상기 특허 문건에서 추출된 키워드를 가공한 키워드 중 어느 하나 이상인 것이며,
    상기 단위 융합 요소의 생성은 상기 단위 융합 요소가 특허 분류 조합 또는 인덱스 조합인 경우에는 상기 특허 문건 중 적어도 한 종류 이상의 특허 분류를 기준으로 2개 이상의 특허 분류를 포함하는 특허 문건을 대상으로 실시되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  37. 제36 항에 있어서,
    상기 (A) 단계에서 생성되는 단위 융합 요소는 적어도 하나 이상의 특허 문건으로 구성되는 제1 특허 집합 및 특허 문건으로 구성되는 적어도 하나 이상의 제2 특허 집합별로 생성되는 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소인 것이며,
    상기 (C) 단계에서의 상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 (A) 단계에서 제1 특허 집합 및 적어도 하나 이상의 제2 특허 집합별로 생성되는 단위 융합 요소에서 생성되지 않은 조합인 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  38. 제37 항에 있어서,
    상기 (A) 단계의 제1 특허 집합과 제2 특허 집합이 생성되는 방법은
    생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 분할된 어느 한 특허 집합으로 상기 제1 특허 집합을 생성하고, 분할된 다른 특허 집합으로 상기 제2 특허 집합을 생성하는 제 1 방법,
    생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성하고, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합별로, 상기 제1 분할 특허 집합 및 상기 제2 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합으로 상기 제1 특허 집합을 생성하고, 적어도 하나 이상의 제2 인용 분할 특허 집합으로 상기 제2 특허 집합을 생성하는 제2 방법,
    생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 생성하고, 상기 제1 분할 특허 집합으로 상기 제1 특허 집합을 생성하고, 상기 제1 분할 특허 집합에 포함된 특허 문건의 1단계 이상의 인용 특허 문건으로 구성되는 제1 인용 분할 특허 집합으로 상기 제2 특허 집합을 생성하는 제3 방법 중 어느 하나의 방법으로 생성되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  39. 제37 항에 있어서,
    상기 (A) 단계에서 상기 융합 처리 기준은 상기 단위 융합 요소가 상기 제1 특허 집합 및 상기 제2 특허 집합별로 1) 어느 한 특허 집합에만 존재하는 것이거나, 2) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 차이 이상인 것이거나, 3) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 증가 속도 이상인 것이거나, 4) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 증가 가속도 이상인 것이거나, 5) 특허 집합별로 상기 단위 융합 요소의 빈도가 기 설정된 함수 관계나 기 설정된 조건 관계를 성립시키는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  40. 제36 항에 있어서,
    상기 (C) 단계에서 상기 비사용 탐색 노드를 생성하는 단계는,
    상기 센터 노드와 상기 탐색 노드로 생성되는 조합 집합을 구성하는 조합 중에서 상기 (A) 단계에서 생성되는 단위 융합 요소와 중복되는 조합을 배제하고 남은 조합에 포함되는 탐색 노드로 처리하는 제1 방법, 및 상기 탐색 노드 중에서 상기 (A) 단계에서 생성되는 단위 융합 요소 중 센터 노드가 포함된 단위 융합 요소에 사용된 노드를 배제하고 남은 탐색 노드로 처리하는 제2 방법 중 어느 하나의 방법을 사용하는 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  41. 제36 항에 있어서,
    (D) 상기 비사용 탐색 노드가 상기 네트워크 다이어그램 상에 표시되는 단계;를 포함하는 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  42. 제41 항에 있어서,
    상기 네트워크 다이어그램에서 상기 비사용 탐색 노드가 표시되는 방법은 상기 비사용 탐색 노드가 상기 가지 노드 주위에 배치되는 것인 것이며,
    선택적으로, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 2 이상 간에는 기설정된 형태의 연결선이 표시되는 것이며,
    선택적으로 상기 연결선 상에는 상기 연결선이 연결하는 2개의 노드에 대응되는 특허 문건으로 구성되는 특허 문건 집합에 대한 적어도 하나 이상의 분석 정보가 표시되는 것이며, 상기 분석 정보에는 빈도가 포함되어 있는 것이며,
    선택적으로 상기 연결선의 형태는 상기 분석 정보에 따라 변동될 수 있는 것인 것이며,
    선택적으로 상기 노드의 형태는 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 하나 이상이 다른 형태를 가지는 것인 것이며,
    선택적으로 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드가 특허 분류와 관련된 것인 경우에는 상기 노드에 나타나는 정보는 1) 상기 특허 분류만 나타나는 방법, 2) 상기 특허 분류에 대응되는 타이틀만 나타나는 방법 및 3) 상기 특허 분류와 상기 타이틀이 모두 나타나는 방법 중 어느 하나인 것이며,
    선택적으로 상기 비사용 탐색 노드에는 하위 분류 확장 표시가 더 포함되어 있으며, 상기 확장 표시가 선택되는 경우, 상기 비사용 탐색 노드가 속하는 분류 체계상에서 상기 비사용 탐색 노드의 하위 노드가 상기 비사용 탐색 노드의 주위에 배치되는 것인 것이며,
    선택적으로 상기 탐색 노드가 상기 가지 노드의 하위 노드인 경우, 상기 비사용 탐색 노드가 표시될 때, 상기 비사용 탐색 노드의 형제 노드 중에서 상기 센터 노드와 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 구성하는 형제 노드도 상기 비사용 탐색 노드와 구분되면서 함께 표시되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  43. 제36 항에 있어서,
    (E) 중요 비사용 탐색 노드 정보를 생성하는 단계;를 더 포함하며,
    상기 중요 비사용 탐색 노드 정보를 생성하는 방법은
    상기 비사용 탐색 노드 중에서 상기 가지 노드와 기설정된 기준을 충족하는 비사용 탐색 노드를 선별하는 것으로 생성하는 제1 방법,
    상기 가지 노드가 복수 개가 있을 때, 적어도 하나 이상의 센터 노드와 상기 복수 개의 가지 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제2 방법 및
    상기 센터 노드가 복수 개가 있을 때, 적어도 하나 이상의 가지 노드와 상기 복수 개의 센터 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제3 방법 중 어느 하나 이상의 방법을 사용하는 것이며,
    상기 제1 방법에서 상기 비사용 탐색 노드와 상기 가지 노드가 충족하는 기준은 상기 비사용 탐색 노드와 상기 가지 노드가 함께 나오는 특허 문건의 개수가 기설정된 기준 이상이거나, 기설정된 증가율 이상이거나, 기설정된 증가 속도 이상이거나, 기설정된 함수 관계를 성립하는 경우 중 어느 하나 이상인 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  44. 제37 항에 있어서,
    상기 제1 특허 집합 및 상기 제2 특허 집합은 생성되거나 입수 받은 적어도 하나 이상의 특허 집합을 적어도 하나 이상의 분할 처리 기준을 적용하여 분할하여 제1 분할 특허 집합 및 적어도 하나 이상의 제2 분할 특허 집합을 기초로 생성되는 것인 것이며,
    상기 분할 처리 기준은 상기 특허 문건에 포함된 발행국, 시간 범위, 출원인이나 권리자나 양수인, 발명자, 특허 분류, 특허 주제 분류 및 기 설정된 분류 속성 중 어느 하나 또는 어느 2 이상의 조합으로 생성되는 것인 것이며,
    상기 시간 범위의 기준이 되는 시간은 상기 특허 문건의 우선일, 출원일, 공개일 및 등록일 중 어느 하나 또는 어느 2 이상의 조합을 사용하는 것이며,
    상기 특허 분류는 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 또는 어느 2 이상의 조합인 것이며,
    상기 특허 주제 분류는 상기 IPC의 인덱스, 상기 USPC의 인덱스 또는 상기 IPC, USPC, FT, FI 및 ECLA 중 어느 하나 이상을 사용하여 생성되는 주제 분류 중 어느 하나 이상인 것이며,
    상기 기 설정된 분류 속성은 상기 출원인이나 상기 권리자나 상기 양수인에 대한 분류 속성, 상기 특허 분류를 구성하는 특허 분류별 분류 속성, 상기 발명자에 대한 분류 속성, 또는 상기 특허 주제 분류별 분류 속성 중 어느 하나 이상인 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템의 정보 처리 방법.
  45. 특허 정보 시스템에서, 상기 특허 정보 시스템은
    적어도 하나 이상의 특허 문건으로 구성되는 적어도 하나 이상의 특허 집합을 사용하여 단위 융합 요소를 생성하는 단위 융합 요소 생성부;
    상기 생성된 단위 융합 요소를 활용하여 네트워크 다이어그램을 생성하는 융합 패턴 분석부; 및
    상기 네트워크 다이어그램을 구성하는 노드 중에서 적어도 하나 이상의 센터 노드, 상기 센터 노드와 연결되는 적어도 하나 이상의 가지 노드에 대한 선택 정보가 있을 때, 선택된 상기 가지 노드에 대한 탐색 노드를 입수하고, 상기 탐색 노드 중에서 비사용 탐색 노드를 선별하여 공백 융합 후보 정보로 처리하는 공백 융합 후보 발견부;를 포함하며,
    상기 가지 노드는 상기 특허 정보 시스템의 사용자 컴퓨터로부터 선택받는 것이며, 상기 센터 노드는 상기 사용자 컴퓨터 또는 상기 특허 정보 시스템의 기설정된 선택 기준에 의해 선택받는 것이며,
    상기 탐색 노드는 상기 가지 노드에 대한 상기 가지 노드가 속하는 분류 체계상에서 상기 가지 노드의 형제 노드인 것이거나, 상기 가지 노드의 하위 노드인 것이며,
    상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 특허 집합을 사용하여 생성되는 단위 융합 요소에 존재하는 않은 조합에 관련되는 노드인 것이며,
    상기 단위 융합 요소는 2 이상의 특허 분류로 구성되는 특허 분류 조합, 2개 이상의 키워드로 구성되는 키워드 조합, 및 특허 분류에 대응되는 인덱스 조합 중에서 선택되는 어느 하나 이상인 것이며,
    상기 특허 분류 조합 및 상기 인덱스 조합은 상기 특허 문건에 포함된 2개 이상의 특허 분류를 기초로 생성되는 것인 것이며, 상기 키워드는 상기 특허 문건에서 추출된 키워드, 상기 특허 문건에서 추출된 키워드를 가공한 키워드 중 어느 하나 이상인 것이며,
    상기 단위 융합 요소의 생성은 상기 단위 융합 요소가 특허 분류 조합 또는 인덱스 조합인 경우에는 상기 특허 문건 중 적어도 한 종류 이상의 특허 분류를 기준으로 2개 이상의 특허 분류를 포함하는 특허 문건을 대상으로 실시되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템.
  46. 제45 항에 있어서,
    상기 특허 집합은 적어도 하나 이상의 특허 문건으로 구성되는 제1 특허 집합 및 특허 문건으로 구성되는 적어도 하나 이상의 제2 특허 집합이며, 상기 단위 융합 요소는 상기 제1 특허 집합 및 상기 제2 특허 집합별로 생성되는 단위 융합 요소 중 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소인 것이며,
    상기 비사용 탐색 노드는 상기 센터 노드와 상기 비사용 탐색 노드로 생성되는 조합을 기준으로 상기 제1 특허 집합 및 상기 제2 특허 집합별로 생성되는 단위 융합 요소에서 생성되지 않은 조합에 관련된 노드인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템.
  47. 제45 항에 있어서,
    상기 공백 융합 후보 발견부가 상기 비사용 탐색 노드를 생성하는 방법은
    상기 센터 노드와 상기 탐색 노드로 생성되는 조합 집합을 구성하는 조합 중에서 상기 단위 융합 요소와 중복되는 조합을 배제하고 남은 조합에 포함되는 탐색 노드로 처리하는 제1 방법, 및 상기 탐색 노드 중에서 상기 단위 융합 요소 중 센터 노드가 포함된 단위 융합 요소에 사용된 노드를 배제하고 남은 탐색 노드로 처리하는 제2 방법 중 어느 하나의 방법을 사용하는 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템.
  48. 제45 항에 있어서,
    상기 융합 패턴 분석부는 상기 비사용 탐색 노드를 상기 네트워크 다이어그램 상에 표시하는 기능을 수행하며,
    상기 네트워크 다이어그램에서 상기 비사용 탐색 노드가 표시되는 방법은 상기 비사용 탐색 노드가 상기 가지 노드 주위에 배치되는 것인 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 2 이상 간에는 기설정된 형태의 연결선이 표시되는 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 연결선 상에는 상기 연결선이 연결하는 2개의 노드에 대응되는 특허 문건으로 구성되는 특허 문건 집합에 대한 적어도 하나 이상의 분석 정보가 표시되는 것이며, 상기 분석 정보에는 빈도가 포함되어 있는 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 연결선의 형태는 상기 분석 정보에 따라 변동될 수 있는 것인 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 노드의 형태는 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드 중 어느 하나 이상이 다른 형태를 가지는 것인 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 센터 노드, 상기 가지 노드, 및 상기 비사용 탐색 노드가 특허 분류와 관련된 것인 경우에는 상기 노드에 나타나는 정보는 1) 상기 특허 분류만 나타나는 방법, 2) 상기 특허 분류에 대응되는 타이틀만 나타나는 방법 및 3) 상기 특허 분류와 상기 타이틀이 모두 나타나는 방법 중 어느 하나인 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 비사용 탐색 노드에는 하위 분류 확장 표시가 더 포함되어 있으며, 상기 확장 표시가 선택되는 경우, 상기 비사용 탐색 노드가 속하는 분류 체계상에서 상기 비사용 탐색 노드의 하위 노드가 상기 비사용 탐색 노드의 주위에 배치되는 것인 것이며,
    선택적으로 상기 융합 패턴 분석부가 정보 처리할 때, 상기 탐색 노드가 상기 가지 노드의 하위 노드인 경우, 상기 비사용 탐색 노드가 표시될 때, 상기 비사용 탐색 노드의 형제 노드 중에서 상기 센터 노드와 기 설정된 융합 처리 기준을 충족하는 단위 융합 요소를 구성하는 형제 노드도 상기 비사용 탐색 노드와 구분되면서 함께 표시되는 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템.
  49. 제45 항에 있어서,
    상기 공백 융합 후보 발견부는 중요 비사용 탐색 노드 정보를 생성하는 중요 공백 융합 후보 발견부;를 더 포함하며,
    상기 중요 공백 융합 후보 발견부가 상기 중요 비사용 탐색 노드 정보를 생성하는 방법은
    상기 비사용 탐색 노드 중에서 상기 가지 노드와 기설정된 기준을 충족하는 비사용 탐색 노드를 선별하는 것으로 생성하는 제1 방법,
    상기 가지 노드가 복수 개가 있을 때, 적어도 하나 이상의 센터 노드와 상기 복수 개의 가지 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제2 방법 및
    상기 센터 노드가 복수 개가 있을 때, 적어도 하나 이상의 가지 노드와 상기 복수 개의 센터 노드별로의 선별되어 생성되는 비사용 탐색 노드를 모았을 때, 빈도 서열이 높은 비사용 탐색 노드로 생성하는 제3 방법 중 어느 하나 이상의 방법을 사용하는 것이며,
    상기 제1 방법에서 상기 비사용 탐색 노드와 상기 가지 노드가 충족하는 기준은 상기 비사용 탐색 노드와 상기 가지 노드가 함께 나오는 특허 문건의 개수가 기설정된 기준 이상이거나, 기설정된 증가율 이상이거나, 기설정된 증가 속도 이상이거나, 기설정된 함수 관계를 성립하는 경우 중 어느 하나 이상인 것인 것을 특징으로 하는 공백 융합 후보 정보를 생성하는 특허 정보 시스템.
PCT/KR2011/001312 2010-05-28 2011-02-25 니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템 WO2011149178A2 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2010-0050279 2010-05-28
KR1020100050279A KR101610938B1 (ko) 2010-05-28 2010-05-28 특허 정보를 활용한 공백 융합 후보 정보 생성 방법 및 그 시스템
KR1020100113561A KR101201218B1 (ko) 2010-11-15 2010-11-15 니치 기술 영역 발견을 지원하는 니치 기술 영역 발견을 지원하는 특허 정보 처리 방법
KR10-2010-0113561 2010-11-15

Publications (2)

Publication Number Publication Date
WO2011149178A2 true WO2011149178A2 (ko) 2011-12-01
WO2011149178A3 WO2011149178A3 (ko) 2012-01-19

Family

ID=45004496

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/001312 WO2011149178A2 (ko) 2010-05-28 2011-02-25 니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템

Country Status (1)

Country Link
WO (1) WO2011149178A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103337035A (zh) * 2013-03-19 2013-10-02 东南大学 基于定量评价的确定城市中心体系选址方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001222536A (ja) * 2000-02-07 2001-08-17 Canon Inc 特許マップ作成システム及びその作成方法ならびに記録媒体
US6389418B1 (en) * 1999-10-01 2002-05-14 Sandia Corporation Patent data mining method and apparatus
KR20040086913A (ko) * 2003-04-03 2004-10-13 재단법인서울대학교산학협력재단 특허 정보의 텍스트 마이닝(Text Mining)에의한 기술 공백의 발견 방법과 그 시스템
KR20090063156A (ko) * 2007-12-12 2009-06-17 (주)광개토연구소 특허 정보 제공 방법 및 그 시스템
KR20090131014A (ko) * 2008-06-17 2009-12-28 한국과학기술원 특허 정보를 이용한 기술과 서비스의 평가 및 서비스중심의 기술 로드맵 작성 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389418B1 (en) * 1999-10-01 2002-05-14 Sandia Corporation Patent data mining method and apparatus
JP2001222536A (ja) * 2000-02-07 2001-08-17 Canon Inc 特許マップ作成システム及びその作成方法ならびに記録媒体
KR20040086913A (ko) * 2003-04-03 2004-10-13 재단법인서울대학교산학협력재단 특허 정보의 텍스트 마이닝(Text Mining)에의한 기술 공백의 발견 방법과 그 시스템
KR20090063156A (ko) * 2007-12-12 2009-06-17 (주)광개토연구소 특허 정보 제공 방법 및 그 시스템
KR20090131014A (ko) * 2008-06-17 2009-12-28 한국과학기술원 특허 정보를 이용한 기술과 서비스의 평가 및 서비스중심의 기술 로드맵 작성 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103337035A (zh) * 2013-03-19 2013-10-02 东南大学 基于定量评价的确定城市中心体系选址方法

Also Published As

Publication number Publication date
WO2011149178A3 (ko) 2012-01-19

Similar Documents

Publication Publication Date Title
WO2012060532A1 (ko) 특허 평가 모델 생성 방법, 특허 평가 방법, 특허 분쟁 예측 모델 생성 방법, 특허 분쟁 예측 정보 생성 방법, 특허 라이센싱 예측 정보 생성 방법, 특허 리스크 헤징 정보 생성 방법 및 시스템
EP2391955A1 (en) Document analysis system
WO2018174603A1 (ko) 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지에 도면 부호의 설명이 표시되도록 처리하는 방법 및 장치
WO2012074338A2 (ko) 자연어 및 수학식 처리 방법과 그를 위한 장치
WO2010036012A2 (ko) 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
WO2019177182A1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2010021527A2 (ko) 영상에 포함된 객체를 색인하는 시스템 및 방법
WO2012134180A2 (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
WO2011155736A9 (ko) 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치
WO2011137724A1 (zh) 基于语义逻辑的类自然语言人机对话装置
WO2020197257A1 (ko) 가시적 표현 요소를 이용한 번역 방법 및 그 장치
WO2023172025A1 (ko) 시계열적 정보를 인코딩하는 모델을 사용하여 개체-쌍 사이의 연관성 관련 정보를 예측하는 방법 및 이를 이용하여 생성되는 예측 시스템
WO2017069548A1 (ko) 복잡계 네트워크에서의 집합 관계 분석 시각화 장치 및 그 방법
WO2013119007A1 (ko) 아이디어 휠 기반의 데이터 생성 장치
WO2021246642A1 (ko) 폰트를 추천하는 방법 및 이를 구현하는 장치
WO2011149178A2 (ko) 니치 기술 영역 탐색, 분석 및 평가 지원 정보 처리 방법 및 그 시스템
WO2021107360A2 (ko) 유사도를 판단하는 전자 장치 및 그 제어 방법
JP2006085546A (ja) 文書検索表示方法
WO2020209499A1 (ko) 응용 프로그램 설계 방법 및 장치
WO2017191877A1 (ko) 프로버넌스 관리를 위한 압축 장치 및 방법
Richter et al. HeidelPlace: An extensible framework for geoparsing
WO2021230469A1 (ko) 아이템 추천 방법
WO2018212536A1 (ko) 콘텐츠의 상세 수치정보 제공장치
WO2024029939A1 (ko) Esg 보조 툴을 이용하여 정형화된 esg 데이터로 이루어진 esg 데이터베이스를 구축하는 방법 및 이를 수행하는 esg 서비스 제공 시스템
WO2024025328A1 (ko) 양자정보기술 시스템 설계/검증 및 사용자 이용 편의성 향상 처리 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11786811

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase in:

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11786811

Country of ref document: EP

Kind code of ref document: A2